iLenta Меню

Samsung выпустила собственный инструмент для оценки искусственного интеллекта

26 сентября 2025, 08:09 | Roter [482]
Samsung была вынуждена выпустить собственный бенчмарк после того, как обнаружила недостатки в существующих инструментах для оценки работы искусственного интеллекта.
Samsung выпустила собственный инструмент для оценки искусственного интеллекта

Компания стала первым брендом, внедрившим целый комплекс AI-функций в смартфоны. С тех пор Samsung регулярно обновляет и расширяет их возможности примерно раз в полгода. Теперь компания представила собственный инструмент для измерения производительности ИИ — Trustworthy Real-world Usage Evaluation Benchmark (TRUEBench).

TRUEBench разработан подразделением Samsung Research как фирменный тестовый комплекс. Необходимость в нем возникла из-за ограничений существующих бенчмарков, которые в основном ориентированы только на английский язык и одноразовые форматы «вопрос-ответ».

В отличие от них, TRUEBench включает более разнообразные диалоговые сценарии и поддерживает многоязычные условия. Он создан на основе практического опыта использования ИИ для повышения продуктивности и оценивает его работу по десяти наиболее востребованным задачам — таким как генерация контента, анализ данных, реферативное изложение текстов и перевод.

Всего в TRUEBench предусмотрено 2485 тестов, разделенных на 10 категорий, 46 подкатегорий и 12 языков. Диапазон заданий охватывает как короткие тексты из нескольких символов, так и документы объемом свыше 20 000 символов — от элементарных операций до сложного суммирования больших материалов.

Система оценки в TRUEBench считается надежной: она основана на автоматизированном алгоритме, который был разработан и отточен в сотрудничестве человека и ИИ. Датасеты и таблицы результатов размещены на открытой платформе Hugging Face, где можно протестировать до пяти моделей ИИ и сравнить их производительность и эффективность.

Источник: sammobile

© 2012-2025 iLenta. Все права защищены.
Полная версия

AI

Основатель Amazon Джефф Безос стал сопредседателем ИИ-стартапа
Основатель Amazon Джефф Безос стал сопредседателем ИИ-стартапа
18 ноября 2025, 12:08 | Bazelas
Основатель Amazon Джефф Безос вновь активно возвращается в бизнес, став сопредседателем нового стартапа в сфере искусственного интеллекта под названием Project Prometheus.
Подробнее...
 
ИИ практически самостоятельно провел крупнейшую кибератаку
ИИ практически самостоятельно провел крупнейшую кибератаку
15 ноября 2025, 23:07 | Roter
Компания Anthropic сообщила о масштабной кибершпионской операции, в ходе которой, по предварительным данным, хакеры, связанные с Китаем, применили ИИ-модель Claude для автоматизации атак на десятки организаций по всему миру.
Подробнее...
 
Mozilla добавила в браузер Firefox режим AI Window
Mozilla добавила в браузер Firefox режим AI Window
15 ноября 2025, 22:07 | Bazelas
Mozilla объявила о разработке нового режима работы браузера Firefox под названием AI Window — это специальное пространство с интегрированным искусственным интеллектом, в котором пользователи смогут взаимодействовать с ИИ-помощником и получать поддержку во время серфинга.
Подробнее...
 
Илон Маск обещает, что Grok 5 станет самой продвинутой ИИ-системой на планете
Илон Маск обещает, что Grok 5 станет самой продвинутой ИИ-системой на планете
15 ноября 2025, 17:07 | Roter
Илон Маск раскрыл новые детали о развитии xAI и грядущих поколениях ИИ-модели Grok.
Подробнее...
 
Карты Google теперь работают с искусственным интеллектом Gemini
Карты Google теперь работают с искусственным интеллектом Gemini
06 ноября 2025, 20:08 | Bazelas
Компания Google выпустила крупное обновление Google Maps для Android и iOS, интегрировав в сервис искусственный интеллект Gemini.
Подробнее...
 
Страницы: 1 2 3 4 5 6
Полная версия
 
© 2012-2025 iLenta. All rights reserved.