iLenta Меню

Samsung выпустила собственный инструмент для оценки искусственного интеллекта

26 сентября 2025, 08:09 | Roter [757]
Samsung была вынуждена выпустить собственный бенчмарк после того, как обнаружила недостатки в существующих инструментах для оценки работы искусственного интеллекта.
Samsung выпустила собственный инструмент для оценки искусственного интеллекта

Компания стала первым брендом, внедрившим целый комплекс AI-функций в смартфоны. С тех пор Samsung регулярно обновляет и расширяет их возможности примерно раз в полгода. Теперь компания представила собственный инструмент для измерения производительности ИИ — Trustworthy Real-world Usage Evaluation Benchmark (TRUEBench).

TRUEBench разработан подразделением Samsung Research как фирменный тестовый комплекс. Необходимость в нем возникла из-за ограничений существующих бенчмарков, которые в основном ориентированы только на английский язык и одноразовые форматы «вопрос-ответ».

В отличие от них, TRUEBench включает более разнообразные диалоговые сценарии и поддерживает многоязычные условия. Он создан на основе практического опыта использования ИИ для повышения продуктивности и оценивает его работу по десяти наиболее востребованным задачам — таким как генерация контента, анализ данных, реферативное изложение текстов и перевод.

Всего в TRUEBench предусмотрено 2485 тестов, разделенных на 10 категорий, 46 подкатегорий и 12 языков. Диапазон заданий охватывает как короткие тексты из нескольких символов, так и документы объемом свыше 20 000 символов — от элементарных операций до сложного суммирования больших материалов.

Система оценки в TRUEBench считается надежной: она основана на автоматизированном алгоритме, который был разработан и отточен в сотрудничестве человека и ИИ. Датасеты и таблицы результатов размещены на открытой платформе Hugging Face, где можно протестировать до пяти моделей ИИ и сравнить их производительность и эффективность.

Источник: sammobile

© 2012-2026 iLenta. Все права защищены.
Полная версия

AI

Samsung вложит $1,72 трлн в подготовку к эпохе искусственного интеллекта
Samsung вложит $1,72 трлн в подготовку к эпохе искусственного интеллекта
30 июня 2026, 17:09 | Oleksandr Bazanov
Samsung Electronics объявила о масштабной инвестиционной программе, направленной на развитие инфраструктуры для эпохи искусственного интеллекта.
Подробнее...
 
Apple ускорила выпуск iOS 26.5.2 и macOS Tahoe 26.5.2 из-за риска AI-атак
Apple ускорила выпуск iOS 26.5.2 и macOS Tahoe 26.5.2 из-за риска AI-атак
30 июня 2026, 10:12 | Oleksandr Bazanov
Apple выпустила обновления iOS 26.5.2, iPadOS 26.5.2 и macOS Tahoe 26.5.2 с большим набором исправлений безопасности. Часть уязвимостей из этого релиза изначально планировалось включить в более крупные обновления iOS 26.6, iPadOS 26.6 и macOS Tahoe 26.6, однако компания решила ускорить выпуск патчей.
Подробнее...
 
Рынок ИИ-чипов меняется: Groq получила крупное финансирование после громкой сделки с Nvidia
Рынок ИИ-чипов меняется: Groq получила крупное финансирование после громкой сделки с Nvidia
25 июня 2026, 18:06 | Anton Petrov
Компания Groq, известная разработкой специализированных ИИ-процессоров Language Processing Unit (LPU), объявила о привлечении $650 млн в рамках нового инвестиционного раунда.
Подробнее...
 
Gemini Live становится умнее: Google добавляет память и глубже интегрирует сервисы
Gemini Live становится умнее: Google добавляет память и глубже интегрирует сервисы
24 июня 2026, 20:06 | Oleksandr Bazanov
Google продолжает развивать возможности своего ИИ-ассистента Gemini. На этот раз обновление затронуло режим Gemini Live, который получил новую функцию памяти и стал заметно более контекстным в общении.
Подробнее...
 
Samsung будет выпускать ключевой компонент для первого ИИ-ускорителя Qualcomm
Samsung будет выпускать ключевой компонент для первого ИИ-ускорителя Qualcomm
22 июня 2026, 18:06 | Bazelas
Подразделение Samsung Electro-Mechanics, специализирующееся на производстве электронных компонентов, начало массовый выпуск важного элемента для первого серверного ИИ-ускорителя Qualcomm.
Подробнее...
 
Страницы: 1 2 3 4 5 6
Полная версия
 
© 2012-2026 iLenta. All rights reserved.