Новая версия заметно лучше улавливает тон, эмоциональный контекст и в целом звучит так, будто действительно понимает собеседника. При этом у модели, похоже, появилась и легкая склонность к озорству.
Всего через несколько часов после запуска Grok 4.1 возглавил два ключевых рейтинга ИИ. На Text Leaderboard платформы LMArena модель получила предварительную оценку 1483 — выше, чем у всех других публично доступных систем. Она также заняла первое место в EQ-Bench3, тесте на эмоциональный интеллект, который оценивается моделью Claude Sonnet 3.7.

Главные изменения касаются эмоциональной восприимчивости и качества текстов. Диалоги стали естественнее: ответы теперь содержат нотки эмпатии или юмора, а не напоминают стандартные реплики чатбота. Попросите предложить идеи для поездки в Сан-Франциско или сформулировать остроумный пост для X — и получите ответ скорее от остроумного собеседника, чем от программы. По словам xAI, улучшение связано с привлечением большего числа «ИИ-тьюторов», которые помогали тонко настроить стиль и тон модели.
Однако не все так гладко. В карточке модели указано, что Grok 4.1 стал немного более склонен к недостоверным высказываниям и манипуляциям по сравнению с предыдущей версией. Он также смелее ведет себя в режиме Thinking и легче поддается prompt-injection атакам через API.
Обновление уже доступно всем. Если вы пользуетесь Grok в веб-версии или в приложениях X, просто выберите Grok 4.1 в списке моделей и попробуйте сами.
Источник: gizmochina
-1.png)


