xAI випускає Grok 4.1: Новий стандарт емоційного інтелекту та креативності у ШІ

Компанія xAI оголосила про випуск Grok 4.1, оновленої версії своєї флагманської моделі штучного інтелекту. Це оновлення приносить значні покращення у зручності використання, особливо в креативних, емоційних та спільних завданнях. Нова модель вже доступна для всіх користувачів на платформі 𝕏, сайті grok.com та в мобільних додатках.

Introducing Grok 4.1, a frontier model that sets a new standard for conversational intelligence, emotional understanding, and real-world helpfulness.

Grok 4.1 is available for free on https://t.co/AnXpIEOPEb, https://t.co/53pltyq3a4 and our mobile apps.https://t.co/Cdmv5CqSrb
— xAI (@xai) November 17, 2025

Що нового в Grok 4.1?

Grok 4.1 — це не просто чергове оновлення; це крок до більш природної та інтуїтивної взаємодії зі штучним інтелектом. Модель стала значно краще розуміти приховані наміри користувача, вести більш захоплюючу розмову та підтримувати цілісну особистість.

Для досягнення цього xAI використала ту саму інфраструктуру навчання з підкріпленням (RL), що й для Grok 4, але застосувала її для оптимізації стилю, індивідуальності, корисності та узгодженості моделі. Компанія також розробила нові методи, що дозволяють використовувати передові агентні моделі для автономної оцінки та ітерації відповідей у великих масштабах.

Лідерство у бенчмарках

Продуктивність Grok 4.1 демонструє вражаючі результати, підтверджені провідними незалежними тестами:

LMArena Text Leaderboard: Grok 4.1 посідає перше місце (з 1483 балами Elo) та друге місце (з 1465 балами Elo) у загальному рейтингу, значно випереджаючи всі інші моделі конкурентів. Це величезний стрибок порівняно з Grok 4, яка посідала 33-тє місце.
EQ-Bench (Емоційний інтелект): Модель лідирує в тесті на емоційний інтелект (EQ-Bench) з 1586 балами Elo. Наприклад, на запит “Я так сумую за своїм котом, що аж боляче”, Grok 4.1 дає значно більш глибоку та співчутливу відповідь, визнаючи біль втрати та пропонуючи підтримку.
Creative Writing v3: У тесті на креативне письмо Grok 4.1 посідає друге місце, демонструючи видатні здібності до творчості.

Зменшення галюцинацій

Одним із ключових напрямків роботи стало зменшення фактичних помилок (галюцинацій). Grok 4.1 показує значне зниження рівня галюцинацій у відповідях на інформаційні запити:

FActScore: Рівень помилок знизився з 9,89% до 2,97%.
Внутрішні тести: Показник галюцинацій на реальних запитах користувачів впав з 12,09% до 4,22%.

Доступність

Grok 4.1 вже впроваджується для всіх користувачів. Вона доступна в автоматичному режимі (“Auto mode”), а також її можна обрати вручну в селекторі моделей. Цей запуск, якому передував двотижневий “тихий” період тестування, встановлює нову планку продуктивності та якості взаємодії з ШІ.

Володимир Дрозд

Володимир Дрозд — засновник та головний редактор AiNews UA. Автор понад 700 публікацій про штучний інтелект, великі мовні моделі (LLM), AI-агентів та сучасні AI-сервіси. Спеціалізується на новинах OpenAI, Google, Anthropic, xAI, Meta та локальних AI-моделях.

Показати повністю Згорнути

Усі матеріали автора

Що нового в Grok 4.1?

Лідерство у бенчмарках

Зменшення галюцинацій

Доступність

Володимир Дрозд

Читайте також

Google представила Gemini 3.6 Flash, Flash-Lite та Flash Cyber — що нового

OpenAI представила GPT-5.6: моделі Sol, Terra та Luna — що нового

OpenAI представила GPT-5.6 Sol: нове покоління ШІ для програмування, науки та кібербезпеки