Ілон Маск представив нову модель штучного інтелекту Grok 3 від стартапу xAI, стверджуючи, що вона перевершує провідних конкурентів за ключовими технічними показниками. Цей крок суттєво посилює перегони за створення більш потужних AI-систем.

Запуск Grok 3 відбувся лише через кілька днів після невдалої спроби Маска придбати OpenAI за $97,4 мільярда. Під час трансляції на платформі X, Маск заявив, що Grok 3 «на порядок потужніша, ніж Grok 2», і виділив її здатність вирішувати складні завдання.
Ранні тести підтверджують деякі заяви xAI. Модель очолила рейтинг Chatbot Arena, перевершивши GPT-4o від OpenAI, Google Gemini та V3 від DeepSeek у сліпих тестах користувачів. Згідно з опублікованими даними, Grok 3 показує найкращі результати в математиці (AIME ’24), науковому мисленні (GPQA) і завданнях програмування.

«Grok 3 демонструє передові здібності до логічного мислення. Мало які моделі справляються з цим стабільно. Моделі OpenAI з цим справляються, але DeepSeek-R1, Gemini 2.0 Flash Thinking і Claude – ні», – написав колишній дослідник OpenAI Андрій Карпаті на X після тестування.
Створення моделі вимагало величезних обчислювальних потужностей. xAI подвоїла кластер GPU до 200 000 чипів Nvidia, розташованих у новому дата-центрі в Мемфісі. Це підкреслює зростаючі вимоги до обчислювальних ресурсів для розробки передових AI-систем.

Одним із ключових нововведень Grok 3 стала функція «DeepSearch», яка поєднує веб-пошук із можливостями аналізу, даючи змогу моделі витягувати й обробляти інформацію з різних джерел. Також є режими для вирішення складних завдань, як-от «Think», що показує хід міркувань моделі, і режим «Big Brain», що виділяє більше ресурсів на складні завдання.
«Найважливіше в AI – це швидкість навчання. А @xai вчиться швидше за всіх», – написав ветеран техіндустрії Роберт Скобл, посилаючись на розмову зі співзасновником Apple Siri Томом Грубером.
Однак тести виявили й недоліки. Карпаті зазначив, що модель іноді вигадує посилання і зазнає труднощів із гумором і завданнями, пов’язаними з етичними питаннями. Ці проблеми характерні для більшості сучасних AI-систем і підкреслюють складність створення штучного інтелекту, який мислить на рівні людини.

Генеральний директор Scale.ai Олександр Ванг високо оцінив Grok 3, заявивши в Twitter: Це нова найкраща модель у світі від команди @xai Він відзначив її перевагу в низці тестів і висловив бажання співпрацювати з xAI.
Grok 3 буде доступна за передплатою Premium+ на платформі X за $40 на місяць, а також через новий сервіс SuperGrok за $30 на місяць. Найближчими тижнями планується запуск API для корпоративних клієнтів.
Цей запуск посилює конкуренцію на ринку AI, особливо в світлі того, що китайський стартап DeepSeek нещодавно представив порівнянну модель із меншими обчислювальними вимогами. Це також порушує питання про те, наскільки стійкі поточні перегони за обчислювальні потужності, оскільки компанії вкладають мільярди доларів в обладнання для розвитку AI.
Маск наголосив, що Grok 3 все ще перебуває на стадії бета-тестування, і поліпшення очікуються «майже щодня». Найближчими тижнями компанія планує додати голосову взаємодію, а попередня модель Grok 2 стане доступною з відкритим кодом після стабілізації нової версії.
Однак найприкметнішим у запуску Grok 3, можливо, є не її технічні характеристики або результати тестів, а те, що вона символізує: зростаючу напругу між Маском і його колишніми колегами з OpenAI. Лише через кілька днів після невдалої спроби придбати OpenAI за $97,4 мільярда, Маск представив модель, яка кидає виклик її лідерству – довівши, що навіть знехтуваний співзасновник може стати серйозним конкурентом у перегонах за домінування у сфері AI.
Залишити коментар