Дослідницька група з Інституту ELLIS у Тюбінгені, Університету Меріленда та Ліверморської національної лабораторії імені Лоуренса розробила мовну модель під назвою «Huginn», яка може поглиблювати свої розумові процеси за допомогою рекурсивної архітектури.

На відміну від звичайних моделей логічного мислення, як-от o3-mini від OpenAI, які генерують ланцюжки міркувань за допомогою логічних токенів, Huginn не потребує спеціального навчання і міркує в прихованому просторі своєї нейронної мережі, перш ніж видати результат.
Модель було навчено на суперкомп’ютері Frontier з використанням 4096 графічних процесорів AMD MI250X – це один із найбільших навчальних прогонів, які будь-коли проводили на кластері AMD. Концепція навчання була новою, але в основі своїй простою: на відміну від типових мовних моделей, Huginn навчався зі змінною кількістю обчислювальних ітерацій.
Для кожного проходу система випадковим чином визначала, скільки разів потрібно повторити центральний обчислювальний блок – від одного до 64 разів. Спеціальний розподіл цього випадкового числа гарантував, що, хоча модель в основному навчалася з меншою кількістю повторень, іноді вона виконувала безліч ітерацій.
Тестування показує, що модель особливо добре справляється з математичними завданнями і завданнями з програмування. У таких тестах, як GSM8k і MATH, вона перевершує кілька протестованих моделей з відкритим вихідним кодом, у яких удвічі більше параметрів і навчальних даних.
Дослідники задокументували кілька нових можливостей: без спеціального навчання система може регулювати глибину обчислень залежно від складності завдання і вибудовувати ланцюжки міркувань у своєму прихованому просторі.
Аналіз, проведений дослідницькою групою, показує, що модель виробляє складні обчислювальні алгоритми у своєму прихованому просторі, зокрема кругові траєкторії під час розв’язання математичних задач. Команда розглядає ці приклади як доказ того, що модель самостійно вчиться «використовувати багатовимірну природу свого прихованого простору для отримання нових висновків».
Хоча його абсолютна продуктивність поки що не є революційною, дослідники вбачають у ньому значний потенціал: незважаючи на відносно невеликий розмір і обмежені навчальні дані, Huginn уже демонструє вражаючі можливості як експериментальна модель. Спостережуване підвищення продуктивності при збільшенні часу обробки і появі нових можливостей дає змогу припустити, що більші моделі з такою архітектурою можуть стати багатообіцяючою альтернативою класичним моделям обробки даних.
Команда особливо підкреслює, що їхній метод може фіксувати типи міркувань, які нелегко висловити словами (зокрема, ланцюжки думок). Очікується, що подальші дослідження і підвищення продуктивності будуть проведені. Дослідники пропонують використовувати навчання з підкріпленням як можливе розширення, аналогічно його застосуванню в класичних моделях міркувань.
Залишити коментар