Китайська компанія Zhipu AI, що працює на міжнародному ринку під брендом Z.ai, офіційно представила нову модель штучного інтелекту — GLM-5V-Turbo. Це мультимодальне рішення, орієнтоване на задачі програмування, яке здатне обробляти не лише текст, а й зображення та відео.
Що таке GLM-5V-Turbo і чим вона відрізняється
Важливо не плутати новинку з попередньою моделлю GLM-5-Turbo, яка була представлена раніше та працювала виключно з текстом, оптимізуючись під агентні сценарії. Натомість GLM-5V-Turbo значно розширює можливості, додаючи повноцінну мультимодальність.
Модель побудована за принципом циклу:
сприйняття → планування → виконання, що дозволяє ефективно працювати як AI-агент для програмування.
Генерація коду прямо з дизайну
Однією з ключових можливостей GLM-5V-Turbo є перетворення дизайну в код. Модель може:
- аналізувати UI-макети та скриншоти інтерфейсів
- розпізнавати структуру, кольори та ієрархію елементів
- генерувати повністю функціональні фронтенд-проєкти
Для вайрфреймів модель відновлює логіку взаємодії, а при роботі з готовими дизайнами прагне до максимально точної (майже попіксельної) відповідності.
Інтеграція з іншими AI-інструментами
GLM-5V-Turbo також може працювати в парі з такими інструментами, як Claude Code та OpenClaw. У цьому сценарії модель:
- аналізує цільові сайти
- збирає елементи інтерфейсу та навігації
- генерує код на основі зібраної інформації
Технічні характеристики
Під капотом моделі:
- візуальний енкодер CogViT
- архітектура Multi-Token Prediction
- контекстне вікно — до 200 000 токенів
- максимальна довжина відповіді — 128 000 токенів
Продуктивність і бенчмарки
За внутрішніми тестами Z.ai, модель демонструє високі результати у:
- задачах design-to-code
- генерації коду з візуальних даних
- роботі з GUI-середовищами (зокрема AndroidWorld і WebVoyager)
Водночас у класичному текстовому програмуванні GLM-5V-Turbo зберегла рівень продуктивності на рівні бенчмарку CC-Bench-V2, що означає — мультимодальність не погіршила її базові можливості.
Втім, варто зазначити, що ці результати поки не мають незалежного підтвердження.
Доступ і ціна
Модель вже доступна через API платформи Z.ai, а також через OpenRouter.
Вартість використання становить:
- $1.20 за 1 млн вхідних токенів
- $4.00 за 1 млн вихідних токенів






