Вийшли молодші моделі Qwen-3.5 — і версія 9B перевершує значно більші моделі

Команда Qwen від Alibaba Cloud презентувала нову серію компактних моделей штучного інтелекту Qwen-3.5 з різною кількістю параметрів: 9B, 4B, 2B та 0.8B. Всі вони — dense-моделі з відкритим доступом до ваг під ліцензією Apache 2.0 та доступні для завантаження і запуску.

Ця лінійка завершує розвиток Qwen через три етапи виходу:
📌 Спочатку був флагман 397B-A17B,
📌 потім середні 122B-A10B, 35B-A3B, 27B,
📌 і тепер — компактні моделі для локальних застосувань.

🚀 9B-модель — крок уперед

Особливість 9B-версії вражає продуктивністю:

Набирає 82.5 балів на MMLU-Pro — вищий результат, ніж у моделей з 120+ млрд параметрів;
На тесті GPQA Diamond показує 81.7 проти 73.4 у попередньої 30B-моделі;
В агентних задачах набирає 66.1 на BFCL-V4 і 79.1 на TAU2-Bench — недоступні результати для моделей значно більшого масштабу лише півроку тому.

Це означає, що 9 млрд параметрів можуть забезпечувати продуктивність, яку раніше мали лише дуже великі моделі.

📊 Що таке архітектура та можливості

Усі нові Qwen-3.5 побудовані на гибридній архітектурі з поєднанням Gated DeltaNet і Gated Attention (співвідношення 3:1). Це дозволяє:

✅ Працювати з контекстом до 262 тисяч токенів,
🔁 За потреби розширювати до 1 мільйона токенів,
🧠 Одночасно обробляти текст + зображення + відео без окремих модифікацій.

🛠️ Легкість запуску й застосування

Запустити модель 9B дуже просто — достатньо однієї команди (наприклад, в Ollama):

ollama run qwen3.5:9b

Даже 4B-версія демонструє високі показники:
⭐ ~79.1 на MMLU-Pro — як у GPT-OSS-120B
⭐ 76+ на GPQA Diamond
⭐ 85+ на MathVista
Це вже працює на звичайному графічному процесорі рівня RTX 3060 / 4060.

Найменша 0.8B-модель створена для edge- та embedded-сценаріїв — де важлива швидкість і компактність при мінімальному залізі.

🧠 Що це означає для галузі

Нова серія Qwen-3.5 демонструє загальний тренд у розвитку ШІ: якість і продуктивність не завжди пропорційні розміру. Компактні моделі стають потужними інструментами, доступними для широкого застосування — від локальної розробки до впровадження у продукти без необхідності великих серверних кластерів.

Alibaba Cloud зробила значний крок у напрямку оптимізації моделей: менше параметрів — не значить менше можливостей. Нові Qwen-3.5 особливо привертають увагу своєю продуктивністю та доступністю для практичного використання.

Hugging Face: https://huggingface.co/collections/Qwen/qwen35

ModelScope: https://modelscope.cn/collections/Qwen/Qwen35