Команда Qwen від Alibaba Cloud презентувала нову серію компактних моделей штучного інтелекту Qwen-3.5 з різною кількістю параметрів: 9B, 4B, 2B та 0.8B. Всі вони — dense-моделі з відкритим доступом до ваг під ліцензією Apache 2.0 та доступні для завантаження і запуску.

Ця лінійка завершує розвиток Qwen через три етапи виходу:
📌 Спочатку був флагман 397B-A17B,
📌 потім середні 122B-A10B, 35B-A3B, 27B,
📌 і тепер — компактні моделі для локальних застосувань.
🚀 9B-модель — крок уперед
Особливість 9B-версії вражає продуктивністю:
- Набирає 82.5 балів на MMLU-Pro — вищий результат, ніж у моделей з 120+ млрд параметрів;
- На тесті GPQA Diamond показує 81.7 проти 73.4 у попередньої 30B-моделі;
- В агентних задачах набирає 66.1 на BFCL-V4 і 79.1 на TAU2-Bench — недоступні результати для моделей значно більшого масштабу лише півроку тому.
Це означає, що 9 млрд параметрів можуть забезпечувати продуктивність, яку раніше мали лише дуже великі моделі.
📊 Що таке архітектура та можливості
Усі нові Qwen-3.5 побудовані на гибридній архітектурі з поєднанням Gated DeltaNet і Gated Attention (співвідношення 3:1). Це дозволяє:
✅ Працювати з контекстом до 262 тисяч токенів,
🔁 За потреби розширювати до 1 мільйона токенів,
🧠 Одночасно обробляти текст + зображення + відео без окремих модифікацій.
🛠️ Легкість запуску й застосування
Запустити модель 9B дуже просто — достатньо однієї команди (наприклад, в Ollama):
ollama run qwen3.5:9b
Даже 4B-версія демонструє високі показники:
⭐ ~79.1 на MMLU-Pro — як у GPT-OSS-120B
⭐ 76+ на GPQA Diamond
⭐ 85+ на MathVista
Це вже працює на звичайному графічному процесорі рівня RTX 3060 / 4060.
Найменша 0.8B-модель створена для edge- та embedded-сценаріїв — де важлива швидкість і компактність при мінімальному залізі.
🧠 Що це означає для галузі
Нова серія Qwen-3.5 демонструє загальний тренд у розвитку ШІ: якість і продуктивність не завжди пропорційні розміру. Компактні моделі стають потужними інструментами, доступними для широкого застосування — від локальної розробки до впровадження у продукти без необхідності великих серверних кластерів.
Alibaba Cloud зробила значний крок у напрямку оптимізації моделей: менше параметрів — не значить менше можливостей. Нові Qwen-3.5 особливо привертають увагу своєю продуктивністю та доступністю для практичного використання.
Hugging Face: https://huggingface.co/collections/Qwen/qwen35
ModelScope: https://modelscope.cn/collections/Qwen/Qwen35





