Компанія Qwen представила потужну мультимодальну модель Qwen-VLo, яка відкриває широкі можливості для генерації, стилізації та редагування зображень за допомогою текстових підказок.
🔍 Що вміє Qwen-VLo:
• Генерація зображень у різноманітних стилях — від фотореалізму до художньої графіки, з урахуванням заданої теми чи естетики.
• Ітеративне редагування — можна поетапно додавати, прибирати або трансформувати об’єкти на зображенні. Наприклад, змінити одяг персонажа, додати новий фон або прибрати зайві елементи.
• Додавання тексту до зображень — підтримується overlay-текст, однак кирилиця ще працює нестабільно (є помилки рендерингу).
🧠 На чому побудована модель:
Qwen-VLo поєднує можливості великої мовної моделі з комп’ютерним баченням, що дозволяє не лише інтерпретувати текст, а й розуміти структуру та контекст зображення. Вона підтримує двосторонню взаємодію: текст → зображення і зображення → текст, включаючи розпізнавання зображень і генерацію коментарів.
💡 Додаткові переваги:
• Безкоштовний доступ — протестувати можна прямо зараз через Qwen Chat
• Підтримка багатьох мов (хоча українська ще не досконала)
• Постійні оновлення і відкритий офіційний блог із прикладами використання
• Висока точність розпізнавання візуального контексту (наприклад, «збільшити кількість яблук у кошику»)
📌 Підсумок:
Qwen-VLo — перспективний інструмент для дизайнерів, ілюстраторів, блогерів і всіх, хто працює з візуальним контентом. Це ще один крок до інтеграції штучного інтелекту в творчі процеси — доступний, потужний і інтуїтивний.
🔗 Спробувати прямо зараз: chat.qwen.ai
📖 Читати офіційний реліз: qwenlm.github.io/blog/qwen-vlo
Залишити коментар