Stable Diffusion 3 Medium – ще один крок вперед у створенні зображень зі штучним інтелектом

Компанія Stability AI оголосила про відкритий реліз Stable Diffusion 3 Medium. Це перший відкритий реліз серії SD3 і найдосконаліша на сьогоднішній день відкрита модель генерації зображень за допомогою штучного інтелекту.

Компанія заявляє, що модель з відкритим вихідним кодом перевершує найкращі ШІ-генератори зображень (включаючи її власну) за можливостями фотореалізму. Крім того, було вдосконалено генерацію тексту.

Stable Diffusion 3 Medium: джерело

Stable Diffusion 3 Medium, що складається з двох мільярдів параметрів, є найдосконалішою відкритою моделлю перетворення тексту в зображення від Stability AI. Вона займає менше місця в VRAM, що робить її більш придатною для роботи як на побутових GPU, так і на графічних процесорах корпоративного рівня.

У Stability AI кажуть, що модель долає поширені артефакти на руках і обличчях, щоб забезпечити більш фотореалістичні зображення. Модель може розуміти складні підказки, що включають просторові відносини, композиційні елементи, дії та стилі, і може досягти “безпрецедентних результатів” у створенні тексту без артефактів і орфографічних помилок завдяки своїй архітектурі Diffusion Transformer.

Компанія також припускає, що модель ідеально підходить для кастомізації завдяки своїй здатності поглинати нюансні деталі з невеликих наборів даних.

Stability AI підкреслює, що провела широке внутрішнє і зовнішнє тестування моделі. Вона планує постійно вдосконалювати Stable Diffusion 3 Medium на основі відгуків користувачів і розширювати її можливості.

Доступ для некомерційного використання здійснюється через Hugging Face. API доступний на Stability Platform, або ви можете спробувати його, зареєструвавшись на безкоштовну триденну пробну версію на Stable Assistant і на Discord через Stable Artisan.