Китайська платформа коротких відео Kuaishou представила Kling – модель перетворення тексту у відео. Клінг приєднується до зростаючої області подібних моделей, які можуть створювати відео з текстових описів, як Sora з OpenAI та нещодавно представлений Google Veo.
Kling може створювати відео з роздільною здатністю 1080p зі швидкістю 30 кадрів на секунду і максимальною тривалістю дві хвилини. Модель може створювати зображення фізичного світу, включно з точними рухами та взаємодіями об’єктів.
Клінг використовує 3D-реконструкцію обличчя і тіла для створення реалістичних персонажів з повним спектром виразів і плавними рухами кінцівок. Ось приклад Google Veo.
Наразі Kling доступний у відкритому доступі, а це означає, що користувачі можуть експериментувати з можливостями моделі. Це контрастує з обмеженнями глобального доступу для майбутньої моделі OpenAI “Sora”.
Розробка Клінга є яскравим прикладом досягнень Китаю в галузі штучного інтелекту. Але загалом дивно, наскільки далеко просунувся ШІ менш ніж за два роки. Ось довідкове відео:
Випуск Kling у поєднанні з майбутнім випуском Sora передбачає подальший прогрес у технології перетворення тексту у відео. Хоча довгостроковий вплив і доступність цих моделей ще належить побачити, їхній розвиток означає динамічну картину в галузі створення відео за допомогою штучного інтелекту.
Залишити коментар