Meta* випустили Llama 4 – найпотужніше сімейство ШІ-моделей, яке рве бенчі та вбиває конкурентів.

Усі версії мультимодальні – розуміють текст, картинки та відео нативно. Знання – до серпня 2024 року. Протестувати можна тут.
🚀 Модель Scout (109B)
⚫️ Контекстне вікно: 10 МІЛЬЙОНІВ токенів. Це рекорд.
⚫️ 16 експертів, 17B активних параметрів
⚫️ Б’є Gemma 3 і Gemini 2.0 Flash Lite
⚫️ Запускається на одній GPU
⚫️ Можна згодувати цілком «Війну і мир», «Тихий Дон» і «Біблію» разом
⚡️ Модель Maverick (400B)
🔘 Контекст: 1 МІЛЬЙОН токенів
🔘 128 експертів, ті самі 17B активних
🔘 На рівні GPT-4o і DeepSeek V3.1, але менше за вагою
🔘 Кодить крутіше, ніж ти сам
🔘 FP8 версія: huggingface.co/meta-llama/Llama-4-Maverick
🏆Модель Behemoth (2T)
🟡 2 ТРИЛЬЙОНА параметрів, 288B активних
🟡 Найпотужніша модель В ІСТОРІЇ
🟡 Обганяє GPT-4.5, Claude Sonnet 3.7, Gemini 2.0 Pro
🟡 Поки недоступна, але її напрацювання вже в Scout і Maverick

Усі моделі, навчені на 30 трлн токенів. Ваги для Scout і Maverick – на Hugging Face.
Залишити коментар