Нещодавно компанія Meta представила модель Llama 4 – нову серію, яка використовує архітектуру Mixture of Experts (MoE). Експерти зазначають, що ця модель має змінити ландшафт ШІ з відкритим вихідним кодом. Її запуск означає кардинальні зміни в індустрії ШІ, позиціонуючи її для конкуренції з такими провідними системами, як GPT-4o і Gemini 2.0. Однією з головних особливостей Llama 4 є її відкритий вихідний код.
Нова серія охоплює три основні моделі, включаючи Llama 4 Scout, легку, але потужну мультимодальну модель. Також є Llama 4 Maverick, високопродуктивний аналог, який, як повідомляється, перевершує DeepSeek-V3 в різних тестах. Крім того, в серії є Llama 4 Behemoth, вражаюча модель з 2 трильйонами параметрів, яка, за прогнозами, перевершить GPT-4.5. Однак офіційний випуск Llama 4 Behemoth ще не відбувся.
Ефективність відповідає продуктивності
Однією з визначних характеристик Llama 4 є її обчислювальна ефективність. І Llama 4, і Maverick можуть працювати на одному графічному процесорі H100, використовуючи при цьому розширені можливості. Цей аспект робить їх більш економічно ефективними, ніж конкурентні моделі. Meta пропонує ціни на API, які нижче, ніж у конкурентів, що потенційно може зробити революцію в тому, як підприємства впроваджують штучний інтелект в масштабах. За словами компанії, модель Maverick зменшує кількість параметрів порівняно з конкурентами, не жертвуючи при цьому продуктивністю.
Лідер у сфері бенчмарків та відкритого коду
Llama 4 Maverick вже наробив галасу, перевершивши результати бенчмарку DeepSeek-V3. Наразі він займає 1417 місце в рейтингу Grand Model Arena, що робить його найкращою моделлю з відкритим вихідним кодом у сферах кодування, міркувань та творчого написання текстів.
Мета стверджує, що ця модель буде загальнодоступною для розробників. На відміну від попередніх ітерацій Llama, серія Llama 4 за своєю суттю є мультимодальною, що дозволяє їй ефективно працювати з текстом, зображеннями та складними візуальними завданнями. Наприклад, модель Scout прокладає шлях для штучного інтелекту з відкритим вихідним кодом, ефективно розпізнаючи об’єкти, аналізуючи зображення та взаємодіючи з контекстними запитами.
Крім того, модель підтримує розширений мовний діапазон – до 200 мов, що розширює її доступність порівняно з попередніми моделями. Поряд з підвищенням планки для ШІ з відкритим вихідним кодом за допомогою Llama 4, Meta посилює конкуренцію з такими технологічними гігантами, як Google та OpenAI.
Підказки Сема Альтмана, генерального директора OpenAI, свідчать про майбутні зміни в GPT. Інновації Meta в ціноутворенні та продуктивності можуть призвести до значних змін у тому, як титан ШІ підходить до доступності та ціноутворення. Незабаром ми можемо вступити в еру, коли моделі з відкритим вихідним кодом будуть лідирувати в революції ШІ.