У серпні 2025 року Google DeepMind представила революційну AI-модель Genie 3, здатну створювати інтерактивні тривимірні світи на основі текстових запитів. Ця технологія виходить за межі статичних картинок чи відео — користувач може не лише бачити, а й досліджувати світ у реальному часі (720 p, 24 fps), змінюючи умови, і при цьому модель запам’ятовує об’єкти протягом кількох хвилин.
Походження та ключові особливості Genie 3
Genie 3 — наступник моделей Genie 1 і Genie 2. Якщо перші версії дозволяли генерувати середовища лише на 10–20 секунд, то Genie 3 підтримує когерентність світу протягом кількох хвилин і дозволяє керувати подіями всередині сцени.
- Постійність світу: об’єкти лишаються на місці навіть після зміни перспективи або виходу зі сцени.
- Інтерактивність: користувач може змінювати погоду, додавати персонажів або змінювати ландшафт текстовими запитами у процесі — без повторного генерування.
- Реалістична фізика: явища, як вода, освітлення, рух, відтворюються без ручного кодування — через навчання моделі.
- Ціль: напрям до AGI: моделювання таких інтерактивних світів може стати ключовим етапом на шляху до штучного загального інтелекту, особливо у контексті навчання агентів.
Технічні характеристики
Роздільна здатність: 720 p
Частота кадрів: 24 fps
Тривалість когерентності: декілька хвилин.
Режим: реальний час, з “promptable world events” – події, що змінюють світ під час гри.
Приклади застосування
Тренування AI-агентів: безпечна підготовка роботів та машин у віртуальних умовах.
Освіта: інтерактивні історичні чи екологічні симуляції для учнів.
Геймінг і VR: прототипи ігрових середовищ з інтерактивною логікою.
Кіно та медіа: швидке створення концепт-артів для візуалізації сцен.
Обмеження Genie 3
Genie 3 наразі доступна лише для обмеженої групи дослідників та творців у рамках пілотної програми. Інтерактивність поки обмежена, не підтримується кілька агентів одночасно, а симуляції генерації світу тривають лише кілька хвилин.
Перспективи розвитку
Ця модель відкрила дорогу для подальших моделей у напрямку AGI. Очікується, що подальші версії підвищать реалістичність, інтерактивність і тривалість симуляцій. Genie 3 вже дозволяє побачити, як можуть виглядати майбутні цифрові світи, що реагують і пам’ятають.
Висновок
Genie 3 — це потужний прорив у моделюванні AI-світів. Вона демонструє, як текстові підказки можна перетворити на живі, адаптивні 3D-світи в реальному часі. Це не просто технологічна демонстрація — це фундамент для тренування AI-агентів, освітніх симуляцій та майбутнього інтерактивного контенту.
Нагадаємо, раніше ми писали, що Grok — штучний інтелект від Ілона Маска: особливості та порівняння з ChatGPT, Starlink Direct to Cell: що це та коли запрацює в Україні у 2025 та OpenAI заборонила ChatGPT давати поради у стосунках.