У серпні 2025 року Google DeepMind представила революційну AI-модель Genie 3, здатну створювати інтерактивні тривимірні світи на основі текстових запитів. Ця технологія виходить за межі статичних картинок чи відео — користувач може не лише бачити, а й досліджувати світ у реальному часі (720 p, 24 fps), змінюючи умови, і при цьому модель запам’ятовує об’єкти протягом кількох хвилин.

Походження та ключові особливості Genie 3

Genie 3 — наступник моделей Genie 1 і Genie 2. Якщо перші версії дозволяли генерувати середовища лише на 10–20 секунд, то Genie 3 підтримує когерентність світу протягом кількох хвилин і дозволяє керувати подіями всередині сцени.

Постійність світу: об’єкти лишаються на місці навіть після зміни перспективи або виходу зі сцени.
Інтерактивність: користувач може змінювати погоду, додавати персонажів або змінювати ландшафт текстовими запитами у процесі — без повторного генерування.
Реалістична фізика: явища, як вода, освітлення, рух, відтворюються без ручного кодування — через навчання моделі.
Ціль: напрям до AGI: моделювання таких інтерактивних світів може стати ключовим етапом на шляху до штучного загального інтелекту, особливо у контексті навчання агентів.

Технічні характеристики

Роздільна здатність: 720 p
Частота кадрів: 24 fps
Тривалість когерентності: декілька хвилин.
Режим: реальний час, з “promptable world events” – події, що змінюють світ під час гри.

Приклади застосування

Тренування AI-агентів: безпечна підготовка роботів та машин у віртуальних умовах.
Освіта: інтерактивні історичні чи екологічні симуляції для учнів.
Геймінг і VR: прототипи ігрових середовищ з інтерактивною логікою.
Кіно та медіа: швидке створення концепт-артів для візуалізації сцен.

Обмеження Genie 3

Genie 3 наразі доступна лише для обмеженої групи дослідників та творців у рамках пілотної програми. Інтерактивність поки обмежена, не підтримується кілька агентів одночасно, а симуляції генерації світу тривають лише кілька хвилин.

Читай також: Huawei представила Smart Screen S6 Pro з частотою оновлення 288 Гц!

Перспективи розвитку

Ця модель відкрила дорогу для подальших моделей у напрямку AGI. Очікується, що подальші версії підвищать реалістичність, інтерактивність і тривалість симуляцій. Genie 3 вже дозволяє побачити, як можуть виглядати майбутні цифрові світи, що реагують і пам’ятають.

Висновок

Genie 3 — це потужний прорив у моделюванні AI-світів. Вона демонструє, як текстові підказки можна перетворити на живі, адаптивні 3D-світи в реальному часі. Це не просто технологічна демонстрація — це фундамент для тренування AI-агентів, освітніх симуляцій та майбутнього інтерактивного контенту.

Tagged:AI Genie 3 Google Deepmind Технології

Fedir BUBNOV

Мене завжди цікавили IT-технології. І оскільки моя попередня багаторічна професійна діяльність (а це дизайн і додрукарська підготовка) неможлива без їх допомоги, то так вийшло, що всім, що було пов'язано з комп'ютерами (наприклад, збиранням і модернізацією "заліза", а також налаштуванням софта) мені завжди доводилося займатися самому. Ну, а з появою в нашому житті гаджетів, сфера моїх інтересів розширилася й на них теж. Люблю вивчати та аналізувати можливості різних пристроїв, і вже багато років, перш ніж придбати що-небудь нове, завжди дуже довго і ретельно вивчаю можливості кожної з потенційних моделей, проводжу досить тривалу і копітку роботу, читаю огляди, відгуки та порівняння. Нагородою за витрачений час зазвичай є те, що найчастіше я дійсно отримую найкраще з того, що можна взяти в рамках запланованого мною бюджету.