Оновлення Siri Apple Gemini формує нову архітектуру голосового асистента, де Apple поєднує локальні моделі, хмарні обчислення та сторонні AI-системи. Згідно з розслідуванням The Information, майбутня Siri використовує дистиляцію Gemini від Google для on-device моделей, а складні запити обробляються у хмарі, включно з інфраструктурою Google Cloud та захищеними GPU від Nvidia.

Гібридна архітектура Siri: як працює система

Нова Siri будується як багаторівнева система:

локальні моделі на iPhone, iPad і Mac виконують базові запити
складні запити перенаправляються у хмару
навчання локальних моделей відбувається через дистиляцію результатів Gemini

Ключова роль полягає в тому, що повна версія Gemini не запускається на пристрої — вона використовується як «викладач» для створення меншої моделі.

Дистиляція Gemini для on-device AI

Дистиляція означає перенесення поведінки великої моделі у компактну:

Gemini генерує відповіді та патерни рішень
Apple навчає на цих даних локальні моделі
результат — швидка робота без постійного підключення до хмари

Це дозволяє обробляти базові запити Siri локально: таймери, повідомлення, прості питання.

Хмарна обробка складних запитів

Коли запит виходить за межі локальної моделі:

Siri перенаправляє його в Google Cloud
використовується ліцензована версія Gemini
Apple застосовує захищені середовища виконання

Власна інфраструктура Apple Private Cloud Compute не масштабується під рівень трильйонних моделей, тому використовується зовнішня GPU-інфраструктура.

Nvidia Confidential Computing і захист даних

Apple схвалила використання технології Confidential Computing від Nvidia:

дані шифруються під час обробки
навіть хмарний провайдер не бачить вміст запиту
моделі виконуються у захищених середовищах GPU

Це дозволяє зберігати приватність навіть при використанні сторонньої інфраструктури.

Приватність vs реальна архітектура

Apple продовжує використовувати бренд Private Cloud Compute, але фактична система включає:

локальні моделі на пристрої
хмару Google для важких запитів
захищене GPU-виконання через Nvidia

Читай також: Серія Redmi Note 10 c 108-мегапіксельними камерами вийде на початку березня

Розрив між маркетингом і технічною реалізацією вже став предметом критики.

WWDC 8 червня: що очікувати

На WWDC 2026 очікується:

новий інтерфейс Siri
демонстрація AI-функцій поверх нової архітектури
перехід до глибшої інтеграції Apple Intelligence

Повноцінний запуск пов’язують з iOS 27 у вересні.

Key Points

Apple використовує Gemini для дистиляції локальних моделей Siri
складні запити обробляються через Google Cloud
Nvidia забезпечує захищене виконання AI на GPU
локальна Siri працює без хмари для базових задач
WWDC покаже користувацький шар нової архітектури

FAQ

Чи працює Gemini прямо на iPhone?

Ні. Використовується лише як модель-джерело для навчання локальних моделей.

Чому Apple використовує Google Cloud?

Через нестачу власної масштабованої GPU-інфраструктури для великих AI-моделей.

Чи безпечні дані користувача?

Так, завдяки Nvidia Confidential Computing дані шифруються під час обробки.

Коли з’явиться нова Siri?

Очікування — WWDC 8 червня та розширений запуск в iOS 27.

Tagged:Apple Apple Intelligence Apple Siri оновлення Gemini AI Google Cloud iOS 27 Nvidia Confidential Computing WWDC WWDC 2026 дистиляція AI нова Siri архітектура штучний інтелект Apple

Fedir BUBNOV

Мене завжди цікавили IT-технології. І оскільки моя попередня багаторічна професійна діяльність (а це дизайн і додрукарська підготовка) неможлива без їх допомоги, то так вийшло, що всім, що було пов'язано з комп'ютерами (наприклад, збиранням і модернізацією "заліза", а також налаштуванням софта) мені завжди доводилося займатися самому.Ну, а з появою в нашому житті гаджетів, сфера моїх інтересів розширилася й на них теж.Люблю вивчати та аналізувати можливості різних пристроїв, і вже багато років, перш ніж придбати що-небудь нове, завжди дуже довго і ретельно вивчаю можливості кожної з потенційних моделей, проводжу досить тривалу і копітку роботу, читаю огляди, відгуки та порівняння.Нагородою за витрачений час зазвичай є те, що найчастіше я дійсно отримую найкраще з того, що можна взяти в рамках запланованого мною бюджету.