Оновлення Siri Apple Gemini формує нову архітектуру голосового асистента, де Apple поєднує локальні моделі, хмарні обчислення та сторонні AI-системи. Згідно з розслідуванням The Information, майбутня Siri використовує дистиляцію Gemini від Google для on-device моделей, а складні запити обробляються у хмарі, включно з інфраструктурою Google Cloud та захищеними GPU від Nvidia.
Гібридна архітектура Siri: як працює система

Нова Siri будується як багаторівнева система:
- локальні моделі на iPhone, iPad і Mac виконують базові запити
- складні запити перенаправляються у хмару
- навчання локальних моделей відбувається через дистиляцію результатів Gemini
Ключова роль полягає в тому, що повна версія Gemini не запускається на пристрої — вона використовується як «викладач» для створення меншої моделі.
Дистиляція Gemini для on-device AI
Дистиляція означає перенесення поведінки великої моделі у компактну:
- Gemini генерує відповіді та патерни рішень
- Apple навчає на цих даних локальні моделі
- результат — швидка робота без постійного підключення до хмари
Це дозволяє обробляти базові запити Siri локально: таймери, повідомлення, прості питання.
Хмарна обробка складних запитів
Коли запит виходить за межі локальної моделі:
- Siri перенаправляє його в Google Cloud
- використовується ліцензована версія Gemini
- Apple застосовує захищені середовища виконання
Власна інфраструктура Apple Private Cloud Compute не масштабується під рівень трильйонних моделей, тому використовується зовнішня GPU-інфраструктура.
Nvidia Confidential Computing і захист даних
Apple схвалила використання технології Confidential Computing від Nvidia:
- дані шифруються під час обробки
- навіть хмарний провайдер не бачить вміст запиту
- моделі виконуються у захищених середовищах GPU
Це дозволяє зберігати приватність навіть при використанні сторонньої інфраструктури.
Приватність vs реальна архітектура
Apple продовжує використовувати бренд Private Cloud Compute, але фактична система включає:
- локальні моделі на пристрої
- хмару Google для важких запитів
- захищене GPU-виконання через Nvidia
Розрив між маркетингом і технічною реалізацією вже став предметом критики.
WWDC 8 червня: що очікувати
На WWDC 2026 очікується:
- новий інтерфейс Siri
- демонстрація AI-функцій поверх нової архітектури
- перехід до глибшої інтеграції Apple Intelligence
Повноцінний запуск пов’язують з iOS 27 у вересні.
Key Points
- Apple використовує Gemini для дистиляції локальних моделей Siri
- складні запити обробляються через Google Cloud
- Nvidia забезпечує захищене виконання AI на GPU
- локальна Siri працює без хмари для базових задач
- WWDC покаже користувацький шар нової архітектури
FAQ
Чи працює Gemini прямо на iPhone?
Ні. Використовується лише як модель-джерело для навчання локальних моделей.
Чому Apple використовує Google Cloud?
Через нестачу власної масштабованої GPU-інфраструктури для великих AI-моделей.
Чи безпечні дані користувача?
Так, завдяки Nvidia Confidential Computing дані шифруються під час обробки.
Коли з’явиться нова Siri?
Очікування — WWDC 8 червня та розширений запуск в iOS 27.















Blogarama - Blog Directory