Siri перестанет бубнить? Apple работает над скоростью речи цифрового ассистента
Вот так дела, друзья! Сейчас все надежды на то, чтобы наша Siri стала умнее и шустрее, висят на одном коротеньком решении. Недавно Apple объявила о партнёрстве с Google, чтобы позаимствовать у них их ИИ-фишки, а точнее — технологию Gemini. Ну вы поняли, хотят быстренько прокачать своего голосового помощничка за счёт чужого ума. Это как взять у соседа крутой девайс на время, чтобы не отставать.
Но! Оказывается, есть и другой путь. Согласно одному свежему исследованию, у Apple есть свой, долгосрочный и дико интересный способ, чтобы заставить Siri работать быстрее — и всё это самостоятельно, своими силами. Представляете? Не полагаться на помощь со стороны, а раскопать свой собственный секретный рецепт. Вот это уже поострее, чем просто партнёрство, правда?
Статья «Принципиальный подход к грубому принятию решений при спекулятивном декодировании речи» была написана пятью исследователями из Apple и Тель-Авивского университета. В ней предлагается новый подход, который, по словам исследователей, может «ускорить генерацию речевых токенов при сохранении качества речи».
По мнению исследователей, ключ к повышению скорости — отказ от излишней строгости. «Для речевых больших языковых моделей, генерирующих акустические токены, — пишут они, — точное совпадение токенов является чрезмерным ограничением: многие дискретные токены акустически или семантически взаимозаменяемы, что снижает процент корректных ответов и ограничивает возможности ускорения». Другими словами, при определенном уровне сходства не имеет значения, какой из двух возможных речевых токенов будет выбран, поскольку они звучат или означают практически одно и то же, а попытки определить, какой из них правильный, отнимают время и ресурсы процессора.
Предлагаемое решение заключается в том, чтобы группировать акустически схожие лексемы.
«Мы предлагаем метод Principled Coarse-Graining (PCG) — подход, который заменяет точное сопоставление токенов проверкой на уровне групп, — поясняется в статье. — Мы формируем группы акустической схожести (ASG) в пространстве векторных представлений токенов целевой модели, отражая внутреннюю организацию семантической и акустической схожести. PCG выполняет спекулятивную выборку на основе грубого распределения по ASG и отбраковывает выборки на уровне групп».
Исследователи утверждают, что это повысит скорость работы Siri без существенного снижения надежности. В ходе экспериментов было установлено, что увеличение количества токенов в секунду немного снижает точность, но гораздо меньше, чем при стандартном спекулятивном декодировании.
Доступность Siri в России
Siri в России работает, но её функции отстают от актуальных мировых трендов и российских аналогов. Её главная особенность — глубокая интеграция в экосистему Apple, однако ассистенты от российских IT-компаний предлагают более развитую поддержку местных сервисов и языка.
Вот ключевое сравнение Siri с основными российскими голосовыми ассистентами:
Siri (Apple): Тип: Встроенный ассистент Apple. Ключевые особенности: Базовая интеграция с iOS, персонализация, приватность данных. Недостатки: Медленное обновление функций в России, слабая интеграция с местными сервисами. Пример команд: «Позвони маме», «Проложи маршрут домой».
Алиса (Яндекс): Тип: Ассистент российского IT-гиганта. Ключевые особенности: Глубокая интеграция с Яндекс.Сервисами, поддержка нейросети YandexGPT, лидер на рынке. Недостатки: Ограничена на iPhone без приложения. Пример команд: «Вызови такси», «Закажи пиццу».
Маруся (VK): Тип: Ассистент экосистемы VK. Ключевые особенности: Интеграция с VK Музыка и соцсетью, «дружелюбный» характер. Недостатки: Узкая поддержка умного дома, паузы в диалоге. Пример команд: «Включи музыку из VK», «Напиши сообщение другу».
Салют (Сбер): Тип: Ассистент экосистемы Сбера. Ключевые особенности: Управление финансами, три варианта голоса, нейросеть GigaChat. Недостатки: Замедленная работа, неестественный голос. Пример команд: «Переведи деньги», «Найди сериал на ТВ».
Будущее Siri: грядущие изменения
Apple активно работает над модернизацией Siri, чтобы догнать конкурентов. Ожидается, что в 2026 году Siri подвергнется значительному обновлению:
Крупное обновление запланировано на конец 2026 года. Siri превратится в полноценного ИИ-чат-бота под кодовым названием «Campos», способного вести сложные диалоги и выполнять многошаговые задачи.
Для этого Apple заключила партнёрство с Google, чтобы использовать в основе своей технологии модель Gemini.
Уже весной 2026 года в обновлении iOS 26.4 должна появиться «персонализированная Siri» — промежуточная версия с улучшенным пониманием контекста.
Практические рекомендации
Для пользователей Apple в России: Siri удобна для базовых команд в рамках экосистемы (звонки, будильники, настройки). Однако для заказа такси, управления умным домом или использования российских медиасервисов лучше установить приложения с Алисой или Марусей.
При выборе основного ассистента: Если ваш смартфон и большинство услуг (музыка, навигация, такси) — от Яндекса, выбирайте Алису. Если жизнь тесно связана с VK — вам подойдёт Маруся. Салют будет наиболее полезен активным клиентам Сбера.
В целом, пока Siri остаётся удобным, но ограниченным инструментом для пользователей iPhone в России, а её будущая конкурентоспособность напрямую зависит от успеха грядущего масштабного обновления.
Siri наконец-то перестанет «глохнуть»: Apple купила уникальный стартап для спасения iPhone
Сообщение Siri перестанет бубнить? Apple работает над скоростью речи цифрового ассистента появились сначала на DGL.RU - Цифровой мир: новости, тесты, обзоры телефонов, планшетов, ноутбуков.
