Мы в Telegram
Добавить новость
АиФ
Май
2024

Почти как человек. Новый чат-бот умеет шутить и подстраиваться под эмоции

0
АиФ 
Почти как человек. Новый чат-бот умеет шутить и подстраиваться под эмоции

Предполагается, что нейросеть GPT-4o сможет показывать пользователю спортивную игру и тут же объяснять её правила. А по фотографии меню в ресторане рассказывать о блюдах и давать по ним рекомендации.

Компания Open AI, разработчик чат-бота ChatGPT, представила новейшую модель генеративного искусственного интеллекта. Она быстрее старой, обладает более широким набором функций, может переводить с одного языка на другой в реальном времени, «улавливать» эмоции говорящего и отвечать с разной интонацией. А ещё — шутить и «смеяться».

Aif.ru спросил у экспертов, можно ли в данном случае говорить о прорыве, есть ли что-то настораживающе в этой разработке и каких навыков и умений стоит ожидать от нейросетей в последующие годы.

Переводит на лету

Новую модель искусственного интеллекта назвали GPT-4o. Символ «о» означает «omni» и переводится как «всесторонний».

Чат-бот способен анализировать звук, изображение и текст в режиме реального времени и делает это лучше, чем его предыдущие версии. Он реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией человека в разговоре.

Как отмечают разработчики, GPT-4o направлен на большее взаимодействие с человеком в роли его помощника. Например, бота можно будет прервать во время ответа. Он будет улавливать эмоции в голосе человека и подстраиваться под них, меняя интонации.

В компании обращают внимание, что предыдущая модель GPT-4 теряет множество информации в ходе общения с пользователем и не умеет воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — говорят разработчики.

Ключевым нововведением называют способность GPT-4o понимать фотографии напрямую с камеры в реальном времени (до этого чат-бот мог видеть лишь загруженные изображения). Это делает взаимодействие с нейросетью более естественным. Например, GPT-4o по фотографии ресторанного меню на иностранном языке сможет переводить названия блюд, рассказывать о них, давать по ним рекомендации.

Предполагается, что чат-бот сможет общаться с пользователем и по видео — например, показывать ему в прямом эфире какую-то спортивную игру и объяснять её правила.

GPT-4o владеет более чем 50 языками, в том числе русским, казахским, грузинским, китайским, арабским, турецким, сербским. Причём понимать и переводить речь он способен на лету — прямо как профессионал-переводчик.

Не революция, но хорошее обновление

«Безусловно, эта модель на сегодня абсолютный мировой лидер. По всем параметрам она превосходит свои предыдущие версии, решения конкурентов и публичные открытые модели, — прокомментировал разработку для aif.ru заместитель директора Института искусственного интеллекта Университета Иннополис Иван Никанов. — В чём главное новшество? Большая работа проделана в части оптимизации и ускорения работы. Нейросеть теперь умеет понимать видео и голос с минимальной задержкой, почти в режиме реального времени, и это одно из главных конкурентных преимуществ. Например, задержка звука нейросети Google Gemini — больше трех секунд. А у GPT-4o — 300 миллисекунд».

«Итоги презентации обновлений GPT следует воспринимать не как революцию, но как хорошее обновление продукта. Это очень качественная модель от лидеров отрасли, — говорит генеральный директор Института искусственного интеллекта AIRI, профессор Сколтеха Иван Оселедец. — По результатам работы с текстом (модели соревнуются друг с другом на ChatGPT Arena) она превосходит все существующие решения, но отставание уже сократилось — Falcon, Gemini и другие дышат в спину. Увеличилась скорость работы, а также появились новые функции — например, синтез речи. Все они есть и в решениях других стартапов, но на данный момент объединить их в одном продукте лучше всего получается у компании Open AI».

Дальше — взаимодействие нейросетей

Есть ли что-то в новой модели, что настораживает специалистов, в том числе в плане безопасности? Никанов обращает внимание, что в датасет (набор данных) для тренировки GPT-4o попадал спам и сомнительные запросы пользователей из интернета.

«Компания OpenAI заявляет об очень тщательной работе с данными и об их фильтрации, однако практика показывает, что ошибки неизбежны даже у лидеров рынка. Энтузиасты нашли в новом мультиязычном токенизаторе на китайском языке рекламу казино и другие отсылки из "мусорного" сегмента интернета», — говорит эксперт.

Чего стоит ожидать от нейросетей в последующие годы? Какие навыки и умения разовьют у них специалисты?

«Стоит ожидать ускорения быстродействия и улучшения работы с мультимодальными данными с сохранением контекста. Проще говоря, нейросеть сможет в режиме реального времени оперировать видео, звуком, текстом и "понимать" связность объектов в информационных потоках различной природы», — считает Никанов.

«Думаю, продолжатся общие тренды разработки ИИ-моделей. Все сейчас нацелены на генерацию видео, а также переход к "агентным системам": вместо одной нейросети будет работать много нейросетей, взаимодействующих друг с другом, — делится своим мнением Оселедец. — Что касается мультимодальности, то есть умения модели воспринимать не только текст, но и другие форматы одновременно, то представленные результаты говорят об активной работе в данном направлении, но прорывов тут пока нет».






Загрузка...


Губернаторы России
Москва

В Москве выбрали лучших педагогов в рамках городского конкурса — Собянин


Спорт в России и мире
Москва

На ВДНХ пройдет Удмуртский национальный праздник Гербер


Загрузка...

Все новости спорта сегодня


Новости тенниса
Сюзанн Ленглен

Последний танец Надаля и юбка Сюзанн Ленглен: 6 важных фактов о «Ролан Гаррос»-2024


Загрузка...


123ru.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.


Загрузка...

Загрузка...

Экология в России и мире
Москва

Проверку начали после загрязнения реки Сетунь в Москве





Путин в России и мире
Москва

Создать комфортные условия для исследований и обучения


Лукашенко в Беларуси и мире



123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.





Зеленский в Украине и мире
Киев

Белый дом признал причастность к выработке «формулы мира» Киева


Навальный в России и мире
Москва

Раз нет протестов, будут санкции: как навальнисты и команда Ходорковского меняют стратегию борьбы с Россией



Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...



Булат Окуджава

Музыка и стихи: концерт к 100-летию со дня рождения Булата Окуджавы состоится в Троицке



Москва

Жителей Подмосковья предупредили о грозе и сильных порывах ветра

Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net