OpenAI отложила запуск голосового помощника в ChatGPT из-за проблем с безопасностью

Опубликовано
Функцию голосового помощника OpenAi представила в мае этого года на презентации новой ИИ-модели GPT-4o / Фото: Jaap Arriens/Reuters

OpenAI отложила запуск долгожданной функции голосового помощника для ChatGPT. Стартапу потребовался дополнительный месяц, чтобы обеспечить безопасную и эффективную обработку запросов миллионов пользователей. Перенос может быть воспринят как неудача лидера рынка, но в случае запуска «сырого» сервиса риски для репутации OpenAI были бы выше.

Детали 

OpenAI продемонстрировала работу голосового помощника в мае на презентации GPT-4o – обновленной версии языковой модели GPT-4, которая лучше справляется с обработкой текста, звука и изображений в режиме реального времени. Двадцать пятого июня компания сообщила, что изначально хотела предоставить доступ к голосовому помощнику небольшой группе платных подписчиков ChatGPT в конце июня, но затем решила взять еще месяц, чтобы «достичь [необходимой] планки для запуска».

«Мы улучшаем способность модели обнаруживать и отклонять определенный контент, – заявила OpenAI. – Мы также работаем над улучшением пользовательского опыта и подготавливаем нашу инфраструктуру к масштабированию до миллионов пользователей, сохраняя при этом возможность ответов в режиме реального времени».

Теперь OpenAI планирует развернуть голосовую функцию для всех своих платных подписчиков осенью. Компания сообщила также, что продолжает работу над запуском видео и совместного использования экрана, но не назвала сроки. Эти функции OpenAI также продемонстрировала в ходе майского мероприятия.

OpenAI пытается удерживать первенство на все более конкурентном поле технологий искусственного интеллекта. В прошлом году компания представила более ограниченную опцию для ChatGPT, позволяющую отвечать пользователям. Новая функция обещала быть быстрее и сочетаться с мощными возможностями распознавания изображений, пишет Bloomberg, превратив чат-бот в гораздо более полезного и динамичного собеседника.

Оправданный риск

Перенос запуска голосового помощника для ChatGPT свидетельствует о трудностях, с которыми сталкивается OpenAI в борьбе с конкурентами. Но при выпуске «сырого» сервиса в широкий доступ репутационный риск мог быть куда больше, отмечает агентство.

В феврале этого года Google была вынуждена отключить генератор изображений в конкурирующем с ChatGPT чат-боте Gemini через несколько дней после запуска. Причиной стал поток жалоб на отказы Gemini генерировать изображения людей европейской внешности. Google надеялся перезапустить генератор изображений людей в Gemini «в ближайшие пару недель», но эта функция до сих пор не работает.

Контекст

OpenAI на этой неделе предупредила разработчиков в Китае, что с июля заблокирует им доступ к своим инструментам искусственного интеллекта. Еще большее беспокойство может вызвать то, что модели с открытым исходным кодом, такие как Llama от Meta Platforms, также отключат доступ, считает глава сингапурской Dorje AI Бернард Леонг.

Baidu, Tencent и еще несколько китайских компаний быстро воспользовались уходом OpenAI. Они, пишет Bloomberg, активно переманивают разработчиков, предлагая различные стимулы. Baidu пообещал бесплатную тонкую настройку, а также 50 млн бесплатных токенов пользователям, перешедшим с OpenAI на его ИИ-модель Ernie. Baichuan, поддерживаемый Alibaba и Tencent, предложил за переход 10 млн токенов. Стартап 01.AI пионера технологий Ли Кайфу рекламирует большие скидки. Даже Microsoft — крупнейший спонсор OpenAI — опубликовал в WeChat пошаговое руководство по переходу на свой локальный сервис, которым управляет местный партнер 21Vianet.

Читайте также