OpenAI представила новую флагманскую модель генеративного ИИ под названием GPT-4o («o» означает «omni»). Данная модель существенно улучшает функциональность чат-бота ChatGPT, он способен обрабатывать текст, речь и видео. Пользователи могут общаться с ChatGPT в режиме реального времени с помощью голоса и прерывать его во время разговора.
GPT-4o будет бесплатным для всех пользователей.
Новая модель будет постепенно внедряться в продукцию компании в течение ближайших недель. Он будет доступен в виде приложения, которое сначала будет доступно пользователям ChatGPT Plus.
Основные характеристики GPT-4 Omni
- Общается на естественном языке, обрабатывает информацию в режиме реального времени, понимает эмоции.
- Отвечает на голосовые сообщения всего за 232 миллисекунды, что аналогично времени реакции человека в разговоре.
- Улучшена многоязычность: она работает примерно на 50 языках, включая русский.
- В настольном приложении оно распознает экран рабочего стола и отвечает на вопросы. Например, он может объяснить, где в коде была допущена ошибка.
- В 2 раза быстрее и в 2 раза дешевле предыдущей модели OpenAI GPT-4 Turbo.
OpenAI обещает существенно расширить функциональность GPT-4o. Начиная со следующего месяца пользователи ChatGPT Plus получат доступ к улучшенному голосовому помощнику на основе GPT-4o.
Напомним, в апреле 2024 года OpenAI открыла доступ к ChatGPT без регистрации.
Источник: ОпенАИ