OpenAI анонсировала языковые модели следующего поколения o3 и o3-mini, обладающие способностью «рассуждать». Прежде чем ответить на вопрос пользователя, модель выстраивает цепочку рассуждений, чтобы ответ был более точным.
По данным компании, модель o3 бьет рекорды производительности по всем направлениям. Например, эта версия ИИ превзошла o1 на 22,8% при написании кода (тест SWE-Bench Verified). Кроме того, модель превзошла результаты исследователя OpenAI в области спортивного программирования. Модель также чуть не выиграла одно из самых сложных математических соревнований AIME 2024, пропустив вопрос, и набрала 87,7% в экспертном тесте GPQA Diamond.
В компании заявили, что, хотя модели o3 и o3-mini все еще учатся, их окончательные результаты все еще могут измениться. OpenAI сейчас принимает заявки на тестирование моделей перед официальным запуском, дата которого пока неизвестна.
Напомним, предыдущая модель o1 была представлена в сентябре 2024 года. OpenAI намеренно опустила номер и назвала следующую модель o3, а не o2, чтобы нейросеть не путали с британской телекоммуникационной компанией O2.
Источник: Край