«Искусственный интеллект быстро развивается и ОпенАИ с релизом задает новую, более серьезную планку Обзор ChatGPT-4o1. Эта модель представляет собой значительный прогресс в сложных рассуждениях и обещает изменить наш подход к SEO и цифровому маркетингу. © Обзор ChatGPT-4o1
Сразу после релиза команда Webpraktik SEO протестировала версию 4о1 и готова рассказать, что умеет новая модель, чем она отличается от предыдущих и чем помогает SEO-специалисту.
За 1 час 30 минут тестирования мы превзошли все лимиты, но оно того стоило. Вероятно, мы не видели такого прорыва с момента выпуска ChatGPT-4. Команда Сэма Альтмана в очередной раз прыгнула выше головы и создала продукт, значительно опередивший конкурентов.
На скриншоте: ChatGPT-4o1 рисует графический интерфейс приложения, которого еще десять минут назад не существовало в природе.
Содержание
Основные возможности ChatGPT-4o1-превью
Это не просто обновление предыдущей модели, но и шаг вперед в способности искусственного интеллекта рассуждать и адаптироваться сложными способами.
Продвинутое сложное рассуждение
Главной особенностью новой модели является поколение длинные цепочки мыслей перед предоставлением ответа, что существенно увеличивает глубину и качество выводов.
Вот как выглядит самая продвинутая система рассуждений – то, что мы делали раньше, с очень длинными подсказками и пошаговыми инструкциями.
Разница также заметна в повседневных задачах SEO. Например, вот запрос на создание метатегов для 4o1-mini:
Простые задачи выполняются без громоздких объяснений и подсказок, буквально за секунды.
Ничего волшебного здесь нет, но в мелочах модель не допускает ошибок. Нам еще предстоит увидеть какие-либо галлюцинации или попытки отклониться от задачи или зайти в бесконечный цикл. И да, нам так и не удалось сделать полную версию 4o1 потрясающей (даже если мы очень старались).
Ранние версии ChatGPT-4 буквально сходили с ума от вопросов на конкретные, специализированные темы. Итак, чтобы ответить на этот вопрос, «четверка» придумала квест-историю о торжестве. Коммунизм Talos and the Rising of the Priests, хотя в самой игре ничего подобного не было. 4о и 4о1 без проблем справляются с аналогичными задачами
Такой подход существенно увеличивает нагрузку на серверы, но позволяет выполнить задачу с поразительной точностью. Согласно тестам OpenAI, новая модель справляется с задачами олимпиадного уровня. в 6 раз лучше старого. Это огромная разница между разрешением проблем в 13 % в предыдущей версии и 83 % в предварительной версии 4o1.
Обучение с подкреплением и адаптивность
Использование алгоритма масштабирования обучение с подкреплениеммодель постоянно развивается, улучшая свои результаты по мере взаимодействия с пользователем.
- Адаптивность. С каждой новой задачей ChatGPT-4o1-preview становится точнее, подстраиваясь под конкретные требования и стиль пользователя.
- Эффективность. Быстрая обработка сложных запросов экономит время и ресурсы, повышая общую производительность.
И это показывает: с каждым запросом нейросеть все точнее понимает, что вам нужно.
Такая структура ответа типична для новой версии: сначала простой ответ в зависимости от условий задачи, затем, если пользователь уточняет вопрос, модель также начинает усложнять ответ, собирая все больше данных и ветвей.
Из-за лимита запросов мы не смогли полноценно протестировать полную версию ChatGPT-4o1 для работы с цепочками подсказок, но нейросеть всего за два запроса написала рабочее Python-приложение на основе JS-скрипта, а на третьем предложила и реализован ряд улучшений.
В целом, мы видим ряд возможностей автоматизации службы SEO, которые можно реализовать в новой версии:
- Автоматическая проверка текстов по заданным характеристикам/моделям. 4o было недостаточно для этой задачи, 4o1 могло хватить с высококачественными образцами и подсказками.
- Отходим от использования Google App Script к простым приложениям Python. Даже с 4o и MS Copilot программирование стало еще проще. – Вам больше не придется ставить задачи программистам по написанию внутренних скриптов и работе с API.
- Упрощение работы с внутренними документами. Как минимум обновите все старые инструкции.
- Первичный анализ. Загрузите набор необработанных данных (например, копию CSV-файла с позициями), который позволит вам быстро оценить закономерности и направления.
- Улучшены описания продуктов, метатеги, SEO-текст. Постепенно заменяя 4o-mini на 4o1-mini в больших заданиях, вы сможете улучшить результаты на страницах, где используется сгенерированный текст.
И это именно то, что лежит на поверхности. После реализации мультимодальности мы обязательно проверим выгрузку данных BI-отчетов и метрик напрямую, через таблицы и скриншоты.
Сравнение ChatGPT-4o и ChatGPT-4o1-превью
Чтобы полностью понять улучшения, представленные в новой модели, давайте на практических примерах сравним ее производительность с предыдущей версией.
Задача 1. Разработать маркетинговую стратегию нового продукта
Запрос:
Четырем моделям (включая две мини) удалось написать на столе. Но Обзор ChatGPT-4o1 Я смог более четко распределить время и задачи:
ЧатGPT-4o при раскрытии предмета он работал заметно слабее.
Задача 2. Конкурентный анализ
Запрос:
Результат 4o1 ниже.
А вот как выглядит решение 4о.
Версия 4о1 раскрывает проблему глубже, а несколько итераций и размышлений позволяют добиться более интересного результата. В задачах с одним действием 4o1 может дать даже худшие результаты, чем 4o. Весь его потенциал раскрывается на расстоянии и в туманных технических характеристиках.
Например, при тестировании кода по запросу «улучшить интерфейс» модель сама добавляла индикатор выполнения или запускала фичу через командную строку после запроса «оптимизировать код».
КотGPT-4o1 более креативен по сравнению с предыдущими версиями, когда задача определена без четких границ. И это, наверное, главное достижение OpenAI в сентябрьском обновлении: их модель сделала еще один шаг навстречу человечности.
Подводные камни
Несмотря на очевидные преимущества очередного (хотя и ожидаемого) прорыва OpenAI, есть и неприятные моменты. Их немного:
- 4o1-preview ограничен 30 запросами в неделю. Доступ к тестам имеют только пользователи платных версий Plus и Enterprise. Ожидается, что в будущем ограничения будут сняты. Также планируется открыть доступ к o1-mini всем бесплатным пользователям ChatGPT, но когда — неясно.
Причина – цена работы с новой моделью.
Для сравнения вот прайс-лист на работу через API с GPT-4o
Если сравнивать работу по API, то цена новой модели в 12 раз выше 4о. Пока цены на логические выводы не снизятся, новую нейросеть можно использовать либо как редактор, проверяющий работу агентов нижнего уровня, либо для экспериментов/работы над крупнобюджетными проектами.
- Никакой мультимодальности. Нейронная сеть работает только с текстом; для работы, например, с изображениями или таблицами потребуется запустить 4o. Это также ставит крест на аналитических экспериментах: большая часть интересующих меня данных находится в таблицах Excel или скриншотах графиков.
- Нет доступа в Интернет. Что означает «база данных ограничена концом 2023 года»? Есть возможность запросить информацию через интернет у 4о и передать собранные данные в окно 4о1, но это, мягко говоря, не совсем удобно.
- Он плохо шутит. Один из моих любимых тестов на цензуру — «придумай шутку про три стереотипа в баре«4o1 успешно справился, начав рассказывать что-то в стиле «все люди — братья, давайте жить дружно». В целом цензура не мешает, но здесь нужно гораздо больше экспериментов.
Заключение
Новое обновление — это серьезный шаг вперед в переходе с GPT-3.5 на 4. Улучшено все: парсинг, работа с текстами, понимание запроса пользователя. И тех, кто бездумно переписывает из статьи в статью»НОВЫЕ НЕЙРОННЫЕ СЕТИ НАУЧИЛИСЬ ДУМАТЬ«не так уж далеки от истины.
4о1 до сих пор не выдаёт идеальных текстов, не сочетает в себе отличную семантику, не может по графику определить причины проблем с сайтом (и вообще с графиками пока не работает). Его специальность — создание новых инструментов и шаблонов, которые облегчат вашу работу.
Создавайте скрипты, предоставляйте шаблоны технических спецификаций, организуйте таблицы Google Sheets со сложной системой функций. Новая модель специально разработана для этого.