ChatGPT-4o1: первые впечатления от SEO-специалиста

«Искусственный интеллект быстро развивается и ОпенАИ с релизом задает новую, более серьезную планку Обзор ChatGPT-4o1. Эта модель представляет собой значительный прогресс в сложных рассуждениях и обещает изменить наш подход к SEO и цифровому маркетингу. © Обзор ChatGPT-4o1

Сразу после релиза команда Webpraktik SEO протестировала версию 4о1 и готова рассказать, что умеет новая модель, чем она отличается от предыдущих и чем помогает SEO-специалисту.

За 1 час 30 минут тестирования мы превзошли все лимиты, но оно того стоило. Вероятно, мы не видели такого прорыва с момента выпуска ChatGPT-4. Команда Сэма Альтмана в очередной раз прыгнула выше головы и создала продукт, значительно опередивший конкурентов.

ЧатGPT-4o1

На скриншоте: ChatGPT-4o1 рисует графический интерфейс приложения, которого еще десять минут назад не существовало в природе.

Содержание

1 Основные возможности ChatGPT-4o1-превью
- 1.1 Продвинутое сложное рассуждение
- 1.2 Обучение с подкреплением и адаптивность
2 Сравнение ChatGPT-4o и ChatGPT-4o1-превью
- 2.1 Задача 1. Разработать маркетинговую стратегию нового продукта
- 2.2 Задача 2. Конкурентный анализ
3 Подводные камни
4 Заключение

Основные возможности ChatGPT-4o1-превью

Это не просто обновление предыдущей модели, но и шаг вперед в способности искусственного интеллекта рассуждать и адаптироваться сложными способами.

Продвинутое сложное рассуждение

Главной особенностью новой модели является поколение длинные цепочки мыслей перед предоставлением ответа, что существенно увеличивает глубину и качество выводов.

КотGPT-4o1

Вот как выглядит самая продвинутая система рассуждений – то, что мы делали раньше, с очень длинными подсказками и пошаговыми инструкциями.

Разница также заметна в повседневных задачах SEO. Например, вот запрос на создание метатегов для 4o1-mini:

КотGPT-4o1

Простые задачи выполняются без громоздких объяснений и подсказок, буквально за секунды.

Ничего волшебного здесь нет, но в мелочах модель не допускает ошибок. Нам еще предстоит увидеть какие-либо галлюцинации или попытки отклониться от задачи или зайти в бесконечный цикл. И да, нам так и не удалось сделать полную версию 4o1 потрясающей (даже если мы очень старались).

КотGPT-4o1

Ранние версии ChatGPT-4 буквально сходили с ума от вопросов на конкретные, специализированные темы. Итак, чтобы ответить на этот вопрос, «четверка» придумала квест-историю о торжестве. ~~Коммунизм~~ Talos and the Rising of the Priests, хотя в самой игре ничего подобного не было. 4о и 4о1 без проблем справляются с аналогичными задачами

ЧИТАТЬ Купленные ссылки в Рунете. Как можно еще добиться санкций от заседателя? Подкаст 406 SEOquick

Такой подход существенно увеличивает нагрузку на серверы, но позволяет выполнить задачу с поразительной точностью. Согласно тестам OpenAI, новая модель справляется с задачами олимпиадного уровня. в 6 раз лучше старого. Это огромная разница между разрешением проблем в 13 % в предыдущей версии и 83 % в предварительной версии 4o1.

Обучение с подкреплением и адаптивность

Использование алгоритма масштабирования обучение с подкреплениеммодель постоянно развивается, улучшая свои результаты по мере взаимодействия с пользователем.

Адаптивность. С каждой новой задачей ChatGPT-4o1-preview становится точнее, подстраиваясь под конкретные требования и стиль пользователя.

Эффективность. Быстрая обработка сложных запросов экономит время и ресурсы, повышая общую производительность.

И это показывает: с каждым запросом нейросеть все точнее понимает, что вам нужно.

КотGPT-4o1

Такая структура ответа типична для новой версии: сначала простой ответ в зависимости от условий задачи, затем, если пользователь уточняет вопрос, модель также начинает усложнять ответ, собирая все больше данных и ветвей.

Из-за лимита запросов мы не смогли полноценно протестировать полную версию ChatGPT-4o1 для работы с цепочками подсказок, но нейросеть всего за два запроса написала рабочее Python-приложение на основе JS-скрипта, а на третьем предложила и реализован ряд улучшений.

В целом, мы видим ряд возможностей автоматизации службы SEO, которые можно реализовать в новой версии:

Автоматическая проверка текстов по заданным характеристикам/моделям. 4o было недостаточно для этой задачи, 4o1 могло хватить с высококачественными образцами и подсказками.

Отходим от использования Google App Script к простым приложениям Python. Даже с 4o и MS Copilot программирование стало еще проще. – Вам больше не придется ставить задачи программистам по написанию внутренних скриптов и работе с API.

Упрощение работы с внутренними документами. Как минимум обновите все старые инструкции.

Первичный анализ. Загрузите набор необработанных данных (например, копию CSV-файла с позициями), который позволит вам быстро оценить закономерности и направления.

Улучшены описания продуктов, метатеги, SEO-текст. Постепенно заменяя 4o-mini на 4o1-mini в больших заданиях, вы сможете улучшить результаты на страницах, где используется сгенерированный текст.

И это именно то, что лежит на поверхности. После реализации мультимодальности мы обязательно проверим выгрузку данных BI-отчетов и метрик напрямую, через таблицы и скриншоты.

Сравнение ChatGPT-4o и ChatGPT-4o1-превью

Чтобы полностью понять улучшения, представленные в новой модели, давайте на практических примерах сравним ее производительность с предыдущей версией.

Задача 1. Разработать маркетинговую стратегию нового продукта

Запрос:

КотGPT-4o1

Четырем моделям (включая две мини) удалось написать на столе. Но Обзор ChatGPT-4o1 Я смог более четко распределить время и задачи:

ЧатGPT-4o при раскрытии предмета он работал заметно слабее.

Задача 2. Конкурентный анализ

Запрос:

КотGPT-4o1

Результат 4o1 ниже.

А вот как выглядит решение 4о.

Версия 4о1 раскрывает проблему глубже, а несколько итераций и размышлений позволяют добиться более интересного результата. В задачах с одним действием 4o1 может дать даже худшие результаты, чем 4o. Весь его потенциал раскрывается на расстоянии и в туманных технических характеристиках.

Например, при тестировании кода по запросу «улучшить интерфейс» модель сама добавляла индикатор выполнения или запускала фичу через командную строку после запроса «оптимизировать код».

КотGPT-4o1 более креативен по сравнению с предыдущими версиями, когда задача определена без четких границ. И это, наверное, главное достижение OpenAI в сентябрьском обновлении: их модель сделала еще один шаг навстречу человечности.

Подводные камни

Несмотря на очевидные преимущества очередного (хотя и ожидаемого) прорыва OpenAI, есть и неприятные моменты. Их немного:

4o1-preview ограничен 30 запросами в неделю. Доступ к тестам имеют только пользователи платных версий Plus и Enterprise. Ожидается, что в будущем ограничения будут сняты. Также планируется открыть доступ к o1-mini всем бесплатным пользователям ChatGPT, но когда — неясно.

Причина – цена работы с новой моделью.

КотGPT-4o1

Для сравнения вот прайс-лист на работу через API с GPT-4o

КотGPT-4o1

Если сравнивать работу по API, то цена новой модели в 12 раз выше 4о. Пока цены на логические выводы не снизятся, новую нейросеть можно использовать либо как редактор, проверяющий работу агентов нижнего уровня, либо для экспериментов/работы над крупнобюджетными проектами.

Никакой мультимодальности. Нейронная сеть работает только с текстом; для работы, например, с изображениями или таблицами потребуется запустить 4o. Это также ставит крест на аналитических экспериментах: большая часть интересующих меня данных находится в таблицах Excel или скриншотах графиков.

Нет доступа в Интернет. Что означает «база данных ограничена концом 2023 года»? Есть возможность запросить информацию через интернет у 4о и передать собранные данные в окно 4о1, но это, мягко говоря, не совсем удобно.

Он плохо шутит. Один из моих любимых тестов на цензуру — «придумай шутку про три стереотипа в баре«4o1 успешно справился, начав рассказывать что-то в стиле «все люди — братья, давайте жить дружно». В целом цензура не мешает, но здесь нужно гораздо больше экспериментов.

Заключение

Новое обновление — это серьезный шаг вперед в переходе с GPT-3.5 на 4. Улучшено все: парсинг, работа с текстами, понимание запроса пользователя. И тех, кто бездумно переписывает из статьи в статью»НОВЫЕ НЕЙРОННЫЕ СЕТИ НАУЧИЛИСЬ ДУМАТЬ«не так уж далеки от истины.

4о1 до сих пор не выдаёт идеальных текстов, не сочетает в себе отличную семантику, не может по графику определить причины проблем с сайтом (и вообще с графиками пока не работает). Его специальность — создание новых инструментов и шаблонов, которые облегчат вашу работу.

Создавайте скрипты, предоставляйте шаблоны технических спецификаций, организуйте таблицы Google Sheets со сложной системой функций. Новая модель специально разработана для этого.

Source link

ChatGPT-4o1: первые впечатления от SEO-специалиста