Услуги по созданию ссылок


Google полностью реорганизовал свою Документация по сканерам и сборщикам, активируемым пользователем. Это привыкший все было на одной странице, а теперь на нескольких. Большинство изменений заключалось в перемещении контента, но Google добавил разделы о том, на какой продукт влияет каждый краулер, и добавил фрагмент robots.txt для каждого краулера, чтобы продемонстрировать, как использовать токены агента пользователя.

Google написал«Документация стала очень длинной, что ограничило наши возможности по расширению контента о наших сканерах и сборщиках, запускаемых пользователями», поэтому они ее переделали.

Если вы углубитесь в каждый скан, например Googlebot вы увидите два новых раздела:

(1) Затронутые продукты

(2) Пример группы robots.txt

Вот пример скриншота, но то, что я выделил красным, было добавлено для каждого сканера:

Пример затронутых продуктов Google Crawler Группа роботов

Вот как каждый поисковик влияет на продукты:

  • Googlebot: Настройки сканирования, адресованные пользовательскому агенту Googlebot, влияют на поиск Google (включая Discover и все функции поиска Google), а также на другие продукты, такие как Google Images, Google Video, Google News и Discover.
  • Googlebot Image: Настройки сканирования, адресованные пользовательскому агенту Googlebot-Image, влияют на Google Images, Discover, Google Video и все функции в поиске Google, где представлены изображения, логотипы и значки.
  • Googlebot Video: Настройки сканирования, адресованные пользовательскому агенту Googlebot-Video, влияют на функции поиска Google, связанные с видео, и другие продукты, зависящие от видео.
  • Googlebot News: настройки сканирования, адресованные пользовательскому агенту Googlebot-News, влияют на все поверхности Google News (например, вкладку «Новости» в Google Search и приложение Google News).
  • Google StoreBot: Настройки сканирования, адресованные пользовательскому агенту Storebot-Google, влияют на все поверхности Google Покупок (например, вкладка «Покупки» в Google Поиске и Google Покупки).
  • Google-InspectionTool: Настройки сканирования, адресованные пользовательскому агенту Storebot-Google, влияют на инструменты тестирования поиска, такие как Rich Result Test и URL inspection в Search Console. Это не влияет на Google Search или другие продукты.
  • GoogleOther: Настройки сканирования, адресованные пользовательскому агенту GoogleOther, не влияют на какой-либо конкретный продукт. GoogleOther — это общий краулер, который может использоваться различными командами по продуктам для извлечения общедоступного контента с сайтов. Например, его можно использовать для одноразовых сканирований для внутренних исследований и разработок. Он не влияет на Google Search или другие продукты.
  • GoogleOther-Image: Настройки сканирования, адресованные пользовательскому агенту GoogleOther-Image, не влияют на какой-либо конкретный продукт, аналогично GoogleOther. GoogleOther-Image — это версия GoogleOther, оптимизированная для извлечения общедоступных URL-адресов изображений.
  • GoogleOther-Video: Настройки сканирования, адресованные пользовательскому агенту GoogleOther-Video, не влияют на какой-либо конкретный продукт, аналогично GoogleOther. GoogleOther-Video — это версия GoogleOther, оптимизированная для извлечения общедоступных URL-адресов видео.
  • Google-CloudVertexBot: Настройки сканирования, адресованные пользовательскому агенту Google-CloudVertexBot, влияют на сканирования, запрошенные владельцами сайта для создания агентов Vertex AI. Это не влияет на Google Search или другие продукты.
  • Google-Extended: Google-Extended — это автономный токен продукта, который веб-издатели могут использовать для управления тем, помогают ли их сайты улучшить генеративные API Gemini Apps и Vertex AI, включая будущие поколения моделей, которые поддерживают эти продукты. Google-Extended не влияет на включение или рейтинг сайта в Google Search.
  • API-интерфейсы Google: Настройки сканирования, адресованные пользовательскому агенту API-интерфейсов Google, влияют на доставку push-уведомлений API-интерфейсами Google.
  • AdsBot Mobile Web: Настройки сканирования, адресованные пользовательскому агенту AdsBot-Google-Mobile, влияют на способность Google Ads проверять качество рекламы на веб-страницах.
  • AdsBot: Настройки сканирования, адресованные пользовательскому агенту AdsBot-Google, влияют на способность Google Ads проверять качество рекламы на веб-страницах.
  • AdSense: Настройки сканирования, адресованные пользовательскому агенту Mediapartners-Google, влияют на Google AdSense. Сканер AdSense посещает участвующие сайты, чтобы предоставить им релевантные объявления.
  • Google-Safety: Пользовательский агент Google-Safety обрабатывает сканирование, направленное на выявление злоупотреблений, например, обнаружение вредоносного ПО для публично размещенных ссылок на ресурсах Google. Таким образом, на него не влияют настройки сканирования.
  • Feedfetcher: Feedfetcher используется для сканирования каналов RSS или Atom для Google News и PubSubHubbub.
  • Центр издателей Google: Центр издателей Google извлекает и обрабатывает каналы, которые издатели явно предоставили для использования на целевых страницах Новостей Google.
  • Google Read Aloud: по запросу пользователя Google Read Aloud извлекает и зачитывает веб-страницы с помощью преобразования текста в речь (TTS).
  • Google Site Verifier: Google Site Verifier извлекает токены проверки Search Console.
ЧИТАТЬ   В режиме видео теперь отображаются только страницы, где видео является основным контентом | Центральный блог Google Поиска | Google для разработчиков

Google написал:

Реорганизовали документацию для краулеров Google и пользовательских сборщиков. Мы также добавили явные примечания о том, на какой продукт влияет каждый краулер, и добавили фрагмент robots.txt для каждого краулера, чтобы продемонстрировать, как использовать токены агента пользователя. В остальном никаких значимых изменений в контенте не было.

Google также добавил информацию о кодировках контента (сжатиях), поддерживаемых краулерами Google и загружаемыми пользователем сборщиками. Это просто изменение документации, никаких изменений в поведении. Google также обновил URL в строке агента пользователя GoogleProducer HTTP в документации для загружаемых пользователем сборщиков Google, чтобы он соответствовал значению, используемому фактическим сборщиком.

Обсуждение на форуме Х.

Изображение предоставлено Лиззи Сассман



Source link