Услуги по созданию ссылок


Продолжительность: 7:49

Дублирование страниц (Яндекс и Google) — Словарь SEONik | Урок №352
SEO

&nbsp

В новом аудиоподкасте №352 Николай Шмичков рассказал о дублировании страниц (Яндекс и Google).

Текстовая версия выступления:

«Всем привет!

Вы находитесь на канале SEOquick.

И сегодня в нашем SEO-словаре мы поговорим о теме дублирования страниц.

О Canonical мы уже говорили, но я хочу непосредственно затронуть саму тему дублирования страниц.

Как Google и Яндекс относятся к дублированию?

Конкретной информации о дублировании в Google нет.

Нашел только новости и более четко написанной конкретики не нашел.

Самое интересное, как Google выявляет дубликаты и выбирает канонические страницы.

В последнее время тег Canonical стал просто рекомендацией, а раньше это была директива.

То есть поисковик воспринял это как команду.

Теперь тег Canonical фактически стал рекомендацией.

А как Google выявляет дубликаты и выбирает канонические страницы — в новом подкасте для веб-мастеров Google рассказали, как они это делают.

Поиск дубликатов и канонизация — две разные вещи.

Прежде всего вам необходимо найти дубликаты, сгруппировать их, а затем выявить лидера в этой группе.

Это будет канонизация.

Фактически, для выявления дубликатов Google создает контрольную сумму для каждой страницы.

Это как уникальный отпечаток документа, основанный на словах на каждой странице.

Таким образом, если есть две страницы с одинаковой контрольной суммой, Google считает их дубликатами.

Используя такой подход, Google обнаруживает не только полные дубликаты, но и частичные.

Контрольная сумма — это значение, полученное из блока цифровых данных для обнаружения ошибок, которые могли возникнуть во время передачи или хранения.

Сами контрольные суммы часто используются программистами для проверки целостности данных.

Эту новость я нашел на сайте SEOnews, они перевели ее с источника Гарри Ильши.

А для выбора канонической страницы Google учитывает около 20 сигналов.

Тот же контент, внутренний вес страницы, протокол https, перенаправление.

Все-таки тег Rel Canonical и тому подобное.

Конечно, Google использует машинное обучение, чтобы присвоить вес этим сигналам.

Ну, канонизация не имеет ничего общего с ранжированием.

Выбранная страница будет ранжироваться, но на основе сигналов, отличных от тех, которые учитываются при канонизации.

То есть, если копнуть глубже, то окажется, что Google ищет дубликаты и машинным методом выбирает оптимальную каноническую страницу.

Но иногда случаются ситуации, когда ваши страницы, которые вы создаете, то есть внутренние, могут по каким-то причинам проигрывать главной странице по ключевым запросам.

Джона Мюллера спросили об этом, почему так происходит.

И на самом деле он сказал, что это признак того, что главная страница значительно сильнее остальных страниц сайта.

Это означает, что, возможно, на оптимизированной странице просто отсутствуют какие-то сигналы, то есть внутренние или внешние ссылки.

На это тоже нужно обратить внимание.

С Яндексом все проще.

Здесь все более конкретно.

Страницы считаются дубликатами, если они не доступны по разным адресам, но имеют одинаковое содержание.

Здесь явный акцент сделан на содержании контента.

В этом случае индексирующий робот объединяет их в группу дубликатов.

В результаты поиска будет включена только одна из этих страниц, которую выберет робот.

И очень важное замечание: страницы внутри одного сайта считаются дубликатами.

Например, страницы на региональных поддоменах с одинаковым содержанием не считаются дубликатами.

Поэтому, если вы создаете страницы, адаптированные под конкретный город, через поддомены, Яндекс дружелюбно воспримет это не как дубликаты.

Но нужно обратить внимание на небольшую уникальность контента.

Я не говорю о полном переписывании, но необходима некоторая уникальность контента.

Дублирующиеся страницы появляются по разным причинам.

Например, естественная причина: если страница с описанием товара интернет-магазина присутствует в нескольких категориях сайта.

Ну и дубли тоже могут быть, связанные с особенностями сайта и его CMS.

Чтобы узнать, есть ли на вашем сайте дубликаты, зайдите в раздел для вебмастеров на странице в поиске, выберите там все страницы и скачайте архив.

А в файле дубликат страницы будет иметь статус «дубликат».

И теперь вы можете спокойно работать с этой страницей с «дубликатом», то есть решать, дубликат она или нет.

Дубликат страницы может быть как обычной страницей, так и быстрой версией.

Чтобы оставить нужную страницу в результатах поиска, наведите на нее робота Яндекса.

Это можно сделать несколькими способами.

Например, установите редирект с кодом http 301 с одной страницы-дубликата на другую.

В этом случае в поиске будет участвовать цель установленного редиректа.

И второй момент: укажите предпочитаемый вами канонический адрес страницы, которая будет участвовать в поиске.

В этом случае также добавьте роботу директиву disalow, чтобы закрывать дубликаты.

И соответственно, если у вас там ситуация и урл отсутствует, установите редирект с одной дублирующей страницы на другую.

В этом случае в поиске будет участвовать цель установленного редиректа.

На самом деле, как настроить редиректы подробно – это тема ни одного вебинара. Возможно, вам рекомендуется обсудить с нами, как удалить дубли, на следующем вебинаре, такого рода технический вебинар мы проведем.

Так что не забудьте подписаться на нас.

Робот узнает об изменениях, когда посетит ваш сайт.

После посещения страница, которая не должна попадать в поиск, будет исключена из него в течение 3 недель.

Если на вашем сайте много страниц, этот процесс может занять много времени.

Те. Если вы внесли такие изменения, то для ожидания результата деиндексации нужно сначала дождаться, пока робот просканирует вас снова, а затем всего лишь подождать 3 недели, чтобы они были исключены из индекса.

В частности, для огромных сайтов эта проблема более актуальна для интернет-магазинов; это может занять несколько месяцев.

Поэтому с дублированием контента обязательно нужно бороться на старте, пока вы только дорабатываете свою CMS.

Поэтому пока у вас молодой сайт, чтобы не отправлять кучу дублей в Яндекс, что замедлит индексацию вашего сайта.

И чем больше ненужных дублей вы сдадите, тем медленнее будет сканирование всего сайта в целом.

Поэтому техническую часть лучше сделать до того, как ее выгружать.

Надеюсь, это все, что касается дублированного контента.

Если у вас есть интересные вопросы, задайте их нам.

Буду рад обсудить их на вебинарах, а также в нашей группе в Telegram.

Давайте также вместе продвигать наш аккаунт в Instagram.

Как только будет 1000 подписчиков, я буду проводить прямые эфиры со случайно выбранными владельцами сайтов и анализировать их сайты в прямом эфире, прямо в Инстаграм.

Если вам это интересно, я бы хотел это обсудить.

Поэтому давайте с удовольствием разберемся в этом вместе, вместе обсудим общие темы.

И всем спасибо и до новых встреч».





Source link

ЧИТАТЬ   Новости Google Рекламы. ТОП-5 причин, почему вам необходимо обновить свои кампании | Подкаст 467