В связи с тем, что у нас есть еще больше документов из суда, у нас есть еще больше документов, в которых упоминается больше об индексе поиска Google, Spam Spare, Pagerank, качеством страницы, клей и еще большим количеством.
Это все в дополнение ко всем документам Министерства юстиции, которые мы рассмотрели ранее, и эту большую утечку поиска, на которую Google в конечном итоге ответил. Вчера мы также рассмотрели бит Google Fastsearch на заземлении для Близнецов и пользовательских взаимодействий и данных с сегодняшнего дня.
Большинство из них были замечены Мари Хейнс, но я выкопал, может быть, немного глубже, чтобы вытащить больше ссылок, которые я нашел.
Следует отметить, что только потому, что эти судебные документы имеют эти заявления, это не означает, что они используются в поиске Google сегодня, и эти заявления также были даны небуглерами:
Содержание
Индекс поиска Google
Что хранится в индексе поиска Google? Идентификатор документа, карта URL, марки времени, результаты спама и т. Д.
Супер интересная информация здесь о том, что хранится в индексе поиска Google.
— У каждого документа есть документ
— Есть карта DocID для URL -адреса
— Каждый DOCID имеет набор сигналов, атрибутов или метаданных, некоторые из которых получены из пользовательских данныхК ним относятся:
— Популярность, измеренная пользователем … pic.twitter.com/mlabmdu8r3— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Качество страниц спама против страницы
Google определяет, что сканировать не только на оценке спама, но и сигналах качества и популярности:
Не ползут? Это может быть связано с вашей оценкой спама.
Сигналы качества и популярности помогают Google определить, как часто для ползания веб -страниц. pic.twitter.com/fn8wfgbvdk
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
PageRank против веб -страницы
PageRank — это ключевой сигнал качества, который является одним из компонентов оценки качества, но «большая часть качественного сигнала Google получена из самой веб -страницы».
Теперь это интересно!
PageRank — это ключевой сигнал качества, который является одним из компонентов оценки качества.
Тем не менее, оказывается, что «большая часть качественного сигнала Google получена из самой веб -страницы». pic.twitter.com/3w6cbnix8c
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Клей
Клей регистрирует запрос и пользовательские данные, чтобы помочь с сигналами и ранжированием:
Клей — это журнал запросов, который собирает данные о запросе и взаимодействии пользователя с ответом.
Данные включают:
— Текст запроса, языка, местоположения пользователя и типа устройства
— Что появляется на SERP
— Что пользователь нажимал на парившись, и как долго он оставался… pic.twitter.com/mns1ptc4vq— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Ранжированный бер
У Google есть Rankembed Bert, которая является моделью ранжирования обучения, которая использует 70 -дневные журналы поиска плюс оценки, генерируемые оценщиками качества человека:
Ооо, следующий — Ранкембл, теперь называемый Ранкимбед Берт.
Это модель глубокого обучения, которая использует 70 дней журналов поиска плюс оценки, генерируемые оценщиками качества человека.
Он имеет сильное понимание естественного языка, которое позволяет ему более эффективно определять лучшие документы … pic.twitter.com/oxjkkctryr
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Что еще вы нашли в Суд постановления PDF?
Обсуждение на форуме в ХПолем