Google запантентовал поведенческие факторы. Что нужно знать?

Google получил новый патент на поведенческие факторы ранжирования.
Что запатентовал Google? Какие сигналы ранжирования описаны в патенте? Что следует сделать?
Разберемся с содержанием патента далее.

Google запатентовал поведенческие факторы

Что произошло? 12 марта 2019 года Google получил патент под названием Modifying search result ranking based on implicit user feedback.
Из названия ясно, что в патенте речь идет про технологию, которая используется для
изменения ранжирования результатов поиска на основе неявной обратной связи с пользователем.

Ссылка на патент — Modifying search result ranking based on implicit user feedback.

Исходя из закона об авторском праве, патенты должны находиться в открытом доступе. Так у поисковых оптимизаторов появляется шанс разобраться в тонкостях ранжирования, которые поисковая система может использовать на практике.
В патенте описывается процесс сбора и анализа поведенческих факторов. Наиболее интересным элементом является так называемый
Rank Modifier Engine, то есть система корректировки ранжирования.

Что такое Rank Modifier Engine?

Итак, исходя и описанной в патенте технологии существует две системы ранжирования сайтов:

  • Корневая система ранжирования страниц сайтов;
  • Система корректировки ранжирования (Rank Modifier Engine).

Система корректировки ранжирования работает отдельно и автономно от основной системы ранжирования.

Процесс выглядит следующим образом:


Основная система ранжирования получает так называемую меру релевантности страницы из системы корректировки ранжирования. В результате позиции в поисковой выдаче изменяются.

Но какую информацию обрабатывает система корректировки ранжирования и как именно? Разберемся далее.

Как работает система корректировки ранжирования?

В патенте описываются сигналы, которые поисковая система может использовать при ранжировании сайтов. Разберемся с главными нюансами.

В патенте речь идет про следующие сигналы ранжирования:

  • Кликовые поведенческие факторы. Речь про факторы, связанные с поведением пользователя на странице поисковой выдачи. В патенте описывается анализ кликстрима, расчет CTR документа по запросу и прочее;
  • Фактор длины клика. Согласно патенту, анализируется время, проведенное пользователем на выбранной странице сайта (a time the user spent on the document). В среде поисковых оптимизаторов метрика именуется как dwell time. Под временем, потраченным пользователем на странице сайта, подразумевается время, прошедшее от клика на ссылку в органических результатах до возвращения к поисковой выдаче и выбора нового документа.
  • Язык и страна пользователя. Использование данного фактора указывает на дифференцирование результатов выдачи в зависимости от языка и предполагаемой страны. К примеру, результаты выдачи для запросов на русском языке и на украинском языке могут отличаться по причине использования разного языка в интерфейсе. Значит, от правильной настройки мультиязычности на сайте зависят позиции в поисковой выдаче. Если перелинковка настроена не верно, то по запросам с одинаковым интентом могут быть потеряны позиции. Если на сайте используется множество языков и перелинковка настроена правильно, то по схожим запросам будет выводиться один и тот же сайт, но ссылки будут разными.

Кликовые факторы ранжирования в патенте расписаны подробно. Срезы по длине клика следующие:

  • Запрос-документ;
  • Запрос-документ-язык;
  • Запрос-документ-язык-страна.

По длине клики разбиваются на такие группы:

  • Короткие;
  • Средние;
  • Длинные;
  • Последний клик.

Итак, определено понятие последнего клика.

Последним кликом называется клик, после которого пользователь не возвращается на страницу с результатами выдачи.

Что можно считать коротким, что средним и что длинным кликом? Значение для каждой из групп зависит от запроса. Итак, для каждого запроса есть свои значения, и конкретные цифры определяются исходя из поведения пользователей на практике.

Как результат, исходя из данных о длине клике поисковым алгоритмом оценивается то, насколько хорошо страница отвечает на поисковый запрос.

В патенте приводится следующий пример:

  • Короткий клик может считаться плохим показателем для страницы. Страница плохо отвечает на поисковый запрос. Пример значения — 0,1;
  • Средний клик характеризует страницу как потенциально полезную. Пример значения — 0,5;
  • Длинный клик характеризует страницу как хорошую. Пример значения — 1,0;
  • Последний клик характеризует страницу как вероятно хорошую. Пример значения — 0,9.

При анализе кликов меньший вес назначается кликам тех пользователей, которые чаще остальных выбирают высоко ранжируемые страницы. Иными словами, если пользователь постоянно выбирает результаты из топ-3, то значимость клика снижается.

Помимо оценки поведения на выдаче, пользователей также разделяют на обычных и опытных. Как результат, при учете кликов определенного пользователя используется весовой коэффициент. Значение зависит от индивидуального поведения в интернете.

Пользователь может быть классифицирован на основе запросов, которые отправляют в поисковую систему. В частности, предполагается, что пользователь является опытным в нише, если вводит множество запросов по определенной нише.

Какой вывод можно сделать? Значит, использование мотивированного трафика из специальных сервисов заведомо ниже по эффективности, нежели привлечение целевой аудитории в выдачу из социальных сетей или оптимизация сниппетов и прочее.

Какие еще нюансы по анализу выдачи известны из патента? На основе полученных данных поисковой системе требуется получить информацию о том, какие страницы лучше отвечают на запрос, и какие хуже. Но если использовать данные напрямую, то ввиду естественного распределения страницы из топ-3 будут получать больше переходов из поисковой выдачи, и, как следствие, выдача не будет изменяться.

Как тогда решить вопрос определения релевантных страниц, исходя из полученных данных? Решение заключается в следующем. При расчете значения релевантности используются составные показатели.

Примеры составных показателей:

  • Отношение числа длинных кликов к коротким;
  • Отношение числа длинных кликов ко всем кликам для конкретного документа по конкретному запросу (доля длинных кликов).

В качестве защиты от шума к подобным отношениям может быть добавлен параметр сглаживания.

Параметр сглаживания обладает следующим свойством — если общее количество кликов невелико, то результат будет стремиться к нулю.

Сигнал не будет учитываться, да и все. Я выдвигал гипотезу о таком подходе поисковой системы в комментариях к статье про поведенческие факторы. Ссылка на статью — Фактор ранжирования Dwell Time — что это и как его оптимизировать для роста позиций в выдаче?Теперь гипотеза подтверждена патентом.

Как результат, благодаря составным показателям, страницы получающие относительно небольшое количество кликов, но длинных в итоге могут получить больший вес меры релевантности, нежели страницы, находящиеся в топ-3 и получающие относительно большое количество кликов, но коротких.

Итак, на меру релевантности влияет соотношение:

количество длинных кликов/общее количество кликов*100

Параметры сглаживания могут варьироваться в зависимости от языка или страны.

Как происходит влияние на ранжирование? Исходя из патента, вычисленные значения меры релевантности (в явном или преобразованном виде) предлагается применять в качестве повышающего коэффициента к значениям релевантности, вычисленным алгоритмом ранжирования.

Значит, поведенческие факторы влияют на результаты ранжирования страниц в органической выдаче поисковой системы.

Схема из содержания патента:


Вопросы и ответы

Используются ли поведенческие факторы в Yandex?

Да. Поведенческие факторы используются в Yandex. Есть подтверждения.

В поисковой системе поведенческие факторы именуются как пользовательские факторы ранжирования документов.


Признает ли Google использование поведенческих факторов?

Официальных заявлений об использовании поведенческих факторов ранжирования в поисковой системы Google нет.

Представители Google отрицали использование таких факторов. Заявления исходили не от инженеров из Google Search Team, а от службы поддержки. В заявлении было сказано, что поведенческие и социальные факторы с точки зрения разработчиков алгоритма ранжирования Google являются очень плохими и слишком шумными сигналами и поэтому не учитываются в алгоритме.

С высокой вероятностью данная информация не является достоверной и была вброшена намеренно с целью ввода поисковых оптимизаторов в заблуждение.

Другой представитель Google дезавуировал заявление:

Я не думаю, что он говорил о факторах напрямую.

Еще заявление от Google:

Если люди переходят на ваш сайт и заполняют формы или подписываются на услуги или рассылку, это значит, что вы действуете в верном направлении. Я бы рассматривал это как позитивный момент в целом, но это не значит, что Google учитывает эти действия в ранжировании и использует эту информацию для автоматического продвижения сайта.

Доступ к информации об использовании факторов ранжирования является ограниченным. Использование поведенческих факторов как сигнала ранжирования подтверждает:

  • Официальные документы, такие как патенты;
  • Практика.

На практике улучшение поведенческих факторов посредством улучшения сниппетов и дизайна влияет на ранжирование страницы сайта в поисковой выдаче.

Специальные сервисы по оптимизации поведенческих факторов также могут оказывать влияние на ранжирование сайтов. Для продвижения на подобных сервисах используется мотивированный трафик. Ссылка на такой сервис по оптимизации поведенческих факторов — SERP Click.

Выводы

Поведенческие факторы ранжирования в Google действительно используются при ранжировании сайтов. Об этом свидетельствуют соответствующие патенты и практика. Но если нет желания вникать в детали патента, то и не стоит.

Итак, получено еще одно подтверждение, что задача удержания пользователей на сайте является одной из основных задач в поисковой оптимизации.

Что делать? Просто используйте следующие рекомендации:

  • Увеличьте количество переходов на сайт из поисковой выдачи за счет создания эффективных сниппетов. Например, проведите анализ сниппетов тематических сайтов, продвигаемых в регионах с высокой конкуренцией;
  • Используйте специальную разметку для создания расширенных сниппетов в поисковой выдаче, чтобы привлечь трафик;
  • Задерживайте пользователя на странице разными способами. Оптимизируйте Dwell Time, например используя формат страницы single-page content вместо пагинации.