Коммерческое ранжирование Яндекса (перевод)

< >

У нас есть технологический SEO-отдел, который не только инициирует разработку сервисов (Serpstat (ex. Продвигатор), Netpeak Spider, Netpeak Checker и пр.), но и разбирается в алгоритмах и проводит различные эксперименты. Переводы некоторых интересных и важных документов уже есть в сети, но когда мы их проверяли, то периодически находили серьезные фактические ошибки, поэтому всегда работаем с первоисточниками и вот как сейчас делимся своей версией перевода исследования про коммерческое ранжирование Яндекса с читателями блога.

Для чего придумано? Для того, чтобы ранжировать те документы, которые уже высокорелевантны для этих запросов. На что обратили внимание:

на доверие пользователей;
юзабилити;
качество дизайна;
качество сервиса.

Для ранжирования используется сумма коммерческой и тематической релевантности. Уходя с головой в SEO, многие вебмастера забывают о пользовательских факторах. А удовлетворенность пользователя на коммерческих сайтах может варьироваться очень сильно. В частности, значительное влияние на поведение пользователей оказывают: дизайн, механизм онлайн обратной связи, отзывы пользователей о товарах. Формальные критерии, которые хаpaктеризуют удобство для пользователя, дизайн и уровень доверия, должны быть созданы на базе аспектов качества сайта, которые важны для пользователя. Такими критериями могут быть: длина текста, грамотно написанный контент, читабельность тайтлов, наличие карт, информация о компании, легкие для запоминания телефонные номера, бесплатная доставка и т.д. Есть работы, которые описывают подходы для сбора дополнительных данных о качестве сайтов. Например: агрегация оценок из нескольких источников, таких как мнения пользователей и данные о кликах или текстовая релевантность и время публикации. В своем документе мы предлагаем новый подход, который включает в себя создание новых аспектов релевантности и внедрение некоторых фич, которые позволяют оценивать релевантность по предложенным нами метрикам.

Шкала оценки коммерческой релевантности

В отличие от тех, кто предлагает оценивать данные о кликах и учитывать мнения пользователей, мы предпочитаем использовать оценки асессоров, т.к. такая методика вносит меньше шума в данные, чем сравнение данных о кликах с данными из тулбара. Если использовать только два последних типа данных, то очень сложно определить, остался ли пользователь удовлетворенным результатом поиска. Поведение пользователя, который задал коммерческий запрос, может очень сильно изменяться в зависимости от категории продукта, его стоимости и т.д. (сравните доставку пиццы и покупку линзы для фотоаппарата). В то же время, эти источники могут дать полезные данные, поэтому, мы дали к ним доступ асессорам. Мы выбрали четыре показателя качества, которые, мы уверены, дают всю необходимую информацию. Это означает, что сайт качество которого определено с помощью измерений данных показателей, включает в себя множество различных фич. Список метрик качества сайта включает в себя:

надежность (trustability) ;
юзабилити;
качество дизайна;
качество обслуживания.

Мы разработали детальные инструкции для асессоров. Согласно этим инструкциям, оценка состоит из двух этапов. На первом этапе асессор должен определить, является ли этот документ тематически релевантным для этого запроса. Мы используем шкалу с пятью оценками релевантности: нерелевантный, релевантный, высокорелевантный, полезный и витальный. Оценка же качества сайта — более сложное, время- и трудозатратное занятие, чем оценка тематической релевантности (а особенно — получение информации из данных о кликах). В нашем случае ситуация частично становится легче за счет того, что нужно оценивать только релевантные сайты. Мы не рассматриваем документы, оцененные как витальные или полезные, так как, зачастую, они оказываются единственным нужным пользователю результатом поиска. Как уже говорилось ранее, мы рассматриваем только пpaктически одинаковые по релевантности результаты. На первой стадии оценки, определяется количество и разнообразие сервисов и продуктов, предлагаемых документом по данному коммерческому запросу. Мы определяем три оценки разнообразия ассортимента: мало, стандартно, много. Оценка разнообразия ассортимента для запроса q и документа d определяется V(q,d). На второй стадии оценки для всего сайта определяются надежность, юзабилити, качество дизайна и обслуживания. У надежности и качества обслуживания есть 4 возможных оценки: спам, стандартно, хорошо и отлично. Сайт получит отметку «спам», если он не позволяет сделать покупку или заказать указанную услугу (фейковый сайт). Сайты с пометкой «стандартно» не плохи сами по себе, но не отличаются ничем особенным от тысяч других похожих коммерческих сайтов. Хорошие сайты предоставляют пользователям стандартный набор услуг, а отлично получают известные лидеры рынка. Надежность и качество обслуживания для сайта обозначаются T(s) и S(s) соответственно. Обратите внимание, что эти показатели не зависят от пары запрос q и документ d. У юзабилити и качества дизайна есть только три оценки: плохо, хорошо, отлично. Эти показатели обозначаются как U(s) и D(s). Все значения для указанных выше показателей варьируются от 0 до 1. Для использования в будущем информации о качестве в течение обучения ранжированию (машинное обучение - прим. переводчика), мы привели четырехмерную оценку к одному показателю коммерческой релевантности: где R^c(q,d,s) — это показатель коммерческой релевантности для запроса q, документа d сайта s. Вес надежности и уровня обслуживания в два раза выше, чем у других показателей. Это сделано по причине того, что мы считаем эти свойства более важными с точки зрения удовлетворенности пользователя, но не рассматриваем такой выбор коэффициентов как единственно возможный).

Обучение ранжированию с новыми показателями

Оценка коммерческой релевантности — это очень сложная задача и, при прочих равных, количество меток коммерческой релевантности будет значительно меньше, чем меток для тематической релевантности. Мы не можем не принимать во внимание оценки для тематической релевантности, у которых нет соответствующих оценок коммерческой релевантности. Это может привести к уменьшению выборки, ухудшению процесса обучения и, как следствие, ухудшению работы функции ранжирования. Таким образом, перед началом обучения процессу ранжирования, мы должны экстраполировать метки коммерческой релевантности на всю обучающую выборку. ПроцеДypa экстраполяции состоит из двух шагов. Во-первых, мы обучаем функцию ранжирования на небольшой выборке, которая содержит только метки коммерческой релевантности. Результирующая функция ранжирования дает нам ожидаемое значение коммерческой релевантности R^c(q,d,s), которое обозначается R^с_est(q,d,s): После этого мы применяем функцию ранжирования из первого шага ко всей выборке с метками тематической релевантности. Это возможно, т.к. мы используем одни и те же методы ранжирования для обеих выборок. Т.к. только высокорелевантные документы получат оценки коммерческой релевантности, то эти ожидаемые оценки вычисляются только для пар запрос-документ, у которых очень высокий показатель тематической релевантности. Все остальные пары запрос-документ в обучающей выборке получат нулевое значение коммерческой релевантности. Получив значения для показателей коммерческой релевантности для всех тематически релевантных результатов запросов коммерческой направленности в нашей выборке, мы вычисляем единую оценку релевантности: где R^f(q,d) — это значение тематической релевантности, R^u(q,d,s) — это единая оценка релевантности и альфа — это весовой коэффициент. Используя единую оценку, мы обучаем функцию ранжирования на всей выборке. Весовой коэффициент альфа выбран эмпирически так, чтобы он максимизировал влияние коммерческой релевантности, но не влиял на метрики тематической релевантности. В итоге мы получаем функцию ранжирования, которая предсказывает единую оценку релевантности, которая, в свою очередь, включает тематическую релевантность и коммерческую.

Особенности измерения качества сайта

Для более точного предсказания новых меток релевантности, которые включают тематическую и коммерческую релевантность, мы предлагаем определенные способы, специфические для коммерческих сайтов. Они новы в том смысле, что пpaктически непригодны для ранжирования в терминах тематической релевантности, т.к. метки тематической релевантности не несут никакой информации о релевантности коммерческой. Но для аппроксимации коммерческой релевантности эти способы очень важны, т.к. они дают понимание о качестве страницы. Из некоторых разработок в этой области мы выбрали некоторые многообещающие способы и дополнили их своими разработками. Таблица 1 представляет список некоторых способов, использованных в нашем исследованием. Обратите внимание, что большинство этих методов — доменного уровня, которые агрегируют информацию из всех документов коммерческого сайта. Это согласуется с фактом того, что, согласно формуле (1), коммерческая релевантность зависит от качества сайта в целом. Сравнение обучения ранжированию с и без описанных методов качества дано в разделе результатов. Таблица 1.Параметры, для измерения качества сайта

Детальная контактная информация.
Страницы компании в социальных сетях.
Отсутствие рекламы.
Количество различных товаров.
Детальность описания товаров.
Наличие службы доставки.
Наличие техподдержки (почта, телефон, форма обратной связи).
Система онлайн консультаций.
Скидки.
Читабельность имени домена.
Средняя длина URL.
Средняя длина Title\\\'ов.
Соответствие заголовка страницы её содержимому.
Средняя вложенность URL.

Новые метрики для метода оценки

Для оценки своих результатов мы разработали две NDCG-подобные метрики основанные на человеческом мнении о коммерческих сайтах. Первая метрика представляет собой взвешенное качество результатов поиска для данного множества коммерческих запросов. Его значение для запроса q определяется как: где R^c(q, di,si) — это коммерческая релевантность для i-го результата поисковой выдачи для запроса q. Общее значение этой метрики для данного набора запросов — это просто среднее значение Goodness(q) среди всех запросов из множества. Чем выше это значение, тем лучше результат поиска. Наша вторая офлайн метрика показывает соотношение низкокачественных результатов поиска для коммерческих запросов. Аналогично первой метрике, она вычисляется для заданного множества запросов как среднее для запросо-зависимых значений по всему множеству. Выражение для запросозависимых значений выглядит так: где th — это порог минимальной коммерческой релевантности для результатов поиска. Чем меньше это значение, тем лучше результаты работы поисковой системы. Также, мы используем A\B-тестирование и чередуем онлайн эксперименты, чтобы оценивать свои результаты.

Результаты и обсуждения

Мы предложили новый способ измерения качества документов для коммерческих запросов — коммерческую релевантность. Мы разработали несколько свойств ранжирования для оценки качества сайта. Мы предложили метод экстраполяции дополнительных меток релевантности для всей обучающей выборки, что позволяет нам не терять в процессе обучения никакую информацию о тематической релевантности. Мы разработали оффлайн DCG-подобные метрики, наблюдали их изменения на протяжении экспериментов и внедряли информацию о качестве в функцию ранжирования. Рис. 1 показывает изменение метрики Goodness за некоторое время до и после модификации функции ранжирования. Горизонтальная ось — это ось времени, а вертикальная ось показывается относительное значение нашей метрики. Можно увидеть, что значение метрики увеличилось примерно на 30% по сравнению с предыдущим значением. Рис. 2 показывает изменение нашей второй метрики — Badness. Как и в предыдущем графике, горизонтальная ось — это ось времени, а вертикальная показывает относительное изменение значения метрики. Из графика видно, что Badness-метрика уменьшилась примерно на 70%. В то же самое время, значение классической NDCG метрики, вычисляемой только с учетом тематической релевантности, на протяжении всего эксперимента пpaктически не менялось. Мы сравнили наши результаты с обучением без учета новых коммерческих свойств. Улучшение Goodness и Badness метрик было примерно на 20% меньше, чем с учетом новых свойств. Наш онлайн эксперимент показал, что пользователи выбирают новые результаты ранжирования на 1% чаще, чем результаты стандартного ранжирования. При A\B-тестировании, наши результаты, учитывающие качество, показали уменьшение показателя отказов на 5% и увеличение соотношения кликов к показам на 1.5%. В следующей работе в процессе обучения будет использоваться набор меток релевантности вместо единственной суммарной оценки. Другой подход к дальнейшему улучшению коммерческих результатов поиска заключается в разработке новых коммерческих ранжирующих сигналов.

Комментарии:

Наука быть счастливым: бесплатный онлайн-курс от профессора из Йеля

Профессор психологии Йельского университета разработала курс по обретению счастья. Его прошли уже 3,5 млн человек...

23 07 2026 21:52:48

12 функций таблиц Google для работы с семантикой

+ таблица с примерами использования каждой функции....

22 07 2026 4:52:35

Лучшие расширения-переводчики в Google Chrome

Многие расширения Google Chrome предназначены для изучения иностранных языков, позволяют сохранять историю переводов и отдельные слова в словарь для дальнейшего запоминания....

21 07 2026 17:18:46

Как определить ключевую метрику LTV перед запуском Apple Search Ads

Расчет прогноза по LTV позволит более точно задать параметры рекламной кампании в Apple Search Ads на начальном этапе. Как это делают в RadASO, читайте в статье....

20 07 2026 12:37:28

Как создать рассылку push-уведомлений. Чек-лист эффективной рассылки от Notix

В статье рассказываем, какие бывают push-уведомления, когда их используют, даем чек-лист и пошаговую инструкцию по созданию успешной push-рассылки....

19 07 2026 0:44:19

Диагностика фидов — как быстро обнаружить и исправить ошибки программистов

Распространенные ошибки в XML-фидах Google и Яндекс, CSV-фидах и как исправить их своими силами. Используем Notepad++, отладчик ленты Facebook и Excel. Узнать больше!...

18 07 2026 16:35:24

Нестандартное мышление в бизнесе. Украинские предприниматели, которые умеют удивлять

Украинцы хотят заниматься коммерцией. И иногда делают это очень нестандартно. Собрали для вас подборку бизнесменов с особенным мышлением....

17 07 2026 14:50:21

Что дают Google AMP: опыт поисковика недвижимости Flatfy

О том, какие результаты дает эта технология, рассказал Александр Иванов, Head of Product в ЛУН.ua в рамках прошлогодней самой летней конференции 8P. Читайте, как его комaнде удалось разогнать загрузку страниц сервиса Flatfy до 0,2 секунды...

16 07 2026 20:40:13

7 частых и неочевидных ошибок интернет-магазинов

Расскажем про ошибки интернет-магазинов, которые трудно найти соответствующими программами и сервисами проверки...

15 07 2026 12:11:53

Сниппеты в выдаче Google –– что изменилось? Исследование Serpstat

Данные из контента страницы и основного заголовка h1 вместо метатега title. Что показало исследование Serpstat....

14 07 2026 6:48:27

Как выбрать редактора для корпоративного сайта

Нужен ли вашему проекту редактор? Как правильно его выбрать и оценить на собеседовании, а затем и в процессе работы?...

13 07 2026 23:12:21

Чем http отличается от https

Чем отличается протокол HTTPS от HTTP — криптошифрованием, обеспечивающим безопасность ресурса...

12 07 2026 9:23:59

Чем наш PPC-отдел круче остальных?

Мария Гoлyб устала отвечать на вопрос «Какие преимущества PPC-отдела в Netpeak?» и решила написать об этом пост....

11 07 2026 8:32:48

Как готовить баннеры для мобильной рекламы

Как сделать креативный мобильный баннер. Зачем нужны особенные баннеры для мобильных? Что делать с картинкой? Что делать с текстом? Что делать с другими рекламными форматами? Дополнительные элементы. Обо всем этом детально и спримерами...

10 07 2026 12:39:25

Как запустить локальную кампанию Google Ads — пошаговая инструкция

Есть офлайн-точка продаж и нужно привлечь сюда больше клиентов. Что делать? Настраиваем локальные кампании. Показываем и рассказываем, как это делать....

09 07 2026 19:57:31

Как привлечь дополнительный трафик с помощью SNDS-кампаний — кейсы Netpeak

Как получить больше конверсионного трафика из поиска и не выйти за рамки KPI? Запустите SNDS-кампании...

08 07 2026 17:22:51

Как добавить статью о проекте на Википедию: Slando for Wiki

О том, как добавить статью в Википедию и о правилах, которые нужно выполнить, чтобы ее не удалили: от добавления Интервики до ссылок на другие статьи, специальных терминов, добавления страниц в категории и выбора источников. Узнать больше!...

07 07 2026 16:19:35

Как Octopus Events и Netpeak организовали офлайн-конференцию летом 2020-го — кейс

Как мы проводили самую летнюю конференцию в условиях постлокдayна, пандемии и неизвестности....

06 07 2026 10:32:35

50 ступеней продвижения мобильного приложения — подробный чек-лист

Как создать онлайн кампанию по продвижению мобильного приложения с максимальной отдачей....

05 07 2026 9:21:31

Алгоритмы Инстаграм 2021 — как работает ранжирование в ленте, сториз, Explore, Reels

Как посты и ролики Reels становятся первыми в ленте, сториз, попадают в рекомендации. Instagram впервые напрямую рассказали о том, как оценивают контент....

04 07 2026 10:37:31

Интернет-торговля в Украине: 15 слайдов о ecommerce

Тема поста — исследование электронной коммерции в Украине: рынки, статистика, объем продаж, поисковый потенциал....

03 07 2026 11:45:51

Как продвигаться в Instagram, если у вас B2B-бизнес

Распространенные ошибки продвижения B2B-компаний + стратегии того, как наращивать число активных подписчиков и потенциальных клиентов....

02 07 2026 17:17:35

Как долго живет лид в базе email-рассылки?

Это исследование для тех, кто хочет выяснить, эффективно ли работать с лидами, если им год и больше...

01 07 2026 15:58:47

Как получить код ответа cервера для страниц сайтов прямо в доксе

Делимся полезным скриптом — он проверяет код ответа сервера для списка страниц, до 1000 за сутки....

30 06 2026 10:41:55

Исследование — сколько стоил клик в Google Ads в Казахстане во втором квартале 2021 года

Информация поможет вам в составлении медиапланов. Зная стоимость клика в вашей тематике или регионе, и коэффициент конверсии на вашем сайте, можно оценить объем необходимых инвестиций в рекламу и прогнозировать стоимость конверсии. Узнать больше!...

29 06 2026 23:40:37

Как быстро увеличить продажи — мнения руководителей отделов продаж

Как повысить результаты продаж в режиме цейтнота. Советы новому руководителю от специалистов Netpeak Group. Больше подробностей — в посте...

28 06 2026 8:38:38

Какие фишки я беру у конкурентов — дневник оптимизатора

Заимствуете лучшее, коллекционируйте идеи и не откладывайте тестирование фишек в долгий ящик...

27 06 2026 13:29:59

Аналитика покупок американцев и украинцев перед праздниками

Пост о том, как и когда тратит деньги американский и украинский покупатель...

26 06 2026 14:58:45

Вебмастера заработают более $2 млн на Всемирном дне шопинга в 2021

С каждым годом китайские маркетплейсы увеличивают свое влияние, и покупатели всё активней заказывают товары из Поднебесной. Но не всё скидки да покупки — обладатели интернет-аудитории и маркетологи могут еще и хорошо заработать на этих площадках....

25 06 2026 23:50:37

Блогеры vs таргетинг: плюсы и минусы

Какой рекламный инструмент использовать, чтобы получить максимальный результат...

24 06 2026 8:59:14

15 странных, но иногда полезных приложений

Если на вашем смартфоне установлен только стандартный набор Uber, Glovo, 2ГИС и нескольких мессенджеров — смотрите подборку необычных и смешных приложений....

23 06 2026 1:44:10

15+ Telegram-каналов о бизнесе, обучении, маркетинге, веб-аналитике, SEO, путешествиях

Полезный и развлекательный контент для всех, кто работает в IT, интернет-маркетинге, интересуется фишками тайм-менеджмента, учится управлять комaндой и собой....

22 06 2026 14:23:47

Азы типографики — нескучно о шрифтах

Нужно подобрать красивый шрифт? Готический или народный? Стандартный или фирменный? Как выбрать — рассказывает профессионал...

21 06 2026 9:42:58

Интеграция Google BigQuery c BI-платформами и электронными таблицами

Подробная инструкция по интеграции с облачной базой данных и сравнение BI-платформ....

20 06 2026 7:59:29

Продвинутые способы аналитики кампаний на Facebook — Инспектор и внутренние диаграммы

Узнайте, как пользоваться Инспектором и внутренними диаграммами Facebook, чтобы быть в лидерах своей ниши!...

19 06 2026 17:15:28

Instagram: что нужно внедрить в 2020 году

Список рекомендаций для SMM-специалистов. Статья будет полезна SMM-менеджерам, проектным менеджерам, а также владельцам бизнеса, которые предпочитают самостоятельно ставить комaнде задачи и отслеживать выполнение целей....

18 06 2026 1:30:18

Теневой бан Instagram — как распознать и преодолеть

Что такое теневой бан, что о нем известно, как выйти из-под него. Плюс мнение SMM-эксперта Нели Серебро...

17 06 2026 13:39:11

Анализ эффективности кампаний рекламной сети Яндекса с помощью отчета по многокaнaльным последовательностям

Отчет «Многокaнaльные последовательности» в Google ***ytics помогает оценить влияние каждого канала, сделать выводы о работе рекламных кампаний — понять их вклад и участие в цепочке до совершения конверсии. Показываем на примере....

16 06 2026 7:30:41

Как работать с задачами — советы от Netpeak

Правильная постановка целей, задач и дедлайна — основа успешной работы...

15 06 2026 5:35:25

Netpeak + RadASO = Netpeak RadASO. Мы выходим на рынок комплексного продвижения мобильных приложений

Агентство Netpeak закрыло сделку по покупке агентства мобильного маркетинга Радомира Новковича RadASO....

14 06 2026 13:26:43

Продвижение мобильных приложений: анализируем данные в Search Console

Отслеживаем эффективность приложения в Search Console на примере OLX.KZ...

13 06 2026 2:10:14

Контекстная реклама интернет-магазина автотоваров — как снизить траты и увеличить ROMI на 772%

Изучаем на примере тестирования товарных кампаний в момент смены логотипа и ренейминга...

12 06 2026 15:34:25

MEGOGO, Google, Фокстрот и AIR Brands — как бренды создают эффективный видеоконтент

Бренды поделились инсайтами на ДиВи Конф — фишки от MEGOGO, Google, TikTok, Banda, McCann, I am IDEA, AIR Brands, Rocket и Фокстрот...

11 06 2026 5:43:47

Как настроить триггерные письма в GetResponse

Делаем первые шаги к созданию системы email-коммуникаций бренда....

10 06 2026 20:22:51

IOS 14: Что это значит для рекламодателей Facebook

Реклама будет не настолько персонализирована, как сейчас....

09 06 2026 11:24:29

Сколько стоил клик в Google Ads и Facebook в Украине во втором квартале 2019 года

Данные по 24 миллионам кликов в 24 тематиках и 391 городу...

08 06 2026 14:14:46

Как быстрее создавать рекламные кампании для Google Ads и Директ с помощью API Serpstat

Как автоматически формировать и выгружать готовые рекламные кампании для Яндекс.Директ и Google Ads со структурой «одна группа объявлений — один key»...

07 06 2026 19:24:47

Сплит-тест — скоростное шоссе к высокой конверсии

5 кейсов отлично иллюстрируют правила юзабилити и находки веб-аналитиков....

06 06 2026 22:53:51

Сторителлинг как маркетинговый приём

Сторителлинг — это способ рассказывать истории, его цель — дать возможность читателю или зрителю почувствовать себя героем этой истории,...

05 06 2026 12:50:56

Что такое Progressive Web Apps и какие возможности они открывают для вашего бизнеса

Определение сайта нового типа. Захочет ли бизнес интернета перевести свои веб-приложения на более прогрессивные рельсы?...

04 06 2026 11:31:31

Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::