Big Data SEO — как заставить большие данные работать на ваш бизнес

Как начать работу с BigData — загружаем данные в Google BigQuery Big Data в сфере маркетинга означает работу
Big Data SEO: кому и зачем
С каждым годом появляется больше грамотных пользователей, которые умеют четко сформулировать свой запрос в поиске, по одному только названию сайта и сниппету определить, можно ли доверять ресурсу. Также чрезвычайно много людей, которые готовы долго искать, продумывать и формулировать длинные запросы, чтобы найти именно то, чего хочется.
Большим проектам (от 300 000 страниц) есть что предложить этим пользователям, но далеко не всегда нужные категории и товары оказываются на первых страницах выдачи даже по тому товару или услуге, которые интересуют покупателя и есть в наличии магазина. И это при том, что SEO-работы на сайте проводят систематически и штатные специалисты регулярно оптимизируют всё на свете.
А сколько всего спрятано в подкатегориях...
В какой-то момент проект перестает быстро расти. Маркетинговые активности, реклама дают какие-то скачки на праздники и другие традиционные сезонные пики, но в целом нет ощущения, что проект развивается. Собственники бизнеса, маркетинг-комaнды начинают переживать, что SEO не работает.
Средний рост проекта в год — +20-30% трафика на сайт. У больших проектов такой показатель снижается, и меньше 10% в год считается вполне себе нормой.
Елена Воскобойник, глава департамента SEO в Netpeak
Можно точечно оптимизировать каждую страницу и категорию: подбирать релевантные ключевые слова, включать их в описание, контент, организовывать с ними перелинковку, наращивать ссылки, строить планы проработки всех разделов сайта и двигаться постепенно, наблюдая результат своей работы. Но такой подход для объемных проектов с сотнями тысяч страниц энерго и трудозатратен, а результат растянут во времени.
Можно добиться значительного прироста трафика, увеличить число продаж с помощью масштабирования классического SEO. Та же работа с поисковыми запросами, только большая, очень большая работа — выгрузка нескольких миллионов запросов по тематике и нише, их сортировка и массовая оптимизация страниц на основании готовых шаблонов.
Как сделать правильную перелинковку в интернет-магазине Как подобрать низкочастотные запросы и для чего это нужно Big data SEO — альтернативный способ решения проблемы. За основу мы берем один из важнейших параметров внутренней оптимизации —
Почему перелинковка?
Существует множество способов улучшить ранжирование страниц в выдаче и непрокаченные проекты могут использовать их по полной. Но когда уже все или почти всё сделано, нужно искать новые точки роста. Подход Netpeak строится на работе с семантикой, которая всегда бесконечна
Наши продукты заточены под такие задачи — инструменты и сервисы, которые помогают извлечь огромные объемы данных, упорядочить их, очистить от шлака и структурировать для постановки технических заданий на SEO-специалистов, разработчиков и аналитиков в штате заказчика. Речь о Serpstat, Netpeak Spider, Netpeak Checker.
Напомним, в чем суть перелинковки:
- Передача веса между страницами. Если на страницу ссылается много других страниц внутри сайта, это указывает поисковикам: страница действительно весома. Так, главная всегда самая «тяжелая», потому что на неё ссылаются все остальные страницы сайта. Та же история со страницами категорий в интернет-магазине. Они сквозные: на каждой странице есть ссылка на категорию. Из-за этого роботы считают страницы категорий весомыми.
Таким образом формируется иерархия важности страниц сайта в глазах робота. Перелинковкой мы придаем так называемый статический вес страницам, который важен с точки зрения продвижения. Мы размещаем ссылки перелинковки на страницы, которые потенциально может искать пользователь — услуг, товаров и так далее.
- Передача анкорного веса (задаем тематику странице). Ссылка всегда привязана к анкорному тексту. Анкорный текст это, по сути, запрос, например «стиральная машина». Увеличивая анкорный вес, мы передаем поисковым роботам понимание, о чем она.
Анкорный текст может быть разный «стиральная машина», «стиральная машина купить», «стиральная машина киев». Чем лучше робот понимает, о чем страница, тем она релевантнее.
- Удобство для пользователя. Человеку предлагают товары, страницы, которые могут его заинтересовать. Это и про навигацию и про помощь в выборе — предложение максимально близкое к тому, что ищет человек.
Почему перелинковка важна для больших проектов? Структура таких сайтов настолько широкая, что пользователи и боты могут не доходить до страниц с большой вложенностью.
Выносить тысячи ссылок на эти страницы в меню для придания им веса— идея тоже не очень. Приходится искать другие варианты и делать перелинковку внутри сайта.
Почему низкочастотные запросы?
Продвижение сайта VIN-кодов в США по низкочастотным запросам: рост трафика на 681% за 6 месяцев Зачем для продвижения использовать
Например, заходим на сайт магазина одежды. Здесь нет категории «сиреневое платье в клеточку», но на сайте оно может быть. Но на главной только основные категории, необходимые для выбора. А ведь запросов по платьям десятки тысяч: фасоны, цвета, модели, имя селебрити, которая надевала похожее на красную дорожку.
У пользователя есть определенный образ, по нему формируется запрос и он ожидает увидеть соответствующее его ожиданиям предложение. Задача оптимизатора — предоставить страницу релевантную запросу.
Как создавать, продвигать и продавать сайты под Amazon На продвижении с помощью низкочастотных запросов строится стратегия успешных
Этапы Big Data Seo
Вне зависимости от объема, тематики сайта, работа над проектом разбивается на шесть этапов (итераций):
Под каждый проект подбираем источники данных, метод и принцип, алгоритм, по которому мы будем их обpaбатывать. На старте готовим техническое задание, в котором детально описываем этапы и промежуточные шаги каждой итерации.
Работаем с семантикой (пулом поисковых запросов)
Выгрузка всей семантики ниши, начиная с нашего сайта и сайтов конкурентов (прямых и косвенных) в каждой категории.
Откуда берем данные:
- Google Search Console;
- Serpstat;
- Google Ads;
- Google ***ytics и другие.
Эти данные собираются как для текущего сайта, так и с сайтов конкурентов. То есть мы получаем всю семантику ниши. Затем информация автоматически очищается от мусора.
Следующий шаг — расширение списка запросов с помощью скрипта генерации семантики. Для каждого ранее выгруженного запроса автоматически подбираются похожие фразы, подсказки. Объем снова увеличивается и мы проводим повторную чистку.
При повторной чистке фильтруются, например, запросы в нерелевантной для языка системе письменности (для кириллицы — латиница и наоборот, иероглифы). Также определяем нерелевантную длину запроса. Количество слов в фразе выбирается исходя из объема данных и личной оценки фраз Data Scientist.
Какие инструменты использует отдел Data Science — собственные скрипты на языке R и Python, Serpstat, Netpeak Spider. Только с помощью этих сервисов можно собрать, выгрузить сотни тысяч или миллионы запросов, отсеять нерелевантные.
Собираем топ по всем запросам
По каждому поисковому запросу, собранному на предыдущем этапе, выгружаем топ-100 выдачи для того, чтобы определить тип страницы, который чаще всего встречается среди конкурентов. Результат — миллионы строк данных.
В дальнейшем эта информация понадобится нам для автоматического сопоставления страниц сайта и поисковых запросов.
Формируем скоринговую модель
Цель — из всего собранного пула отобрать запросы, которые нам выгодно использовать для перелинковки. Делаем это с помощью скоринговой модели.
Скоринг — это «оценка». Скоринговая модель — алгоритм оценки.
В нашем случае он заключается в определении эффективных запросов, которые потенциально могут принести трафик с наименьшими затратами.
С помощью нейронной сети формируем скоринговую модель. Модель помогает оценить каждый поисковый запрос с точки зрения конкурентности, релевантности, потенциала трафика. Каждому запросу присваивается балл. Балл показывает эффективность ключевого запроса.
После оценки отбираем пул запросов, которые принесут максимальную выгоду.
«На пальцах»: если нет рекламы в выдаче — фразе добавляем два балла, если есть слово «купить» — добавляем ещё три бала, присутствует слово «бесплатно» — минус шесть баллов. Если конкуренция по запросу почти отсутствует — плюс пять баллов. В итоге берем только те ключевики, которые собрали достаточное количество баллов.
Денис Стадник, SEO Tech Lead в Netpeak
Скоринг нужен, чтобы определить запросы, которые точно подойдут данному конкретному сайту.
На этом этапе используем собственный скрипт для определения показателя качества фразы. Скоринговая модель, а следовательно и скрипт корректируется под каждую конкретную тематику, учитывая ее особенности.
Проводим автоматическую кластеризацию подходящих запросов
Цель — сопоставить страницы сайта и ключевые запросы ниши, которые мы получили на основании двух предыдущих итераций.
Для кластеризации (группировки) поисковых запросов используем алгоритмы Machine learning, в основе которых лежат метод иерархической и k-means кластеризации и данные поисковой выдачи (топа).
На выходе получаем связку URL сайта+кластер (группу) поисковых запросов. Оцениваем, каким запросам нужно больше входящих ссылок, каким меньше.Создаем связки для перелинковки
Цель: определить доноров — страницы сайта, с которых будем расставлять ссылки и связать их уже с созданными на предыдущем этапе связками «URL+кластер».
Проводим оценку «веса» и «тематичности» каждой страницы сайта для максимального эффекта.
Мы принимаем решение, какие именно страницы-доноры будут ссылаться на страницы-реципиенты. Важно, чтобы на страницу с ноутбуками ссылалась страница с телефонами, а не подгузниками (параметр «тематичность»). Дальше смотрим — если по этому запросу большая конкуренция, значит донору нужны ссылки с 20 страниц сайта. По другому такой конкуренции нет — достаточно и одной ссылки.
Денис Стадник, SEO Tech Lead в Netpeak
В результате получаем базы данных со списком анкоров, доноров и реципиентов. Пример:
На этом этапе мы используем, в частности, собственные скрипты для кластеризации и привязки кластеров к текущей структуре сайта, Serpstat.
Формируем шаблоны title, h1, description
Как оптимизировать контент: title, h1, description, keywords На финальной стадии работ наши специалисты генерируют новое
Далее мы сопровождаем внедрение перелинковки, шаблонов новых описаний и отслеживаем результат, консультируем специалистов заказчиков на протяжении всего процесса оптимизации.
Как правило, такая работа показывает результаты в сжатые сроки — и не только за счет опытных специалистов в штате комaнд крупных проектов. Дело в том, что большие сайты (с историей и регулярными работами по SEO) для поисковых систем — трастовые ресурсы и это помогает ускорить продвижение оптимизированных страниц.
Хочу быстро найти клиентов онлайнЗапомнить
Существует огромное количество данных о пользователях, их предпочтениях, поведении на сайтах, о том, как и что ищут люди (в поисковых запросах). Все эти данные — и есть Big Data.
11 этапов SEO-продвижения сайта Использование Big Data для поискового продвижения называется Big Data SEO. Подход Netpeak заключается в том, чтобы масштабировать
Упор делаем на перелинковку и низкочастотные запросы.
Перелинковка помогает передавать вес между страницами, анкорный вес, улучшает навигацию по сайту. В итоге, поисковикам станет понятнее ресурс, отдельные его страницы, вырастет их вес, а значит ценность по мнению роботов. Такой сайт будет удобен для пользователя — а здесь и лояльность, и низкий показатель отказов.
Использование низкочастотных запросов помогает увеличить конверсию, а ещё такие запросы, как правило, низкоконкурентные. Но нельзя так просто взять и массово найти, выгрузить, очистить от мусора нч запросы для больших проектов.
Этапы Big Data SEO:
- Сбор семантики, чтобы по максимуму расширить пул поисковых запросов. Мы делаем выгрузку всей семантики ниши: нашего сайта и сайтов конкурентов (прямых и косвенных) в каждой категории.
- По каждому поисковому запросу, собранному на предыдущем этапе, выгружаем топ-100 выдачи для того, чтобы определить тип страницы, который чаще всего встречается среди конкурентов. Результат — миллионы строк данных.
- Формирование скоринговой модели: здесь находим запросы, которые выгодно использовать для перелинковки.
- Кластеризация подходящих запросов — сопоставляем страницы сайта и ключевые запросы ниши.
- Создание связки для перелинковки (определяем релевантных доноров).
- Формирование шаблонов title, h1, description — делаем описания для страниц, участвующих в перелинковке.
Комментарии:
Директ Коммaндер от Яндекса позволяет легко работать с большими кампаниями...
08 06 2026 13:23:43
Интерфейс прикладного программирования для работы с аккаунтами десятка сайтов....
07 06 2026 4:58:43
Грамотная аналитика в мире мобильных приложений, как и в целом в маркетинге — единственный путь к окупаемости продукта и выходу в высшую лигу брендов...
06 06 2026 2:40:53
При создании проекта и выбора доменного имени важно взвесить плюсы и минусы использования домена с историей...
05 06 2026 21:41:12
Много 404-страниц и ссылок на них негативно сказывается на ранжировании сайта в поисковых системах....
04 06 2026 4:25:23
Реклама будет не настолько персонализирована, как сейчас....
03 06 2026 0:42:13
Узнайте зарплату интернет-маркетологов с новым рейтингом от Serpstat....
02 06 2026 22:41:49
Узнайте, как пользоваться Инспектором и внутренними диаграммами Facebook, чтобы быть в лидерах своей ниши!...
01 06 2026 11:39:37
Гайд по типам рекламы в соцсетях для SMM-, PPC-специалистов, блогеров и владельцев бизнеса в зависимости от целей, которые вы ставите перед продвижением. С конкретными рекомендациями и примерами. Узнать больше!...
31 05 2026 0:12:37
Алексей Селезнев проанализировал 29 млн кликов, и в этой статье вы прочитаете, как дорого обходятся рекламодателям клики в Google Ads....
30 05 2026 17:23:32
Если ваш сайт не приносит желаемых продаж, задумайтесь о смене формата. Этот кейс о том, как с качественным лендингом можно достигнуть желаемой цены за конверсию....
29 05 2026 5:16:28
Красивый слог и сюжет должны быть в интеpaктивной оболочке, соответствующей времени. Проект Gutenbergz идет к созданию именно такой — идеальной истории для людей XXI века. О пути к этой цели, топе App Store и успехе на Kickstarter мы поговорили с руководи...
28 05 2026 13:26:41
Нужно разбить ячейку или составить график? Если вы знаете функции, таблицы гугл могут пpaктически заменить отдельные сервисы или дополнения...
27 05 2026 4:55:53
Метод настройки с помощью Google Tag Manager. Мануал с подробным описанием каждого шага — показываем на примере, как отслеживать веб-конверсии в рекламных кампаниях LinkedIn. Узнать больше!...
26 05 2026 10:21:55
Мы попросили спикеров ответить на острые для многих онлайн-проектов вопросы о развитии мобайла как канала, программатике и строительстве инхаус комaнд...
25 05 2026 11:44:18
Используем возможности Google Cloud Platform в работе с R...
24 05 2026 15:19:12
Ошибка, которая может привести к полной потере контроля над вашим сайтом. Рассказываем, что это такое, какие могут быть причины поломки и как исправить. Узнать больше!...
23 05 2026 2:27:41
Открываем интернет-магазин за один день. Комплекс UniTheme от AlexBranding и Netpeak включает CMS CS-Cart, современный шаблон и 11 SEO-модулей...
22 05 2026 14:51:26
Данные, приведенные в исследовании, могут помочь в составлении медиапланов по продвижению в интернете. Читать дальше....
21 05 2026 6:47:46
Совет Константина Леоновича (Sape.ru), 4 наших + 2 бонусных...
20 05 2026 22:54:34
Работа велась с конца августа прошлого года до конца декабря и включила в себя анализ рынка, конкурентов, целевой аудитории, поиск инсайта, разработку стратегии, подготовку медиаплана, создание промо-сайта и само проведение рекламной кампании, в котором б...
19 05 2026 6:32:21
Как вернуть на сайт как можно больше пользователей...
18 05 2026 3:54:43
О создании структуры сайта на основе семантического ядра, работе с Xmind и таблицами онлайн...
17 05 2026 14:22:35
Экс-CEO, а теперь просто сотрудник и «волшебник страны Moz» Рэнд Фишкин поделился с читателями блога рассказом о своем видении будущего SEO, перспективах анонимизации сети и причудах американских клиентов....
16 05 2026 20:19:10
Краткая инструкция по поиску идеального кандидата, потому что (как видим) многим на рынке все еще сложно найти хорошего маркетолога. Да и понять, стоит ли вкладывать в сотрудника силы, время, средства с первой встречи достаточно сложно....
15 05 2026 19:16:21
Пост о том, как и когда тратит деньги американский и украинский покупатель...
14 05 2026 14:47:22
Обзор полезных сервисов и программ, которые увеличат эффективность работы из дома и улучшат организацию бизнес-комaнды...
13 05 2026 22:26:12
Ярослав Легенчук поделился историей успешного «переезда» площадки IT-продукта из Рунета в страны ЕС...
12 05 2026 12:22:32
Определение и настройка главного зеркала сайта в поисковых системах — первое, что нужно сделать перед раскруткой сайта...
11 05 2026 9:38:20
Анализируя поведение аудитории, вы сможете понять, почему клиенты приходят на сайт, почему уходят, и почему не делают заказы....
10 05 2026 23:10:58
Как за один час собрать самые популярные темы для информационных статей с помощью Serpstat и Key Collector?...
09 05 2026 7:17:34
Alexa Rank учитывает как число страниц, так и количество просмотров страниц. Alexa Rank 1, что означает, что все сайты и сервисы Google посещают больше всего посетителей в интернете....
08 05 2026 15:14:14
Мы собрали и проанализировали ответы 270 владельцев и маркетологов...
07 05 2026 2:56:50
Как настроить программу Obsidian для удобной и быстрой работы по системе Zettelkasten....
06 05 2026 11:58:14
Продвижение монобренда: особенности, трудности, подводные камни. Ниша здоровья и красоты....
05 05 2026 14:30:42
Брендовые или витальные запросы содержат только название компании или бренда, без дополнительных уточнений...
04 05 2026 15:57:13
За 10 месяцев сотрудничества увеличили небрендовый на 99%, а общий трафик — в два раза. Рассказываем не только о результатах, но и подходе создания реалистичного прогноза SEO-продвижения сайта. Читать дальше!...
03 05 2026 12:32:16
160 символов — размер рекламного сообщения, 2 млн евро — минимальный бюджет для запуска. Уже интересно?...
02 05 2026 15:56:32
General Data Protection Regulation (GDPR): ответы на вопросы....
01 05 2026 5:21:28
Кейс детской костюмерной Colombina.ua — как продвигать проект с ярко выраженной сезонностью....
30 04 2026 0:39:26
Под какие треки работают интернет-маркетологи, копирайтеры и другие специалисты digital-рынка....
29 04 2026 6:48:27
Такое обозрение очередной новинки Google от Сергея Бахаря...
28 04 2026 11:56:20
Ссылки называются вечными, потому что их внедряют один раз и навсегда, но это не значит, что такие ссылки однажды не удалят (что поведет к потере трафика). Узнать больше!...
27 04 2026 21:18:31
Суперспособности фрилансера: как понять свою прокрастинацию, распознать мошенников и решать проблемы, связанные с удалёнкой...
26 04 2026 14:29:11
25 04 2026 3:16:17
Учим правильно платить за верхние строчки показов объявления: настройка быстрых звонков из поисковых объявлений «Только номер телефона» Google Ads...
24 04 2026 9:29:27
Рассказываем о перспективном формате рекламы, который привлекает внимание потребителя даже в эпоху повсеместной «баннерной слепоты»....
23 04 2026 13:46:10
Перевод статьи Никки Джиллиленд из Econsultancy об уроках для маркетологов про то, каким должно быть хорошее видео. Узнайте 4 правила эффективного видеоконтента прямо сейчас!...
22 04 2026 16:52:39
Крауд-маркетинг предполагает взаимодействие с целевой аудиторией с помощью рекомендательных комментариев на форумах, сайтах вопросов и ответов, в блогах, на других площадках...
21 04 2026 17:20:55
История для заказчиков, которые самостоятельно запускают рекламу...
20 04 2026 0:16:48
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::