Как исключить спам в Google ***ytics, или Кто портит ваши данные

Что делать, если вы столкнулись со спамом в отчетах Google ***ytics? Значит ли это, что кто-то имеет доступ к вашему аккаунту, или что кто-то специально влияет на данные сайта в GA? Как они это делают? И как исключить подобные данные из отчетов?
Когда в источниках реферального трафика появляются нетематические ресурсы, или когда вы открываете «Поведение → События → Обзор», и видите событие, которое точно не настраивали самостоятельно, самое время разобраться, в чем же тут дело. Спам в событиях от event-tracking.com
Зачем спамить в Google ***ytics?
Google ***ytics — самый популярный инструмент веб-аналитики, его используют миллионы пользователей. Спамеры рассчитывают на переходы любопытных владельцев сайтов, а что уже делать с этими переходами — монетизировать через баннеры, перенаправлять в магазин или использовать любым другим способом — каждый решает сам. Даже если принять процент любопытства за 10%, в соотношении с миллионами пользователей Google ***ytics это получится значительная цифра.
Как они это делают? Метод спама Google ***ytics #1: Ghost spam
Ghost spam (спам-призpaк) называется призpaком, потому что отправляет данные в GA без взаимодействия с сайтом напрямую.
Как же данные попадают в Google ***ytics? GA использует протокол для передачи данных — Measurement Protocol, который позволяет разработчикам отправлять данные напрямую на сервера Google ***ytics. Measurement Protocol сам по себе — хорошая вещь, он позволяет использовать возможности Google ***ytics для сбора данных пpaктически из любой среды. Таким образом, становится возможным использовать инструменты аналитики GA, к примеру, в сети магазинов розничной торговли. Данные по продажам или любым другим взаимодействиям с покупателями магазинов будут собраны в Google ***ytics подобно данным с веб-сайтов. Однако, тот же Measurement Protocol можно использовать и для передачи спама.
Для доступа к аккаунту GA достаточно знать ID аккаунта. Спамерам ничего не нужно узнавать — ID можно генерировать автоматически в больших количествах. Остальное они вводят сами — рефералов, страницы, имена хостов, ключевые слова и так далее. Автоматизированный скрипт отправляет ложные данные в разные аккаунты GA.
Так как непосредственного взаимодействия с сайтом нет, то нельзя отсечь спамные данные на уровне сервера, используя .htaccess. Данные можно исключить из отчетов только с помощью фильтров Google ***ytics.
Пример Ghost spam: спам в событиях GA от www.event-tracking.com
Вы, конечно же, знаете, какие именно события настроены на сайте, и что хотите отслеживать. Поэтому идентифицировать спам в событиях очень просто. Если в событиях вы обнаружили чужое сообщение, к примеру, «to use this feature visit: www.event-tracking.com» — это спам. Чтобы отсеять ложные данные по несуществующему событию, нужно настроить отдельный фильтр — подробные инструкции, как это сделать, смотрите в конце поста.
Метод спама Google ***ytics #2: Crawler Referrer Spam
Есть роботы, которые совершают обход сайтов с целью привлечь трафик на определенный портал. Данные, которые такие роботы оставляют в Google ***ytics, не несут никакой полезной информации, а сфабрикованные показатели искажают статистику. Такие роботы игнорируют директивы robots.txt, поэтому блокировать их там нет смысла. Хорошая новость в том, что здесь есть обращение к сайту. Это значит, что можно заблокировать робота-спамера не только в настройках Google ***ytics, но и в .htaccess на уровне сервера.
Как определить реферальный спам в отчетах?
Зайдите в свой аккаунт Google ***ytics, вкладка «Отчеты», «Источники трафика → Весь трафик → Рефералы». К отчету добавьте дополнительный параметр «Поведение → “Имя хоста”» и отсортируйте по имени хоста. Увидите много интересного :) Поиск реферального спама в отчетах Если рефералов много, для удобства работы лучше выгрузить все данные в таблицу, и там отобрать те источники, которые необходимо исключить. Экспорт данных из Google ***ytics
Какие параметры нужно проанализировать для идентификации спамера?
- Источник — неестественный или нетематический адрес сайта говорит сам за себя.
- Новые сеансы и Показатель отказов — в первую очередь обратите внимание на значения 0% или 100%.
- Имя хоста — набор символов или «not set».
- Дублирование значений в дополнительных параметрах. В нашем случае — данные для «Имя хоста» и «Название экрана» для сайтов erot.co, sanjosestartups.com, непереводимая.рф и так далее частично или полностью совпадают.
Сравнение данных имени хоста и названия экрана для одинаковых источников.
5. Списки спамеров Google ***ytics в сети. Если мишенями спамеров становится большое количество людей, то и списки спам-роботов будут совпадать. Понимая это, Вы можете отсеять часть спама заранее. Настройте фильтр по чужому списку спамеров — пример такого списка находится здесь. Или сделайте общий список спамеров для нескольких SEO-проектов и примените к каждому сайту по отдельности.
Как исключить реферальный спам: фильтры Google ***ytics
Как мы уже писали выше, оба вида спама — Ghost spam и Crawler Referrer Spam — можно исключить из отчетов внутренними инструментами GA, настроив соответствующие фильтры.
Важно! Не применяйте фильтры к основному представлению Google ***ytics, иначе часть данных для вашего сайта не будет собрана. Для фильтрации данных используйте имеющееся дополнительное представление или создайте его (подробнее).
Фильтр по источнику кампании
Любые метрики Google ***ytics — количество переходов, длительность сессий, события и все остальное — имеют источник. Чтобы исключить их из отчета, внесите URL определенного сайта как источника кампании в фильтр представления с настройкой «Исключить». В дальнейшем все данные из этого источника не будут добавлены к отчету. Как настроить фильтр:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление, к которому будет применен фильтр. Основное представление не нужно трогать :)
4. В меню сразу под выбранным представлением выберите «Фильтры». 5. Кликните «Фильтры» → «Новый фильтр». 6. Заполните поля, как показано на скринах ниже. Настройка антиспам фильтра по источнику кампании. 7. Сохраните фильтр. Такой фильтр исключит все данные, которые приходят из указанного источника, в том числе и спам в разделе «События».
Фильтр по имени хоста или по любому другому параметру
Как настроить фильтр: пункты 1-5 те же — перейдите на вкладку «Администратор», выберите представление и откройте вкладку создания нового фильтра. Далее так же заполняем фильтр, только вместо «Источник кампании» выбираем «Имя хоста».
Аналогичным образом можно отфильтровать спамные данные и по другим параметрам. Главное, определить параметр, который однозначно определит нежелательный источник.
Важно! Обязательно проверяйте фильтр перед применением. К примеру, вы можете указать адрес сайта, имя хоста которого нужно исключить. Предположим, что для сайта в качестве имени хоста указан домен вашего ресурса. Но этот домен автоматически указывается в имени хоста и для всех естественных рефералов. Таким образом, если вы примените «не глядя» этот фильтр, данные из естественных источников также будут исключены.
Исключение обращений роботов
Исключить Crawler Referrer Spam можно в настройках представления. Последовательность та же:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление.
- Войдите в «Настройки представления».
Как настроить представление Google ***ytics 5. Отметьте пункт «Исключение обращений роботов и пауков». Исключение обращений роботов из данных представления Google ***ytics Теперь Google ***ytics на основании собственного алгоритма будет определять обращения роботов и отсеивать их.
А нужно ли заморачиваться?
Мы решили поинтересоваться у Middle SEO специалиста агентства Netpeak Алексея Данилина о том, как он фильтрует данные по своим проектам. По мнению Алексея, все зависит от ситуации. Прежде чем тратить время на отслеживание спамеров и настройку фильтров, стоит оценить, нужно ли это конкретному проекту. Если спам составляет незначительную часть всей аналитики, или если вам важно отследить отдельную тенденцию среди пользователей (например, распределение мобильных и десктоп посещений) — можно отфильтровать данные, просмотрев это соотношение только для посетителей из органического поиска, или для всех посещений, кроме реферального трафика.
Чтобы избежать пyтaницы в событиях, можно заранее отнести каждое настроенное событие к отдельной группе, при этом все возможные внешние события будут оставаться в общем списке и никак не попадут в какую-то из групп. Когда вы создаете отдельное представление, безусловно стоит отсеять из статистики обращения роботов и пауков. Настраивать ли дополнительно фильтры от спама — нужно смотреть для каждого проекта индивидуально.
Краткие выводы
Хорошие новости: полную картину по своему сайту видите только вы, никто не имеет доступа в ваш Google ***ytics. Плохие новости: отослать ложные данные в ваш GA можно пpaктически всегда. Определить ID — тоже. Хорошие новости: как правило, ID именно Вашего аккаунта никому не нужен. Чаще всего ложные данные попадают в GA после генерации случайных чисел и с целью рекламы другого ресурса. Больше хороших новостей: спам можно исключить из отчетов с помощью фильтров и настроек. Или, если он не мешает жить, можно просто не обращать на него внимания. Остались вопросы? Будем рады ответить на них в комментариях.
Комментарии:
Первая реакция на перегорание — послать все к чертям собачьим. Очень заманчиво, но правильно ли убегать от всех проблем?...
01 04 2026 7:48:32
Сравним разные модели атрибуции с точки зрения оценки финансовых показателей проекта...
31 03 2026 15:53:41
Грамотный контент важен для всех, но особенно — для аутсорсов и стартапов в B2B. Если вы согласны с этим, давайте делать медиа....
30 03 2026 9:45:35
+ таблица с примерами использования каждой функции....
29 03 2026 13:49:44
Техника безопасности по безукоризненным рекламным кампаниям...
28 03 2026 7:56:59
Пришло такое время — обновить данные, тем более что в начале сентября появилось исследование Google....
27 03 2026 14:36:31
Хотите узнать, сколько стоит клик в вашей тематике? Как эффективно распределить рекламный бюджет? В этом исследовании я изучил, сколько стоил клик в Google Ads и Яндекс.Директ в Казахстане...
26 03 2026 4:21:54
В Twitter удобно собрать список потенциальных клиентов, чтобы время от времени посматривать за их новостями...
25 03 2026 10:28:10
Словарь, которым пользуются SEO-специалисты агентства Netpeak...
24 03 2026 3:50:25
Объясняем по пунктам, как создать и правильно настроить DSA c таргетингом на фид и содержание сайта...
23 03 2026 17:33:48
Чтобы сделать что-то лучше, иногда надо довести это до абсурда. Так думают приверженцы теории «странных изделий» — chindogu...
22 03 2026 2:26:54
Почему важно знать детали создания и защиты уникального контента? Потому что это позволит защитить ваш сайт от санкций поисковых систем из-за неуникального контента...
21 03 2026 6:28:31
Лихие девяностые и самые ужасные сайты интернета: образцы, примеры, оформление....
20 03 2026 18:23:37
Отличный кейс Ольги Костовой. Увеличивая бюджет на рекламу вдвое, вы начинаете заpaбатывать не вдвое больше, а в 2.5, 3 и так далее раз больше. На примере кейса показываем, как это происходит. Читать дальше....
19 03 2026 6:35:16
Первая часть иллюстрированного руководства, в котором мы взяли 20 самых важных фактора ранжирования представлены с краткими иллюстрированными примерами. В этом тексте вы найдете первые 10. Узнать больше!...
18 03 2026 0:27:23
Как формируется цена на услугу онлайн-рекламы в специализированном агентстве, и на какие бюджеты предпринимателям стоит ориентироваться...
17 03 2026 8:40:44
О феномене Баадера-Майнхофа — как на самом деле работают системы баннерной рекламы в интернете...
16 03 2026 13:46:41
Как Netpeak продвигал Cifrus.ru, один из ведущих магазинов цифровой техники в Москве....
15 03 2026 5:14:30
Доля органического трафика увеличилась с 14% до 44%, а небрендового — на 184%....
14 03 2026 10:12:16
Поговорим о soft skills, потому что именно они, исходя из моего опыта, помогают строить поистине сильные комaнды....
13 03 2026 19:43:16
Эффективность рекламы в поиске падает, но растут YouTube, контекстно-медийная сеть и другие платформы...
12 03 2026 5:34:26
Возможно, вы купили обувь Intertop именно после просмотра нашей рекламы....
11 03 2026 7:22:22
Лучшие маркетинговые и бизнес-фишки от Давида Брауна (Weblium), Владислава Флакса (OWOX), Александра Галкина (Competera), Люси Литерадо (Reply.io), Вадима Нехая (Depositphotos), Валерия Грабко (PromoRepublic), Игоря Дебатура (Uploadcare), Руслана Савчишин...
10 03 2026 6:37:16
Безопасность Instagram — что делать, если заметили попытку взломщиков украсть аккаунт, и как вернуть аккаунт после взлома....
09 03 2026 20:36:26
Первое подробное руководство по работе с оконными функциями в Google BigQuery....
08 03 2026 13:39:42
Миллионы решили купить книгу гении и аутсайдеры на Amazon: удивительное исследование канадского журналиста...
07 03 2026 13:13:30
[SEO 2.0] — это продукт для бизнеса от Netpeak, он включает в себя принципиально новый подход к продвижению сайтов....
06 03 2026 20:39:36
Корзина интернет-магазина поможет повысить продажи, если ее функционал содержит: фото товара, кликабельное наименование товара, перечень способов оплаты. Узнать больше!...
05 03 2026 2:35:49
Информация для бизнесменов, интернет-маркетологов и всех, кто интересуется продвижением бизнеса в интернете....
04 03 2026 1:31:53
Расширяем возможности визуализации данных из Google ***ytics c помощью пакета RGA и Power BI...
03 03 2026 10:44:18
Не существует универсальных решений - есть эффективные инструменты и удачные их сочетания....
02 03 2026 21:59:42
Создатель scrum model Джефф Сазерленд написал книгу о том, как использовать методику разработки программного обеспечения для развития бизнеса....
01 03 2026 12:39:52
Кейс — поисковое продвижение блога в нише юридических услуг. Как увеличить количество читателей из поисковых систем и трафик на страницы услуг....
28 02 2026 3:44:48
Tencent — китайская компания, мировой лидер в сфере игр. Все о создании компании, доходах, прибыли, инвестициях. Особенности ведения бизнеса в Китае — в пересказе статьи Паки Маккормик. Читать дальше!...
27 02 2026 20:15:34
«Случайный» посетитель потому, что может уйти (не сделав покупку) и не вернуться, не стать клиентом. Пуш-уведомления позволяют посетителю сразу стать подписчиком: ему предлагают подписаться на рассылку. Как это использовать? Читайте!...
26 02 2026 4:16:24
Как создать онлайн кампанию по продвижению мобильного приложения с максимальной отдачей....
25 02 2026 10:15:14
Каждому бизнесу в интернете важно продумать систему оплаты для своих товаров или услуг. При этом следует учитывать объемы и нишу бизнеса. Узнать больше!...
24 02 2026 3:18:16
Создатели алгоритмов соцсетей используют слабые места человеческого мозга. Случайно или намеренно, но они это делают. Как нам с этим жить?...
23 02 2026 8:54:43
Кейс продвижения YouTube-канала магазина товаров для рыбалки...
22 02 2026 22:39:27
Как мы проводили самую летнюю конференцию в условиях постлокдayна, пандемии и неизвестности....
21 02 2026 4:35:13
От идеи для стартапа до плана развития и масштабирования бизнеса. Познавательные, полезные каналы, которые помогут реализовать смелые бизнес-цели. Узнать больше!...
20 02 2026 3:13:13
Сооснователь и главред Forbes Ukraine о вовлечении читателей в смысловое поле бизнеса...
19 02 2026 15:31:37
Автор книги о вирусном маркетинге «Заразительный. Психология сарафанного радио» Йона Бергер пришел к выводу, что у виральности всего шесть принципов....
18 02 2026 7:42:25
Кейсы, фишки и советы, опыт крупных брендов, маркетологов....
17 02 2026 4:25:15
Как GTM помогает настроить расширенную электронную торговлю (enhanced ecommerce)....
16 02 2026 12:25:26
Обзор ресурса по подбору ключевых запросов www.SEMRUSH.com на Netpeak.ua...
15 02 2026 16:11:31
Проверенные лайфхаки по платному трафику от спикеров и участников конференции 8P 2018...
14 02 2026 23:17:35
Как внедрить Business Intelligence для малого и среднего бизнеса....
13 02 2026 17:38:26
Это исследование для тех, кто хочет выяснить, эффективно ли работать с лидами, если им год и больше...
12 02 2026 16:28:12
Чтобы эффективно продвигать товар или услугу в Instagram, необходимо повысить охват целевой аудитории. Одно из возможных решений — привлечение блогеров. Казалось бы, достаточно предложить платное размещение рекламы…...
11 02 2026 1:44:59
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::