Как провести контент-аудит сайта — пошаговое руководство

Как понять, что проект нуждается в новых текстах, а того, что написала дeвoчка с биржи за два косаря, недостаточно для счастья читателя и выхода сайта на первые позиции? Проведите контент-аудит. Прочитав этот текст до конца, вы узнаете как.
- Как найти все страницы без текстов
- Как проверить, есть ли анализируемые страницы в индексе поисковой системы
- Как проанализировать спрос
- Как провести анализ входящего трафика на страницы фильтров
- Как найти страницы с текстами, которые нуждаются в доработке
- Как проверить тексты на сайте
- Как доработать старые тексты
- Выводы
Как найти все страницы без текстов
Речь о всех страницах, включая разделы, категории, подкатегории, страницы фильтров. Если сайт небольшой, страницы без текстов можно найти вручную. В других случаях лучше использовать Netpeak Spider.
Для начала выделим потенциально важные типы страниц — разделы/категории/подкатегории.
Например:
- раздел — https://www.newegg.com/Electronics/Store;
- категория — https://www.newegg.com/Cell-Phones/Category/ID-450?Tid=161569;
- подкатегория — https://www.newegg.com/Tablets/SubCategory/ID-2557?Tid=171661.
Инструменты для парсинга в работе SEO-специалиста С помощью XPath (XML Path Language — язык запросов к элементам XML-документа) спарсим все аналогичные типы страниц. Читайте подробно,
Находясь на главной странице, кликаем правой кнопкой мыши по первому разделу и нажимаем «Просмотреть код»:
Находим блок со всеми URL-адресами разделов, категорий, подкатегорий:
Копируем путь к этому блоку:
Чтобы спарсить только ссылки, к результату нужно добавить //@href, то есть в итоге получается:
//*[@id=\"main-nav-menu-list\"]//@hrefЭто и есть наш XPath, его нужно сохранить. Для проверки корректности результата можно использовать браузерное расширение XPath Helper в Chrome.
Теперь можно скопировать список всех URL:
И почистить список от дублей и лишних страниц. Например, нужно удалить URL других сайтов:
Теперь необходимо найти XPath для текстов на всех страницах, так как он может быть разным для отдельных типов страниц.
В зависимости от типа страницы, путь может меняться, поэтому нужно проверить все страницы.
Для этого открываем Netpeak Spider и выбираем способ сканирования «По списку URL»:
Добавляем XPath в настройки:
Добавляем список наших URL и запускаем сканирование:
В самом крайнем столбике (справа) будет выводиться статус присутствия текста на странице:
После того как все страницы будут просканированы, можем выгрузить все страницы без текстов, выполнив сортировку. Страницы без текстов отмечены нулем:
Также можно воспользоваться фильтром:
Важно: все анализируемые страницы должны возвращать код ответа 200.
Допустим, в списке встретились URL-адреса с редиректами:
В таком случае укажите конечные URL и пересканируйте страницы заново:
Как проверить, есть ли анализируемые страницы в индексе
Необходимо убедиться, что анализируемые страницы есть в индексе поисковых систем. Если поисковик уже добавил страницу в индекс, то с большей вероятностью будет ее ранжировать в результатах поиска.
Отмечу, что описанный в данном разделе метод подходит для страниц фильтров и других посадочных под средне- и низкочастотные запросы.
Откроем Netpeak Checker и добавим туда список наших адресов:
Выбираем: «Google SERP» — «Индексация»:
Берем в работу страницы со статусом «True», со статусом «False» — отбрасываем:
Со страницами, которых нет в индексе, мы также будем работать. Просто на данном этапе это не в приоритете, к ним можно вернуться позже.
Важно учитывать индивидуальные особенности каждого сайта. То есть причин плохой индексации может быть множество. Например, неуместное использование метатега , HTTP заголовок X-Robots-Tag: noindex, неверно указанные директивы в файле robots.txt, низкое качество контента на странице, высокий уровень вложенности и так далее.
Как проанализировать спрос
Метод не очень точный, но для быстрого анализа подойдет.
Открываем Netpeak Checker, выбираем параметры: «On-Page» — «значение h1» и выгружаем все заголовки h1 наших страниц:
Включаем сканирование и копируем все заголовки h1:
Пробиваем частотность с помощью Планировщика ключевых слов Google. Чтобы ключи были более коммерческими, добавим в начало фразы «buy».
Важно анализировать частотность на вкладке «Планирование бюджета и получение прогнозов». При этом необходимо указывать ключевые слова в точном соответствии, добавив квадратные скобки для ключевых фраз:
Экспортируем данные и удаляем фразы без частотностей. Оставляем только нужные столбцы, как на картинке:
После этого сопоставляем заголовки с соответствующими URL-адресами — можно использовать функцию vlookup в таблицах Google.
То есть берем выгруженный список URL-адресов и заголовков h1:
Удаляем «buy» (c пробелом) из списка фраз KeywordPlanner, нажав сочетание клавиш «Ctrl +H» и выбрав диапазон нужного столбца:
Далее на нужной вкладке в столбце «Avg. Monthly Searches» прописываем формулу:
=VLOOKUP(B2;\\\'Keyword Planner \\\'!$2:$172;2;0)
Протягиваем ее вниз и получаем соответствие и частотности искомых ключевых фраз.
Чтобы отсортировать данные по частотности, выделяем столбец с частотностями, нажимаем сочетание клавиш «Сtrl+С» и вставляем столбец на то же место, нажав «Сtrl+Shift+V». Так мы переведем значения в обычный формат.
После этого выделяем столбец с частотностями и выбираем в меню «Данные» — «Сортировать лист по столбцу C, Я-A»:
Получаем таблицу, которая дает ориентировочное представление, какие группы товаров более востребованные.
Как использовать возможности поиска для решения бизнес-задач В Яндексе
Как провести анализ входящего трафика на страницы фильтров
Еще один способ узнать, для каких страниц нужны тексты — проанализировать количество органического трафика, приходящего на конкретную страницу. Для анализа можно использовать Google ***ytics или Яндекс.Метрику.
Смотрим количество органического трафика со страниц входа. В Google ***ytics для этого нужно перейти на: «Источник трафика» — «Каналы» — «Organic Search» — «Страницы входа».
В Яндекс.Метрике нужно пройти по пути: «Стандартные отчеты» — «Содержание» — «Страницы входа»:
Затем следует выбрать сегмент «Поисковый трафик»:
Пример страниц фильтров с достаточно хорошим трафиком:
Конечно, не для всех страниц нужен текстовый контент, но проведя такой анализ, вы получите готовый полигон для экспериментов с текстами.
Как найти страницы с текстами, которые нуждаются в доработке
Проанализируем динамику трафика.
В Google ***ytics переходим по пути: «Источник трафика» — «Каналы» — «Organic Search» — «Страницы входа». Выбираем анализируемый период и сравнить его с предыдущим годом:
Замечаем страницы, трафик на которые сильно просел:
Также смотрим на изменение показателей отказов, страниц за сеанс, средней длительности сеанса Все это — аргументы в пользу оптимизации контента данных страниц.
Если вам ближе Яндекс.Метрика, следуйте по пути: «Стандартные отчеты» — «Содержание» — «Страницы входа». Затем выбираем период и сравниваем.
Важно: анализ будет корректен, только если URL-адрес страницы за выбранный период не менялся.
Как проверить тексты на сайте
Приоритетные страницы, для которых нужны хорошие тексты, определили. Допустим, что на некоторых из них тексты уже есть. Как проверить их качество?
Уникальность текстов должна быть не менее 90%. Можно использовать, например, Advego Plagiatus. Если вы делаете рерайт или темы ваших статей очень похожи, также проверяйте тексты на сайте на схожесть между собой. Вот неплохой сервис: https://utext.rikuz.com.
Допустим, вы делаете описания для похожих моделей телефонов. При трех словах в шингле (фрагменте текста, с которым работает программа проверки уникальности), показатель схожести должен быть не более 10%:
Спамность (плотность) ключевых слов в тексте должна быть не более 3%. Это условный показатель, но на него можно ориентироваться. Проверить вхождение ключевых слов легко с помощью сервиса istio.
Еще один отличный сервис — «Семён-Ядрён» (для регистрации понадобится яндексовская почта). С его помощью удобно проверять работу копирайтеров:
- В колонке «Фразы для поиска» добавляем ключевые фразы, которые вы указывали в техзадании для копирайтера.
- В колонку «Текст или URL:» вставляем написанный текст или адрес страницы.
- Получаем список ключевых слов в тексте.
Оптимальный размер текстов, конечно, отличается от ниши к нише, но недавний эксперимент Алексея Рылко доказывает, что роботы поисковых систем предпочитают тексты объемом более 150 слов. Короткая выдержка из исследования: «Страницы, которые имеют меньше 150 слов текста, краулятся роботом реже всего. А страницы с текстами свыше 1200 слов крауляется в 89% случаев».
Если хотите лучше понять, какого объема тексты вам нужны, можно вручную посчитать объем текстов на релевантных страницах из ТОП-10. Затем рассчитать среднее количество символов и готовить тексты побольше.
Но это, естественно, слишком трудоемкий процесс, если у вас большой проект. В данном случае лучше использовать megaindex — сервис анализирует ТОП-10 по Яндексу/Google, подсчитывая средний объем текстов по заданному региону.
Этот сервис бесплатный, а вот аналог от Seolib обойдется в копеечку.
Алгоритм действий аналогичен:
- Нужно добавить анализируемую ключевую фразу.
- Выбрать регион.
- Поставить галочку рядом со строкой «Объем текста в словах и символах».
- Поставить галочку рядом со строкой «Всю страницу».
Результат:
Еще одна программа — Ultimate Keyword Hunter — позволяет анализировать объем контента по ТОПу.
Единственный минус — нельзя выгрузить данные об объеме символов.
Инструмент анализа текстовой релевантности от Serpstat в частности позволяет узнать необходимый размер текста на основании анализа конкурентов. Кроме того, сервис предоставляет данные о релевантности и коэффициенте штиля анализируемых ключевых фраз и дает рекомендации по использованию важных ключевых слов в title, h1 и самом тексте.
Также хорошие результаты дает совмещение двух инструментов: Key Collector (для Яндекса, при анализе до 50 фраз, можно использовать arsenkin.ru) и Netpeak Checker.
Алгоритм действий:
- Добавляем максимально релевантные ключевые фразы в Key Collector:
- Определяем регион:
- Идем по пути: «SERP» — «Получить данные для ПС Google»:
- Экспортируем данные:
Получается такой отчет.
- Добавляем в Netpeak Checker список найденных URL из ТОПа.
Важно, чтобы URL были конечные, то есть возвращали код ответа 200, иначе Checker не выгрузит количество символов.
- Напротив строки «Количество символов» ставим галочку:
Получаем такой отчет.
После этого следует сопоставить полученные данные с нашим списком URL-адресов по ТОПам.
В документе сопоставим основной список ключей и URL с количеством символов. Для этого используем все ту же функцию vlookup в таблицах Google.
Посчитаем среднее количество символов в ТОП-10 по каждому запросу — для этого нужно использовать функцию =AVERAGE()
Чтобы сосчитать для всех строк, нужно выделить первые десять строк, а затем протянуть курсор вниз до конца списка.
Так же можно находить самые большие тексты и стараться сделать их еще длиннее.
С помощью сочетания клавиш Ctrl+H удаляем из ключевых фраз «buy» с пробелом.
Затем копируем все полученные данные в таблицу с общим списком URL категорий (вставлять данные следует с помощью CTRL+SHIFT+V). И опять с помощью функции =VLOOKUP сопоставляем среднее количество символов с названиями категорий:
В итоге получается такая таблица.
Оформление текста так же важно для оптимизации страницы. Следует учесть технические рекомендации:
1. Не должно быть слишком много ключевых слов, выделенных полужирным (тегами , ):
2. В тексте присутствуют подзаголовки h1, h2...h6.
3. Все списки размечены корректно. Пример некорректной разметки (без и
):
4. Текст желательно не скрывать:
Скрытый текст весит меньше для поисковых роботов Google
Как доработать старые тексты
Если у вас информационный ресурс, алгоритм реанимации контента хорошо представлен в этой презентации:
Что делать со старыми статьями в блоге Часть этих советов представлена в материале
Дооптимизация текстов на страницах товаров
Повышением информативности страниц товаров на сайтах интернет-магазинов обычно занимаются в последнюю очередь (или вообще за это не берутся). Часто оправданно, так как описания одинаковых товаров на сайтах похожи друг на друга.
Чтобы сделать уникальные описания, добавьте к названию товара «отзывы» и введите полученную комбинацию в поисковик. Затем выберите страницы с отзывами. Их легко найти по микроразметке:
Скопируйте полностью все отзывы со страницы и вставьте их в сервис istio.
После этого нужно найти тематические слова, которые часто встречаются в тексте описания:
На сайте с отзывами ищем предложения/вопросы с этими словами:
Видим, что многие интересуются вопросом расширения оперативной памяти на ноутбуке. Соответственно, в описании товара на сайте добавляем информацию о возможностях расширения оперативной памяти.
Отзывы можно использовать и для определения ключевых достоинств и недостатков товара/услуги. Отличная площадка для этого — Яндекс.Маркет:
1. Находим отзывы о товаре на сайте.
2. Копируем весь текстовый контент из графы «Достоинства»:
3. Определяем частотность слов/фраз и составляем список всех достоинств/недостатков продукта.
Используйте мощь пользовательского контента. Бесплатная идея:
Слишком бaнaльно? Ok. Как насчет того, чтобы выводить на странице товара блок с превью информационных статей по заданной теме вместо стандартного текста:
Или, например, показывать отзывы на страницы категорий:
На самом деле все средства хороши, чтобы посетители вашего сайта как можно быстрее нашли желаемое. Так что главный совет: пишите так, чтобы читатели были счастливы.
Выводы
1. Создавать простыни текста важно далеко не во всех нишах и не для каждого бизнеса. Изучайте тематику, анализируйте старые тексты. Легче переписать и дооптимизировать их, чем подготовить ворох новых материалов и неожиданно попасть под «Баден-Баден» из-за некачественных старых статей. В результате вы потратите гораздо больше времени для поиска текстов, из-за которых сайт оказался под санкциями.
2. При поиске страниц, для которых нужны тексты, используйте автоматизированные инструменты. Это значительно сэкономит время.
3. Периодически проводите дооптимизацию существующих статей: исправляйте ошибки, следите за структурой, спамностью, дополняйте текст упущенными ключевыми фразами.
4. Ищите альтернативные способы создания контента: проводите статейные конкурсы, предлагайте скидки за отзывы.
Думаете, на этом контент-аудит завершен? Как бы не так: впереди еще составление техзадания для копирайтеров и комплекс мероприятий по анализу сети для выявления плагиаторов и защиты от них. Но это уже темы для отдельных статей.
Комментарии:
То, как мы разговариваем, важно не только в жизни, но и в соцсетях. Зачем нужен tone of voice и как сделать, чтобы ваш голос отличался от других и был эффективен? Читайте наш гайд....
01 04 2026 20:37:55
Покажем, как продвигать сайты, продающие детскую обувь...
31 03 2026 10:16:48
Офис Netpeak в Харькове официально открыт! В этом посте, вместо игры на фанфарах, мы на собственном примере рассмотрим, что нужно для создания регионального отделения в разгар кризиса....
30 03 2026 18:19:44
Как достучаться до сердца блогера, или Автору звонят дважды...
29 03 2026 13:38:57
Чтобы обезопасить себя и своих клиентов, используйте технологию 3D Secure. Больше рекомендаций — в статье....
28 03 2026 7:28:42
О феномене Баадера-Майнхофа — как на самом деле работают системы баннерной рекламы в интернете...
27 03 2026 6:26:41
Как быстро систематизировать мысли и заметки? Используйте систему Zettelkasten....
26 03 2026 2:20:24
Крупным брендам не избежать негатива в сети. Но с ним можно и нужно работать. Читайте успешный кейс для DOM.RIA....
25 03 2026 23:37:17
Кейс по росту органического трафика на сайте интернет-магазина на платформе Summer Cart....
24 03 2026 18:14:35
Решили составить список из семи улучшений. Что нового, Netpeak?...
23 03 2026 16:59:24
Киев, Одесса, Харьков, Днепр и другие города — в офис и обратно IT-специалисты добираются от 10 минут до более чем полутора часа. В дороге они слушают музыку, подкасты, читают книги. Узнать больше!...
22 03 2026 16:49:49
Определение сайта нового типа. Захочет ли бизнес интернета перевести свои веб-приложения на более прогрессивные рельсы?...
21 03 2026 7:49:41
SMM от Netpeak — это разработки стратегий продвижения, механики конкурсов, медиапланирование и постоянная интеpaктивная связь с клиентом с помощью «Личного кабинета»....
20 03 2026 5:58:17
Какие рассылки можно отправить покупателю, если у вас есть только данные из карточки товара...
19 03 2026 18:15:44
Продолжаем разговор о том, почему функция «Совмещение данных» в Google Data Studio может работать не так, как вы ожидаете....
18 03 2026 1:16:20
Работа — рекламировать. Интервью с директором по стратегии агентства Smartica/Skykillers....
17 03 2026 19:54:39
Счетчик Яндекс.Метрики: создание и установка кода, важные настройки....
16 03 2026 22:49:58
Под какие треки работают интернет-маркетологи, копирайтеры и другие специалисты digital-рынка....
15 03 2026 10:48:14
C какими сложностями пришлось столкнуться при создании интернет-магазина....
14 03 2026 15:20:19
Правильное продвижение сайта и нестандартные предложения по привлечению трафика...
13 03 2026 20:38:23
Почему дешевый копирайт не подходит для текстов карточки товара...
12 03 2026 18:55:36
Что такое контекстная реклама? Словарь терминов для чайников...
11 03 2026 5:17:38
Программа покорения онлайн мира мобайла — самому и с ограниченными средствами на маркетинг...
10 03 2026 23:55:58
Результаты рейтинга зарплат интернет-маркетологов....
09 03 2026 15:17:41
Обо всех способах передачи данных из несвязанных с сайтом источников, а также о ручной передаче данных...
08 03 2026 13:20:42
Сооснователь и главред Forbes Ukraine о вовлечении читателей в смысловое поле бизнеса...
07 03 2026 2:15:24
Короткий кейс и рекомендации по защите аккаунта от взлома....
06 03 2026 19:10:51
Как повысить результаты продаж в режиме цейтнота. Советы новому руководителю от специалистов Netpeak Group. Больше подробностей — в посте...
05 03 2026 22:41:47
Чем радовала, смущала и шокировала реклама в социальных сетях в марте 2021-го...
04 03 2026 3:45:39
Здесь не нужно часами собирать семантику, прописывать уйму расширений и создавать максимально релевантные объявления под каждый товар, а потому вам нужен этот понятный и короткий мануал! Читайте дальше!...
03 03 2026 6:38:46
Дэн Гридин, ненавистник холодных звонков и эксперт в области системного B2B маркетинга для сложных рынков, рассказал читателям блога о принципах работы на рынке во время шторма....
02 03 2026 15:32:19
Как стать лидером ниши не на словах, а на деле. Пошаговый алгоритм....
01 03 2026 19:27:44
Сериал «Ход королевы» взорвал интерес к шахматам, и вот насколько сильно...
28 02 2026 4:14:55
Что нужно знать перед запуском рекламы в мессенджерах....
27 02 2026 20:20:29
Как избежать ошибок при продвижении интернет-магазина с помощью видеоблогеров....
26 02 2026 7:12:19
В основе продвижения любых продуктов фигурирует ЦА и её потребности. Рассказываем, как с ней работать в разрезе Инстаграм и Facebook так, чтобы РК давала максимальный профит...
25 02 2026 6:59:44
Эффективность продвинутой сегментации стала заметна уже в первый месяц ее функционирования....
24 02 2026 22:21:21
Ликбез по важным понятиям, без которых нельзя начинать бизнес в интернете. Что такое домены второго и третьего уровня, чем они отличаются. Узнать больше!...
23 02 2026 5:18:49
Аромамаркетинг. Почему В Нью-Йоркских магазинах Samsung пахнет медовой дыней, в British Airways — луговыми травами. Что мы знаем о восприятии нами сенсорной информации, а конкретно — ароматов. Читать дальше!...
22 02 2026 10:26:16
Самопомощь по тревоге во время карантина и экономического кризиса...
21 02 2026 14:51:31
Уверены, что аппы в украине не приносят денег? В этом кейсе мы расскажем, как увеличить доход с мобильного приложения, и поделимся результатами продвижения LeBoutique...
20 02 2026 9:49:16
All about internet mail. Примеры того, что стоит внедрить в рассылках почты онлайн....
19 02 2026 1:14:46
Как правильно оптимизировать страницы пагинации, чтобы не допустить проседание целевого трафика...
18 02 2026 9:34:21
И эксперт, и агент. Анонимный покупатель — специальная проверка бизнес-процессов до и во время рекламной кампании...
17 02 2026 14:39:44
Разработка, вёрстка и оптимизация мобильных версий сайтов — популярные темы последнего времени. Мы расскажем, что стоит и что не стоит делать в мобильном SEO....
16 02 2026 9:57:53
Анализ пути — это как многокaнaльные последовательности в Universal ***ytics, только лучше....
15 02 2026 5:56:45
Рекламные аукционы Фейсбук заточены поднимать объявление с наивысшей итоговой ценностью — это главное отличие от классических аукционов...
14 02 2026 20:33:49
Бренды поделились инсайтами на ДиВи Конф — фишки от MEGOGO, Google, TikTok, Banda, McCann, I am IDEA, AIR Brands, Rocket и Фокстрот...
13 02 2026 1:35:57
Бесплатные продукты для онлайн-бизнеса — история внедрения freemium модели в сфере виджетов обратных звонков....
12 02 2026 12:55:42
Сколько прибыли вы не получили в Google Ads из-за нехватки бюджета или низкого рейтинга ключевых слов. Метод покажется сложным, но в дальнейшем вы сможете бесплатно обновлять данные и контролировать потери показов и дохода по всем рекламным кампаниям...
11 02 2026 5:44:53
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::