Как прогнозировать цены с помощью машинного обучения

Когда ваш бизнес растет и товаров становится больше, то управлять ими вручную невозможно. Чтобы устанавливать конкурентные цены, корректировать ассортимент и оптимизировать бизнес-процессы, ритейлеры используют алгоритмы машинного обучения. Но с ними не все так просто.
В этой статье я опишу методы восполнения недостающих данных: от их покупки до моделирования с помощью алгоритмов машинного обучения.
Первый шаг в использовании алгоритмов — их обучение на исторических данных (обучение с учителем, supervised learning), где есть целевая функция. Например, продажи, выручка, прибыль или доля рынка.Эта функция — основной KPI ритейлера, на прогнозирование которого и будет работать данный алгоритм.
Модель анализирует переменные, которые влияют на продажи — цены, трафик и другие— и выводит функцию, которая максимально точно описывает продажи. После этого обученный алгоритм рекомендует с высокой точностью, какие значения переменных максимально увеличат продажи в будущем.
Чем больше данных в распоряжении алгоритма, тем точнее он работает. Поэтому данные — важнейшее условие конкурентоспособности ритейлера.
Причины отсутствия данных
Главная сложность, с которой сталкиваются ритейлеры при использовании алгоритмов, — пропуски или противоречия в исторических данных. Из-за этого сложно ими пользоваться нормально.
Причины:
- Менялся формат данных.
Различия внутренних систем, ИТ-решений, подходов к сбору данных (по дням или по транзакциям) приводят к тому, что данные в разные периоды жизни компании собираются в разных форматах . - Данные собирались для разных целей.
Если данные собираются в обобщенном виде, например, для расчета премии категорийным менеджерам и не категорируются, они, как правило, не пригодны для обучения алгоритмов. - Ритейлер недавно вышел на рынок.
На начальном этапе 90% продаж зависят от трафика сайта. Поэтому невозможно определить, как цены влияют на продажи в течение этого периода. - Горящие распродажи.
Если ритейлер работает в режиме flash sales (запуск кратковременных распродаж разных категорий или брендов), алгоритмы не могут использовать полученные неоднородные данные.
Если по какой-либо причине данных недостаточно для обучения алгоритма и прогнозирования, ритейлер должен постараться выжать все возможное из доступного объема данных, смоделировать или купить недостающие данные.
Как работать с существующими данными
Данные, независимо от источника, должны быть в едином формате. Если уже собран определенный объем данных, то ритейлеру потребуется около года, чтобы собрать данные в новом формате (например, включающие цены и акции конкурентов), прежде чем их можно будет использовать в алгоритмах.
Еще один путь — купить недостающие данные.
В то же время для создания моделей прогнозирования данные о конкурентах не нужны.
Такие модели менее точны, более трудоемки, требуют допущений и моделирования отсутствующей информации, но используются достаточно широко.
Как смоделировать недостающие данные
Есть методы, которые прогнозируют недостающие значения на основе существующих данных об определенных переменных. Например, у ритейлера есть данные о своих ценах и продажах за два года, а также о продажах конкурента за полтора года. На основе этой информации можно определить, какими были цены конкурента за отсутствующий период.
Для решения таких задач, как правило, используются классификаторы. Они прогнозируют недостающие значения на основе других независимых переменных, значения которых известны.
Рассмотрим типы «умного» заполнения отсутствующих данных.
1. Предиктивная модель: чтобы получить прогноз о недостающих данных, все данные нужно разделить на две части.
Первая часть — известные данные, вторая — недостающие. Первый массив будет играть роль тренировочного для обучения модели, а данные из второй части станут целевыми переменными для прогноза.
В этой модели, бинарный классификатор будет отвечать на вопрос, произошло ли то или иное событие (например, были ли товары на полке). Категорийный классификатор — присвоит товар определенному сегменту (например, ценовому сегменту) ;
2. Заполнение методом KNN (k-nearest neighbor): предсказывает недостающие значения на основе ближайшей к целевому показателю переменной.
Близость переменных определяется на основании так называемой расчетной дистанции между ними.
Существует пять основных типов алгоритмов-классификаторов:
- логистическая регрессия;
- древо принятия решений;
- нейронные сети;
- семейство бустеров;
- Random Forest.
Для прогнозирования конечного целевого показателя — продаж — используются регрессоры. Они предсказывают не сегмент или вероятность, а вероятное числовое значение.
Самые распространенные типы регрессоров — линейная и полиномиальная регрессия, нейронные сети, регрессионные деревья и упомянутый выше Random Forest.Как использовать алгоритмы машинного обучения в работе с данными
Если у ритейлера собран большой объем данных, можно использовать нейронные сети, чтобы с высокой точностью рекомендовать ассортимент или цены для максимального увеличения продаж. Если же их мало, можно использовать другие алгоритмы, которым нужно меньше данных.
Например, если у ритейлера есть достаточное количество исторических данных только о 30% товаров, а также небольшой трафик и редкие продажи, нейронная сеть не сможет работать. В таком случае, можно использовать алгоритмы-деревья для отдельных продуктов.
Примеры древовидного алгоритма — XGboost, LightGBM и CatBoost.Этот тип алгоритма может прогнозировать оптимальные цены на основе 150-дневной истории активных продаж. Однако, у него есть недостаток: он не умеет учитывать взаимозависимость цен на разные товары. Такой алгоритм можно использовать для KVI-товаров, а к остальным — применять простые сценарии переоценки (rule-based pricing).
Чтобы вычислить эластичность цены для 20-30 товаров, ритейлер может использовать регрессию, добавляя три-четыре переменные. Регрессию можно использовать для принятия высокоуровневых решений: например, стоит или нет повышать цены.
Пример: линейная или полиномиальная регрессия (метод опopных векторов).Этот алгоритм не определяет конкретную цену, необходимую для максимального увеличения продаж и маржи, но показывает тенденцию.
Другой метод, который используется, когда ритейлеру не хватает данных, это A/B-тестирование на основе аналитики и статистики. Начинающие ритейлеры могут воспользоваться им, чтобы оценить влияние рекламы и цен на продажи.
Пример: сопряженный анализ.Сопряженный анализ на основе небольшой выборки данных, собранных с помощью A/B-тестирования, определяет оптимальные комбинации цена-промо-реклама. Этот метод показывает, как каждый из этих факторов влияет на цены, и определяет их оптимальное значение.
Выводы
Ритейлер может использовать несколько методов, чтобы восполнить недостающие данные или прогнозировать цены на основе небольших объемов данных: различные классификаторы, древовидные алгоритмы, метод регрессии, A/B-тестирование и совместный анализ.
Самый оптимальный метод — сбор и обработка качественных исторических данных. Используя такие данные, нейронные сети быстрее обучаются и делают более точные прогнозы.
Комментарии:
Понятные людям и роботам URL. Это уникальный набор символов, который дает возможность идентифицировать всевозможные ресурсы в интернете (страницы сайтов, файлы, изображения, видео и так далее). Чтобы узнать больше, читайте далее!...
08 06 2026 9:57:23
Кейс: контент-маркетинг сервиса в США, или как SerpStat покорил англоязычный мир...
07 06 2026 3:45:16
Правила преобразования фидов в Google Merchant Center помогут сегментировать товары и сделать вашу рекламу более эффективной...
06 06 2026 3:48:49
Самые точные данные статистики, которые вы получите с помощью Google Tag Manager....
05 06 2026 10:49:59
Айти эксперт Женя Розинский о том, почему нацию айти развивают продуктовые бизнесы, а не outsourcing сервисы...
04 06 2026 15:11:21
«Нет, нам нужна раскрутка и точка!» Список маркетинговых пpaктически применимых фишек....
03 06 2026 3:34:23
Словосочетания и аббревиатуры, которыми пользуются на рынке игрового маркетинга....
02 06 2026 6:17:28
4 кейса с шагами, рекомендациями и результатами, которые помогут грамотно распределить средства на рекламу....
01 06 2026 18:33:10
Тестируем новый инструмент Яндекс.Директ — динамические объявления....
31 05 2026 13:21:12
Примерно 70% конверсий происходит за счет дополнительных источников, их ценность отражается в GA. Разбираемся, какие отчеты использовать для анализа и оценки таких источников. Читайте далее!...
30 05 2026 19:47:27
Как настроить просто и быстро настроить скрипт в Google ***ytics для отслеживания печати страниц сайта....
29 05 2026 3:14:40
Наш результат ведения рекламных кампаний в Facebook показывает, что при правильно подобранной стратегии можно даже за короткий период в авральном режиме попасть точно в цель...
28 05 2026 15:16:13
Мануал по созданию удобного планировщика повторяющихся действий....
27 05 2026 13:29:24
Почему нельзя просто взять и перевести. В худшем случае специализированный текст на иностранном языке должен стать для переводчика дорожной картой, в лучшем — источником вдохновения. Почему? Читайте об этом!...
26 05 2026 18:13:20
Товарные объявления торговых кампаний заметнее в выдаче, да и показываться будут и в Bing, и в Yahoo, и в AOL...
25 05 2026 18:40:55
Тематический кейс в нише «Фотография и аксессуары»: проделанные работы и полученные результаты...
24 05 2026 9:58:30
Рассказываем о том, что такое Песочница, как сюда писать и получать больше аудитории для своего бизнеса...
23 05 2026 3:53:21
Разбираемся, как определить самые эффективные источники лидов....
22 05 2026 16:50:19
Причины, по которым имеет смысл работать в офисе хотя бы несколько дней в неделю, а может и больше. Конечно, только если эпидемиологическая ситуация не заставляет оставаться дома. Берегите себя....
21 05 2026 3:39:29
Распространенные ошибки продвижения B2B-компаний + стратегии того, как наращивать число активных подписчиков и потенциальных клиентов....
20 05 2026 14:31:36
Проверьте свою логику, находчивость и креативность...
19 05 2026 1:10:12
Аккаунт менеджеры это... Быть лицом компании, проводником между заказчиком и комaндой агентства, ментором для коллег и суперменом, готовым прийти на помощь клиенту в любой час дня и ночи… Эти задачи по плечу аккаунт-менеджерам Netpeak...
18 05 2026 23:11:16
Образец рассылки от создателе Replyapp.io Олег Белозор, на которую ответили самые влиятельные эксперты в мире в2в продаж...
17 05 2026 0:23:43
Чем вам может пригодиться это исследование? Понимания стоимость конверсии и необходимое количество конверсий, вы можете прогнозировать, сколько денег на рекламу нужно выделить. Читать!...
16 05 2026 7:50:32
Продолжаем уроки по Google ***ytics для новичков. Сегодня рассмотрим основные моменты, касающиеся отчетов....
15 05 2026 13:24:42
Мотивация сотрудников к работе с текстами. Опыт бюро копирайтинга Texbroker...
14 05 2026 5:35:22
Личный кабинет на сайте: что нового во внешнем виде, внутренностях и отчетах, функционале и юзабилити, автоматизации работы с оплатами, интернет-представительстве клиента и для специалистов. Узнайте больше!...
13 05 2026 12:52:44
Что нужно знать о целевой аудитории, как грамотно воровать у других и что нужно сделать, чтобы настроить идеальную рекламную кампанию....
12 05 2026 1:14:30
Есть офлайн-точка продаж и нужно привлечь сюда больше клиентов. Что делать? Настраиваем локальные кампании. Показываем и рассказываем, как это делать....
11 05 2026 8:33:29
В арсенале Google Рекламы есть очень ценный инструмент — отслеживание конверсий....
10 05 2026 16:14:12
Рост количества транзакций на 417%, дохода на 560%, среднего чека на 28%....
09 05 2026 20:37:32
Нам удалось увеличить количество органических показов на 63% и установок на 25%....
08 05 2026 9:57:40
Проверка структурированных данных поисковыми роботами нуждается в нашей поддержке...
07 05 2026 21:19:56
Следим за развитием событий и анализируем решение суда. Читать дальше!...
06 05 2026 9:37:39
Советы специалистам по контекстной рекламе. Технические сложности, которые возникают при работе с Google ***ytics: от ограничений интерфейса до ошибок настройки отслеживания и последующей недостоверности полученных данных, и решения для них...
05 05 2026 22:45:50
Сравним разные модели атрибуции с точки зрения оценки финансовых показателей проекта...
04 05 2026 5:25:41
Как развить в себе такой EQ, как хочется, и далее использовать его для достижения успеха. Рецензия на книгу Дэниела Гоулмана «Эмоциональный интеллект в бизнесе»....
03 05 2026 13:45:30
Чтобы раскрутить себя в Твиттер иногда нужно чистить списки фолловеров и это намного проще, чем кажется :)...
02 05 2026 19:29:38
А ещё у нас появилась новая стратегия SEO-продвижения для ниши доставки еды и продуктов....
01 05 2026 4:10:47
Результаты рейтинга зарплат интернет-маркетологов....
30 04 2026 6:49:53
Правильная внутренняя перелинковка необходима, чтобы страницы не вылетали из индекса, а также чтобы увеличить ссылочный вес продвигаемых страниц...
29 04 2026 2:10:58
Почему бизнесу нужно настраивать мультикaнaльную модель атрибуции на основе воронки продаж и как это сделать....
28 04 2026 15:17:55
10 шагов к я-бренду из книги «Я-бренд. Формула успеха». Марк вырастил свой бренд до размеров торгового бизнеса с объемами продаж в миллиарды долларов. Читайте, здесь есть и сама формула, подходящая для товара, сайта или торговли машинами...
27 04 2026 12:25:19
Очередной красивый пост о продвижении платформы email и sms-рассылок — UniSender...
26 04 2026 13:21:48
Основатель сервиса мобилографии EyeEm Рамзи Ризк рассказал об особенностях своего сервиса и будущем мобильных приложений....
25 04 2026 20:16:19
Инсайты от специалистов агентства Netpeak о популярных тематиках, тенденциях, особенностях продвижения в карантин и кризис, новых правилах для контекстной рекламы и других способов продвижения. Чтобы узнать больше, читайте далее!...
24 04 2026 23:43:17
В 2019 году в цикл зрелости вошли 28 технологий и инструментов...
23 04 2026 5:27:46
2 любопытные истории и 8 успешных стартапов, которые вас удивят....
22 04 2026 21:56:32
Тест, который проходят все соискатели. Никому не показывайте!...
21 04 2026 22:49:59
Обидно терять сохраненные достижения. Почему падает трафик из поисковых систем и как это исправить...
20 04 2026 11:30:46
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::