Как для онлайн-, так и для офлайн-ритейла прогнозирование продаж является важной задачей, которая помогает компаниям лучше подготовить запасы и распределить товары по складам. Сильные рекламные акции, особенно во время крупных торговых фестивалей, значительно повысят потребление. Однако исторических данных для справки очень мало. Как спрогнозировать продажи в разных районах и временных периодах города одновременно — очень сложная задача.
В AAAI 2021 (категория CCF-A), включенном в декабре 2020 года, JD.com был включен в документ под названием «Надежное пространственно-временное прогнозирование покупок с помощью глубокого метаобучения». В этой статье рассматривается, как использовать глубокое метаобучение для объединения различной информации о городе и исторических данных о продажах для прогнозирования будущих продаж в различных регионах города в разные периоды времени, особенно во время крупных торговых фестивалей.
1. Предпосылки
Такие факторы, как пространственное распределение торговых центров и магазинов, особенности распределения населения и различные типы дней (например, будние дни, выходные или праздники шоппинга), приведут к различным схемам совершения покупок, как показано на рисунке 1. Из-за нехватки данных из определенного региона и определенного временного диапазона мы не можем обучить высокоточную прогностическую модель, используя только определенный диапазон данных. В то же время плотность населения и особенности распределения различных регионов в городе весьма неоднородны, а региональные характеристики также изменяются во времени Моделирование такой сложной пространственно-временной модели закупок представляет собой весьма сложную задачу. Чтобы точно фиксировать пространственные характеристики области, необходимо учитывать полный набор пространственных характеристик, таких как распределение точек интереса (POI), демографические характеристики области и т. д. Как повысить точность прогнозирования отдельного региона в определенный период времени с помощью обучения пространственно-временному моделированию — наша главная задача.
Рисунок 1 Пространственное распределение
Авторы делят эту задачу прогнозирования на три основные части: 1) Использование пространственно-временного вывода метаобучения для создания соответствующих пространственно-временных представлений для различных пространственно-временных регионов. 2) Изучите общую информацию между различными пространственно-временными регионами и объедините пространственно-временные представления для конкретных регионов, чтобы получить более надежный прогноз продаж. 3) Благодаря поочередному обучению времени и пространства модель может быть более совершенно изучена как в пространстве, так и во времени.
Рисунок 2 Амортизирующая сеть
2. Генерация пространственно-временного представления
Мы разрабатываем амортизированную сеть (показанную на рисунке 2. Амортизирующая сеть) для моделирования приблизительного апостериорного распределения пространственно-временного представления целевого региона и типа даты, которое учитывает влияние как объема продаж, так и связанных пространственных характеристик.
Из рисунка 3(а) видно, что на примере Пекина очевидны различия в распределении продаж по разным городским районам.
Чтобы полностью отразить временной характер данных о покупках для различных региональных задач прогнозирования, также необходимо учитывать линейные и нелинейные временные корреляции между историческими данными о продажах, такие как циклические закономерности, скрытые в записях заказов на покупку и корзины покупок.
На рисунке 3(b) мы можем видеть четкое изменение модели продаж каждую неделю. Чтобы смоделировать этот сложный и динамичный шаблон временного ряда, мы использовали модуль линейного преобразования, чтобы получить приблизительную кардинальность продаж, и специальный слой LSTM с пропуском, чтобы зафиксировать нелинейный временной шаблон изменений продаж. Затем извлеченные временные характеристики объединяются со статическими функциями с помощью модуля объединения функций для дальнейшей поддержки построения более репрезентативного пространственно-временного представления продаж.
Рисунок 3. Изменения в структуре продаж
3. Пространственно-временной прогноз продаж
На предыдущем шаге мы получили торговое представительство для определенного пространственно-временного региона. Затем мы представляем генеративную модель, которая использует общую статистическую структуру для изучения информации, используемой в различных задачах пространственно-временного прогнозирования. Для прогнозов для конкретных задач это значительно повышает эффективность обучения и точность прогнозов. Структура генеративной модели может относиться к декодеру амортизированной сетевой структуры, которая относится к предыдущему разделу (показанному на рисунке 2 Генеративная модель).
Он использует два разных входа для создания конечных продаж. Первые входные данные фокусируются на изучении текущих представлений о покупках путем использования методов извлечения признаков и методов слияния для входных продаж за последний период, которые описывают недавние изменения в моделях продаж. Второй вход представляет собой представление пространственно-временных признаков, специфичное для задачи пространственно-временного прогнозирования, выбранной из амортизированной сети. Он фиксирует макроскопические пространственно-временные паттерны целевой задачи. Наконец, генеративная модель объединяет два входа, используя полностью подключенную сеть, чтобы предсказать заказ на продажу в целевой момент.
4. Альтернативная тренировка во времени и пространстве
Различные пространственно-временные задачи связаны только с ограниченными данными из определенных регионов и временных рамок и не могут полностью описать покупательское поведение в определенных регионах. Вдохновленные многопрофильным обучением, мы создаем два представления (пространственное и временное) для описания различных представлений данных. Эти два представления дополняют друг друга, улучшая изученную информацию и получая более точное представление пространственно-временных данных. Пространственное представление имеет тенденцию изучать модели покупок в разных регионах, в то время как временное представление имеет тенденцию добывать модели временных вариаций различных типов периодов времени.
Переключение между различными представлениями во время обучения позволяет получить различную пространственно-временную информацию для разных регионов или типов дат. В то же время генеративные модели, общие для разных пространственно-временных задач, также могут быть интегрированы во время чередующегося обучения, и точность прогнозирования повышается. Полный процесс обучения показан в Алгоритме 1.
Алгоритм 1
5. Эксперимент
Для проверки валидности и надежности модели автор проводит прогнозные оценки продаж в разные промежутки времени (недели, выходные, торговые фестивали и т. д.). В то же время анализ абляции выполняется на различных компонентах модели для оценки эффективности различных компонентов.Результаты представлены в таблице 1.
Таблица 1 Эффективность различных компонентов
В таблице 1 мы видим, что STMP превосходит все базовые методы как для более ровных будних дней, так и для взрывных настроек прогнозирования торговых фестивалей. С точки зрения MSE оба STMP улучшились как минимум на 30% по сравнению с лучшими эталонными тестами. STMP по-прежнему примерно на 30-60% ниже эталонного показателя в сценарии прогноза взрывоопасных продаж. Эти результаты показывают, что наш подход эффективен и надежен, когда фактические модели покупок сильно отличаются от обычных.
Чтобы дополнительно изучить влияние различных компонентов модели STMP, мы также сравним производительность STMP и его вариантов в таблице 1. Можно заметить, что STMP-VI хорошо работает в общих сценариях и сценариях выходного дня, которые имеют относительно стабильные модели покупок, но хуже, чем STMP, на праздниках покупок. Это связано с тем, что STMP-VI использует точечные оценки, а не пространственно-временные представления описаний распределения для конкретных задач, что может быть проблематичным, когда данные ограничены или закономерности очень неопределенны. Кроме того, STMP-SKIP имеет более низкую точность по сравнению с STMP или другими вариантами, но все же превосходит другие тесты. Это оправдывает необходимость учета нескольких циклических паттернов во временном ряду покупок. Это также отражено на Рисунке 4(b), где мы можем видеть четкую циклическую закономерность в данных временного ряда покупок. Они демонстрируют, что моделирование нескольких периодических свойств данных играет важную роль в повышении производительности модели.
Рисунок 4
Чтобы изучить влияние модели в разных регионах и периодах времени, авторы выбрали четыре репрезентативных региона (охватывающих разные диапазоны продаж, подробные географические местоположения см. на рис. 4 (а)), чтобы сравнить продажи STMP и базовых методов в течение 2019 г. Данные визуализируются, как показано на рисунке 4. В большинстве регионов базовый уровень не годится для прогнозирования внезапности временных рядов покупок во время торговых фестивалей, таких как распродажи в середине продаж и пик покупок 11.11. Они, как правило, дают консервативные результаты и сосредоточены только на повышении общей точности. Тем не менее, STMP использует пространственно-временные представления различных регионов и типов дат для поддержки многозадачного обучения за несколько шагов, чтобы облегчить более точные прогнозы для конкретных регионов и типов дат. Можно заметить, что только STMP может точно предсказать взрывные продажи (все пики на рис. 6).
Рисунок 5
Наконец, автор сравнивает пространственно-временной попеременный метод обучения на трех крупных торговых фестивалях. При временном обучении операция слияния интегрирует экземпляры одного и того же типа дня в пакеты, независимо от пространственных знаний. Между тем, при пространственном обучении модель объединяет набор экземпляров из одного и того же региона без учета временной информации. Однако отсутствие совместного метазнания над пространственно-временным все же приводит к более низкой точности по сравнению с полной пространственно-временной чередующейся тренировкой. Это говорит о том, что разные режимы обучения изучают разные переходы между регионами и временными типами. Дополнительное обучение с пространственно-временной точки зрения может эффективно повысить точность предсказания.
Рекомендуемое чтение
- 21 статья JD.com была выбрана высоким голосованием для AAAI 2021, главной международной конференции.
- «Научная фантастика», принесенная НЛП, превосходит ваше воображение — интерпретация документов ACL2020 (1)
- Демистификация городской системы пространственно-временных данных JD — как JUST помогает прогнозировать транспортные потоки
Добро пожаловать, нажмите【Технология Jingdong] чтобы понять сообщество разработчиков
Более увлекательная техническая практика и эксклюзивный анализ сыпучих материалов
Добро пожаловать в публичный аккаунт [Jingdong Technology Developer]