[Документальное исследование] Оценка заказа

Representation Learning for Predicting Customer Orders

Введение

Прогнозирование будущих заказов клиентов имеет важное справочное значение для розничных продавцов при принятии многих ключевых операционных решений.Прогнозировать распределение будущих заказов, то есть возможные подмножества товаров и их частоты (вероятности), которые являются важными данными для принятия таких решений, как выбор классификации передовых складов и оценка пропускной способности центров доставки.

Изучение информации о распределении заказов сильно отличается от прогнозирования следующей корзины, прогнозирования временного набора и анализа частых наборов, где цель состоит в том, чтобы описать агрегацию рынка в определенный период Полная картина поведения, в то время как прогнозирование следующей корзины и прогнозирование набора времени ориентация на поведение конкретного покупателя при следующей покупке, независимо от времени покупки, кроме того, частый майнинг сетов дает только высокочастотные сеты, но не дает точной вероятности майнинга сетов информации, что не может удовлетворить потребности бизнес-приложений .

Из-за резкого увеличения количества комбинаций возможных типов ордеров изучение распределения ордеров на основе данных сопряжено с рядом серьезных проблем, в том числе:

Данные порядка, используемые для изучения распределения, обычноредкий, где количество наблюдаемых ордеров намного меньше, чем количество возможных типов ордеров, а многие возможные типы ордеров не отображаются в наборе данных или появляются только один раз.
Полученное распределение порядка должно отражатьКорреляция, потому что категория продукта, к которой относится заказ, часто не является независимой.
Чтобы использовать распределение заказов в вышеупомянутых последующих приложениях, часто необходимо генерировать множествослучайный порядок. Следовательно, также необходимо разработать эффективные методы выборки случайных порядков в соответствии с изученным распределением порядков.

Прогноз будущих заказов

Прежде чем внедрять прогностическую модель, сначала изучите распределение порядка в известном наборе данных. $p$ Как спрогнозировать будущие заказы, исходя из предпосылки

символ

использовать $V=\{1,2,..,n\}$ Представляет собой набор товарных категорий, $S$ Указывает тип заказа, который $V$ Подмножество всех возможных типов ордеров с количеством $N=2^n$ .

Предполагая, что распределение заказов постоянно в течение определенного периода времени (это предпосылка возможности прогнозировать будущие заказы с помощью исторических заказов), предположим $p=\{p_1,...,p_N\}$ распределение порядка, полученное из исторических данных, $p_i$ Указывает, что случайный порядок принадлежит $i$ вероятности в типах ордеров, используя $p^g=\{p_1^g,...,p^g_N\}$ Представляет истинное распределение последних заказов.

использовать $K$ Представляет количество заказов в будущем периоде времени, предполагая, что $K$ дано (поскольку предсказание $K$ Гораздо проще, чем предсказывать конкретный порядок). использовать N-мерный целочисленный вектор $C^g=(c^g_1,...,c^g_N)$ представлять наземные истинные будущие заказы, $c^g_1$ означает первый $i$ Количество заказов основных правд для заказов классов. $C^p=(c^p_1,...,c^p_N)$ , представляет изученный порядок, очевидно $||C^p||_1=K$ , $С^?$ Построение обычно основано на изученном распределении порядка $p$ .

Метрики оценки

Цель состоит в том, чтобы делать прогнозы. $C^p$ как можно ближе $C^g$ , поэтому необходимо измерить разницу между ними.overlap(что можно понимать как сходство) можно рассчитать как:

Overlap(C^p,C^g)=\sum^N_{i=1}\frac{\min(c^p_i,c^g_i)}{K}

так как $||C^p||_1=||C^g||_1=K$ , приведенную выше формулу можно упростить следующим образом:

Overlap(C^p,C^g)=1-\frac{||C^p-C^g||_1}{2K}

видимая минимизация $||C^p-C^g||_1$ эквивалентно максимизации $Overlap(C^p,C^g)$ .

Алгоритм максимизации перекрытия

Определить вероятность $Pr(C^g=C^1;K,p^g)$ ,в $C^g=C^1=(c^1_1,...,c^1_N),||C^1||=K$ , который распределяется в соответствии с порядком истинности основания $p^g$ Заказ генерируется случайным образом, поэтому вы получаете:

Pr(C^g=C^1;K,p^g)=\frac{K!}{c^1_1!,...,c^1_N!}\prod^N_{i=1}(p^g_i)^{c^1_i}

первое $i$ Предельная вероятность количества наземных истинных ордеров в каждом типе ордеров равна:

Pr(c^g_i=Cc^1_i;K,p^g)= \begin{matrix} K\\ c^1_i \end{matrix}(p^g_i)^{c^1_i}(1-p^g_i)^{K-c^1_i}

знать, $c^g_i$ Повторное биномиальное распределение $B(K,p^g_i)$ . Прогноз для определенного заказа $C^p$ ,имеют:

Observation 1: когда установлено $C^p\approx Kp^g$ час, $c^p_i$ значение $Kp^g_i$ поймали и $||C^p||_1=K$ , $E[|c^g_i-c^p_i|;K,p^g]$ близко к своему минимальному значению, его геометрический смысл $C^g$ и $C^p$ между $l_1$ - Ожидание расстояния.

пройти черезObservation 1Ранее упомянутая максимизация может быть легко найдена $Overlap(C^p,C^g)$ На самом деле, это установить $C^p\approx Kp^g$ . На практике, однако, распределение истинного порядка не может быть известно. $p^g$ , из последних исторических данных можно узнать только одно распределение ордеров $p$ , затем используйте $p$ строить $C^p$ , и надеюсь $p$ и $p^g$ как можно ближе, $p$ Также известен как прокси-распределение ордеров.

Алгоритм 1 показывает использование прокси-распределения ордеров $p$ строить $C^p$ процесс.

модель генеративного отбора

В этом разделе предлагается генеративная модель выбора, которая может эффективно генерировать случайные заказы. Модель встраивает категории элементов в евклидово пространство и строит граф категорий элементов на основе вложения. На графе категорий элементов выполняется случайное блуждание для создания случайных порядков. Заказ.

Встраивание категорий продуктов и карта категорий продуктов

Набор заданных категорий товаров $V=\{1,2,...,n\}$ и несколько коллекций исторических заказов $S=\{S_1,S_2,...,S_r\}$ , $S_i$ за $V$ Подмножество. Категория $i$ представлен как $d$ - размерный вектор $x_i\in \mathbb{R}^d$ , называетсяВстраивание элемента.

Для построения графа категорий вводятся две воображаемые вершины, исходный узел $0$ и стоковые узлы $n+1$ и встроенный $x_0$ вершины $0$ . Граф категорий является ориентированным графом $G=<V\cup\{0,n+1\},E>$ , $E$ содержит от $0$ прибыть $V$ ,от $V$ прибыть $V$ (кроме петель), из $V$ прибыть $n+1$ со всех сторон и $n+1$ на петле, а $n=4$ Диаграмма категорий показана на рисунке 2 (а):

Случайное блуждание для генерации случайных порядков

Моделирование генеративного процесса выбора клиентов как процесса случайного блуждания на основе графа категорий: из исходных узлов $0$ Сначала клиенты могут перемещаться только по ребрам за пределами текущей вершины и в конечном итоге попадут в ловушку в узле стока. $?+1$ В (см. последний цикл на рис. 2) заказ клиента, полученный таким образом, представляет собой набор продуктов, которые он посещает.

После формализации случайное блуждание можно рассматривать как марковский процесс. $\{X_i,i=0,1,..|X_0=0\}$ , набор посещенных категорий $S=\{X_i|i=0,1,...\}-\{0,n+1\}$ . Кроме того, требуется матрица переходных вероятностей $P$ , в матрице $P_{ij}$ означает от $i$ перейти к $j$ вероятность, текст $P_{ij}$ устанавливается следующим образом:

$y_i$ Указывает, что клиент покупает категорию $i$ Прекратить ли покупать после, определите набор параметров $X=\{x_0,...,x_n,y_1,...,y_n\}$ . использовать $x_i^Tx_j$ для измерения категории $i,j$ корреляция, используя $softmax$ функция стандартизации категорий на карте категорий $i$ взаимосвязь с другими узлами. Заказы, случайно сгенерированные этой моделью, определяются как $S$ ,использовать $Pr\{S=s|X\}$ представлять категорию заказа $s\subseteq V$ в случайном порядке $S$ Вероятность.

тренировочный процесс

В этом разделе, чтобы изучить представления вершин, мы сначала сформулируем процесс обучения как задачу оценки максимального правдоподобия. Точный расчет стохастического градиента показан в Алгоритме 2:

Набор данных и исходный код

Ссылка на набор данных Исходная ссылка