Временной ряд --- AR MA ARMA ARIMA ARIMAX

задняя часть

[toc]

Предварительное знание

стационарность последовательности

Стационарные последовательные графики автокорреляции и графики частичной автокорреляции либо имеют хвост, либо усекаются.

Усечение означает, что после определенного порядка все коэффициенты равны 0. Размазывание есть склонность к загниванию, но не все 0 .

С точки зрения автокорреляционной диаграммы она представляет собой треугольно-симметричную форму, в ней отсутствуют усечения и хвосты, что является типичным проявлением монотонной последовательности, а исходные данные принадлежат нестационарной последовательности.

Примечание:

Если автокорреляция запаздывает, а частичная корреляция усекается, используйте алгоритм AR.

Если автокорреляция усечена, а частичная корреляция имеет хвост, используйте алгоритм MA.

Если и автокорреляция, и частичная корреляция отстают, используйте алгоритм ARMA, ARIMA — это расширенная версия алгоритма ARMA, использование аналогично

ACF&PACF

image.png

image.png

AIC(akaike information criterion)

AIC=-2 ln(L) + 2 k

Информационный критерий Акаике, Информационный критерий Акаике, или сокращенно AIC, является стандартом для измерения качества подгонки статистической модели. Информационный критерий Акаике основан на концепции энтропии. Чем меньше AIC, тем лучше модель, и обычно выбирают модель с наименьшим AIC.

Его предположенияОшибки модели подчиняются независимому нормальному распределению..

где: k — количество параметров в подобранной модели, L — логарифмическая вероятность, а n — количество наблюдений. Маленький k означает, что модель краткая, а большой L означает, что модель точная. Поэтому при оценке модели учитываются как простота, так и точность. В частности, L=-(n/2)ln(2pi) - (n / 2) * ln (sse / n) - n / 2. Где n - размер выборки, sse - остаточная сумма квадратов, а L в основном зависит от остаточной суммы квадратов, которая является отрицательной номер

image.png

BIC

БИК=-2 ln(L) + ln(n)*k

Срок штрафа BIC больше, чем у AIC, учитывая количество выборок.Когда количество выборок слишком велико, это может эффективно предотвратить слишком сложную модель из-за чрезмерной точности модели. Принципы AIC и BIC различны.AIC выбирает хорошую модель для предсказания с точки зрения предсказания, а BIC выбирает модель, которая лучше всего соответствует существующим данным с точки зрения подгонки.С точки зрения интерпретации, это модель с наибольшая предельная вероятность.

HQIC

HQIC= -2 ln(L) + ln(ln(n))*k

Затем возьмем логарифм, чтобы уменьшить штрафной член количества параметров в целом.

AR

AR является аббревиатурой авторегрессии, что означает авторегрессионную модель, что означает, что значение текущей точки времени равно регрессии значения нескольких точек времени в прошлом, потому что оно не зависит от других объясняющих переменных, это только зависит от его собственных прошлых исторических значений, поэтому он называется авторегрессией; если он зависит от прошлых p недавних исторических значений, порядок называется p и записывается как модель AR (p).

Определение :

Xt=a0+a1Xt1+a2Xt2++apXtp+εt,tеZX_t=a_0+a_1X_{t-1}+a_2X_{t-2}+\cdots+a_p X_{t-p}+\varepsilon_t,t\in \mathbb{Z}

представляет собой авторегрессионную модель p-порядка, называемую моделью AR(p), а a=(a0,a1,...,ap)T представляет собой коэффициент авторегрессии в модели AR(p). Временной ряд {Xt}, удовлетворяющий AR(p)-модели (3), называется AR(p)-рядом. Когда a0=0, это называется последовательностью AR(p) с нулевым средним значением, т.е.

Xt=a1Xt1+a2Xt2++apXtp+εt,tеZX_t=a_1X_{t-1}+a_2X_{t-2}+\cdots+a_p X_{t-p}+\varepsilon_t,t\in \mathbb{Z}

Следует отметить, что для случая a0 ≠ 0 мы можем изменить общую AR(p)-последовательность на AR(p)-последовательность с нулевым средним с помощью нулевого среднего

Моделирование последовательностей AR

image.pngШаг 1. Выполните проверку белого шума в последовательности. Если после проверки определено, что последовательность представляет собой белый шум, моделирование заканчивается, в противном случае перейдите к шагу 2.

Шаг 2: Проверьте стационарность последовательности, если тест показал, что она нестационарна, затем выполните процесс стационаризации последовательности и перейдите к шагу 1; в противном случае перейдите к шагу 3.

Шаг 3. Определить модель и оценить ее параметры, перейти к шагу 4.

Шаг 4 Проверить применимость модели, если тест пройден, можно получить подогнанную модель и предсказать последовательность, в противном случае перейти к шагу 3.

Определение модели AR

Если временной ряд удовлетворяет следующим двум условиям

  • АКФ хвостовая, то есть АКФ(k) не становится равной 0 после того, как k больше некоторой константы.
  • PACF усекается, то есть PACF(k) становится равным 0, когда k>p.

Оценка параметров для моделей AR

Существует три основных метода оценки параметров моделей AR: оценка момента, оценка методом наименьших квадратов и оценка максимального правдоподобия.

MA

определение image.png

Уравнение скользящего среднего может быть получено путем взвешивания последовательности белого шума во временном ряду. Как показано на рисунке ниже, процесс скользящего среднего q-го порядка выражается как MA(q).θ\thetaпредставляет собой скользящий коэффициент регрессии. ut представляет белый шум в разные моменты времени.

Определение модели MA

Коэффициент автокорреляции модели MA q-порядка является q-усеченным, поэтому порядок модели MA можно определить путем вычисления выборочного коэффициента автокорреляции.

Оценка параметров модели

Существует три основных метода оценки параметров модели MA: оценка максимального правдоподобия ML, оценка методом наименьших квадратов CSS, использование CSS для выбора начальной точки, а затем использование ML для выполнения метода CSS-ML.

Преобразование AR и MA

image.png

image.png

Преобразование Койка:

image.png

image.png

обратимость

Выше AR → MA мы называем это преобразованием Койка.От MA → AR мы называем его Invertibility (обратимость).На самом деле существует более широкое определение инверсии.Я не буду упоминать его здесь, просто уточню сначала это понятие.

image.png

ARMA

определение:

image.png

Этапы моделирования ARMA

(1) Судя по входным данным, чтобы определить, является ли это стационарной нечистой случайной последовательностью, если она стационарна, перейти непосредственно к шагу 2;

(2) С помощью функций автокорреляции и частичной автокорреляции в сочетании с критериями AIC или BIC модель идентифицируется и упорядочивается.

(3) После завершения идентификации модели и определения порядка перейдите к этапу оценки параметров модели.

(4) После завершения оценки параметров проводится проверка пригодности подобранной модели. Если подобранная модель проходит тест, начинается фаза прогнозирования. Если проверка модели не удалась, повторно идентифицируйте и протестируйте модель, то есть повторите шаг 2, чтобы снова выбрать модель.

(5) Наконец, используйте подходящую модель с высокой адаптивностью, чтобы предсказать будущую тенденцию изменения последовательности.

ARIMA

Как и предыдущие три модели, модель ARIMA также основана на стационарном временном ряду или устойчива после дифференцирования, кроме того, предыдущие модели можно рассматривать как особую форму ARIMA. Обозначается как ARIMA(p, d, q). p — авторегрессионный порядок, q — порядок скользящего среднего, d — количество различий, сделанных, когда время становится стационарным, что и является значением слова «интегрировать» здесь.

Преимущества: Модель очень проста, нужны только эндогенные переменные и не нужны никакие другие экзогенные переменные.

недостаток: 1. Данные временного ряда должны быть стабильными (стационарными) или быть стабильными после дифференцирования. 2. По сути, можно зафиксировать только линейные зависимости, а нелинейные связи зафиксировать нельзя. Обратите внимание, что использование модели ARIMA для прогнозирования данных временных рядов должно быть стабильным.Если данные нестабильны, невозможно зафиксировать закон. Например, причина, по которой данные о запасах не могут быть предсказаны с помощью ARIMA, заключается в том, что данные о запасах нестабильны и часто колеблются из-за влияния политики и новостей.

image.png

ARIMAX

определение

image.png

чтение бумаги

применение

armax.png

Part 1 - Data Wrangling

Part 2 eda

Part 3 Training and Modeling ARIMA vs ARIMA(X)

Part 4 Conclusion

приложение

посмотреть файл кода

использованная литература

Эмпирический анализ управления преступлениями, связанными с наркотиками, в прибрежных городах — на основе модели временных рядов ARMAX

Исследование прогнозирования качества чугуна в доменных печах на основе модели ARMAX-LSTM

Анализ причин колебаний цен на акции на основе полупараметрической модели LM_ARMAX

модель АРИМА

The ARIMAX model muddle

Временные ряды для начинающих — начало работы с моделями ARMA