[toc]
Предварительное знание
стационарность последовательности
Стационарные последовательные графики автокорреляции и графики частичной автокорреляции либо имеют хвост, либо усекаются.
Усечение означает, что после определенного порядка все коэффициенты равны 0. Размазывание есть склонность к загниванию, но не все 0 .
С точки зрения автокорреляционной диаграммы она представляет собой треугольно-симметричную форму, в ней отсутствуют усечения и хвосты, что является типичным проявлением монотонной последовательности, а исходные данные принадлежат нестационарной последовательности.
Примечание:
Если автокорреляция запаздывает, а частичная корреляция усекается, используйте алгоритм AR.
Если автокорреляция усечена, а частичная корреляция имеет хвост, используйте алгоритм MA.
Если и автокорреляция, и частичная корреляция отстают, используйте алгоритм ARMA, ARIMA — это расширенная версия алгоритма ARMA, использование аналогично
ACF&PACF
AIC(akaike information criterion)
AIC=-2 ln(L) + 2 k
Информационный критерий Акаике, Информационный критерий Акаике, или сокращенно AIC, является стандартом для измерения качества подгонки статистической модели. Информационный критерий Акаике основан на концепции энтропии. Чем меньше AIC, тем лучше модель, и обычно выбирают модель с наименьшим AIC.
Его предположенияОшибки модели подчиняются независимому нормальному распределению..
где: k — количество параметров в подобранной модели, L — логарифмическая вероятность, а n — количество наблюдений. Маленький k означает, что модель краткая, а большой L означает, что модель точная. Поэтому при оценке модели учитываются как простота, так и точность. В частности, L=-(n/2)ln(2pi) - (n / 2) * ln (sse / n) - n / 2. Где n - размер выборки, sse - остаточная сумма квадратов, а L в основном зависит от остаточной суммы квадратов, которая является отрицательной номер
BIC
БИК=-2 ln(L) + ln(n)*k
Срок штрафа BIC больше, чем у AIC, учитывая количество выборок.Когда количество выборок слишком велико, это может эффективно предотвратить слишком сложную модель из-за чрезмерной точности модели. Принципы AIC и BIC различны.AIC выбирает хорошую модель для предсказания с точки зрения предсказания, а BIC выбирает модель, которая лучше всего соответствует существующим данным с точки зрения подгонки.С точки зрения интерпретации, это модель с наибольшая предельная вероятность.
HQIC
HQIC= -2 ln(L) + ln(ln(n))*k
Затем возьмем логарифм, чтобы уменьшить штрафной член количества параметров в целом.
AR
AR является аббревиатурой авторегрессии, что означает авторегрессионную модель, что означает, что значение текущей точки времени равно регрессии значения нескольких точек времени в прошлом, потому что оно не зависит от других объясняющих переменных, это только зависит от его собственных прошлых исторических значений, поэтому он называется авторегрессией; если он зависит от прошлых p недавних исторических значений, порядок называется p и записывается как модель AR (p).
Определение :
представляет собой авторегрессионную модель p-порядка, называемую моделью AR(p), а a=(a0,a1,...,ap)T представляет собой коэффициент авторегрессии в модели AR(p). Временной ряд {Xt}, удовлетворяющий AR(p)-модели (3), называется AR(p)-рядом. Когда a0=0, это называется последовательностью AR(p) с нулевым средним значением, т.е.
Следует отметить, что для случая a0 ≠ 0 мы можем изменить общую AR(p)-последовательность на AR(p)-последовательность с нулевым средним с помощью нулевого среднего
Моделирование последовательностей AR
Шаг 1. Выполните проверку белого шума в последовательности. Если после проверки определено, что последовательность представляет собой белый шум, моделирование заканчивается, в противном случае перейдите к шагу 2.
Шаг 2: Проверьте стационарность последовательности, если тест показал, что она нестационарна, затем выполните процесс стационаризации последовательности и перейдите к шагу 1; в противном случае перейдите к шагу 3.
Шаг 3. Определить модель и оценить ее параметры, перейти к шагу 4.
Шаг 4 Проверить применимость модели, если тест пройден, можно получить подогнанную модель и предсказать последовательность, в противном случае перейти к шагу 3.
Определение модели AR
Если временной ряд удовлетворяет следующим двум условиям
- АКФ хвостовая, то есть АКФ(k) не становится равной 0 после того, как k больше некоторой константы.
- PACF усекается, то есть PACF(k) становится равным 0, когда k>p.
Оценка параметров для моделей AR
Существует три основных метода оценки параметров моделей AR: оценка момента, оценка методом наименьших квадратов и оценка максимального правдоподобия.
MA
определение
Уравнение скользящего среднего может быть получено путем взвешивания последовательности белого шума во временном ряду. Как показано на рисунке ниже, процесс скользящего среднего q-го порядка выражается как MA(q).представляет собой скользящий коэффициент регрессии. ut представляет белый шум в разные моменты времени.
Определение модели MA
Коэффициент автокорреляции модели MA q-порядка является q-усеченным, поэтому порядок модели MA можно определить путем вычисления выборочного коэффициента автокорреляции.
Оценка параметров модели
Существует три основных метода оценки параметров модели MA: оценка максимального правдоподобия ML, оценка методом наименьших квадратов CSS, использование CSS для выбора начальной точки, а затем использование ML для выполнения метода CSS-ML.
Преобразование AR и MA
Преобразование Койка:
обратимость
Выше AR → MA мы называем это преобразованием Койка.От MA → AR мы называем его Invertibility (обратимость).На самом деле существует более широкое определение инверсии.Я не буду упоминать его здесь, просто уточню сначала это понятие.
ARMA
определение:
Этапы моделирования ARMA
(1) Судя по входным данным, чтобы определить, является ли это стационарной нечистой случайной последовательностью, если она стационарна, перейти непосредственно к шагу 2;
(2) С помощью функций автокорреляции и частичной автокорреляции в сочетании с критериями AIC или BIC модель идентифицируется и упорядочивается.
(3) После завершения идентификации модели и определения порядка перейдите к этапу оценки параметров модели.
(4) После завершения оценки параметров проводится проверка пригодности подобранной модели. Если подобранная модель проходит тест, начинается фаза прогнозирования. Если проверка модели не удалась, повторно идентифицируйте и протестируйте модель, то есть повторите шаг 2, чтобы снова выбрать модель.
(5) Наконец, используйте подходящую модель с высокой адаптивностью, чтобы предсказать будущую тенденцию изменения последовательности.
ARIMA
Как и предыдущие три модели, модель ARIMA также основана на стационарном временном ряду или устойчива после дифференцирования, кроме того, предыдущие модели можно рассматривать как особую форму ARIMA. Обозначается как ARIMA(p, d, q). p — авторегрессионный порядок, q — порядок скользящего среднего, d — количество различий, сделанных, когда время становится стационарным, что и является значением слова «интегрировать» здесь.
Преимущества: Модель очень проста, нужны только эндогенные переменные и не нужны никакие другие экзогенные переменные.
недостаток: 1. Данные временного ряда должны быть стабильными (стационарными) или быть стабильными после дифференцирования. 2. По сути, можно зафиксировать только линейные зависимости, а нелинейные связи зафиксировать нельзя. Обратите внимание, что использование модели ARIMA для прогнозирования данных временных рядов должно быть стабильным.Если данные нестабильны, невозможно зафиксировать закон. Например, причина, по которой данные о запасах не могут быть предсказаны с помощью ARIMA, заключается в том, что данные о запасах нестабильны и часто колеблются из-за влияния политики и новостей.
ARIMAX
определение
чтение бумаги
применение
Part 1 - Data Wrangling
Part 2 eda
Part 3 Training and Modeling ARIMA vs ARIMA(X)
Part 4 Conclusion
приложение
посмотреть файл кода
использованная литература
Исследование прогнозирования качества чугуна в доменных печах на основе модели ARMAX-LSTM
Анализ причин колебаний цен на акции на основе полупараметрической модели LM_ARMAX
Временные ряды для начинающих — начало работы с моделями ARMA