Анализ временных рядов - определение скользящей средней (MA) и порядка

сбор данных
Анализ временных рядов - определение скользящей средней (MA) и порядка

[TOC]

1. Модель скользящей средней (MA)

1.1 Определение МА

Определение: Текущее значение определяется过去误差的线性组合Ошибки нормально распределены и не зависят друг от друга.

формула q-порядка:

1.2 Понимание MA

Различия между авторегрессионным моделированием и моделированием скользящей средней:

  • 移动平均(Moving average,MA)да过去的残差项, то есть белый шум делать линейной комбинацией;
  • Модель AR представляет собой линейную комбинацию прошлых наблюдений;

Отправной точкой МА является наблюдение за колебанием остатков путем объединения членов остатков.MA能有效地消除预测中的随机波动.

Когда значения временного ряда受周期变动и不规则变动Когда трудно показать тенденцию развития, можно использовать метод скользящей средней, чтобы исключить влияние этих факторов и проанализировать долгосрочную тенденцию прогнозного ряда.

Пример: например, влияние ураганов на цену сырой нефти, модель скользящего среднего может быть построена для прогнозирования тенденций.

2. Стабильность

  1. Стационарность - это требование, чтобы подобранная кривая, полученная с помощью выборочного временного ряда, могла продолжать «инерцию» вдоль существующей формы в будущем периоде (сохранять состояние~);

  2. Стационарность требует, чтобы последовательность均值和方差不发生明显变化(математическое определение устойчивого состояния ~);

2.1. Строгая устойчивость и широкая (слабая) устойчивость

  1. Строго стационарное: Строго стационарное представление представляет собой распределение, которое не меняется во времени.

Например: белый шум (нормальный), как бы он ни был взят, математическое ожидание равно 0, а дисперсия равна 1;

  1. Слабо стационарный: ожидания и коэффициенты корреляции (зависимости) не изменились

когда-нибудь в будущемttзначениеYtY_{t}Необходимо полагаться на его прошлую информацию, поэтому требуются зависимости;

2.2 Математические характеристики слабо (широко) стационарных временных рядов

  1. значитE(Yt)=μE(Y_{t})= μсо временемttнерелевантная константа;

  2. дисперсияVar(Yt)=γVar(Y_{t} )= \gammaсо временемttнерелевантная константа;

  3. КовариацияCov(Yt,Yt+k)=γ0,kCov(Y_{t},Y_{t+k} )= \gamma_{0,k}только с временным интерваломkkсвязанный со временемttнерелевантные константы.

  4. коэффициент автокорреляцииρk=Cov(yt,ytk)Var(ytk)Var(yt)=Cov(yt,ytk)Var(yt)=γkγ0ρ_{k }=\frac{Cov(y_{t }, y_{t-k})}{\sqrt{Var(y_{t-k)}Var{(y_t)}}}=\frac{Cov(y_{t }, y_{t-k})}{Var{(y_t)}}= \frac{\gamma_{k}}{\gamma_{0}}

2.3 Разностный метод

Для нестационарных временных рядов обычно используют差分метод для получения желаемого стационарного ряда, вы также можете использовать对数变换,幂变换и другие методы.

На рисунке ниже показана последовательность индекса доверия потребителей США, последовательность после разницы первого порядка и разницы второго порядка. Например: верхнее синее изображение на рисунке ниже — это исходные данные, зеленое изображение — это данные после разности первого порядка, а красное изображение — это данные после разности второго порядка. , базовое требование стабильности достигается.

这里写图片描述

3. Коэффициент автокорреляции и коэффициент частичной автокорреляции

3.1 Коэффициент автокорреляции (ACF)

  1. упорядоченная последовательность случайных величин по сравнению с самой собой;

  2. Автокорреляционная функция отражает同一序列在不同时序的取值之间的相关性;(корреляция парных значений)

  3. формула:ACF(k)=ρk=Cov(yt,yt1)Var(yt)ACF(k)=ρ_{k}=\frac{Cov(y_{t }, y_{t-1})}{Var(y_t)};

  4. ρkρ_{k}Диапазон значений: [-1,1];

3.2 Коэффициент частичной автокорреляции (PACF)

  1. для стационарногоAR(p)AR(p)модель, найти отставаниеkkкоэффициент автокорреляцииρkρ_{k}когда на самом деле получаешьx(t)x(t)иx(tk)x(t-k)простая корреляция между;

  2. x(t) также зависит от промежуточногоk1k-1случайная переменнаяx(t1),x(t2),,x(tk+1)х(т-1), х(т-2), ..., х(т-к+1)воздействие, и этоk1k-1обе случайные величиныx(tk)x(t-k)имеют корреляцию, поэтому коэффициент автокорреляцииρkρ_{k}на самом деле смешивается с другими парами переменныхx(t)x(t)иx(tk)x(t-k)Влияние;

  3. вырезать серединуk1k-1случайная переменнаяx(t1),x(t2),,x(tk+1)х(т-1), х(т-2), ..., х(т-к+1)После вмешательства,x(tk)x(t-k)правильноx(t)x(t)релевантность воздействия;

  4. ACFACFтакже включает влияние других переменных, а коэффициент частичной автокорреляцииPACFPACFявляется строгой корреляцией между этими двумя переменными.

3.3 Цензура и размытие

Цензурирование: относится к тому свойству, что функция автокорреляции (ACF) или функция частичной автокорреляции (PACF) временного ряда равна 0 после определенного порядка (например, PACF AR);

Размазывание: свойство, при котором ACF или PACF не равны 0 после определенного порядка (например, ACF AR).

Цензурирование: когда оно больше определенной константы k, оно быстро стремится к 0 для усечения порядка k; Хвост: всегда есть ненулевое значение, и оно не всегда будет равно нулю (или будет случайным образом колебаться вокруг 0) после того, как k превысит определенную константу.

3.4 Резюме

  1. ACF

ACF — это полная автокорреляционная функция, которая обеспечивает具有滞后值的任何序列的自相关值. Проще говоря, он описывает степень корреляции между текущим значением последовательности и ее прошлыми значениями.

Временные ряды могут содержать такие компоненты, как тенденция, сезонность, периодичность и остатки. АКФ учитывает все эти компоненты при поиске корреляций.

Интуитивно ACF описывает автокорреляцию между одним наблюдением и другим, включая информацию как о прямой, так и о косвенной корреляции.

  1. PACF

PACF — это функция частичной автокорреляции или функция частичной автокорреляции. По сути, вместо того, чтобы находить корреляцию лага вроде АКФ с текущим, он находит корреляцию остатка (который остается после удаления эффектов, уже объясненных предыдущими лагами) со значением следующего лага.

Таким образом, если в остатках есть какая-либо скрытая информация, которую можно смоделировать с помощью следующей задержки, можно получить хорошую корреляцию и смоделировать ее со следующей задержкой в ​​качестве признака.

Примечание. При моделировании обычно не следует оставлять слишком много взаимосвязанных объектов, что вызовет проблемы с мультиколлинеарностью.

4. Определение порядка АР и МА.

Давайте сначала посмотрим на MA.

Порядок q МА, полученный из графика АКФ, после определенного порядка АКФ впервые пересекает верхний доверительный интервал.

Из вышеизложенного известно, чтоPACF фиксирует взаимосвязь между остатками и задержками временных рядов., мы можем получить хорошую корреляцию по ближайшим задержкам и прошлым задержкам.

Почему бы не использовать PACF?

  1. Поскольку ряд MA представляет собой линейную комбинацию остаточных членов, а запаздывающий член самого временного ряда не может напрямую объяснить текущий член (поскольку это не процесс AR).

  2. Процесс MA, который не имеет сезонного компонента или компонента тренда, поэтому ACF фиксирует только корреляцию из-за остаточных членов.

Суть графика PACF заключается в том, что он может извлекать изменения, которые были объяснены предыдущими терминами задержки, поэтому PACF «устарел» в процессе MA, но подходит для процесса AR.

Следовательно:

  • AR(p) См. PACF
  • MA(q) см. ACF
Модель ACF PACF
AR(p) мазок, распад стремится к нулю Цензура после p-заказа
MA(q) Цензура после q-порядка мазок, распад стремится к нулю

Приглашаем обратить внимание на личный публичный номер:Distinct数说