Структура регрессии OLS для малых выборок

машинное обучение

1 История наименьших квадратов

Будь то машинное обучение, эконометрика, математическая статистика, первый алгоритм, с которым сталкиваются многие люди, — это метод наименьших квадратов.

Это очень старый метод. Еще в начале 18 века идея метода наименьших квадратов появилась в области астрономии и навигации. Первая официальная публикация метода была сделана французским ученым Лежандром в 1806 году, а математик Гаусс, как говорят, открыл метод раньше, но официально он не использовался до 1809 года, когда он опубликовал расчет орбит небесных тел. двое также спорили о том, кто первым узнал.

В конце концов, Гаусс — король математики, и в 1829 году он впервые доказал, что в классе линейных несмещенных оценок МНК-оценка имеет наименьшую выборочную дисперсию. В его доказательстве члены ошибки в модели линейной регрессии предполагались независимыми и нормально распределенными, а позже Марков смягчил это предположение, потребовав только, чтобы члены ошибки были некоррелированными, гомоскедастичными и, как ожидается, равными нулю. Следовательно, теорема в конечном итоге была названаТеорема Гаусса-Маркова.

2 Структура регрессии МНК для небольшой выборки

Какова цель регрессии МНК? Короче говоря, после принятия процесса генерации данныхy=β'x+εy=\beta' x+\varepsilonи собрать серию(x,y)(x,y)После данных мы можем сделать 3 вещи, которые также являются нашим путем изучения регрессии МНК:

  • получить точечные оценки коэффициентов;
  • Определить, насколько хорошо подходят данные?
  • Получите интервальную оценку коэффициента и выполните проверку гипотезы.

Во-первых, мы сначала используем данные, чтобы получить точечную оценкуβ^\hat{\beta}, из которого также можно получить ряд свойств, а затем вычислив такиеR2R^2Подождите, пока ряд индикаторов покажет, насколько хорошо подходит, и, наконец, после получения оценки интервала, вы можете выполнить проверку гипотез на предварительных гипотезах о коэффициентах.

2.1 Балльная оценка и ее свойства

После использования регрессии МНК можно получить

β^=(X'X)1X'y\hat\beta=(X'X)^{-1}X'y

Это точечная оценка коэффициента, и вы можете видеть, какими свойствами он обладает.

Во-первых, этоyyЛинейная комбинация , обладает линейностью, и, кроме того, после наложения некоторых предположений ее условное математическое ожидание представляет собой несмещенную оценку коэффициентов, т.е.E(β^X)=β\mathbb{E}(\hat\beta|X)=\beta, а его дисперсия гарантируется теоремой Гаусса-Маркова наименьшей, что является «СИНИМ» (лучшая линейная несмещенная оценка).

2.2 Качество подгонки

Для соответствия базовые показатели централизованы или децентрализованы.R2R^2.

Для выбора модели, если вы используетеR2R^2В качестве критерия выбора модели очевидно, что чем больше независимых переменных добавляется, тем большеR2R^2будет выше, поэтому необходимо использовать другие показатели. Например, AIC (информационный критерий Akaike), BIC (байесовский информационный критерий), корректировкаR2R^2которыйRˉ2\bar{R}^2И так далее, вы можете выбрать модель.

2.3 Интервальная оценка и проверка гипотез

Если предположитьεXN(0,о2I)\varepsilon|X\sim N(0,\sigma^2 I)о\sigmaнеизвестно), тоβ^\hat{\beta}Он также соответствует нормальному распределению, поэтому можно получить его интервальную оценку. Но получение его интервальной оценки не является нашей конечной целью, наша конечная цель состоит в том, чтобы проверить, например,Rβ=rR\beta=rRRзаJ×KJ\times Kматрица) выполняется ли такое предположение.

Из статистических знаний можно построить такую ​​квадратичную форму

(Rβ^r)'()(Rβ^r)о2XхJ2\dfrac{(R\hat\beta-r)'(\cdot)(R\hat\beta-r)}{\sigma^2}|X \sim \chi^2_J

Хотя можно доказать, что приведенная выше формула подчиняетсях2\chi^2раздача, но леваяо2\sigma^2Мы не знаем, поэтому мы не можем использовать приведенную выше формулу для построения статистики.

Одним из решений является использованиеs2=1NKe'es^2=\dfrac{1}{N-K}e'eоценитьо2\sigma^2, можно показать, что эта оценка несмещена, т.е.E(s2X)=о2\mathbb{E}(s^2|X)=\sigma^2, и удовлетворить

(NK)s2о2XхNK2\dfrac{(N-K)s^2}{\sigma^2}|X\sim \chi^2_{N-K}

и

s2 ⁣ ⁣ ⁣ ⁣ ⁣ ⁣ ⁣β^Xs^2 \perp \!\!\!\!\!\!\! \perp \hat{\beta} |X

Следовательно, мы можем построитьFFСтатистика для проверки:

F(Rβ^r)'()(Rβ^r)/Js2FJ,NKF\equiv \dfrac{(R\hat\beta-r)'(\cdot)(R\hat\beta-r)/J}{s^2}\sim F_{J,N-K}

Таким образом, мы можем совместно проверить коэффициент корреляцииJJлинейная гипотеза, просто запишите гипотезу какRβ=rR\beta=rв виде . Если нужно проверить только одну гипотезу, т.J=1J=1, то потому чтоF1,qtq2F_{1,q}\sim t^2_q, поэтому статистику можно преобразовать вttраспространение, напрямуюttПросто проверьте.