Предыдущий«Структура для регрессии МНК для малых выборок»Объясняется основная структура регрессии МНК для малой выборки.Эта статья следует этой структуре, чтобы сделать всесторонний обзор регрессии МНК для малой выборки.
1 предположение
Здесь все гипотезы, которые могут быть использованы в регрессии МНК для небольшой выборки, собраны вместе для удобства просмотра. Конечно, каждый из следующих выводов использует не все допущения, а лишь некоторые из них, которые будут подробно объяснены, когда мы поговорим о каждом выводе позже.
- Допущение 1 Линейность:,впредставляет собой вектор неизвестных параметров, который объединяет всеСоединяя выборки вместе, это можно записать как,вдаматрица;
- Допущение 2. Строго экзогенное:;
- Допущение 3. Несингулярность:не единственное число;
- Допущение 4. Сферический член возмущения:;
- Допущение 5 Условно-нормальный термин возмущения ;
- Допущение 6. Отсутствие приблизительной мультиколлинеарности:когдачас,наименьшее собственное значениеВероятность равна 1.
где предположение 3 эквивалентно. Если предположить, что число 6 встречается только в отдельных данных, это исключает возможность приблизительной мультиколлинеарности. Кроме того, Гипотеза 4 утверждает, что член возмущения не имеет автокорреляции и является гомоскедастичным, Гипотеза 5 включает Гипотезу 4, а Гипотезу 5 нужно только вывестиНеобходимы выборочное распределение и связанные с ним проблемы.
2 Точечная оценка и ее свойства
2.1 точечная оценка
путем решения, легко добраться, когда предположение 3, что является точечной оценкой.
Обозначим остатки линейной регрессии как.
В последующем выводе в основном используется точечная оценкас правдойразности , используя предположение 1, имеем.
2.2 природа
Во-первых,изусловное ожиданиеэквивалентно, т. е. этобеспристрастное условие, используя предположение 4, мы можем получить. Конечно, безоговорочно и беспристрастно.
этоУсловная дисперсияХорошо рассчитанный, по определению и допущению 4,. Если также выполняется предположение 6, то для любогои удовлетворитьвектор, когдачас,. Это означает, что пока нет приблизительной мультиколлинеарности, пока данных достаточно,Дисперсия будет приближаться к 0. Наоборот, если имеет место приблизительная мультиколлинеарность, дисперсию будет трудно восстановить путем сбора данных.
Можно показать, что во всех линейных несмещенных оценкахимеет наименьшую дисперсию, т.Теорема Гаусса-Маркова. Это показывает, что для любой другой линейной несмещенной оценки,Должна быть положительной полуопределенной матрицей.
для неизвестных параметров,Можно использоватьоценщик остаточной дисперсииоценить его. Это также несмещенная оценка, т.е..
3 Распределение выборки и проверка гипотез
3.1 Выборочное распределение
Из-за небольшого размера выборки предположения о распределении члена возмущения имеют решающее значение. Одного допущения 4 недостаточно, необходимо использовать более сильное допущение 5.
С предположением 5 мы можем получитьТакже подлежит условному нормальному распределению:
для любогонеслучайная матрица,имеют
3.2 Качество подгонки
Насколько хорошо модель линейной регрессии соответствует данным? Это может быть выражено в терминах качества подгонки. Следующая формулаДецентрализациявыражение:
Следующая формулацентрализованный, он жерешающий фактор(Коэффициент детерминации):
фактически,этоиКвадрат коэффициента корреляции между:.
3.3 Некоторые вспомогательные выводы и теоремы
Теорема 1 Квадратичная форма нормальной случайной величины размерный случайный вектор,даНеслучайная симметричная идемпотентная матрица ,,но.
Теорема 2 размерный случайный вектор,вдаСимметричная невырожденная ковариационная матрица , затем.
Из теоремы 1 можно получить.
Кроме того,,ииследует совместному нормальному распределению, потому что
И по предположению 5,подчиняются условному нормальному распределению, поэтому приведенная выше формула имеет видЛинейная комбинация , также подчиняетсяявляется условным совместным нормальным распределением. Для совместного нормального распределения некорреляция эквивалентна независимости, поэтомуиданезависимыйиз.
3.4 Проверка гипотез
3.4.1 контрольная работа
мы можем какПроверка гипотезы выполняется на такой нулевой гипотезе, гдезаматрица.
Если нулевая гипотеза верна, то
Из раздела 3.1 мы знаем, что
Снова используя теорему 2, мы можем получить
Из-за распространенияЭто не зависит от, поэтому безусловное распределение приведенной выше формулы также подчиняетсяраспределенный.
Но проблема в томнеизвестна, поэтому приведенная выше формула не может быть рассчитана. Решение заключается в использованииПодставьте его, поэтому после подстановки сделайте небольшую обработку (делите на), мы можем получить другое распределение, т.Статистика:
зачем подчинятьсяраспределяется? можно превратить из молекулы враспределение, разделенное на, знаменательраспределение, разделенное на, переменные в числителе и знаменателеиЭти три условия не зависят друг от друга.
Помните, с другого ракурса- остаток неограниченной регрессии, обозначаемыйбыть ограниченнымОстатки регрессии ниже, затемСтатистику можно записать как
3.4.2 контрольная работа
когдачас,истановится скаляром, и его больше не нужно строить в квадратичной формераспределения, но может напрямую построить форму нормального распределения:
Просто вернитесь к предыдущему разделуЗнаменатель статистики также имеет квадратный корень соответственно, мы можем получитьСтатистика:
так что это может бытьконтрольная работа.