1 Унарная и множественная регрессия
Любая книга по эконометрике, статистике или машинному обучению начального уровня подробно расскажет о решении множественной линейной регрессии, поэтому я не буду повторяться здесь.
Приведем некоторые настройки, используемые в этой статье.заразмерный вектор зависимых переменных, гипотетический, если независимая переменнаяобъемный, будетоценивается какматрица, где первый столбецдля всехТермин перехвата , мы имеем оценку наименьших квадратов:
Если это одномерная регрессия и член пересечения отсутствует, запишите независимую переменную какразмерный вектор,серединаОценка методом наименьших квадратов
Какая связь между ними? Если в многомерной регрессииВекторы-столбцы ортогональны друг другу, т.е.является диагональной матрицей, то можно сделать вывод, что оценочное значение каждого коэффициента равно.
Это дает нам подсказку, можем ли мы построить некоторые измерения, которые ортогональны друг другу?
2 Процесс Грама – Шмидта
Для расчета используем следующую процедуру:
- ;
- траверс:использоватьправильнокаждогоВыполните одномерную линейную регрессию без точки пересечения соответственно и получите коэффициенты соответственно, и, наконец, получить;
- повторное использованиеправильноВыполните одномерную регрессию без члена перехвата, чтобы получить окончательный результат..
так кактолько впоявляется в и сортогональны, поэтому получаются приведенные выше результаты. как, то предполагаемая дисперсия может быть записана как
Обратите внимание, что каждое измерение может использоваться какизмерение, следовательно, каждыйможно вывести таким образом.
3 QR-разложение
если добавлено,в, поставить всерасстановкаизверхний треугольникматрицапри запоминании, то есть
построить еще одиндиагональная матрица, диагональные элементы,Сейчас, вставьте в середину приведенной выше формулы, то есть
Помните,, что является матрицейизQR-разложение:.
так какВекторы-столбцы ортогональны друг другу, поэтому,иЭто также верхняя треугольная матрица. Используя разложение QR, мы можем записать оценку методом наименьших квадратов как
и имеет установленное значение
так как— верхняя треугольная матрица, а последняя строка,следовательнотакже является верхнетреугольной матрицей, а последняя строка. Повторное использование, мы можем получитьпоследний акт, так что есть
Это также согласуется с результатами, полученными в разделе 2.
использованная литература
- Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. The elements of statistical learning: data mining, inference, and prediction. Springer Science & Business Media, 2009.