Анализ основных компонентов PCA
1. Основная идея
Иногда в данных, которые мы получаем, информация между несколькими измерениями может влиять друг на друга, что приводит к тому, что данные одного измерения не являются независимыми и избыточными данными.
На картинке выше,представляет собой линейную корреляцию, т.Когда уверен,распределены не случайным образом. Так же, как рост и вес человека, двумерные данные влияют друг на друга. В настоящее время мы надеемся == сформировать новый базисный вектор посредством линейной комбинации исходного базисного вектора и представить данные в виде нового базисного вектора, чтобы информация могла быть сосредоточена впереди.Размерность, чтобы достичь цели уменьшения размерности ==.
Анализ главных компонент выполняет ортогональное преобразование данных геометрически, то есть ось данных поворачивается и преобразуется, а данные представляются новой осью координат.
При вращении осей переменные в данныхМожно сказать, что она линейно независима, устраняя избыточность данных, и интуитивно мы думаем, что информация сосредоточена визмерение, с данными вПроекция на него заменяет исходные данные для анализа данных с целью уменьшения размерности.
Итак, пока проблему можно разделить на два этапа:
- Представление данных и преобразование базиса
- Выбор оптимального базисного вектора
2. Представление данных и преобразование базиса
2.1 Умножение матриц
Матрица обеспечивает представление для систем линейных уравнений
Это также является источником правила умножения матриц «первая матрица умножается на строку, а вторая матрица умножается на столбец по порядку».
2.2 Представление данных и представление базисного вектора
По соглашению базисный вектор представляется в виде вектора-строки, например:
Данные обычно记录
существуют в виде:
{ "身高": 180, "体重":180, "年龄": 18 }
По привычке данные представляются в виде вектора-столбца, например:
При этом, чтобы упростить последующий расчет дисперсии, данные обычно сначала деусредняются.
Необработанные данные, о которых мы поговорим позже, относятся к результату после деусреднения данных.
2.3 Базовое преобразование
Представление данных связано с используемым базовым вектором.Например, базовый вектор исходных данных в двух измерениях равен, при использовании других базисных векторов важные свойства векторного скалярного произведения: A与B的内积 = A到B的投影长度 × |B|。
Когда модуль базисного вектора равен 1, исходные данные и базисный вектор перемножаются для получения координат после преобразования данных. как
представлять данныев базисном вектореНовые координаты
== с вектором-строкойпредставляет базисный вектор, вектор-столбецПредставляя одни данные, базисное преобразование для нескольких наборов данных может быть выражено единообразно путем матричного умножения ==.
Новые координаты: (Примечаниевсе матрицы)
Теперь, когда мы нашли метод получения соответствующего представления данных во время преобразования базиса, следующим шагом является анализ группы базисных векторов.Оцените, чтобы найти оптимальный набор базисных векторов.
3. Оценка базового вектора
Мы надеемся использовать раньшеизмерения представляют данные и сохраняют информацию, необходимоПредставление размеров максимально приближено к исходному представлению данных.
Отражаясь на графике, начало координат представляет собой исходные данные (двумерные), а крест представляет данные (одномерные) после базисного преобразования и уменьшения размерности. Мы надеемся, что крест находится как можно ближе к началу координат, и мы также надеемся, что пересечение будет как можно дальше друг от друга, потому что перекрытие выборок также приводит к избыточности данных.

3.1 Дисперсия
Согласно теореме Пифагора расстояние от точки до начала координат постоянно (гипотенуза остается неизменной), одна из двух других прямоугольных сторон увеличивается, а другая уменьшается.Можно использовать степень разделения креста , то есть расстояние одной из прямоугольных сторон Длина измеряет наш базисный вектор. Таким образом, мы берем среднее значение суммы дисперсий данных (помните, что мы усреднили данные) в качестве стандарта, то есть для первогоразмер, надеюсь максимизировать
из которых- координаты после преобразования базы.
3.2 Ковариация
Мы используем дисперсию для представления степени дисперсии нескольких наборов данных в одном измерении и количества информации об удержании данных.Для многомерных данных мы используем ковариацию для представления корреляции между измерениями данных и измерениями. Чтобы сделать связь между переменными линейной, наша цель состоит в том, чтобы сделать, то есть дляРазмер и Диизмерения, мы хотим сделать следующее уравнение равным
из которыхУказывает 1-е измерение, 2-е измерение.
3.3 Ковариационная матрица
Мы хотим объединитьПредлагаемая цель оптимизации, этим инструментом является ковариационная матрица. в соответствии св виде матрицы данных. заКусокразмерные данные
Например, 3 2D-данные

Используя ковариационную матрицу, цель оптимизации теперь очень ясна Нам нужно сделать все элементы преобразованной ковариационной матрицы, кроме диагональной линии, равными 0, и расположить элементы на диагональной линии от большего к меньшему.
Пусть == исходная матрица данныхСоответствующая ковариационная матрица==,представляет собой набор матриц, составленных из строк по базису, пусть,СейчасзаправильноВыполните базовое преобразование данных. ПредполагатьКовариационная матрица, имеет следующую связь
Целью оптимизации становится == найти матрицу, удовлетворять— диагональная матрица, а диагональные элементы расположены в порядке убывания, топервыйРяд — это база для поиска, используйтепервыйматрица строк, умноженная насделатьотразмер внизразмерность и удовлетворяют приведенным выше условиям оптимизации. ==
Это видно из вышеизложенногозаРядстолбец вещественной симметричной матрицы, с помощью линейной алгебры он может найтиединичные ортогональные собственные векторы, пусть этоСобственные векторы, образуя матрицу. но
из которых— диагональная матрица, диагональными элементами которой являются соответствующие собственные значения каждого собственного вектора (могут быть повторения).
На этом этапе мы обнаруживаем, что нашли искомую матрицу.
— матрица собственных векторов ковариационной матрицы, расположенных по строкам после нормализации, где каждая строкавектор признаков . Если установленов соответствии сСобственные значения располагаются от большего к меньшему, а собственные векторы располагаются сверху вниз, затем используйтепервыйМатрица строк умножается на исходную матрицу данных, получаем нужную нам матрицу данных уменьшенной размерности.