Анализ главных компонентов (PCA)

искусственный интеллект дизайн Tomcat
Анализ главных компонентов (PCA)

предисловие

Анализ основных компонентов — это статистический метод, который упрощает структуру данных в основном за счет уменьшения размерности, преобразования нескольких переменных в несколько всеобъемлющих переменных, а комплексные переменные могут хорошо выражать большую часть информации исходных множественных переменных.Между переменными должна быть корреляция. , и нет корреляции между переменными после анализа.

Фундаментальный

Простой способ понять это с точки зрения восприятия состоит в том, что, например, есть две переменные, как показано на рисунке ниже. Кажется, что объем информации между ними одинаков. В настоящее время переменная не может быть игнорируется для уменьшения размерности.

Создайте новую систему координат PC1 и PC2.В настоящее время количество информации, содержащейся в PC1, намного больше, чем в PC2.PC2 можно игнорировать, поэтому PC1 можно использовать для представления информации исходных двух измерений для достижения Эффект уменьшения размерности. Аналогия аналогична многомерному случаю.

Для m выборок с n переменными формируется матрица данных порядка m*n,

Если количество переменных n велико, то нам сложно непосредственно наблюдать за этими переменными, чтобы увидеть какие-то показатели.Чтобы облегчить наше наблюдение за показателями, нам нужно уменьшить их размерность, а после уменьшения размерности мы должны отразить исходные содержание максимально возможное количество информации.

Имеется p главных компонент, p

Среди них ПК не имеют ничего общего друг с другом. Руо Линг

но

В это время вектор $A1$ называется загрузкой первого главного компонента, а вычисленное значение является оценкой первого главного компонента. То же самое верно и для других ингредиентов. Суть нашего анализа главных компонент состоит в том, чтобы определить нагрузку исходной переменной на p главных компонент, то есть $a{ij}$, где i=1,2,...,p и j=1,2,...,n. Математически докажите, что $a_{ij}$ является собственным вектором, соответствующим p большим собственным значениям корреляционной матрицы.

Корреляционная матрица

Коэффициент корреляции используется для описания близости корреляции между переменными, Для p переменных матрица корреляции,

Диагональная половина от верхней левой до нижней правой и нижняя половина симметричны, $r{ij}$ представляет корреляцию двух переменных, где (i,j = 1,2,...,p) и $r{ij} = r_{ji}$. Рассчитывается следующим образом:

Как определить ингредиенты

шаг

  1. Расположите необработанные данные в строках, чтобы сформировать матрицу.
  2. Данные нормализованы по стандартному отклонению.
  3. Вычислите матрицу коэффициентов корреляции.
  4. Собственные значения рассчитываются по корреляционной матрице и располагаются в порядке убывания.
  5. Вычислите собственные векторы каждого собственного значения и потребуйте
    .
  6. Рассчитайте ставку взноса и кумулятивную ставку взноса каждого основного компонента и, как правило, выберите p основных компонентов с совокупной ставкой взноса более 85%.
  7. Получены собственные векторы, соответствующие p главным компонентам, и получена нагрузка каждого главного компонента.

Ниже приведенырекламировать

========Время рекламы========

Моя новая книга «Анализ дизайна ядра Tomcat» продана на Jingdong, нуждающиеся друзья могут перейти кitem.JD.com/12185360.Контракт…Зарезервировать. Спасибо друзья.

Зачем писать «Анализ проектирования ядра Tomcat»

=========================

Добро пожаловать, чтобы следовать: