Это 25-й день моего участия в ноябрьском испытании обновлений. Узнайте подробности события:Вызов последнего обновления 2021 г.
Расчет моделирования AN (переменная нормализация)
Сначала мы устанавливаем некоторые матрицы и параметры
A0b0Λqα=⎣⎢⎡0.20.9000.100.801⎦⎥⎤=⎣⎢⎡0.500.5⎦⎥⎤=⎣⎢⎡0.80.10.1⎦⎥⎤=1,d=1
Чтобы немного объяснить,A0Согласно оригинальному описанию алгоритмаnПутем объединения предсказанных распределений вероятностей выборок с относительно высокой достоверностью можно увидеть, что только 3 выборки имеют относительно высокую достоверность, а их предсказанные категории равны 2, 0 и 2 соответственно;b0является образцомxПрогнозируемая вероятность , поскольку это распределение вероятностей, сумма должна быть равна 1;Λqпредставляет собой выборочное соотношение трех категорий, видно, что первая категория имеет много данных
Во-первых, это нормализация столбцов.
ΛSSd=D(L0Te)=D(⎣⎢⎢⎢⎡0.20.900.500.1000.8010.5⎦⎥⎥⎥⎤T⎣⎢⎢⎢⎡1111⎦⎥⎥⎥⎤)=D(⎣⎢⎡1.60.12.3⎦⎥⎤)=⎣⎢⎡1.60.12.3⎦⎥⎤=L0ΛS−1=⎣⎢⎢⎢⎡0.20.900.500.1000.8010.5⎦⎥⎥⎥⎤⎣⎢⎡1/1.6101/2.3⎦⎥⎤=⎣⎢⎢⎢⎡1/89/1605/1601008/23010/235/23⎦⎥⎥⎥⎤
Посмотрите внимательно на матрицуSd, это в сумме 1 для каждого столбца, то есть нормализация столбца, если мы вернемся к источнику, на самом делеSdэтоL0просуммируйте каждый столбец, затем поставьтеL0Разделите каждый элемент столбца на эту сумму
с последующей нормализацией строк
ΛLL1=D(⎣⎢⎢⎢⎡1/89/1605/1601008/23010/235/23⎦⎥⎥⎥⎤⎣⎢⎡0.80.10.1⎦⎥⎤⎣⎢⎡111⎦⎥⎤)=D(⎣⎢⎢⎢⎡31/23011/201/2325/92⎦⎥⎥⎥⎤)=⎣⎢⎢⎢⎡31/23011/201/2325/92⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡230/3120/112392/25⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡1/89/1605/1601008/23010/235/23⎦⎥⎥⎥⎤⎣⎢⎡0.80.10.1⎦⎥⎤=⎣⎢⎢⎢⎡23/319/11023/2502/11008/31012/25⎦⎥⎥⎥⎤
нам просто нужноL1последняя строкаb1=[23/2502/25]T, видно что оригиналb0Распределение вероятностей[0.500.5]T, категория после «предварительной» корректировки явно смещается в сторону первой категории с большим количеством данных, иb1Сумма векторов равна 1, что соответствует определению вероятности