Несколько способов нормализации данных в машинном обучении

машинное обучение

Введение

Нормализация также называется нормализацией на английском языке, включает в себя несколько распространенных методов преобразования данных и имеет большое количество приложений в статистике и машинном обучении.

2. Несколько способов нормализации

1.Rescaling (min-max normalization)

x*=xminmaxminx^*= \frac{x - min}{max -min}

Нормируйте распределение на интервал [0,1].

2.Mean normalization

x*=xmeanmaxminx^*= \frac{x - mean}{max -min}

3.Standardization (Z-score Normalization)

x*=xmeanstdx^*= \frac{x - mean}{std}

4.Scaling to unit length

x*=xxx^*= \frac{x}{||x||}

3. Пример нормализации

1. Нормальное распределение

1.1 Нормальное распределение со средним значением 1 и дисперсией 3

1.2 Rescaling

1.3 Mean normalization

1.4 Standardization

2. Произвольное распространение

2.1 Произвольное распространение

2.2 Rescaling

2.3 Mean normalization

2.4 Standardization

4. Резюме

1. Масштабирование гарантирует, что диапазон преобразованных данных составляет [0,1]

2. Средняя нормализация и стандартизация могут гарантировать, что среднее значение преобразованных данных равно 0.

3. Параметры распределения после преобразования Стандартизации могут измениться, но тип распределения не изменится, и это не обязательно нормальное распределение (недоразумение).

5. Ссылка

Feature_scaling-wiki

Normalization-wiki

Standard_score

Стандартизация и нормализация, не путайте, разбирайтесь в преобразовании данных досконально