Это 12-й день моего участия в августовском испытании обновлений. Узнайте подробности события:Испытание августовского обновления
Метод оценки модельного эффекта
Разделены на проблемы прогнозирования и проблемы классификации
-
Каковы обычно используемые методы оценки для прогнозирования проблем?
MSE (среднеквадратическая ошибка) [Mean Squared Error]:РазнообразиеСтепень - меньше - тем точнее модель
Ожидаемое значение (оценка параметра - истинное значение параметра)²MSE = Σ(расчетное значение - истинное значение)²/N
RMSE (среднеквадратичная ошибка): Арифметический квадратный корень из среднеквадратичной ошибки
MAE (средняя абсолютная ошибка): Среднее значение абсолютной ошибки Фактическая ошибка предсказанного значения
-
Каковы обычно используемые методы оценки для задач бинарной классификации? Проблемы классификации: двухклассовые и многоклассовые проблемы
Задача двух классов:
-
Объясните точность и полноту — важные показатели оценки для бинарной классификации
Точность: Точность - количество положительных и фактических положительных случаев / количество положительных случаев - TP/(TP+FP)
Уровень отзыва: Уровень отзыва — количество положительных примеров, которые оцениваются как положительные примеры, и фактическое количество положительных примеров/количество фактически всех положительных примеров — TP/(TP+FN)
N (отрицательный отрицательный образец) | P (положительный положительный образец) | |
---|---|---|
F (ошибка ложного предсказания) | FN - Предсказание было N, но предсказание было неверным | FP - Предсказание было P, но предсказание было неверным |
T (Истина предсказывает правильность) | TN - предсказание равно N, предсказание верно | TP- Результат прогноза P, результат прогноза правильный |
Кривая PR — график для визуализации точности и полноты модели — исправление одной метрики и улучшение другой.
-
Кратко объясните правильную скорость и объясните разницу между правильной скоростью и точностью
Правильная скорость: оценка правильного числа - (TP + TN) / (TP + TN + FP + FN) - с учетом как положительных, так и отрицательных прогнозов выборки.
Чаще используется точность
-
Объясните точность и напоминание кратким языком или с примерами
Полиция ловит воров: сосредоточьтесь на ворах - образцы воров как положительные примеры
Точность: процент пойманных воров
Уровень отзыва: процент всех пойманных воров.
ROC-кривая: Частота отзыва — FPR (частота ложных срабатываний): TP/TP+FN
Коэффициент точности - TPR (истинный положительный показатель): TP/TP+FP
-
Краткое введение в понятия ROC и AUC и взаимосвязь между ними
Кривая ROC должна проходить через две точки (0, 0) и (1, 1), и на этом основании максимизировать площадь, охватываемую кривой - AUCAUC — показатель эффективности модели бинарной классификации.
-
Каковы методы оценки для задач множественной классификации?
- Проблема с несколькими классами - проблема с двумя классами - в качестве положительного примера используется наиболее интересующая классификация, а в качестве отрицательного - кривая PR.
- Матрица путаницы - 22 Матрица, соответствующая прогнозируемому значению и фактическому результату, расширяется - nn матрица - количество n категорий
Диагональ - правильный результат
В задаче мультиклассификации - если вы уделяете особое внимание определенной классификации - конвертируйте в две классификации - если вы ориентируетесь на общий классификационный эффект модели - описание правильной скорости
Бинарная классификация: частный случай многоклассовых задач