Это 10-й день моего участия в августовском испытании обновлений. Узнайте подробности события:Испытание августовского обновления
В этой статье представлены основные значения двухклассовых показателей оценки производительности Precision, Recall, Sensitivity, Specificity, Accuracy, FNR, FPR, TNR, TPR, F1 Score, Balanced F Score в машинном обучении, приведены формулы и конкретные примеры, а также приведены краткий анализ.
основное определение
Метрики оценки |
результат прогноза |
положительный образец |
отрицательный образец |
действительный состояние |
положительный образец |
TP |
FN |
отрицательный образец |
FP |
TN |
Ссылка на конкретное значение и пониманиеМашинное обучение — Основы — TP, FN, FP, TN.
Пример использования
Образец информации
номер образца |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
реальная категория |
P |
P |
P |
P |
P |
P |
P |
N |
N |
N |
> прогноз-1
номер образца |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
категория прогноза |
P |
P |
P |
N |
N |
N |
N |
N |
N |
N |
Метрики оценки |
TP |
3 |
TN |
3 |
FP |
0 |
FN |
4 |
прогноз-2
номер образца |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
категория прогноза |
P |
P |
N |
N |
P |
P |
P |
P |
N |
N |
Метрики оценки |
TP |
5 |
TN |
2 |
FP |
1 |
FN |
2 |
Предсказать-3
номер образца |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
категория прогноза |
P |
P |
P |
P |
P |
P |
P |
P |
P |
P |
Метрики оценки |
TP |
7 |
TN |
0 |
FP |
3 |
FN |
0 |
Precision
переводится как:精确率
,查准率
.
Значение: Предскажите правильную пропорцию всех положительных образцов:
Precision=TP+FPTP
Вариант использования прогнозирования Точность:
PrecisionдоИзмерение1=TP+FPTP=3+03=1
PrecisionдоИзмерение2=TP+FPTP=5+15≈0.83
PrecisionдоИзмерение3=TP+FPTP=7+37=0.7
Можно видеть, что все положительные образцы, оцениваемые по прогнозу 1, верны, поэтому этот прогноз имеет самую высокую точность.
Можно понять, что точность - это доверительная вероятность того, что модель оценивает положительный образец, Чем выше вероятность, тем надежнее положительный образец, оцененный моделью.
FDR (скорость ложного обнаружения)
переводится как:过杀率(工业缺陷)
.
Значение: Отражает долю отрицательных проб в пробах, оцененных детектором как положительные пробы:
FDR=TP+FPFP=1−Precision
Вариант использования прогнозирования FA:
FDRдоИзмерение1=TP+FPFP=3+00=0
FDRдоИзмерение2=TP+FPFP=5+11≈0.17
FDRдоИзмерение3=TP+FPFP=7+33=0.3
Отзыв / Чувствительность / TPR (истинно положительный показатель)
переводится как:召回率
,查全率
,敏感性
,真正率
.
Значение: доля всех положительных образцов, которые были правильно предсказаны, ко всем фактически положительным образцам:
Recall=Sensitivity=TPR=TP+FNTP
Прогнозируемый вариант использования Отзыв / Чувствительность / TPR:
RecallдоИзмерение1=TP+FNTP=3+43≈0.43
RecallдоИзмерение2=TP+FNTP=5+25≈0.71
RecallдоИзмерение3=TP+FNTP=7+07=1
Отзыв и точность рассматриваются с разных точек зрения.Мы не обращаем внимания на модель, чтобы определить, достаточно ли точны положительные образцы, и фокусируемся на доле положительных образцов, выбранных моделью, по отношению ко всем положительным образцам.
Таким образом, простейшая стратегия оценки всех образцов как положительных может обеспечить уровень отзыва 100%, потому что положительные образцы, найденные этой моделью, очень «полные».
Специфичность / TNR (истинно отрицательный показатель)
переводится как:特异度
,真负率
.
Значение: доля всех правильно предсказанных отрицательных выборок по отношению ко всем фактическим отрицательным выборкам:
Specificity=TNR=TN+FPTN
Прогнозирование специфики вариантов использования / TNR:
SpecificityдоИзмерение1=TN+FPTN=3+03=1
SpecificityдоИзмерение2=TN+FPTN=2+12≈0.67
SpecificityдоИзмерение3=TN+FPTN=0+30=0
Подобно воспоминанию, он описывает ситуацию на другой стороне.
FPR (ложноположительный показатель)
переводится как:假正率
,误检率
,虚警概率
.
Значение: количество отрицательных образцов, которые, по прогнозам, будут ошибочно приняты за положительные образцы, составляет долю всех фактических отрицательных образцов:
FPR=FP+TNFP
Прогнозирование варианта использования FPR:
FPRдоИзмерение1=FP+TNFP=0+30=0
FPRдоИзмерение2=FP+TNFP=1+21≈0.33
FPRдоИзмерение3=FP+TNFP=3+03=1
FNR (ложноотрицательный показатель)
переводится как:假负率
,漏警概率
,漏检率
.
Значение: количество положительных образцов, предсказывающих недоразумение, является долей фактических всех положительных образцов:
FNR=FN+TPFN=1−Recall
Прогнозирование варианта использования FNR:
FNRдоИзмерение1=FN+TPFN=4+34≈0.57
FNRдоИзмерение2=FN+TPFN=2+52≈0.29
FNRдоИзмерение3=FN+TPFN=0+70=0
Accuracy
переводится как:正确率
Значение: отношение количества правильно предсказанных выборок к общему количеству выборок во всех экспериментах.
Accuracy=TP+FP+TN+FNTP+TN
Вариант использования прогноза Точность:
AccuracyдоИзмерение1=TP+FP+TN+FNTP+TN=3+0+3+43+3=0.6
AccuracyдоИзмерение2=TP+FP+TN+FNTP+TN=5+1+2+25+2=0.7
AccuracyдоИзмерение3=TP+FP+TN+FNTP+TN=7+3+0+07+0=0.7
На самом деле существует определенная правильная классификация модели на положительные и отрицательные образцы, а модель 3 использовала только стратегию «все образцы должны быть положительными», а не только самый высокий правильный показатель. проблема, но распределение данных не сбалансировано.
В выборке много положительных выборок, и модель для предсказания 3 успешно предсказывает большинство положительных выборок в данных, поэтому стратегия отличается высокой точностью.
Error Rate
переводится как:错误率
Значение: Доля количества выборок с неправильными предсказаниями во всех экспериментах в общем количестве выборок.
Error_Rate=TP+FP+TN+FNFP+FN=1−Accuracy
Вариант использования прогноза Точность:
Error_RateдоИзмерение1=TP+FP+TN+FNFP+FN=3+0+3+40+4=0.4
Error_RateдоИзмерение2=TP+FP+TN+FNFP+FN=5+1+2+21+2=0.3
Error_RateдоИзмерение3=TP+FP+TN+FNFP+FN=7+3+0+03+0=0.3
F1 Score / Balanced F Score
переводится как:F1 分数
/ 平衡F分数
Значение: оценка F1 учитывает точность и полноту модели классификации и определяется как среднее гармоническое точности и полноты модели.
F1Score=2×Precision+RecallPrecision×Recall
Прогнозируемый сценарий использования F1 Score:
F1ScoreдоИзмерение1=2×PrecisionдоИзмерение1+RecallдоИзмерение1PrecisionдоИзмерение1×RecallдоИзмерение1=2×1+731×73=0.6
F1ScoreдоИзмерение2=2×PrecisionдоИзмерение2+RecallдоИзмерение2PrecisionдоИзмерение2×RecallдоИзмерение2=2×65+7565×75≈0.77
F1ScoreдоИзмерение3=2×PrecisionдоИзмерение3+RecallдоИзмерение3PrecisionдоИзмерение3×RecallдоИзмерение3=2×0.7+10.7×1≈0.82