2 Структура обучения PAC (стр. 26)

машинное обучение

2.4.3 Ошибки оценки и аппроксимации

ПредположениеhеHч е НРазницу между ошибкой и байесовской ошибкой можно разложить следующим образом:

R(h)R*=(R(h)R(h*))оценить+(R(h*)R*)приближение,(2.25)R(h)-R^*=\underbrace{(R(h)-R(h^*))}_{оценка}+\underbrace{(R(h^*)-R^*)}_{приближение }, (2.25)

вh*h^*даHHГипотеза с наименьшей ошибкой или лучшая в своем классе гипотеза.
Второй член называется ошибкой аппроксимации, потому что он измеряет использованиеHHСтепень байесовской ошибки может быть аппроксимирована. это набор гипотезHHСвойство является мерой его богатства. Из-за основного дистрибутиваDDОбычно неизвестна, поэтому ошибка аппроксимации недоступна. Оценить ошибки аппроксимации сложно даже при различных предположениях о шуме.
Первый член - это ошибка оценки, которая зависит от выбранных допущений.hh. взвешивает предположенияhhКачество относительно лучших в своем классе гипотез. Определение независимого обучения PAC также основано на ошибке оценки. алгоритмAAОшибка оценивания , т. е. в выборкеSSГипотезы вернулись после обученияhsh_sОшибка оценки , иногда может быть ограничена ошибкой обобщения.
Например, пустьhSERMh^{ERM}_Sпредставляет собой гипотезу, возвращенную алгоритмом минимизации эмпирического риска, то есть гипотезу, возвращенную с наименьшей эмпирической ошибкой.hSERMh^{ERM}_Sалгоритм. Тогда теорема2.22.2или любой другой предметsuphеHR(h)R^(h)sup_{h\in H}|R(h)-\widehat R(h)|Установленные ограничения обобщения можно использовать для ограничения ошибки оценивания алгоритма минимизации эмпирического риска. Фактически, переписав ошибку оценки так, чтобыR^(hSERM)\widehat R(h^{ERM}_S)появляться, и использовать определенные по алгоритмуR^(hSERM)R^(h*)\widehat R(h^{ERM}_S)\leq\widehat R(h^*), мы можем написать

R(hSERM)R(h*)=R(hSERM)R^(hSERM)+R^(hSERM)R(h*)R(hSERM)R^(hSERM)+R^(h*)R(h*)2suphеHR(h)R^(h).(2.26)\begin{aligned} R(h^{ERM}_S)-R(h^*)& =R(h^{ERM}_S)-\widehat R(h^{ERM}_S)+\widehat R(h^{ERM}_S)-R(h^*)\\ & \leq R(h^{ERM}_S)-\widehat R(h^{ERM}_S)+\widehat R(h^*)-R(h^*)\\ & \leq 2\underset {h\in H}{sup}|R(h)-\widehat R(h)|.(2.26) \end{aligned}

3.3.когдаHHявляется конечным набором предположений,h*ч ^ *должны существовать, иначе в этом обсужденииR(h*)Р (ч ^ *)Можно использоватьinfhеHR(h)заменятьinf_{h\in H}R(h) вместо этого.