Определение 2.4 Независимое обучение PAC
Предполагать является набором гипотез. непостижимоеPACалгоритм обучения, если есть полиномиальная функциясделать для любого и , заВсе раздачи на, следующее относится к любому размеру выборки:
Если A далее запустить в poly(1/ε, 1/δ, n, size(c)) , то он считается эффективным алгоритмом обучения PAC, не зависящим от него.
Когда метка точки может быть определена некоторой измеримой функцией(с вероятностью 1), когда он однозначно определен, сценарий называется детерминированным. В этом случае рассмотрим распределение по входному пространству Будет достаточно. Обучающие выборки получаютсярисоватьполучены и черезПолучите этикетку:для всех. В этом детерминированном сценарии можно сформулировать многие проблемы обучения.
В предыдущих разделах и в большей части материала, представленного в этой книге, мы для простоты ограничили введение детерминированными сценариями. Однако для всего этого материала расширения для случайных сценариев должны быть понятны читателю.
2.4.2 Байесовская ошибка и шум
В детерминированном случае по определению существует целевая функция f:R(h)=0 без ошибки обобщения. В случайных случаях существует минимальная ненулевая ошибка для любой гипотезы
Определение 2.5 Байесовская ошибка
данныйраспространение на, байесовская ошибкаопределяется как измеримая функцияИнфимум полученной ошибки:
Гипотеза h называется байесовской гипотезой или байесовским классификатором.
По определению в детерминированном случае имеем, но в случайных случаяхОчевидно, байесовский классификаторможно определить в соответствии с условной вероятностью как:
существует Средняя ошибка на, что является наименьшей возможной ошибкой. Это приводит к следующему определению шума.
Определение 2.6 Шум
данный распространение на,точка Шум при определяется как
средний шум илиСопутствующий шум.
Таким образом, средний шум — это просто байесовская ошибка:. Шум является характеристикой учебной задачи, указывающей на ее сложность. один пункт , его шумоколо , иногда называемый шумом, безусловно, является проблемой для точных прогнозов.