Теорема 2.2 Граница обучения - конечное H, противоречивый случай
Предполагатьпредставляет собой конечное множество гипотез. Тогда для любого, с вероятностью не менее, имеет место следующее неравенство:
доказыватьПредполагатьзаЭлементы. Использование совместной границы и применение следствия 2.2 к каждой гипотезе дает:
- приравнять правую часть кзавершить проверку
Следовательно, для конечного набора гипотез,
Как упоминалось ранее,можно интерпретировать как означающеенеобходимое количество цифр. Здесь можно сделать что-то похожее на комментарии, сделанные по поводу границ обобщения в непротиворечивом случае: больший размер выборкигарантирует лучшее обобщение, и оценка возрастает сувеличивается с ростом, но только логарифмически. Однако предел здесьМенее благоприятная функция , она зависит от квадратного корня члена. Это не маленькая цена: за фиксированную, для получения тех же гарантий, что и в согласованном случае, требуются квадратично большие помеченные выборки.
Обратите внимание, что границы указывают на поиск компромисса между уменьшением эмпирической ошибки и контролем размера набора гипотез: большие наборы гипотез наказываются вторым членом, но могут помочь уменьшить эмпирическую ошибку, первый член. Однако для аналогичных эмпирических ошибок рекомендуется меньший набор допущений. Это можно рассматривать как пример так называемого принципа бритвы Оккама, названного в честь оккамовского теолога Уильяма: множественность не следует предполагать без необходимости или можно переформулировать так: самое простое объяснение является наиболее приемлемым. В этом случае это можно выразить так: при прочих равных чем проще (меньше) набор гипотез, тем лучше.
2.4 Введение
В этом разделе мы рассмотрим несколько важных вопросов, связанных со сценариями обучения, и для простоты опускаем обсуждение предыдущих разделов.
2.4.1 Детерминированные и стохастические сценарии
В самом общем сценарии обучения с учителем распределениеопределено ввыше данные обучения представляют собойОбразцы, отмеченные i.i.d.:
Задача обучения состоит в том, чтобы найти гипотезу с малой ошибкой обобщения.,
Этот более общий случай называется случайным случаем. В этой настройке выходные метки являются вероятностными функциями входных данных. Случайные сценарии охватывают множество практических задач, когда метки входных точек не уникальны. Например, если бы мы пытались предсказать пол на основе входной пары, состоящей из роста и веса человека, метки обычно не были бы уникальными. Для большинства пар возможными полами являются как мужской, так и женский пол. Для каждой фиксированной пары существует распределение вероятности, помеченное как мужской.
PACЕстественное расширение структуры обучения в этой среде называется агностическим.PACучиться.