2 Структура обучения PAC (стр. 20 21)

машинное обучение

Пример 2.4 формула k-терминальной ДНФ

Формула дизъюнктивной нормальной формы (ДНФ) — это формула дизъюнкции нескольких терминов, каждый из которых является конъюнкцией логических литералов.kkТермин ДНФ определяется выражениемkkФормула ДНФ для дизъюнктивного определения терминов, каждый термин определяется не более чемnnБулев литерал. Следовательно, дляkзнак равно2к=2иnзнак равно3п=3, пример k-членной ДНФ:(x1x2x3)(x1x3)(x_1∧ \overline x_2∧ x_3)∨ (\overline x_1∧ x_3).
kkчлен формулы ДНФCCЯвляются ли классы PAC изучаемыми? Мощность класса3nk3^{nk}мощности, так как каждый член не болееnnконъюнкцию переменных и имеют3n3^nтакое соединение, как было замечено ранее. набор гипотезHHдолжен содержатьCCдля достижения согласованности, поэтомуH3nk|Н|≥ 3^{нк}. Теорема 2.1 дает следующую оценку сложности выборки:

m1ϵ((log3)nk+log1δ),(2.12)m\ge\frac{1}{\epsilon}\big((log3)nk+log\frac{1}{δ}\big),(2.12)

Это полиномиальное. Однако можно показать, что проблема обучения k-членной ДНФRPRPсередина,RPRPэто класс сложных задач, которые позволяют решать стохастические решения за полиномиальное время. Следовательно, еслиRP=NPRP=NP, в противном случае проблема неразрешима с вычислительной точки зрения, что обычно считается не так. Следовательно, хотя размер выборки, необходимый для изучения формулировки k-терминальной ДНФ, является только полиномиальным, если толькоRP=NPRP=NP, иначе эффективное обучение таких ПАК невозможно.

Пример 2.5 Формула k-CNF

Формула конъюнктивной нормальной формы (CNF) представляет собой конъюнкцию дизъюнкций. Формула k-CNF:T1...TjT_1∧ ... ∧T_jвыражения вида произвольной длиныjеNj∈N, и каждый терм представляет собой дизъюнкт не более чем k булевых свойств. Задача изучения формулы k-CNF может быть сведена к проблеме изучения связей булевых литералов, которая, как упоминалось ранее, является PAC-обучаемым классом понятий. Для этого просто поместите каждый элементTiT_iПросто свяжите его с новой переменной. Затем это можно сделать с помощью следующей биекции:

ai(xi)...ai(xn)Yai(xi),...,ai(xn),(2.13)a_i(x_i)∨...∨a_i(x_n)\стрелка вправо Y_{a_i(x_i),...,a_i(x_n)}, (2.13)

В формулеai(xj)а_я (х_j)выраженный вTiT_iпара предметовxix_iназначение. Это упрощение обучения PAC для логических литеральных соединений может повлиять на исходное распределение, но это не проблема, поскольку в структуре PAC не делается никаких предположений о распределении. Следовательно, обучаемость PAC булевой литеральной связи подразумевает обучаемость PAC формулировки k-CNF.
Однако это неожиданный результат, поскольку любая k-членная формула ДНФ может быть записана как формула k-КНФ. Фактически, используя ассоциативность, k-членная ДНФ может быть переписана как формула k-CNF:

i=1kai(xi)...ai(xn)=i1,...,ik=1na1(xi1)...ak(xik).\bigvee ^k_{i=1}a_i(x_i)\wedge...\wedge a_i(x_n)=\bigwedge ^n_{i_1,...,i_{k}=1}a_1(x_{i_1})\vee...\vee a_k(x_{i_k}).

Чтобы проиллюстрировать это переписывание в конкретном случае, обратите внимание, например, на

(u1u2u3)(v1v2v3)=i,j=13(uivj)(u_1\wedge u_2\wedge u_3)\vee (v_1\wedge v_2\wedge v_3)=\bigvee ^3_{i,j=1}(u_i\vee v_j)

Однако, как мы видели ранее, формулировка DNF с k-терминами не является действительным обучаемым PAC! Чем можно объяснить это кажущееся несоответствие? Заметим, что количество новых переменных, необходимых для записи k-членной ДНФ в виде формулы k-КНФ с помощью только что описанного преобразования, экспоненциально по k,O(nk)O(nk). Разница заключается в размере представления концепта. Формулировка DNF с k-членом может быть экспоненциально более компактным представлением, и если требуется полином временной сложности такого размера, эффективное обучение PAC становится невозможным. Таким образом, этот очевидный парадокс включает в себя ключевые аспекты обучения PAC, в том числе стоимость представления концепции и выбор наборов гипотез.