СегодняТемы машинного обученияВ 33-й статье мы продолжаем рассказывать о модели SVM.
В предыдущей статье мы подтолкнули к выводу формулы модели SVM в линейно разделимой задаче и в итоге пришли к выводу, что это квадратичный член с неравенством:
Для студентов, которые хотят понять конкретный процесс деривации, вы можете обратиться к моей предыдущей статье:
Машинное обучение | Подробный принцип SVM и построение модели (1)
На самом деле в предыдущей статье осталась проблема, то есть мы надеемся получитьМинимум, почему бы напрямую не попроситьМинимум, не требуетсяСамый маленький? Причина заключается в его решении, потому что мы должны преобразовать его вЗадача выпуклого квадратичного программирования(квадратичное программирование). Проблема QP также является очень важной областью компьютерных наук, и это также более сложная область, поскольку она требует глубоких знаний компьютеров и математики.
Я лично считаю, что он не очень тесно интегрирован с реальным машинным обучением и инженерией, В настоящее время он в основном используется при выводе принципа модели SVM, поэтому мы можем понять только принцип формулы, используемой SVM.
Процесс решения
В задаче QP на самом деле есть специальный пакет расчета QP, который умеет находить его экстремальное значение, я использовал его раньше, но это не единственное решение, и у этого решения есть большой недостаток, которыйНет возможности применить функцию ядра. Поэтому мы обычно не используем метод планирования QP для решения.
Когда мы смотрим на исходную формулу, естественно возникает ощущение, что эти неравенства раздражают. Мы хотим устранить это неравенство, и есть способ, используяМетод множителей Лагранжапреобразовать цель оптимизации с ограничениями в функцию оптимизации без ограничений.
Давайте посмотрим на процесс использования метода множителей Лагранжа, учитывая проблему ограничения неравенства:
Для этой, казалось бы, сложной системы уравнений введем обобщенную функцию Лангранжа и перепишем ее следующим образом:
Эта формула выглядит проще, чем приведенная выше система уравнений, но какой от нее толк? Мы просто проанализируем его, мы найдем. так как,и. Итак, сложив два вместе,,когдаКогда L может принимать максимальное значение, то. Итак, о чем мы просим.
А так как цель нашего запросаминимальное значение , наша конечная цель.
двойная проблема
Далее мы поговорим о знаменитомдвойная проблемаИтак, так называемая проблема двойственности — это по существу обратный порядок неравенств уравнения с двумя неравенствами. Пучокпревратиться в, но проблема в том, что положение знака неравенства заведомо важно, а порядок нельзя изменить произвольно, поэтому нам нужно доказать, что это изменение верно.
Для удобства запишем исходную задачу в виде, мы определяемиСвязанные уравнения:. Правая часть этого уравнения представляет собой минимизацию функции Лагранжа, потому что после определения x результат уравнения будет таким же, как иа такжесвязаны, так что этоиФункция.
Максимизируем эту функцию:
Не знаю, выглядит ли эта формула знакомой, потому что она очень похожа на исходную задачу, которую мы только что вывели.Просто положение знака неравенства другое. Почему мы перечисляем эти два уравнения? Конечно не ради забавы, а в основном чтобы получить вот такое неравенство:
Мы можем легко доказать эту формулу, переопределив уравнение Лагранжа:
Если мы хотим заменить исходную задачу на двойственную, нам нужно взять указанный выше знак неравенства. Математики уже строго доказали равенство условий уравнения Лагранжа, и нужно только удовлетворитьУсловие Каруша-Куна-Таккера(называемое состоянием КТТ). Условный вывод КТТ тоже очень сложный процесс, нам не нужно делать глубоких исследований, нужно только знать о его существовании.
Условий КТТ так много, кажется, что многие не сложные.
Сравниваем условия КТТ для решенияМинимальное значение , это часть средней школы математики. Сначала упростим исходную формулу:
Правильно сноваиСделайте вывод:
Получаем путем выводаиотношения, то есть до тех пор, пока мы определяемЭто уж точно, и мы можем волшебным образом обнаружить, что в приведенной выше формуле нет b, что указывает на то, что b было исключено нами. Когда мы берем экстремальное значение, полученное из приведенного выше вывода,иПодставить в исходную формулу, исключитьи, вы можете получить:
Если мы будем соблюдать эту формулу, мы найдемОба x и y являются фиксированными значениямиОпределяется выборкой, единственной переменной является только. Что нам нужно, так это максимальное значение приведенной выше формулы, единственная переменная, проситьможно вывести в соответствии си б.
тогда этоКак попросить об этом? Мы поместим соответствующий контент в следующую статью.
Сегодняшняя статья здесь, если вам понравилась эта статья, пожалуйста, приходите на волнукачество три, поддержите меня (Подписывайтесь, делайте репосты, лайкайте).