Примечания к машинному обучению 5 — Опорные векторные машины 2

искусственный интеллект

1. Отображение малой размерности в многомерное

Согласно заключению предыдущего раздела, в основном нам нужно решить линейно-разделимую задачу, и линейно-разделимая задача будет окончательно преобразована в задачу о выпуклых функциях, которая считается разрешимой. Но не всякая проблема линейно отделима. Столкнувшись с линейно неразделимой проблемой, мы можем отобразить младшие измерения в большие. Например, чтобы сопоставить два измерения с тремя измерениями:
При увеличении размерности M признакового пространства размерность соответствующих оцениваемых параметров (ω, b) также будет увеличиваться, а также будет увеличиваться степень свободы всей модели, и с большей вероятностью будет выделяться низкоразмерные данные. Проблема здесь изменена с линейной неразделимости на то, как найти φ (x), чтобы завершить преобразование малой размерности в многомерное.

2. Функция ядра

Чтобы решить указанную выше проблему нахождения φ(x), вводится новое понятие: функция ядра Функция ядра представляет собой действительное число, φ(x)T, φ(x) — два вектора одинаковой размерности, а поскольку φ(x)T — транспонирование φ(x), два вектора одинаковой размерности равны Внутренний продукт даст число.

Между функцией ядра K и φ(x) существует взаимно однозначное соответствие. Форма функции ядра не может быть выбрана произвольно. Должны быть выполнены следующие два условия (это теорема, просто запомните ее сначала): Теорема Мерсера:

3. Проблема двойственности

Оригинальный вопрос:

Двойное определение проблемы:

Теорема первая:

Разрыв двойственности: Разница между основной проблемой и двойной проблемой заключается в двойном разрыве.

Сильная теорема двойственности:Если целевая функция исходной задачи — выпуклая функция, если ограничение — линейная функция, то решение исходной задачи и решение двойственной задачи совпадают.

ккт условие:

Суммировать:

1. Во-первых, поскольку во многих случаях невозможно напрямую достичь линейной разделимости, существует отображение малой размерности в многомерное для решения ситуации, когда статус линейно неразделим, преобразован в многомерный и становится линейно разделимым, и затем используйте линейно разделимый способ решения проблем
2. Ключом к отображению из малой размерности в большую является нахождение φ(x)Tφ(x), введение функции ядра K(x1,x2) вместо φ(x)Tφ(x), а затем обсуждение функция ядра и φ( x)Tφ(x) имеют взаимно однозначное соответствие, пока вы знаете одну из них, вы можете преобразовать ее в другую форму, и мы говорили о Теорема Мерсера.
3. Говоря о двойной проблеме, преобразуя минимальное значение исходной задачи в максимальное значение, доказывая, как получена двойная проблема, и расширение двойного зазора, сильной теоремы двойственности, условия KKT и другие концепции.