Народное машинное обучение — метод оптимизации — метод Ньютона
@[toc]
Введение
Метод Ньютона, английское название BFGS, является одним из наиболее эффективных методов решения задач нелинейной оптимизации.
Функции
- Быстрая сходимость;
Способ
- Метод Ньютона представляет собой итерационный алгоритм, на каждом шаге которого необходимо решить целевую функциюМатрица ГессеОбратная матрица , вычисление более сложное (метод квазиньютона будет объяснен позже, а метод квазиньютона упрощает этот процесс, аппроксимируя обратную матрицу или матрицу Гессе матрицы Гессе положительно определенной матрицей.
анализировать
Рассмотрение задач неограниченной оптимизации
вточка минимума целевой функции. Предполагая, что f(x) имеет непрерывную частную производную второго порядка, если значение k-й итерации равно, то f(x) может бытьРядом выполняется разложение Тейлора второго порядка:
- - вектор градиента f (x) взначение .
- - матрица Гессе функции f (x)существуетзначение .
Вот подробное объяснение матрицы Гессе в расширении Тейлора и временное объяснение расширения Тейлора бинарной функции.
Затем продолжаем, необходимым условием для того, чтобы функция f(x) имела экстремальное значение, является то, что первая производная в точке экстремального значения равна 0, то есть вектор градиента равен 0. особенно когдаКогда это положительно определенная матрица, экстремальное значение функции f (x) является минимальным значением, поэтому:
Производная по f(x), тогда
но илив Вывод этой формулы завершен
алгоритм
Вход: целевая функция f(x), градиент, матрица Гессе H(x), требование точности ε; Выход: точка минимума x^* функции f(x);
- взять начальное значение точки, к=0;
- рассчитать
- как, затем останавливаем расчет и получаем решение
- рассчитать, и решить для
5. Итерация,, запросить k++, перейти к шагу 2;