Первый вопрос
Практика линейной регрессии
Мы можем сделать это сначала с помощью линейной регрессии
Сначала создайте данные, обучите их и получите строку
Тогда мы можем вынести решение
тоже можно решить
Но есть и проблема
Когда мы переобучаем модель с этими данными
У него будут проблемы, сложность выборки увеличивается, этот метод может быть не очень хорошим
Поэтому нам нужно использовать новые методы, которые будут изучены逻辑回归
логистическая регрессия
Так что же делать с логистической регрессией?
Мы собираемся подготовить уравнение логистической регрессии
нравится
объяснять
Поскольку мы находимся в этой проблеме классификации, мы сводим проблему классификации к вероятности того, что он принадлежит к определенной категории, тогда, когда вероятность больше 0,5, мы оцениваем его как 1, а когда она меньше 0,5, мы оцениваем его. быть 0.
как это использовать
Используйте эти 3 числа для расчета проблемы сброса воды в бассейне, как упоминалось ранее.
当x = -20的时候
1 + e^20就很大很大了,那么1/(1 + e^20)就非常趋近于0
其他数据带进去算一算,会发现是很贴合现实情况的。
Спуск воды из бассейна можно рассматривать как простую задачу, давайте посмотрим, как решить сложную задачу
сложная проблема
Посмотри на это сначала
Итак, все вышеперечисленное — простые случаи, давайте посмотрим, как сделать что-то посложнее.
Давайте рассмотрим этот вопрос
Мы можем видеть эту классификацию, которую можно разделить на графике прямой линией
Глядя на эту линию, мы видим, что область над линией окрашена в красный цвет, а область под ней — в синий цвет.
Мы можем сначала найти прямую, а затем привести ее в показатель степени e
нравится
Конкретная реализация состоит в том, чтобы сначала найти эту прямую линию
g((x,y)) = y -x - 1
Подставляя данные в уравнение логистической регрессии, можно выяснить, что если точка находится выше линии, показатель степени e будет положительным числом, а если точка ниже линии, показатель степени e будет отрицательным числом. .
Вы обнаружили, что это похоже на предыдущую проблему со сбросом воды?
Посмотрите на эту ситуацию еще раз
Мы такие же, сначала создайте строку, чтобы разделить два типа данных
Разберем, что это круг, центр которого(0,0)
Радиус2
круг
Такg((x,y)) = x^2 + y^2 - 4
Поместите это g (x) в экспоненту e в уравнении логистической регрессии в начале
Можно получить уравнение логистической регрессии для классификации.
унифицировать
Мы называем линию, которая различает, как значение или точка классифицируются, как границу решения модели
в заключении
Решение модели логистической регрессии
Линейная регрессия первого отзыва
Сначала в линейной регрессии мы сначала находим функцию потерь.
Затем, с целью найти точку минимума функции потерь, мы корректируем нашу функцию потерь, учитывая размер шага, выполняем градиентный спуск до тех пор, пока функция не сойдется.
логистическая регрессия
Тогда наш подход к логистической регрессии такой же, сначала найдите функцию потерь
Но для нашей логистической регрессии фактические данные равны 0 и 1. Хотелось бы надеяться, что если прогноз не соответствует действительности, функция потерь должна быть очень большой. Точно так же, если они правы, мы хотим, чтобы это значение было бесконечно близко к 0.
Решение функции потерь
Давайте сначала разберемся с нашей функцией потерь
С помощью этой функции мы решаем ее градиентным спуском
Для этой задачи давайте, тогда мы фактически решаем градиентный спуск для граничной функции. В соответствии с формой различных граничных линий она определяется как функция нескольких юаней, а затем, учитывая данные случайной точки, корректируется в соответствии с направлением и шагом градиента, сохраняется во временных данных и затем найдите следующую точку по сравнению с временными данными, пока два данных не сравняются, чтобы найти значение этого коэффициента. Решение этой регрессионной модели известно.