О том, почему функция потерь логистической регрессии делает записи в журнале

машинное обучение

Я не думал о деталях раньше, но я только сегодня увидел соответствующую информацию, поэтому я записываю ее.

LR является обобщенной моделью линейной регрессии.Если используется квадратичная функция потерь, нельзя гарантировать, что расчет вывода сигмовидной функции будет выпуклой функцией.В процессе оптимизации полученное решение может быть локальным минимумом, а не глобальным оптимальное значение. . Второе: после логарифмирования это удобнее для нашего последующего вывода.

А если она рассчитывается непосредственно по функции правдоподобия, то есть два недостатка: (1) она не способствует последующему выводу, и (2) расчет функции правдоподобия приведет к потере значимости.

Таким образом можно понять недополнение.Окончательный расчет является результатом умножения, и значение после каждого расчета очень мало.Если выборок много, это приведет к недозаполнению.