Участвуйте в 8-м дне Ноябрьского испытания обновлений, узнайте подробности события:Вызов последнего обновления 2021 г.
В настоящее время я написал несколько, с которыми я столкнулся, и я добавлю их позже, когда столкнусь с ними. Долгосрочное обновление.
L2 loss
Среднеквадратичная потеря
фронтЭто позволит вам отменить, когда вы ищете вывод.
-
зеленый
-
Розовый - четверичная функция, т.е.Следуйте нормальному распределению (распределение Гаусса)
-
Желтый — это градиент функции потерь, линейная функция, проходящая через начало координат. Во время градиентного спуска параметры обновляются в направлении отрицательного градиента. Таким образом, производная определяет, как градиентный спуск обновляет параметры. Когда прогнозируемое значение далеко от фактического значения, градиент относительно велик, и диапазон обновления параметра также велик.Когда градиент уменьшается, диапазон обновления параметра также становится все меньше и меньше.
Это нехорошо, может быть, мы не хотим кардинально обновлять параметры, когда находимся далеко от дальней точки.
L1 loss
Функция потери абсолютного значения
- фиолетовый
- синий - его четвертичная функция
- Зеленый — это градиент, а интервал равен ±1. Обновления веса стабильны, но не могут быть получены в нуле и могут быть нестабильны в конце оптимизации.
Huber's Robust loss
Потеря Хаббла
Сочетает в себе преимущества первых двух.
Когда разница между прогнозируемым значением и фактическим значением относительно велика, используется ошибка абсолютного значения за вычетомдля соединения изображений. Квадрат ошибки используется, когда прогнозируемое значение близко к истинному значению.
Таким образом, веса могут обновляться равномерно, когда расстояние относительно большое, а градиент становится все меньше и меньше в конце оптимизации, и оптимизация становится более плавной.