Из приведенного выше объяснения логистической регрессии мы знаем, что прямая операция может вычислять выходной результат, а обратная операция может вычислять градиент или производную для настройки параметров. Состав вычислительного графа выводится с помощью простой формулы операции, что приводит к методам работы прямого распространения и обратного распространения в глубоком обучении.
1. Вычислительный граф и прямое распространение
Гипотетическая функцияВ соответствии с порядком операций, мы делаем,ps Если вы изучаете многомерное исчисление в высшей математике, то следующее содержание может быть аналогом многомерного дифференциального исчисленияПравило цепи, поэтому получается следующая цифра (по сути, форвардный расчет — это процесс расчета распределения):Процесс пошагового расчета проще, и эффективнее будет передать его компьютеру, поэтому эта часть опущена.
2. Вычислить производные и обратное распространение
3. Правила использования символа программирования
Прося совета,Представляет производную конечной выходной переменной по некоторой связанной переменной. При программировании для удобного и единообразного представления этой производной переменной вводится имя переменной:Например,В то же время этот способ записи также позволяет избежать промежуточных переменных.
4. Резюме
- Блок-схема вычислений, которая вычисляет функцию стоимости вперед, функция, которую необходимо оптимизировать
- При вычислении ряда производных наиболее эффективным подходом являетсяВ обратном порядке (счет справа налево), следуйте красной стрелке, шаг за шагом для вывода (цепочка)