напиши первым
Объяснений по алгоритму БП в интернете много, лишнюю статью писать не надо, но всегда хочется быстро просмотреть перед собеседованием, а письменной информации нет. Эта статья направлена на то, чтобы извлечь чистый процесс вывода, но объяснить слишком много, чтобы основные друзья могли быстро пройти интервью.
абстрагироваться от проблемы
данный тренировочный наборВ качестве примера возьмем сеть прямой связи с одним скрытым слоем, как показано на рисунке выше:
Введите появившиеся параметры:
- Количество нейронов во входном слое
- Количество нейронов в выходном слое
- Нейроны скрытого слоя
- выходной слойпорог нейрона
- скрытый слойпорог нейрона
- входной слойнейроны и скрытые слоивеса связей нейронов
- скрытый слойнейрон и выходной слойвеса связей нейронов
- скрытый слойвыход нейрона
- скрытый слойвход в нейрон
- выходной слойвход в нейрон
Внедрить основное содержание оптимизации
На рисунке выше показана простейшая модель нейронной сети для одного нейрона, также известная как «модель нейрона MP». Эту модель можно рассматривать как наименьшую единицу нейронной сети. Мы ориентируемся на этот порог, нейронный выход, модель выводит результат классификации, так что этоЭто также напрямую влияет на результаты классификации. Обучение нейронной сети — это обновление весов соединений, поэтому обучение весов соединений не нужно объяснять. Сам порог также можно использовать в качестве веса для фиктивного узла со значением -1. Итак, наш алгоритм BP обученОсновным содержанием является вес связи нейронов и порог нейронов.
Процесс обучения алгоритму АД
- Уточнить функцию потерь и стратегию настройки параметров
пара образцов, предполагая, что выход нейронной сети,который
сеть в образцесреднеквадратическая ошибка на
Стратегия настройки - градиентный спуск:
- Вычислить порог выходного слояградиент
прямой удар, прямой удар, используя цепное правило:
Из предыдущей формулы можно вычислить:
Поскольку функция активации является сигмовидной функцией, производная может быть выражена в виде произведения следующим образом:
Так что есть
- Рассчитать веса соединения от скрытого слоя к выходному слоюградиент
прямой удар,прямой удар,прямой удар, используя цепное правило, поэтому мы имеем:
Поскольку функция активации является сигмовидной функцией
Зависит отОпределение показывает, что:
Комплексно найти:
- Рассчитать порог скрытого слояградиент
Оказывать воздействие, прямой удар, то есть:
- Подведите итоговый результат
В более широком смысле в многоуровневой прямой сети пороговый градиент скрытого слоя выражается как пороговый градиент m-го уровня., выход нейронов в скрытом слое выражается как выход нейронов в слое m, вес соединения между скрытым слоем и выходным слоем выражается как вес слоя m+1, пороговый градиент выходного слоя выражается как пороговый градиент слоя m+1. Тогда пороговый градиент скрытого слоя может быть выражен как:
Видно, что в процессе настройки порогаПороговый градиент текущего слоя зависит от порогового градиента следующего слоя, в этом суть алгоритма БП, то же самое:
знать,Градиент веса соединения текущего слоя зависит от порогового градиента нейронов в текущем слое и выхода нейронов в верхнем слое..
Преимущества и недостатки алгоритма BP
преимущество
- Способность адаптироваться и учиться самостоятельно. Это основа алгоритма BP и его преимущества.Алгоритм BP постоянно корректирует параметры в нейронной сети в соответствии с заданными правилами обновления параметров для достижения наиболее желаемого результата.
- Он обладает сильной способностью нелинейного отображения.
- Строгий процесс вывода. Процесс обратного распространения ошибок использует уже очень зрелый цепной метод, а процесс его вывода является строгим и научным.
- Сильная способность к обобщению, то есть после обучения алгоритма BP алгоритм BP может использовать знания, полученные из исходных знаний, для решения новых задач.
недостаток:
- Из-за большого количества параметров в нейронной сети BP каждый раз необходимо обновлять большое количество порогов и весов, поэтому скорость сходимости будет слишком медленной.
- Не существует четкой формулы для количества узлов скрытого уровня в сети.Традиционный метод должен непрерывно устанавливать количество узлов скрытого уровня методом проб и ошибок и определять окончательное количество узлов скрытого уровня в соответствии с результатами сетевых ошибок.
- С математической точки зрения, алгоритм BP является быстрым алгоритмом градиентного спуска, и легко попасть в проблему локального минимума. При возникновении локального минимума ошибка удовлетворяет требованиям на поверхности, но полученное в это время решение не обязательно является реальным решением задачи. Таким образом, алгоритм BP неполный.