Эндрю Нг, машинное обучение, серия 11: нейронные сети

чтоНейронные сетиШерстяная ткань? Сначала ученые хотели использовать алгоритмы для имитации мозга для достижения искусственного интеллекта. С помощью серии экспериментов было установлено, что мозг работает через нейроны, которые передают информацию посредством электрических сигналов. Поэтому они начали моделировать рабочий процесс нейронов и использовали алгоритмы моделирования нейронов, которые образовывали нейронную сеть. Нейронные сети можно использовать для обученияСложные нелинейные гипотетические модели.

Как показано на рисунке ниже, синий кружок имитирует входную информацию, а желтый кружок имитирует нейроны, принимая на себя функциюh_θ(x) Информация об аналоговом выходе, эту функцию мы изучили раньшеЛогистическая функция,Также известен как Sigmoid Function.

未命名图片.png

Итак, теперь смоделирован нейрон, но мозг определенно не полагается на работу одного нейрона, и теперь начнем моделировать рабочий процесс нескольких нейронов, как показано ниже:

未命名图片.png

Слой Layer 1 моделирует входной сигнал, а линия соединения представляет направление передачи сигнала. Слой 2 представляет собой скрытый слой. Вход и выход этого слоя невидимы, поэтому он называется скрытым слоем. Этот слой обычно имеет много слоев. Слой 3 является выходным слоем, и этот слой выводит результат. Следуйте шагам от уровня 1 доРаспространение слоя 3 в этом направлении называетсяпрямое распространение.

Обычно единица смещения добавляется к каждому слою, как показано ниже:

未命名图片.png

Каждый нейрон представляет собой гипотетическую функциюh_θ(x) строится следующим образом:

未命名图片.png

представляет i-й нейрон в j-м слое.

未命名图片.png

Представляет матрицу параметров нейронов в j-м слое.

В логистической регрессии поиск лучших параметров можно выполнить с помощьюМинимизация функции затратЧтобы найти, то в нейросети тоже есть параметры, и мы можем решить эти параметры точно так же. Сначала используйте функцию стоимости логистической регрессии, с которой мы наиболее знакомы, чтобы провести аналогию,Функция стоимости логистической регрессии выглядит следующим образом (часть красной линии предназначена для упорядочения параметров,θ_0 Регулировка не требуется):

未命名图片.png

Так же,Функция стоимости нейронной сетиследующее:

未命名图片.png

в:

L = количество слоев нейронной сети;

S_l= сколько юнитов в слое l;

K = количество выходных ячеек.

На первый взгляд это выглядит сложно, но на самом деле идея та же, что и при сравнении функции стоимости логистической регрессии.

ps. Эта статья представляет собой учебную заметку, основанную на курсе Эндрю Нг по машинному обучению. Если вы хотите вместе изучать машинное обучение, вы можете подписаться на публичный аккаунт WeChat "SuperFeng", жду встречи с тобой.

请关注公众号.PNG