Прямое распространение нейронной сети
однослойная нейронная сеть
Структурная схема
формула
⎣⎢⎢⎢⎢⎡z1z2⋮zn⎦⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎡w11(i)w21(i)⋮wn1(i)w12(i)w22(i)⋮wn2(i)⋯⋯⋯w1m(i)w2m(i)⋮wnm(i)⎦⎥⎥⎥⎥⎥⎤⎣⎢⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎥⎤+⎣⎢⎢⎢⎢⎢⎡b1(i)b2(i)⋮bn(i)⎦⎥⎥⎥⎥⎥⎤
z(i)=W(i)⋅x+b(i)
⎣⎢⎢⎢⎢⎡y1y2⋮yn⎦⎥⎥⎥⎥⎤=a⎝⎜⎜⎜⎜⎛⎣⎢⎢⎢⎢⎡z1z2⋮zn⎦⎥⎥⎥⎥⎤⎠⎟⎟⎟⎟⎞
y(i)=a(z(i))
срок
Предвзятостьb
Контролирует, насколько легко активируются нейроны
Весаwijl
-
lотносится к первомуlЭтаж
-
iотносится к первомуlпервоеiнейроны
-
jотносится к первомуl−1первоеjнейроны
z(i)
первоеiПромежуточный результат слоев
y(i)
первоеiвывод слоя
трехслойная нейронная сеть
Структурная схема
срок
one-hot
Положительное решение 1, остальные 0
normalize
нормализовать, нормализовать, нормализовать
получить данные0∼1между
пакетная обработка
Обработка пакета данных за раз, матричный расчет
- партия партия
- размер пакетных данных
функция активации
sigmoid
f(x)=1+e−x1
ступенчатая функция
f(x)={10x>0x≤0
relu
f(x)={x0x>0x≤0
Функция активации выходного слоя
Функция тождества (регрессия)
софтмакс (классификация)
f(x)=ex1+⋯+exnexi
обрабатывать переполнение данных, предотвращатьexiочень большой
f(x)=ex1−c+⋯+exn−cexi−cc=max{x1,⋯,xn}