однослойный персептрон

машинное обучение
однослойный персептрон

Это второй день моего участия в ноябрьском испытании обновлений, подробности о мероприятии:Вызов последнего обновления 2021 г.

Однослойный персептрон — это простейшая нейронная сеть, и его роль заключается в эффективном и быстром решении линейно разделимых задач.

Во-первых, структура однослойного персептрона

Структурная схема однослойного перцептрона выглядит следующим образом:

image.png

Он содержит следующее:

  • Входные узлы: x1,x2,x3
  • выходной узел: у
  • Весовой вектор: w1,w2,w3
  • Коэффициент смещения: b
  • Функция активации: знак(х)

Чтобы облегчить использование матричных вычислений, структура приведенного выше рисунка часто преобразуется в следующий рисунок:

image.png

в,w0w_0Эквивалентно b, его значение не изменилось.

2. Правила обучения персептрона

Если предположить, что персептрон использует передаточную функцию знака, аналогичную пороговой передаточной функции, ее выражение будет следующим:

image.png

image.png

Формула корректировки веса должна быть такой:

image.png

3. Скорость обучения

  • ?Значение обычно находится в диапазоне от 0 до 1.
  • Если скорость обучения слишком велика, легко вызвать нестабильную регулировку веса.
  • Скорость обучения слишком мала, регулировка веса слишком медленная, а количество итераций слишком велико.

4. Условия сходимости модели

  • Ошибка меньше некоторого предустановленного меньшего значения
  • Изменения весов между итерациями уже небольшие
  • Установите максимальное количество итераций и остановитесь, когда итерация превысит максимальное количество раз.

Пять, пример применения однослойного персептрона

(1) Темы

Предположим, что в плоской системе координат есть четыре точки, метки двух точек (3,3), (4,3) равны 1, а метки двух точек (1,1), (0,2) равны -1 . Создайте нейронную сеть для классификации.

(2) Идеи

Данные, которые мы хотим классифицировать, являются двумерными данными, поэтому нам нужно только входные узлы 2. Мы также можем установить значение смещения нейрона на узел, поэтому нам нужно входные узлы 3. Схема структуры сети выглядит следующим образом:

image.png

(3) Код

1. Входные данные

image.png

2. Этикетка

image.png

3. Инициализация веса

3 строки и 1 столбец, диапазон значений от -1 до 1

image.png

4. Настройка параметров

image.png

5. Функция обновления веса

image.png

6. Обучение

image.png