Это 31-й день моего участия в августовском испытании обновлений. Узнайте подробности события:Испытание августовского обновления
Представление нейронных сетей
Есть как линейная регрессия, так и логистическая регрессия Зачем изучать нейронные сети?
Теперь, чтобы привести несколько примеров.
Это задача классификации контролируемого обучения. Есть только два количества признаков.
Если вы используете логистическую регрессию и хотите подогнать приведенную ниже кривую, вам может понадобиться много терминов для разделения положительных и отрицательных выборок.
Только два количества признаков настолько проблематичны, что, если их будет 100?
Даже если включены только квадратичные члены, такие как, так что в конце также более 5000 многочленов.ОКусок,отумножить наЭто 100 предметов и так далее.отумножить наЭто составляет до 10 000 элементов. ноито же самое, а затем объединить то же самое. Так что в итоге осталось примерно половина.
Сейчас их более 5000, и конечный результат, скорее всего, будет переобгонным, а также возникнет проблема избыточных вычислений.
Теперь посчитайте три включенных термина., так что вы получите 170 000 кубических членов. (Проверьте сами, я не навязываю).
Как видно из приведенного выше примера, когда количество признаков велико, пространство будет быстро расширяться. Поэтому очень неразумно использовать метод построения полиномов для построения нелинейных классификаторов, когда количество признаков n очень велико!
Однако в действительности для многих практических задач машинного обучения число признаков n обычно очень велико.
Например, для задачи компьютерного зрения: теперь вам нужно использовать машинное обучение, чтобы определить, является ли изображение автомобилем.
Вы можете сказать, что это машина, просто взглянув на нее, но вы, конечно, не можете сказать, что это машина сразу.
Возьми этот маленький кусочек. Для вас это похоже на дверную ручку, но она распознает только сетку значений интенсивности пикселей, зная значение яркости каждого пикселя. Таким образом, задача компьютерного зрения состоит в том, чтобы сообщить нам, что эта матрица представляет собой дверную ручку автомобиля на основе матрицы яркости пикселей.
Когда мы используем машинное обучение для создания распознавателя автомобилей, все, что нам нужно сделать, это предоставить помеченный образец. Некоторые из них являются автомобилями, а некоторые образцы не являются автомобилями. Введите такой набор образцов в алгоритм обучения, чтобы обучить классификатор, и, наконец, введите новое изображение, пусть классификатор определит, что это такое.
Необходимость введения нелинейных допущений:
Для автомобиля возьмите два пикселя и поместите их в систему координат. Положение зависит от интенсивности точки 12 пикселя.
Теперь нам нужно нелинейное предположение, чтобы различать два класса выборок.
Предполагая, что изображение автомобиля имеет размер 50*50 пикселей, теперь используйте вектор x для хранения яркости каждого пикселя. Итак, 2500 пикселей. Размерность вектора 2500. Если изображение раскрашено и сохранено в RGB, размерность вектора 7500.
Если теперь вы хотите перечислить нелинейные предположения со всеми квадратичными членами, то квадратичные признакимиллион функций. Три миллиона, вычислительные затраты слишком высоки. Следовательно, он содержит только квадратные члены и кубические члены, чтобы найти, что даже модель предположения регрессии подходит только для случая, когда n относительно мало. Чем больше n, тем лучше влияние нейронной сети на сложные нелинейные предположения.
Алгоритмы нейронных сетей существуют уже давно, изначально для создания машин, имитирующих мозг.
Отображение модели
Нейронные сети имитируют нейроны в мозге. Нейроны имеют аксоны и дендриты. Аксоны соответствуют входным путям, а дендриты — выходным путям. Нейрон можно рассматривать как вычислительную единицу. между нейронами переменного тока с током. (эммм, будучи студентом-биологом, я до сих пор четко помню это знание...)
В искусственно реализованной нейронной сети используйте следующую простую модель для имитации работы нейронов.
Обозначает дендриты как вход, а справа как модель прогнозирования выхода аксонов.
вводно обычно с дополнительными узлами, стать единицей смещения или нейроном смещения.
Если вы видите вес слова в литературе по нейронным сетям, это на самом деле то же самое, что узнать параметр θ.
Нейронная сеть человека представляет собой группу нейронов, изображение ниже представляет собой более сложное изображение, первый слой синего круга называется входным слоем, потому что мы вводим количества признаков в первый слой. Желтый кружок в последнем слое называется выходным слоем, потому что нейроны этого слоя выводят окончательный результат вычисления гипотезы, а второй слой посередине называется скрытым слоем, а скрытых слоев может быть более одного слой.
Представляет элемент активации i-го нейрона или единицы в j-м слое, как и для матрицы весов., который управляет отношением отображения от слоя j к слою j+1.
активационная функция
На последнем маленьком изображении не добавлена единица смещения, посмотрите на изображение с добавленным нейроном смещения на предыдущем изображении. сюдаМатрица представляет первый слой (входной слой x) для второго скрытого слояМатрица весов (параметров) .
можно понимать как