Снова поговорим о нейронных сетях и глубоком обучении

нелинейный мир

Наш мир — нелинейный мир. Можем ли мы позволить машинам изучать многие сложные проблемы в реальности? Вдохновившись строением человеческого мозга, люди стали в определенной степени моделировать строение мозга. Поскольку мозг может понимать мир, искусственные нейронные сети тоже должны это уметь.

Нейронные сети

Простые персептроны представляют собой линейные модели, в то время как многие сложные проблемы можно решить путем вложения нескольких слоев нейронной сети и добавления нейронов.

Вся модель нейронной сети содержит три элемента: линейное преобразование, нелинейное преобразование и линейное принятие решений. Линейные и нелинейные преобразования на самом деле являются преобразованиями координат, которые объединяют информацию в другие пространства. От линейного к нелинейному — это преобразование признака, которое преобразует признак в другой признак. Многослойная нейронная сеть предназначена для обучения представлению.

Математически вложение нейронной сети представляет собой вложение нескольких функций, а отношение признаков описывается сложным отношением вложения функций.

Обучение сложным отношениям

В реальности существует много сложных отношений, поэтому для их описания необходимо построить сложные границы. Так как же узнать эти границы? Мы можем рассматривать каждый нейрон как простое описание границы.Вводя скрытый слой, многие нейроны могут описывать очень сложную границу, то есть пересекая множество границ нейронов.

Очень мелкая сеть

Поскольку введение скрытого слоя может описывать произвольно сложные непрерывные границы, можем ли мы сказать, что нам нужно использовать неглубокую сеть только для любых сложных отношений? Независимо от того, насколько сложны отношения, я просто добавляю нейроны и, наконец, строю сверхмелкую сеть для описания сколь угодно сложных отношений.

глубокая сеть

Очень неглубокая сеть может показаться непобедимой, но она приведет к катастрофе размерности. Очень неглубокие сети на самом деле представляют объекты низкой размерности в пространствах сверхвысокой размерности, для изучения которых потребуется достаточно большой объем данных. Кроме того, это приведет к проблемам с переоснащением.

Следовательно, ее можно улучшить в направлении глубины, а сеть можно разделить на большее количество слоев, чтобы каждый слой абстрагировал разные функции, то есть степень абстракции каждого слоя была разной. Чем дальше находится информация, тем она более абстрактна, подобно тому, как люди обрабатывают информацию, чем ближе сенсорная информация, тем она конкретнее. Например, при виде книги глаза изначально видят такую информацию, как название, размер и цвет книги. Оглядываясь назад, вы можете думать о такой информации, как тема книги.

В общем, мы надеемся получить низкоразмерную сеть, которая сможет хорошо представлять сложные отношения.

------------- Рекомендуем прочитать ------------

Краткое изложение моих проектов с открытым исходным кодом (машинное и глубокое обучение, НЛП, сетевой ввод-вывод, AIML, протокол mysql, чат-бот)

Зачем писать «Анализ проектирования ядра Tomcat»

2018 Алгоритмы структуры сводных данных

Сборник статей по машинному обучению за 2018 г.

Сводка статей о глубине Java за 2018 г.

Резюме по обработке естественного языка за 2018 г.

Резюме глубокого обучения за 2018 г.

Сводка статей об исходном коде JDK за 2018 г.

Обзор Java Concurrency Core за 2018 г.

Итоговые чтения за 2018 год

Поговори со мной, задай мне вопросы:

Добро пожаловать, чтобы следовать: