Как работает глубокое обучение с нуля? Просто прочитайте эту статью!

машинное обучение искусственный интеллект глубокое обучение Нейронные сети
Как работает глубокое обучение с нуля? Просто прочитайте эту статью!

Вчера я порекомендовал несколько обязательных к просмотру книг для вводного глубокого обучения.Если вы пропустите их, пожалуйста, нажмитездесь.

Прежде чем приступить к глубокому обучению, необходимо понять, как оно работает. Раду Райча, известный программист, написал статью для начинающих, объясняя, как работает глубокое обучение, на примере инструмента прогнозирования стоимости проезда.Нет необходимости в продвинутых математических знаниях, каждый может понять.

В настоящее время искусственный интеллект и машинное обучение должны быть самыми популярными темами.Вы, наверное, часто слышите, что многие друзья-программисты говорят, что хотят изучать ИИ, а многие компании заявляют, что хотят применять технологии ИИ, но многие люди не до конца понимают искусственный интеллект. интеллект и искусственный интеллект машинное обучение. Поэтому Раду Райча считает, что прежде чем объяснять принципы глубокого обучения, нам необходимо понять несколько основных терминов, например, в качестве вводного теста:

Вы знаете, что такое машинное обучение?

Машинное обучение относится к способности машин учиться использовать большие наборы данных для обучения, а не жестко запрограммированные правила. Это ядро ​​​​искусственного интеллекта и основной способ сделать компьютеры интеллектуальными. Оно в основном использует индукцию и синтез вместо дедукции.

Машинное обучение позволяет компьютерам учиться самостоятельно, и этот тип обучения выигрывает от вычислительной мощности современных компьютеров, которые могут легко обрабатывать большие наборы данных.

Вы знаете, что такое контролируемое обучение?

Обучение с учителем применяет помеченный набор данных, содержащий входные значения и ожидаемые выходные значения.

При обучении ИИ с контролируемым обучением нам нужно дать ему входные значения и сказать, чтобы он ожидал выходные значения. Если ИИ выдает неверное выходное значение, он корректирует собственные расчеты. Этот процесс повторяется по мере обновления набора данных до тех пор, пока ИИ не перестанет совершать ошибки.

Типичным применением контролируемого обучения является приложение AI для прогноза погоды. ИИ использует исторические данные, чтобы научиться предсказывать погоду. Данные для обучения состоят из входных значений (давление воздуха, влажность, скорость ветра и т. д.) и выходных значений (температура и т. д.).

Вы знаете, что такое неконтролируемое обучение?

Неконтролируемое обучение — это использование наборов данных без определенной структуры.

При использовании неконтролируемых методов обучения для обучения ИИ необходимо позволить ИИ классифицировать данные.

Примером применения неконтролируемого обучения является прогнозирование поведения потребителей на веб-сайтах электронной коммерции. Вместо использования помеченных наборов данных входных и выходных значений ИИ классифицирует сами входные данные, позволяя веб-сайтам узнать, что клиенты больше всего любят покупать.

Зачем говорить об этих двух понятиях?

так какОбучение с учителем и обучение без учителя — это всего лишь два метода обучения в глубоком обучении..

Поздравляем с прохождением вступительного теста, теперь мы открываем дверь в глубокое обучение.

Концепция глубокого обучения возникла в результате исследования искусственной нейронной сети, которая является новой областью исследований в области машинного обучения. Цель состоит в том, чтобы создать и смоделировать нейронную сеть человеческого мозга для анализа и обучения звуку и тексту.

Как метод машинного обучения, глубокое обучение позволяет нам обучать ИИ прогнозировать выходные значения с учетом входных значений. Для обучения ИИ можно использовать как контролируемое, так и неконтролируемое обучение..

Давайте посмотрим, как Раду Райча объясняет, как работает глубокое обучение, на примере создания гаджета прогнозирования стоимости проезда, а затем обучает его с помощью обучения с учителем.

Сначала мы хотим, чтобы этот инструмент прогнозирования тарифа предсказывал тариф со следующими входными значениями (билеты туда и обратно здесь не рассматриваются):

  • Аэропорт вылета

  • Прибытие в аэропорт

  • время отправления

  • маршрут

Нейронные сети

Давайте взглянем на мозг ИИ — нейронные сети. Как и у животных, у этого ИИ, предсказывающего стоимость проезда, есть нейроны в мозгу. Кружки на изображении ниже представляют собой нейроны, которые связаны друг с другом:

Нейроны делятся на три разных уровня:

  • входной слой

  • Скрытый слой (возможно несколько) (скрытый слой)

  • выходной слой

Входной слой получает входные данные. В нашем ИИ прогнозирования тарифов входной слой имеет 4 нейрона: аэропорт отправления, аэропорт прибытия, дата отправления и маршрут. Входной слой получает эту информацию и передает ее первому скрытому слою.

Скрытые слои выполняют математические операции над входными данными.. Как определить количество скрытых слоев и количество нейронов в каждом слое, все еще остается проблемой для построения нейронных сетей.

Слово «глубокий» в глубоком обучении относится к тому факту, что в нейроне есть более одного скрытого слоя.

Наконец,Выходной слой вернет выходные данные, в данном случае ИИ, предсказывающий стоимость проезда.

Итак, как этот инструмент ИИ рассчитывает прогнозируемый тариф?

Конечно, с помощью магии глубокого обучения.

Каждая связь между нейронами тесно связана с весом, который определяет важность входного значения. Начальные веса задаются случайным образом. Дата вылета является одним из наиболее важных факторов при прогнозировании стоимости авиабилетов на определенный рейс, поэтому связи между нейронами даты вылета будут сильно взвешены.

Каждый нейрон имеет активационную функцию. Трудно понять эти функции, не зная математики. Тем не менее, эта статья предназначена для начинающих, поэтому я не буду касаться здесь эзотерической математики.

Проще говоря, одной из целей этих функций является преобразование выходного значения нейрона.стандартизация".

Как только набор входных данных прошел через все слои нейронной сети, ИИ возвращает выходные значения через выходной слой.

Это не сложно понять, правда?

обучать нейронную сеть

Самая сложная часть глубокого обучения — это обучение ИИ, почему?

  • Вам нужны большие наборы данных.

  • Вы должны иметь мощную вычислительную мощность, необходимую для обучения.

Возьмем ИИ для прогнозирования тарифов, который мы собираемся сделать. Нам нужны данные о ценах на авиабилеты за прошлые периоды. А поскольку существует множество возможных комбинаций аэропортов и дат вылета, этот список тарифов может быть огромным.

Чтобы обучить ИИ, нам нужно предоставить ему входные значения из набора данных, а затем сравнить выходные значения ИИ с выходными значениями набора данных. Поскольку ИИ не обучен, в выходном значении будет много ошибок.

Когда у нас есть все данные во всем наборе данных, мы можем создать функцию, которая покажет нам, насколько далеко вывод ИИ от реального вывода. Эта функция называется "функция стоимости(Функция стоимости).

В идеале мы хотим, чтобы функция стоимости была равна нулю, но это состояние достигается только тогда, когда выходное значение ИИ совпадает с выходным значением набора данных.

Вопрос в том, как уменьшить функцию затрат?

Мы упоминали о «весе» выше, помните? В операции уменьшения функции стоимости веса играют решающую роль. Изменение весов между нейронами может скорректировать функцию стоимости, мы можем изменять их случайным образом, пока функция стоимости не будет близка к 0, но этот метод очень неэффективен.

В этом случае метод называетсяградиентный спускАртефакт (Градиентный спуск) выглядит величественно.

Градиентный спуск — это метод нахождения минимума функции., нам нужно полагаться на градиентный спуск, чтобы найти минимальное значение функции стоимости в модели цены авиабилета.

Градиентный спуск работает, изменяя веса небольшими приращениями после каждой итерации набора данных..Вычисляя производную (или градиент) функции стоимости, которая определяет веса, мы можем выяснить, в каком направлении искать минимум.

Чтобы минимизировать функцию стоимости, нам нужно многократно перебирать набор данных, поэтому мы только что сказали, что нам нужна большая вычислительная мощность.

Обновление весов при градиентном спуске может выполняться автоматически, что является магией глубокого обучения! Как только мы обучим наш инструмент ИИ для прогнозирования стоимости авиабилетов, мы сможем использовать его для прогнозирования будущих цен на авиабилеты!

Ах да, есть много типов нейронных сетей, и разные ИИ используют разные нейронные сети.Например, технология компьютерного зрения использует сверточные нейронные сети (Convolutional Neural Networks), а обработка естественного языка использует рекуррентные нейронные сети (Recurrent Neural Networks). .

Хотите узнать больше?

Понимание принципа работы глубокого обучения — это только первый шаг в изучении глубокого обучения, и я думаю, что следующим шагом будет знакомство с открытием Ву Энды на Coursera.Курс глубокого обучения.

Jizhi добавит некоторые ресурсы. Мы собрали пакет сетевых ресурсов для машинного обучения и глубокого обучения. Пожалуйста, возьмите его для молодежи:кликните сюда

Наконец, краткое изложение глубокого обучения:

  • Глубокое обучение требует, чтобы нейронные сети имитировали интеллект животных.

  • В нейронной сети есть три типа слоев нейронов, а именно входной слой, скрытый слой (который может иметь несколько слоев) и выходной слой.

  • Связи между нейронами связаны с весами, которые определяют важность входного значения.

  • Применение функции активации к данным «нормализует» выходное значение нейрона.

  • Для обучения нейронной сети нужен большой набор данных.

  • Итерация по набору данных и сравнение выходных данных ИИ с выходными данными набора данных даст функцию стоимости, которая показывает разницу между выходными данными ИИ и реальными выходными данными.

  • После каждой итерации набора данных веса между нейронами будут уменьшать значение функции стоимости с помощью градиентного спуска.

Теперь, когда вы понимаете принцип работы глубокого обучения, давайте сядем в яму и научимся!

Но если вы боитесь, что у вас плохой фундамент и вам будет сложно освоить навыки ИИ, как вы можете его сломать? Ничего страшного! !

Если вы настоящий новичок, но хотите максимально эффективно изучить знания об искусственном интеллекте, у нас просто есть возможность бесплатно изучить ИИ, чтобы вы могли стать инженером ИИ с нуля до профессионала, понимаете?

Портал возможностей:кликните сюда! !

Это может быть лучший шанс вовремя успеть на автобус ИИ, не упустите его.