Перевод / Департамент Али ТаоF(x) Team- Чэнъюэ
Оригинальный адрес:Хотите узнать, как работает Deep Learning? Вот краткое руководство для всех.
Искусственный интеллект (ИИ) и машинное обучение (МО) — самые горячие темы на данный момент.
Слово «искусственный интеллект» используется почти каждый день. Вы услышите, как хорошие разработчики говорят, что хотят изучить ИИ. Вы также услышите, как руководители говорят, что хотят внедрить ИИ в свои услуги. Но часто эти люди не понимают, что такое искусственный интеллект. Прочитав эту статью, вы поймете основы искусственного интеллекта (ИИ) и машинного обучения (МО) и, что более важно, поймете, как работает глубокое обучение, самый популярный тип машинного обучения. (Это руководство предназначено для всех, поэтому продвинутая математика не требуется)
задний план
Первым шагом в понимании глубокого обучения является понимание разницы между некоторыми техническими терминами.
ИИ против машинного обучения
Искусственный интеллект — это воспроизведение человеческого интеллекта в компьютерах.Когда исследования ИИ только начинались, исследователи пытались воспроизвести человеческий интеллект для конкретных задач, например, для игр. Они ввели множество правил, которым должны следовать компьютеры. Компьютер имеет определенный список возможных действий и принимает решения на основе этих правил.
Машинное обучение относится к способности машин обучаться, используя большие наборы данных, а не жестко запрограммированные правила.Машинное обучение позволяет компьютерам учиться самостоятельно. Этот тип обучения использует вычислительную мощность современных компьютеров и может легко обрабатывать большие наборы данных.
Контролируемое и неконтролируемое обучение
Обучение под наблюдением — это входные данные из помеченных обучающих данных и ожидаемый результат.. Когда вы обучаете искусственный интеллект с помощью обучения с учителем, вы даете ему ввод и говорите, какой результат ожидать. Если вывод, произведенный ИИ, неверен, он скорректирует свои расчеты. Этот процесс выполняется итеративно для набора данных до тех пор, пока ИИ больше не сможет ошибаться. Примером контролируемого обучения является искусственный интеллект прогноза погоды. Он учится предсказывать погоду, используя исторические данные. Эти обучающие данные имеют входные данные (давление, влажность, скорость ветра) и выходные данные (температура).
Неконтролируемое обучение — это задача машинного обучения с использованием наборов данных без определенной структуры.. Когда вы обучаете ИИ с помощью неконтролируемого обучения, вам нужно позволить ИИ логически классифицировать данные. Примером неконтролируемого обучения является искусственный интеллект, предсказывающий поведение для веб-сайтов электронной коммерции. Он не обучается, используя помеченные входные и выходные наборы данных. Вместо этого он создаст собственную классификацию входных данных. Он расскажет вам, какие типы пользователей чаще всего покупают разные продукты.
Итак, как работает глубокое обучение?
Теперь вы готовы понять, что такое глубокое обучение и как оно работает.глубокое обучениеявляется методом машинного обучения. Это позволяет нам обучить ИИ прогнозировать результат, учитывая набор входных данных. Для обучения искусственного интеллекта можно использовать как контролируемое, так и неконтролируемое обучение.
Мы увидим, как работает глубокое обучение, создав гипотетическую службу оценки стоимости авиабилетов. Мы будем тренировать его, используя метод обучения с учителем. Мы хотим, чтобы наш оценщик стоимости авиабилетов прогнозировал цены, используя следующие входные данные (мы исключаем обратные билеты для простоты):
- Аэропорт вылета
- аэропорт назначения
- время отправления
- авиакомпания
Нейронные сети
Давайте заглянем внутрь мозга искусственного интеллекта. Как и у животных, у нашего оценщика ИИ есть нейроны в мозгу. Они представлены кружками. Эти нейроны взаимосвязаны.
Нейроны делятся на три различных слоя:
- входной слой
- скрытый слой
- выходной слой
входной слойПолучить входные данные. В нашем примере входной слой имеет четыре нейрона: аэропорт вылета, аэропорт назначения, время вылета и авиакомпания. Входной слой передает ввод первому скрытому слою.скрытый слойСделайте математику на нашем вводе. Одной из проблем при создании нейронной сети является определение количества скрытых слоев и количества нейронов в каждом слое. «Глубокое» в глубоком обучении означает наличие нескольких скрытых слоев.выходной слойВозврат выходных данных. В нашем случае он дает прогнозы цен.
Так как же он рассчитывает прогнозы цен? Вот где начинается магия глубокого обучения. Каждая связь между нейронами связана с весом. Этот вес определяет важность входного значения. Начальные веса задаются случайным образом. Дата вылета является важным фактором при прогнозировании цен на авиабилеты. Так что дата отъезда будет иметь большое значение.
У каждого нейрона есть функция активации. Эти функции трудно понять без математических рассуждений. Проще говоря, одна из его целей — «нормализовать» выход нейронов. Как только набор входных данных прошел через все слои нейронной сети, он возвращает выходные данные через выходной слой. Ничего сложного, правда?
обучать нейронную сеть
Обучение ИИ — самая сложная часть глубокого обучения
- Вам нужен большой набор данных.
- Вам нужна большая вычислительная мощность.
Для наших оценщиков стоимости авиабилетов нам необходимо найти исторические данные о ценах на авиабилеты. Поскольку может быть большое количество комбинаций аэропорта и даты вылета, нам нужен очень большой список цен на авиабилеты. Чтобы обучить искусственный интеллект, нам нужно дать ему ввод набора данных и сравнить его вывод с выводом набора данных. Поскольку ИИ не обучен, его вывод будет неверным.
После того, как мы просмотрим весь набор данных, мы можем создать функцию, которая покажет нам ошибку между выводом ИИ и фактическим выводом. Эта функция называется функцией стоимости. В идеале мы хотим, чтобы функция стоимости была равна нулю. То есть вывод нашего ИИ такой же, как вывод набора данных.
Как уменьшить функцию затрат?
Мы меняем веса между нейронами. Мы могли бы менять их случайным образом, пока наша функция стоимости не станет низкой, но это не очень эффективно. Вместо этого мы будем использовать метод, называемыйградиентный спускТехнологии.
Градиентный спуск позволяет найти минимум функции. В нашем случае мы ищем минимальное значение функции стоимости. Он работает, изменяя веса небольшими приращениями после каждой итерации набора данных. Вычисляя производную (или градиент) функции стоимости при определенном весе, мы можем увидеть, в каком направлении находится минимум.
Чтобы минимизировать функцию стоимости, вам нужно несколько раз перебрать набор данных. Вот почему вам нужна большая вычислительная мощность. Обновление весов с помощью градиентного спуска выполняется автоматически. Это магия глубокого обучения! После того, как мы обучили ИИ цен на авиабилеты, мы можем использовать его для прогнозирования будущих цен.
Где я могу узнать больше?
Существует множество других типов нейронных сетей: длякомпьютерное зрениеизСверточная нейронная сетьи дляобработка естественного языкаизРекуррентная нейронная сеть. Если вы хотите изучить технические аспекты глубокого обучения, я рекомендую пройти онлайн-курс. В настоящее время одним из лучших курсов по глубокому обучению являетсяВу АндеПрофессиональное глубокое обучение: вам даже не нужно платить за обучение, если вы не заинтересованы в получении сертификата.
в конце концов…
-
Глубокое обучение использует нейронные сети для имитации интеллекта животных.
-
В нейронной сети есть три типа слоев нейронов: входной слой, скрытый слой и выходной слой.
-
Связи между нейронами связаны с весом, который определяет важность входного значения.
-
Нейроны применяют к данным функцию активации, чтобы «нормализовать» выходные данные нейрона.
-
Для обучения нейронной сети нужен большой набор данных.
-
Повторение набора данных и сравнение результатов даст функцию стоимости, которая учитывает отклонение ИИ от фактического результата.
-
После каждой итерации веса между нейронами корректируются с помощью градиентного спуска, чтобы уменьшить функцию стоимости.
Front-end-F-x-Team Amoy открывает WeiboЛа! (Отображается после входа в Weibo)Помимо статей, вас ждет разблокировка еще командного контента ?