«Глубокое обучение» Ли Хунъи (1)

машинное обучение
«Глубокое обучение» Ли Хунъи (1)

Волна искусственного интеллекта захлестывает мир, и многие слова всегда звучат у нас в ушах: искусственный интеллект (Artificial Intelligence), машинное обучение (Machine Learning), глубокое обучение (Deep Learning). Эта статья предназначена в основном для того, чтобы разобраться в примечаниях к содержанию курса Ли Хунъи, и в конце статьи дана справочная ссылка.

1- Введение в машинное обучение

image.png

Искусственный интеллект — это цель, которую мы хотим достичь, а машинное обучение — это средство для достижения цели Я надеюсь, что благодаря обучению машина станет такой же умной, как человек. Глубокое обучение — это один из методов машинного обучения. В двух словах:Машинное обучение — это метод достижения искусственного интеллекта, а глубокое обучение — это технология машинного обучения.

Машинное обучение и глубокое обучение

машинное обучение

По своей сути, машинное обучение использует алгоритмы для анализа данных, обучения на них, а затем принятия решений и прогнозов о реальных событиях. В отличие от традиционных программ, которые жестко закодированы для решения конкретных задач, машинное обучение используетмассивные данныеЧтобы «обучить», различные алгоритмы учатся на данных, как выполнять задачи.

Здесь есть три важные части информации:

  1. Машинное обучение — это способ моделирования, расширения и расширения человеческого интеллекта, поэтому оно является подмножеством искусственного интеллекта;
  2. «Машинное обучение» основано наБольшие объемы данных, то есть его «интеллект» питается большим объемом данных;
  3. Именно из-за огромного количества обрабатываемых данных технология больших данных особенно важна; «машинное обучение» — это лишь одно из применений технологии больших данных.

10 наиболее часто используемых алгоритмов машинного обучения:Деревья решений, случайные леса, логистическая регрессия, SVM, наивный байесовский анализ, K-ближайшие соседи, K-средние, Adaboost, нейронные сети, Марков.

глубокое обучение

Глубокое обучение — это технология машинного обучения, используемая для построения и моделирования нейронной сети человеческого мозга для анализа и обучения, а также для имитации механизма человеческого мозга для интерпретации данных.Его основная особенность заключается в том, чтобы попытаться имитировать схему передачи и обработки информации между нейронами в мозгу. Глубокое обучение не является самостоятельным методом обучения, оно также будет использоваться само по себе.контролируемыйинеконтролируемыйметоды обучения для обучения глубоких нейронных сетей. Однако из-за быстрого развития этой области в последние годы некоторые уникальные методы обучения были предложены один за другим (например, остаточная сеть), поэтому все больше и больше людей рассматривают его как метод обучения.

Однако в глубоком обучении есть и соответствующие проблемы:

  1. модель глубокого обученияТребует много обучающих данных, дабы показать магический эффект, но часто встречающийся в реальной жизниНебольшая выборка, в настоящее время нельзя использовать метод глубокого обучения., с которым можно справиться традиционными методами машинного обучения.
  2. В некоторых областях традиционные и простые методы машинного обучения могут быть хорошо решены, и нет необходимости использовать сложные методы глубокого обучения.
  3. Идея глубокого обучения исходит от человеческого мозга, но это ни в коем случае не моделирование человеческого мозга Процесс обучения человека часто не требует крупномасштабных обучающих данных, и текущий метод глубокого обучения явно не симуляция человеческого мозга.

Технологии, связанные с машинным обучением

Машинное обучение можно в основном разделить на:

  • контролируемое обучение
  • полуконтролируемое обучение
  • передача обучения
  • неконтролируемое обучение
  • Структурированное обучение в контролируемом обучении
  • обучение с подкреплением

image.pngЭто изображение в основном является соответствующим подразделением машинного обучения, Сначала мы объясним контролируемое обучение в верхнем левом углу изображения.

контролируемое обучение

определение:В соответствии с существующим набором данных узнайте взаимосвязь между входными и выходными результатами. По этому известному соотношению путем обучения получается оптимальная модель.То есть при обучении с учителем обучающие данныеособенностьсноваимеет ярлык, Благодаря обучению машина может сама находить связь между функцией и меткой и может оценивать метку, когда сталкивается с данными только с функциями и без меток.С точки зрения непрофессионала, машинное обучение можно понимать как обучение машин тому, как что-то делать.

Обучение с учителем делится на:

  • Регрессия
  • проблема классификации

Классические алгоритмы: машины опорных векторов, линейный дискриминант, деревья решений, наивный байесовский алгоритм.

проблема регрессии

Проблемы регрессии для непрерывных переменных. Возвращаясь к простому пункту,Проанализируйте существующие точки (данные для обучения) и подберите соответствующую функциональную модель y=f(x), где y — метка данных, а для новой независимой переменной x метка y получается с помощью этой функциональной модели.

проблема классификации

Разница между проблемой регрессии «Регрессия» и задачей классификации «Классификация» заключается в том, что типы вещей, которые мы хотим, чтобы машина выводила, различаются. В задаче регрессии машинный выход представляет собой числовое значение.В задаче классификации машинный выход представляет собой категорию.Самое большое отличие от регрессии заключается в том, чтоКлассификация для дискретных, выходРезультаты ограничены.

Существует два типа задач классификации:

  • Двоичная классификация, вывод да или нет. Например, чтобы определить, доброкачена ли опухоль или злокачественная
  • Мультикатегория, выберите правильную категорию из нескольких вариантов. Например, введите изображение, чтобы понять, кошка это, собака или свинья.

Проще говоря, классификация заключается в том, чтобы получить метку для нового вектора путем анализа входного вектора признаков.

微信截图_20210712155432.png

Вышеупомянутая проблема, которую может решить машина, Первым шагом в решении проблемы является выбор функции для решения проблемы, то есть выбор модели, необходимой для решения проблемы. главным образом дляЛинейная модельинелинейная модель

полуконтролируемое обучение

Традиционные методы машинного обучения делятся на две категории: обучение без учителя и обучение с учителем.

Неконтролируемое обучение использует толькоНемаркированный набор образцов, в то время как контролируемое обучение использует толькоМаркированный набор образцовучиться.

Но во многих практических задачах имеется лишь небольшое количество помеченных данных, потому что стоимость пометки данных иногда очень высока. Например, в биологии структурный анализ или функциональная идентификация определенного белка может стоить биологии многих лет. работы дома, в то время как огромное количество неразмеченных данных легко доступно. Это позволяетОдновременное использование сэмплов с тегами и сэмплов без маркировкиТехника полуконтролируемого обучения быстро развивалась. Короче говоря, обучение с полуучителем должно уйти.Уменьшить метку (этикетку)дозировка.

Обучение с полуучителем является индуктивным, и полученную модель можно использовать в качестве более широкой выборки.

Классификация полууправляемых алгоритмов обучения:

  1. Самообучение (алгоритм самообучения)
  2. генеративные модели
  3. SVM Полууправляемые машины опорных векторов
  4. графовые методы
  5. алгоритм обучения с несколькими представлениями
  6. Другие методы

передача обучения

Цель:Применяйте знания или шаблоны, полученные в одной области или задаче, к другой, но связанной области или проблеме.

смысл:Перенесите помеченные данные или структуры знаний из связанных областей, завершите или улучшите обучение в целевых областях или задачах.

Например, если человек научится ездить на велосипеде, то ездить на мотоцикле будет очень просто.После изучения языка C будет очень легко выучить другие языки.Это способность человеческого обучения делать выводы о других, поэтому может машины также имеют возможность делать выводы о других?

image.pngВышеприведенная картинка является примером анализа тональности отзывов о продуктах, которые содержат два разных поля товаров: поле книг и поле мебели; в области книг такие слова, как «широкая» и «качественная художественная литература», обычно используются для выражения положительных эмоций. В сфере мебели такие слова, как «острый» и «легкий вес», используются для выражения положительных эмоций. Видно, что в этой задаче большая часть различных эмоциональных слов в разных полях не пересекается, есть доменно-эксклюзивные слова, а частотность слов в разных полях существенно отличается, что приведет к проблеме распределения вероятностей несовпадение полей.

Ключевые моменты трансферного обучения:

  1. Исследуйте, какие знания можно использовать для трансферного обучения в разных областях или задачах, то есть какие общие знания можно передавать между разными областями.
  2. После того, как объект передачи найден, конкретный алгоритм обучения передачи используется для конкретных задач, то есть как разработать подходящий алгоритм для извлечения и передачи общих знаний.
  3. Исследование, при каких обстоятельствах подходит перенос и подходят ли методы переноса для конкретных приложений, что связано с проблемой отрицательного переноса. (Отрицательный перенос — это препятствующий эффект старых знаний на усвоение новых знаний, например, влияние изучения трехколесного велосипеда на езду на велосипеде и влияние изучения китайского пиньинь на изучение английских букв. Узнайте, как использовать положительный перенос, чтобы избежать отрицательного переноса. )

Существующие методы трансферного обучения можно условно разделить на три категории:

  1. Метод трансферного обучения на основе образцов
  2. Методы трансферного обучения на основе признаков
  3. Методы трансферного обучения на основе моделей

Три типа методов трансферного обучения, упомянутые выше, представлены следующим образом:

  1. Метод трансферного обучения на основе образцов

смысл:Часть данных отфильтровывается из набора данных исходной области, так что выбранная часть данных аналогична распределению вероятностей целевых данных.

Метод, основанный на выборке выборки: если предположить, что исходный домен и целевой домен имеют разные условные распределения, но схожие предельные распределения, выборка может быть выполнена в соответствии с такими методами, как методы, основанные на метрике расстояния, и методы, основанные на мета-обучении.

Метод, основанный на весе выборки: если предположить, что исходный домен и целевой домен имеют схожие условные распределения, но разные предельные распределения, обучение весу выборки определяется отношением плотности вероятности.

  1. Методы трансферного обучения на основе признаков

Метод переноса обучения на основе максимальной средней разницы (MMD): сопоставьте исходные и целевые образцы доменов с воспроизводимыми и фильтрующими пространствами (RKHS) и минимизируйте разницу между ними.

  1. Методы трансферного обучения на основе моделей (глубокое обучение)

Глубокие нейронные сети поверхностно изучают общие функции и глубоко изучают специальные функции, связанные с задачами.

Резюме по мобильности нейронной сети:

  1. Первые несколько слоев нейронной сети в основном представляют собой общие черты, и эффект миграции лучше.
  2. В сеть глубокой миграции добавлена ​​тонкая настройка, и эффект значительно улучшен, что может быть лучше, чем в исходной сети.
  3. Тонкая настройка может лучше устранить различия между данными
  4. Сеть с глубоким переносом работает лучше, чем случайная инициализация весов
  5. Миграция сетевых слоев может ускорить обучение и оптимизацию сети.

неконтролируемое обучение

определение:Мы не знаем связи между данными и признаками в наборе данных, но нам нужно получить связь между данными в соответствии с кластеризацией или определенной моделью.Можно сказать, что по сравнению с обучением с учителем обучение без учителя больше похоже на самообучение, позволяющее машинам учиться делать что-то самостоятельно без ярлыков.

Неконтролируемое обучение позволяет нам решать проблемы практически без представления о том, как должны выглядеть результаты. Мы можем получить структуру из данных, не зная влияния переменных. Мы можем получить эту структуру, сгруппировав данные на основе взаимосвязей между переменными в данных. При неконтролируемом обучении нет обратной связи, основанной на прогнозируемом результате.

Классический алгоритм: алгоритм кластеризации K-средних (алгоритм K-средних), анализ главных компонент

Структурированное обучение в контролируемом обучении

При структурированном обучении выходные данные машины должны быть структурированы.

В задаче классификации машина выводит только вариант, в задаче структурированного класса машина выдает сложный объект.

В контексте распознавания речи входом машины является звуковой сигнал, а выходом — предложение; предложение состоит из множества слов и представляет собой структурированный объект.

Машинный перевод, распознавание лиц (отметка имен разных людей), такие как GAN, также являются методом структурированного обучения.

обучение с подкреплением

определение:Обучение с подкреплением является важной ветвью машинного обучения и является продуктом междисциплинарного и многопрофильного пересечения Суть его заключается в решении проблемы принятия решений, то есть в автоматическом принятии решений и принятии непрерывных решений.

В основном содержит четыре элемента: агент, состояние среды, действие, вознаграждение

Цель обучения с подкреплением состоит в том, чтобыПолучите самые кумулятивные награды.

Разница между обучением с подкреплением и контролируемым обучением:

  1. Контролируемое обучение - это как у учителя, указанного, как учитель правильно и неверно во время обучения, но во многих практических проблемах, таких как шахматы и уход, есть десятки миллионов способов игры, невозможно иметь один учитель, знает все возможные результаты. Тем не менее, обучение подкреплениями получит результат, сначала попытаюсь сделать некоторые поведения без каких-либо ярлыков и корректировать предыдущее поведение через обратную связь о том, является ли результатом правильным или неправильным. С этой непрерывной регулировкой алгоритм может узнать, какое поведение выбрать в Такая ситуация даст лучшие результаты.
  2. Оба метода обучения изучают сопоставление от ввода к выводу. Контролируемое обучение узнает взаимосвязь между ними, что может сообщить алгоритму, какой вход соответствует какому выводу. Какое обучениеОбратная связь с машиной, который используется для оценки того, является ли поведение хорошим или плохим.
  3. Кроме того, существует задержка в обратной связи результатов обучения с подкреплением.Иногда может потребоваться много шагов, чтобы узнать, является ли выбор предыдущего шага хорошим или плохим, а обучение с учителем делает плохой выбор и немедленно возвращает его алгоритм. Более того, входные данные, с которыми сталкивается обучение с подкреплением, всегда меняются.Каждый раз, когда алгоритм выполняет действие, он влияет на входные данные следующего решения, в то время как входные данные обучения с учителем независимы и одинаково распределены.
  4. При обучении с подкреплением агент может найти компромисс между исследованием и эксплуатацией и выбрать тот, который принесет наибольшую награду. Исследование попробует много разных вещей, чтобы увидеть, лучше ли они, чем то, что вы пробовали раньше. Эксплуатация пробует наиболее эффективное поведение из прошлого опыта. Общие алгоритмы обучения с учителем не учитывают этот баланс.

Разница между обучением с подкреплением и обучением без учителя:

Вместо того, чтобы изучить сопоставление от ввода на вывод, без присмотрамодель. Например, в задаче рекомендации новостных статей пользователям неконтролируемый найдет похожие статьи, которые пользователь читал ранее, и порекомендует им одну из них. Обучение с подкреплением сначала порекомендует пользователю небольшое количество новостей,и продолжайте получать отзывы от пользователейи, наконец, построить «график знаний» из статей, которые могут понравиться пользователям.

Основные алгоритмы и классификации

С точки зрения некоторых элементов обучения с подкреплением методы в основном делятся на следующие категории:

  • На основе политики основное внимание уделяется поиску оптимальной политики.
  • На основе ценности основное внимание уделяется поиску оптимальной суммы вознаграждения.
  • Основанный на действии, акцент делается на оптимальном действии на каждом этапе.

2- Зачем изучать машинное обучение

Машинное обучение может быстрее и автоматически генерировать модели для анализа больших и сложных данных с более быстрой передачей и более точными результатами — даже в очень больших масштабах. При отсутствии вмешательства человека в реальность ценные прогнозы могут привести к более правильным решениям и более информированному поведению.

Ссылка на ссылку: