Эта статья написана [Передовая линия ИИ】оригинал
Автор|Джеймс Ле Переводчик|Шан Цзянь Редактор|Эмили
Руководство по передовой ИИ: "Нет сомнений в том, что за последние несколько лет популярность области машинного обучения/искусственного интеллекта возросла. Большие данные уже популярны в технологической отрасли, и машинное обучение, позволяющее делать прогнозы или давать рекомендации на основе больших объемов данных, несомненно, очень эффективно. Некоторые из наиболее распространенных примеров машинного обучения, такие как алгоритм Netflix, который рекомендует фильмы на основе фильмов, которые вы смотрели ранее, и алгоритм Amazon, который рекомендует книги на основе книг, которые вы купили ранее. "
Итак, если вы хотите узнать больше о машинном обучении, с чего начать? Для меня вводным курсом был курс по искусственному интеллекту, который я посещал во время учебы за границей в Копенгагене. Мой лектор в то время был профессором прикладной математики и информатики в Техническом университете Дании, и его исследования были в области логики и искусственного интеллекта, с упором на использование логики для удобного для человека планирования, рассуждений и моделей решения проблем. . Этот курс включает в себя обсуждение теории/основных концепций и самостоятельное решение проблем. Учебник, который мы используем, является одним из классических учебников по ИИ: искусственный интеллект — современный подход Питера Норвига (китайский перевод: «Искусственный интеллект: современный подход»), теории вероятностей, многоагентных систем, социального ИИ и философии/этики. /будущее ИИ и многое другое. В конце курса наша команда из трех человек реализовала простой проект по программированию, поисковый агент для решения транспортной задачи в виртуальной среде.
Я многому научился на этом курсе и решил продолжить изучение смежных тем. За последние несколько недель я посетил несколько технических докладов в Сан-Франциско, посвященных глубокому обучению, нейронным сетям и структурам данных, а также посетил конференцию по машинному обучению со многими известными экспертами и учеными в этой области. Кроме того, в начале июня я прошел онлайн-курс «Введение в машинное обучение» на Udacity и только что закончил его на днях. В этом посте я хотел бы поделиться некоторыми из наиболее часто используемых алгоритмов машинного обучения, которые я изучил на курсе.
Алгоритмы машинного обучения можно разделить на три широкие категории: обучение с учителем, обучение без учителя и обучение с подкреплением. Обучение с учителем можно использовать, когда конкретный набор данных (обучающий набор) имеет определенный атрибут (метку), но другие данные не имеют метки или должны предсказывать метку. Обучение без учителя можно использовать для заданного немаркированного набора данных (данные не назначаются заранее), и цель состоит в том, чтобы найти потенциальные взаимосвязи между данными. Обучение с подкреплением находится между этими двумя, с некоторой формой обратной связи для каждого прогноза, но без точных ярлыков или дезинформации. Поскольку это вводный курс, я ничего не узнал об обучении с подкреплением, но я надеюсь, что следующих 10 алгоритмов обучения с учителем и без учителя достаточно, чтобы вас заинтересовать.
Обучение с учителем 1. Деревья решений
Дерево решений — это инструмент поддержки принятия решений, который использует древовидные диаграммы или модели решений и последовательности возможностей, включая результаты случайных событий, стоимость ресурсов и полезности. Следующий рисунок является его основным принципом:
С точки зрения принятия бизнес-решений, деревья решений — это наименьшее количество вопросов типа «да/нет», которые нужно понять, чтобы оценить вероятность принятия правильного решения в большинстве случаев. Как метод, он позволяет структурированно и систематически решать проблемы, приводя к логическим выводам.
2. Наивная байесовская классификация
Наивные байесовские классификаторы — это класс простых вероятностных классификаторов, основанных на теореме Байеса и сильных (наивных) предположениях о независимости между признаками. На рисунке показана формула Байеса, где P(A|B) — апостериорная вероятность, P(B|A) — вероятность, P(A) — априорная вероятность класса, а P(B) — предсказанная априорная вероятность.
Некоторые примеры приложений:
- Оценка спама
- Классифицируйте категории новостей, такие как технологии, политика, спорт
- Определите, является ли эмоция, выраженная в тексте, положительной или отрицательной.
- распознавание лица
3. Обычная регрессия методом наименьших квадратов
Если вы знакомы со статистикой, вы, вероятно, уже слышали о линейной регрессии. Метод наименьших квадратов — это метод вычисления линейной регрессии. Вы можете думать о линейной регрессии как о подгонке линии через набор точек. Есть много способов сделать это, «метод наименьших квадратов» выглядит следующим образом: вы можете нарисовать линию, затем для каждой точки данных вычислить расстояние по вертикали от каждой точки до линии и сложить их, затем окончательный приблизительный Результирующая линия представляет собой расстояние и наименьшую возможную прямую линию.
Линейная относится к модели, которую вы используете для подбора данных, а метод наименьших квадратов относится к метрике ошибки, которую вы минимизируете.
4. Логистическая регрессия
Логистическая регрессия — это мощный статистический метод, который может выражать биномиальный результат с одной или несколькими независимыми переменными. Он оценивает вероятность с помощью логистической функции, которая измеряет взаимосвязь между переменной, зависящей от класса, и одной или несколькими независимыми переменными, которые следуют кумулятивному логистическому распределению.
В целом, логистическую регрессию можно использовать в следующих реальных сценариях приложений:
- кредитный рейтинг
- Рассчитайте показатель успеха маркетинговой кампании
- Прогнозировать доход от продукта
- Произойдет ли землетрясение в определенный день
5. Машина опорных векторов (SVM)
SVM — это алгоритм бинарной классификации. Учитывая два типа точек в N-мерных координатах, SVM генерирует (N-1)-мерную гиперплоскость, чтобы разделить точки на две группы. Предположим, у вас есть два типа линейно отделимых точек на плоскости, SVM найдет линию, которая делит точки на два типа, и эта линия находится как можно дальше от всех этих точек.
В масштабе некоторые из самых больших проблем, решаемых с помощью SVM (с соответствующими модификациями), включают медийную рекламу, распознавание мест сплайсинга человека, определение пола на основе изображений, крупномасштабную классификацию изображений…
6. Методы ансамбля
Ансамбльный подход — это алгоритм обучения, который классифицирует новые точки данных путем создания набора классификаторов, а затем голосования, взвешенного по их прогнозам. Первоначальным методом ансамбля было байесовское усреднение, но более поздние алгоритмы включают кодирование вывода с исправлением ошибок, пакетирование и повышение.
Так как же работает ансамблевый подход? И чем они лучше одной модели?
- Они усредняют предубеждения одной модели: если вы усредните опросы демократов и республиканцев вместе, вы получите сбалансированный результат, не в пользу ни одной из сторон.
- Они уменьшают дисперсию: общее мнение группы моделей более единообразно, чем отдельное мнение любой из них. В финансах это называется диверсификацией, и есть комбинации многих акций с меньшей неопределенностью, чем одна акция, поэтому ваша модель лучше с большим количеством данных.
- Они с меньшей вероятностью переобучат: если у вас есть отдельные модели, которые не переобучаются, просто объедините прогнозы этих моделей (среднее, средневзвешенное значение, логистическая регрессия), и результирующая модель также не будет переобученной.
Неконтролируемое обучение 7. Алгоритмы кластеризации
Кластеризация — это задача группирования ряда объектов с целью сделать объекты в одной группе (кластере) более похожими друг на друга, чем объекты в других группах.
Каждый алгоритм кластеризации отличается, вот несколько примеров:
- Алгоритмы на основе центроида
- алгоритм на основе соединения
- Алгоритмы на основе плотности
- вероятность
- Снижение размерности
- Нейронные сети / Глубокое обучение
8. Анализ основных компонентов (PCA)
PCA - это статистическая процедура, которая преобразует наблюдения набора потенциально коррелированных переменных в значения набора линейно некоррелированных переменных с помощью ортогонального преобразования Преобразованные переменные известны как главные компоненты.
Некоторые приложения PCA включают сжатие, упрощение данных для обучения, визуализацию и т. д. Обратите внимание, что знание предметной области очень важно при принятии решения о продолжении использования PCA. Случай, когда данные зашумлены (все компоненты PCA имеют высокую дисперсию), не применяется.
9. Разложение по сингулярным числам (SVD)
В линейной алгебре SVD — это факторизация комплексных матриц. Для данной m * n-матрицы M существует такое разложение, что M=UΣV, где U и V — унитарные матрицы, а Σ — диагональная матрица.
По сути, ППШ — это простое приложение СВД. В компьютерном зрении первые алгоритмы распознавания лиц использовали PCA и SVD для представления лиц как линейных комбинаций «собственных лиц», выполнения уменьшения размерности, а затем сопоставления лиц с идентичностями с помощью простых методов, хотя современные методы более сложны. подобные технологии.
10. Анализ независимых компонентов (ICA)
ICA — это статистический метод, в основном используемый для выявления скрытых факторов в случайных величинах, измерениях или концентрациях сигналов. ICA определяет генеративную модель для наблюдаемых многомерных данных, которые обычно представляют собой большую базу данных образцов. В модели предполагается, что переменные данных линейно смешиваются с некоторыми неизвестными скрытыми переменными, и способ смешивания также неизвестен. Предполагается, что скрытые переменные распределены не по Гауссу и не зависят друг от друга, и их называют независимыми компонентами наблюдаемых данных.
ICA связана с PCA, но когда эти классические методы полностью терпят неудачу, это более мощная техника, способная обнаружить основные факторы источника. Приложения включают цифровые изображения, базы данных документов, экономические индикаторы и психометрические данные.
Теперь примените свое понимание этих алгоритмов для создания приложений машинного обучения, которые улучшат опыт людей во всем мире.
Посмотреть исходный английский текст:
Ууху. См. nuggets.com/2016/08/10-…
Ответить после подписки "AI"Знаешь