Добро пожаловать, чтобы следовать за нами, учебники по искусственному интеллекту, учебные ресурсы, интересные научно-популярные, бумажные интерпретации, все, что вы хотите увидеть, здесь!
В последнее время многие студенты стремятся попробовать и хотят инвестировать в объятия ИИ, но они не знают, с чего начать. Среди них ядром искусственного интеллекта является машинное обучение (Machine Learning), которое является основным способом сделать компьютеры интеллектуальными, и его приложения можно найти во всех областях искусственного интеллекта.
Сегодня мы собираемся поделиться учебным пособием от EliteDataScience, посвященным внедрению машинного обучения для самообучающихся, которое шаг за шагом научит вас, как перейти от новичков к мастерам машинного обучения. Садитесь в автобус, не ищите монет, этому автобусу деньги не нужны!
Вы готовитесь научиться машинному обучению, но не знаете, как это сделать?
Сегодня в этой статье мы научим вас, как бесплатно получить образование мирового уровня в области машинного обучения, не имея докторской степени или технического специалиста. Если вы хотите стать специалистом по данным или использовать алгоритмы машинного обучения в разработке, вы действительно можете изучить и применить машинное обучение быстрее, чем вы думаете.
В этой статье рассказывается о нескольких шагах на пути к машинному обучению, чтобы вы не заблудились, давайте начнем наше выступление.
Первый шаг: сначала понять, что такое машинное обучение
Прежде чем изучать машинное обучение, лучше всего выяснить, что такое машинное обучение, и понять основные концепции машинного обучения.
Проще говоря, машинное обучение — это обучение компьютеров тому, как учиться на данных для принятия решений или прогнозов. Для настоящего машинного обучения компьютеры должны научиться распознавать модели без явного программирования.
Машинное обучение находится на пересечении информатики и статистики, и оно будет проявляться в разных формах во многих областях.Например, вы должны были слышать эти термины:Наука о данных, большие данные, искусственный интеллект, прогнозная аналитика, компьютерная статистика, интеллектуальный анализ данных...
Хотя между машинным обучением и этими областями есть много общего, их не следует путать. Например, машинное обучение — это инструмент в науке о данных, который также можно использовать для обработки больших данных.
Само машинное обучение также делится на несколько типов, таких как обучение с учителем, обучение без учителя, обучение с подкреплением и так далее. Например:
Почтовые операторы классифицируют нежелательную рекламную информацию в мусорные баки и применяют обучение с учителем в машинном обучении; компании электронной коммерции классифицируют потребителей, анализируя данные о потреблении, и применяют обучение без учителя в машинном обучении; обучение с подкреплением используется, когда компьютеры и камеры в автомобилях, управляемых людьми, взаимодействуют с дорога и другие транспортные средства, чтобы научиться ориентироваться.
Для ознакомления с машинным обучением ознакомьтесь с некоторыми онлайн-курсами. Для тех, кто хочет получить общее представление о ключевых концепциях в области машинного обучения, вводный курс профессора Ву Энда по машинному обучению обязателен к просмотру:кликните сюда.
А курс «Введение в машинное обучение» Себастьяна Труна, «отца беспилотных транспортных средств», представляет собой подробное введение в машинное обучение, дополненное большим количеством операций программирования, которые помогут вам закрепить изученное:кликните сюда.
Конечно, есть также бесплатная колонка, организованная и подготовленная Jizhijun, где вы можете избежать проблем с установкой среды и напрямую инвестировать в простое обучение машинному обучению:
Краткое руководство по машинному обучению во время просмотра и практики
Эти курсы бесплатны!
После примерного понимания машинного обучения мы подходим к этапу подготовки знаний.
Шаг 2: Предварительные знания
Машинное обучение кажется пугающим без базовой базы знаний. Чтобы научиться машинному обучению, вам не нужно быть профессиональным математиком или отличным программистом, но вам нужны базовые навыки в этих областях.
Хорошей новостью является то, что после того, как предварительные этапы завершены, все остальное довольно просто. По сути, машинное обучение — это, по сути, применение понятий статистики и компьютерных наук к данным.
Основная задача этого шага — убедиться, что вы не отстаете в программировании и статистике.
2-1: Программирование на Python для науки о данных
Если вы не знаете программирования, вы не можете использовать машинное обучение. К счастью, вот бесплатный учебник по изучению языка Python для науки о данных:кликните сюда.
Примечание: Jinglue Jizhi добавляет еще три ресурса:
[Введение в Python] 01 Основные правила
Полное руководство по изучению Python в науке о данных с нуля
а такжеОбзор более 40 учебных ресурсов по Python
2-2: Статистика для науки о данных
Знание статистики, особенно байесовской вероятности, является важным требованием для многих алгоритмов машинного обучения. Вот учебник по изучению статистики в обучении данных:кликните сюда.
2-3: Математические знания, которые необходимо изучить
Изучение алгоритмов машинного обучения требует определенных знаний линейной алгебры и многомерного исчисления в качестве основы. Нажмите здесь, чтобы получить бесплатное учебное пособие:кликните сюда.
Шаг 3: Включите «режим губки» и изучите как можно больше основных знаний.
Так называемый «режим губки» заключается в том, чтобы впитать как можно больше принципов и знаний машинного обучения, как губка впитывает воду.Этот шаг чем-то похож на первый шаг, но разница в том, что первый шаг должен иметь предварительное понимание машинного обучения.Этот шаг заключается в освоении соответствующих принципов.
Некоторые студенты могут подумать: я не хочу заниматься фундаментальными исследованиями, зачем мне осваивать эти принципы, если я могу использовать инструментарий машинного обучения?
Это нормально, но для всех, кто хочет применить машинное обучение в своей работе, очень важно изучить основы машинного обучения. Например, вы можете столкнуться со следующими проблемами в прикладном машинном обучении:
-
Сбор данных — трудоемкий и трудоемкий процесс.Вам нужно подумать: какой тип данных мне нужно собирать? Сколько данных мне нужно? и так далее.
-
Предположения о данных и предварительная обработка. Разные алгоритмы требуют разных предположений о входных данных.Как я могу предварительно обработать свои данные? Надежна ли моя модель на отсутствие данных?
-
Интерпретируйте результаты модели. Представление о том, что машинное обучение — это «черный ящик», явно ошибочно. Да, не все результаты модели можно интерпретировать напрямую, но нужно уметь судить о состоянии модели и улучшать их.Как я могу определить, переоснащает модель или недообучает? Сколько возможностей для улучшения есть у модели?
-
Оптимизация и отладка моделей. Мало у кого получается оптимальная модель с самого начала, нужно разбираться в нюансах и методах регуляризации между разными параметрами.Если моя модель переоснащена, как я могу это исправить? Стоит ли объединять несколько моделей вместе?
Чтобы ответить на эти вопросы в исследованиях машинного обучения, необходимо овладеть принципами машинного обучения. Вот два курса машинного обучения мирового класса, которые определенно принесут вам большую пользу:
- Гарвардский курс машинного обучения позволит вам понять весь процесс от сбора данных до их анализа:кликните сюда.
(Подсказка: этот курс более эффективен, если его есть вместе с курсом профессора Ву Энда)
- Курс машинного обучения Стэнфордского университета четко объясняет основные концепции машинного обучения:кликните сюда.
Также стоит прочитать два справочника: Introduction to Statistical Learning и Fundamentals of Statistical Learning.
Оригинальный адрес загрузки английской версии этих двух книг:
«Введение в статистическое обучение»
Элементы статистического обучения
Примечание. Учащиеся, не знакомые с оригинальной английской версией, могут читать китайскую версию этих двух книг.
Jizhi также рекомендует посетить форумы по машинному обучению на Reddit:
Конечно, раздел машинного обучения на Quora тоже очень интересен:кликните сюда.
Передовые знания при посещении форумов увидеть непросто.Нельзя постоянно находиться в стадии новичка.Для апгрейда необходимо читать профессиональные статьи. Отличным местом для посещения является arXive, коллекция препринтов статей по физике, математике, информатике и биологии.
раздел искусственного интеллекта
Если вам слишком сложно искать статьи самостоятельно, вы можете зарегистрировать учетную запись на веб-сайте arxiv-sanity.com, который будет предлагать вам последние статьи на arXive в соответствии с вашими собственными интересующими тегами.
Шаг 4: Целенаправленная практическая практика
После включения «режим губки» вы должны были освоить базовые концепции машинного обучения, а затем пришло время применить их на практике. Практика — это, прежде всего, совершенствование ваших навыков посредством конкретной, продуманной практической практики. На этом шаге преследуются три цели:
-
Практикуйте весь процесс машинного обучения: собирайте данные, предварительно обрабатывайте и очищайте данные, создавайте модели, обучайте и отлаживайте модели, а также оценивайте модели.
-
Практикуйтесь в операциях с реальными наборами данных. Вы должны постепенно наращивать свою способность суждения о том, какие данные подходят для того или иного типа модели.
-
Углубленное исследование: например, на предыдущем шаге вы много узнали об алгоритмах машинного обучения, а на этом шаге вам нужно применить различные типы алгоритмов к набору данных и посмотреть, какие из них работают лучше всего.
После того, как этот шаг завершен, более масштабные проекты готовы.
4-1 Девять основных частей
Машинное обучение — очень широкая и богатая область, находящая применение практически во всех отраслях. Поскольку есть так много вещей, которые нужно изучить, новичкам легко запаниковать, и легко заблудиться и упустить из виду общую картину, столкнувшись с множеством моделей.
Поэтому мы грубо делим машинное обучение на девять частей:
Целостное обучение машинному обучению:
Основные принципы машинного обучения, такие как компромиссы дисперсии.оптимизация:
Алгоритмы поиска оптимальных параметров модели.Предварительная обработка данных:
Обработка отсутствующих данных, асимметричных распределений, выбросов и т. д.Выборка и разделение:
Как разделить набор данных, чтобы настроить параметры и избежать переобучения.Обучение под наблюдением:
Обучение на размеченных данных с использованием моделей классификации и регрессии.неконтролируемое обучение
Обучение на неразмеченных данных с использованием моделей факторного и кластерного анализа.Оценка модели
Принимайте решения на основе различных показателей производительности.интегрированное обучение
Комбинируйте разные модели для достижения лучшей производительности.коммерческое приложение
Как машинное обучение может помочь в различных типах бизнес-операций.4-2 Практические инструменты
Новичкам мы рекомендуем использовать готовые алгоритмы, чтобы вы могли потратить время на знакомство с процессом машинного обучения, а не на написание алгоритмов. В зависимости от языка программирования, который вы используете, есть два хороших инструмента:
Scikit-Learn для Python:Учебник по поке
Каретка в языке R:Учебник по поке
4-3 Практические операции с наборами данных
Этот шаг требует реальной операции построения и отладки модели с набором данных, то есть превращения теории, которую вы изучили на этапе «режим губки», в код. Мы рекомендуем вам начать с наборов данных из Репозитория машинного обучения UCI, Kaggle и http://Data.gov:
Шаг 5: Проект машинного обучения
Наконец добрался до последнего шага, тоже очень интересного шага. На данный момент мы выполнили: запас знаний, освоение основных принципов, целевые упражнения и т.д., и теперь мы готовы исследовать более крупные проекты:
Цель этого шага — попрактиковаться в применении методов машинного обучения для полного сквозного анализа.
Задание: Выполните приведенные ниже пункты в порядке от простого к сложному.
5-1: Прогнозы выживших на «Титанике»
Прогнозирование выживших на «Титанике» — довольно популярный выбор при практике машинного обучения, и существует множество руководств, которым можно следовать.
5-2 Напишите алгоритм с нуля
Мы рекомендуем начать с простых вещей: логистической регрессии, деревьев решений, k-ближайших соседей и т. д.
Если вы застряли на полпути, вот несколько советов для справки:
-
Википедия — хороший источник псевдокода для некоторых распространенных алгоритмов.
-
Взгляните на исходный код некоторых готовых наборов инструментов ML для вдохновения.
-
Разбейте алгоритм на части. Напишите функции разделения для выборки, градиентного спуска и т. д.
-
Прежде чем приступить к написанию всего алгоритма, давайте напишем простое дерево решений.
5-3 Выберите интересный проект или сферу интересов
На самом деле, это должно быть лучшей частью машинного обучения.Вы можете использовать машинное обучение для реализации собственных идей.
Если у вас действительно нет хорошей идеи, вот 8 забавных практических проектов по машинному обучению для начинающих:кликните сюда.
Эпилог
Если вы будете следовать этому шагу, чтобы учиться шаг за шагом, я верю, что вы в конечном итоге добьетесь небольшого успеха в машинном обучении!
У нас также есть 10 небольших советов для новичков в машинном обучении:
-
Ставьте перед собой цели и сроки обучения и делайте все возможное для их достижения.
-
Заложите хорошую основу для обучения и освойте базовую теорию.
-
Объедините практическую теорию, не сосредотачивайтесь только на одном аспекте.
-
Попробуйте самостоятельно написать несколько алгоритмов с нуля.
-
Думайте о проблемах с разных точек зрения и находите практические проекты, которые вас интересуют.
-
Подумайте, какую ценность может принести каждый алгоритм.
-
Не верьте шумихе вокруг машинного обучения в научно-фантастических фильмах.
-
Слишком много игнорируйте онлайн-дебаты о знаниях ML.
-
Больше думайте о «вводе/выводе» данных и больше спрашивайте «почему».
-
На Jizhi улучшите себя в первый раз→→Джижи
Наконец, я желаю студентам успехов в учебе!
Примечание. Исходный текст написан на английском языке, поэтому большинство перечисленных учебных ресурсов доступны на английском языке. Если вы беспокоитесь о том, что ваш английский не очень хорош, это не имеет значения, потому что идеи обучения одинаковы, и можно искать материалы для изучения китайского языка на соответствующем этапе.
Обратите внимание на домашнюю страницу Jinglue Jizhi Nuggets и не пропустите замечательный контент!