Путь роста и путь обучения специалиста по данным: как научиться ML/DL
предисловие
Я изучаю машинное обучение как исследователь-любитель с 2012 года, и я написал учебную заметку по модели SVM со ссылкой на множество материалов. В конце 2014 года я, наконец, освободил время и начал писать конспекты по таким моделям, как максимальная энтропия, адабуст, кластеризация, байесовская, LDA и т.д. Конечно, многие точки знаний и модели все еще слишком поверхностны, поэтому я продолжу учиться, когда у меня будет возможность.
Мы начали свой бизнес в начале 2015 года. Мы твердо верим, что хороший контент принесет пользу миллионам людей, полагаясь на онлайн-формат, и воплощая в жизнь мой единственный идеал, который оставался неизменным в течение последних нескольких лет: создавать ценность и помогать миллионам людей вести промышленность продвигает цивилизацию. К счастью, несмотря на спотыкания и спотыкания на протяжении всего 2015 года, все проблемы, наконец, были решены одна за другой. Конечно, нет недостижимой цели, неразрешимой проблемы и плохого общения. Однако по-настоящему понять утомляемость открытия своего дела могут только те, кто имел опыт открытия бизнеса на собственном опыте.За все 15 лет времени на обновление блога в принципе нет, разве что новая книга "Метод Programming: Interview and Algorithm Experience», выпуск которого откладывался почти на 3 года, наконец-то опубликован. Я люблю эту книгу, независимо от того, что я вложил в нее, она помогает некоторым людям, она работает для некоторых людей.
2016, второй год предпринимательства. Как написано в заметке CNN: «Хотя я не участвую ни в каких курсах, но поскольку компания постоянно проводит онлайн-курсы, связанные с машинным обучением, глубоким обучением и т. д., я всегда буду учиться и учиться по ходу дела». переписать технический блог с точки зрения одного из студентов, который сказал мне, что я могу «некоторые сложные на первый взгляд вещи выписать самым простым образом»? После написания заметок CNN, наш курс глубокого обучения вот-вот начнет второй период, а курс DL будет начинаться по одному периоду.В то время я подумал, помимо прослушивания класса, могу ли я что-то сделать с вами? В это время мои коллеги по рынку предложили нам провести несколько экспериментов по глубокому обучению, поэтому у нас есть серия интересных экспериментов по глубокому обучению, таких как обучение рисованию Ван Гога с помощью DL и автоматическая игра Flappy Bird с DL, что в конечном итоге привело почти 1000 человек подписались на нас. Играть с командой ассистентов очень весело!
Вступая в этот 2017 год, всего через два года после начала бизнеса. Количество студентов в компании колебалось от 0 до 20 000, преподавательский состав вырос с 1 до 21 человека, а типы курсов изменились с 2 до 11, что можно считать некоторыми достижениями. В последние два года мы всегда настаивали на качестве в первую очередь, в первую очередь на содержании, и всегда осмеливались быть первыми, включая первую отечественную облачную экспериментальную платформу GPU, запущенную в ноябре прошлого года, а затем коллеги по рынку снова предложили, почему бы не GPU в течение года в этом году ну вот недавно мы запустили 2017годовое членство: 2999 иен покрывает полный набор курсов по работе с данными и облачных сервисов GPU в течение года.
Оглядываясь назад на последние несколько лет, я начал организовывать вопросы для интервью в своем блоге, затем изучал и изучал структуры данных и алгоритмы, а затем начал изучать машинное обучение, глубокое обучение и 15 лет запуска бизнеса. с данными, хотя это всегда было личностью исследователя-любителя, который шпионил за дверью снаружи, но в конце концов он имеет глубокие корни в науке о данных.
С помощью роста компании в сети в июле и опираясь на ее мощные лекционные ресурсы и ресурсы курсов, я специально составил «Руководство по развитию Data Scientist» для друзей, которые хотят изучать науку о данных, машинное обучение и глубокое обучение в новых год. Дорога и познавательный маршрут», желаю всем друзьям новых вершин в новом году.
Путь роста и путь обучения специалиста по данным
Там куча материала, так что давайте перейдем к сути. Из так называемой многоэтажки на земле, чтобы заниматься наукой о данных, машинным обучением или глубоким обучением, нужно хотя бы в начале научиться обращаться с компьютерами. программирование.
Шаг 1: Научитесь программировать
Честно говоря, компьютерная система очень огромна.Помимо языков, структур данных и алгоритмов, огромны области компьютерной архитектуры, операционных систем, сетей, баз данных и т. д. Но в любом случае необходимо научиться кодировать, как программировать. Изучив основы языков, структур данных, алгоритмов и т. д., как вы можете еще больше улучшить свои навыки программирования? Проработка вопросов на LeetCode стала лучшим выбором для многих людей.
Рекомендуемые учебные пособия: «Урок алгоритма поиска работы на собеседовании», «Урок живого экзамена LeetCode».
Шаг 2: Твердая математика
Математика является важной основой для науки о данных. Если математика не является надежной, многие принципы, выводы и формулы в машинном обучении не могут быть полностью поняты. Например, один SVM требует математических знаний, таких как вывод и выпуклая оптимизация. Поэтому, если математика забыта, необходимо пересмотреть и заново укрепить основы математики.
Обложки: исчисление, математическая статистика и теория вероятностей, матрицы, выпуклая оптимизация
Рекомендуемые книги: Краткая история математической статистики, матричный анализ и приложения Чжан Сянда, Выпуклая оптимизация
Рекомендуемые курсы: 《Математические занятия по машинному обучению》
Шаг 3: Освойте Python для науки о данных
Python очень популярен в сегодняшнем анализе данных.Он широко используется в анализе больших данных в области финансов, электронной коммерции и других областях.Он также очень удобен для обработки данных работниками данных.Поэтому Python становится все более и более распространенным используется в поле данных.
Рекомендуемые учебные пособия: «Вводный курс Python Basic», «Основы Python».Класс анализа данных Python", "Класс проекта поискового робота Python"
Шаг 4. Начните изучать машинное обучение
Методы машинного обучения широко используются во многих областях, включая интеллектуальный анализ данных, поиск, рекомендации, рекламу, обработку естественного языка и многое другое. Таким образом, обучение машинному обучению является необходимым условием для большего количества областей применения. Кроме того, обучения машинному обучению недостаточно только для изучения одной модели и алгоритма, потому что в реальной работе машинного обучения анализ проблем, обработка данных и обработка функций составляют большую часть работы. Так что не думайте, что вы нашли сокровище, когда видите, что курс охватывает множество моделей/алгоритмов.Чтобы увидеть, есть ли в курсе машинного обучения реальный промышленный бой, одним из самых быстрых критериев оценки является то, говорит ли он об этом и есть ли он может хорошо рассказать о разработке функций, настройке модели и других инженерных моментах.
Рекомендуемые книги: PRML
Рекомендуемые курсы: 《Класс машинного обучения》
Шаг 5. Дальнейшее изучение DL
Благодаря все более мощным вычислительным мощностям компьютеров расширенная версия глубокого обучения нейронных сетей (правильно и позвольте мне назвать такое непрофессиональное название) становится все более популярной, от AlphaGo, беспилотного вождения, до недавнего AlphaGo 2.0, захлестнувшего мир. можно сказать, что ИИ находится в центре внимания лучших шахматистов Китая, Японии и Южной Кореи. люди и говорят, что я занимаюсь компьютерной техникой.
Рекомендуемый курс: Первая отечественная платформа, обеспечивающая реальный бой на облачной платформе GPU.Курс глубокого обучения》
Шаг 6. Проводите эксперименты и практикуйтесь на kaggle
На бумаге я чувствую себя мелким, и я абсолютно точно знаю, что должен это сделать. Независимо от того, сколько теоретических исследований существует, они все равно должны быть практическими. Чтобы снизить порог, вы можете начать с интересного эксперимента по глубокому обучению, например, научить Ван Гога рисовать, автоматически играть в птичку и т. д. Затем почистите еще несколько проектов конкурса данных на kaggle.
Рекомендуемые курсы: в дополнение к фактическим курсам по машинному обучению и глубокому обучению, указанным выше, мы также рекомендуем "Боевой класс кейса Kaggle", "Класс проекта машинного обучения", "Класс проекта глубокого обучения"
Шаг 7: Стажировка или работа
Если вы хотите заниматься интеллектуальным анализом данных, компьютерным зрением, обработкой естественного языка, вы можете продолжить изучение связанных курсов:www.julyedu.com/route. Кроме того, многие классические недавние статьи заслуживают прочтения. Если этого достаточно, давайте официально выйдем в реальный мир: найдите работу и сделайте это!
Рекомендуемая компания: более крупная компания с ресурсами и данными
использованная литература
- «Путь роста и путь обучения ученых данных»
- "Июльское годовое онлайн-членство: 2999 иен за полный год курсов по работе с данными и год облачных сервисов на GPU.》
- "Научите вас использовать DL, чтобы изучить живопись Ван Гога от начала до конца: GTX 1070 cuda 8.0, версия GPU с тензорным потоком》
- "Научу вас использовать DQN для автоматического воспроизведения Flappy Bird от начала до конца (полная командная строка, версия GPU+CPU)》
- «Математический класс в машинном обучении»
- «Класс анализа данных Python»
- «Октябрьский класс алгоритмов машинного обучения»
- «Ноябрьский класс глубокого обучения»
- "боевой класс kaggle case"
- "Как начать работу с машинным обучением》
постскриптум
Об июльском онлайн-курсе моей компании я могу рассказать в трех предложениях: 1. Это самое раннее, самое профессиональное и крупнейшее учебное заведение в области данных в Китае. 2. Единственное учреждение с полной системой учебных программ по науке о данных. 3. Первое в мире. миру, чтобы предоставить облако GPU на весь год.
Кроме того, о сложности изучения науки о данных можно сказать в одном предложении: пока вы хотите учиться, вы хотите делать, нет ничего, чему вы не могли бы научиться или не могли бы сделать.
Июль Онлайн июль, 15 января 2017 г.