Как стать специалистом по данным?

анализ данных

Это статья, написанная участниками DataCamp, зарубежной платформы обучения науке о данных, 8 Steps to Become a Data Scientist. Давайте подробнее рассмотрим, какой учебный контент и учебные ресурсы доступны.

Упомянутые здесь 8 шагов — это не то, что вы можете выполнить за 8 недель, а способ обучения. Хотя эти шаги не так просты, все они выполнимы и практичны. Пока вы вкладываете время в обучение и верите в накопленную силу времени, вы можете овладеть этим знанием.

Во-первых, кто такой специалист по большим данным?

Специалист по данным — это междисциплинарный человек, который лучше разбирается в статистике, чем инженер-программист, и лучше в разработке программного обеспечения, чем статистик. Знания, которые необходимо освоить, включают математическую статистику, навыки программирования, машинное обучение, исследовательские способности и т. д.

image.pngВ настоящее время большинство специалистов по данным имеют степень бакалавра или магистра (37% бакалавров, 31% магистров). Но не волнуйтесь, по данным опроса, 5% выпускников средних школ также становятся учеными данных. Этого достаточно, чтобы доказать, что пока ты усердно работаешь, чтобы обеспечить себя, герой не спрашивает источник.

image.pngШаг 1. Изучите статистику, математику и машинное обучение Ресурсы для их изучения приведены ниже. Если вы чувствуете, что эти ресурсы слишком сложны для изучения, вы можете начать с двух книг «Голая статистика» и «Статистика по-простому». Чтобы улучшить аналитическое мышление, вы можете прочитать книгу «Мышление, основанное на анализе данных».

image.pngШаг 2: Научитесь программировать Овладейте основами информатики и изучите весь процесс разработки системы, потому что то, что вы делаете, становится частью других систем.

Выберите язык программирования для анализа данных, например, R, Python и т. д. для программного обеспечения с открытым исходным кодом или SAS, SPSS и т. д. для коммерческого программного обеспечения.

image.pngКак систематически учить себя Python? ​www.zhihu.com

image.pngШаг 3: Понимание базы данных В большинстве практических проектов анализа данных большая часть данных хранится в базе данных, поэтому вам следует научиться работать с базой данных, такой как реляционная база данных MySQL, нереляционная база данных MongoDB и т. д.

image.pngКак выучить язык SQL? ​www.zhihu.comШаг 4. Изучите предварительную обработку данных, визуализацию и отчетность

  1. предварительная обработка данных

До 60% работы аналитика данных тратится на подготовку данных перед фактическим анализом. Цель предварительной обработки данных — преобразовать данные в то, что нам нравится, для последующего анализа и обработки. Например, сейчас многим девушкам нравится использовать Meitu Xiuxiu для фотосъемки, но их глаза не большие, поэтому я использую Meitu Xiuxiu, чтобы сделать их больше. Станьте тем, что вам нравится.

image.pngКак систематически изучать Excel? ​www.zhihu.com2. Визуализация данных заключается в отображении результатов анализа данных для удобства отображения.

3. Отчет о данных В качестве последнего шага анализа данных необходимо преобразовать анализ данных и результаты в простой для понимания отчет. Утилиты Power BI, Tableau, Spotfire.

image.pngБизнес-аналитика (БИ) ​www.zhihu.comШаг 5: Поднимитесь на уровень больших данных Когда вы начинаете обрабатывать огромные объемы данных, большинство проблем, которые необходимо решить специалистам по данным, не могут быть решены на одной машине, и вам необходимо обрабатывать большие наборы данных распределенным образом.Используемые инструменты — это Hadoop и Apache Spark.

image.pngПлан развития карьеры в науке о данных ​www.zhihu.comШаг 6. Больше практикуйтесь и больше общайтесь с специалистом по данным Даниэлем К счастью, в эпоху Интернета мы можем познакомиться с Дэниелом через Интернет и получить больше опыта и знаний из знаний, которыми они делятся. Конечно, вы также можете получить больше практического опыта, участвуя в конкурсах и выполняя небольшие проекты.

image.pngКак найти проект анализа данных самостоятельно? ​www.zhihu.comШаг 7: Стажируйтесь, практикуйтесь или найдите работу Лучший способ определить, являетесь ли вы настоящим специалистом по данным, — это использовать свои новые знания, чтобы принять вызов и войти в область анализа данных.

image.pngКак подать заявку на работу? ​www.zhihu.comШаг 8: Узнайте больше через профессиональные сообщества

image.pngанализ данных обезьян ​ zhuanlan.zhihu.com.

image.png