Эта статья написана [Передовая линия ИИ] Оригинал, исходная ссылка:t.cn/RHqaB5p
Автор|Танмой Рэй
Переводчик|Сюэ Миндэн
Редактор | Эмили
Руководство по передовой ИИ: "В 2017 году большие данные выдвинули ИИ в центр технологической шумихи, а наука о данных и машинное обучение начали появляться во всех отраслях. Машинное обучение начинают применять для решения задач анализа данных. Машинное обучение, искусственный интеллект и прогнозная аналитика были горячими темами в 2017 году. Мы стали свидетелями инноваций, основанных на данных, включая платформы обработки данных, глубокое обучение и облачные сервисы машинного обучения от крупных поставщиков, а также машинный интеллект, предписывающую аналитику, поведенческую аналитику и Интернет вещей. В 2018 году темпы развития ИИ ускорятся, и этот год станет годом возрождения технологии ИИ и переопределения науки о данных. Для начинающих специалистов по данным, как они выделяются на рынке труда, связанном с наукой о данных? Будет ли достаточно рабочих мест в сфере обработки данных в 2018 году? Или есть вероятность усадки? Далее давайте проанализируем тенденции в науке о данных и выясним, как получить хорошую работу в области больших данных и машинного обучения/ИИ в будущем. "
Повысить техническую силу
Языки программирования и средства разработки
365 Data Science собрал информацию от 1001 специалиста по данным в LinkedIn и обнаружил, что языками программирования, пользующимися наибольшим спросом, были R, Python и SQL. Кроме того, требуется знание MATLAB, Java, Scala и C/C++. Чтобы выделиться, вам нужно владеть такими инструментами, как Weka и NumPy.
Вероятность и статистика, прикладная математика и алгоритмы машинного обучения
Вам необходимо иметь четкое представление о вероятности и статистике, а также изучать и осваивать такие алгоритмы, как наивный байесовский анализ, гауссовские смешанные модели, скрытые марковские модели, матрица путаницы, кривая ROC, P-значение и т. д.
Вам нужно не только понимать эти алгоритмы, но и знать, как они работают. Вам нужно хорошо разбираться в градиентном спуске, выпуклой оптимизации, методологии Лагранжа, квадратичном программировании, дифференциальных уравнениях в частных производных, квадратурах и других связанных алгоритмах.
Если вы хотите найти высокооплачиваемую работу, вам также необходимо освоить методы и алгоритмы машинного обучения, такие как k-NN, Naive Bayes, SVM и леса решений.
Распределенные вычисления и инструменты Unix
В наши дни большая часть машинного обучения требует огромных объемов данных, поэтому вы не можете выполнять машинное обучение на одной машине. Итак, вам нужно использовать кластеры, вам нужно освоить Apache Hadoop и некоторые облачные сервисы, такие как Rackspace, Amazon EC2, Google Cloud Platform, OpenStack и Microsoft Azure.
Вам также необходимо освоить различные инструменты Unix, такие как cat, grep, find, awk, sed, sort, cut, tr и т. д. Поскольку машинное обучение в основном работает в системах Unix, вам необходимо освоить эти инструменты, знать, что они делают и как их использовать.
Языки запросов и базы данных NoSQL
Традиционные реляционные базы данных устарели. Помимо Hadoop, вам необходимо освоить SQL, Hive и Pig, а также базы данных NoSQL, такие как MongoDB, Casssandra, HBase.
Инфраструктуры, основанные на распределенных базах данных NoSQL, стали основой хранилищ больших данных. Задача, которая раньше занимала 20 часов в центральной реляционной базе данных, может занять всего 3 минуты в большом кластере Hadoop. Конечно, вы также можете использовать такие инструменты, как MapReduce, Cloudera, Tarn, PaaS, Chef, Flume и ABAP.
инструмент визуализации данных
Осваивая языки программирования и алгоритмы, не забывайте о роли визуализации данных. Данные бессмысленны, если вы не можете заставить себя или кого-то еще понять их. Визуализация данных — это показ данных нужным людям в нужное время, чтобы они могли извлечь из них пользу. Основные инструменты визуализации данных включают в себя: Tableau, QlikView, тепловые карты Someka, FusionCharts, Sisense, Plotly, Highcharts, Datawrapper, D3.js, ggplot и другие.
Правильный выбор образования и специальности
Вам не нужно иметь степень в области науки о данных, чтобы стать специалистом по данным. На самом деле, вам вообще не нужно этого делать, и это не очень хорошая идея. Если вы можете получить степень в области информатики, инженерии, экономики, математики, статистики, актуарии, финансов или степень в области естественных наук (физики, химии или биологии), это нормально. Даже гуманитарные науки (включая социальные науки) в порядке.
Исследование, проведенное 365 Data Science, показывает, что 20% ученых данных имеют степень в области вычислительной техники, 19% имеют опыт работы в области статистики или математики, а 19% специализируются в области экономики и социальных наук. Только 13% имеют солидную степень по науке о данных. Однако очень немногие университеты предлагают степень бакалавра в области науки о данных, и большинство из них предлагают степень магистра. Поскольку эта профессия является новой, нет сомнений, что многие люди не будут знакомиться с наукой о данных на уровне бакалавриата.
Если вы сможете продолжить учебу и получить степень магистра или доктора в области науки о данных или машинного обучения/ИИ, это, естественно, поможет вам, особенно если вы хотите найти работу специалиста по данным в компании из списка Fortune 500. Исследование 365 Data Science показало, что 48% и 27% из 1001 специалиста по данным имеют степень магистра и доктора наук соответственно.
Тем не менее, степень магистра действительно не так просто получить, но если вы сможете ее получить, она определенно будет более мощной. Если вы хотите работать в области анализа данных, но не обязательно знакомы с наукой о данных и машинным обучением, степень магистра не требуется. Вы можете получить работу в области анализа данных без степени магистра. Не путайте науку о данных с аналитикой данных.
Получите практический опыт
После стажировки 18% могут сразу перейти в область науки о данных. Итак, если у вас уже есть степень магистра, лучше сначала найти стажировку, а не сразу идти в докторантуру.
На самом деле лишь немногие компании напрямую и формально нанимают новых специалистов по обработке и анализу данных. Большинство из них начинали как аналитики (анализ данных, BI-анализ), стажеры, ИТ-специалисты, инженеры-программисты и консультанты. Только 2% поначалу занимаются наукой о данных.
Интересно, что 27% специалистов по данным являются докторами наук, поэтому университеты естественным образом становятся колыбелью для подготовки специалистов по данным, а некоторых университетских ученых напрямую нанимают, чтобы они стали специалистами по данным. Кроме того, люди, работающие в сфере ИТ, с большей вероятностью станут учеными данных, чем те, кто работает в сфере консалтинга, поэтому солидный опыт программирования, безусловно, является преимуществом.
В какой-то степени важны рейтинги колледжей
Ряд исследовательских данных показывает, что лучшие колледжи и университеты выпускают больше специалистов по обработке и анализу данных.
28% высокооплачиваемых специалистов по обработке и анализу данных — из 50 лучших университетов мира, хотя 25% — из университетов, не входящих в рейтинги.
Итак, это имеет определенное отношение к школьному рейтингу, но не ко всему. Знания, техническая мощь и практический опыт важнее, чем аспирантура. Требуется практический опыт и хорошие навыки программирования, а хорошая школа — это вишенка на торте, но не решающий фактор.
Пройдите онлайн-курсы обучения
Я давно хожу на онлайн-курсы. Чтобы устроиться на работу специалистом по данным или получить степень магистра в области анализа данных, вам необходимо получить образование.
40% специалистов по данным прошли онлайн-курсы обучения. Кроме того, в среднем каждый человек получил 3,33 сертификата. Итак, чтобы стать хорошим специалистом по данным, вам нужно обучаться, проходя онлайн-курсы, просматривая видеоматериалы и получая сертификаты MOOC.
Укрепляйте свои мягкие навыки
Наука о данных — это все о математике, программировании и технологиях. Но на современном рабочем месте, основанном на данных, также важны социальные навыки, такие как коммуникативные навыки, интеллектуальное любопытство, креативность, культурный интеллект, эмоциональный интеллект и деловая хватка.
любопытство
Конечной целью науки о данных является исследование, открытие новых идей инновационными способами. Хорошие специалисты по данным движимы интеллектуальным любопытством к изучению данных различными инновационными способами. Хорошим компаниям нужны не только люди, которые могут ответить на вопросы, но и люди, которые умеют их задавать.
позитив и страсть
Есть люди, которые могут заниматься тем, что отражает их страсть вне учебы и работы.Эти люди больше нравятся рекрутерам, поэтому, пожалуйста, проявите инициативу, чтобы присоединиться к некоторым проектам по науке о данных, чтобы решить некоторые практические бизнес-задачи или провести исследование. Способность мыслить новаторски и находить новые решения старых проблем — главная основа, отличающая хороших специалистов по данным от средних специалистов по данным.
Коммуникабельность и аналитические способности, умение работать в команде
Хороший специалист по данным — это связующее звено между технической и бизнес-командой. Как специалист по данным, вы должны быть хорошим коммуникатором.
Иногда хочется изложить факты так, чтобы все могли их понять. Если результаты вашего анализа данных предполагают, что стратегия вашей компании нуждается в изменении, вам нужно использовать хорошие навыки межличностного общения, чтобы направить компанию в правильном направлении.
деловая хватка
Как специалист по данным, вы должны иметь очень глубокое понимание своей отрасли — отраслевых тенденций, болевых точек клиентов, конкурентов. Вы должны знать, какую бизнес-проблему пытается решить компания. Специалисты по данным должны знать, какую проблему решить и как найти правильное решение. Глубокое понимание бизнеса и способность согласовать его с предпочтениями клиентов, жизненным циклом продукта и целями прибыльности являются ключом к поиску креативных решений.
Подготовьтесь к интервью
Не забудьте уделить время подготовке к интервью. Неважно, насколько вы опытны, интервьюер всегда найдет способ выбить вас из колеи вопросами, которых вы не знаете. На собеседовании интервьюер может задавать различные вопросы, требующие от кандидатов очень сильных технических навыков, сильной способности противостоять давлению, творческого мышления и хороших коммуникативных навыков. Интервьюеры проверят ваши знания, навыки программирования и моделирования данных различными способами, поэтому заблаговременная подготовка является ключом к успешному приему на работу.
в заключении
В 2018 году отрасли требуется около 1 млн специалистов по данным. Искусственный интеллект, большие данные и технологии IoT используются для извлечения новых бизнес-идей и, по оценкам Forbes, «к 2020 году будут украсть 1,2 триллиона долларов в год у своих спящих коллег». Однако, чтобы попасть в эту область, убедитесь, что у вас достаточно страсти к статистике, программированию и моделированию данных, а не просто следуете за толпой или гонитесь за высокими зарплатами.
Но, возможно, вам будет лучше в других областях, таких как экономика, прикладная математика или инженерия. Первое, что нужно сделать, это определить, подходит ли вам путь науки о данных. 2018 год определенно не разочарует тех, кто хочет попробовать себя в области науки о данных. Но опять же, аналитический ум, опытные навыки программирования, искренний энтузиазм и настойчивость в постоянном самосовершенствовании определят, как далеко вы пойдете как специалист по данным.
Оригинальная ссылка:
ууууууу.стоял NT.com/blog/285/ ок…
Ответить после подписки "AI"Знаешь