Понимание: наука о данных, машинное обучение, аналитика данных, бизнес-аналитика

машинное обучение искусственный интеллект программист анализ данных
Сборник | Чжоу Сяолу
Редактор | Винсент
Руководство по передовой ИИ:Благодаря этой статье вы можете получить предварительное представление о науке о данных и ее основных разделах, включая бизнес-аналитику, анализ данных, бизнес-аналитику, расширенную аналитику, машинное обучение и искусственный интеллект.

Для получения дополнительных галантерейных товаров, пожалуйста, обратите внимание на публичный аккаунт WeChat «AI Frontline» (ID: ai-front)

Наука о данных, модное слово на данный момент, многие люди пытались определить ее с помощью историй успеха.

Чтобы поговорить об этом, мы должны начать с других областей, связанных с наукой о данных — бизнес-аналитики, аналитики данных, бизнес-аналитики, расширенной аналитики, машинного обучения и, наконец, ИИ.

Мы понимаем, что «абсолютное определение» науки о данных требует знания большого количества контекста «науки о данных», чтобы понять, это бесконечный цикл ... Здесь предполагается, что статистик или программист понимает науку о данных лучше, чем историк или язык. ученым гораздо проще, потому что первые в той или иной степени знакомы с наукой о данных.

Исходя из этого предположения, возможно, «относительное определение» науки о данных имеет больше смысла, о чем и пойдет речь в этой статье.

Следующая диаграмма Эйлера описывает взаимосвязь между всеми упомянутыми выше полями.Каждый цвет представляет собой отдельное поле (смешанные цвета представляют междисциплинарные области), абсцисса представляет ось времени, а каждая область представляет вариант использования.

Рисунок 1. Расположение, форма и цвет каждой квадратной области указывают на концептуальное сходство и различие, а не на сложность

Много информации, мы начинали с нуля.

Бизнес

Чтобы избежать чрезмерного упрощения вопроса, давайте предположим, что слово "бизнес" не нуждается в определении. Вот некоторые примеры деловой практики:

  • бизнес-кейс

  • Качественный анализ

  • Отчет о исходных данных

  • Визуальный отчет

  • Создание дашборда

  • Прогноз продаж

Это все в синей зоне

данные

Здесь действительно начинается диаграмма Эйлера.Если мы добавим данные к этой диаграмме, мы получим 2 больших поля и их междисциплинарность, всего 3 части.

С помощью начального выбора термина мы можем поместить последние четыре термина пересечения бизнеса и данных, которые являются фиолетовыми областями на текущем графике. Поскольку «Отчетность по исходным данным», «Создание информационных панелей» и «Прогнозирование продаж» — все это бизнес-практики, основанные на данных.

Сравните это с «бизнес-кейсами» и «качественным анализом», терминами, которые, хотя и в бизнесе, также важны, основываясь на прошлых знаниях, опыте и поведении, но вы скоро узнаете, что это не совсем наука о данных.

Аналитика против аналитики

Анализ означает разделение вашей проблемы на поддающиеся решению части, каждую из которых можно изучать отдельно, и отслеживание взаимосвязей между частями.

Аналитика, с другой стороны, представляет собой применение логических и вычислительных рассуждений к компонентам, полученным в ходе анализа. И в процессе люди ищут шаблоны и изучают будущее использование этого шаблона.

Поэтому по сравнению с бизнесом и данными мы должны эффективно использовать бизнес-анализ и анализ данных.

время

Прежде чем идти дальше, давайте представим временную шкалу, которая важна для последующих разделов.

Мы будем использовать три состояния — прошлое, настоящее и будущее.

Вертикальная линия на диаграмме представляет настоящий момент для любой аналитической проблемы, левая часть вертикальной линии представляет собой аналитику в прошлом, а правая часть вертикальной линии представляет прогнозную аналитику.

Последние две части анализа можно добавить к диаграмме.

«Прогноз продаж» находится справа, и, как следует из названия, это процесс перспективного анализа. Очевидно, что «качественный анализ» использует вашу интуицию и опыт для планирования вашего следующего шага, так что это еще один перспективный термин.

наука о данных

Для большинства читателей следующее станет кульминацией этой статьи. Наука о данных — это область, которая не может жить без данных, поэтому она полностью будет находиться в области анализа данных на графике.

Так как же это связано с бизнес-аналитикой?

В результате часть, которая принадлежит как анализу данных, так и бизнес-анализу, должна быть наукой о данных.

Обратите внимание, однако, что есть процессы науки о данных, которые не являются непосредственно бизнес-анализом, а анализом данных. Например, «оптимизация буровых работ» требует инструментов и методов обработки данных, которые являются частью повседневной работы специалистов по данным. Но в нефтяной отрасли мы не можем связать это с бизнес-анализом.

Чтобы лучше понять это, можно ввести понятие «соответствующие определения». «Цифровая обработка сигналов» — это акт анализа данных, но не наука о данных и не бизнес-анализ. Данные, программы и математика играют определенную роль в науке о данных, но в разных ролях.

В соответствии с вышеизложенным, мы заканчиваем этот раздел временной шкалой — той частью, где наука о данных существует как в прошлом, так и в будущем.

Это также поднимает другой вопрос: существует ли поле, ориентированное только на прошлое?

Бизнес-аналитика

Бизнес-аналитика — это процесс анализа и отчетности по прошлым данным.

Ориентировано ли оно на прошлое? Не обязательно, но прогнозная аналитика не входит в бизнес-аналитику. Регрессия, классификация и все другие типичные методы прогнозирования являются частью науки о данных, но не бизнес-аналитики. Это также определяет положение этой вертикальной линии.

Кроме того, бизнес-аналитика является надлежащим подмножеством науки о данных, поэтому, когда кто-то имеет дело с описательной статистикой, отчетами или визуализацией прошлых событий, его поведение является одновременно бизнес-аналитикой и наукой о данных.

Машинное обучение и ИИ

Определения здесь будут немного расплывчатыми, так как объяснение обеих концепций сделало бы эту статью нецелевой, а по концепциям машинного обучения есть много материала, особенно по KDnuggets.

Искусственный интеллект (ИИ) — это любая форма интеллекта, демонстрируемая машинами, имитирующая естественный (человеческий) интеллект, например планирование, обучение, решение проблем и т. д.

Машинное обучение (ML) — это способность машин предсказывать результаты, когда они явно не запрограммированы на это.

ML — это один из способов ИИ, но их часто путают, потому что, судя по исследованиям на людях, ML — единственный жизнеспособный путь к ИИ.

На рисунке эти два термина находятся в следующих позициях.

Машинное обучение — это анализ данных, потому что оно не может быть выполнено без данных. Он также пересекается с наукой о данных, поскольку является одним из лучших инструментов для специалистов по данным. Наконец, он также обладает свойствами бизнес-аналитики, за исключением части, касающейся прогнозной аналитики.

Примерами машинного обучения в науке о данных являются «удержание клиентов», «предотвращение мошенничества» и «создание информационных панелей в реальном времени» (также часть BI). Типичные примеры включают «распознавание речи» и «распознавание изображений», которые являются частью науки о данных и не частью науки о данных, поэтому мы помещаем их на границу.

Подводя итог: машинное обучение — это полностью ИИ, но некоторые области ИИ даже не связаны с бизнесом и анализом данных, например, «символическое рассуждение».

Расширенная аналитика

Последней областью нашего анализа является расширенная аналитика, которая является скорее маркетинговым термином, чем наукой о данных. Он часто используется для описания анализа, с которым «не так просто справиться». Субъективно для новичка вся информация на этом рисунке продвинута. Хотя это и не лучший термин, это хороший способ обобщить все «правильные» термины, упомянутые в этой статье.

С удаленным ИИ и добавленной расширенной аналитикой это картина ниже.

Ссылаясь на терминологию в тексте, наш анализ расширенной аналитики завершен.

Ниже представлены гифки, сравнивающие эти понятия.

Посмотреть исходный английский текст:

https://woohoohoo См. nuggets.com/2018/05/data-science-machine-learning-business-analytics.HTML