Мышление данных | Обобщить часто используемые методы анализа данных и мышления.

анализ данных

Статья из:Калейдоскоп данных

Нажмите на синее слово выше, чтобы подписаться на нас


Структура каталога статей выглядит следующим образом:

1. Три типа аналитического мышления

2. Методы анализа разных жизненных циклов

3. Резюме практических случаев


 

Овладение широко используемыми методологиями анализа данных является основой для развития мышления в области анализа данных.Как говорится, «Если вы хотите делать хорошую работу, вы должны сначала отточить свои инструменты», а методологии анализа данных являются одним из самых мощных видов оружия. В этом разделе основное внимание будет уделено общим методам анализа данных и дано общее введение в методологии анализа данных, обычно используемые аналитиками данных в их повседневной работе.

01

Три аналитического мышления

Сравнительный анализ, группировка пользователей, корреляционный и причинно-следственный анализ — три основных аналитического мышления, которые проходят через весь процесс анализа данных. Как показано на рисунке 1, три основных аналитических ума включают разные аналитические методы.

Рисунок 1. Обзор трех основных аналитического мышления

Без сравнения нет четкого вывода данных.Сравнительный анализ может измерять общий размер данных, колебания данных и тенденции изменения данных.Поэтому сравнительный анализ является самым простым и наиболее эффективным способом сделать выводы о данных. Обычно аналитики данных будут использовать бизнес-данные для сравнения с рыночными данными или данными золотого стандарта отрасли, чтобы судить о текущей ситуации в бизнесе. Кроме того, методы сравнительного анализа в годовом исчислении, цепное соотношение/горизонтальное соотношение/вертикальное соотношение и т. д. также чаще используются. A / B-тестирование — это особый вид метода сравнительного анализа, который обычно используется аналитиками данных и является наиболее эффективным методом для изучения причинно-следственной связи между переменными.

Группировка пользователей также является аналитическим мышлением, которое проходит через все звено анализа данных.Группировка пользователей в соответствии с данными о поведении пользователей/данными о потреблении и другими характеристиками является основой для реализации усовершенствованных пользовательских операций. Группировка пользователей может быть основана на исторических данных пользователей, а данные могут быть объединены в блоки для формирования тегов типа правил, чтобы реализовать группировку пользователей в соответствии с тегами. Если система маркировки данных предприятия сделана хорошо, пользователи могут быть сгруппированы непосредственно через метки данных. Кроме того, еще одним методом группировки пользователей является когортный анализ пользователей, который представляет собой комбинацию методов горизонтального и вертикального анализа Различия между группами на одном этапе цикла. Конечно, аналитики данных также могут использовать RFM-модели или алгоритмы машинного обучения, такие как K-Means, для группировки пользователей по мере необходимости.

В дополнение к сравнительному анализу и группировке пользователей, анализ корреляции и причинно-следственных связей также является третьим важным аналитическим мышлением, которое необходимо иметь аналитикам данных. В процессе исследования взаимосвязей переменных чаще используются корреляционные аналитики как методы анализа, но наличие корреляции между переменными не означает, что они имеют причинно-следственную связь, поэтому причинно-следственный вывод также является обязательным методом анализа для аналитиков данных, когда это необходимо.


Пожалуйста, перейдите к полной статье,Калейдоскоп данных

Оставшаяся структура каталогов:

2. Методы анализа разных жизненных циклов

3. Резюме практических случаев