10 самых популярных алгоритмов интеллектуального анализа данных

сбор данных




Ниже приведены основные типы алгоритмов.

  1. Классификация:
    Эти алгоритмы помещают существующие данные (или прошлые данные) в различные «классы» (отсюда и классификации) на основе их свойств (атрибутов) и используют эти классифицированные данные для прогнозирования.
  2. возвращение:
    Эти алгоритмы строят математическую модель на основе существующих элементов данных и используют эту модель для прогнозирования одного или нескольких элементов данных, которые в основном являются числовыми, такими как прибыль, стоимость, стоимость недвижимости и т. д. Основное различие между алгоритмами классификации и алгоритмами регрессии заключается в том, что тип вывода в алгоритмах регрессии предсказывает числовые значения, тогда как алгоритмы классификации предсказывают «метки классов».
  3. Сегментация или кластеризация:
    Эти алгоритмы делят данные на группы или кластеры элементов со схожими свойствами.
  4. Ассоциация:
    Эти алгоритмы находят некоторые отношения (технически называемые ассоциациями) между различными атрибутами или атрибутами в существующих данных и пытаются создать правила «ассоциации» для прогнозирования.
    Алгоритмы ищут элементы в данных, которые часто встречаются вместе.
  5. Анализ последовательности:
    Эти алгоритмы находят в данных частые последовательности (например, серию посещений веб-сайта или серию событий журнала, предшествующих сбою машины).
  6. последовательно:
    Эти алгоритмы похожи на алгоритмы регрессии в том, что они предсказывают числовые значения, но временные ряды фокусируются на предсказании будущих значений в упорядоченных рядах, а также включают сезонные циклы (например, управление складскими запасами).
  7. Алгоритм уменьшения размерности:
    Некоторые наборы данных могут содержать много переменных, что делает почти невозможным определение важных переменных, влияющих на прогнозы.
    Алгоритмы уменьшения размерности помогают определить наиболее важные переменные.
Конечно, существует множество других алгоритмов, таких как Random Forest, GBM, XBoost, GMM, Kernel Approximation и т. д., и выбор лучшего алгоритма для конкретной задачи анализа может оказаться сложной задачей.
Для одной и той же бизнес-задачи вы можете использовать разные алгоритмы, каждый из которых дает разные результаты, а некоторые алгоритмы могут давать несколько типов результатов.

Оригинальный адрес:

Woohoo.data VERSI same.net/10-самая-теща…

Адрес бумаги:

У-у-у. В это время. Ультрафиолетовая дверь. Квота/~Код IC/Муж или…