[TensorFlow] Лес решений (модель TF-DF)

машинное обучение искусственный интеллект

TensorFlow Decision Forests, представляет собой библиотеку программного обеспечения TensorFlow с открытым исходным кодом на основе Keras. Он направлен на внедрение некоторых передовых алгоритмов леса принятия решений (например, Random Forest, GBDT, LambdaMart) в TensorFlow простым в использовании способом. Леса решений уже давно являются передовыми алгоритмами машинного обучения для моделирования табличных данных. Леса принятия решений обеспечивают отличную производительность во многих приложениях машинного обучения, таких как обучение ранжированию.

Леса классификации и принятия решений

Что такое классификация?

  • табличный набор данных
  • который содержит образцы (строки) и атрибуты (столбцы)
  • Некоторые свойства являются категориальными свойствами, некоторые свойства являются числовыми свойствами.

在这里插入图片描述

Классификация: используйте модель для прогнозирования категориальных атрибутов на основе других атрибутов.

在这里插入图片描述

Почему важна классификация?

  • Доступ к труднодоступным или дорогим данным

Что такое модель?

Модель: выберите (или обучите) модель, которая лучше всего соответствует имеющимся наблюдениям (так называемым «помеченным образцам»).

在这里插入图片描述

Древо решений

  • общая модель
  • Набор вопросов, организованных иерархически в виде древовидной структуры (отмечены зеленым цветом, также известные как узлы принятия решений)
  • Листовые узлы (отмечены желтым) содержат прогнозы
  • Как правило, вопросы относятся к одному атрибуту (с выравниванием по оси), а ответы являются бинарными (бинарные деревья).

在这里插入图片描述

обучение дереву решений

Использование жадной стратегии, рост вопроса за вопросом для максимизации локальных функций оценки (например, прирост информации, среднеквадратическая ошибка).

在这里插入图片描述Продолжайте рекурсивно, чтобы получить дерево решений:在这里插入图片描述

лес решений

  • Суммируйте прогнозы нескольких деревьев решений
  • Часто содержит сотни или тысячи деревьев решений
  • Прогнозы, как правило, более точны (но медленнее), чем одно дерево решений.
  • Для совместного обучения деревьев решений можно использовать разные алгоритмы (например, случайные леса, деревья с градиентным усилением, AdaBoost).

在这里插入图片描述

Библиотека леса решений TensorFlow

  • TensorFlow предоставляет ряд алгоритмов принятия решений.
  • легко использовать
  • Доступно с помощью набора инструментов TensorFlow
  • Поддержка расширенных настроек, таких как комбинация леса решений и нейронной сети.

Основной код TF-DF:在这里插入图片描述Визуализация модели:在这里插入图片描述В сводке отображается различная информация о модели:在这里插入图片描述Используйте с другими инструментами тензорного потока:在这里插入图片描述

Когда использовать леса решений?

  • Работа с табличными данными
  • Простота: не нужно слишком много настраивать
  • интерпретируемость
  • Скорость: включая скорость обучения и скорость вывода