Примечание. Проблема классификации с несколькими метками
机器学习
多标签分类
Недавно я столкнулся с проблемой маркировки, которая заключается в маркировке объекта несколькими метками, и я проверил много информации в Интернете. Я обнаружил, что Baidu ничего не искал, а позже я нашел достоверную информацию о Zhiwang, а затем погуглил ее. Теперь подведем итоги проблемы с несколькими метками.
Методы с несколькими метками можно условно разделить на две категории, а именно преобразование задачи и преобразование алгоритма.
Сначала опишите проблему:
Во-первых, вводится метод трансформации задачи.
метод преобразования проблемы
Первая широкая категория основана на методах преобразования токенов.
Во-первых, это бинарная релевантность (BR).
В соответствии с меткой мы реорганизуем данные в положительные и отрицательные выборки.Для каждой метки категории мы обучаем базовый классификатор отдельно.Общая сложность q × O(C), где O(C) — сложность базовой классификации. Таким образом, BR Алгоритм подходит для случая, когда количество меток q относительно невелико. Но во многих сценариях теги связаны с древовидными уровнями. При этом БР не учитывает корреляцию между этими маркерами.
Вторая — Цепочка Классификаторов (CC).
С целью решения проблемы корреляции меток в BR, в CC эти базовые классификаторы Cj, j = 1 ... q объединяются в цепочку, а выход предыдущего базового классификатора используется как вход следующего базового классификатора. .
Вторая категория основана на методах преобразования типовых экземпляров.
Во-первых, это новая инновационная этикетка (Label-Powerset).
Цена этого заключается в том, что количество токенов будет увеличиваться, а у некоторых токенов всего несколько экземпляров, но преимущество LP в том, что учитывается корреляция между токенами.
Второй — разложить мультимаркерный
Приведенный выше рисунок означает, что мы можем использовать обучающие данные несколько раз, называемыеcross-training
, то есть мы рассматриваем E1 на приведенном выше рисунке как обучающую категорию y2 как положительную выборку, так и обучающую выборку y3 как положительную выборку, которая ощущается так же, как алгоритм бинарной релевантности (BR).
Метод преобразования алгоритма
Модификация алгоритма Алгоритмы модифицируются для специальных алгоритмов.
В основном введите два, вы можете обратиться кSCI kit.beautiful/API/class if….
Нейронные сети
Вот бумагаMulti-Label Neural Networks with Applications to
Functional Genomics and Text Categorization, алгоритм нейронной сети.
По сути, это простая глубокая сеть:
Но следует отметить, что выбор нашей функции потерь, если предположить, что мы выбираем
Это эквивалентно рассмотрению только одного значения метки, 0 или 1, без учета корреляции между различными метками, поэтому мы меняем потери на следующее:
Приведенное выше k — это индекс с меткой, а l — индекс без метки.Мы считаем, что значение с меткой более значимо, чем значение без метки.
Наконец, мы представляем новую модель нейронной сети, документИзучение глубоких скрытых пространств для классификации по нескольким меткам
Его модель выглядит следующим образом:
Среди них Fx, Fe и Fd — это 3 dnn, которые представляют извлечение признаков, кодирование меток и декодирование скрытого вектора соответственно, а функция потерь состоит из двух частей:
где потери при встраивании:
Выходные потери:
Вы можете увидеть это сMulti-Label Neural Networks with Applications to
Functional Genomics and Text CategorizationФункция потерь в одинакова.
Если вы все еще не понимаете эту статью, очень повезло, что в Интернете есть реализация статьи, см.C2AE-Multilabel-Classification.
Суммировать
В этой статье дается краткое введение в проблему с несколькими метками. Я помню, что многие сценарии, такие как классификация изображений и распознавание видеоконтента, являются проблемами с несколькими метками. Я продолжу разбираться в них, когда у меня будет время.
Ваша поддержка является движущей силой для меня, чтобы продолжать писать, и я с нетерпением жду нашего общего прогресса.
Ссылаться на
Сравнение методов классификации с несколькими метками Сюй Чжаогуй
Изучение глубоких скрытых пространств для классификации по нескольким меткам
Машинное обучение с несколькими метками и его применение к семантической классификации сцен