Примечание. Проблема классификации с несколькими метками

机器学习 多标签分类

Недавно я столкнулся с проблемой маркировки, которая заключается в маркировке объекта несколькими метками, и я проверил много информации в Интернете. Я обнаружил, что Baidu ничего не искал, а позже я нашел достоверную информацию о Zhiwang, а затем погуглил ее. Теперь подведем итоги проблемы с несколькими метками.

Методы с несколькими метками можно условно разделить на две категории, а именно преобразование задачи и преобразование алгоритма.

Сначала опишите проблему:

Во-первых, вводится метод трансформации задачи.

метод преобразования проблемы

Первая широкая категория основана на методах преобразования токенов.

Во-первых, это бинарная релевантность (BR).
В соответствии с меткой мы реорганизуем данные в положительные и отрицательные выборки.Для каждой метки категории мы обучаем базовый классификатор отдельно.Общая сложность q × O(C), где O(C) — сложность базовой классификации. Таким образом, BR Алгоритм подходит для случая, когда количество меток q относительно невелико. Но во многих сценариях теги связаны с древовидными уровнями. При этом БР не учитывает корреляцию между этими маркерами.

Вторая — Цепочка Классификаторов (CC).
С целью решения проблемы корреляции меток в BR, в CC эти базовые классификаторы Cj, j = 1 ... q объединяются в цепочку, а выход предыдущего базового классификатора используется как вход следующего базового классификатора. .

Вторая категория основана на методах преобразования типовых экземпляров.

Во-первых, это новая инновационная этикетка (Label-Powerset).

Цена этого заключается в том, что количество токенов будет увеличиваться, а у некоторых токенов всего несколько экземпляров, но преимущество LP в том, что учитывается корреляция между токенами.

Второй — разложить мультимаркерный

Приведенный выше рисунок означает, что мы можем использовать обучающие данные несколько раз, называемыеcross-training, то есть мы рассматриваем E1 на приведенном выше рисунке как обучающую категорию y2 как положительную выборку, так и обучающую выборку y3 как положительную выборку, которая ощущается так же, как алгоритм бинарной релевантности (BR).

Метод преобразования алгоритма

Модификация алгоритма Алгоритмы модифицируются для специальных алгоритмов.
В основном введите два, вы можете обратиться кSCI kit.beautiful/API/class if….

Нейронные сети

Вот бумагаMulti-Label Neural Networks with Applications to
Functional Genomics and Text Categorization, алгоритм нейронной сети.

По сути, это простая глубокая сеть:

Но следует отметить, что выбор нашей функции потерь, если предположить, что мы выбираем

Это эквивалентно рассмотрению только одного значения метки, 0 или 1, без учета корреляции между различными метками, поэтому мы меняем потери на следующее:

Приведенное выше k — это индекс с меткой, а l — индекс без метки.Мы считаем, что значение с меткой более значимо, чем значение без метки.

Наконец, мы представляем новую модель нейронной сети, документИзучение глубоких скрытых пространств для классификации по нескольким меткам

Его модель выглядит следующим образом:

Среди них Fx, Fe и Fd — это 3 dnn, которые представляют извлечение признаков, кодирование меток и декодирование скрытого вектора соответственно, а функция потерь состоит из двух частей:

где потери при встраивании:

Выходные потери:

Вы можете увидеть это сMulti-Label Neural Networks with Applications to
Functional Genomics and Text CategorizationФункция потерь в одинакова.

Если вы все еще не понимаете эту статью, очень повезло, что в Интернете есть реализация статьи, см.C2AE-Multilabel-Classification.

Суммировать

В этой статье дается краткое введение в проблему с несколькими метками. Я помню, что многие сценарии, такие как классификация изображений и распознавание видеоконтента, являются проблемами с несколькими метками. Я продолжу разбираться в них, когда у меня будет время.

Ваша поддержка является движущей силой для меня, чтобы продолжать писать, и я с нетерпением жду нашего общего прогресса.
这个时代，每个人都是超级个体！关注我，一起成长！

Ссылаться на

Сравнение методов классификации с несколькими метками Сюй Чжаогуй
Изучение глубоких скрытых пространств для классификации по нескольким меткам
Машинное обучение с несколькими метками и его применение к семантической классификации сцен