смысл
В отличие от обычной модели классификации с одной меткой, обученной на основе перекрестной потери энтропии, в этой статье для завершения обучения используется модель классификации с несколькими метками. Так называемая многометочная модель классификации, то есть в начальном процессе одному снимку присваивается отдельный класс, а через последующие итерации снимок не только относится к своему классу, но и относится к другим фотографиям, относящимся к тот же человек, что и на фото. Чтобы повысить эффективность обучения моделей с несколькими классификациями, в этой статье предлагаются потери классификации с несколькими метками на основе памяти (MMCL). Основная идея этой функции потерь заключается в том, что косинусное расстояние между признаками двух изображений с общей меткой должно быть ближе к 1, а с разными метками должно быть ближе к -1.
Обзор модели
Для каждого входного изображения после извлечения признаков они сохраняются в словаре с индексом в качестве значения ключа. В то же время картинка также генерирует one-hot вектор, который является одноклассовой меткой в картинке, в которой только индекс, соответствующий картинке, равен +1, а остальные позиции равны -1. Вектор и словарь памяти получают соответствующую мультиклассовую метку через модуль MPLP.Как и для одноклассовой метки, индекс прогнозируемого класса равен +1, а остальные позиции равны -1. Для каждой категории, предсказанной как 1 в мультиклассовой метке, соответствующие характеристики изображения берутся из памяти, а косинусное расстояние рассчитывается по характеристикам входного изображения в виде баллов. Наконец, мультиклассовые метки и оценки взаимодействуют, чтобы получить окончательный MMCL для оптимизации.
Основное содержание
Учитывая набор данных немаркированных изображений, цель состоит в том, чтобы обучить модель ReID на основе этого набора данных. Для любого заданного изображения запроса, обученная модель ReID может извлечь функцию для извлечения изображений, принадлежащих одному и тому же человеку, из набора галерей G.. Для этого модель ReID должна гарантироватьиСравниватьДругие изображения имеют более схожие черты. Тогда конечная цель оптимизации:
для каждой картинки, соответствующая инициализированная одноклассовая метка представляет собой двоичный вектор, длина которого равна n,, иначе -1. Поскольку изображение может иметь несколько классов, метку одного класса следует изменить на метку нескольких классов. Из-за большого количества изображений в наборе данных сложно обучить классификатор с несколькими метками. Более эффективным решением является использование признаков изображения, соответствующих i-классу.в качестве классификатора для этого класса. Отсюда можно вычислить любое изображениеКлассификационные баллы следующие:
, ввыражатьКлассификационная оценка по нескольким меткам .
memory
использоватьразмер банка памятидля хранения функций изображения, где.
MPLP
Модуль MPLP получает соответствующую метку мультикласса путем ввода метки одного класса и банка памяти.
ввходная одноклассовая метка,является выходной мультиклассовой меткой.
данное изображениеИнициализированная бинарная одноклассовая метка, MPLP работает над поиском другихкатегория. за, MPLP сначала согласноРассчитать рейтинговую таблицу сходства с другими функциями
ввыражатьиоценки сходства между.
в соответствии сможет получитьПодходящий набор доверенных меток, например несколько первых в списке выбора. Однако стабильность таблицы сортировки будет снижена из-за размытия, угла обзора и фоновых эффектов. Поэтому в данной статье представлены следующие две стратегии решения проблемы устойчивости:
- Фильтрация тегов на основе показателей сходстваУказав нижний предел оценки достоверности, достоверный набор отфильтровывается как,вэто последняя метка с достоверностью выше нижней границы заданного балла. следовательно,Это может быть не то же самое для каждой картины.
- Фильтрация меток на основе петлевых ограниченийПринцип фильтрации основан на предположении, что если два изображения принадлежат к одной и той же категории, их соседние наборы изображений также должны быть похожими. По этому принципу можно отфильтроватьжесткие отрицательные метки в . Пара MPLPТеги в просматриваются от начала до конца. заметка j in , MPLP вычисляетпоследние теги. если метка i также является одной из меток jближайшая метка, то метка j считаетсяПоложительный образец. В противном случае он считается жестким отрицательным тегом. Обход останавливается, когда найден первый жесткий отрицательный тег. Это получает положительный набор меток.
MMCL
Традиционная функция потерь с несколькими метками MCL
так какиявляется L2-усредненным, классификационные баллы ограниченымежду. Это ограничитДиапазон сигмовидной функции в , делает невозможным сделать значение потерь равным 0 даже при правильной классификации. Эту проблему можно решить, введя коэффициентРешите, чтобы функция потерь обновлялась следующим образом
Обозначим соответствующие потери MCL как, ноГрадиент градиента рассчитывается следующим образом
В соответствии с приведенной выше формулой получается карта градиента, показанная на следующем рисунке.
Очевидно, что модернизированная потеря MCL по-прежнему имеет проблему исчезновения градиента, когда показатель классификации больше 0,25 или меньше -0,25. Другая проблема заключается в том, что, поскольку в задаче задействовано много классов, положительные и отрицательные классы не сбалансированы. Чтобы решить эту проблему, авторы также предлагают потерю MMCL.
Memory-based Multi-label Classification Loss (MMCL)
Во-первых, чтобы решить интервальную проблему оценок, функция потерь модифицируется следующим образом:
Во-вторых, чтобы сбалансировать положительные и отрицательные классы, MMCL вводит жесткий анализ отрицательных классов. за, отрицательная категория которого может быть отмечена как. Отсортируйте отрицательные категории в соответствии с их классификационными баллами, а затем выберите их верхние категории r% как жесткие отрицательные категории, обозначенные как.
Это приводит к новой функции потерь:
Его формула градиента выглядит следующим образом:
Как видно из рисунка выше, этим можно решить проблему исчезновения градиента.
Memory Update
Он будет обновляться после каждой итерации обучения, метод обновления аналогичен моменту,
эксперимент
См. оригинальную бумагу.