один. В итоге
Повторная идентификация пешеходов может быть упрощена до следующего процесса: извлечение признаков из исходных данных изображения, а затем передача их в целевую функцию и оптимизация. Этот процесс включает в себя три важные части: данные, признаки и целевую функцию. Поэтому методы РИД делятся на три категории по направленности исследования. Это исследования, основанные на данных, исследования, основанные на функциях, и исследования, основанные на объективных функциях. \
Определим: цель повторной идентификации человека — сделать производительность максимально возможной при тестировании на определенном наборе данных. (ранг 1, мАП)
Категории следующие:
1 Данные: относится к изображениям в реальном смысле, и классификация основана на исследовательской направленности на подготовку данных.
2 Особенности: относится к глубоким функциям, созданным после CNN, и классификация основана на фокусе исследования на выражении функций.
3 Целевая функция: относится к части, которая предоставляет информацию обратной связи для обновления параметров сети.Классификация основана на фокусе исследования на информации обратной связи.
\
два. Описание классификации
1 данные:
1.1 Сгенерировать данные:
1.1.1 Дополнение существующих наборов данных [1,2,3]
1.1.2 Дополните целевой набор данных другими наборами данных [4,5,6]
1.2 дополнительные данные
1.2.1 Выберите некоторые данные [7]
1.2.2 Использовать все [8,9]
2. особенность
2.1 извлечение локальных признаков
2.1.1 Жесткое выравнивание [10]
2.1.2 Адаптивное выравнивание [11,12,13]
2.2 извлечение глобальных признаков
2.2.1 Одновыборочные глобальные признаки [14,15,16]
2.2.2 Глобальные функции с несколькими выборками [17,18,19]
3. Целевая функция:
3.1 традиционная целевая функция
3.1.1 Выбор целевой функции [20]
3.1.2 Вес целевой функции изменяется динамически [21]
3.2 Новая целевая функция
3.2.1 Формально улучшенный [22]
3.2.2 Улучшено выравнивание входных данных [23,24,25]
1 данные:
1.1 Сгенерировать данные:
1.1.1 Расширение в рамках существующих наборов данных
1.1.2 Дополнить целевой набор данных другими наборами данных
1.2 дополнительные данные
1.2.1 выбрать некоторые данные
1.2.2 использовать все
Классифицировать в соответствии с данными, в зависимости от того, сосредоточено ли исследование на подготовке данных. Наша цель REID — обучить сеть таким образом, чтобы обученная сеть хорошо работала на тестовом наборе. Набор обучающих данных сильно повлияет на результаты.Чтобы добиться хорошего тестового эффекта на определенном целевом наборе данных, мы можем использовать сеть GAN для создания большего количества искусственных данных изображения или использовать данные в других наборах данных, чтобы помочь в улучшении целевые данные Тестовый эффект на множестве. Поэтому подклассы данных делятся на две категории, а именно сгенерированные данные (генерирующие несуществующие изображения) и вспомогательные данные (использующие существующие реальные данные).
В 1.1 Сгенерированные данные есть две ветви, а именно расширение в пределах существующего набора данных и расширение целевого набора данных с другими наборами данных:
1.1.1 Расширение существующего набора данных заключается в увеличении количества выборок в собственном наборе данных и создании данных с четкими метками.
1.1.2 Использование других данных для расширения себя означает перенос данных из других наборов данных в целевой набор данных, а сгенерированные данные также четко помечены.
В вспомогательных данных 1.2 есть две ветви, которые предназначены для выбора части данных в определенном наборе данных и использования всех данных в определенном наборе данных.
1.2.1 Выбор части данных относится к процессу обучения на целевом наборе данных, для которого требуется часть данных из других наборов данных в качестве эталонного прокси-образа.
1.2.2 Все использование означает, что при обучении на целевом наборе данных использовать картинки из других наборов данных Чем больше других вспомогательных данных, тем лучше эффект.
\
\
2. особенность
2.1 извлечение локальных признаков
2.1.1 жесткое выравнивание
2.1.2 Адаптивное выравнивание
2.2 извлечение глобальных признаков
2.2.1 Одновыборочные глобальные функции
2.2.2 Многосемпловые глобальные функции
\
REID - это, по сути, проблема классификации, а проблема классификации требует глубоких особенностей изображения в качестве основы для классификации. При проектировании сети CNN для извлечения признаков глубины изображения глобальные признаки могут быть извлечены как представления с точки зрения всего изображения; локальные признаки также могут быть извлечены как представления в локальных местах изображения. Таким образом, функции делятся на две ветви, а именно извлечение локальных функций и извлечение глобальных функций.
В 2.1 Извлечение локальных признаков он разделен на две ветви, а именно жесткое выравнивание и адаптивное выравнивание.
2.1.1 Жесткое выравнивание означает, что при извлечении локальных особенностей изображения выбор локальной области фиксируется, и он напрямую фиксируется с точки зрения длины и ширины.
2.1.2 Адаптивное выравнивание относится к обнаружению различных частей в соответствии с различными условиями, а затем к извлечению признаков в этом месте.
\
В 2.2 Global Feature Extraction он разделен на две ветви, которые рассматривают только глобальные особенности одного образца и глобальные признаки нескольких образцов.
2.2.1 Глобальный признак одного образца относится к процессу извлечения признака При извлечении изображения сосредоточьтесь только на этом изображении.
2.2.2 Глобальный признак множественной выборки означает, что при извлечении признаков определенного изображения необходимо не только сосредоточиться на его собственных признаках, но также сравнивать и сопоставлять с другими существующими признаками. Было много статей о банке памяти, и все они посвящены этому.
\
3. Целевая функция:
3.1 традиционная целевая функция
3.1.1 Выбор целевой функции
3.1.2 Вес целевой функции изменяется динамически
3.2 Новая целевая функция
3.2.1 Улучшить форму
3.2.2 Улучшения от выравнивания входных данных
\
Описание: целевая функция, которая предоставляет информацию обратной связи для обучения сети. Изучение проблемы REID с точки зрения целевой функции эквивалентно сосредоточению внимания на том, как использовать существующую информацию. Изучение целевой функции делится на две ветви, а именно традиционную целевую функцию и новую целевую функцию.
3.1 Традиционная целевая функция относится к обычно используемой целевой функции задач классификации, включая перекрестную энтропию и т.д. Эта часть делится на две ветви: выбор целевой функции и динамическое изменение веса целевой функции.
3.1.1 Выбор целевой функции, при обучении REID, перекрестная энтропия часто используется для расчета ошибки классификации, а затем сеть оптимизируется.В дополнение к этой перекрестной энтропии часто выбираются некоторые другие целевые функции для совместного обучения и улучшения эффект.
3.1.2 Динамическое изменение веса целевой функции означает, что при определении целевой функции вес функции будет меняться в зависимости от количества тренировочных раундов и определенных значений.
3.2 Определить новую целевую функцию, что означает добавление новых целевых функций для улучшения выразительности признаков в процессе обучения. В неконтролируемом обучении он используется больше.
\
- Соответствующая литература
- Joint Discriminative and Generative Learning for Person Re-identification
- Progressive Pose Attention Transfer for Person Image Generation
- Unsupervised Person Image Generation with Semantic Parsing Transformation
- Image-Image Domain Adaptation with Preserved Self-Similarity and Domain-Dissimilarity for Person Re-identification
- Person Transfer GAN to Bridge Domain Gap for Person Re-Identification
- SBSGAN: Suppression of Inter-Domain Background Shift for Person Re-Identification source
- Unsupervised Person Re-identification by Soft Multilabel Learning
- Distilled Person Re-identification: Towards a More Scalable System
- Self-Similarity Grouping: A Simple Unsupervised Cross Domain Adaptation Approach for Person Re-Identification
- Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional Baseline)
- Densely Semantically Aligned Person Re-Identification
- Attention Towards Rich Feature Discovery with Class Activation Maps Augmentation for Person Re-Identification
- AANet: Attribute Attentio Network for Person Re-Identification
- Spectral Feature Transformation for Person Re-Identification
- Adaptive Transfer Network for Cross-Domain Person Re-Identification
- View Confusion Feature Learning for Person Re-Identification
- Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-identification
- Generalizable Person Re-identification by Domain-Invariant Mapping Network
- Unsupervised Person Re-identification by Soft Multilabel Learning
- In Defense of the Triplet Loss for Person Re-Identification
- Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training
- Unsupervised Person Re-identification by Soft Multilabel Learning
- self-Similarity Grouping: A Simple Unsupervised Cross Domain Adaptation Approach for Person Re-Identification
- Maximum-value Perfect Matching for Mining Hard Sample
- A Novel Unsupervised Camera-Aware Domain Adaptation Framework for Person Re-Identification
\
\
\
\
\