В основном записывайте документы по визуальному пониманию и ограниченным этикеткам, добро пожаловать в гостиGithubпроект.
0. Grafit: Learning fine-grained image representations with coarse labels
Авторы рассматривают задачу «изучения мелких признаков с использованием только грубых меток во время обучения» как обобщение обучения без учителя (в котором каждый образец представляет собой грубую метку). В этой статье авторы представляют KNN Loss [1] поверх BYOL, чтобы лучше изучить потенциальное пространство мелких деталей.
1. Causal Attention for Unbiased Visual Recognition
Это статья, связанная с обучением каузальному представлению, в которой авторы представляют состязательное обучение, основанное на методах причинного вмешательства, основанных на сегментации данных, чтобы «самоаннотировать искажающие факторы без присмотра».
2. Semantic Diversity Learning for Zero-Shot Multi-label Classification
Для данного изображения i модель генерирует несколько основных векторов вложения и принимает максимальное значение произведения вектора метки j и его произведения в качестве степени ассоциации между изображением i и меткой j. В статье автор не только проектирует Rank Loss в соответствии с деталями задачи, но и динамически настраивает вес выборки в соответствии с смысловым разнообразием изображения.
3. Scribble-Supervised Semantic Segmentation by Uncertainty Reduction on Neural Representation and Self-Supervision on Neural Eigenspace
За счет «уменьшения неопределенности в нейронном представлении» и «самоконтроля в собственном пространстве нейронов» автор надеется решить проблему низкой достоверности и несогласованности прогнозов, характерных для задач семантической сегментации под наблюдением Scribble.
4. LocTex: Learning Data-Efficient Visual Representations from Localized Textual Supervision
В отличие от обычных задач классификации изображений или обнаружения объектов, задача LocTex, предложенная автором, направлена на улучшение производительности модели при настройке подписей и синхронизированных жестов наведения мыши в качестве аннотационной информации.
5. Transformer-based Dual Relation Graph for Multi-label Image Recognition
В дополнение к обычному графу семантических отношений автор также представил Transofrmer для изучения графа структурных отношений.
6. Pri3D: Can 3D Priors Help 2D Representation Learning?
Модель предварительно обучена с данными 3D-изображения путем введения инвариантных к просмотру контрастных потерь и геометрических априорных контрастных потерь.
7. Interactive Prototype Learning for Egocentric Action Recognition
Авторы разрабатывают фреймворк Interactive Prototype Learning для повышения точности распознавания движущихся объектов.
Reference
[1] Zhirong Wu et al., Improving Generalization via Scalable Neighborhood Component Analysis, ECCV 2018.