Бог есть Бог в конце концов!
Только что AI Technology Base Camp узнал, что после двукратного получения награды CVPR за лучшую статью две последние статьи, в которых участвовал Хэ Юмин, получили две награды ICCV 2017 за лучшую статью и лучшую студенческую работу соответственно.
Введение в статью:Мы предлагаем простую, гибкую и общую структуру сегментации экземпляров объектов. Наш метод эффективно обнаруживает объекты на изображениях, создавая высококачественные маски сегментации для каждого экземпляра. Этот метод, называемый Mask R-CNN, расширяет Faster R-CNN, добавляя ветвь для прогнозирования масок объектов, которая работает параллельно с существующей ветвью для распознавания ограничивающей рамки. Mask R-CNN прост в обучении с небольшими накладными расходами поверх Faster R-CNN, работающего со скоростью 5 кадров в секунду. Кроме того, Mask R-CNN легко обобщить на другие задачи, например, он может позволить оценку позы в той же структуре. Мы достигаем самых современных результатов по трем орбитальным задачам из серии задач COCO, включая сегментацию экземпляров, обнаружение граничных объектов и обнаружение ключевых точек человека. Безо всяких ухищрений Mask R-CNN превосходит все существующие одномодельные результаты, включая победителя конкурса COCO 2016.
Адрес бумаги:АР Вест V.org/ABS/1703.06…Введение в статью:Наиболее точные детекторы объектов сегодня используют двухэтапный подход, обычно используемый в R-CNN, который применяет классификатор к разреженному набору местоположений объектов-кандидатов. Напротив, одноэтапные детекторы применяются к регулярному плотному набору выборок возможных местоположений объектов, они быстрее и проще, но уступают двухэтапным детекторам по точности. В этой статье мы исследуем причины этого явления.
Мы обнаружили, что основной причиной этого явления является серьезный дисбаланс классов переднего плана и фона во время обучения детекторов плотных объектов. Наше решение этого дисбаланса классов состоит в том, чтобы изменить стандартную кросс-энтропийную потерю так, чтобы она уменьшила вес потери для хорошо классифицированных выборок. Focal Loss сосредотачивает обучение на разреженном наборе жестких образцов и предотвращает перегрузку детектора большим количеством простых отрицательных образцов во время обучения. Чтобы оценить эффективность этой потери, мы разрабатываем и обучаем простой детектор плотных объектов — RetinaNet. Экспериментальные результаты показывают, что при обучении с помощью Focal Loss RetinaNet может не только догнать по скорости обнаружения одноэтапные детекторы, но и превзойти по точности все современные двухэтапные детекторы.
Чемпион открытых вступительных экзаменов в колледж
В 2009 году на конференции CVPR, проведенной IEEE, первая статья Хэ Юминга «Удаление дымки одиночного изображения с использованием предварительного темного канала», который все еще был стажером в Азиатском исследовательском институте Microsoft (MSRA), выиграла лучшую статью и выиграла лучший документ. В свое время награду выиграла команда, полностью состоящая из китайцев.
В 2016 году еще одна статья «Глубокое остаточное обучение для распознавания изображений», написанная командой Хэ Юмина, снова получила награду CVPR за лучшую статью.
Что вы думаете, читатели? Добро пожаловать, чтобы оставить сообщение в области комментариев.