Машинное обучение — базовые знания — объяснение концепций, связанных с обнаружением целей

глубокое обучение

В этой статье представлено введение в различные базовые концепции, связанные с обнаружением объектов машинного обучения.

Обнаружение цели

Обнаружение объектов, также называемое извлечением объектов, представляет собой сегментацию изображения на основе геометрических и статистических характеристик объектов, которая объединяет сегментацию и распознавание объектов в одно целое, а ее точность и производительность в реальном времени являются важными возможностями всей системы.

Обнаружение объектов - популярное направление в компьютерном зрении и цифровой обработке изображений.Он широко используется в навигации роботов, интеллектуальном видеонаблюдении, промышленном контроле, аэрокосмической и многих других областях.Очень большое практическое значение имеет снижение потребления человеческого капитала с помощью компьютера. зрение. Таким образом, в последние годы обнаружение целей стало предметом научных исследований в теории и применении.Это важная ветвь обработки изображений и компьютерного зрения, а также основная часть интеллектуальных систем мониторинга.В то же время обнаружение целей также основное поле идентификации.Алгоритмы играют решающую роль в последующих задачах, таких как распознавание лиц, распознавание походки, подсчет толпы и сегментация экземпляров. Благодаря широкому использованию глубокого обучения алгоритмы обнаружения целей быстро развивались.

Ground Truth

Ground Truth (GT) представляет собой реальную метку, присвоенную данным искусственными средствами, которая используется для обучения модели, проверки и тестирования производительности модели.

Bounding Box (bbox)

Обнаружение цели необходимо для определения положения цели и категории на изображении Форма, отраженная в данных, заключается в использовании прямоугольной рамки для обрамления области цели и отметки метки категории Это ограничивающая рамка обнаружения цели Аннотация и алгоритм вывод используйте эту форму, чтобы машина могла изучать и сравнивать экспериментальные результаты.

ROI (region of interest)

Область интереса, аналогичная концепции bbox, определяет интересующую нас часть изображения и передает ее машине для изучения.

IoU (Intersection over Union)

Соотношение пересечений и объединений (соотношение пересечений и объединений), в существующей базе мы каким-то образом пометим данные, назначим целевую область и категорию в данных, то есть пометим ROI, алгоритм обнаружения изучит данные и получает модель обнаружения, роль модели Выводит bbox результата обнаружения для определенного изображения.

IoU используется для оценки выходных результатов модели обнаружения.Метод расчета заключается в выводе отношения площади пересечения и площади объединения bbox и отмеченного bbox. Более высокие коэффициенты указывают на более точные результаты, и наоборот.

confidence

Уверенность (уверенность) указывает на степень уверенности модели обнаружения в обнаружении самой цели.Чем больше значение, тем более уверена модель в точности результатов своего обнаружения.

Решение об обнаружении

В задаче классификации выходной результат модели классификации используется в качестве категории ее классификации, а выходные данные сравниваются с реальной меткой категории, чтобы определить, является ли прогноз правильным, и, соответственно, прогноз может быть разделен на TP, FP , ТН, в ФН.

Результат вывода в задаче обнаружения целей отличается от классификации, результат содержит информацию о том, что определенная позиция на изображении принадлежит к определенной категории и, вероятно, содержит несколько целей, что на самом деле нереально для вывода результат должен полностью соответствовать этикетке.Так как же определить, правильный ли результат теста?

Для определения правильного результата при обнаружении целей необходимо предварительно установить порог IoU, а затем определить кадр обнаружения по категориям:

  • перебирать каждую категорию
  • Отсортируйте поля прогнозов для этой категории в порядке убывания достоверности.
  • Для каждого предсказанного bbox найдите gt_bbox с наибольшим IoU.
  • Если gt_bbox ранее не назначался, а IoU больше заданного порога (например, 0,5), назначьте gt_bbox блоку предсказания и установите для поля предсказания значение TP; в противном случае установите для поля предсказания значение FP.
  • gt_bbox неправильно предсказано установлено в FN
  • Отсутствие явного TN в результатах тестирования

оценка эффективности

После определения результатов можно рассчитать показатели эффективности с помощью классификационной системы оценки:

Машинное обучение — основы — точность, отзыв, чувствительность, специфичность, точность, FNR, FPR, TPR, TNR, F1 Score, Balanced F Score

Вы также можете нарисовать кривые ROC и PR:

Машинное обучение — Основы — PR, кривая ROC и AUC