Эта статья взята изТехническое руководство по официальному резюме аккаунтаСерия обмена ресурсами
Создание высококачественных наборов данных является важной частью любого проекта машинного обучения. На практике это обычно занимает больше времени, чем реальное обучение и оптимизация гиперпараметров. Поэтому выбор правильного инструмента аннотации имеет решающее значение. Здесь мы суммируем некоторые из лучших инструментов аннотирования изображений для задач компьютерного зрения: labelme, labelImg, CVAT и hasty.ai.
Автор: Дмитрий
Составление: Техническое руководство по резюме
Обратите внимание и сосредоточьтесь на техническом обзоре компьютерного зрения, отслеживания новейших технологий и интерпретации классических статей..
labelme
адрес:GitHub.com/ikentaro/pull…
Что ты можешь сделать с этим
labelme — это инструмент для маркировки полигонов изображений на основе Python с открытым исходным кодом, который можно использовать для ручной маркировки изображений для обнаружения, сегментации и классификации объектов. Это офлайн-форк онлайн-сервиса LabelMe, который недавно закрыл возможность регистрации новых пользователей. Итак, в этом посте мы рассматриваем только labelme (строчные буквы).
Инструмент представляет собой легкое графическое приложение с интуитивно понятным пользовательским интерфейсом. С помощью labelme вы можете создавать: многоугольники, прямоугольники, круги, линии, точки или полосы.
Часто удобно иметь возможность экспортировать комментарии в известные форматы, такие как COCO, YOLO или PASCAL VOL, для последующего использования. Однако в labelme метки можно сохранять только в виде файлов JSON непосредственно из приложения. Если вы хотите использовать другой формат, вы можете преобразовать аннотации в PASCAL VOL с помощью скрипта Python в репозитории labelme.
Тем не менее, это довольно надежное приложение с простыми функциями для ручной маркировки изображений и широкого спектра задач компьютерного зрения.
Установить и настроить
labelme — это кроссплатформенное приложение, которое может работать на нескольких системах, таких как Windows, Ubuntu или macOS. Сама установка очень проста и хорошо описана здесь. Например, в macOS вам нужно выполнить следующие команды в Терминале:
-
Установить зависимости: brew установить pyqt
-
Установить labelme: pip установить labelme
-
запустить labelme: labelme
labelImg
адрес:GitHub.com/Тайзу Таллинн/Ла…
Что ты можешь сделать с этим
labelImg — широко используемый инструмент графических аннотаций с открытым исходным кодом. Он подходит только для задач локализации или обнаружения объектов и может создавать только прямоугольные рамки вокруг рассматриваемых объектов.
Несмотря на это ограничение, мы рекомендуем использовать этот инструмент, поскольку приложение ориентировано исключительно на создание ограничивающих рамок, которые максимально упрощают инструмент. Для этой задачи в labelImg есть все необходимые функции и удобные сочетания клавиш.
Еще одним преимуществом является то, что вы можете сохранять/загружать аннотации в 3 популярных форматах аннотаций: PASCAL VOC, YOLO и CreateML.
Установить и настроить
Установка хорошо описана здесь. Также обратите внимание, что labelImg является кроссплатформенным приложением. Например, для MacOS вам нужно сделать следующее в командной строке:
-
Установите зависимости: сначала brew install qt, затем brew install libxml2
-
Выберите расположение папки для установки.
-
Когда вы находитесь в папке, выполните следующую команду: git cloneGitHub.com/Тайзу Таллинн/Ла…, cd labelImg затем сделайте qt5py3
-
Запустите labelImg: python3 labelImg.py
-
Разработчики настоятельно рекомендуют использовать Python 3 или выше и PyQt5.
CVAT
адрес:GitHub.com/open vino тоже…
Что ты можешь сделать с этим
CVAT — это инструмент аннотирования изображений и видео с открытым исходным кодом для таких задач, как обнаружение объектов, сегментация и классификация.
Чтобы использовать этот инструмент, вам не нужно устанавливать приложение на свой компьютер. Веб-версия этого инструмента доступна в Интернете. Вы можете сотрудничать в команде над пометкой изображений и распределением работы между пользователями.
Также есть приятная опция, которая позволяет использовать предварительно обученную модель для автоматической маркировки ваших данных, это может упростить наиболее популярные классы (например, те, которые включены в COCO), если вы используете существующие модели, доступные на панели инструментов CVAT. класс) процесс. Кроме того, вы можете использовать свою собственную предварительно обученную модель.
CVAT имеет самый широкий набор функций из всех рассмотренных нами инструментов. В частности, он позволяет сохранять этикетки примерно в 15 различных форматах. Полный список форматов можно найти здесь.
hasty.ai
адрес:hasty.ai/
Что ты можешь сделать с этим
В отличие от всех вышеперечисленных инструментов, hasty.ai не является бесплатным сервисом с открытым исходным кодом, но он очень удобно маркирует данные благодаря так называемым помощникам ИИ для обнаружения и сегментации объектов. Автоматическая поддержка позволяет значительно ускорить процесс аннотирования, так как во время маркировки вспомогательная модель обучается. Другими словами, чем больше изображений отмечено, тем точнее работа ассистента. Мы рассмотрим пример ниже, чтобы проиллюстрировать, как это работает. Вы также можете попробовать эту услугу бесплатно. Этот эксперимент дает 3000 точек, которых достаточно для автоматического создания предлагаемых меток примерно для 3000 объектов для задачи обнаружения объектов. hasty.ai позволяет экспортировать данные в формате COCO или Pascal VOC. Вы также можете работать над одним проектом в команде и назначать роли в настройках проекта. После того, как бесплатные кредиты будут израсходованы, hasty.ai по-прежнему будет бесплатным для использования, но тегирование будет полностью ручным. В этом случае лучше рассмотреть упомянутые выше бесплатные инструменты.
настроить
-
Чтобы использовать инструмент, вам необходимо зарегистрироваться на hasty.ai.
-
Войдите в свою учетную запись.
-
Щелкните Создать новый проект.
-
Заполните форму с именем и описанием и перейдите к настройкам проекта, где вы можете определить рассматриваемый класс, добавив данные для проекта.
-
Кроме того, вы можете добавить других пользователей для совместной работы над проектами. Баллы будут использоваться со счета пользователя, который поделился предметом.
Оригинальный адрес:medium.com/arrival-machinei…
Добро пожаловать в техническое руководство CV для общедоступной учетной записи, в котором основное внимание уделяется техническому обзору компьютерного зрения, отслеживанию новейших технологий и интерпретации классических статей.
Ответьте на ключевое слово «техническое резюме» в официальном аккаунте, чтобы получить краткий PDF-файл оригинальной технической сводной статьи официального аккаунта.
Другие статьи
Техническое руководство по CV - Резюме и классификация основных статей
Резюме методов настройки параметров для гиперпараметров нейронной сети
Серия облегченных моделей -- GhostNet: дешевые операции дают больше возможностей
ICCV2021 | MicroNet: Улучшение распознавания изображений с очень низкими значениями FLOP
CVPR2021 | Переосмысление пакетной обработки в BatchNorm
ICCV2021 | Переосмысление пространственного измерения визуальных трансформеров
CVPR2021 | Transformer для сквозной сегментации экземпляров видео
Анализ сложности сверточных нейронных сетей
Обзор последних исследований по обнаружению малоразмерных целей в 2021 году
Самостоятельное внимание в компьютерном зрении
Обзорная колонка | Обзор оценки позы
Почему GEMM лежит в основе глубокого обучения
Почему 8 бит достаточно для использования глубоких нейронных сетей?
Классическая серия статей — Капсульные сети: новая сеть глубокого обучения
Как просмотреть пузырь искусственного интеллекта
Четкое обнаружение границ с использованием Dice loss
PVT — многофункциональная основа для плотного прогнозирования без свертки
CVPR2021 | Обнаружение объектов в открытом мире
Визуальное обнаружение и распознавание объектов Прошлое, настоящее и возможное
Краткое изложение методов недообучения и переобучения
Краткое изложение общих идей бумажных инноваций
Резюме методов эффективного чтения англоязычной литературы по направлению CV
Обзор непродолжительного обучения компьютерному зрению
Краткий обзор дистилляции знаний
Краткое изложение технологии пирамиды функций в компьютерном зрении
Краткое изложение методов механизма внимания в компьютерном зрении
Сравнение фреймворков OCR с открытым исходным кодом для распознавания текста — Tesseract и EasyOCR
Краткое изложение методов эффективного чтения англоязычной литературы в компьютерном зрении
Обзор непродолжительного обучения компьютерному зрению
Краткий обзор дистилляции знаний
Краткое изложение методов функции потерь
CVPR2021 | Обнаружение объектов в открытом мире
CVPR2021|PVT — многофункциональная магистраль для плотного прогнозирования без свертки
CVPR2021 | Новый способ функциональной пирамиды YOLOF
CVPR2021 | Трансформатор в трансформере, предложенный Huawei Noah Lab
CVPR2021 | Новое внимание после SE, CBAMСиловой механизм Координация внимания
Серия Classic Paper | Переосмысление предварительного обучения в ImageNet