Из arXiv Питера Р. Флоренса, Лукаса Мануэлли, Расса Тедрейка, составлено Heart of the Machine.
В операциях робототехники методы обучения с подкреплением для конкретных задач могут помочь приобрести хорошие навыки в данной задаче, но лучший способ эффективного выполнения многих различных задач не найден. Авторы этой статьи предлагают Dense Object Networks — глубокие нейронные сети, обученные предоставлять плотные описания объектов. Плотные объектные сети могут различать несколько объектов, быстро обучаться полностью автоматическим образом с самоконтролем и разрешать новые задачи манипулирования.
Адрес исходного кода:github.com/RobotLocom…
1. Введение
Как правильно представлять объекты в роботизированных манипуляциях? Хотя методы обучения с подкреплением для конкретных задач могут обеспечить впечатляющие навыки ловкости в заданной задаче [1], лучший способ эффективного выполнения множества различных задач не найден. Некоторые другие недавние исследования [2, 3] могут предоставить общие функции захвата, но не конкретную обработку. Чтобы добиться специфичности, возможности использовать конкретный объект для выполнения конкретной задачи, может потребоваться решить проблемы ассоциации данных. Грубо говоря, задача идентификации и манипулирования отдельными объектами может быть решена с помощью семантической сегментации, как показано в Amazon Robotics Challenge (ARC) [4, 5] или в статье [6]. Однако представления, обеспечиваемые семантической сегментацией, не дают никакой информации о богатой структуре самих объектов. Следовательно, это может быть неподходящий метод характеристики для решения сложных проблем, выходящих за рамки задачи «взять и разместить» в АРО.
Помимо визуальной сегментации, недавняя работа [7] знаменует собой прогресс в использовании методов самоконтроля для изучения плотных ассоциаций данных на уровне пикселей из необработанных данных RGBD. Наша работа вдохновлена [7], но нам нужны дополнительные новые методы для надежного изучения непротиворечивых дескрипторов объектов и разработки метода обучения, подходящего для роботизированной автоматизации. Кроме того, никто ранее не исследовал уникальность плотных дескрипторов объектов, не демонстрировал обучение плотным описаниям для более чем одного класса объектов или не использовал плотные дескрипторы для задач манипулирования. В этой статье мы предлагаем Dense Object Networks, которые представляют собой глубокие нейронные сети, обученные предоставлять плотные (на уровне пикселей) описания объектов. Плотные объектные сети могут различать несколько объектов, быстро обучаться полностью автоматическим образом с самоконтролем и разрешать новые задачи манипулирования.
Вклад: По нашему мнению, самый большой вклад этой статьи заключается в том, что мы вводим плотные дескрипторы для объектов в роботизированном обучении и демонстрируем их универсальность и полезность в роботизированных манипуляциях. Основным вкладом этой статьи являются недавно разработанные различные плотные дескрипторы для нескольких объектов, для которых мы вводим три метода получения дескрипторов: потеря кросс-объекта, прямое обучение с несколькими объектами и синтетическое обучение с несколькими объектами. Изменяя функцию потерь и процесс выборки, мы можем получить дескрипторы, которые обобщают классы объектов или имеют разные представления для каждого экземпляра объекта. Кроме того, мы показали, что роботизированное самоконтролируемое обучение плотным визуальным дескрипторам может быть применено к большому количеству потенциально нежестких объектов и классов (в настоящее время 47 объектов в 3 разных классах) и может быть изучено быстро (примерно 20 минут). Мы также предлагаем общие методы обучения для изучения плотных дескрипторов (см. Раздел 3.2), которые имеют решающее значение для хорошей работы на практике. Наконец, мы демонстрируем новые применения изученных плотных дескрипторов в роботизированных манипуляциях. В примерах задач мы захватываем характерные точки объектов в потенциально деформируемых конфигурациях, делаем это со специфичностью экземпляра объекта в загроможденных средах или переносим определенные действия захвата между объектами в классе.
Рисунок 1: Обзор процесса сбора данных и обучения. (a) Автоматический сбор данных с помощью робота-манипулятора (b) Обнаружение изменений с использованием методов плотной трехмерной реконструкции (c)-(f) Зеленый цвет указывает на совпадение, красный цвет указывает на несоответствие.
5 Экспериментальные результаты
Рисунок 2: Дескрипторы изученных объектов согласуются после значительной деформации (а) и, при желании, по категориям объектов (б-г). На рисунках (a) и (b-d) вверху показаны кадры RGB, а внизу, соответственно, изображения дескрипторов, непосредственно выводимые путем прямого распространения обучающей сети. (e)-(f) показывают, что мы можем выучить дескрипторы для объектов с низкой текстурой и маскировать дескрипторы для четкой визуализации. В правой части рисунка мы суммируем набор объектов.
5.1 Плотные дескрипторы для одного объекта
Рисунок 3: (а) Таблица, показывающая различные типы сетей, упомянутых в экспериментах. Метки столбцов соответствуют методам, обсуждаемым в разделе 3. (b) На графике показана кумулятивная функция распределения расстояния в пикселях L2 между наилучшим соответствием u_b hat и фактическим соответствием u_b* (нормализованное по диагонали изображения, 800 для изображения 640*480), например: для 93 Для % пар изображений, использующих процесс обучения «стандарт-SO», нормализованное расстояние между u_b* и u_b в пикселях составляет менее 13%. Все сети обучаются на одном и том же наборе данных с использованием процедуры обучения, отмеченной в (а). (c) На рисунке изображен
(т. е. они ближе к u_a* в пространстве дескрипторов, чем к фактическому соответствию u_b*) кумулятивной функции распределения пикселей в части u_b точки пикселя объекта.
Рисунок 4: Сравнение результатов обучения без какой-либо очевидной потери объекта (а) и с потерей перекрестного объекта (б). В (b) межобъектная потеря применяется в течение 50 % обучающих итераций, в оставшихся 50 % применяется внутрисценовая потеря одного объекта, а (а) 100 % используется внутрисценовая потеря одного объекта. На этих графиках показана диаграмма рассеяния дескрипторов для 10 000 случайно выбранных пикселей на объект в трех разных объектах. Сеть обучается с D = 2, что упрощает визуализацию кластеров. (c) Участок с теми же координатами, что и в 3(b). Все сети обучаются на одном и том же наборе данных из 3 объектов. Сети с числовыми метками обучаются с межобъектной потерей, где числа представляют размерность дескрипторов. Некросс-объектная сеть (красная линия) — это сеть, обученная без кросс-объектных потерь.
5.2 Плотные дескрипторы для нескольких объектов
Рисунок 5: Координаты (а) те же, что и на рисунке 3 (а).Сравнивается тренировочный процесс "стандарт-СО" и "без-ДР" Разница только в том, что "без-ДР" не используется во время обучения Методы фоновой рандомизации предметной области. Набор данных, использованный в (а), содержит 3 объекта, каждый из которых имеет 4 сцены. (b) На рисунке показано, что для набора данных, содержащего 10 тренировочных сцен, дескрипторы, полученные во время обучения без случайности фона и ориентации, не согласованы (в центре), но с фоном и случайностью ориентации. Дескрипторы, полученные во время секса, были согласованы (справа).
5.4 Пример применения робота: захват определенной точки
Рисунок 6: Схематическая диаграмма, изображающая процесс «захвата определенной точки». Пользователь назначает точку пикселя каждому эталонному изображению, и робот автоматически выбирает точку, которая лучше всего соответствует тестовой среде. Для одного объекта можно увидеть, как робот захватывает две разные точки объекта-гусеницы: хвост (i) и правое ухо (ii). Обратите внимание, что демонстрация «правого уха» является примером нарушения симметрии довольно симметричного объекта. Что касается способности к межклассовому обобщению (iii), при последовательном обучении робот улавливает межклассовые точки обобщения (точки с общими характеристиками) на различных объектах. Эта работа тренируется только на 4-х туфлях и распространяется на экземпляры туфель, которых робот раньше не видел, например (c). Для «специфической» задачи робот обучается на конкретном объекте, а данные дополняются путем синтеза сцен с несколькими объектами (3.3 iii), что позволяет роботу понять даже эту точку конкретного экземпляра в загроможденной среде.
Бумага: Сети плотных объектов: изучение дескрипторов плотных визуальных объектов с помощью роботизированных манипуляций и для них
Ссылка на бумагу:АР Вест V.org/PDF/1806.08…
Резюме:Как должно выглядеть правильное представление объекта для роботизированных манипуляций? Мы надеемся, что робот может интуитивно воспринимать сцену, понимать объекты на ней и удовлетворять следующим требованиям: (i) не зависит от конкретной задачи, может использоваться в качестве строительного блока в различных задачах манипуляции, (ii) широко применим. к твердым и нежестким объектам, (iii) использовать богатую априорную информацию, предоставляемую трехмерными изображениями, и (iv) учиться полностью с помощью методов самоконтроля. Этого трудно достичь с помощью предыдущих методов, в частности: многие недавние работы по схватыванию объектов не распространяются на схватывание конкретных объектов или других задач, а обучение конкретным задачам может потребовать значительных усилий для получения хорошей способности к обобщению различных конфигураций объектов и других задач. В этой статье мы основываемся на последних достижениях в обучении плотных дескрипторов с самоконтролем, чтобы предложить плотные сети объектов в качестве согласованных представлений объектов для задач визуального понимания и манипулирования. Мы показали, что их можно быстро (приблизительно за 20 минут) обучить работе с различными априори неизвестными и, возможно, нежесткими объектами. Кроме того, мы представляем некоторые новые вклады, позволяющие изучать дескрипторы с несколькими объектами, и показываем, что можно изменить процесс обучения, чтобы получить дескрипторы, которые можно обобщать для разных классов объектов или которые различны для каждого символа экземпляра объекта. Наконец, мы демонстрируем новые применения изученных плотных дескрипторов в роботизированных манипуляциях. Мы демонстрируем процесс захвата определенных точек объекта при потенциально деформируемых конфигурациях объекта и перенос определенных действий захвата для различных объектов внутри класса с использованием общих для класса дескрипторов.