Конвейеры на базе моделирования адаптируют обучающие данные для ловких роботов

Моушн-дизайн INSIDER

PhysicsGen может превратить несколько десятков демонстраций виртуальной реальности в почти 3000 симуляций на машину для механических компаньонов, таких как роботизированные руки и руки. (Изображение:разработано Алексом Шиппсом/MIT CSAIL с использованием фотографий исследователей)

Когда ChatGPT или Gemini дают кажущийся экспертным ответ на ваши животрепещущие вопросы, вы можете не осознавать, как много информации они полагаются, чтобы дать этот ответ. Как и другие популярные модели генеративного искусственного интеллекта (ИИ), эти чат-боты полагаются на магистральные системы, называемые базовыми моделями, которые обучаются на миллиардах или даже триллионах точек данных.

Аналогичным образом инженеры надеются создать модели фундаментов, которые обучат целый ряд роботов новым навыкам, таким как подъем, перемещение и установка объектов в таких местах, как дома и фабрики. Проблема в том, что сложно собирать и передавать обучающие данные между роботизированными системами. Вы можете обучить свою систему, шаг за шагом телеуправляя оборудованием, используя такие технологии, как виртуальная реальность (VR), но это может занять много времени. Обучение на видеороликах из Интернета менее поучительно, поскольку ролики не содержат пошагового выполнения специализированных задач для конкретных роботов.

Подход, основанный на моделировании, под названием «PhysicsGen», разработанный Лабораторией компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) и Институтом робототехники и искусственного интеллекта, настраивает данные обучения роботов, чтобы помочь роботам находить наиболее эффективные движения для выполнения задачи. Система может превратить несколько десятков VR-демонстраций в почти 3000 симуляций на машину. Эти высококачественные инструкции затем сопоставляются с точными конфигурациями механических компаньонов, таких как роботизированные руки и кисти.

PhysicsGen создает данные, которые обобщаются для конкретных роботов и условий с помощью трехэтапного процесса. Во-первых, гарнитура виртуальной реальности отслеживает, как люди манипулируют руками с объектами, такими как блоки. Эти взаимодействия одновременно отображаются в трехмерном физическом симуляторе, визуализируя ключевые точки наших рук в виде маленьких сфер, отражающих наши жесты. Например, если вы перевернете игрушку, вы увидите трехмерные фигуры, представляющие разные части ваших рук, вращающие виртуальную версию этого объекта.

Затем конвейер переназначает эти точки на 3D-модель установки конкретной машины (например, роботизированной руки), перемещая их в точные «суставы», где система изгибается и поворачивается. Наконец, PhysicsGen использует оптимизацию траектории — по сути, моделирует наиболее эффективные движения для выполнения задачи — поэтому робот знает, как лучше всего выполнять такие действия, как перемещение коробки.

Каждая симуляция представляет собой подробные данные обучения, которые знакомят робота с потенциальными способами обращения с объектами. Когда это реализовано в политике (плане действий, которому следует робот), машина имеет множество способов решения задачи и может пробовать разные движения, если какое-то из них не работает.

«Мы создаем данные, специфичные для роботов, без необходимости перезаписи людьми специализированных демонстраций для каждой машины», — сказал Луджи Ян, доктор философии Массачусетского технологического института. студент факультета электротехники и информатики и член CSAIL, ведущий автор новой статьи, представляющей проект. «Мы масштабируем данные автономно и эффективно, делая инструкции по выполнению задач полезными для более широкого круга машин».

Создание такого количества обучающих траекторий для роботов может в конечном итоге помочь инженерам создать огромный набор данных для управления такими машинами, как роботизированные руки и ловкие руки. Например, конвейер может помочь двум роботам-манипуляторам совместно собирать товары со склада и размещать их в нужных коробках для доставки. Система также может помочь двум роботам работать вместе в домашнем хозяйстве, например, убирая чашки.

Потенциал PhysicsGen также распространяется на преобразование данных, предназначенных для старых роботов или других сред, в полезные инструкции для новых машин. «Несмотря на то, что они собираются для конкретного типа роботов, мы можем возродить эти предыдущие наборы данных, чтобы сделать их более полезными в целом», — сказал Ян. PhysicsGen превратил всего 24 человеческих демонстрации в тысячи симулированных, помогая цифровым и реальным роботам переориентировать объекты.

Янг и ее коллеги впервые протестировали свой конвейер в виртуальном эксперименте, где плавающей роботизированной руке нужно было повернуть блок в заданное положение. Цифровой робот выполнил задачу с точностью 81 процент, обучаясь на огромном наборе данных PhysicsGen, что на 60 процентов лучше исходного уровня, который был получен только на основе человеческих демонстраций.

Исследователи также обнаружили, что PhysicsGen может улучшить взаимодействие виртуальных роботов-манипуляторов при манипулировании объектами. Их система создала дополнительные тренировочные данные, которые помогли двум парам роботов успешно выполнять задачи на 30 процентов чаще, чем в базовом режиме, обученном человеком.

В эксперименте с парой реальных роботизированных рук исследователи наблюдали аналогичные улучшения, когда машины объединялись, чтобы перевернуть большой ящик в назначенное положение. Когда роботы отклонялись от намеченной траектории или неправильно обращались с объектом, они могли восстановиться в середине задания, ссылаясь на альтернативные траектории из своей библиотеки обучающих данных.

Старший автор Расс Тедрейк, профессор электротехники, информатики, аэронавтики, космонавтики и машиностроения Toyota в Массачусетском технологическом институте, сказал, что этот метод генерации данных на основе имитации сочетает в себе сильные стороны человеческой демонстрации с мощью алгоритмов планирования движения роботов.

«Даже одна демонстрация на человеке может значительно облегчить задачу планирования движения», — сказал Тедрейк, который также является старшим вице-президентом по большим моделям поведения в Исследовательском институте Toyota и главным исследователем CSAIL. «В будущем, возможно, базовые модели смогут предоставлять эту информацию, и этот тип метода генерации данных предоставит своего рода рецепт для этой модели после обучения».

Вскоре PhysicsGen может выйти на новый уровень:разнообразить задачи, которые может выполнять машина. «Мы хотели бы использовать PhysicsGen, чтобы научить робота наливать воду, когда он, например, только обучен убирать посуду», — говорит Ян. «Наш конвейер не просто генерирует динамически осуществимые движения для знакомых задач; он также потенциально может создать разнообразную библиотеку физических взаимодействий, которые, по нашему мнению, могут служить строительными блоками для выполнения совершенно новых задач, которые человек еще не демонстрировал».

Создание большого количества широко применимых обучающих данных может в конечном итоге помочь построить базовую модель для роботов, хотя исследователи Массачусетского технологического института предупреждают, что это довольно далекая цель. Команда под руководством CSAIL исследует, как PhysicsGen может использовать огромные неструктурированные ресурсы, такие как интернет-видео, в качестве затравки для моделирования. Цель:превратить повседневный визуальный контент в обширные данные, готовые для роботов, которые могли бы научить машины выполнять задачи, которые им никто явно не показывал.

Янг и ее коллеги также стремятся в будущем сделать PhysicsGen еще более полезным для роботов различных форм и конфигураций. Для этого они планируют использовать наборы данных с демонстрацией реальных роботов, фиксируя, как движутся роботизированные суставы, а не человеческие.

Исследователи также планируют внедрить обучение с подкреплением, при котором система ИИ учится методом проб и ошибок, чтобы PhysicsGen расширила свой набор данных за пределы примеров, предоставленных человеком. Они могут дополнить свой конвейер передовыми методами восприятия, которые помогут роботу воспринимать и интерпретировать окружающую среду визуально, позволяя машине анализировать и адаптироваться к сложностям физического мира.

На данный момент PhysicsGen показывает, как ИИ может помочь нам научить разных роботов манипулировать объектами одной категории, особенно жесткими. Вскоре этот конвейер может помочь роботам найти лучшие способы обращения с мягкими предметами (например, фруктами) и деформируемыми (например, глиной), но смоделировать эти взаимодействия пока непросто.

Источник

Доступная, прочная, сверхчувствительная роботизированная кожа для улучшенного восприятия, подобного челове… Ультразвук выявляет скрытые дефекты аккумулятора:новый диагностический инструмент

Датчик