Внедрение персональных помощников роботов
Недавно я посетил MWC Shanghai. Роботы были большими - очень большими. Я видел десятки компаний, ищущих клиентов для брендинга и предложения их в любом из множества приложений. Возьмем только один пример приложения - робот-медсестра Буксир. Это не очень похоже на наш научно-фантастический образ роботов, если вы не думаете о некоторых из наиболее утилитарных примеров из «Звездных войн». Это коробка на колесах, но у нее есть многие функции, которые мы ожидаем от мобильных роботов, включая навигацию и предотвращение препятствий. Он может перемещаться по больнице, он остановится, если кто-то встанет перед ним, и будет обходить ошибочную стойку для внутривенных вливаний; он также может вызвать лифт, чтобы попасть на другой этаж.
Цель Tug - доставлять лекарства и еду пациентам, и он уже развернут в 37 больницах VA в США. Представьте себе нагрузку, которая снимает с плеч занятых конфетчиков. Существует множество других приложений для помощников по уходу за престарелыми, в учебных заведениях, ресторанах и отелях. Думайте об этом как о следующем большом событии в личных помощниках после умных колонок (у Amazon уже есть более 100 тысяч роботов, работающих на их складах, поэтому очевидно, что они работают над домашними роботами как продолжением Echo). Это не научная фантастика; Роботы-помощники по дому уже поступили в продажу.
Помощник по здоровью робота (Источник:CEVA / Shutterstock)
Существуют очевидные технические проблемы при создании такого типа роботов, аналогичные проблемам автономного вождения, хотя есть некоторые явные различия. Навигация и уклонение от препятствий являются обычным явлением, но концепции чистых полос движения и управления дорожным движением к этим роботам неприменимы; это все об избежании препятствий и навигации в здании (с переназначением для обхода временных неподвижных препятствий). И хотя интерфейс на естественном языке может быть полезным в автомобиле, для роботов-помощников он может быть необходим. Кто хочет научиться нажимать кнопки, когда аптека отправила неправильное лекарство или ресторан испортил ваш заказ?
Компания Gartner недавно составила список 10 основных требований к ИИ и распознаванию роботов, среди которых:
-
Компьютерное зрение - анализ сцены, распознавание объектов и т. д.
-
Биометрическое распознавание и аутентификация - кто разговаривает со мной и разрешено ли им давать эти команды
-
Диалоговый интерфейс - распознавание речи и обработка естественного языка
-
анализ акустического ландшафта - распознавание характерных шумов, таких как лай собаки или бьющееся стекло
-
Определение местоположения - где я и что / кто рядом со мной
-
Автономное движение - возможность перемещаться к цели в другом месте здания без столкновения с объектами или людьми
-
Функции ИИ в роботе - не только в зависимости от облака
Подход по умолчанию к созданию систем с этими возможностями сегодня начинается с встраивания системы искусственного интеллекта в робота на основе многоядерной платформы графического процессора. Это и понятно - разработчики продуктов могут создать прототип решения, используя готовую платформу, не беспокоясь о деталях ASIC, почти так же, как они использовали бы плату разработки ЦП для более традиционных приложений. Но по мере того, как объем продукта увеличивается или вы его увеличиваете, стоимость и удовлетворенность / дифференциация клиентов становятся все более важными. Готовые решения дороги, энергоемки, и их сложно отличить, когда вы используете ту же платформу, что и все остальные. Вот почему неизбежно массовые решения обращаются к платформам ASIC. Вам не нужно отказываться от всех вложений, которые вы вложили в свой прототип; более дешевая платформа графического процессора может остаться частью решения, но значительный уровень функциональности ИИ может быть перенесен на гораздо более экономичную и более интегрированную платформу.
Преимущества производительности на ватт DSP по сравнению с графическими процессорами в приложениях машинного обучения (ML) хорошо известны, частично благодаря операциям с фиксированной запятой по сравнению с операциями с плавающей запятой и гибкости квантования на некоторых платформах. И ценовые преимущества (в объеме) индивидуальных решений хорошо известны. Вот почему вы с большей вероятностью увидите встроенный DSP в приложениях машинного обучения, чувствительных к объему / цене, на периферии, чем стандартный графический процессор.
Но сможете ли вы сделать все, что могли, в графическом процессоре? Оказывается, можно довольно много. Возьмем, к примеру, компьютерное зрение - позиционирование, отслеживание, распознавание объектов и распознавание жестов. Этот уровень обработки изображений уже доступен сегодня на некоторых встроенных платформах на основе DSP. Или возьмем автономное перемещение с поддержкой локального переобучения (без перехода в облако). Опять же, основные возможности распознавания для поддержки этого интеллекта, те же возможности, которые вы также можете найти в графическом процессоре, доступны в DSP.
Распознавание голоса / аутентификация и акустический анализ сцены также могут быть выгружены. Эти (наряду с другими примерами здесь) четко показывают, почему разгрузка имеет такой смысл. Каждая из этих интеллектуальных операций разбивается на несколько этапов, скажем, от приема голоса и разрешения направления до, возможно, базового распознавания слов и, в конечном итоге, даже обработки естественного языка (NLP). Последний шаг сложен и может потребовать перехода в облако. Но предыдущие шаги можно очень удобно выполнить во встроенном решении. В некоторых приложениях, где требуется распознавать только ограниченный словарный запас или где вы хотите обнаруживать невербальные сигналы, такие как разбитие окна, вам может вообще не понадобиться облако (или локальный графический процессор). Уже есть намеки на то, что даже ограниченное НЛП может поддерживаться на периферии в ближайшем будущем.
Появился обширный набор решений для поддержки этих интерфейсных функций с использованием ИИ на периферии, во внешней обработке голоса и в глубоком обучении в IoT. Используя эти решения, разработчики могут более легко решать возникающие проблемы, связанные с повсеместным распространением персональных помощников-роботов.
Моше Шейер является директором по стратегическому маркетингу CEVA, где он курирует корпоративное развитие и стратегическое партнерство для основных целевых рынков CEVA и направлений будущего роста. Моше сотрудничает с ведущими компаниями в области программного обеспечения и интеллектуальной собственности, чтобы вывести на рынок инновационные решения на основе DSP. В свободное время Моше катается на горных велосипедах и занимается айкидо.
Интернет вещей
- Готова ли моя фабрика для робота?
- Промышленный робот
- Приложения для портальных роботов
- Промышленные роботы в автомобильной промышленности
- 10 лучших производителей роботов SCARA
- Робот-паук Arduino (четвероногий)
- Ручные направляющие роботы
- 5 аспектов роботов-помощников в области здравоохранения
- Идея:больничные роботы
- Мы делаем роботов умнее и безопаснее