Почему более умная кромка приведет к появлению новых приложений компьютерного зрения в 2019 году
В 2018 году произошел значительный прогресс в области компьютерного зрения. Точность обнаружения объектов и распознавания лиц продолжает улучшаться, а количество доступных опций, основанных на современных технологиях глубокого обучения, включая сверточные и рекуррентные нейронные сети, продолжает расти. За эти улучшения приходится платить - они усложняют и обрабатывают требования к технологиям. Например, YOLOV3, популярная модель распознавания объектов, имеет 106-слойную полностью сверточную базовую архитектуру, что более чем вдвое больше, чем в предыдущей версии. Другие модели, такие как варианты RetinaNet и SSD, также демонстрируют огромный прогресс в точности, но опять же за счет увеличения сложности и снижения производительности.
В ногу с новыми потребностями
В то время как сложность и вычислительные требования передовых технологий компьютерного зрения возрастают, существует потребность в применении этих технологий против растущего числа потоков видео в реальном времени с высоким разрешением. Количество камер видеонаблюдения стремительно растет, и ожидается, что они будут обеспечивать проактивную разведку. Пассивной видеосистемы уже недостаточно. Проще говоря, камеры должны быть намного умнее.
Реальность внедрения передовых технологий машинного обучения требует нового подхода к реализации. Потоковая передача видео с полным разрешением в облако для обработки непомерно дорого, требует слишком большой полосы пропускания и приводит к большим задержкам. Размещение большого количества мощных серверов на месте имеет свои собственные наборы проблем, требующих большого количества драгоценного места и энергии, и может быть дорогостоящим при попытке развертывания на большом количестве камер. Он также не учитывает реалии работы в средах с несколькими местоположениями, которые становятся все более важными для использования данных. Обработка живого видео с 1 или 2 камер - это одно. Обработка видео с сотен камер в реальном времени в одном или нескольких местах, часто с ограниченными доступными ресурсами, требует от нас совершенно другого мышления.
Решение:видео на грани
Ответ лежит на грани. Использование интеллекта на периферии позволяет распределять рабочую нагрузку по множеству устройств. Это может означать либо встраивание более мощных возможностей обработки в саму камеру, либо добавление высокоэффективных периферийных устройств, которые находятся между камерами и облаком. Для этого компании по периферийной обработке данных начинают выпускать быстрые и энергоэффективные специализированные процессоры искусственного интеллекта. Nvidia запустила несколько модулей в своей серии Jetson для выполнения логического вывода в реальном времени во встроенных устройствах, а Intel, благодаря приобретению Movidius, предлагает свои процессоры серии Myriad и модуль нейронных вычислений. В последние несколько лет огромные объемы средств инвесторы направляются в новое поколение компаний, производящих микросхемы, которые предлагают недорогие и высокопроизводительные возможности обработки глубокого обучения. Такие компании, как Mythic, Graphcore и другие, получили венчурное финансирование на 100 миллионов долларов. Недавно даже Google и Amazon анонсировали собственные чипы для обработки кромок. Это удивительное признание двумя чистыми облачными компаниями важности обработки машинного обучения на периферии.
Что нас ждет?
Обработка на основе краев предоставит совершенно новый вид интеллекта в реальном времени. То, что в настоящее время является пассивными видеомагнитофонами, скоро будут наблюдать за детьми, которые рискуют утонуть в бассейне, обнаруживают оружие возле школы или открывают двери для сотрудников без ключа. Они будут искать дефекты на производственных линиях, находить рабочих, которые не надевают защитное оборудование, и узнавать, как люди перемещаются в розничной среде, чтобы оптимизировать потоки и сократить время ожидания. Камеры, наконец, предоставят данные, которые можно предпринять в реальном времени. Мы увидим огромные улучшения в нашей способности повысить безопасность, надежность производства, удовлетворенность и безопасность покупателей в магазинах.
С более чем 1 миллиардом развернутых камер и следующим миллиардом, готовым к развертыванию, периферийная обработка данных дает возможность, наконец, сделать их умными.
Компании уже могут найти поставщиков услуг видеонаблюдения, таких как Kogniz, которые могут предоставить возможности, которые могут идентифицировать людей и закономерности в реальном времени. Благодаря подходу Kogniz в сервисе используются периферийные устройства, включая автономные камеры и адаптеры для существующих IP-камер, что позволяет развертывать по требованию с минимальной инфраструктурой. Решение Kogniz работает с неограниченным количеством камер и в любом количестве местоположений.
Джед Путтерман является со-генеральным директором Kogniz. Г-н Путтерман основал несколько технологических компаний, включая Snapcentric, приобретенную VeriSign, и Allerez, приобретенную Mercury Interactive Corporation. Г-н Путтерман начал свою карьеру в Oracle Corporation и много лет проработал консультантом в крупных компаниях, включая Sun Microsystems, SGI и Aspect Communications. Окончил Калифорнийский университет в Беркли.
Интернет вещей
- Почему периферийные вычисления для Интернета вещей?
- Слайд-шоу K 2019:новые смолы, новые применения в материалах
- Что такое периферийные вычисления и почему они важны?
- Исследование 5G, проведенное DARPA, приведет к появлению коммерческих приложений
- Реализует ли 5G видение 2020 года?
- Почему сеть передачи данных будет двигать энергетику вперед в 2019 году
- Почему периферийные вычисления так важны для IIoT
- Edge и IoT:выводы из IoT World 2019
- Тенденции продолжают продвигать обработку до края для ИИ
- Hitachi выпускает новый промышленный компьютер