Чип AI ускоряет распознавание изображений
Проверенная концепция чипа от французских исследовательских институтов CEA-Leti и LIST, представленная на симпозиуме VLSI 2020, включает маломощный узел Интернета вещей и ускоритель искусственного интеллекта и демонстрирует сверхбыстрое время пробуждения с 15000-кратным размахом от пика до нуля. снижение энергопотребления на холостом ходу. Узел выполняет до 1,3 тера операций в секунду на ватт (TOPS / Вт) или 36 GOPS для задач машинного обучения.
Чип, названный SamurAI, был протестирован в системе обнаружения присутствия с готовыми компонентами, включая датчик PIR, черно-белую камеру 224 × 224 пикселей, FeRAM и радиомодуль с низким энергопотреблением. Среднесуточное энергопотребление системы составляло 105 мкВт, при этом SamurAI потреблял 26% этого бюджета. В системе использовался ИК-датчик с интервалом 5 с при использовании комнаты 8 часов в день, камера с частотой 1 кадр в секунду и радио 10 раз в день.
Система SamurAI
SamurAI использует две подсистемы на кристалле:маломощный, управляемый событиями контроллер пробуждения без тактовой частоты, который может запускаться через 207 нс, и подсистему по запросу, состоящую из процессора RISC-V с режимом глубокого сна и ускорителя PNeuro AI. и ускорители криптографии.
Эта схема с двумя подсистемами обеспечивает отношение пиковой мощности к мощности холостого хода в 15000 раз. На рисунке ниже показано энергопотребление в разных режимах; в режиме ожидания потребляется всего 6,4 мкВт. При работающем процессоре и ускорителе искусственного интеллекта потребляемая мощность составляет 96 мВт.
Чип построен по 28-нм технологии STMicro, полностью обедненный кремний на изоляторе (FD-SOI), а показатели мощности приведены без смещения корпуса. Силикон 4,5 мм 2 и имеет 6 переключаемых областей мощности.
Измерение энергопотребления SamurAI по режимам питания (режимы LR:режим ожидания, только контроллер пробуждения (WuC), контроллер пробуждения и радио пробуждения (WuR), контроллер пробуждения и периферийные устройства, и процессор работает (Изображение:CEA-Leti)
AI-ускоритель
Ускоритель искусственного интеллекта чипа, дизайн которого команда называет PNeuro, представляет собой программируемый ускоритель с одной инструкцией и множеством данных (SIMD). Он состоит из 2 кластеров по 32 8-битных обрабатывающих элементов с многобанковой SRAM объемом 264 КБ. Он может выполнять до 64 операций умножения с накоплением (MAC) за цикл. Блок PNeuro может достигать 1,3 TOPS / Вт при 2,8 GOPS / 0,48 В. Он может выполнять до 36 GOPS при 0,9 В для 8-битных полносвязных слоев нейронной сети.
Использование ускорителя PNeuro снизило общее энергопотребление системы в 2,3 раза по сравнению с использованием ядра контроллера RISC-V для вычислений ML.
Дизайн предназначен для приложений Интернета вещей, которым требуется время от времени вычислительная мощность между длительными периодами «сна». Вместо подключения к облаку, если узел может обрабатывать рабочую нагрузку AI сам, это часто может быть выполнено быстрее, и это не влияет на конфиденциальность, поскольку данные не передаются за пределы системы. Сюда могут входить такие приложения, как обнаружение человека или идентификация сцены с помощью камер или других датчиков.
>> Эта статья была первоначально опубликована на наш дочерний сайт EE Times Europe.
Встроенный