Промышленное производство
Промышленный Интернет вещей | Промышленные материалы | Техническое обслуживание и ремонт оборудования | Промышленное программирование |
home  MfgRobots >> Промышленное производство >  >> Industrial Internet of Things >> Встроенный

Микросхема аппаратного вывода нацелена на автомобильные приложения

Компания AImotive из Венгрии, разработчик технологий автоматизированного вождения на основе программного и аппаратного обеспечения, начала поставки своей интеллектуальной собственности (IP) аппаратного механизма логического вывода aiWare3 своим основным клиентам.

Его IP-ядро aiWare3P, о котором было объявлено в прошлом году, предлагает аппаратный ускоритель NN для приложений автомобильного зрения с высоким разрешением, а также в качестве компонента в подсистемах, сертифицированных по стандарту ASIL A, B и выше по ISO26262. Ядро, которое может быть развернуто в системе на кристалле (SoC) или как автономный ускоритель NN, предоставляется в виде полностью синтезируемого RTL; его низкоуровневая микроархитектура предназначена для использования гораздо меньше ресурсов центрального процессора или общей памяти, чем другие аппаратные ускорители NN.

Выделенные ускорители NN, такие как aiWare3P IP, используемые в различных частях платформы автомобильной электроники (Источник:AImotive)

В интервью EE Times Europe О том, чем предложение AIMotive отличается от других решений, Тони-Кинг Смит, исполнительный советник компании, сказал, что большинство производителей микросхем говорят об ускорителях на основе графических процессоров и SoC, протестированных в лабораторных условиях, что не очень хорошо работает. в реальный мир. «Принципиальная разница в том, что необходимо понимать принципы работы нейронных сетей, а не ускорителя. В нашем решении нет DSP, нет NOC (сеть на кристалле). aiWare предназначен только для автомобильных выводов, поэтому мы можем обеспечить низкую задержку от ввода до вывода ». Он добавил, что улучшения в RTL-выводе нового ядра означают, что оно освобождает основную подсистему ЦП, и затем ядро ​​можно подключить к любому ускорителю SoC.

IP-ядро aiWare3P включает в себя функции, которые приводят к повышению производительности, снижению энергопотребления, большей разгрузке центрального процессора и более простой компоновке для более крупных микросхем. Каждое ядро ​​обеспечивает до 16 TMAC / с (> 32 TOPS) на частоте 2 ГГц, при этом многоядерные и многочиповые реализации способны обеспечивать до 50+ TMAC / с (> 100 INT8 TOPS) - полезно для многокамерных или гетерогенных сенсорные приложения. Ядро предназначено для работы в расширенных температурных режимах AEC-Q100 и включает функции, позволяющие пользователям получить сертификат ASIL-B и выше.

Масштабируемость производительности IP-ядра до более чем 50 TMAC / с (> 100 TOPS) на чип и устойчивый логический вывод с низкой задержкой являются результатом его низкоуровневой микроархитектуры. Он использует запатентованную конструкцию с нуля для высокодетерминированного управления потоками данных с высокопараллельной архитектурой, ориентированной на память, с пропускной способностью встроенной памяти до 100 раз большей, чем у других аппаратных ускорителей NN, что обеспечивает устойчивую эффективность до 95% для сложных DNN, используемых с большими такие входы, как несколько камер HD.

Поддерживая NNEF Khronos, а также входные данные открытого стандарта ONNX, aiWare SDK напрямую компилирует двоичные файлы без необходимости низкоуровневого программирования DSP или MCU. Он включает автоматизированные инструменты для квантования FP32 в INT8 с небольшой потерей точности или без нее, а также растущий портфель сложных инструментов анализа производительности DNN. Последние разработаны, чтобы помочь инженерам по программному обеспечению и искусственному интеллекту переносить и преобразовывать NN, обученные в лаборатории, в эффективные решения в реальном времени, выполняемые на производственных автомобильных аппаратных платформах на базе aiWare.

Строительные блоки автомобильного ускорителя ИИ, включая аппаратный IP-адрес aiWare (Источник:AImotive)

Мартон Фехер, старший вице-президент по разработке аппаратного обеспечения AImotive, сказал:«Наша готовая к производству версия aiWare3P объединяет все, что мы знаем об ускорении нейронных сетей для автомобильных приложений логического вывода ИИ на основе машинного зрения. Теперь у нас есть одно из самых эффективных и убедительных решений для ускорения NN в автомобильной отрасли для массового производства L2 / L2 + / L3 AI ».

Аппаратный IP aiWare3P развертывается в ряде производственных решений L2 / L2 +, а также применяется для исследований более сложных приложений гетерогенных датчиков. Заказчики включают Nextchip для своего будущего процессора Apache5 Imaging Edge и ON Semiconductor для их совместного проекта с AImotive по демонстрации передовых возможностей объединения гетерогенных датчиков.

AImotive заявила, что выпустит полное обновление своих публичных результатов тестов в первом квартале 2020 года на основе IP-ядра aiWare3P. Это часть его приверженности открытому тестированию с использованием хорошо контролируемых тестов, отражающих реальные приложения, такие как входы с высоким разрешением для камер, а не нереалистичные общедоступные тесты, использующие входные данные 224 × 224.

Не требуется вмешательство ЦП хоста

Новые функции аппаратного IP aiWare3P включают поддержку гораздо большего портфеля предварительно оптимизированных встроенных функций активации и объединения, гарантируя, что 100% большинства NN выполняются в ядре aiWare3P без какого-либо вмешательства центрального процессора; сжатие данных в реальном времени, что снижает требования к пропускной способности внешней памяти - особенно для больших размеров ввода и более глубоких сетей; и усовершенствованная перекрестная связь между механизмами свертки C-LAM и функциональными модулями F-LAM для повышения эффективности выполнения с перекрытием и чередованием.

Физическая микроархитектура на основе тайлов позволяет упростить физическую реализацию больших ядер AIWare за счет минимизации сложных временных ограничений на любом узле процесса; а логическое управление данными на основе плиток обеспечивает эффективную масштабируемость рабочей нагрузки до максимальных 16 TMAC / с на ядро ​​без необходимости использования кешей, NOC или других сложных подходов на основе многоядерных процессоров, которые создают узкие места, снижают детерминизм и потребляют больше энергии и Область кремния aiWare3P RTL будет поставляться всем клиентам с января 2020 года, а обновленный SDK включает улучшенный компилятор и новые инструменты анализа производительности как для автономной оценки, так и для детального анализа целевого оборудования в реальном времени.


Встроенный

  1. Infineon запускает серию встроенных систем питания TLE985x для автомобильных приложений
  2. Архитектура микросхемы ИИ нацелена на обработку графов
  3. Аппаратные ускорители обслуживают приложения AI
  4. Датчик Холла нацелен на важные с точки зрения безопасности автомобильные системы
  5. Представлен процессор автомобильных радаров со скоростью 30 кадров в секунду
  6. EKF:прочная платформа для настенного монтажа для железнодорожного, автомобильного и промышленного применения
  7. Portwell:19-дюймовая система нацелена на приложения для видеостен
  8. Углеродное волокно в автомобильных приложениях
  9. Упрочненные термостабилизированные компаунды PPA для требовательных автомобильных приложений
  10. Углеродные технологии SGL, предназначенные для автомобильных и аэрокосмических приложений