Микросхема аппаратного вывода нацелена на автомобильные приложения

Компания AImotive из Венгрии, разработчик технологий автоматизированного вождения на основе программного и аппаратного обеспечения, начала поставки своей интеллектуальной собственности (IP) аппаратного механизма логического вывода aiWare3 своим основным клиентам.

Его IP-ядро aiWare3P, о котором было объявлено в прошлом году, предлагает аппаратный ускоритель NN для приложений автомобильного зрения с высоким разрешением, а также в качестве компонента в подсистемах, сертифицированных по стандарту ASIL A, B и выше по ISO26262. Ядро, которое может быть развернуто в системе на кристалле (SoC) или как автономный ускоритель NN, предоставляется в виде полностью синтезируемого RTL; его низкоуровневая микроархитектура предназначена для использования гораздо меньше ресурсов центрального процессора или общей памяти, чем другие аппаратные ускорители NN.

Выделенные ускорители NN, такие как aiWare3P IP, используемые в различных частях платформы автомобильной электроники (Источник:AImotive)

В интервью EE Times Europe О том, чем предложение AIMotive отличается от других решений, Тони-Кинг Смит, исполнительный советник компании, сказал, что большинство производителей микросхем говорят об ускорителях на основе графических процессоров и SoC, протестированных в лабораторных условиях, что не очень хорошо работает. в реальный мир. «Принципиальная разница в том, что необходимо понимать принципы работы нейронных сетей, а не ускорителя. В нашем решении нет DSP, нет NOC (сеть на кристалле). aiWare предназначен только для автомобильных выводов, поэтому мы можем обеспечить низкую задержку от ввода до вывода ». Он добавил, что улучшения в RTL-выводе нового ядра означают, что оно освобождает основную подсистему ЦП, и затем ядро можно подключить к любому ускорителю SoC.

IP-ядро aiWare3P включает в себя функции, которые приводят к повышению производительности, снижению энергопотребления, большей разгрузке центрального процессора и более простой компоновке для более крупных микросхем. Каждое ядро обеспечивает до 16 TMAC / с (> 32 TOPS) на частоте 2 ГГц, при этом многоядерные и многочиповые реализации способны обеспечивать до 50+ TMAC / с (> 100 INT8 TOPS) - полезно для многокамерных или гетерогенных сенсорные приложения. Ядро предназначено для работы в расширенных температурных режимах AEC-Q100 и включает функции, позволяющие пользователям получить сертификат ASIL-B и выше.

Масштабируемость производительности IP-ядра до более чем 50 TMAC / с (> 100 TOPS) на чип и устойчивый логический вывод с низкой задержкой являются результатом его низкоуровневой микроархитектуры. Он использует запатентованную конструкцию с нуля для высокодетерминированного управления потоками данных с высокопараллельной архитектурой, ориентированной на память, с пропускной способностью встроенной памяти до 100 раз большей, чем у других аппаратных ускорителей NN, что обеспечивает устойчивую эффективность до 95% для сложных DNN, используемых с большими такие входы, как несколько камер HD.

Поддерживая NNEF Khronos, а также входные данные открытого стандарта ONNX, aiWare SDK напрямую компилирует двоичные файлы без необходимости низкоуровневого программирования DSP или MCU. Он включает автоматизированные инструменты для квантования FP32 в INT8 с небольшой потерей точности или без нее, а также растущий портфель сложных инструментов анализа производительности DNN. Последние разработаны, чтобы помочь инженерам по программному обеспечению и искусственному интеллекту переносить и преобразовывать NN, обученные в лаборатории, в эффективные решения в реальном времени, выполняемые на производственных автомобильных аппаратных платформах на базе aiWare.

Строительные блоки автомобильного ускорителя ИИ, включая аппаратный IP-адрес aiWare (Источник:AImotive)

Мартон Фехер, старший вице-президент по разработке аппаратного обеспечения AImotive, сказал:«Наша готовая к производству версия aiWare3P объединяет все, что мы знаем об ускорении нейронных сетей для автомобильных приложений логического вывода ИИ на основе машинного зрения. Теперь у нас есть одно из самых эффективных и убедительных решений для ускорения NN в автомобильной отрасли для массового производства L2 / L2 + / L3 AI ».

Аппаратный IP aiWare3P развертывается в ряде производственных решений L2 / L2 +, а также применяется для исследований более сложных приложений гетерогенных датчиков. Заказчики включают Nextchip для своего будущего процессора Apache5 Imaging Edge и ON Semiconductor для их совместного проекта с AImotive по демонстрации передовых возможностей объединения гетерогенных датчиков.

AImotive заявила, что выпустит полное обновление своих публичных результатов тестов в первом квартале 2020 года на основе IP-ядра aiWare3P. Это часть его приверженности открытому тестированию с использованием хорошо контролируемых тестов, отражающих реальные приложения, такие как входы с высоким разрешением для камер, а не нереалистичные общедоступные тесты, использующие входные данные 224 × 224.

Не требуется вмешательство ЦП хоста

Новые функции аппаратного IP aiWare3P включают поддержку гораздо большего портфеля предварительно оптимизированных встроенных функций активации и объединения, гарантируя, что 100% большинства NN выполняются в ядре aiWare3P без какого-либо вмешательства центрального процессора; сжатие данных в реальном времени, что снижает требования к пропускной способности внешней памяти - особенно для больших размеров ввода и более глубоких сетей; и усовершенствованная перекрестная связь между механизмами свертки C-LAM и функциональными модулями F-LAM для повышения эффективности выполнения с перекрытием и чередованием.

Физическая микроархитектура на основе тайлов позволяет упростить физическую реализацию больших ядер AIWare за счет минимизации сложных временных ограничений на любом узле процесса; а логическое управление данными на основе плиток обеспечивает эффективную масштабируемость рабочей нагрузки до максимальных 16 TMAC / с на ядро без необходимости использования кешей, NOC или других сложных подходов на основе многоядерных процессоров, которые создают узкие места, снижают детерминизм и потребляют больше энергии и Область кремния aiWare3P RTL будет поставляться всем клиентам с января 2020 года, а обновленный SDK включает улучшенный компилятор и новые инструменты анализа производительности как для автономной оценки, так и для детального анализа целевого оборудования в реальном времени.

Чип AI обрабатывает одновременные рабочие нагрузки Настраиваемый индуктивный датчик поддерживает высокоскоростные автомобильные и промышленные электродвига…

Встроенный

Датчик

Облачные вычисления

Интернет вещей