Недорогой кроссовер процессор поддерживает вывод конечной точки
БРИСТОЛЬ, Великобритания - XMOS адаптировала ядро процессора Xcore для машинного обучения, создав кроссовер для приложений AIoT. Xcore.ai будет доступен от 1 доллара.
Xcore.ai, третье поколение продуктов, созданных на основе собственной разработки компании, предназначено для вывода ИИ в реальном времени и принятия решений на конечных устройствах, а также может выполнять функции обработки сигналов, управления и связи.
Новым в этом чипе третьего поколения является возможность векторного конвейера для приложений машинного обучения. Это единственный кроссоверный процессор такого типа, поддерживающий бинаризованные (1-битные) нейронные сети, важность которых для ИИ со сверхнизким энергопотреблением в конечных приложениях возрастает, поскольку они предлагают повышение производительности и плотности памяти на порядок. для умеренного снижения точности (Xcore.ai также поддерживает 32-битные, 16-битные и 8-битные числа).
Xcore.ai присоединяется к новому классу систем с поддержкой ИИ на микросхемах для конечных приложений, кроссоверному процессору (Изображение:XMOS)
Xcore.ai присоединяется к новому классу процессоров для оконечных устройств с возможностями ИИ - кроссоверным процессорам. Созданный компанией NXP, этот термин описывает новую важную категорию устройств с производительностью прикладного процессора в сочетании с простотой использования, низким энергопотреблением и работой микроконтроллера в режиме реального времени.
«Если вы говорите с клиентами о« микроконтроллерах », они думают об устройствах Cortex-M0, M3 или M4, которые стоят 75 центов или ниже, с относительно низкой производительностью, около сотни MIPS или около того. Тогда «SoC» могут быть чем-то с четырьмя ядрами A53, работающими на гигагерцах. Есть большой пробел для чего-то посередине, например, для голосовых процессоров, что является особенно сложной математической задачей, требующей тысяч операций в секунду. Итак, есть большой пробел, в центре которого находится действительно большая и важная область приложения, и он заслуживает названия », - сказал Марк Липпет, генеральный директор XMOS, в эксклюзивном интервью EETimes.
Голосовые интерфейсы
Ранее анонсированный продукт второго поколения, XVF3510, был запущен в июле 2019 года в качестве ASIC для голосовых интерфейсов, но внутренняя часть микросхемы также основана на запатентованном дизайне компании Xcore и поставляется с прошивкой. Эталонные проекты решений для голосовой связи в дальней зоне на базе XVF3510 соответствуют требованиям Amazon Alexa Voice Service.
Учитывая историю XMOS в голосовом секторе, неудивительно, что чип Xcore.ai изначально будет нацелен на приложения с голосовым интерфейсом, которым требуется ИИ для обнаружения ключевых слов или функций словаря.
«Давайте будем абсолютно ясны, голос - самая важная рабочая нагрузка ИИ на конечной точке, и, вероятно, останется таковой в течение некоторого времени. Но чтобы сделать голосовые интерфейсы лучше, вы обнаружите, что устройства станут более мультимодальными », - сказал Липпет, описывая тенденцию к использованию различных типов датчиков, чтобы сделать приложения более контекстно-зависимыми, будь то обнаружение присутствия человека или определение того, где они говорят с.
Марк Липпет (Изображение:XMOS)
«Есть много возможностей улучшить взаимодействие с пользователем не только за счет прослушивания звука, но и за счет чего-то большего, - сказал он.
Многие приложения для искусственного интеллекта в устройствах IoT зависят от сочетания конфиденциальности, безопасности и защиты, что требует обработки на конечной точке. Липпетт описал функции безопасности на приборах, которые используют голосовой сигнал и радар для выключения духовки, например, если на кухне находятся только дети.
Таким образом, Xcore.ai выйдет на рынок с библиотеками, предназначенными для создания голосовых интерфейсов, но Липпетт сказал, что у него есть резервные возможности для клиентов, чтобы они могли создавать свои собственные системы. Интерфейс MIPI включен для ввода с камеры.
Архитектура Xcore
Чип Xcore.ai обеспечивает скорость до 3200 MIPS, 51,2 GMACC и 1600 MFLOPS. Он имеет 1 Мбайт встроенной SRAM и интерфейс DDR с низким энергопотреблением для расширения.
По сравнению с устройством Cortex-M7, которое обеспечивает примерно такой же уровень интеграции, как Xcore.ai, работающее на аналогичной рабочей частоте, собственные данные XMOS показывают, что производительность обработки AI в 32 раза выше, а производительность DSP - в 15 раз.
«В мире конечных точек должно быть соотношение цены и качества, нет смысла говорить об одном без другого», - сказал Липпет. «Мы были очень агрессивны в отношении цены, мы можем снизить эту цену до 1 доллара [в объеме]. Вообще говоря, мы стоим примерно вдвое дешевле [сопоставимого устройства Cortex-M7], и с точки зрения производительности мы стремимся превзойти все ожидания ».
Xcore основан на логических ядрах, расположенных в виде плиток с памятью,
ALU и векторные блоки (Изображение:XMOS)
Xcore.ai основан на собственной архитектуре Xcore XMOS. Сам Xcore построен на строительных блоках, называемых логическими ядрами, которые могут использоваться для ввода-вывода, DSP, функций управления или ускорения AI. На каждой плитке есть восемь логических ядер, по две плитки в каждом чипе Xcore.ai, и дизайнеры могут выбрать, сколько ядер выделить для каждой функции. Каждая плитка также содержит память, ALU и векторный блок, к которому логические ядра имеют общий доступ.
«Важно то, что они [совместно используют доступ] очень предсказуемым образом», - сказал Липпет. «Это особенность Xcore. Изначально мы хотели предоставить разработчикам программного обеспечения гибкость ввода-вывода, а оборудование не очень терпимо, если вы пропустите сроки. Итак, Xcore является многоядерным не потому, что мы хотим распределять рабочие нагрузки и делать что-то очень быстро - мы можем это сделать, - но на самом деле он многоядерный, потому что мы хотим предоставить отдельным частям приложения их собственные ресурсы, так что когда нужно, готово. Он разработан снизу вверх, чтобы обеспечить такую точность отсчета времени ».
Сопоставление различных функций (ввод / вывод, DSP, управление, AI) логическим ядрам во встроенном ПО позволяет создавать «виртуальную SoC», полностью написанную в программном обеспечении. В приведенном ниже примере одно ядро выполняет задачи, которые обычно выполняются аппаратно, например I 2 S, I 2 Драйверы C и светодиодов, а некоторые ядра обрабатывают нейронную сеть, в то время как другие выполняют задачи, которые обычно выполняются в программном обеспечении. Определять все это в программном обеспечении быстрее, чтобы соответствовать временным требованиям устройств IoT. По словам Липпетта, разработка также обходится дешевле, что позволяет компаниям создавать экономичные решения даже в небольших сегментах рынка.
Пример приложения, сопоставленного с устройством Xcore.ai (Изображение:XMOS)
«Мы видим развитие рынка так, что рынок требует более разнообразных функций, и компаниям нужно будет быстрее реагировать», - сказал Липпет. «Очень сложно сделать двухлетнюю ставку на IoT, не создав очень универсальную платформу, которая [в конечном итоге] может оказаться недостаточно хорошей для любого сегмента. [С Xcore.ai] намного проще выводить устройства на рынок намного быстрее, с меньшими капитальными затратами и эффективно делать меньшие ставки на более мелких рынках и делать эти рынки экономичными ».
Как XMOS будет конкурировать с крупными производителями микроконтроллеров, которые перейдут на рынок кроссоверных процессоров?
«Не путем создания SoC на базе ARM! Потому что они делают это очень хорошо », - сказал Липпет. «Единственный способ соревноваться с этими парнями - иметь архитектурное преимущество. Речь идет о внутренних возможностях Xcore с точки зрения производительности, но также и о гибкости ».
Встроенный
- Renesas выделяет интеллект конечных точек во встроенном мире 2019
- MCU нацелены на безопасные конечные точки и периферийные устройства Интернета вещей
- Предварительно сертифицированные модули беспроводного процессора поддерживают подключение к сети Bluetooth
- Использование нескольких микросхем вывода требует тщательного планирования
- PMIC упрощает конструкции многорельсовых процессоров
- Крошечная тактильная ИС поддерживает маломощные носимые устройства
- Многоядерный процессор объединяет блок нейронной обработки
- РЛС на кристалле 60 ГГц поддерживает требования автомобильной промышленности
- ИС управления питанием поддерживает семейство прикладных процессоров
- Специализированные процессоры ускоряют рабочие нагрузки ИИ конечных точек