Промышленное производство
Промышленный Интернет вещей | Промышленные материалы | Техническое обслуживание и ремонт оборудования | Промышленное программирование |
home  MfgRobots >> Промышленное производство >  >> Industrial Internet of Things >> Интернет вещей

Наборы разработчика ускоряют интеграцию с Alexa

Инженеры-проектировщики могут использовать аппаратные модули и программные сервисы для интеграции Alexa Voice Service (AVS) в умный дом, автомобильные и носимые устройства; Это позволяет использовать облачные технологии Alexa в различных продуктах, от портативных колонок до интеллектуальных устройств и информационно-развлекательных систем в автомобиле. Разработчики могут интегрировать Alexa в голосовые продукты и написать сопутствующее приложение, чтобы превратить продукт в подключенный.

С тех пор, как Amazon вывела на рынок оригинальное устройство Alexa в 2014 году, Amazon Web Services (AWS), а также несколько производителей микросхем представили эталонные проекты, которые помогают инженерам интегрировать технологию распознавания голоса Amazon и интерфейс AVS, предоставляя готовые и предварительно протестированные проекты.

Итак, если в вашей компании не так много инженеров для разработки аппаратного и программного обеспечения, эталонные проекты упрощают разработку простого и экономичного понимания естественного языка и голосового интерфейса для проектов на основе Alexa. В противном случае интеграция высококачественной обработки звука делает разработку голосовых устройств длительной и сложной.


Рис. 1. Эталонные проекты голосовых приложений на основе AVS созданы для беспрепятственной интеграции технологии распознавания голоса Amazon в устройства с голосовым управлением. Источник:STMicroelectronics

Обнаружение слова пробуждения

Все начинается с надежного механизма пробуждения (WWE), который прослушивает ключевое слово «Alexa», прежде чем система предпримет какие-либо действия. Существует облачная проверка слова пробуждения, которая проверяет контекст и гарантирует, что пользователю действительно нужна Alexa. В данном случае часть референсного дизайна, предназначенная для захвата голоса, улучшает обнаружение пробуждающего слова «Alexa», выполняя захват звука в реальных условиях. Чтобы дизайнеры могли прерывать шумную обстановку даже с небольшого расстояния.

Возьмем, к примеру, комплект разработчика голосового захвата Cirrus Logic для приложений Amazon AVS; он обеспечивает акустическую настройку с использованием проверенных аппаратных и программных компонентов. Комплект улучшает обнаружение «слова пробуждения» «Alexa» как в тихой, так и в шумной обстановке, даже если пользователь находится в нескольких метрах от устройства. Это достигается за счет подавления шума и других реальных помех для более точного и надежного голосового взаимодействия.


Рис. 2. Эталонный дизайн AVS в дальней зоне предназначен для интеллектуальных динамиков и других устройств умного дома с голосовым управлением. Источник:Cirrus Logic

Как показано выше, в комплект входит плата захвата голоса с массивом из двух микрофонов, Raspberry Pi 3 (RPi3), динамик и карта microSD с предварительно загруженной необходимой прошивкой для мгновенной производительности. Консоль управления упрощает работу с различными приложениями RPi3 и предоставляет удобный интерфейс для выполнения функций акустической настройки и диагностики.

Плата захвата голоса оснащена интеллектуальным кодеком CS47L24 компании Cirrus Logic, цифровыми микрофонами MEMS CS7250B и алгоритмами SoundClear для управления голосом, шумоподавления и эхоподавления. Здесь интеллектуальный кодек объединяет Hi-Fi ЦАП, усилитель для стереонаушников и усилитель для монофонических динамиков, чтобы уменьшить занимаемую площадь на плате и уменьшить перечень материалов (BOM).

Кроме того, микрофоны MEMS со сверхнизким уровнем шума и широким динамическим диапазоном 103 дБ обеспечивают точный захват голоса в сложных шумовых условиях. Наконец, алгоритмы SoundClear блокируют шум, который в противном случае помешал бы сигналу пробуждения Alexa.

Это позволяет комплекту эффективно выполнять обнаружение пробуждающего слова «Alexa» и захват звука в реальных условиях, даже с умеренных расстояний в шумной обстановке, что позволяет пользователям надежно прерывать громкую музыку или воспроизведение ответа Alexa.

Аудио интерфейс

Базовое оборудование в конструкции на основе AVS состоит из нескольких микрофонов и аудиовхода (AFE), который обеспечивает обнаружение слова пробуждения «Alexa» как в тихой, так и в шумной обстановке. Это делает аудио интерфейс критически важным строительным блоком любого эталонного проекта AVS.

Аудиосистема улавливает голос пользователя, усиливает его, снижает фоновый шум и отправляет его в облако. Это сложно сделать, поэтому использование комплекта разработчика - отличный способ создать аудио интерфейс.

Возьмем, к примеру, TalkTo, аудиоинтерфейс DSP Concepts с интегрированной обработкой голоса, отвечающей требованиям AVS; он был запущен для эталонного дизайна STMicroelectronics AWS IoT Core, основанного на микроконтроллерах STM32 производителя микросхем. Внешний интерфейс TalkTo audio оснащен функцией шумоподавления, эхоподавления и обработки сигналов на основе усовершенствованного формирования луча для обнаружения звука в дальней зоне. Он предоставляется через Audio Weaver, бесплатный инструмент, который помогает разработчикам оптимизировать проекты AVS.


Рис. 3. Однокристальное решение, включающее интерфейсную обработку звука, локальное обнаружение пробуждающего слова, интерфейсы связи и содержимое памяти, включая ОЗУ и флэш-память, снижает затраты на спецификации и упрощает компоновку. Источник:STMicroelectronic

Плата ST 36 × 65 мм сочетает в себе модуль Wi-Fi с микроконтроллером STM32H743, который объединяет внешнюю обработку звука, локальное обнаружение слова пробуждения, интерфейсы связи и память в одном кристалле. Аппаратное обеспечение эталонного дизайна также включает дочернюю звуковую плату в качестве отдельного модуля для дальнейшего упрощения разработки и создания прототипов.

Дочерняя плата включает аудиокодек FDA903D, пользовательские светодиоды и кнопки, а также два МЭМС-микрофона MP23DB01HP, расположенных на расстоянии 36 мм для конструкций с ограниченным размером. Это также позволяет разработчикам включить режим конфиденциальности, который отключает микрофоны, поэтому красный светодиод может информировать пользователей о том, что Alexa не слышит голосовые команды.

Распознавание голоса в дальней зоне

Другие производители микросхем также представили эталонные конструкции, в которых интегрирована технология распознавания голоса в дальней зоне. Например, NXP представила эталонную платформу, которая утверждает, что распознает запрос пользователя из другого конца комнаты, даже когда играет громкая музыка.

Эталонная платформа NXP для Amazon Alexa включает в себя конструкцию из 7 микрофонов, алгоритмы обработки звука и технологию формирования луча. Он объединяет технологию распознавания голоса Amazon в дальней зоне с процессорами приложений NXP i.MX, стремясь упростить создание устройств с голосовым управлением.

Дизайн с голосовым управлением, такой как Alexa, меняет способ взаимодействия пользователей с умными вещами, от тостеров до плит и термостатов до жалюзи. Здесь справочные платы и комплекты для записи голоса обеспечивают самый быстрый выход на рынок для различных продуктов с поддержкой Alexa, обеспечивая при этом высокоточную активацию слова пробуждения и интерпретацию команд даже в шумной обстановке.

Мы находимся в самом начале революции устройств с поддержкой голоса, и разнообразие этих приложений означает, что заранее спроектированные и протестированные эталонные платы и комплекты, вероятно, будут играть важную роль. Их роль будет иметь решающее значение в более быстром выводе продуктов с поддержкой голосовой связи на рынок и в обходе сложности их дизайна.

>> Эта статья была первоначально опубликована на наш дочерний сайт EDN.


Интернет вещей

  1. Спидометр
  2. Голосовое биометрическое решение нацелено на аутентификацию
  3. Недорогие комплекты для разработчиков ускоряют разработку LoRaWAN
  4. Комплект разработчика помогает ускорить проектирование автомобильных блоков управления
  5. В наборах для разработчиков используется датчик изображения 1 x 1 мм
  6. MajorTom:ARDrone 2.0 с голосовым управлением Alexa
  7. Обзор стартовых комплектов HARTING MICA®
  8. Обзор стартовых комплектов HARTING MICA®
  9. Facebook разрабатывает ИИ, способный с беспрецедентной точностью копировать любой голос
  10. Интеграция 5G в системы IIoT ускоряет внедрение Индустрии 4.0