Наборы разработчика ускоряют интеграцию с Alexa
Инженеры-проектировщики могут использовать аппаратные модули и программные сервисы для интеграции Alexa Voice Service (AVS) в умный дом, автомобильные и носимые устройства; Это позволяет использовать облачные технологии Alexa в различных продуктах, от портативных колонок до интеллектуальных устройств и информационно-развлекательных систем в автомобиле. Разработчики могут интегрировать Alexa в голосовые продукты и написать сопутствующее приложение, чтобы превратить продукт в подключенный.
С тех пор, как Amazon вывела на рынок оригинальное устройство Alexa в 2014 году, Amazon Web Services (AWS), а также несколько производителей микросхем представили эталонные проекты, которые помогают инженерам интегрировать технологию распознавания голоса Amazon и интерфейс AVS, предоставляя готовые и предварительно протестированные проекты.
Итак, если в вашей компании не так много инженеров для разработки аппаратного и программного обеспечения, эталонные проекты упрощают разработку простого и экономичного понимания естественного языка и голосового интерфейса для проектов на основе Alexa. В противном случае интеграция высококачественной обработки звука делает разработку голосовых устройств длительной и сложной.
Рис. 1. Эталонные проекты голосовых приложений на основе AVS созданы для беспрепятственной интеграции технологии распознавания голоса Amazon в устройства с голосовым управлением. Источник:STMicroelectronics
Обнаружение слова пробуждения
Все начинается с надежного механизма пробуждения (WWE), который прослушивает ключевое слово «Alexa», прежде чем система предпримет какие-либо действия. Существует облачная проверка слова пробуждения, которая проверяет контекст и гарантирует, что пользователю действительно нужна Alexa. В данном случае часть референсного дизайна, предназначенная для захвата голоса, улучшает обнаружение пробуждающего слова «Alexa», выполняя захват звука в реальных условиях. Чтобы дизайнеры могли прерывать шумную обстановку даже с небольшого расстояния.
Возьмем, к примеру, комплект разработчика голосового захвата Cirrus Logic для приложений Amazon AVS; он обеспечивает акустическую настройку с использованием проверенных аппаратных и программных компонентов. Комплект улучшает обнаружение «слова пробуждения» «Alexa» как в тихой, так и в шумной обстановке, даже если пользователь находится в нескольких метрах от устройства. Это достигается за счет подавления шума и других реальных помех для более точного и надежного голосового взаимодействия.
Рис. 2. Эталонный дизайн AVS в дальней зоне предназначен для интеллектуальных динамиков и других устройств умного дома с голосовым управлением. Источник:Cirrus Logic
Как показано выше, в комплект входит плата захвата голоса с массивом из двух микрофонов, Raspberry Pi 3 (RPi3), динамик и карта microSD с предварительно загруженной необходимой прошивкой для мгновенной производительности. Консоль управления упрощает работу с различными приложениями RPi3 и предоставляет удобный интерфейс для выполнения функций акустической настройки и диагностики.
Плата захвата голоса оснащена интеллектуальным кодеком CS47L24 компании Cirrus Logic, цифровыми микрофонами MEMS CS7250B и алгоритмами SoundClear для управления голосом, шумоподавления и эхоподавления. Здесь интеллектуальный кодек объединяет Hi-Fi ЦАП, усилитель для стереонаушников и усилитель для монофонических динамиков, чтобы уменьшить занимаемую площадь на плате и уменьшить перечень материалов (BOM).
Кроме того, микрофоны MEMS со сверхнизким уровнем шума и широким динамическим диапазоном 103 дБ обеспечивают точный захват голоса в сложных шумовых условиях. Наконец, алгоритмы SoundClear блокируют шум, который в противном случае помешал бы сигналу пробуждения Alexa.
Это позволяет комплекту эффективно выполнять обнаружение пробуждающего слова «Alexa» и захват звука в реальных условиях, даже с умеренных расстояний в шумной обстановке, что позволяет пользователям надежно прерывать громкую музыку или воспроизведение ответа Alexa.
Аудио интерфейс
Базовое оборудование в конструкции на основе AVS состоит из нескольких микрофонов и аудиовхода (AFE), который обеспечивает обнаружение слова пробуждения «Alexa» как в тихой, так и в шумной обстановке. Это делает аудио интерфейс критически важным строительным блоком любого эталонного проекта AVS.
Аудиосистема улавливает голос пользователя, усиливает его, снижает фоновый шум и отправляет его в облако. Это сложно сделать, поэтому использование комплекта разработчика - отличный способ создать аудио интерфейс.
Возьмем, к примеру, TalkTo, аудиоинтерфейс DSP Concepts с интегрированной обработкой голоса, отвечающей требованиям AVS; он был запущен для эталонного дизайна STMicroelectronics AWS IoT Core, основанного на микроконтроллерах STM32 производителя микросхем. Внешний интерфейс TalkTo audio оснащен функцией шумоподавления, эхоподавления и обработки сигналов на основе усовершенствованного формирования луча для обнаружения звука в дальней зоне. Он предоставляется через Audio Weaver, бесплатный инструмент, который помогает разработчикам оптимизировать проекты AVS.
Рис. 3. Однокристальное решение, включающее интерфейсную обработку звука, локальное обнаружение пробуждающего слова, интерфейсы связи и содержимое памяти, включая ОЗУ и флэш-память, снижает затраты на спецификации и упрощает компоновку. Источник:STMicroelectronic
Плата ST 36 × 65 мм сочетает в себе модуль Wi-Fi с микроконтроллером STM32H743, который объединяет внешнюю обработку звука, локальное обнаружение слова пробуждения, интерфейсы связи и память в одном кристалле. Аппаратное обеспечение эталонного дизайна также включает дочернюю звуковую плату в качестве отдельного модуля для дальнейшего упрощения разработки и создания прототипов.
Дочерняя плата включает аудиокодек FDA903D, пользовательские светодиоды и кнопки, а также два МЭМС-микрофона MP23DB01HP, расположенных на расстоянии 36 мм для конструкций с ограниченным размером. Это также позволяет разработчикам включить режим конфиденциальности, который отключает микрофоны, поэтому красный светодиод может информировать пользователей о том, что Alexa не слышит голосовые команды.
Распознавание голоса в дальней зоне
Другие производители микросхем также представили эталонные конструкции, в которых интегрирована технология распознавания голоса в дальней зоне. Например, NXP представила эталонную платформу, которая утверждает, что распознает запрос пользователя из другого конца комнаты, даже когда играет громкая музыка.
Эталонная платформа NXP для Amazon Alexa включает в себя конструкцию из 7 микрофонов, алгоритмы обработки звука и технологию формирования луча. Он объединяет технологию распознавания голоса Amazon в дальней зоне с процессорами приложений NXP i.MX, стремясь упростить создание устройств с голосовым управлением.
Дизайн с голосовым управлением, такой как Alexa, меняет способ взаимодействия пользователей с умными вещами, от тостеров до плит и термостатов до жалюзи. Здесь справочные платы и комплекты для записи голоса обеспечивают самый быстрый выход на рынок для различных продуктов с поддержкой Alexa, обеспечивая при этом высокоточную активацию слова пробуждения и интерпретацию команд даже в шумной обстановке.
Мы находимся в самом начале революции устройств с поддержкой голоса, и разнообразие этих приложений означает, что заранее спроектированные и протестированные эталонные платы и комплекты, вероятно, будут играть важную роль. Их роль будет иметь решающее значение в более быстром выводе продуктов с поддержкой голосовой связи на рынок и в обходе сложности их дизайна.
>> Эта статья была первоначально опубликована на наш дочерний сайт EDN.
Интернет вещей
- Спидометр
- Голосовое биометрическое решение нацелено на аутентификацию
- Недорогие комплекты для разработчиков ускоряют разработку LoRaWAN
- Комплект разработчика помогает ускорить проектирование автомобильных блоков управления
- В наборах для разработчиков используется датчик изображения 1 x 1 мм
- MajorTom:ARDrone 2.0 с голосовым управлением Alexa
- Обзор стартовых комплектов HARTING MICA®
- Обзор стартовых комплектов HARTING MICA®
- Facebook разрабатывает ИИ, способный с беспрецедентной точностью копировать любой голос
- Интеграция 5G в системы IIoT ускоряет внедрение Индустрии 4.0