Расширенные технологии ускорят принятие голосовых помощников

Изобретение телефона более 150 лет назад произвело революцию в области связи. Сегодня революция голосовой связи находится в разгаре нового квантового скачка, поскольку новые классы интеллектуальных устройств позволяют искусственному интеллекту (ИИ) извлекать смысл из звука и давать людям новые способы взаимодействия со своим миром в более интуитивно понятной форме. способ. В этой статье рассматривается текущее положение дел и рассматриваются технологии, которые сделают повсеместные голосовые помощники естественной частью нашей жизни.

«Мистер Ватсон, иди сюда… »

Знаменитые слова, произнесенные Александром Грэмом Беллом в 1876 году, ознаменовали собой первый раз, когда звук был передан электрически. Эти революционные инновации остаются в центре драматических изменений в том, как мы работаем, живем и развлекаемся, и являются неотъемлемой частью новых достижений в том, как мы взаимодействуем с окружающим миром.

В первом веке проводная телефонная сеть соединяла людей по всему миру. Затем революция в электронике последних 50 лет сделала голосовые и видеосвязи беспроводными и портативными. В этом десятилетии мы перешли от телефонных разговоров между людьми без помощи рук к разговорам с машинами. Хотя этот новый тип взаимодействия человека и машины пока еще находится в зачаточном состоянии, он делает новый шаг в инновациях.

Компьютеры, смартфоны и интеллектуальные колонки теперь оснащены встроенными голосовыми помощниками, которые используют облачные системы глубокого обучения, чтобы мы могли задавать вопросы и программировать действия. Та же функция скоро будет интегрирована в другие устройства, которые мы используем каждый день. По оценкам Statistica, к 2020 году около 1,8 миллиарда человек будут иметь доступ к голосовым помощникам на устройствах, которые они носят с собой, а также на других типах платформ в своих домах и даже в бизнес-среде.

Тем не менее, успех систем голосового помощника по-прежнему сталкивается с ограничениями современных технологий. Достижения в области искусственного интеллекта, специализированных процессоров и более чувствительных микрофонов повысят производительность голосовых помощников и ускорят внедрение на рынок.

Сделайте разговор человечным

Одна из проблем, с которой сталкиваются системы голосового помощника, заключается в том, что человеческие разговоры невероятно разнообразны и интерактивны. Иногда друг может ответить на ваши утверждения еще до того, как вы закончите предложение. С технической точки зрения время отклика, когда люди разговаривают друг с другом, измеряется десятками миллисекунд. Хотя периодический медленный, вдумчивый ответ очень естественен, когда вы разговариваете с друзьями, представьте, насколько неудобным было бы ваше повседневное общение, если бы нормальный перерыв в разговоре включал задержки до нескольких секунд или частые потребности в повторении вопроса или команды.

Медленный темп «разговора» с голосовым помощником связан с несколькими аспектами базовой технологии. Алгоритмы, обеспечивающие распознавание голоса и ответ, требуют большой вычислительной мощности, поэтому современные смартфоны и интеллектуальные акустические системы записывают, а затем передают речь на вычислительные ресурсы в облаке. Чтобы свести к минимуму возможность задержек передачи, системы обычно передают аудиофайлы низкого качества, что приводит к высокому уровню ошибок. Сам Интернет - это среда с переменной скоростью, поэтому скорость передачи может меняться. Сочетание этих двух факторов всегда будет влиять на качество голосовых помощников, которые полагаются на облако для выполнения тяжелой работы по распознаванию голоса.

Даже с этими недостатками потребители явно в восторге от технологии. Продажи интеллектуальных акустических систем, первого полностью нового продукта после смартфонов, предлагающего голосовых помощников, растут темпами, невиданными с момента появления первых смартфонов. По данным voicebot.ai, продажи устройств в США подскочили на 40% в 2018 году, а продажи 66,4 миллиона новых устройств увеличили количество умных динамиков до 133 миллионов, что составляет немногим более 26% взрослого населения США.

Также неизбежно, что голосовые помощники будут продолжать совершенствоваться в имитации разговора. Задержка в разговоре сократится, а улучшенные алгоритмы сделают взаимодействие более похожим на человеческое. Большая часть этих улучшений будет связана с приближением обработки к пользователю.

Поднимите разговор на острие

Технология, которая делает облачные голосовые помощники реальностью, сейчас развивается со скоростью, которая сделает эти устройства гораздо более персонализированными. Текущие голосовые помощники передают информацию в облако и из него. Завтра ИИ, который сделает это возможным, будет находиться на периферийном устройстве, обеспечивая преимущества в отношении конфиденциальности, энергопотребления и скорости реагирования системы. Короче говоря, периферийные вычисления обещают сделать голосовых помощников более эффективными за счет переноса ИИ из облака в наш дом, на наше рабочее место и на другие устройства, встроенные в окружающий нас мир. Шагая навстречу этому будущему, Infineon недавно продемонстрировала самое низкое в мире решение для распознавания ключевых слов.

Одна из самых перспективных областей для более умных голосовых помощников - это медицинский и личный мониторинг здоровья. Например, высокочувствительный микрофон может отслеживать звуки дыхания во время сна и прогнозировать возникновение нарушений сна, таких как апноэ во сне. Многим людям может быть неудобно передавать этот тип личной медицинской информации в облако для обработки. Пограничная обработка позволит отслеживать и анализировать эту информацию путем локализации захвата звука, вычисления и хранения проанализированных данных. После этого пользователи смогут управлять тем, как и когда будут передаваться данные. Голосовой помощник, обеспечивающий более высокий уровень конфиденциальности, позволит людям более комфортно контролировать состояние сердца и дыхательных путей, состояние сна и общее самочувствие.

Прогресс в области искусственного интеллекта, который мы наблюдаем сегодня, обусловлен исследованиями в области глубокого обучения и новыми типами оборудования, которые используются для создания специализированных систем глубокого обучения. Партнер Infineon, Syntiant, пионер в этой области, создает новый класс микросхем, которые обеспечивают глубокое обучение на периферийных устройствах. Всего через несколько лет взаимодействие человека с машиной с помощью технологии голосового помощника станет повседневным явлением для миллиардов людей. А технология, разработанная для более умных голосовых помощников, будет иметь характеристики энергопотребления, которые позволят использовать компактное интеллектуальное распознавание звука с питанием от батареек для многих других приложений. Чтобы спрогнозировать, где еще технология имеет ценность, подумайте, как звуки, которые вы слышите, влияют на то, как вы взаимодействуете с миром. За пределами видимости обычных пользователей технология голосового помощника станет частью набора датчиков в интеллектуальных машинах, работающих в Интернете вещей (IoT), и как часть Индустрии 4.0.

Автономные транспортные средства также будут использовать аудиовход в сочетании с другими датчиками для обнаружения окружающей среды и реагирования на нее. Звуки, такие как велосипеды, поезда, другой транспорт и крик детей, - все это входы в сеть искусственного интеллекта, которая позволит автомобилям «видеть» объекты за углами. На заводе звуки работающих машин можно использовать в интеллектуальных сетях управления, которые диагностируют потенциальные проблемы до того, как они возникнут. Системы умного города будут «слышать» необычные события, такие как разбитие стекла или автомобильную аварию, и предупреждать соответствующие органы. А будущие поколения роботов будут использовать аудиосистемы как часть сенсорной сети, поддерживающей интеллектуальную работу и взаимодействие. Действительно, список потенциальных приложений бесконечен.

- Прадьюмна Мишра, постоянный предприниматель, Infineon Technologies

Цифровой датчик температуры отличается высокой точностью и низким энергопотреблением. Специализированные датчики для носимых медицинских устройств

Встроенный

Датчик

Облачные вычисления

Интернет вещей