Как устроен голосовой помощник: что позволяет искусственному интеллекту понимать человека

Как устроен голосовой помощник: что позволяет искусственному интеллекту понимать человека

Системы Алиса, Маруся и Siri — это примеры голосовых помощников, которые уже больше 10 лет используются в быту и не вызывают должного удивления. Но что вы скажете, когда узнаете, что голосовые помощники также активно помогают бизнесу решать ежедневные задачи? Давайте разберемся, как развитие искусственного интеллекта привело к автоматизации бизнес процессов и оптимизации расходов на персонал.

В далеких 60-х годах XX века первый помощник от IBM распознавал всего 16 слов и 10 цифр, с тех пор технология разговорного искусственного интеллекта значительно продвинулась вперед и сегодня от помощников ждут большего.

Ожидание: голосовой помощник понимает вашу речь. Реальность: голосовой помощник не просто понимает речь, но умеет поддерживать диалог и даже продавать.

Михаил Денисов

Сооснователь и разработчик Alloka и голосовых роботов Newlogic.ai

Что же такое голосовой помощник и как он устроен?

Если все максимально упростить, то это сложная многокомпонентная система, которая понимает о чем, его спрашивают и очень быстро находит релевантный ответ. Новое знание такой помощник не создаст, но стандартную информацию обрабатывает и воспроизводит качественно, поэтому может частично заменить работников, взаимодействующих с людьми.

HR, продажи, лидогенерация и даже работа секретаря может быть автоматизирована, если рутинные их функции передать голосовым помощникам.

У нас есть опыт внедрения голосовых помощников даже для производственных компаний, а уж для магазинов и курсов такой инструмент точно окажется полезным.

Что сделало возможным работу современных говорящих речевых помощников? Результаты развития технологии распознавания потоковой речи и нейросетей помогают искусственному интеллекту распознавать речь, обрабатывать различные форматы текста и синтезировать ответы.

Следующий шаг — внедрение голосовых помощников в различные коммуникационные каналы: от социальных сетей до телефонов.

Ключевой навык — распознавание потоковой речи, т.е. разговора. Как это происходит? Разберем на примере входящего звонка роботу. Голосовой помощник принимает звонок, человек задает свой вопрос. И тут начинается самое интересное.

Речь звонящего трансформируется в сигнал и кодируется.

Затем полученные данные анализируются, выделяются ключевые посылы по отдельным словам и с помощью обучающейся нейросети, робот квалифицирует их по темам и ищет в своей базе данных релевантную информацию в качестве ответа.

Эта информация также обратно кодируется и трансформируется из текста в звучащую речь. Время обработки данных занимает доли секунды — быстрее, чем вы прочитаете это описание. Собеседник робота даже не замечает, какие сложные алгоритмы задействуются при этом, диалоги происходят без пауз. И так на каждом этапе диалога.

Реально ли понимание речи роботом?

Диалог с современным голосовым помощником не похож на разговор с автоответчиком. Да, весь словарный запас робота записан ранее, но это не просто шаблон ответов, а результат тщательной работы скриптологов и представителей компании.

На этапе разработке важно предусмотреть все возможные формы отказов, вопросов и уточнений, вплоть до междометий и значимого мычания в ответ.

Для этого многократно отрабатываются тестовые звонки, чтобы понять, как ведет себя целевой клиент каждой компании. При этом не обязательно прописывать каждый шаг диалога вручную, нейросеть способна самостоятельно находить примеры и на основании этих примеров готовить точный ответ. Этап обучения голосового помощника — самый важный, в этот период разработчики многократно тестируют и корректируют ответы робота.

Голосовой помощник не повторяет заученные фразы, он разбивает их на множество фрагментов, затем анализирует входящую речь (хороший помощник понимает не менее 96% входящей речи) и на основе этого анализа собирает ответ из имеющихся кусочков предварительно записанного текста.

Он умеет менять фразы, уточнять и задавать вопросы. Речь голосового помощника получается «живой», большинство людей даже и не догадается, что говорит с искусственным интеллектом.

Конечно, голосовые помощники еще не могут полностью заменить людей в коммуникации с клиентами. Нестандартные вопросы или проблемы, требующие многоступенчатого решения могут озадачить робота.

Однако всегда остается возможность переадресации звонка на реального менеджера и обучаемость. Все звонки записываются, а потом анализируются. Если выявляются пробелы в скрипте, то вносятся правки. Каждое обновление данных делает голосового помощника более современным и понимающим.

Будущее голосовых помощников для бизнеса сегодня видится весьма перспективным.

Если люди привыкли к искусственному интеллекту в бытовых вещах, то и возможность качественно изменить подход к организации труда, передав нужные, но однообразные задачи роботам, оставив людям более сложные и творческие.

Уже сегодня крупный бизнес, а за ним средние и малые предприятия идут по пути оптимизации и автоматизации рутинных процессов. Взаимодействовать с голосовым помощником можно и в банке, и при звонке на горячую линию, и даже проходя собеседование по телефону. Попробуйте задуматься, а не с роботом ли вы говорили последний раз, когда звонили в компанию?

Фото: Arthur Kenzo

115280, Россия, Московская Область, Москва, Ленинская слобода 19
Почта: adm@dailymoscow.ru