В «Яндексе» отучают «Алису» от ненормативной лексики

В первые дни после запуска создатели голосового помощника получили обратную связь от пользователей и теперь занимаются «чисткой» лексикона «Алисы», обучавшейся по диалогам на форумах и в соцсетях.

Об этом радиостанции «Говорит Москва» сообщил руководитель отдела разработки голосовых технологий и продуктов «Яндекса» Денис Филиппов.

«Сейчас главная задача – не обучить нейросеть, а отучить её общаться на том языке, который люди предпочитают на некоторых форумах. Люди в интернете используют ненормативную лексику, а мы не можем позволить, чтобы Алиса общалась в таком духе с нашими пользователями.
Поэтому мы много усилий сейчас тратим, чтобы "Алиса" была доброжелательна, вежлива с нашими пользователями. Поэтому сейчас задача – отучить её общаться так, как общаются в интернете. Эти первые дни нам дали много обратной связи».

Число опробовавших новый сервис за вчерашний день исчисляется миллионами, уточнил Филиппов.

«Мы сами не ожидали такой популярности и такой нагрузки на Алису, приятно удивлены. Алиса обучается, в том числе, и на вопросах пользователей, но тут важно понимать, что это не самообучение – это всё-таки программа, и её обучают разработчики "Яндекса". Мы будем выпускать регулярные апдейты, и она будет становиться всё умнее и умнее».

В «Яндексе» разъяснили модель обучения «Алисы»: в нейросеть единовременно загружают несколько миллиардов текстов из интернета.

«У неё одна из способностей – общаться с пользователями на свободные темы. Мы это называем "режим болталки". Обычно в таких голосовых помощниках берётся порядка 300-500 вопросов, редакторы пишут заготовленные ответы, и помощники эмулируют свободную речь. Но это работает достаточно плохо, потому что пользователи очень быстро начинают получать повторные ответы и интерес пропадает.
Мы решили эту задачу с помощью нейронной сети: взяли все тексты из интернета, не только классическую русскую литературу, но и обошли все форумы, общение в соцсетях. Основной фокус был – найти в текстах диалоги между людьми. Мы собрали миллиарды текстов и загрузили их в нейросеть. И она научилась на каждую реплику пользователя давать свой ответ».

Голосовой сервис «Алиса» был запущен в широкое пользование 10 октября. До этого систему протестировал президент России Владимир Путин. «Алиса» может рассказывать пользователю о погоде и новостях, строить маршруты, вести непринужденные беседы и рассказывать анекдоты. Мы также выяснили, что система может настаивать на своём мнении и сама даёт согласие на интервью.

https://govoritmoskva.ru/news/137801/