Опубликован патент на систему противодействия нежелательным мошенническим и спам звонкам, в которых используется искусственная речь, синтезируемая компьютерными программами, маскирующими под людей (ссылка на патент внизу публикации).
В настоящий момент практически любой обладатель универсального мобильного устройства (например, мобильного телефона, смартфона, планшета и т.д.) сталкивается с нежелательными звонками, SMS–сообщениями, электронными письмами из банков, медицинских центров, страховых фирм, салонов красоты и других компаний, использующих в своей работе телемаркетинг.
Большинство из этих компаний неявно прописывают распространение рекламы через коммуникационные сети в договоре и тем самым обходят правовые нормы.
Компании, предоставляющие услуги телемаркетинга, активно используют интеллектуальных ботов, которые имитируют в процессе общения людей.
Роботы определяют уровень раздражительности и зачастую специально выстраивают разговор так, чтобы маскировать искусственное происхождение беседы.
Также коммуникационные сети нередко используют мошенники для получения конфиденциальной информации пользователя (например, данных о кредитных картах, номерах социального страхования и т.д.).
Для борьбы с описанными злоупотреблениями в коммуникационных сетях используют мобильные приложения, определяющие номера (например, TrueCaller). В большинстве случаев входящие вызовы проверяют по базе данных спам–номеров, которая постоянно обновляется на основании обратной связи от пользователей, и, если номер спамера или мошенника находится в этой базе, пользователя информируют о том, что вызывающая сторона была замечена в назойливом общении.
Ситуация усугубляется тем, что в настоящее время довольно просто сделать телефонный звонок анонимным или замаскировать телефонный номер при помощи технологии подмены номеров. Мошенники все чаще, используя данную технологию, звонят клиентам банков с номеров кредитных организаций и запрашивают необходимую для снятия средств информацию.
В патентной публикации US20050221840A1 описана технология присваивания репутации телефонному номеру, ассоциированному с неклассифицированной вызываемой стороной.
На основании анализа определенных атрибутов входящего вызова (например, продолжительности звонка) неклассифицированной вызывающей стороне присваивают репутацию. Если вызывающую сторону определяют как нежелательную заранее установленное количество раз, ее помещают в черный список.
Хотя описанный выше способ работы хорошо справляется с задачей распознавания роботизированных звонков, он не позволяет классифицировать звонок от мошенников. К тому же в новых схемах мошенничества подмена номера дискредитирует легального абонента вместо злоумышленника. Блокировка таких номеров, к примеру, может привести к тому, что банки утратят возможность дозвониться своим клиентам.
Настоящее изобретение позволяет решать задачу обеспечения информационной безопасности путем досрочного завершения нежелательного звонка, в том числе мошеннического с подменными номерами.
Изобретение реализуется следующим способом
Способ определения нежелательного звонка, который содержит этапы, которые реализуются с помощью средств из системы по п. 1 и на которых:
а) перехватывают вызов от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны, при этом уведомляют коммутационный узел о маршрутизации перехваченного вызова через узел разветвления, который устанавливает соединение по двум различным каналам: одно – с терминальным устройством вызываемой стороны, второе – со средством записи для передачи медиаданных от каждого терминального устройства;
б) формируют запись медиаданных, передаваемых в рамках установленного вызовом соединения во время звонка;
в) преобразуют сформированную запись медиаданных в набор признаков, где преобразование включает представлении записи в виде форматированного текста, при этом признаки включают:
• множество слов,
• векторное представление слов,
• мультимножество слов, не учитывающих грамматику и порядок;
г) определяют звонок как нежелательный на основании сформированного набора признаков с использованием заранее обученной модели классификации звонков, при этом к нежелательным относят звонки, инициированные вызывающей стороной для осуществления мошенничества, получения конфиденциальной информации, предложения товаров, спама;
д) досрочно завершают вызов путем прекращения передачи медиаданных в рамках установленного вызовом соединения.
8. Способ по п. 7, по которому запись формируют в течение заданного промежутка времени, где промежуток времени задают по меньшей мере одним из способов:
• кратным заранее заданному значению;
• равным значению, при котором размер содержащихся медиаданных кратен заранее заданному размеру.
9. Способ по п. 7, по которому атрибуты записи определяют с помощью средства автоматического распознавания речи.
10. Способ по п. 7, по которому в качестве алгоритма классификации выступает по меньшей мере:
• байесовские классификаторы;
• логистическая регрессия;
• MRF-классификатор;
• метод опорных векторов;
• методы ближайших соседей;
• дерево принятия решений.
11. Способ по п. 7, по которому модель классификации звонков обучают на атрибутах классифицированного ранее звонка, чей класс был подтвержден, таким образом, чтобы при следующей классификации звонка вероятность неверной классификации была меньше, чем при текущей.
12. Способ по п. 7, по которому после классификации пользователю терминального устройства вызываемой стороны предоставляют информацию о нежелательном классе звонка.
Таким образом, в патенте описан достаточно глубокий алгоритм анализа речи и определения является ли она искусственно синтезированной или принадлежит реальному человеку.