Как искусственный интеллект определяет ложь

Цифровая экономика

Алексей Гусев, заведующий лабораторией исследования поведения F2FGroup

Михаил Баев, руководитель проектов компании F2FGroup

Принцип распознавания лжи

Основная наша задача и как учёных, и как прикладников – по поведению человека, которое мы можем объективно зарегистрировать, оценить недостоверность, неискренность его при ответе на вопросы, при обсуждении темы, при приёме на работу. Мои коллеги психологи создают разного рода тесты, опросники, но они не берут эту задачу вовсе, потому что социальная желательность очень высокая, и никакой человек о себе плохо рассказывать не будет.

Самый строгий сейчас тест, если мы хотим оценить человека на предмет лжи, это полиграф. Но только не нужно забывать: полиграф с очень квалифицированным полиграфологом, которых мало во всех странах.

Конечно же, эти методы рассчитаны на обычных людей, и всегда можно создать антитехнологию, и мои коллеги психофизиологи говорят, что 8-10 сеансов – и lie-детектор не заметит ничего. Это правда. Но когда нужно отобрать 10 человек из 100 возможных, детально проанализировать видеозапись в рамках судебно-психологической экспертизы, это очень актуально.

Задача состоит в исследовании обычных людей, а обычные люди, как правило, не имеют навыков манипулирования голосом, лицом, управления своими психо-физиологическими функциями: давление, кожно-гальваническая реакция, частота сердечных сокращений. Обычно мы все прокалываемся на естественной реакции нашей нервной системы.

Так вот, наш подход новый. Компания Nemesysco разработала уникальную технологию анализа голоса человека. Имеется в виду не речи, а вокальных характеристик живого голоса в живом общении.

Есть информативные параметры голоса, которые на слух не чувствует никакой эксперт. Это очень маленькие промежутки времени, то есть тысячные секунды. Человек не реагирует на это, а компьютер реагирует. И вот набирая статистику, проводя экспериментальные исследования на полиграфе, в клинике, в спецслужбах, в обычной жизни, анализируя телефонные разговоры, психологи и айтишники разработали такую технологию, которая не чувствительна к языку, не чувствительна к той ситуации, в которой человек говорит, но она чувствительна к вибрации голоса, напряжению, расслаблению, замедлению. Мы отсеиваем с помощью этого теста людей, у которых есть какие-то знаковые проблемы, сомнения. А дальше специалист кадровой службы, медик, сотрудник службы безопасности должен разбираться.

Экспрессивное поведение человека не только в голосе. Например, эмоциональная экспрессия. И в сомнительных случаях включаем следующую нашу технологию – автоматический анализ эмоций на лице человека, насколько они истинные и ложные, насколько они интенсивные, насколько человек склонен к маньеризмам. И вот тогда мы сможем уже приближаться к 95 – 98 %.

И третий уровень – выразительные движения: голова, губы, глаза, руки, ноги, позы, жесты. Это очень важные параметры поведения человека, поскольку мы привыкли вести себя привычным образом в характерных ситуациях. И тогда вот эти поглаживания, жесты-иллюстраторы, успокаивающие, сглатывания, попытка потянутся к несуществующему стакану с водой очень характерны.

По следам Пола Экмана

Мы работаем частично в автоматизированном режиме, с использованием имеющегося у нас программного обеспечения VicarVision. Мы ведём разработки собственного программного обеспечения, которое более точно определяет эмоции в аспекте детекции лжи. Дело в том, что те имеющиеся технологии, который у нас есть, позволяют великолепно работать в нейромаркетинге. То есть мы можем взять группу респондентов, предъявить им определённые стимулы, сравнить реакцию и абсолютно точно увидеть.

Для этого необходим контент. Поэтому мы используем то, что разработал наш учитель –Пол Экман, Facial Action Coding System, система кодирования движений лица, изначально кодируя лицо в двигательных единицах FACS, то есть объективно его описывая, и далее потом делая на этом основании выводы, что это было: эмоция, сознательно она возникла, неосознанно, просто человек создал эмблему эмоций, чтобы усилить свою фразу.

Когда Экман разрабатывал свою систему кодирования движений лица, он, наверное, не думал, насколько обыватель упростит его учение. Есть 7 базовых эмоций, и мы в этом дискурсе оперируем. На самом деле, всё гораздо сложнее. Любую эмоцию мы должны оценить, насколько она является естественной, неестественной, насколько она связана с речевым высказыванием человека.

Для кого создаются программы

По факту, это HR службы, потому что у них очень большая проблема, особенно в крупных городах: Москва, Питер, Нью-Йорк, Мехико, в Китае очень востребованные технологии.

Большое количество людей хотят устроиться, у них отбор даже есть 1:1000 на массовые профессии. А у нас это в крупных торговых сетях воруют, поступают нечестно, и в связи с этим большая текучка. То есть это верификация человека при приёме на работу.

Второе – это нейромаркетинг, особенно Сколтех позиционирует, в МГУ, в Вышке создают психофизиологические комплексы, которые оценивают реакцию человека на какую-то продукцию. Это очень выгодно,

Третье – службы безопасности. Оказывается, раз в полгода во всех крупных торговых сетях, во всех крупных организациях, банковских структурах человек проходит assessment. И естественно, за кем-то явные грешки, особенно сейчас всех интересует связь с коррупционными схемами, откаты, сговор. В транспортной безопасности это психофизиологическое оценивание сотрудников.

Как это работает

Мы загружаем видео в нашу программу. Программа выделяет лицо в видеопотоке, накладывает на него определённую группу точек, на основании этих точек выделяет определённые двигательные единицы системы кодирования движений лица и даёт нам раскладку этих двигателей единиц во времени. Кроме этого, она даёт нам раскладку по эмоциям. То есть мы можем сравнивать реакцию человека на предъявленный стимул, то есть мы абсолютно точно знаем, когда был предъявлен стимул, когда был задан тот или иной вопрос, и мы смотрим на реакцию. Это своеобразная квинтэссенция профессионального опыта, которая вшита в программное обеспечение. И что интересно, она показывает нам ещё достаточно много параметров: изменение направления взгляда, показывает пульс человека.

Есть специальный алгоритм, по которому компьютер определяет пульс. Кожа раскладывается на красное, зелёное и синее. Что такое учащение пульса? Это означает, что сосуды начинают интенсивно сокращаться. И на лице выделяются зоны, где сосуды наиболее близко подходят к коже, компьютер выделяет эту зону, делает фильтрацию в цветовом диапазоне, очень чётко увидит, как пульсирует кожа. Мы тоже научились это делать с помощью нашего программиста в рамках нашего проекта. Мы видим, как меняется пульс на руке, по взгляду это не определишь, а компьютер определяет. Естественно, искусственный интеллект искусственным интеллектом, но заключение пишет человек.

Индивидуальный опросник

Это не полиграфия, всё-таки это технология для массовых обследований. Там есть топики: алкоголь, подделка документов, частная жизнь, прошлый опыт, наркотики, связь с преступными группировками, образование, проблемы с коллегами, лояльность к руководству, желание и возможность выполнять указания начальства, с которыми ты не согласен, но надо сделать, мелкие кражи, ложь во благо психического здоровья коллег и коллектива, ложь во вред другим. Вот из таких отдельных тем мы делаем опросники. Например, для кассира-контролёра это прошлый опыт: где работал, уволился или тебя уволили, проблемы с алкоголем, с кражей, с наркотиками, в семье. Там может быть вопросов 10-12. Серьёзный тест, который раз в полгода проводится для оценки персонала, уже минут на 35-40, там 2-3 десятка самых разных вопросов: и об образовании, и о лидерских качествах. Обычно, если человек робкий, работает продажником на выезде, конечно, у него эти комплексы манифестируются в голосе. И тогда кадровик ему говорит: «Мы вас всё-таки на тренинг, у нас хорошие показатели, что же вам за счет здоровья своего постоянно перемогаться».

Наша технология экономит время, экономит средства, она позволяет более точно и детально подойти к выбору кандидата. Более того, она позволяет не приглашать даже кандидата в офис. То есть система может сама позвонить человеку по телефону, попросить его пройти тест, так называемый IVR.

В Сбере интересуются нашей работой, но это неповоротливая организация, очень мощная, с ними тяжело работать. А другие более современные банки запустили несколько пилотов.

Например, в одном банке есть база данных жуликов, которые уже несколько лет звонят и пытаются взять кредит. Они их знают по голосу, они их записали, дали нам. Мы их проанализировали слепым двойным методом – мы не знали, кто жуликоватый, кто честный – и разделили практически со стопроцентной вероятностью тех людей, которые позвонили для прикола или обмануть, либо просто кто честно хочет взять кредит и волнуется. Наши технологии эти случаи очень хорошо берут.

Елена Женина, автор программы «Завтрак у Жениной» на Радио Медиаметрикс

Полный текст интервью на Mediametrics.Ru