ИИ - это следующий этап эволюции полицейской работы

17 May 2019

По всему миру правоохранительные органы сталкиваются со всё усложняющимся ландшафтом угроз (терроризм, кибератаки, кража персональных данных и т.д.) на фоне растущего объема ведомственных и открытых данных, которые требуют обработки и анализа. Поэтому правоохранительные органы всё активнее задействуют продвинутые инструменты работы с данными - машинное обучение и искусственный интеллект, - для принятия более взвешенных и обоснованных решений в своей работе, пишет обозреватель издания "State Tech Magazine".

Каждый день в мире генерируется 2.5 эксабайт (2.5 млрд гигабайт) новых данных. И объем будет нарастать из-за расширения использования мобильных стройств и гаджетов, ресурсов глобальной сети и пользовательских приложений, развития систем видеонаблюдения и Интернета вещей (IoT). По прогнозу исследовательских компаний "IDC" и "Seagate Technology", за период 2018-25 гг. объем глобальный объем собранных данных возрастет с 33 до 175 зеттабайт, притом почти 30% этих данных потребуется обрабатывать в режиме реального времени.

Значительная часть этих данных будет использована в целях обеспечения общественной безопасности, вне зависимости от того, станут ли они впоследствии доказательной базой в суде или просто будут использованы для получения дополнительной информации для поиска и идентификации подозреваемых и ускорения расследования. Но с ростом объема информации из неё становится всё сложнее выделять значимые факты, взаимосвязи, тенденции.

"Эффективность борьбы с преступностью определяется тем, как правоохранительные органы, сообщества и власти (местные и федеральные) используют данные и искусственный интеллект для выявления связей между данными и преобразования их в действенные идеи, - считает Ричард Зак, директор по решениям в области права и общественной безопасности компании "Microsoft", - По мере того, как количество данных, доступных правоохранительным органам, увеличивается, необходимость превращать их в полезную информацию и, в конечном итоге, в "умные" данные востребует аналитические инструменты, включая некоторые методы искусственного интеллекта, которые могут способствовать принятию человеческих решений для достижения лучших результатов.. Импорт данных и их корреляция при помощи инструментов ИИ помогают устранить "слепые зоны", которыми пользуются преступники. Дополнительная визуализация позволяют людям лучше понимать ситуации, чтобы они могли принимать более обоснованные решения".

"Большая проблема" больших данных - их разнородность. Чаще всего они представляют собой комбинацию структурированных ("маркированных"), неструктурированных и полуструктурированных данных. И это серьезно затрудняет эффективную обработку больших объемов данных в "разумных" временных интервалах.

Изображение: IBM Think Summit, 2019
Изображение: IBM Think Summit, 2019

По некоторым оценкам, контролируемый алгоритм глубокого обучения ("с учителем") в целом достигнет приемлемой производительности на примерно 5000 структурированных ("маркированных") примерах для 1 категории, а для соответствия уровню человека или превышения его производительности потребуется обучающий набор данных, содержащий, по крайней мере, 10 миллионов маркированных примеров.

Лишь в некоторых случаях правоохранительные органы располагают данными, на основе которых можно создать готовые наборы структурированных данных ("дата-сеты") такого масштаба. В США, например, общедоступными являются данные о криминальных инцидентах по 395 полицейским департаментам. База данных, размещенная на “Цифровом портале Чикаго” содержит более 6.8 миллионов записей (за исключением убийств) и охватывает период с 2001 года по сегодняшний день. Эта обширная база включает записи о криминальных случаях с различными маркерами: идентификатор записи, номер дела, адрес, тип преступления (незаконное проникновение, кража, насильственное действие, нарушение общественного порядка и т.д.), тезисное описание преступления, тезисное уточнение места преступления (станция метро, квартира, отель и т.д.), отметка о задержании/аресте, отнесение к внутрисемейным отношениям, идентификатор зоны ответственности, патрулирования, идентификаторы района (полицейское управление и районная администрация), код по Национальной системе отчетности о преступлениях Федерального Бюро Расследований.

Эти дата-сеты можно, например, использовать для целей предиктивной аналитики ("прогнозирование преступлений"), но для целей расследования уже совершенных преступлений, этих данных будет недостаточно.

Следователям часто приходится отслеживать и выявлять группы связанных преступлений ("серийные схемы", "шаблоны"). Чтобы сделать поиск преступных моделей более эффективным и действенным, Нью-Йоркское управление полиции ("NYPD") в декабре 2016 года внедрило в работу "Patternizr" - специализированное решение для поддержки принятия решений с механизмом рекомендаций. Отметим, NYPD с 36 000 сотрудников является крупнейшим полицейским департаментом в Соединенных Штатах, который обеспечивает общественную безопасность для 8.5 миллионов жителей и 56 миллионов туристов, ежегодно посещающих Нью-Йорк.

"У следователей исторически сложилась модель работы с записями "вручную", основанная на памяти и личном опыте, отнимающая много времени", - говорят разработчики "Patternizr", помощник комиссара по анализу данных "NYPD" Эван Левин и бывший директор аналитики" NYPD" Алекс Чохлас-Вуд, - Чтобы улучшить этот процесс, мы разработали набор из трех контролируемых моделей машинного обучения, который назвали "Patternizr".

"Patternizr" заменяет этот ручной труд - решение "берет" новое заявление о преступлении и сравнивает его с сотнями тысяч других преступлений, зарегистрированных в базе данных полиции Нью-Йорка. Алгоритмы распознавания "Patternizr" работают со структурированными и
неструктурированными данными из полицейских отчетов: описаниями нападавших и действий жертвы, предметов, похищенных при ограблении, и т.д.

При каждом сравнении алгоритм генерирует "показатель сходства" - вероятностную оценку того, пара преступлений (новое и хранящееся в базе) соответствуют одной схеме. После того как все оценки сходства сгенерированы, "Patternizr" упорядочивает пары по сходству в порядке убывания и возвращает аналитику для просмотра в формате списка. Изучив эти ранжированные результаты, аналитик решает, какие заявления следует объединить в "схему" ("шаблон").

"ИИ "на службе": как алгоритм ловит "серийных" грабителей". Читать

Алгоритмы моделей машинного обучения "Patternizr" разработаны на данных, содержащихся в заявлениях о преступлениях. "Заявление содержит сочетание неструктурированного текста, описывающего подробности преступления и структурированные поля о преступлении, включая дату и время (которое может варьироваться, если точное время происшествия неизвестно), местонахождение, категория преступления и дополнительная значимая информация, - говорят Левин и Чохлас-Вуд, - Неструктурированный текст также содержит показания подозреваемых, действия потерпевших, способ проникновения, описание помещения и похищенное имущество. Эти пять типов данных (местоположение, дата и время, тип, описание подозреваемого и неструктурированный текст являются основой при анализе сходства между преступлениями".

На то, чтобы провести анализ 10-летнего архива заявлений о грабежах и кражах и 3-летнего архива заявлений о крупных ограблениях способом параллельных облачных вычислений департаменту потребовалось 20 дней с задействованием 1600 процессоров.

В период с января 2018 года по июль 2018 года "Patternizr" анализировала около 400 новых заявлений в неделю. Все новые и пересмотренные заявления каждый раз заново проходят сравнение со всем массивом данных, а результаты по выявленным серийным схемам обновляются три раза в день.

"Patternizr" интегрирован в полицейскую сеть датчиков, баз данных, устройств, программного обеспечения и инфраструктуры "DAS" ("Domain Awareness System"), которая установлена в каждом полицейском участке города и на смартфоне каждого сотрудника, и предоставляет специализированную информацию и аналитику.

Понравился пост? Поставьте 👍 или поделитесь им в социальной сети, чтобы мы могли рассказать ещё больше о новых технологиях.
Подпишитесь на наш канал "Умная безопасность" ( @smartsafecity ) в Телеграм , чтобы узнать больше новостей о новых технологиях