Черное зеркало S04E01: Нужен ли образец ДНК для симуляции человека?

31 December 2017

Кадр из серии USS Каллистер
Кадр из серии USS Каллистер

Статья не спойлерит сюжет и Вы можете прочитать ее если не видели S04E01 Черного зеркала. А потом посмотреть серию :)

Четвертый сезон "Черного зеркала" выложили в сеть 29 декабря и он быстро вышел в топ твиттера. Первая серия нового сезона под названием USS Каллистер исследует насилие над игровыми симуляциями живых людей. Роберт Дейли — талантливый программист и сооснователь популярной ММОРПГ, которого не признают коллеги. Он вымещает фрустрацию на их копиях в виртуальной реальности, для создания которых используют образцы ДНК. Копии выглядят и ведут себя идентично прототипам, но возникает вопрос — действительно ли для симуляции людей нужны образцы ДНК? Что нужно, чтобы создать реалистичную по поведению копию человека?

Теория оперантного обусловливания предполагает, что для воссоздания личности достаточно помещенного в правильные условия эволюционного алгоритма. Эволюционные алгоритмы действуют по правилам естественного отбора — генерируют варианты поведения, из которых остаются наиболее совместимые с выживанием, а все выжившие варианты воспроизводятся с изменениями, из которых вновь остаются только наиболее совместимые с выживанием.

Google DeepMind AI создает сложные движения виртуального организма руководствуясь только отбором наиболее совместимых с продвижением вперед вариантов
Google DeepMind AI создает сложные движения виртуального организма руководствуясь только отбором наиболее совместимых с продвижением вперед вариантов

Чтобы скопировать зеленого жука необязательно знать генотип зеленых жуков — достаточно создать генерирующий раскраски панциря алгоритм и отбирать наиболее близкие к зеленому цвета. Нет нужды знать генотип откладывающего работу над эссе студента чтобы воссоздать его прокрастинацию — достаточно поместить эволюционный алгоритм в условия, где работа до наступления дедлайна не повысит шансы на выживание, а пропуск дедлайна снизит шансы на выживание. В таком контексте компьютерные симуляции, животные и люди демонстрируют одинаковый шаблон активности.

Частота активности как функция времени в контексте фиксированного времени наступления последствий (например, еду дают за нажатие только раз в 5 секунд)
Частота активности как функция времени в контексте фиксированного времени наступления последствий (например, еду дают за нажатие только раз в 5 секунд)

Люди по-разному распределяют время между активностями не потому, что у них разный генотип, а потому, что в разных ситуациях разные активности совместимы с выживанием. Время ограничено и у организма нет возможности распределить время на все варианты — мы видим только тех особей, что распределяют время в соответствии с важными для выживания событиями. В природе и в лаборатории еда сигнализирует, что еще больше еды на подходе. Нашедший семена в траве голубь, вероятно, найдет еще, если продолжит искать в той же области, что повысит его шансы не умереть от голода. Зашедший на сайт знакомств и увидевший анкету девушки молодой человек, вероятно, увидит еще, если продолжит искать на сайте, что повысит его шансы найти партнера.

Мы можем не понимать, как конкретно голубь ищет еду, но можем воссоздать поиск еды через алгоритм, что генерирует варианты распределения времени между возможными точками на поле и оставляет только те варианты, что обеспечивают наибольшие шансы на успех. Звучит как фантастика, но через отбор последствиями работают классифицирующие картинки нейронные сети — создающий их алгоритм предлагает вариант структуры нейронов, полученный вариант тестируется на выборке изображений, алгоритм вносит правки в структуру нейронов и повторяет цикл десятки тысяч раз. Неясно, как конкретно полученная нейронная сеть отличает "три" от "пчелы", но она это делает и для ее создания достаточно эволюционного алгоритма.

Алгоритм, что предложил Вам прочитать эту статью — тоже результат эволюции. Создающий рекомендательные сервисы эволюционный алгоритм собирает тысячи вариантов, какую статью кому предложить, тестирует их, оставляет жить сервисы, предложения которых читают лучше всего, вносит в них правки, тестирует, вносит правки, тестирует и так до бесконечности. Никто не знает как получившийся рекомендательный сервис выбирает, что Вам читать, но он работает (Вы читаете).

О личности, чувствах и воспоминаниях можно говорить как о растянутых во времени паттернах активности. Мы помещаем их под кожу метафорически, но если бы они действительно находились под кожей, то было бы сложно объяснить, как люди называют других людей интровертами и экстравертами, как они говорят, что кто-то задумался или вспомнил неприятное событие. Люди не ходят с рентгеном и не заглядывают под кожу, они в своем разговоре о психологических феноменах могут опираться только на наблюдаемую активность.

Если личностью называют наблюдаемую от третьего лица активность, то ее может создать эволюционный алгоритм, который не знает как должен выглядеть результат, но знает как комбинировать более простые активности и как они связаны с последствиями. Полученная симуляция личности, возможно, будет пугать, как вызывают опасения самоуправляемые машины, но создать ее технически возможно.

Три с половиной тысячи итераций и не знающий как водить отбор последствиями создал быстро и аккуратно следующего маршруту виртуального водителя
Три с половиной тысячи итераций и не знающий как водить отбор последствиями создал быстро и аккуратно следующего маршруту виртуального водителя

Тесты показывают, что эволюционные алгоритмы создают виртуальные организмы со сложными формами поведения и систематически наблюдаемыми феноменами связи между поведением и контекстом. Например, генерализацией стимульного контроля, где поведение появляется не только в тренировочной ситуации, но и в похожих; взаимосвязью контекстов, где соединение ранее встречавшихся стимулов производит новое поведение; и мелиорацией, переключением между несколькими источниками ресурсов по мере их иссякания.

Взаимосвязь контекстов у робота под контролем эволюционного алгоритма. Добавление преграды в контексте уже отобранных последствиями действий создает новое поведение.
Взаимосвязь контекстов у робота под контролем эволюционного алгоритма. Добавление преграды в контексте уже отобранных последствиями действий создает новое поведение.

Резюмируя, симулировать человека можно. Для этого необязателен образец ДНК. Эволюционный алгоритм может создать зеленого жука не понимая, что делает зеленого жука зеленым — ему достаточно дать сырой материал и задать ограничения, в которых происходил отбор настоящих зеленых жуков. Эволюционный алгоритм может создать работающего 8 часов в день человека или ожидающую на автобусной остановке толпу если создать достаточно богатый банк простых активностей и описать связи между активностями и последствиями, в которых существуют работающие в офисе или пользующиеся общественным транспортом люди. И это единственные препятствия перед реалистичной симуляцией личности.

Автор: Иван Чистяков

Ставьте лайк и подписывайтесь на канал, чтобы чаще видеть наши материалы. Поддержать не.психологию можно через форму ниже.