Мысленный эксперимент: Дилемма заключённого

11 June 2019
864 full reads
1k story viewUnique page visitors
864 read the story to the endThat's 81% of the total page views
1,5 minute — average reading time

Привет, друзья. Сегодня у нас вторник, и у нас новый день для изучения философии сознания и других тем, связанных с нею. На этот раз и пару следующих вторников я хотел бы дать вам понимание нескольких мысленных экспериментов, которые сами по себе не относятся к философии сознания, но будут нужны нам для тщательного рассмотрения одного важного понятия, которое мы изучим примерно через месяц. Итак, сегодня у нас классическая задача теории игр — дилемма заключённого.

Мысленный эксперимент: Дилемма заключённого

Задача была предложена Мерилом Фладом и Мелвином Дрешером в 1950 году. В её классическом варианте она формулируется примерно так:

Двое преступников, совершивших одинаковые преступления примерно в одно и то же время, попались полиции. Полицейские развели их по разным комнатам и предлагают каждому одинаковую сделку со следствием. Если оба признаются в совершении преступления, то получают минимальный срок по соответствующей статье (например, 2 года). Если оба молчат и на сделку не идут, то каждый получает по 6 месяцев заключения, так как их преступления в этом случае проходят по более лёгкой статье. Если же один молчит, а второй его сдаёт, то сдавшего отпускают на все четыре стороны, а молчуна приговаривают по соответствующей статье на максимальный срок (скажем, 10 лет). Как быть преступникам?

Оптимального решения у этой задачи нет, так как равновесие Нэша не достигается. Понять это на пальцах можно при помощи следующего рассуждения. Пусть первый преступник решил молчать, предполагая, что второй тоже будет молчать (так как на первый взгляд это наиболее рационально). Но в этот момент он может начать размышлять о том, что если он будет молчать, то второму преступнику ничего не стоит сдать его, и тогда тот выйдет на свободу, а первый получит максимальный срок. С другой стороны, если первый считает, что второй будет молчать, то ему рациональнее сдать его и выйти на свободу. В итоге при изолированных размышлениях рациональным получается сотрудничать со следствием. Но как итог — 2 года тюрьмы каждому, хотя могли бы получить по 6 месяцев, то есть итоговое решение неоптимально. В этом и заключается дилемма — каждый из акторов ведёт себя оптимально, но итог неоптимален.

Кстати, если количество акторов увеличить, либо задачу сделать повторяющейся, что чем больше акторов и чем больше повторений, тем проще понять, что лучше молчать. Если у нас повторяющаяся игра, то вообще существует оптимальная стратегия повторяющихся действий, которая ведёт к лучшему равновесному решению.

И очень многие проблемы в нашей реальности сводятся к дилемме заключённого, так что не стоит думать, что это нечто абстрактное. Через некоторое время мы посмотрим, как эта дилемма может применяться к нашей непосредственной теме — философии сознания и искусственному интеллекту. До новых встреч.