Интересно вот что. Если рассматривать дилемму заключенного как повторяющийся процесс, то многое может измениться. Представим себе игру, в которой участники не садятся в тюрьму сразу после первого хода, а получают или теряют очки по очень похожей схеме:
Игра на основе дилеммы заключенного
Разобравшись с этой таблицей, участники узнают от ведущего, что игра длится, допустим, 5 ходов. Видимо, показывать черную метку уже в первом ходу не стоит. Ведь тогда отношения испортятся с самого начала, и от этого игрока ничего, кроме потерь, ожидать не придется. Значит, на первом ходу имеет смысл быть «добрым» и показывать белую метку. И так делать до самого или почти до самого конца, ведь поддержание хороших отношений позволит стабильно получать по 3 очка и ничего не терять от рискованной игры. А если поставить черную метку, уже буквально на следующем ходу оппонент ударит в ответ, и больше заработать с ним/на нем не получится.
Но ведь рано или поздно наступит последний ход. И все знают, что на этом конец, а игра превращается в классическую дилемму заключенного, где рассуждения будут строиться по типу описанной в начале ситуации с преступниками, когда каждый ожидает подставы от второго, и поэтому подставляет сам. Тогда на последнем ходу все резко становятся «злыми» и показывают друг другу черную метку. Но раз мы знаем, что итог пятого, последнего хода с большой долей вероятности предопределен, то имеет смысл тогда «кинуть» всех на четвертом ходу. Но если так будут рассуждать все, то станет заранее известным итог и четвертого хода, а тогда надо «кидать» всех на третьем, и так мы можем дойти и до самого первого. Что же делать?
Когда дилемма заключенного стала приобретать популярность, был организован турнир, в котором соревновались компьютерные программы, используя различные стратегии-алгоритмы. Чем хороши компьютерные программы? Чтобы посмотреть, как сто программ, пользующихся ста различными стратегиями, будут взаимодействовать друг с другом и что из этого выйдет, нужно потратить максимум несколько минут. А чтобы посмотреть результат применения этой же стратегии в других условиях (другое количество ходов, получаемые и теряемые баллы, введение доп. условий, когда очки последнего хода, скажем, удваиваются и т.д.), нужно потратить еще пару минут, запустив цикл заново с другими вводными. И уже за несколько таких турниров может накопиться интересная статистика о том, какие стратегии успешны, а какие нет. И такая статистика накопилась. Итак, барабанная дробь, что же объединяло успешные программы:
1. Они были «добры» к коллегам. Начиная знакомство с другой программой, они сначала ставили белую метку. И делали так в дальнейшем, никогда не предавая первыми. Они были «добрыми» не потому, что родители так учили, не потому, что это высокоморально, и даже не потому, что в противном случае Боженька покарает, а потому что так было выгодно. Они были «эгоистичны», они «хотели» заработать больше баллов и именно поэтому не делали зла товарищу. Во всяком случае, пока тот не делал зла им.
2. Они «наказывали подлецов», то есть не давали другим программам пользоваться их «добротой» и, получив черную метку, били в ответ. Не факт, что так они поступали уже с первой черной метки, но со второй точно можно ответить тем же. Не стоит только путать наказание с местью, цель не в том, чтобы потопить злодея и самоутвердиться, а в том, чтобы объяснить: «со мной так не надо, у меня тоже есть зубы, вот они, смотри».
3. Они умели «прощать». Из цикла взаимных наказаний надо как-то выходить. И, дав понять, что они готовы к «трудной» игре, готовы ударить в отместку, если потребуется, они вновь демонстрировали, что хотят вовсе не этого. Давай лучше жить дружно, смотри, я не гордый и первый протяну руку, первый пойду на примирение, так выгоднее для нас обоих, держи снова белую метку.
4. «Независтливые». В каждом ходу они старались набрать не больше соседа, а больше, чем у них самих было на предыдущем ходу. Интересно, что, когда в расширенной версии такой игры участвуют люди, они с удовольствием пользуются дополнительными возможностями типа «потратьте одно очко, чтобы любая другая команда на ваш выбор потеряла три» и редко пользуются опцией «получите одно очко, чтобы любая другая команда на выбор ведущего (или ваш собственный) получила три». Свою успешность человек определяет в сравнении с остальными, очень часто считая, что дела идут плохо, потому что у соседа лучше, или наоборот, радуясь, что у меня долгов только на 100 000, потому что у Петьки-то на целый мильон.