"Эгоистичный ген" - читать интересную книгу автора (Докинз Ричард)Глава 12. Добрые парни финишируют первымиДобрые парни финишируют последними. Это выражение, по-видимому, впервые родилось в мире бейсбола, хотя некоторые авторитеты настаивают, что противоположное утверждение появилось еще раньше. Американский биолог Гаррет Хардин (Garret Hardin) воспользовался этой фразой, чтобы кратко сформулировать идею о том, что можно было бы назвать «социобиологией» или «эгоистичным генным механизмом». Уместность такого использования очевидна. Если перевести общепринятый смысл слов «добрый парень» его дарвиновским эквивалентом, то «добрый парень» — это индивидуум, который помогает другим представителям своего вида, в ущерб самому себе, передавать их гены следующему поколению. Таким образом, число «добрых парней» неизбежно будет сокращаться: доброта гибнет дарвинистской смертью. Существует, однако, и другая, техническая, интерпретация слова «добрый». Если мы примем это определение, которое не слишком далеко отходит от разговорного смысла, то добрые парни могут кончать Вспомните Злопамятных из гл. 10. Это были птицы, которые помогали друг другу, очевидно из альтруистичных побуждений, но Злопамятные при этом отказывали в помощи индивидуумам, которые ранее отказывались помочь им самим. Злопамятные в конечном счете заняли доминирующее положение, потому что они передавали последующим поколениям больше генов, чем Простаки (помогавшие всем без разбора и сами подвергавшиеся эксплуатации) и Плуты (которые стремились безжалостно эксплуатировать всех и в конечном счете уничтожали друг друга). История Злопамятных иллюстрирует важный принцип, который Роберт Трайверс назвал «реципрокным альтруизмом». Как мы видели на примере рыб-чистильщиков, в реципрокном альтруизме могут участвовать и представители разных видов. Он присутствует во всех взаимоотношениях, называемых симбиотическими, как, например, взаимоотношения между муравьями и их «коровами» — тлями, которых они доят (с. 169). После того как гл. 10 была написана, американский политолог Роберт Аксельрод (Robert Axelrod) при участии У. Гамильтона, имя которого упоминается на столь многих страницах этой книги, использовал идею реципрокного альтруизма в новых очень интересных направлениях. Именно Аксельрод определил техническое значение слова «добрый», о чем я упоминал во вступительном абзаце этой главы. Аксельрод, подобно многим политологам, экономистам и психологам, был восхищен простой азартной игрой, получившей название «Парадокс заключенных». Она так проста, что я знаю умных людей, которые, не допуская такой простоты, совершенно неправильно ее понимали и пытались искать в ней что-то еще. Но простота обманчива. Целые полки в библиотеках отведены вариантам этой увлекательной игры. Многие влиятельные люди полагают, что в ней содержится ключ к планированию стратегической обороны и что нам следует изучать ее, если мы хотим предотвратить третью мировую войну. Как биолог я согласен с Аксельродом и Гамильтоном, что многие дикие животные и растения заняты бесконечной игрой в Парадокс заключенных, происходящей в эволюционных масштабах времени. В своем первоначальном, человеческом, варианте эта игра состоит в следующем. Имеется «банкомет», который судит игру и выплачивает выигрыши двум игрокам. Допустим, что я играю против вас (хотя, как мы увидим, «против» — это как раз то, чего нам не следует делать). На руках у каждого игрока только по две карты с надписями Кооперируюсь и Отказываюсь. Каждый из нас выбирает одну из двух своих карт и кладет ее на стол рубашкой вверх, с тем чтобы ни один из игроков не знал, как пошел другой; собственно говоря, оба они ходят одновременно. Далее игроки напряженно ожидают, пока банкомет перевернет карты. Напряженность связана с тем, что выигрыш зависит не только от собственного хода (каждый игрок знает, какую карту положил он сам), но и от хода противника (что остается неизвестным, пока банкомет не перевернет карты). Поскольку в игре участвуют 2х2 карты, то имеется четыре возможных исхода (из уважения к северо-американскому происхождению игры выигрыши приводятся в долларах): Исход I. Мы оба сыграли КООПЕРИРУЮСЬ. Банкомет выплачивает каждому из нас по 300 долларов. Эта почтенная сумма называется «Награда за взаимное кооперирование». Исход II. Мы оба сыграли ОТКАЗЫВАЮСЬ. Банкомет штрафует каждого из нас на 10 долларов. Это называется «Наказание за взаимный отказ». Исход III. Вы сыграли КООПЕРИРУЮСЬ, а я ОТКАЗЫВАЮСЬ. Банкомет выплачивает мне 500 долларов (Плата за риск) и штрафует вас (Простака) на 100 долларов. Исход IV. Вы сыграли ОТКАЗЫВАЮСЬ, а я КООПЕРИРУЮСЬ. Банкомет выплачивает вам за риск 500 долларов и штрафует меня (Простака) на 100 долларов. Совершенно очевидно, что исходы III и IV представляют собой зеркальные отражения один другого: один игрок выигрывает, а другой проигрывает. При исходах I и II оба оказываются в равном положении, но исход I При чем же тут «Парадокс»? Чтобы понять это, посмотрите на платежную матрицу и попытайтесь представить себе мысли, проходящие через мою голову, когда я играю против вас. Я знаю, что имеются только две карты, с которых вы можете пойти: Кооперируюсь и Отказываюсь. Обсудим их по порядку. Если вы пошли Отказываюсь (это означает, что нам надо смотреть на правую сторону матрицы), то лучшее, что я могу сделать, это также сыграть Отказываюсь. Правда, мне при этом придется заплатить штраф за взаимный отказ, но если бы я пошел Кооперируюсь, то был бы оштрафован как Простак, что еще хуже. Обратимся теперь к левой половине матрицы, т. е. допустим, что вы пошли с карты Кооперируюсь. И снова мне лучше всего играть Отказываюсь. Если бы я сыграл Кооперируюсь, то мы оба получили бы довольно высокий куш — по 300 долларов. Если же я играю Отказываюсь, то получаю даже еще больше — 500 долларов. Отсюда следует вывод, что независимо от того, с какой карты вы пошли, моей лучшей тактикой будет Итак, я путем безупречных логических рассуждений установил, что независимо от ваших действий, я должен отказаться. С помощью столь же безупречной логики придете к точно такому же выводу и вы. Таким образом, когда встречаются два разумных игрока, они оба будут отказываться и оба в конечном счете либо заплатят штраф, либо получат небольшую выплату. При этом каждый из них прекрасно знает, что если бы только они оба играли Кооперируюсь, то каждый получил бы довольно высокую Награду за взаимное кооперирование (в нашем случае 300 долларов). Поэтому-то игра и называется Парадоксом, причем она так парадоксальна, что может довести до исступления, и поэтому раздавались голоса за то, чтобы издать закон о ее запрещении… «Заключенные» относится к одному воображаемому примеру. Валютой в этом примере служат не деньги, а сроки заключения. Два человека назовем их Петерсон и Мориарти — сидят в тюрьме по подозрению в соучастии в преступлении. Каждому из заключенных в его отдельной камере предлагают предать своего товарища (Отказаться), дав в суде показания против него. Дальнейший ход событий зависит от того, как поступят оба заключенных при том, что ни один из них не знает, как поступил другой. Если Петерсон свалит всю вину на Мориарти, а Мориарти, храня молчание, тем самым подтвердит это (кооперируясь со своим былым и, как оказалось, вероломным другом), то Мориарти получит длительный срок заключения, а Петерсон выйдет на свободу целым и невредимым, получив Плату за риск. Если каждый из них свалит вину на другого, то обоих осудят за инкриминируемое им преступление, но оба получат некоторое снисхождение за дачу показаний и приговор окажется Наказанием за взаимный отказ, хотя и несколько смягченным. Если оба преступника кооперируются (друг с другом, а не с властями), отказываясь давать показания, то доказательств их вины может оказаться недостаточно, чтобы осудить кого-то одного из них за. главное преступление, и они получат меньший срок за какое-нибудь более мелкое преступление — Награда за взаимное кооперирование. Вряд ли можно назвать тюремное заключение «наградой», однако люди, которым грозило долгое пребывание за решеткой, воспримут его именно так. Вы должны были заметить, что хотя все выплаты выражены не в долларах, а в сроках тюремного заключения, главные черты игры сохраняются (обратите внимание на относительный ранг четырех исходов по их желательности). Если вы поставите себя на место каждого из заключенных, допуская, что обоими движет разумный эгоизм, и помня, что они не имеют возможности переговорить друг с другом, чтобы заключить соглашение, то вы поймете, что ни у одного из них нет иного выбора, как предать другого. Можно ли разрешить этот парадокс? Оба игрока знают, что, независимо от действий оппонента, лучшее, что они могут делать сами, это отказываться; но при этом оба знают также, что если бы только они В простом варианте игры «Парадокс заключенных» такой способ отсутствует. Если хотя бы один из игроков не окажется настоящим праведником, не от мира сего, игра неизбежно окончится обоюдным отказом с парадоксально жалким результатом для обоих игроков. Однако есть и другой вариант этой игры. Она называется Итерированным, или Многократным, Парадоксом заключенных. Итерированный вариант игры сложнее, и его сложность вселяет надежду. Итерированная игра — это просто та же самая игра, повторенная бесконечное число раз с участием тех же игроков. Снова мы с вами сидим друг против друга, по обе стороны от банкомета. Снова у каждого из нас по две карты — Кооперируюсь и Отказываюсь. Снова каждый из нас ходит с той или другой из этих карт, а банкомет выплачивает деньги или взимает штрафы в соответствии с приведенными выше правилами. Однако на этот раз вместо того, чтобы закончить игру, мы снова берем карты и готовимся к следующей партии. Последовательные партии позволяют нам выяснить, следует ли доверять противнику или нет, отплачивать ему за каждый удар или умиротворять, прощать или мстить. В бесконечно долгой игре очень важно добиться того, чтобы мы оба выигрывали за счет банкомета, а не за счет друг друга. После десяти партий я теоретически мог бы выиграть 5000 долларов, но только в том случае, если вы необыкновенно глупы (или праведны) и всякий раз играли Кооперируюсь, несмотря на то, что я все время ходил Отказываюсь. Более реально допустить, что каждый из нас получит по 3 тысячи долларов за счет банкомета, если мы оба все 10 раз сыграли Кооперируюсь. Для этого нам не надо быть особенно праведными, так как мы оба можем убедиться на основании предшествующей игры противника, что ему можно доверять. Мы можем, в сущности, регулировать поведение друг друга. Вполне вероятен также и другой оборот: ни один из нас не вериг другому и мы оба играем Отказываюсь все десять раз, а банкомет получает от каждого из нас по 100 долларов в виде штрафов. Скорее всего мы частично доверимся друг другу, каждый будет играть вперемешку то Кооперируюсь, то Отказываюсь, и в результате получит некую промежуточную сумму денег. Описанные в гл. 10 птицы, которые удаляли друг у друга клещей из перьев, играли в итерированный вариант Парадокса заключенных. Как это получается? Если вы помните, птице очень важно избавляться от клещей, однако она не может добраться до собственной макушки и ей нужно, чтобы кто-то сделал это за нее. Казалось бы, справедливость требует, чтобы она впоследствии отплатила за эту услугу тем же самым. Но на процедуру вытаскивания клещей надо затратить время и энергию, хотя и не слишком много. Если птица может безнаказанно сплутовать, т. е. если ей была оказана услуга, а она отказывается сделать то же самое, то она пожинает все плоды, не расплачиваясь за это. Расположите исходы в порядке их «цены» и вы убедитесь, что перед вами типичная игра Парадокс заключенных. Когда оба кооперируются (вытаскивают друг у друга клещей), то это дает достаточно хорошие результаты, однако остается соблазн добиться большего, отказавшись оплачивать стоимость ответной услуги. Если оба играют Отказываюсь (отказываются вытаскивать клещей), то ничего хорошего не получается, однако еще хуже затрачивать усилия на вытаскивание клещей из другого индивидуума, а самому оставаться зараженным клещами. Но это всего лишь один пример. Чем больше думаешь об этом, тем больше понимаешь, что не только жизнь людей, но также жизнь животных и жизнь растений переполнена играми типа Итерированного Парадокса заключенных. Жизнь растений? А почему бы нет? Вспомните, что речь идет не об осознанных стратегиях (хотя иногда можно говорить и о них), а о стратегиях в «мэйнардсмитовском» смысле, стратегиях тех типов, которые могли бы программироваться генами. А пока займемся более глубоким изучением того, в чем же состоит важность итерации. В отличие от простого варианта игры, которая довольно предсказуема в том смысле, что Отказываюсь — единственная разумная стратегия, итеративный вариант предлагает много разных стратегий. В простом варианте возможны лишь две стратегии: Кооперируюсь и Отказываюсь. Итерация, однако, допускает множество стратегий, и какая из них лучше всех — отнюдь не очевидно. Приведем в качестве примера одну из тысяч: «играй Кооперируюсь по большей части, но в выбранных случайным образом 10% партий играй Отказываюсь». Другие стратегии могут зависеть от того, как протекала игра перед этим. Примером служит мой «Злопамятный»: у него хорошая память на лица, и хотя в основном он склонен кооперироваться, он отказывается, если другой игрок отказывался когда-либо в прошлом. Другие стратегии могут быть более снисходительными и не такими злопамятными. Число стратегий, возможных в итеративной игре, ограничено, очевидно, лишь нашей изобретательностью. Можно ли установить, какая из них лучше всех? Эту задачу поставил перед собой Аксельрод. У него возникла увлекательная идея провести конкурс и он пригласил специалистов по теории игр представить свои стратегии. В данном случае стратегии — это заранее составленные программы действия, и соответственно соперники представили свои заявки на языке программирования. Было предложено четырнадцать стратегий. Аксельрод добавил к ним пятнадцатую, назвав ее Случайной, которая просто без всякой системы играла то Кооперируюсь, то Отказываюсь и служила своего рода базовой «анти-стратегией»: стратегию, дававшую худшие результаты, чем Случайная, следовало признать очень плохой. Аксельрод описал все 15 стратегий на одном общем языке программирования. Каждая стратегия сравнивалась по эффективности поочередно с каждой из остальных (в том числе и с собственной копией) в игре Итерированный Парадокс заключенных. Поскольку стратегий было 15, то компьютер сыграл 15 х 15, или 225, отдельных игр. После того, как каждая пара сделала по 200 ходов, все выигрыши были суммированы и был объявлен победитель. Нас здесь не интересует, какая именно стратегия вышла победителем в игре против каждого отдельного противника. Нам важно установить, какая стратегия выиграла больше всего «денег» за все свои 15 вариантов. «Деньги» — это просто «очки», присуждаемые по следующей схеме: взаимное Кооперирование — 3 очка; Риск — 5 очков; Наказание за взаимный отказ — 1 очко (эквивалент небольшого штрафа в игре, описанной ранее); Штраф Простаку — 0 очков (эквивалент большого штрафа в игре, описанной ранее). Максимально возможный выигрыш, который могла бы получить та или иная стратегия, составляет 15 000 очков (200 партий по 5 очков за партию с каждым из 15 противников). Минимальный результат составляет 0. Излишне говорить, что ни один из этих крайних результатов на самом деле не наблюдался. Наибольший выигрыш, на который может реально надеяться данная стратегия в среднем из своих 15 турниров, не может сколько-нибудь значительно превысить 600 очков. Это все, что мог бы получить каждый из двух игроков, если бы они оба все время играли Кооперируюсь, зарабатывая по 3 очка за каждую из 200 сыгранных партий. Если бы один из них поддался искушению отказаться, то число его очков, вероятно, оказалось бы меньше 600, так как другой игрок отплатил бы ему тем же (в большей части представленных стратегий было заложено в той или иной форме стремление к ответному удару). Мы можем использовать число 600 в качестве своего рода точки отсчета для данной игры и выражать результаты в процентах от этого числа. По такой шкале оценок теоретически можно довести выигрыш до 166% (1000 очков), но практически ни одна стратегия не заработала в среднем больше 600 очков. Не забывайте, что «игроками» в турнире были не люди, а программы, точнее — запрограммированные стратегии. Их авторы, т. е. люди, выступали в той же роли, что и гены, программирующие тела (вспомните гл. 4 — компьютер, играющий в шахматы, и компьютер, созданный по инструкциям с Андромеды). Стратегии, о которых идет речь, можно рассматривать как доверенных лиц их авторов. На самом деле кто-то из авторов мог бы представить не одну, а несколько программ (хотя было бы жульничеством — которого Аксельрод, вероятно, не допустил бы, — если бы тот или другой автор «забил» весь турнир своими стратегиями, и одна из них воспользовалась бы плодами жертвенного кооперирования со стороны других). Было предложено несколько очень хитроумных стратегий, хотя они были, конечно, далеко не столь хитроумными, как их авторы. Интересно, что победившая стратегия была проще всех других и на первый взгляд наименее хитроумной. Она называлась «Око за око» и была представлена проф. Анатолем Рапопортом (Anatol Rapoport), известным психологом и специалистом по теории игр из Торонто. По этой стратегии первым ходом должно быть Кооперируюсь, а в дальнейшем следует просто повторять предыдущий ход другого игрока. Как проходит игра Око за око? Как всегда, развитие событий зависит от поведения второго игрока. Допустим для начала, что второй игрок — это тоже стратегия Око за око (напомним, что каждая стратегия играла не только против каждой из 14 других стратегий, но также против копии самой себя). Обе стратегии Око за око начинают с кооперирования. При следующем ходе каждый игрок повторяет предыдущий ход противника, т. е. кооперируется. Оба продолжают играть Кооперируюсь до конца игры, которую оба заканчивают, достигнув на 100% суммы очков, принятой за точку отсчета, т. е. заработав по 600 очков. Допустим, что Око за око играет против стратегии, названной Наивный испытатель. На самом деле Наивный испытатель не участвовал в конкурсе Аксельрода, но тем не менее этот пример поучителен. Наивный испытатель в основном идентичен программе Око за око, с той разницей, что время от времени, скажем один раз за десять ходов, причем без всякой закономерности, он совершенно беспричинно играет Отказываюсь и требует 5 очков, причитающиеся ему за риск. До тех пор, пока Наивный испытатель не предпримет один из своих зондирующих отказов, оба игрока ведут себя в соответствии со стратегией Око за око. Однако внезапно, без предупреждения, скажем на восьмом ходу. Наивный испытатель отказывается. Око за око, разумеется, сыграла в этот раз Кооперируюсь, а поэтому получила 0 очков, как это положено Простаку. Наивный испытатель, казалось бы, добился успеха, заработав за этот ход 5 очков. Но своим следующим ходом Око за око «мстит». Она играет Отказываюсь, просто следуя заложенному в нее правилу копировать предыдущий ход противника. Тем временем стратегия Наивный испытатель, следуя правилу копировать противника, заложенному в нее самое, повторила ее ход — Кооперируюсь. В результате ей достается Штраф Простаку, т. е. 0 очков, тогда как Око за око получает высшую плату — 5 очков. Своим следующим ходом Наивный испытатель — довольно несправедливо, как можно подумать, — «мстит» за отказ стратегии Око за око. И такое чередование продолжается. При этом оба игрока получают в среднем по 2,5 очка за ход (среднее между 5 и 0). Это меньше, чем те верные 3 очка за ход, которые получают игроки, если они оба играют Кооперируюсь (кстати, это и есть причина введения того «дополнительного условия», которому не было дано объяснения на с. 188). Итак, когда Наивный испытатель играет против стратегии Око за око, оба выигрывают меньше, чем в игре Око за око против Ока за око. Если же игра идет между двумя Наивными испытателями, дела обоих обстоят еще хуже, так как серии взаимных отказов начинаются раньше. Рассмотрим теперь еще одну стратегию, получившую название Раскаивающийся испытатель. Раскаивающийся испытатель сходен с Наивным испытателем, отличаясь от него лишь тем, что для запуска серии поочередных возмездии необходимо предпринимать активные шаги. Для этого ему нужна несколько более долгая «память», чем у стратегий Око за око или Наивный испытатель. Раскаивающийся испытатель запоминает, был ли его отказ спонтанным и привело ли это к быстрому возмездию. В этом случае он, «полный раскаяния», предоставляет своему противнику право на «один бесплатный удар», за которым не следует возмездия. Это означает, что серии взаимных возмездии пресекаются и самом зачатке. Если теперь продолжить воображаемую игру между стратегиями Раскаивающийся испытатель и Око за око, то обнаружится, что серии мнимых взаимных возмездии быстро прерываются. На протяжении большей части игры противники взаимно кооперируются, что обеспечивает им обоим большой выигрыш. Раскаивающийся испытатель играет более успешно против стратегии Око за око, чем Наивный испытатель, хотя и не так успешно, как Око за око против самой себя. Некоторые из стратегий, участвовавших в турнире Аксельрода, были гораздо более хитроумными, чем Раскаивающийся испытатель или Наивный испытатель, однако они также набирали в среднем меньше очков, чем простая стратегия Око за око. В сущности наименее успешной из всех стратегий (если исключить Случайную) оказалась самая сложная, тщательно разработанная стратегия. Она была представлена под девизом «Автор пожелал остаться неизвестным», что послужило поводом для веселых гипотез. Кто автор? Какой-то серый кардинал в Пентагоне? Глава ЦРУ? Генри Киссинджер? Сам Аксельрод? Я думаю, что этого мы никогда не узнаем. Подробно разбирать отдельные стратегии не так уж интересно. В задачи этой книги не входит обсуждение изобретательности программистов. Гораздо интереснее распределить имеющиеся стратегии по определенным категориям и изучать эффективность этих более крупных подразделений. Самая важная из различаемых Аксельродом категорий названа «добропорядочной». Добропорядочная стратегия определяется как такая стратегия, которая никогда не отказывается первой. Примером служит Око за око. Она способна отказаться, но делает это только в порядке возмездия. Как Наивный, так и Раскаивающийся испытатели — недобропорядочные стратегии, потому что они иногда, хотя и редко, отказываются без всякого к тому повода. Из 15 стратегий, участвовавших в турнире, 8 были добропорядочными. Показательно, что эти же 8 стратегий набрали наибольшее число очков, а 7 недобропорядочных остались далеко позади. Стратегия Око за око набрала в среднем 504,5 очка, что составляет 84% от нашей точки отсчета (600 очков) и может считаться хорошим результатом. Другие добропорядочные стратегии набрали лишь немного меньше очков — от 83,4 до 78,6%, оставив далеко позади самую успешную из всех непорядочных стратегий — Грааскамп, набравшую 66,8% очков. Еще один из технических терминов Аксельрода — это «прощение». У прощающей стратегии короткая память, хотя она может давать сдачи. Она очень быстро забывает о прошлых обидах. Око за око — прощающая стратегия. Она немедленно дает отказчику по рукам, но тут же забывает о нанесенной ей обиде. Описанный в гл. 10 Злопамятный никогда не прощает. Он сохраняет в памяти все события до самого конца игры. Он никогда не забывает, если кто-то из игроков хотя бы один раз сыграл против него Отказываюсь. Стратегия, формально названная Злопамятный, участвовала в турнире Аксельрода под именем Фридман и не достигла особенно хороших результатов. Среди всех добропорядочных стратегий (заметим, что она добропорядочна лишь в техническом смысле, но при этом совершенно ничего не прощает) пара Злопамятный/Фридман оказалась на втором месте с конца. Причина, по которой неспособные прощать стратегии не достигают хороших результатов, состоит в том, что они не могут разорвать серию взаимных возмездии даже в тех случаях, когда их противник «раскаивается». Можно быть более снисходительным, чем стратегия Око за око. Стратегия Око за два ока разрешает своим противникам два отказа подряд и только потом мстит. Это может показаться слишком милостивым и великодушным. Тем не менее Аксельрод установил, что если бы кто-то представил на рассмотрение стратегию Око за два ока, то она победила бы в турнире. Это обусловлено способностью данной стратегии избегать серии взаимных возмездии. Таким образом, мы определили два качества выигрывающих стратегий: добропорядочность и способность к прощению. Это почти утопическое заключение, что добропорядочность и всепрощение окупаются, вызвало удивление у многих экспертов, которые пускались на всевозможные хитрости, предлагая стратегии, содержащие в себе скрытые элементы недобропорядочности; даже те, кто предложил добропорядочные стратегии, не решились на что-либо столь всепрощающее, как Око за два ока. Аксельрод объявил о втором турнире. Он получил 62 заявки на участие и снова добавил к ним Случайную стратегию, что в сумме составило 63 стратегии. На этот раз по причине, о которой я скажу позднее, точное число ходов за партию — 200 — не было оговорено заранее. Мы снова можем выражать в процентах оценки от точки отсчета или же от результатов, получаемых при условии «Всегда кооперируйся», несмотря на то, что определение этой точки отсчета требует более сложных вычислений и она уже не всегда равна 600 очкам. Всем программистам, участвовавшим во втором турнире, были представлены результаты первого турнира, а также проведенный Аксельродом анализ того, почему Око за око и другие добропорядочные и способные к прощению стратегии получили такие хорошие результаты. Разумеется, участники турнира тем или иным образом должны были учесть эту информацию. На самом деле они разбились на две группы. Одни считали, что добропорядочность и способность к прощению, очевидно, давали шансы на выигрыш, и соответственно предложили добропорядочные способные к прощению стратегии. Джон Мэйнард Смит зашел так далеко, что представил всепрощающую стратегию Око за два ока. Другая группа исходила из того, что многие участники, прочитав анализ Аксельрода, предложат теперь добропорядочные способные к прощению стратегии. Они поэтому представили недобропорядочные стратегии, пытаясь использовать в своих интересах этих предполагаемых придурков! Однако недобропорядочность опять оказалась невыгодной. Снова стратегия Око за око, представленная Анатолем Раппопортом, вышла победителем, и результат составил целых 96% от 600. И еще раз добропорядочные стратегии в общем оказались более эффективными, чем непорядочные. Все 15 более эффективных стратегий, за исключением одной, были добропорядочными, а из 15, набравших меньше очков, все, за исключением одной, были непорядочными. Но хотя праведная стратегия Око за два ока выиграла бы в первом турнире, если бы в нем участвовала, она не вышла победителем из второго. Это объясняется тем, что во втором турнире участвовали более коварные стратегии, способные безжалостно наброситься на столь откровенного придурка. Такой результат выявил одно важное обстоятельство, характерное для этих турниров: успех той или иной стратегии зависит от того, какие другие стратегии участвуют в турнире. Это единственный способ объяснить различие между вторым турниром, в котором Око за два ока заняла гораздо более далекое место в турнирной таблице, и первым турниром, в котором эта стратегия выиграла бы. Однако, как я уже говорил, эта книга не о том, сколь изобретательны программисты. Существует ли способ, позволяющий решить, какую стратегию можно действительно считать наилучшей в более общем и менее произвольном смысле? Те, кто прочитали предыдущие главы, уже готовы искать ответ на этот вопрос в теории эволюционно стабильных стратегий. Я был одним из тех, кому Аксельрод сообщил о своих ранних результатах с просьбой прислать стратегию для второго турнира. Я этого не сделал, но высказал другое предложение. Аксельрод уже начинал мыслить в терминах ЭСС, но я счел это столь важным, что написал ему, предложив связаться с У. Гамильтоном. Аксельрод не знал, что Гамильтон в это время работал в одном с ним университете, только в другом отделении. Он немедленно встретился с ним, и результатом последовавшего за этим сотрудничества оказалась блестящая статья, опубликованная в журнале Science в 1981 г. и завоевавшая премию Ньюкомба Кливленда Американской ассоциации содействия развитию науки. Помимо обсуждения некоторых восхитительно оторванных от жизни биологических примеров Итерированных Парадоксов заключенных, Аксельрод и Гамильтон дали, с моей точки зрения, должную оценку подходу в свете теории ЭСС. Сопоставьте этот подход с -«соревнованием по круговой системе», в соответствии с которым проводились два турнира Аксельрода. Каждая стратегия выставлялась против каждой из других стратегий одинаковое число раз. Конечная оценка стратегии определялась общей суммой очков, «заработанных» ею в играх со всеми остальными стратегиями. Таким образом, чтобы добиться успеха в соревновании по круговой системе, данная стратегия должна выстоять против всех других стратегий, которые людям вздумается предложить. Аксельрод назвал стратегию, способную победить широкий круг других стратегий, «сильной» стратегией. Око за око оказалась сильной стратегией. Однако набор стратегий, предлагаемых людьми в том или другом случае, произволен. Именно это беспокоило нас выше. По чистой случайности в первом турнире Аксельрода примерно половина стратегий относилась к добропорядочным. В этих условиях Око за око выиграла, а Око за два ока выиграла бы, если бы приняла участие в турнире. Допустим, однако, что все представленные стратегии случайно оказались непорядочными. Такая ситуация могла бы возникнуть очень легко. Ведь из 14 предложенных стратегий 6 действительно были непорядочными. Если бы число непорядочных стратегий составило 13, то Око за око не выиграла бы. Атмосфера оказалась бы для нее неподходящей. Не только сумма выигрыша, но и место в иерархическом ряду, выстраиваемом на основе достигнутого успеха, определяется тем, какие стратегии были представлены; иным словами, все зависит от такого произвольного фактора, как прихоть того или иного человека. Как мы можем уменьшить эту произвольность? Если будем «мыслить в духе ЭСС». Как вы, вероятно, помните по первым главам, важная характеристика эволюционно стабильной стратегии состоит в том, что она продолжает оставаться эффективной, когда она уже многочисленна в данной популяции стратегий. Называя Око за око эволюционно стабильной стратегией, мы говорим, что Око за око эффективна в ситуации, в которой эта стратегия доминирует. Это можно рассматривать как особый тип «силы». Как эволюционисты мы испытываем соблазн рассматривать его как единственный тип силы, имеющий существенное значение. Почему это так важно? А потому, что в мире дарвинизма выигрыши выплачиваются не в виде денег, а в виде потомков. Для дарвиниста успешная стратегия — это такая стратегия, которая стала многочисленной в данной популяции стратегий. Для того чтобы стратегия оставалась успешной, она должна быть особенно эффективной тогда, когда она многочисленна, когда она действует в обстановке, где доминируют ее собственные копии. На самом деле Аксельрод провел третий раунд своего турнира так, как его мог бы вести естественный отбор, стремящийся найти некую ЭСС. Правда, он не назвал это третьим раундом, поскольку он не обращался с просьбами о новых предложениях, а использовал те же 63 стратегии, что и в раунде 2. Мне кажется удобным рассматривать его как раунд 3, потому что, по-моему, он отличается от двух «соревнований по круговой системе» более основательно, чем эти два соревнования отличаются друг от друга. Аксельрод взял эти 63 стратегии и вновь ввел их в компьютер в качестве «генерации I» некой эволюционной последовательности. Поэтому в «генерации I» были равномерно представлены все 63 стратегии. В конце генерации 1 каждой стратегии был выплачен выигрыш не в виде «денег» или «очков», но в виде В конце концов по прошествии примерно 1000 поколений дальнейшие изменения обстановки прекратились. Была достигнута стабильность. До этого благосостояние различных стратегий возрастало и падало, точно так же, как при компьютерном моделировании стратегий Плутов, Простаков и Злопамятных. Некоторые стратегии пошли на убыль с самого начала, а к 200-му поколению большая их часть вымерла. Одна или две из непорядочных стратегий стали встречаться все чаще, однако их процветание, как и у Простака в моей модели, было недолгим. Единственная непорядочная стратегия, сохранившаяся по прошествии 200 поколений, была стратегия под названием Харрингтон. Выигрыши этой стратегии резко возрастали на протяжении первых 150 поколений, а затем довольно медленно снижались, и стратегия практически вымерла к 1000-му поколению. Стратегия Харрингтон была успешной в течение некоторого времени по той же причине, что и моя оригинальная стратегия Плут. Она эксплуатировала придурков вроде стратегии Око за два ока, пока они еще существовали. Затем, после того как эти придурки были доведены до вымирания, стратегия Харрингтон, лишившись легкой добычи, последовала за ними. Арена оказалась свободной для таких добропорядочных, но дерзких стратегий, как Око за око. Сама стратегия Око за око действительно взяла верх в пяти из шести партий третьего раунда, точно так же, как это было в раундах 1 и 2. Пять других добропорядочных, но дерзких стратегий добились почти такого же успеха (высокая частота в популяции), как Око за око; одна из них даже победила в шестой партии. После того как все недобропорядочные стратегии было доведены до вымирания, ни одну из добропорядочных стратегий нельзя было отличить от Ока за око или друг от друга, потому что все они, будучи добропорядочными, просто играли друг против друга Кооперируюсь. Эта неразличимость означает, в частности, что хотя Око за око напоминает ЭСС, она, строго говоря, не является настоящей ЭСС. Вспомним: для того, чтобы быть ЭСС, стратегия, когда она становится широко распространенной, должна быть защищена от проникновения той или иной редкой мутантной стратегии. Что же касается стратегии Око за око, то хотя она и, не допускает проникновения какой-либо недобропорядочной стратегии, от других добропорядочных стратегий она не защищена. Как мы только что видели, в популяции добропорядочных стратегий все стратегии будут выглядеть и вести себя совершенно одинаково: все они будут играть Кооперируюсь. Таким образом, любая другая добропорядочная стратегия, подобно совершенно праведной Всегда кооперируйся, хотя предположительно она будет обладать положительным селективным преимуществом над стратегией Око за око, тем не менее может проникнуть в популяцию незамеченной. Поэтому технически Око за око нельзя считать ЭСС. - Можно подумать, что поскольку мир продолжает оставаться таким же добропорядочным, мы могли бы рассматривать Око за око как ЭСС. Но, боже, посмотрите, к чему это приведет! В отличие от Ока за око стратегия Всегда кооперируюсь неустойчива к проникновению непорядочных стратегий, таких, как Всегда отказываюсь. Стратегия Всегда отказываюсь эффективна против Всегда кооперируюсь, поскольку она всякий раз получает 5 очков за риск. Непорядочные стратегии, такие, как Всегда отказываюсь, вступят в игру, поддерживая на низком уровне численность слишком добропорядочных стратегий, таких, как Всегда' кооперируюсь. Однако, хотя Око за око, строго говоря, не является истинной ЭСС, было бы, вероятно, справедливо рассматривать некую смесь в своей основе добропорядочных, но мстительных, «Око за око-подобных» стратегий, как примерно эквивалентную ЭСС. Такая смесь может содержать небольшую добавку непорядочности. Роберт Бойд и Джеффри Лорбербаум (Robert Boyd, Jeffrey Lorberbaum) в одной из интересных работ, продолжающих исследования Аксельрода, рассматривают смесь стратегии Око за око и стратегии, названной Недоверчивой око за око. Недоверчивая око за око технически относится к числу непорядочных, но она не Аксельрод понимал, что Услугу за услугу, строго говоря, нельзя считать ЭСС и поэтому он описал ее как «Коллективно стабильную стратегию». Как и в случае настоящих ЭСС, коллективно стабильными могут быть одновременно несколько стратегий. И снова доминирование в популяции зависит просто от везения. Всегда отказываюсь также стабильная стратегия, равно как и Око за око. В популяции, в которой Всегда отказываюсь уже достигла доминирующего положения, ни одна другая стратегия не может превзойти ее по эффективности. Мы можем рассматривать систему как имеющую две точки стабильности: одна из них Всегда отказываюсь, а другая — Око за око (или какая-то смесь по большей части добропорядочных ответных стратегий). Та точка стабильности, которая первой займет доминирующее положение в популяции, и останется доминантной. Что же означает «доминирование» на количественном уровне? Каким должно быть число стратегий Око за око, чтобы она одолела Всегда отказываюсь? Это зависит от конкретных выплат, на которые банкомет согласился пойти в данной игре. В общем можно лишь сказать, что существует некая критическая частота, некий рубеж. По одну его сторону критическая частота стратегии Око за око превышена и отбор начинает все больше и больше благоприятствовать этой стратегии. По другую сторону превышена критическая частота стратегии Всегда отказываюсь и отбор все больше и больше благоприятствует этой последней. Мы уже встречались с такой ситуацией в гл. 10, при рассмотрении Злопамятных и Плутов. Совершенно очевидно поэтому, сколь важное значение имеет то, по какую сторону от рубежа окажется данная популяция Как это может произойти? Можно было бы ответить: «Случайно». Однако слово «случайность» просто скрывает наше незнание. Оно означает: «Определяется какими-то пока неизвестными или точно не установленными факторами». У нас есть возможность ответить чуть лучше. Мы можем попытаться представить себе, как практически некоему меньшинству индивидуумов, использующих стратегию Око за око, удается увеличиться в числе и достигнуть критической массы. Это равносильно поискам возможных путей, которыми индивидуумы Око за око могли бы образовывать достаточно большие скопления, чтобы всем вместе выигрывать за счет банкомета. Такое направление представляется перспективным, но вместе с тем довольно неопределенным. Как именно могли бы сходные друг с другом индивидуумы собираться вместе, образуя локальные скопления? Очевидная причина образования таких скоплений в природе — генетическая близость, родство. Животные большинства видов обычно живут поблизости от своих родных и двоюродных братьев и сестер, а не от каких-то случайных членов данной популяции. Это необязательно бывает обусловлено их собственным выбором, а автоматически вытекает из присущей популяции «вязкости». Вязкость означает любую наблюдаемую у индивидуумов тенденцию продолжать жить вблизи того места, где они родились. Например, на протяжении большей части своей истории и в большинстве областей земного шара (хотя это далеко не всегда можно сказать о нашем современном мире) люди редко удалялись больше чем на несколько километров от того места, где они родились. Это приводит к образованию локальных скоплений индивидуумов, связанных генетическим родством. Я помню, как при посещении одного острова, довольно сильно удаленного от западного побережья Ирландии, меня поразило, что почти у всех его жителей были огромные уши, напоминавшие по форме ручку кувшина. Вряд ли это объяснялось тем, что большие уши соответствовали климату (на острове дуют сильные ветры с моря). Это было результатом тесного родства между всеми обитателями острова. Генетическое родство проявляется не только во внешнем сходстве (например, в чертах лица), но и во всевозможных других аспектах. Например, индивидуумы, связанные генетическим родством, походят друг на друга по генетической склонности играть (или не играть) Око за око. Поэтому, если даже эта стратегия редко встречается в популяции в целом, она может быть широко распространена локально. На некоем локальном участке индивидуумы, использующие стратегию Око за око, могут встречаться друг с другом достаточно часто, чтобы взаимное кооперирование обеспечивало им процветание, несмотря на то, что по расчетам, исходящим из одной только глобальной частоты в популяции в целом, может получиться, что их частота ниже критической. В таких случаях индивидуумы Око за око, кооперирующиеся между собой в пределах уютных маленьких территорий, могут достигнуть такого процветания, что из небольших локальных скоплений превратятся в более крупные локальные скопления. Иногда локальные скопления вырастают так сильно, что распространяются в другие области, в которых до того численно доминировали индивидуумы, придерживающиеся стратегии Всегда отказываюсь. Мой ирландский остров, очевидно, не слишком удачный пример упомянутых маленьких территорий, потому что он физически обособлен. Представим себе лучше обширную популяцию, в которой не происходи! существенных перемещений, так что ее члены больше похожи на своих непосредственных соседей, чем на более удаленных, несмотря на непрерывный интербридинг в масштабах всей области. Итак, возвращаясь к нашему рубежу, следует признать, что индивидуумы Око за око могут преодолеть его. Для этого лишь требуется небольшое локальное скопление таких индивидуумов, подобное тем, которые естественным образом возникают в природных популяциях. Око за око обладает способностью преодолевать рубеж и переходить на свою собственную сторону, даже если частота этой стратегии невелика. Как будто под этим рубежом имеется тайный проход. Однако дверца в этом тайном проходе пропускает индивидуумов лишь в одну сторону, т. е. существует некая асимметрия. В отличие от Ока за око стратегия Всегда отказываюсь, несмотря на то, что это настоящая ЭСС, не может использовать локальное скопление, для того чтобы преодолеть рубеж. Локальные скопления индивидуумов, использующих стратегию Всегда отказываюсь, в присутствии друг друга не только не процветают, но функционируют особенно Таким образом, хотя Око за око лишь с большими оговорками можно отнести к категории ЭСС, она обладает некой стабильностью более высокого порядка. Что это может означать? Конечно, стабильность-это стабильность. Однако здесь мы имеем в виду очень большой промежуток времени. Всегда отказываюсь в течение длительного времени сопротивляется инвазии. Но если прождать достаточно долго, быть может, тысячи лет. Око за око в конечном счете достигнет численности, требуемой для того, чтобы перешагнуть через рубеж, и популяция сделает это одним рывком. Обратного, однако, не произойдет. Стратегия Всегда отказываюсь, как мы видели, не может извлечь выгоду из образования скоплений, так что она не пользуется преимуществами этой стабильности более высокого порядка. Око за око стратегия «добропорядочная», т. е. никогда не отказывается первой, и «незлопамятная», т. е. быстро забывает прошлые злодеяния. Здесь я хочу ввести еще один из будоражащих воображение технических терминов Аксельрода: Око за око «независтлива». Быть Эта ошибка затрагивает игры лишь определенных типов. В теорий игр различают игры «с нулевой суммой» и «с ненулевой суммой». В играх с нулевой суммой выигрыш одного игрока сопровождается проигрышем другого. К играм этого типа относятся шахматы, поскольку цель каждого игрока состоит в том, чтобы выиграть, т.е. заставить другого игрока проиграть. Однако Парадокс заключенных — это игра с ненулевой суммой. В ней участвует банкомет, выплачивающий деньги, и два игрока, объединившись, могут отправиться в банк, весело смеясь над ним. Последняя фраза заставляет меня вспомнить восхитительную строчку Шекспира: Генрих VI, ч. 2 В том, что называют гражданскими «спорами», на самом деле часто имеется широкий простор для кооперирования. То, что выглядит как конфронтация, можно, проявив немного доброй воли, превратить во взаимовыгодную игру с ненулевой суммой. Возьмем, например, бракоразводный процесс. Удачное супружество-это, безусловно, игра с ненулевой суммой, с бьющим через край взаимным кооперированием. Но даже после того, как брак распадется, имеются всевозможные причины, по которым супружеская пара могла бы выиграть, продолжая кооперироваться и рассматривая свой развод также как игру с ненулевой суммой. Если даже они не считают благополучие своих детей достаточно веской причиной, то следовало бы подумать о том ущербе, который нанесут семейному бюджету гонорары двух адвокатов. Итак, вероятно, разумная и цивилизованная пара начнет с того, что отправится Увы, на самом деле этого никто не делает. Во всяком случае в Англии и до недавнего времени во всех пятидесяти штатах США закон или, что гораздо важнее, собственный профессиональный кодекс адвоката не разрешает им этого. Клиентом данного адвоката может быть только один из супругов. Другому отказывают с порога, и он либо остается без юридической помощи, либо вынужден обратиться к другому адвокату. Вот тут-то и начинается комедия. В разных комнатах, но в один голос, оба адвоката немедленно начинают рассуждать о «нас» и о «них». «Мы», как вы понимаете, относится не ко мне и моей жене: «мы»— это я и мой адвокат, а «они»-моя жена и ее адвокат. Когда дело передается в суд, то оно регистрируется под названием «Смит Злополучные супруги втянуты в игру с нулевой суммой. Для адвокатов, однако, дело Способ, который рекомендует Шекспир, слишком радикален. Пожалуй, проще было бы добиться изменения закона. Но большинство членов парламента — юристы по специальности, и по складу ума им ближе игра с нулевой суммой. Трудно представить себе более враждебную атмосферу, чем та, что царит в Британской палате общин. (На судебных заседаниях по крайней мере соблюдаются приличия при прениях сторон. Им и следует это делать, ибо «Мой ученый коллега и я» прекрасно сотрудничают и довольные направляются в банк.) Быть может, законодателей, действующих из самых лучших побуждений, и способных внять голосу совести адвокатов следовало бы обучить начаткам теории игр. Справедливости ради необходимо добавить, что некоторые адвокаты выступают в прямо противоположной роли, убеждая клиентов, испытывающих непреодолимое желание ввязаться в драку «с нулевой суммой», что им лучше было бы достигнуть в суде соглашения, которое принесло бы им ненулевую сумму. А что можно сказать о других играх, в которые мы играем? Какие из них относятся к играм с ненулевой, а какие-с нулевой суммой? И, поскольку это не одно и то же, какие аспекты жизни мы Футбол — игра с нулевой суммой. Во всяком случае обычно. Иногда он может превратиться в игру с ненулевой суммой. Так случилось в 1977 г. в Английской футбольной лиге (Ассоциация футбола, или соккера; другие игры, называемые футболом — рэгби. Австралийский футбол, Американский футбол, Ирландский футбол и т. и.-обычно также представляют собой игры с нулевой суммой). Команды, входящие в футбольную лигу, разбиты на четыре дивизиона. Клубы каждого дивизиона играют между собой, набирая очки за каждый выигрыш и каждую ничью в течение данного сезона. Находиться в первом дивизионе престижно, а также прибыльно для клуба, поскольку это обеспечивает большое число зрителей. В конце каждого сезона три клуба первого дивизиона, занявшие последние места, переводят на следующий сезон во второй дивизион. Такое перемещение, очевидно, рассматривается как ужасный удар судьбы, и чтобы избежать его, стоит затратить огромные усилия. Последняя игра в футбольном сезоне 1977 г. происходила 18 мая. Два из трех кандидатов на вылет из первого дивизиона уже были определены, но третий еще оставался под вопросом. Это определенно должна была быть одна из трех команд: Сандерленд, Бристоль или Ковентри. Таким образом, этим трем командам было за что бороться в ту субботу. Сандерленд играла против четвертой команды (пребывание которой в первом дивизионе не подвергалось сомнению), а Бристоль и Ковентри играли друг против друга. Было известно, что если Сандерленд проиграет, то командам Бристоль и Ковентри достаточно закончить игру вничью, чтобы остаться в первом дивизионе. Если же Сандерленд выиграет, то либо Бристоль, либо Ковентри будет переведена из первого дивизиона. Две решающие игры должны были проходить одновременно. Однако фактически игра Бристоль-Ковентри началась на пять минут позднее. Поэтому результаты игры с участием команды Сандерленд стали известны до окончания игры Бристоль-Ковентри. Это и послужило завязкой всей дальнейшей сложной истории. Большая часть игры между командами Бристоль и Ковентри проходила, выражаясь языком современных спортивных комментаторов, «в быстром темпе», а по временам бурно; это была увлекательная (если вы любите подобные зрелища) борьба, в которой успех все время переходил от одной команды к другой. В результате нескольких блестяще забитых голов с обеих сторон счет матча к восемнадцатой минуте был 2:2. Затем, за две минуты до конца игры, пришло известие с другого поля, что Сандерленд проиграл. Немедленно тренер команды Ковентри передал эту новость на гигантское светящееся электронное табло, находящееся в конце поля. Очевидно, что все 22 игрока умели читать и все они поняли, что им теперь незачем надрываться. Обеим командам нужна была всего лишь ничья, чтоб избежать перевода во второй дивизион. И в самом деле теперь было бы совершенно неразумно изо всех сил стараться забивать голы, тем более, что при этом, отвлекаясь от защиты собственных ворот, они рисковали проиграть и в конечном счете оказаться во втором дивизионе. Обе команды стали настойчиво стремиться сделать ничью. Приведу слова того же комментатора: «Болельщики, которые несколько секунд назад, когда Дог Гиллис на 80-й минуте забил гол в ворота Ковентри, сравняв счет. были злейшими врагами, внезапно объединились в дружном ликовании. Судья Рон Чаллис беспомощно наблюдал за игроками, лениво гонявшими мяч по полю». То, что было ранее игрой с нулевой суммой. вдруг, в результате сообщения. поступившего из внешнего мира превратилось в игру с ненулевой суммой. Пользуясь принятой нами выше терминологией, как по волшебству, появился внешний «банкир» и это позволило обеим командам, Бристоль и Ковентри, извлечь выгоду из одного и того же исхода игры — из ничьей. Зрелищные виды спорта, такие как футбол, обычно представляют собой игры с нулевой суммой, и по весьма веской причине. Зрителям гораздо интереснее смотреть на игроков, неистово борющихся друг с другом за победу, чем наблюдать, как они дружески достигают молчаливого согласия. Однако реальная жизнь, будь то жизнь человека или растений и животных, учреждалась не для того, чтобы развлекать зрителей. Многие ситуации в подлинной жизни, в сущности, мало чем отличаются от игры с ненулевой суммой. Природа нередко выступает в роли «банкомета», так что индивидуумы могут извлекать выгоду из успехов друг друга. Им нет нужды повергать на землю противников для того, чтобы достигнуть благополучия. Не отступая от основных законов эгоистичного гена, мы можем видеть, как кооперирование и взаимопомощь способствуют процветанию даже в мире, в котором преобладает эгоизм. Мы можем убедиться, что добрые парни могут финишировать первыми (в аксельродовском смысле). Однако все это реализуется лишь в случае Даже если число партий в игре точно не известно, в реальной жизни часто возможно из статистических соображений высказать То простое различие, которое делается между одноразовым Парадоксом заключенных и игрой Итерированный Парадокс заключенных в математике, слишком просто. Следует ожидать, что каждый из игроков будет вести себя так, как если бы он был способен вновь и вновь оценивать, сколько еще времени будет продолжаться игра. Чем выше окажется его оценка, тем дольше он будет играть в соответствии с математическим ожиданием для настоящей итерированной игры; иными словами, он будет более добрым и менее завистливым, с большей готовностью будет прощать. Чем короче по его оценке будет игра, тем больше будет он склонен играть в соответствии с математическими ожиданиями одноразовой игры: он будет вести себя непорядочно и проявлять злопамятность. Аксельрод живо обрисовал картину того, какое важное значение может иметь тень будущего, на примере замечательного феномена, возникшего во время Первой мировой войны — так называемая система «живи и дай жить другим». Он воспользовался для этого исследованиями историка и. социолога Тони Ашуэрта (Tony Ashworth). Хорошо известно, что на Рождество английские и немецкие войска братались и пили вместе на ничейной земле. Менее хорошо известно, но, по-моему, интереснее, то, что, начиная с 1914 г., по всем линиям фронта в течение по меньшей мере двух лет процветали неофициальные и необъявленные пакты о ненападении, т. е. имела место своего рода система «живи и дай жить другим». Рассказывают, что один из старших английских офицеров при посещении окопов был поражен, увидев немецких солдат, расхаживающих позади своих траншеи на расстоянии ружейного выстрела от англичан. «Наши солдаты, казалось, их не замечали. Я решил про себя покончить с такими вещами, когда мы займем эти позиции; этого нельзя допускать. Эти люди, по-видимому, не осознавали, что идет война. Обе стороны, очевидно, придерживались политики „живи и дай жить другим“. Теория игр и Парадокс заключенных в те дни еще не были придуманы, но, оглядываясь назад, можно ясно видеть, что происходило, и Аксельрод дает прекрасный анализ. В окопной войне тех времен тень будущего для каждого взвода была длинной. Это означает, что каждая окопавшаяся группа английских солдат, по всей вероятности, могла ожидать, что ей предстоит долгие месяцы видеть перед собой все ту же окопавшуюся группу немецких солдат. Кроме того, рядовые солдаты не имели никакого представления о том, когда они двинутся с места и произойдет ли это вообще; армейские приказы пользуются дурной славой как произвольные, непостоянные и непонятные для тех, к кому они обращены. Тень будущего была достаточно длинной и достаточно неопределенной для того, чтобы способствовать развитию кооперирования по типу стратегии Око за око. Разумеется, в том случае, когда ситуация соответствовала игре в Парадокс заключенных. Напомню, что игра может считаться настоящим Парадоксом заключенных лишь в том случае, если платежи можно расположить в определенной последовательности по их рангу. Обе стороны должны предпочитать взаимное кооперирование (КК) взаимному отказу (00). Отказ в том случае, когда другая сторона кооперируется (ОК), даже еще лучше, если это сходит с рук. Кооперирование, когда другая сторона отказывается (КО), хуже всего. Взаимный отказ — вот чего хотелось бы генеральному штабу. Они хотят, чтобы их бравые парни при каждой представившейся возможности сажали в калошу всех Джерри (или Томми). Взаимное кооперирование, с точки зрения генералов, было нежелательно, так как не помогало им выиграть войну. Однако оно было в высшей степени желательно с точки зрения отдельных солдат обеих сторон. Они не хотели быть убитыми. Можно предположить — и это обеспечивает выполнение других условий, связанных с выплатами и необходимых для того, чтобы превратить эту ситуацию в настоящий Парадокс заключенных — что солдаты, вероятно, были согласны с генералами, предпочитая выиграть войну, а не проиграть ее. Однако каждый отдельный солдат не стоит перед таким выбором. Исход всей войны вряд ли существенно зависит от того, что делает данный солдат как некий индивидуум. Взаимное кооперирование с конкретными неприятельскими солдатами, стоящими против вас за ничейной полосой земли, безусловно влияет на вашу собственную судьбу, и оно, разумеется, гораздо предпочтительней взаимных отказов, несмотря на то, что вы — возможно, из патриотических чувств или подчиняясь дисциплине — в общем предпочли бы отказаться (ОК), если бы вам это могло сойти с рук. Создается впечатление, что данная ситуация действительно представляла собой настоящий Парадокс заключенных. Следовало ожидать, что при этом возникнет нечто вроде стратегии Око за око; так оно и случилось. Локально стабильной стратегией в каждой отдельной части линии окопов не обязательно должна была быть сама Око за око; Око за око это одна из семейства добропорядочных, отвечающих ударом на удар, но незлопамятных стратегий, которые все, если и не стабильны технически, то по крайней мере могут противостоять инвазии, раз уж они возникли. В одной современной работе описана, например, стратегия Око за три ока, возникшая на неком локальном участке. По ночам мы выходим из окопов… Группы немецких солдат в ночное время также работают вне окопов, так что стрелять считается дурным тоном. Чрезвычайно скверная штука — винтовочные гранаты. Упав в окоп, они могут убить 8–9 человек… Но мы никогда не пускаем в ход свои гранаты, пока немцы не поднимут слишком большого шума, так как по их системе возмездия на каждую нашу гранату они посылают в нашу сторону три. Для каждой стратегии, относящейся к семейству Око за око, важно, чтобы игроки несли наказание за отказ. Угроза возмездия постоянно должна присутствовать. Демонстрации способности отомстить играли заметную роль в системе «живи и дай жить другим». Меткие стрелки с обеих сторон демонстрировали свою смертоносную виртуозность, стреляя не во вражеских солдат, а в неодушевленные мишени вблизи этих солдат — метод, используемый также в вестернах (например, когда выстрелом гасят пламя свечи). По-видимому, никогда так и не будет получено удовлетворительного ответа на вопрос о том, зачем две первые действующие атомные бомбы были использованы — несмотря на решительные протесты физиков, ответственных за их создание — для разрушения двух городов, вместо того, чтобы продемонстрировать их действие каким-то эффектным способом, аналогичным «расстреливанию» свечей. Одна из важных черт стратегий типа Око за око состоит в том, что они незлопамятны. Это, как мы видели, помогает демпфировать то, что могло бы превратиться в длительную изнуряющую череду взаимных обвинений. О том, как важно подавить, стремление к ответному удару, ярко свидетельствует следующее воспоминание одного английского (в этом не оставляет никаких сомнений первая же фраза) офицера: «Я пил чай во взводе А, когда мы услыхали громкие крики и пошли узнать, в чем дело. Мы увидели наших собственных и немецких солдат, которые стояли друг против друга на своих брустверах. Внезапно начался обстрел, не причинивший, однако, никакого вреда. Естественно, обе стороны попрятались в окопы, причем наши солдаты начали поносить немцев. И вдруг какой-то храбрый немец выскочил на парапет и прокричал: «Мы очень сожалеем о случившемся; мы надеемся, что никто не пострадал. Мы не виноваты — это проклятая прусская артиллерия». Аксельрод замечает, что это извинение «выходит далеко за рамки поступка, предпринятого просто с целью предотвратить отмщение. Оно отражает нравственное сожаление о том, что было нарушено взаимное доверие, и беспокойство о возможных жертвах». Безусловно, это был очень храбрый немец, заслуживающий восхищения. Аксельрод подчеркивает также важную роль предсказуемости и соблюдения ритуала для поддержания стабильности взаимного доверия. Приятным примером служит «вечерний выстрел», производившийся английской артиллерией всегда в точно определенное время и на определенном участке линии фронта. По словам одного немецкого солдата: «Выстрел раздавался в семь часов-с такой точностью, что по нему можно было проверять часы… Он всегда был направлен в одну цель, его дальность была всегда одинакова, он никогда не отклонялся ни вправо, ни влево, точно попадая в цель, без перелета или недолета… Находились даже любознательные люди, которые выползали из окопов… незадолго до семи часов, с тем чтобы увидеть взрыв». Совершенно то же самое проделывала немецкая артиллерия, о чем свидетельствует рассказ с английской стороны: «Они (немцы) были так точны в выборе целей, времени и числа выстрелов, что… полковник Джонс… знал с точностью до минуты, куда упадет следующий снаряд; его расчеты были очень точны и он был способен идти на то, что непосвященным штабным офицерам казалось большим риском, поскольку знал, что обстрел закончится раньше, чем он дойдет до обстреливаемого участка». Аксельрод отмечает, что такой «ритуал несерьезной и ставшей привычной стрельбы имел двоякий смысл: высшему командованию он демонстрировал боевой дух, но противнику говорил о мире». Система «живи и дай жить другим» могла бы быть разработана путем переговоров между здравомыслящими стратегами, торгующимися за круглым столом. Однако этого не произошло. Она развивалась в результате ряда локальных соглашений, через реакции людей на Мы, конечно, хорошо знакомы с идеей бессознательных стратегов или по крайней мере стратегов, сознание которых, если оно у них существует, не имеет значения. Страницы этой книги переполнены бессознательными стратегиями. Программы Аксельрода служат превосходной моделью того, как мы на протяжении всей этой книги представляли себе животных и растения, да в сущности и гены. Поэтому естественно спросить, не приложимы ли его оптимистичные заключения — об успехе независтливой, незлопамятной добропорядочности — также и к Природе. Да, конечно, приложимы. Единственные условия состоят в том, что Природа должна иногда устраивать игры в духе Парадокса заключенных, что тень будущего должна быть длинной и что ее игры должны быть играми с ненулевой суммой. Эти условия определенно выполняются во всех царствах живых существ. Никто никогда не станет утверждать, что бактерия является сознательным стратегом, а между тем паразитические бактерии, по-видимому, непрерывно играют со своими хозяевами в Парадокс заключенных, и нет никаких причин, почему бы нам не применять аксельродовские прилагательные — Незлопамятные, Независтливые и тому подобные — к их стратегиям. Аксельрод и Гамильтон указывают, что бактерии, которые в обычных условиях безобидны или полезны, могут стать вредными и даже вызывать у раненых сепсис с летальным исходом. Врач в таких случаях, вероятно, скажет, что «природная сопротивляемость» организма понизилась в результате травмы. Возможно, однако, что истинная причина как-то связана с играми типа Парадокс заключенных. А нет ли в этом какой-то выгоды для бактерий, которые в другое время не дают себе воли? В игре между человеком и бактериями «тень будущего» обычно бывает длинной, поскольку ожидаемая продолжительность жизни человека от любой данной начальной точки в норме исчисляется годами. Но если человек серьезно ранен, то он способен обеспечить своим бактериальным гостям гораздо менее привлекательную тень будущего. Соответственно отказ представляется гораздо более заманчивым выбором, чем взаимное кооперирование. Нет нужды напоминать, что при этом отнюдь не имеется в виду, что бактерии придумывают все это в своих противных маленьких головках! Отбор, действуя на бесчисленные поколения бактерий, вероятно, выработал у них неосознанный эмпирический прием, действующий чисто биохимическими путями. Растения, согласно Аксельроду и Гамильтону, могут даже мстить, но безусловно опять-таки бессознательно. Между инжирным деревом и насекомыми, фиговыми оплодотворителями, существует тесное кооперирование. Инжир, который мы едим — это на самом деле не плод. На одном его конце есть крошечное отверстие, и если проникнуть в это отверстие (для того, чтобы это сделать, надо быть таким же маленьким, как фиговый оплодотворитель — к счастью, он слишком мал, чтобы его можно было заметить, когда мы едим инжир), то станет видно, что его стенки выстилают сотни маленьких цветочков. Инжир-это темная закрытая оранжерея для цветков и закрытая камера для опыления. При этом опыление способен произвести только фиговый оплодотворитель. Таким образом, дерево, приютив насекомых, извлекает из этою для себя выгоду. А что же получают фиговые оплодотворители? Они откладывают свои яйца в некоторые из крохотных цветков, которыми затем питаются личинки, и опыляют другие цветки внутри того же инжира. Для насекомых «отказаться» означало бы откладывание яиц в слишком большое число цветков в одной инжирине при опылении слишком малого их числа. Но как могло бы инжирное дерево отомстить за это? Согласно Аксельроду и Гамильтону: «Оказалось, что во многих случаях, когда фиговый оплодотворитель, проникнув в незрелый инжир, не опыляет достаточное число цветков, т. е. не обеспечивает образования семян, а вместо этого откладывает яйца почти во все цветки, дерево прерывает развитие инжира на ранней стадии. В результате все потомство насекомого гибнет». Причудливый пример того, что, по-видимому, можно считать стратегией Око за око в природе, обнаружил Эрик Фишер у гермафродитного вида рыб — морского окуня. В отличие от человека у этого вида пол данного индивидуума не определяется хромосомами в момент зачатия. Каждый индивидуум способен выступать в роли как самки, так и самца. Во время нереста в каждом отдельном случае данный индивидуум может продуцировать либо икру (яйца), либо молоки (сперму). Морской окунь образует моногамные пары, причем партнеры поочередно выступают в роли то самца, то самки. Допустим теперь, что какая-то одна рыба «предпочла» бы, если ей это удастся, все время выступать в роли 'самца, поскольку это обходится дешевле. Иными словами, индивидуум, которому удалось бы убедить своего партнера большую часть времени играть роль самки, воспользовался бы всеми плодами «ее» экономического вклада в яйца, тогда как сам «он» сберег бы часть своих ресурсов и смог использовать их иначе, например спариваясь с другой рыбой. На самом деле Фишер обнаружил у окуней систему довольно строгой очередности. Именно этого следовало ожидать, если они придерживаются стратегии Око за око. А это достаточно правдоподобно, поскольку игра, в которую они играют — это, по-видимому, настоящий Парадокс заключенных, хотя и в несколько усложненном варианте. Выложить карту Кооперируюсь означает выступить в роли самки тогда, когда настает ваша очередь быть самкой. Пытаться выступать в роли самца, когда надлежит быть самкой, равносильно тому, чтобы выложить карту Отказываюсь. Отказ грозит возмездием: партнер может отказаться от выполнения роли самца в следующий раз, когда придет «ее» (его?) очередь сделать это, или же «она» может просто прекратить все отношения. Фишер и в самом деле наблюдал, что пары, в которых роли самца и самки распределились неравномерно, обычно распадаются. Социологи и психологи иногда задают вопрос: почему доноры (в таких странах, как Англия, где за это не платят) отдают свою кровь? Мне трудно поверить, что в основе этого лежит некий расчет на ответную услугу или элементарный эгоизм в завуалированной форме. Ведь донорам, регулярно сдающим кровь, не положено никаких привилегий в случае, если им самим понадобится переливание крови. Им даже не выдают маленьких золотых звездочек, которые они могли бы носить. Быть может, я наивен, но мне очень хотелось бы рассматривать все это как пример подлинного бескорыстного альтруизма. А вот летучие мыши-вампиры, которые делятся друг с другом кровью, очевидно, вполне укладываются в модель Аксельрода. Мы узнали об этом из работы Дж. Уилкинсона (G. S. Wilkinson). Вампиры, как хорошо известно, питаются кровью. Охотятся они ночью, и добывать пищу им нелегко, но если они находят жертву, то обычно крови бывает достаточно. С наступлением рассвета некоторые индивидуумы, которым не повезло, возвращаются ни с чем, тогда как другие, которым удалось найти жертву, часто насасывают крови с избытком. В следующий раз счастье может улыбнуться другим. Такая ситуация открывает возможности для некоторого взаимного альтруизма. Уилкинсон обнаружил, что те индивидуумы, которым посчастливилось в какую-то одну ночь, действительно иногда делятся кровью со своими менее удачливыми собратьями, отрыгивая им некоторое ее количество. Из 110 таких случаев, которые наблюдал Уилкинсон, в 77 легко было понять, что кровь отрыгивали матери для своих детенышей, а во многих других случаях вампиры делились кровью с генетически близкими родственниками. Тем не менее оставалось еще несколько эпизодов, когда кровь отрыгивалась для неродственных летучих мышей, т. е. были случаи, которые нельзя объяснить, ссылаясь на «голос крови». Характерно, что в этом участвовали индивидуумы, которые часто устраивались рядом на дневной отдых, т. е. у них была полная возможность многократно общаться друг с другом, как это требуется для Итерированного Парадокса заключенных. Но выполнялись ли другие требования игры в Парадокс заключенных? На рис. 4 изображена платежная матрица, которая получилась бы в случае выполнения этих требований. Действительно ли экономика вампиров соответствует этой матрице? Уилкинсон изучал скорость потери веса у голодающих вампиров. На основании полученных данных он рассчитал, за сколько времени погибнет от голода сытый вампир, вампир с пустым желудком и все промежуточные ситуации. Это позволило ему выразить стоимость крови в «валюте», единицей которой служит час продленной жизни. Он обнаружил, и это неудивительно, что «обменный курс» может быть разным и зависит от того, насколько голодна летучая мышь. Данное количество крови продлевает жизнь сильно изголодавшемуся вампиру на больший срок, чем менее голодному животному. Иными словами, хотя акт дарения крови повысил бы шансы донора на гибель, это повышение невелико по сравнению с повышением шансов реципиента на выживание. Таким образом, переходя на язык экономики, следует признать, что вампиры выполняют правила игры в Парадокс заключенных. Кровь, которую отдает донор, представляет для нее (социальные группы у вампиров состоят из самок) меньшую ценность, чем то же количество крови для реципиента. В свои неудачные ночи животное в самом деле очень сильно выигрывает, получив в дар порцию крови. Но в удачные ночи оно выиграет лишь немного, отказавшись поделиться кровью (если ей удастся проделать это). «Если удастся», конечно, имеет какой-то смысл лишь при условии, что летучие мыши используют ту или иную стратегию типа Око за око. Но выполняются ли при этом другие условия, необходимые для эволюции стратегии Око за око? В частности, способны ли эти летучие мыши распознавать друг друга как отдельных индивидуумов? В эксперименте, проведенном на летучих мышах, содержащихся в неволе, Уилкинсон доказал, что они к этому способны. Эксперимент состоял в следующем' одну из летучих мышей отделяли на одну ночь от других и не давали ей есть, тогда как всех остальных кормили. Несчастную изголодавшуюся летучую мышь Уилкинсон вновь переносил к другим, а затем наблюдал, даст ли ей кто-нибудь поесть и если да, то кто именно. Эксперимент проводился много раз и все летучие мыши по очереди оказывались в роли голодающей жертвы. Ключевой момент состоял в том, что эта популяция содержавшихся в неволе вампиров представляла собой смесь двух отдельных групп, отловленных в пещерах, которые находились на расстоянии многих километров одна от другой. Если вампиры способны распознавать своих приятелей, то голодавшую мышь должны были бы кормить только индивидуумы, происходящие из одной с ней пещеры. Практически именно так и было на самом деле. Всего наблюдалось 13 случаев кормления голодавшего животного. В 12 из этих 13 случаев самка-донор была «старым приятелем» голодавшей жертвы, пойманной в той же пещере. Конечно, нельзя исключить возможность совпадения, однако, согласно проведенным вычислениям, шансы на это составляют менее чем 1:500. Мы вправе сделать заключение, что вампиры определенно предпочитали кормить старых друзей, а не чужаков из другой пещеры. О вампирах существует множество легенд. В «черных романах» викторианской эпохи они фигурируют как темные силы, наводящие ужас но ночам, губящие невинные живые существа, высасывая из них жизненные соки, просто чтобы утолить жажду. Если добавить к этому другие мифы викторианской эпохи — о Природе с окровавленными клыками и когтями — то не предстанут ли перед нами вампиры как реальное воплощение глубочайших страхов перед миром, где правит эгоистичный ген? Что касается меня, то я отношусь скептически ко всем мифам. Если мы в том или ином конкретном случае хотим знать правду, нам ее следует искать. Дарвинизм дает нам не детальную информацию об отдельных организмах, а нечто более глубокое и ценное — понимание принципа. Если уж нам никак не обойтись без мифов, то реальные факты о вампирах могли бы сложиться в иную назидательную повесть. Для самих этих животных дело не ограничивается тем, что «кровь не вода». Они способны подняться выше родственных уз, создавая собственные прочные братства, верность которым скреплена кровью. Вампиры могли бы подтолкнуть к созданию нового успокоительного мифа — мифа о равноправном взаимном сотрудничестве. Они могли бы выступить в роли провозвестников благословенной идеи, что добрые парни, несмотря на украшающие их шлем эгоистичные гены, могут финишировать первыми. |
||
|