Два хлопка одной ладонью или Эволюционная стратегия 3.0

«Ты можешь услышать хлопок двух ладоней, когда они ударяются друг о друга,  теперь покажи мне хлопок одной ладони». — Мокурай в точности решил повторить свой опыт с Тойо. В тот раз ему удалось на 3 года погрузить ученика в транс, при том, что деньги от его отца продолжали капать. Но светловолосый парень с санкритским именем Вась-я лишь таращился своими большими глазами, сквозь которые просвечивало само небо.
«Хлопок одной ладонью!» — Ученый сымитировал движение, уже расскаиваясь в том, что связался с этим варваром.
По лицу парня промелькнула тень понимания. Он неуверенно улыбнулся, потом кивнул каким то своим мыслям, мягко довернул правую ногу и в ухе Макурая взорвалось. Да, он первым на Островах услышал вторую редакцию прочтения этого популярного коана.
«Странные они какие-то» — Василий пожал плечами.  Афанасий Никитин подхватил под руку и со словами «Вечно ты влипаешь!, что он от тебя хотел-то?», потащил в его сторону рикш.



проблема

Допустим, что Око за око играет против стратегии, названной Наивный испытатель. На самом деле Наивный испытатель не участвовал в конкурсе Аксельрода, но тем не менее этот пример поучителен. Наивный испытатель в основном идентичен программе Око за око, с той разницей, что время от времени, скажем один раз за десять ходов, причем без всякой закономерности, он совершенно беспричинно играет Отказываюсь и требует 5 очков, причитающиеся ему за риск. До тех пор, пока Наивный испытатель не предпримет один из своих зондирующих отказов, оба игрока ведут себя в соответствии со стратегией Око за око. Однако внезапно, без предупреждения, скажем на восьмом ходу. Наивный испытатель отказывается. Око за око, разумеется, сыграла в этот раз Кооперируюсь, а поэтому получила 0 очков, как это положено Простаку. Наивный испытатель, казалось бы, добился успеха, заработав за этот ход 5 очков. Но своим следующим ходом Око за око «мстит». Она играет Отказываюсь, просто следуя заложенному в нее правилу копировать предыдущий ход противника. Тем временем стратегия Наивный испытатель, следуя правилу копировать противника, заложенному в нее самое, повторила ее ход — Кооперируюсь. В результате ей достается Штраф Простаку, т.е. 0 очков, тогда как Око за око получает высшую плату — 5 очков. Своим следующим ходом Наивный испытатель — довольно несправедливо, как можно подумать, — «мстит» за отказ стратегии Око за око. И такое чередование продолжается. При этом оба игрока получают в среднем по 2,5 очка за ход (среднее между 5 и 0). Это меньше, чем те верные 3 очка за ход, которые получают игроки, если они оба играют Кооперируюсь (кстати, это и есть причина введения того «дополнительного условия», которому не было дано объяснения на с. 188). Итак, когда Наивный испытатель играет против стратегии Око за око, оба выигрывают меньше, чем в игре Око за око против Ока за око. Если же игра идет между двумя Наивными испытателями, дела обоих обстоят еще хуже, так как серии взаимных отказов начинаются раньше.

Рассмотрим теперь еще одну стратегию, получившую название Раскаивающийся испытатель. Раскаивающийся испытатель сходен с Наивным испытателем, отличаясь от него лишь тем, что для запуска серии поочередных возмездии необходимо предпринимать активные шаги. Для этого ему нужна несколько более долгая «память», чем у стратегий Око за око или Наивный испытатель. Раскаивающийся испытатель запоминает, был ли его отказ спонтанным и привело ли это к быстрому возмездию. В этом случае он, «полный раскаяния», предоставляет своему противнику право на «один бесплатный удар», за которым не следует возмездия. Это означает, что серии взаимных возмездии пресекаются и самом зачатке. Если теперь продолжить воображаемую игру между стратегиями Раскаивающийся испытатель и Око за око, то обнаружится, что серии мнимых взаимных возмездии быстро прерываются. На протяжении большей части игры противники взаимно кооперируются, что обеспечивает им обоим большой выигрыш. Раскаивающийся испытатель играет более успешно против стратегии Око за око, чем Наивный испытатель, хотя и не так успешно, как Око за око против самой себя.

Можно быть более снисходительным, чем стратегия Око за око. Стратегия Око за два ока разрешает своим противникам два отказа подряд и только потом мстит. Это может показаться слишком милостивым и великодушным. Тем не менее Аксельрод установил, что если бы кто-то представил на рассмотрение стратегию Око за два ока, то она победила бы в турнире. Это обусловлено способностью данной стратегии избегать серии взаимных возмездии.
Таким образом, мы определили два качества выигрывающих стратегий: добропорядочность и способность к прощению. Это почти утопическое заключение, что добропорядочность и всепрощение окупаются, вызвало удивление у многих экспертов, которые пускались на всевозможные хитрости, предлагая стратегии, содержащие в себе скрытые элементы недобропорядочности; даже те, кто предложил добропорядочные стратегии, не решились на что-либо столь всепрощающее, как Око за два ока.
___________
завтра дам комментарий

3 комментария

avatar
Можно быть более снисходительным, чем стратегия Око за око. Стратегия Око за два ока разрешает своим противникам два отказа подряд и только потом мстит. Это может показаться слишком милостивым и великодушным. Тем не менее Аксельрод установил, что если бы кто-то представил на рассмотрение стратегию Око за два ока, то она победила бы в турнире. Это обусловлено способностью данной стратегии избегать серии взаимных возмездии.
если продолжить искать паралели в ветхом завете, то вполне можно их там найти

Слова Иисуса Христа «кто ударит тебя в правую щеку твою, обрати к нему и другую» (Мф. 5: 39) в образной форме выражают заповедь: на зло отвечать не злом, а добром. Суд же и наказание над сделавшим зло должно предоставить Господу. В основе этой заповеди находится непреложная вера во всеведение и всесилие Божие. Один Господь знает меру то, что надо нам претерпеть. «Не пять ли малых птиц продаются за два ассария? и ни одна из них не забыта у Бога.  А у вас и волосы на голове все сочтены. Итак не бойтесь: вы дороже многих малых птиц» (Лк. 12: 6 – 7). Если мы исполняем эту заповедь, то умножаем в мире добро. «Ибо такова есть воля Божия, чтобы мы, делая добро, заграждали уста невежеству безумных людей» (1 Пет. 2: 15).
  • T55M
  • 0
avatar
Не понимаю, зачем нужно многократно тестировать эти упражнения в кидалове. Система рейтингов (моделирующая общественное мнение (ака «репутация»)) разом сводит на ноль всё это хитрожопиеумие. Может, я чего не понял в этих играх? Чего там полезного, разъясните тупому.
avatar
разъясните тупому

разъясняю.

зачем нужно многократно тестировать эти упражнения в кидалове

ребеночек балуется — а ты ему раз и в голову лопатой, чисто не прощающий и справедливый.
ну, или в пробке кто тебя задел и помял крыло.

Система рейтингов (моделирующая общественное мнение (ака «репутация»)) разом сводит на ноль всё это хитрожопиеумие.

Сидит инженер какой, мост считает, а тут Ты.
«Зачем считать хитрожопо? надо чтоб крепкий был! а все эти ваши расчеты — один развод на бапки»




Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.