最早在1979年,有个叫做rebort axelrod的家伙,组织了60多个搞对策论的,做了这个模拟。前两次的胜利者的作者叫做Anatol Rapaport,他的“tit for tat”成为“多回合囚徒的困境”的最佳策略的基础。在那之后,又有一系列的模拟,而且后来使用了基因算法,“最后一次”里程碑式的论文发表于1995年, 叫做"How to Cope with Noise in the Iterated Prisoner's Dilemma" ,作者是Wu, Jianzhong and Robert Axelrod,(由名字看,wu很可能是大陆出来的中国人,不知哪里高就)。
在"prisoner's dilemma"中,“玩家”的地位是对称的,偏好曲线相同,而且“基本上”是一个“零和”(zero-sum)游戏,这是比较传统的方式。在“多回合”的模型中,没有“one night stand”,这个可能跟axelrod的本行--国际政治--有关,很明显,这不是一个危机导向的策略。