作者:Anonymous 在 罕见奇谈 发贴, 来自 http://www.hjclub.org
“经济人”的文化信仰
秋实
博弈论中,一般都只把博弈者看作只追求自身利益最大化的个体,此即人们
常说的所谓“经济人假设”。一些朋友据此认为,博弈论的“经济人假设”,
只讲赤裸裸的利益,否认道义、价值观和羞耻感等非利益因素的作用。此种
看法,其实大谬不然。博弈论发展到现在,早就从“大众定理”等一系列重
要结果中发现,许多博弈都有无穷多个与个人利益最大化相容的解。不同的
解,由性质极不相同的对彼此行为的预期来支持。它们当中究竟那一个会成
为社会博弈的结果,并不是单靠个人利益最大化就可以决定。这还取决于社
会上通行的行为预期,后者又与行为规则、价值观、道德感、文化模式等等
因素,有着千丝万缕的联系。
且让我们用一个简单例子来说明这一点。这个例子,曾被道格拉斯·诺思
(Douglass C. North)和伯瑞·万格斯特(Barry R. Weingast)当作一个有用
的参照系,用以探讨英国光荣革命后的制度演变;后来万格斯特在《民主与
法治的政治基础》一文中又加以运用,以说明现代政治理论中一些颇为令人
迷惑的问题,如文化观念的作用、精英与大众的关系等等。道格拉斯·诺思
其人,相信很多人都很熟悉,他是新经济史学的创始人,1993年的诺贝尔经
济学奖获得者。伯瑞·万格斯特则是斯坦福大学政治科学系的资深教授,在
政治组织和政治制度的研究上造诣很深。
在一个法治社会中,政府必须有足够的威权,可以运用强制力来维护必要的
法治秩序。但是一个拥有足够威权和强制力的政府,又很容易利用这种威权
和强制力,来侵犯个人的合理权利。怎样才能让政府既有执法威权而又不滥
用权力呢?这就是伯瑞·万格斯特所称的“有限政府”问题。
在下面这个简单博弈中,有三个博弈者。一个是统治者,称为S,他可以选
择两个策略:侵犯和不侵犯。另外两个是被统治者,分别称为A和B,每个人
也可以选择两种策略,顺服与抵制。
不同的策略组合可以产生不同的利益分配,如上图右边报偿矩阵所示。比如,
当S选择侵犯,A和B都选择顺服时,S得益为8,A和B之得益分别为2。假如A
和B任何一人选择抵制,而另一人不抵制,则那个单独抵制之人的得益,将
会减少一单位,而其他人得益不变。然而当两个人同时抵制时,A和B之得益
将会增加到7,而S之得益则减少为0。
我们有意这样选择利益数字,使得S不侵犯、A和B不抵制的情况,成为一种
利益总和最大化的状态。其他任何一种策略组合,都会导致利益总和减少。
仔细观察一下上图中的报偿表,就会发现,在S选择侵犯的条件下,A和B的
个人利益极大化策略,取决于他对别人行为的预期。假如A预期B会进行抵制,
那么A的最佳策略也是抵制;然而假如A预期B不抵制而顺服,则A的最佳策略
也是顺服。因此,在这个A和B的子博弈中,有两个源自个人利益最大化的平
衡点:A、B两人都顺服,或两人都抵制。
与这两个平衡点相应,整个博弈也有两个源自个人利益最大化的平衡点(学
名叫作子博弈完全均衡 sub-game perfect equilibrium): 其一,S侵犯,
A和B顺服;其二,S不侵犯,A和B顺服。
第一个均衡点非常好理解:任何一方都单独偏离此点,都会导致其自身的个
人利益受损。既然A和B都顺服,则S显然没有必要变侵犯为不侵犯,那样将
使其个人利益由8降为2。而A和B也不愿意单独去抵制,那样将使得抵制者的
个人利益降低一个单位。
第二个均衡点,S不侵犯,A和B顺服的情况,稍微有点复杂。乍一看,既然
A和B都顺服,那么S选择侵犯,不是可以使其自身个人利益由2提高到8吗?
然而在这里,A和B的顺服是有条件的。那就是,如果S不侵犯,就顺服;如
果S侵犯,就抵制(如前所述,此时两人都抵制,也是子博弈中个人利益最大
化的平衡点)。预见到此,S选择侵犯只会导致A和B的抵制,反而使其自身个
人利益降低至0。于是不侵犯便是最佳选择。
两个均衡点,虽然A和B在均衡态中的正常行为都是顺服,他们关于彼此在均
衡态以外之行为的预期,则大不相同。支持第二个均衡点的,正是这样一种
预期:一旦S作出侵犯,A不仅预期B一定会抵制,而且知道B也预期A一定会
抵制,等等。简言之,抵制统治者对个人的侵犯,成为A和B的共识。在诺思
和万格斯特看来,这种共识不是别的,正反映了流行在今天西方社会中某种
关于公民权利神圣不可侵犯的意识,或者如其他一些学者所言,是一种公民
文化。
与此不同,在第一种均衡点中,抵制统治者对个人的侵犯,并未成为A和B的
共识。这也许是因为A和B根本就没有权利意识,所谓“普天之下,莫非王土;
率土之滨,莫非忘臣;雨露雷霆,莫非王恩”是也。也可能是因为A和B之间
因缺乏沟通理解而弥漫着一股犬儒主义的无力感,只好得过且过。还可能是
A和B对什么构成不可侵犯的个人权利等等,有着极不相同的理解和看法,因
而无法协调其个人行动,等等。
如果我们把不同的均衡点看作不同的制度选择,则可以说,决定人们行为预
期的价值观念和文化信仰,正是社会制度选择中一个决定性因素。
这个例子如此简单,看起来不过在博弈论与文化价值因素之间建立了某种联
系而已,似乎没有揭示任何超越常识的东西。可能许多人怀疑,花费功夫去
仔细分析这样的例子,究竟有什么意义?
在诺思和万格斯特的分析中,此例只是一个最简单的出发点。他们接着问了
一个较深的问题:历史上,一个社会究竟是如何从第一种均衡点过渡到第二
种均衡点的?这正是他们用博弈论分析光荣革命的用意所在。他们的分析挺
有意思,以后有时间再介绍。
为什么反抗暴政是公民义务?
秋实
上一回我在《;“经济人”的文化信仰》谈到,单靠个人自身利益最大化的
理性计算,无法决定社会博弈的结果。每一种不同的社会博弈结果,其实都
是靠不同的文化信仰来支持的。那篇文章所介绍的统治者--被统治者博弈,
两个被统治者A与B之间,其实并不存在利益冲突,只存在一个协调问题:当
统治者侵犯其权益的时候,个人利益最大化的均衡点,既可以是两人都反抗,
又可以是两人都顺服。究竟那一个均衡点成文社会博弈的结果,取决于哪一
种行为方式会成为他们共同的预期或信仰,即他们是否具有公民权利神圣不
可侵犯的共识。这是一种权利观念,然而却不要求个人将反抗暴政看作必须
履行的道德义务。
本文想用一个例子说明,更进一步的道德义务的观念,也是可以从个人只关
心自身利益的最大化行为中推导出来的。
现在我们将上文的模型稍加变动,加进一个稍微现实一点的因素:A和B可以
单独与统治者S结成联盟,默认甚至协助S对另一人的侵犯,并从中分享利益。
这个新的博弈,统治者S现在可以在不侵犯、联合A侵犯B、联合B侵犯A、既侵
犯A又侵犯B等四组行动中选择一个。被统治者A和B的可选择行动,仍然是顺服
和抵制两种。其报偿矩阵,如下图所示。
图中所选取的数字,具有这样一些性质:首先,S不侵犯,A和B不抵制,仍然
是社会利益总和最大化的状态,此时S得益为2,A和B得益分别为8。其次,一
次成功的侵犯,可从每个受侵犯者哪里多榨取到3个单位的利益,而受侵犯者
利益将减少6个单位(其中3个单位可看成由于生产率的下降等等而白白浪费掉
的社会死损失)。这样,如果S成功地侵犯A、B二人,则其利益增加6个单位。
如果他联合A侵犯B,则可从B榨取到3单位额外利益,但须将其中一单位分给A,
等等。第三,A与B两人都抵制,S利益将变成0,而A和B利益变成7,均较社会
最优状态时为少。
一眼可以看出,当S联合A侵犯B,或联合B侵犯A的时候,A、B两人中肯定有一
人可以从不抵制中得到好处,因此两人都抵制,已不再是相应子博弈中个人
利益最大化的平衡点。两个被统治者A与B之间,现在出现了利益的冲突。这
就是该博弈与前一博弈的最大区别。
由于这一利益冲突,S不侵犯,A和B不抵制的社会最优状态,已不可能成为一
次性博弈的均衡点。因为现在S完全可以肯定,当他选择联合A侵犯B,或选择
联合B侵犯A时,可以获得较多利益,而不会遇到A和B两人联合抵制,这样他
自然不会选择不侵犯任何人了。
于是,作为一次性博弈,现在只有三种可能的均衡点:1) S侵犯A和B,A和B均
顺从;2) S只侵犯A,A和B均顺从;3) S只侵犯B,A和B均顺从。有兴趣的朋友
不妨试着去证明这些确实是我前文中谈到的子博弈完全均衡。
这个结果是很自然的。实现社会最优状态,要求A和B联合抵制S对其中任何一
人的侵犯---即使你从这种侵犯中得到一时的好处,也要起而抵制。这种行为,
在一次博弈中,不可能是与个人利益最大化相容的。幸而在重复博弈中,情形
并非如此。
让此博弈无限重复,情况如何?一次性博弈的三种均衡点,仍然是重复博弈的
均衡点。但重复博弈还有其他无限多个新的均衡点,其中就包括S不侵犯、A和B
均不抵制的社会最优状态。比如下面这组策略,就可以使得这种社会最优态成
为个人利益最大化的均衡点:
S:如果发现A或B曾经不抵制对其中一人的侵犯,则侵犯A和B;否则,
就不侵犯任何人;
A:如果以前B曾经不抵制S之侵犯行为,则以后永远不抵制S的侵犯;
否则,只要S有侵犯行为,就加以抵制,无论这侵犯针对谁,也
无论自己能否从中得到好处;
B:如果以前A曾经不抵制S之侵犯行为,则以后永远不抵制S的侵犯;
否则,只要S有侵犯行为,就加以抵制,无论这侵犯针对谁,也
无论自己能否从中得到好处;
为什么说这些是符合个人利益最大化的策略呢?我们且考虑一下S企图联合A侵
犯B的情形。此时A的最佳策略是什么呢?与社会最优态相比,假如他抵制的话,
现时利益将损失一个单位,但以后各期利益不变;假如他不抵制而顺从,则他
现时利益将增加一个单位,但以后各期,B将用不抵制任何侵犯来报复A。S意
识到这点,其在此后各期的最优策略将是同时侵犯二人。这样,以后各期A的
得益反而将下降3个单位。由于长远损失超过现时得益,针对S联合A侵犯B的企
图,A的最佳策略将是抵制而不是顺从。
此组策略的一个重要特点就是,B以自己对以后各期S侵犯行为的不抵制,来惩
罚和报复A的顺从行为。“今天他们抓犹太人,我没有说话;明天他们抓共产党,
我没有说话;后天他们抓工会分子,我也没有说话;等到他们来抓我时,已经
没有人会为我说话了。” 这段常被人引用的语录,也可以看成此种惩罚机制
的写照。正是由于存在这种惩罚机制,才使得社会最优态有可能成为重复博弈
中符合个人利益最大化的均衡点。
不难看出,与前文中的社会最优均衡一样,抵制统治者对任何个人的侵犯,这
样一种公民权利神圣的观念,仍须成为A和B的共识。但本文的社会最优均衡,
还要求形成一个更进一步的新共识,这就是,抵制侵犯不仅被看成公民权利,
而且更被认为是A和B必须共同遵守的公民义务。一旦有人不遵守这个义务,就
会遭到其他人惩罚和报复----这种惩罚和报复,不一定是用强力加于顺从者之
上,而是指其他人会作出道义反应,会把他的顺从,视为出卖和背叛,鄙视其
人品,并且撤回在他遭难时施以援手的义务。万格斯特指出,洛克关于积极抵
制统治者侵犯的公民义务原则,正反映了这种观念。
观察历史,光荣革命之前的几千年里,这样的社会最优均衡,绝少出现。最常
见的稳定均衡,倒是统治者联合某个社会阶层,压榨其他社会阶层的情形 (即
前述第2、3种均衡)。而第1种均衡,即统治者同时压榨社会各主要阶层的情况,
历史上也曾间歇性地出现过多次,但都不稳定,导致造反动乱,很快又让位于
第2、3种均衡。
第1种均衡不稳定的原因在于,在A、B两人都受侵犯的情况下,两人都抵制,
也是符合个人利益最大化的均衡点。他们选择顺从,通常只因为不能确知别人
是否会同时选择抵制。假如A、B二人中,有一人突然不堪压迫,让愤怒压倒了
理性计算,根本不考虑成败,先行独自挺而走险,揭竿而起。这时另一人的最
佳选择,就是起而响应,因为在别人抵制的情况下,个人利益最大化的抉择就
是抵制。所以第1种均衡是不稳定的---它很容易因为其中一个博弈者一星半点
不理性的行为而被打破。
然而造反之后,常见的情形是回到均衡2或3,而不是社会最优均衡。为什么社
会最优均衡很难出现?
最优均衡所要求的公民义务,是一种道义观念和文化信仰。它只有在其他人都
持同样的道义观念时,才是与个人利益最大化一致的。这种与个人利益最大化
的一致性,仅仅只保证了此种道义观念,在一旦成为所有人的信仰之后,能够
自我维持下去,具有相当的稳定性。它并未保证,这种道义观念,会必然出现,
会在某个早上,突然成为全社会所有人的共识。
在第2、3种均衡当中,大家的共识是对统治者消极顺从。在这种情况下,单个
个人转而信仰公民义务的道义观念,是与其个人利益最大化相矛盾的。此时也
许有一些先知,一些很有献身精神或其他高贵品质的人,大力呼吁鼓吹此观念。
但在一般情况下,普通人也许从理智上觉得这种观念很好,却不会以此观念作
为自己的行为准则。原因很简单,他们不能确知其他人是否会这样做。换言之,
分散的个人行动无法协调其信仰。他们需要一种建立社会共识和集体信仰的协
调机制(coordination device)。
历史上,这样的协调机制可能因各种契机而出现。一场暴动、一次政变、一个
统治者的死亡、一位具有魅力的领袖人物出现、一份打动人心的宣言等等,可
能突然成为一种象征和旗帜,使得社会大众围绕此它,形成新的对彼此行为的
共同预期。要使这种新的共同预期转而成为稳定的公民权利和公民义务观念,
第一要将任何侵犯,包括新统治者对原来革命对象的侵犯,都看成是不合法的;
第二每个公民还须将公民权利和义务的地位看得足够高,高到神圣不可侵犯的
地步,任何人违背它,就会引起他们的强烈反应。提出新的理论,基于利益分
析的逻辑诉求,是必要的,然而却是不够的,因为他们唤不起这种强烈的情感
来。
达不到上述第一点,肯定会回到第2、3中均衡中去。达不到上述第二点,革命
也会以失败而告终。英国的光荣革命,是一个成功的例子。当初斯图亚特王朝
复辟后,国王先是在主张消极顺从的托利党人的合作下,压迫主张积极抵制的
辉格党人,后来又侵犯到了托利党人头上。1689年,托利党和辉格党人联合发
动政变,赶跑国王詹姆土二世。政变之后,共同受侵犯的经历,使得政见和利
益大相岐异的托利党和辉格党,在经过长时间的磋商之后,终于就如何界定国
王之侵犯行为、哪些权利属于神圣不可侵犯等问题,达成了共识,并通过了光
辉灿烂的《权利法案》。
作者:Anonymous 在 罕见奇谈 发贴, 来自 http://www.hjclub.org