一、囚徒困境:理性决策与不理想的结局
个体的理性选择却导致了双方很不理想的结果,这就是“困境”所在。“囚徒困境”是指把一些非常普遍而有趣的情形简单化、抽象化,为我们探讨人们合作的形成及合作中的问题,提供了极为形象的解说方式。
囚徒的选择
在博弈论的所有案例和模型中,“囚徒困境”无疑是最著名的,甚至可以说,不谈“囚徒困境”,我们就无法谈博弈论,所以让我们就从两个囚徒的故事开始吧。
1950年,数学家塔克在担任斯坦福大学客座教授期间,给一些心理学家作讲演时,他用两个囚徒的故事将当时专家们正研究的一类博弈问题,作了形象化的解释。从此以后,类似的博弈问题便有了一个专门名称——“囚徒困境”。现在,“囚徒困境”已经广为人知,在经济学、伦理学、社会学、政治学、哲学乃至生物学等学科中,获得了极为广泛的应用。
“囚徒困境”的版本很多,现在被普遍使用的版本大致是下面这样:
两个作恶多端的歹徒在携枪准备作案时,被警察发现抓了起来。因为没有其他犯罪证据,警方只能以非法携带枪支的轻罪处罚他们。但是警方怀疑这两个人可能还犯有其他重罪,于是分别进行审讯。为了分化瓦解,警方告诉他们中的每一个:如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过会因为认罪态度较好,而比拒不交代要轻一些。
简单总结一下,两个囚徒面临的选择不外以下几种结果(为了更清楚地说明问题,我们给每种情况设定具体刑期):
如果两人都不坦白,警察便抓不到证据,只能以非法携带枪支罪而将二人各判刑1年;
如果其中一人招供而另一人不招,坦白者将被作为污点证人免于起诉,另一人将会被重判15年;
如果两人都招供,则两人都会因抢劫罪各判10年。“囚徒博弈”示意图如下所示:
在这种情形下,两个囚徒都可以作出自己的选择:或者背叛他的同伙,换取自己的从宽处理;或者与他的同伙合作,对警察的威逼利诱保持沉默。
两个聪明人的麻烦
这两个囚徒该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩得到的是对双方来说最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择,于是问题就这样开始了。我们假定两个人都十分精明,而且都只关心减少自己刑期,并不在乎对方被判多少年——这符合经济学中“理性人”的假定:人都是考虑个人利益最大化的。
囚徒甲会这样推理:
假如乙不招,我只要招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然也是招供为好。可见:无论乙招与不招,我的最佳选择都是招供,所以还是招了吧。
也就是说,如果你认为对方将选择与自己合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的,无论对方如何行动。
但是,相同的逻辑对另一个人也同样适用。因此,另一个人也将背叛而不管你如何做。
于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个人利益的选择。照博弈论的说法,这是他们双方的“优势策略”,也是本问题的唯一平衡点(即“纳什均衡”,关于这一点以后还要详细讨论)。
可是问题出现了:这样一来,两个囚徒将是双方背叛,只能一起坐上长达10年的牢,这比双方合作所能得到的“奖励”(只需短期服刑1年)差很多。也就是说,从个体的角度来说,背叛是最好的选择,但双方背叛会导致很不理想的结果,这就是“困境”。
为什么聪明的囚徒,却无法得到最好的结果?产生不良结局的原因是因为囚徒二人都基于自私(用经济学的术语,是“个体理性”)的角度开始考虑问题的,站在这个立场上看,“合作”就成了“非理性”的选择。
“囚徒困境”是把一些非常普遍而有趣的情形简单化、抽象化,可以说是理性的人类社会活动最具形象的比喻。为我们探讨人们合作的形成及合作中的问题,提供了极为形象的解说方式。因此它被广泛应用于经济学研究,特别是在分析寡头市场(指一个被少数人控制的市场)合作与竞争的选择研究中。
需要特别指出的是:囚徒博弈是完全信息下的静态博弈。所谓完全信息,指的是两个罪犯都知道双方各自策略下的支付;而静态博弈指的是一方的策略不受另一方策略的影响。这一点并不因为他们被分隔审问而有所改变。也就是说,即使一个罪犯已经知道了他的同伴咬牙不招,他的最佳策略仍然是招供。从这个意义上说,两个囚徒相互出卖的命运是“冤家命定、在劫难逃”的。换言之,只要给定双方选择的条件,那么即使允许“共谋”,“囚徒困境”还是会出现。
20世纪80年代,美国曾发生过一个几乎可以说是“囚徒困境”的翻版案例。两位主人公是两家航空公司的总裁,他们的公司正在为了争夺市场份额而激烈竞争。一位总裁给他的对手打了电话,希望结束“我们愚蠢地拼个你死我活,却一分钱也没赚到”的价格战,要求双方同时提价20%。这是违反《反托拉斯法》的共谋行为。结果另一位总裁却把对话录了音,并把录音带交给了司法部(他这样做,是担心自己也因此惹上官司),于是这位一心“合作”的总裁立即遭到了起诉。
改变收益值:烟草商的意外救赎
从上面的例子来看,一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。那么,有什么办法可以使我们逃脱“囚徒困境”呢?
那些碰到“囚徒困境”的人有一个共同的反应,即“应该有一个东西(法律或别的什么权威)来阻止这类事情的发生”。例如,在“囚徒困境”的故事中,如果两个同案犯同属一个帮派组织,而这个帮派对背叛者有严厉的惩罚措施,那么这将大大降低背叛同伙的收益值,使得两个囚徒都不再把背叛当成一种理性选择,这样他们就可以由于双方保持沉默的合作而得到较轻的徒刑。
事实上,帮助人们摆脱“囚徒困境”正是政府的一个主要的功能:要求人们无论如何也得做那些对社会有用的事—一即所谓“公民义务”,比如交税、守法、忠实履行与陌生人的合同。这每一件事都可以看做是有许多人参加的大“囚徒困境”:没有人愿意纳税,因为它的好处(如各种社会福利、公共设施的建设等)对个人而言是间接的,而代价是直接的。但是如果你逃避交税,你就可能被送进监狱,这种前景使得背叛的选择就不那么吸引人了。政府所做的正是改变有效的收益值,结果是每—个人都纳税,大家都能生活得更好,即分享学校、道路和其他公共设施的好处。这就是卢梭所说的,政府的作用就是保证每一个公民“被强迫得到自由”。
在收益结构上作调整,能够改变策略的相互作用,使得情况不再是一个“囚徒困境”。如果对背叛的惩罚是如此之大以至于不管对方如何选择,从短期来说合作都是最好的选择的话,那么就不再有“困境”。可是,收益值的改变没有必要如此激烈才能奏效,其实相当小的一点儿改变就可以有助于回报合作的稳定,尽管这相互作用的情况仍然是“囚徒困境”。
这里只说一个外力干预打破“困境”的例子,它很有悖谬甚至滑稽的色彩。
1971年,在“禁烟运动”的声势下,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。而且,后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。
你是否知道烟草公司为什么不反对,甚至可能还欢迎这项法律?因为这个禁令使他们从“囚徒困境”中解放了出来。
烟草行业同样竞争激烈,为了争夺市场,各大烟草公司都必须大做广告。为此,它们每年都要花费巨额的广告费用,这无疑降低了它们的利润。也就是说,如果烟草公司都不做广告,它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走。这正是一个“囚徒困境”:你合作,对方不合作,你就吃亏了。在这种情况下,做广告就是优势策略。那么,烟草公司能否达成都不做广告的协议呢?不能,因为谁遵守协议,就很可能被对手耍弄。
现在好了,烟草公司做不到的,国家为它做了:法律起到了协议的作用,而政府承担了监督的责任,烟草公司又何乐而不为呢?
展开