1.纳什的《美丽心灵》
众所周知,现代博弈理论由现代大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》标志着现代系统博弈理论的初步形成。
但是诺伊曼所解决的只有二人零和博弈,也就是一方如果赢了,那另一方必须输,两人的获利总和为零。然而,在提倡“双赢”的现在,我们已经摒弃了这种“杀敌一千,我伤八百”的零和模式,那么,有没有一种理论作为一种“平衡”能使参与双方都获得一种最“合理”或者说最优的具体策略?虽然二人零和博弈的解决具有重大意义,但作为一个理论来说,它的应用范围是极其有限的。一是在社会生活中,常常有多方参与而不只是两方;二是参与各方相互作用的结果并不一定有人得利就得有人失利,整个群体可能有大于零或小于零的净获利。
所以提到博弈,我们就不能不说到一位数学天才,1994年诺贝尔经济学奖得主之一的约翰·纳什。
纳什从早年起在数学领域的工作就非常优异。1949年,21岁的纳什写下了一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代非合作型博弈论中最重要的思想之一,也奠定了他44年后获得诺贝尔奖的基础。
1950年,纳什曾带着他的想法去见当时名满天下的冯·诺伊曼,但遭到拒绝。然而他的论文却得以在普林斯顿大学发表,并引起轰动。在此之前,人们无法找到多人参与的零和博弈的解,更谈不上用以指导实践。纳什天才性地提出“纳什均衡”的基本概念,为更加广泛普遍的博弈问题找到了解,这也是它对博弈论的最大贡献。
1950年和1951年的两篇关于非合作博弈论的重要论文的发表,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈均衡解的存在性,即著名的纳什均衡。从而证明了博弈均衡与经济均衡的内在联系,奠定了现在非合作博弈论的基石。
1958年,他被美国《财富》杂志评为新一代天才数学家中最杰出的人才。就在纳什春风得意、事业将达到顶峰的时候,他却忽然遭受到命运无情的一击:年仅30岁的他患上了严重的精神分裂症。从此,他的一生都受着难以言喻的困扰。
但幸运的是,他有一个爱他至深的妻子。她叫爱莉西亚,本是麻省理工的学生,在和纳什结婚后的40多年里,她始终与他患难与共,照顾有加。在爱莉西亚怀有身孕,正待分娩的同时,纳什的精神状况却日益恶化,甚至因为异常古怪的行为而被捕。万般无奈之下,爱莉西亚与纳什在1962年离婚,但爱情并没有因此而消失。1970年,当纳什的母亲去世,无人再来供养照料纳什的时候,爱莉西亚接他来与自己同住。为了迁就纳什不肯去医院封闭治疗的想法,她把家搬到远离尘嚣的普林斯顿,希望那宁静熟悉的学术气氛能稳定纳什的情绪。她不但在生活起居上对纳什照顾得无微不至,而且还用女性特有的温柔与坚强来关爱纳什的内心情感,鼓励他战胜疾病。
不知是受妻子爱的鼓励与感动,还是老天无法眼睁睁地看着这样一位天才意志消沉,纳什在他自己的天才与狂乱中,陷入了一种狂热的智力上的极高境界。通过多年的努力,纳什终于走出阴霾,理性战胜了疯狂,他的心境重新恢复了平和。
1994年,纳什凭借他在现代博弈理论上的卓越贡献,获得科学界的最高荣誉--诺贝尔奖。
天才纳什的传奇一生不仅受到科学界的广泛关注,甚至还被影视界发掘为素材,这就是美国环球公司2001年出品的《美丽心灵》。该片一举囊括了第59届金球奖五项大奖,并荣获第24届奥斯卡奖四项大奖。本片艺术地再现了约翰·纳什传奇般的人生经历,全世界的观众都被他深深震撼。也许很多人对博弈论的兴趣正是由这部传世之作引发的。
本片除了渲染了纳什的情感生活之外,主要是以他天才的构想--纳什均衡为切入点的。纳什均衡奠定了现代非合作博弈论的基础,后来博弈论研究基本上都是围绕这一主线展开的。电影无意中给出了一个绝佳的例子,说明什么是纳什均衡。
电影里有这样一幕,有四位美女和一位真正的绝色美女走进了酒吧。于是纳什便给三个男同学解释说,他们该怎样去讨好这些女生。纳什说,在正常情况下,四个男生会同时对这个绝色美女展开攻势。但纳什认为,采取这种策略并不聪明,因为所有男生都追求同一个女生,他们就会互相牵制,到头来“没有一个人”能如愿以偿。纳什预言,如果这四个男生被这个绝色美女拒绝后才追那些颇具姿色的女生,那么这些女生就会因为成为别人的“第二选择”而发火,于是她们也会把这些男生一脚踢开。纳什提议说,为了避免两头落空,这些男生一起冷落绝色美女,转而去追求那些颇具姿色的女生。虽然电影里一直没有明确说明,但它却以暗示的手法告知大家,纳什所提出的配对策略与他赢得诺贝尔经济学奖的理论有关。
诺伊曼在《博弈论与经济行为》中建立了合作型博弈论的基本模型,但是对于其中双向协商问题并没有给出一个确定的解。而纳什在这一领域也作出了杰出的贡献,他不仅提出了协商问题(即“讨价还价”问题)的公理化解法,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作博弈中的协商转化为更广泛的非合作博弈的一个步骤--协商的目的最终仍是使自己的收益最大化。
此外,在测试博弈论的行为试验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的试验,并敏锐地提出,在其他实验者的囚徒困境试验里,反复让一对参与者重复试验,实际上是把单步策略问题转化成了一个大的多步策略问题。这一思想初步提示了在重复博弈理论中串谋的可能性,这一发现在经济和政治领域起到重要作用。
在《美丽心灵》中有这样一个情节:1994年,美国政府向商家拍卖大部分电磁波谱。这一多回合拍卖由很多博弈论专家精心设计,目的是最大化政府收益和各商家的利用率。通过纳什均衡的理论性指导,此次拍卖获得极大的成功,政府获得超过100亿美元的收入,各频率的波谱也都找到了满意的买主。
与此相对应的是,新西兰一个类似的拍卖会惨遭失败。因为他们根本没有用博弈理论来设计拍卖规则。结果,政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用,一个大学生只花了一美元就买到了一个电视台许可证。
正是因为博弈论对现代经济生活具有如此大的冲击和影响力,1994年瑞典皇家学院宣布该年诺贝尔奖经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。这是一个科学家所能获得的最高荣誉,也是对纳什的最高礼赞。
也许正如《美丽心灵》的男主角,扮演纳什的奥斯卡影帝罗素·克洛在领奖时对《美丽心灵》的评价一样,纳什与他的博弈论“能帮助我们敞开心灵,给予我们信念,生活中真的会有奇迹发生”。
2.围棋中的纳什均衡
从开始,我们就不停提到一个名词,那就是“纳什均衡”,那么究竟什么是“纳什均衡”,我们不妨举个例子来说明一下。
围棋可能是世上最简单也最复杂的游戏,它源于4000年前的中国,但到现在我们也未必真正弄懂了它。它有最简化的棋盘--纵横各19条线编织而成的一张网;最简化的棋子--只分黑白两色;最简单的规则--轮流下子,两气活棋,空多者胜,再加上一些“劫争”之类的补充规定。一个对围棋一无所知的人也能在几分钟内学会,可是它的玄妙却又超过了任何一种棋类游戏。如果你在围棋上下过一些工夫,你就一定能悟到某些哲理,例如:“乱中求胜”、“过犹不及”等等。而在下围棋时,围棋的19×19的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见,围棋是数学意义上的严格的零和博弈。
从博弈角度来看,围棋初段到九段的差别只是他们策略选择技巧的高低不同而已。比如过分的“骗招”、“本手”与“缓招”之间,一般都会选择“本手”。招法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,应考虑到对手的反击手段。对手也会考虑到在追求利益过程中不可能占尽便宜。这就是双方都能接受的方案。如果一方的策略是抢占实地,另一方是获得外势,而结果相当互有所得,双方就愿意那样下。抢占实地获得现实利益,获得外势考虑将来发展,这便形成一个双方的“均衡”;另一方面可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也用同样法则找到应对,则可以说双方达成“均衡”。
纳什均衡是指一个不会令人后悔的结果,无论其他人怎样做,各方对于自己的策略都很满意。在纳什均衡中,你不一定满意其他人的策略,但你的策略是应对对手策略的最优策略。纳什均衡中的各方决不会合作,而且总是认定自己无法改变对手的行动。
纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个参与者都不可能因为单方面改变自己的策略而增加获益。于是双方为了自己利益的最大化而选择了某种最优策略,并与对手达成一种暂时的平衡。
然而,博弈的结果不能都成为均衡。因为围棋本身就是一个零和博弈。博弈的均衡是稳定的则必然可以预测。纳什均衡的另一层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。
围棋是对弈双方按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈,每个参赛者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。
这是一条线性的推理链:“假如我这样做,它就会那样做--若是那样,我会这样反击”,后面的步骤依此类推。也就是说,你怎么走棋,完全取决于对手的上一招,这在博弈中叫“倒推法”。
在围棋博弈中,存在明显的马太效应,也就是说,凡是拥有较少的,连他仅有的那一点点也夺过来;凡是拥有较多的,就加给他,让他拥有更多。比如“一招不慎,满盘皆输”的谚语,当然我们也要用马太效应的原理,在获得优势的情况下能保持优势,扩大优势,直至最后成功。
在生活中一般出现的都是互不知道对方策略、同时进行的博弈,这种叫做静态博弈。在这种博弈里,没有一个博弈者可以在自己行动之前知道另一个博弈者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。
要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即使你那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。
因此,每一个人不得不同时担任两个角色,一个是你自己,一个是对手,从而找出双方的最佳行动方式。与一条链的推理不同,这是一个循环,即“假如我认为对方认为我认为……”
这样看来,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为可以根据形势选择任何变化或脱身而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。因此在博弈中,纳什均衡的要义在于:即使在对抗的条件下,可以通过向对方提出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”,即无论对方做何选择,这一策略始终应优于其他策略。
3.作为游戏策略的博弈
“博弈论”的英文是“Game Theory”,实际上Game的本意是游戏,博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。
所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争中包含着潜在合作的种子,合作中包含着潜在竞争的种子。
合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能公然“串通”或“共谋”。
合作博弈最典型的例子就是石油输出国组织欧佩克。1960年9月,伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司维护石油收入,欧佩克在这个时候应运而生。欧佩克现在已发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。它统一协调各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飙升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。
对于个人来说,从傅弈论的角度来看,在人生、事业一筹莫展的时候,如何能寻找到一个快速突破困境的办法?
首先要寻找一个合理的策略,而这个合理的策略,势必要建立在一个牢固的基点之上,才能切实可行。如果在困境之中,有人与你因为同样的原因无法抽身,那么是否能够和这个人一起摆脱不利的处境,在合作的基础上走向双赢呢?
《红楼梦》里形容四大家族的时候,用过一个评语,叫做“一荣俱荣、一损俱损”,就是因为这四个家族你中有我,我中有你,相互之间有利益的合作,也有亲缘关系,所以结成了一个牢固的联盟。
智力游戏与博弈相近似的本质是:在确定游戏规则的约束下,游戏参与者决策、行动的过程。各种智力游戏实质上就是一个社会的经济、管理、政治等现象抽象出来的缩微模拟模型。在这个意义上不妨说,博弈论就是研究怎么玩好游戏的理论。
游戏是一种抽象。面对复杂现象时,人们经常会“只见树木不见森林”无法抓住某种现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低,从而轻松地分析问题并找到合理的解决方法。
中国最古老的围棋智力游戏,其最初的功能形态就是模拟战争。围棋包含最多的就是博弈的内涵,特别是战争中的博弈内涵,如“围而歼之”,“生死存亡为先,争地夺利为上”。围棋以获得最大的利益为胜,抽象出战争的本质和目的,来研究战争的规律。
围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最终以所占地盘大小定胜负。然而,其作为一项智力游戏,围棋与战争在很多方面都相通。围棋棋手在小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。
战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为“新的战争哲学”。基于效果就是,着眼于敌方整个控制作战系统,使之丧失作战能力。美军在伊拉克发动“斩首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。
围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所有的作战方法都必须是有效的,着重要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的外在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐就是基于效果的典范。
智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出条理性。
现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A,B、C、D赶往演出现场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯,他们只有一只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17分钟内过桥吗?”
这可不是微软公司的别出心裁,据说许多跻身世界500强的公司在招收新员工时,都要出类似的智力题。
思维方法是抽象的,它不像1+1=2那么简单,只有通过自己的想象,亲自动手操作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能力就越强,这一点已成为人们的共识。
在许多智力游戏中,都存在这么一个共同的特点:就是参与者所选择的策略对于胜负有着举足轻重的影响。一个游戏的规则一旦定好之后,策略选择的好坏就成了游戏参加者所能自由运用的、左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中,策略选择就成了游戏结果的唯一决定因素。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来。
任何游戏都有自己的规则。事实上,现实中的人类社会自然也是如此,这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就确定了人们行为的前提条件。
因此博弈与游戏都有一个重要的共同特征:那就是这些规则规定游戏参加者可以做什么,不可以做什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎样的惩罚等。
游戏者的策略有相互依存的关系。每一个游戏者从游戏中所得结果的好坏不仅取决于自身的策略选择,同时也取决于其他参加者的策略选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果,原因是其他方选择了更坏的利他而不利己的策略。这一点也是游戏与博弈重要的相似之处。
4.博弈理论包括什么内容
前面已经指出,博弈论研究的对象是理性的行动者或参与者如何选择策略或如何作出行动的决定。理性的人是对现实的人的基本假定,即假定参与者努力用自己的推理能力使自己的目标最大化。“理性的”与“道德的”不是一回事,理性的与道德的有时会发生冲突,但是理性的人不一定是不道德的。
博弈涉及哪些内容呢?
第一、博弈涉及至少两个独立的博弈参与者。
每个参与者通过采取行动,努力使自己的效用或利益最大化。但是,他的行动的好处或支付的获得取决于另外的参与者。下文有时将参与者称为行动者。
“囚徒博弈”或“囚徒困境”是一个被广泛谈论和研究的博弈。两个共同作案偷窃的小偷被带进警察局单独关押,如果一方与警方合作,招认并供出自己与对方以前所做违法之事,而对方不招认,招认方将不受重刑,无罪释放,另一方则会被判重刑15年;如果双方都与警方合作共同招认,各被判刑10年;而如果双方均不承认有罪,因警察找不到其他证明他们以前违法的证据,则只能对他们的小偷行为进行惩戒,各判刑1年。这两个小偷如何作出选择?
在这个囚徒困境中,囚徒的最后结果--是当场释放还是被判刑(15年、10年、1年)不仅取决于该囚徒的决定,而且还取决于另外一个囚徒的决定。
而在买卖的交换行为中,买东西的人要尽量以低的价格买到,但是他是否能买到取决于卖者是否能卖;卖东西的人尽量想以高的价格将东西卖出去,但价格太高,买者不接受,因此卖东西的人能否将物品卖出去取决于买者。
第二、博弈涉及行动者存在着策略选择的可能,博弈论用策略空间来表示参与者可以选择的策略。
赤壁一战,曹兵大败,曹操落荒而逃,在选择是走通往华容道的小路,还是选择大路时,他面临着在两个策略之间进行选择。囚徒困境中的小偷面临着“不招认”还是“招认”的选择。每个参与者从策略空间中选取他的策略,如果没有选择的可能,理性的人是无法作出计算的,对自己的目标也就无能为力。从这个意义上来讲,我国改革开放走向市场经济,就是使得每个经济主体发挥其理性的作用,使之发挥主动性,而在计划经济下则没有可选择的余地。
第三、参与者在不同策略组合下会得到一定的支付。
在卖主甲和买主乙之间的“买--卖”博弈中,这是一个讨价还价过程,假定通过讨价还价后确定了价格。在此价格下,卖者卖成后获得的效用为6,卖不成的效用为5;买者买成的效用为4,买不成的效用为0。而如果他们之间的交易不成功,无论是买主还是卖主,都要等待和进行讨价还价,假定等待和讨价还价的成本均为1,则支付矩阵为:
第四、对于博弈参与者来说,存在着博弈结果。
所谓结果是参与者最终对策略的选择造成的确定性的支付。如在曹操败走华容道的博弈中,诸葛亮在“埋伏大路”与“埋伏通往华容道的小路”之间进行选择,而曹操在“走大路”和“走通往华容道的小路”之间进行选择。在这个博弈中,双方猜测对方的行为,看谁猜得准。博弈的最终结果是,诸葛亮派关羽埋伏在通往华容道的小路,而曹操选择走小路,被诸葛亮抓住。这就是曹操与诸葛亮之间的博弈的结果。
第五、博弈涉及均衡。
均衡是经济学中的重要概念。那么什么是均衡,它的含义是什么?
均衡即是平衡的意思,在英文中是equilibrium。在经济学中,均衡意即相关量处于稳定值。在供求关系中,如果在某一商品市场的某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经济学中的重要分析。
那么什么是博弈论的均衡呢?所谓博弈均衡,它是一个稳定的博弈结果。均衡是博弈的一种结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。
纳什均衡是一种最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。
在上面的“买--卖”的博弈中,(卖出,买进)是纳什均衡,这个博弈可以解释为什么在现实中讨价还价后买卖能做成,因为这对双方来说都是最优选择。同时在“买--卖”博弈中,其均衡对双方来说是全局最优的。
……
展开
★博弈,绝不仅仅是智力PK和头脑风暴
★要在现代社会做一个有文化的人,你必须对博弈论有大致的了解。
——美国诺贝尔经济学奖第一人 萨缪尔森