多伦多书苑

博弈论与生活

方框1.1 纳什均衡与囚徒困境

博弈论研究者会这样描述纳什均衡:“在各方都选择了同一种策略的情形下,没有一方能通过独自改变策略而获益。此时的策略搭配和后续结果,就构成纳什均衡。”博弈论研究者使用简明的图表来表达不同的选项和结果,就像是建筑师的蓝图,以确保一切尽在掌握之中。他们把各种可能性画成一张矩阵图,代表局中人受困的处境,就像1999年的科幻电影《黑客帝国》里所演的一样。这种方式的设计者是美籍匈牙利数学天才冯·诺依曼,他也是博弈论的发明者。

以下是伯纳德和弗兰克的囚徒困境,这两个矩阵图显示了各种选项会造成的刑期:

在每个格子之间有小小的通道,箭头方向代表两人可以缩短刑期的选项。从图中可以清楚看出,不论一方选择为何,另一方合乎逻辑的选择只有认罪这一条路。博弈论研究者会说认罪是优势策略(dominantstrategy),不论另一方怎么选择,都能得到最佳结果。

博弈论研究者将以上两图合二为一,所包含的信息完全相同,但如果没有解释,可能无法第一眼就看懂:

这种图表能清楚看出结果的配对。格子中的数字,左边是伯纳德,右边是弗兰克。举例来说,你可以看出不会有(0,0)这种选项,表明不会出现两个囚犯同时免于牢狱之灾;任何一个囚犯想免于牢狱之灾,唯一的可能就是对方被判10年,换言之,只会有(0,10)或(10,0)的搭配。

如果我们在各个格子中加上小通道,伯纳德只能上下移动,弗兰克只能左右移动(和先前的图表相同),并且也加上小箭头,就可以看出他们的困境何在。他们如果能采用合作策略(两人都不认罪),会形成(2,2)的选项,但只要其中有一人动了自私的念头,连锁反应就会无情地将他们带到(4,4)这一格,而且再也无法逃脱!(请注意这一格没有向外的箭头。)现在我添加了表情图案,来代表他们面对各种境况的心情:

其中,(4,4)这一格就是纳什均衡(在此处和后续的图中,就用灰色网底表示),任何一方想独自逃脱,只会让自己的问题更大。

例如,如果伯纳德选择不认罪,反而会判刑10年,而不是4年,弗兰克的情形也相同。两人必须合作、协调,“同时”不认罪,才能实现(2,2)的最佳选项。

要解决这种处境,秘诀在于双方要设法协调行动,而且不能有一方改变心意。我有个朋友看过一个有趣的例子,当时他正在意大利的山路上开着车。有一段道路缩减到只剩一条车道,双向来车必须有默契地谦让才能轮流通行,但正好碰上两位互不相让的驾驶员,就这么卡在狭窄的路中间,彼此大按喇叭,想要对方后退。两个人坚持不退让,后方很快形成长长的车龙,喇叭声此起彼落,怒火交加。后来,警察花了三天才疏解了这场塞车问题。

这件事的症结在于双方都站在自己的立场思考,希望对自己最有利。我们也常常如此,并因此困在纳什陷阱之中,既像是托斯卡和斯卡皮亚,也像弗兰克和伯纳德。让纳什荣获诺贝尔奖的论文,可能是诺贝尔奖有史以来最短的一篇,在论文中他同时使用了符号逻辑和高等数学,证明在不合作的情境中,纳什陷阱无所不在!(所谓的“不合作”情境,就是双方不愿或无法互相沟通。)

在纳什发表这篇论文之前,在讨论合作为何失败、无法共谋利益时,通常都是从个人的心理学、道德观角度切入。虽然这两者也的确很重要,但纳什指出,这些问题的核心都深埋着一个逻辑问题,而且这常常才是主因。这个逻辑问题用我们的自身利益作饵,不断让我们放弃最适当的合作策略,而陷入长远利益受损的局面。

读报纸或八卦杂志时常能看到纳什所说的这种逻辑。夫妻大闹离婚,通常只要双方妥协,就能好好收场,但如果一方拒绝妥协,另一方的退让也就毫无意义。结果双方坐困纳什陷阱,不仅得付给律师大笔金钱,过程中还必须承受情绪上的压力。

在此必须强调,双方之所以困在这个矛盾的逻辑循环中,是因为他们不愿或不能通过沟通来采取合作的策略。

不幸的是,这件事说来轻松,做起来很难。常常双方同意沟通协调,达成协议后却有一方反悔。问题在于:如果合作达成的解决方案(协议)并非纳什均衡,其中一方改变心意,就的确可能得到更好的结果。一般而言,要达成合作有两项重大挑战:第一是找到方式达成协议,第二是找到方式让每个人不改变心意。后者必须完善到足以令双方相信对方会遵守,而且还能维持到结果正式出炉。

这本书就是要告诉各位如何寻找以上两项挑战的答案,答案既涉及个人层面,也涉及人类共同重大议题层面。我发现主要的解决方式有三种,每种方式都有来自不同族群、不同文化的拥护者。
• 改变态度:例如,如果我们都认为在合作中作弊是不道德的,就能避免许多社会困境。
• 诉诸善意的权威人士:由外部的权威人士来促成合作并守护公平。
• 能够自行运作的策略:开发出能够自行运作的策略,如此一来,只要合作一开始,就不会有作弊的机会。

下面我会一一审视这三种解决方式,而且我认为,只有第三种方式可以长久,而博弈论的新观点,可以协助我们在许多情况中运用这种策略。

Author:

退出移动版