计算机的决策不会受到人类认知的约束
在为2017年的这场比赛做准备的几个月里,Libratus已经和自己玩了上万亿手的牌。随着系统的不断学习,在识破人类玩家的虚张声势方面,它的能力已大大提高,这就使得它能够找到最优赌注,赢得任何一手牌——因为它的对手要么弃牌,要么手里拿着的牌不好。对Libratus的做法,莱斯进行了反思:“Libratus完全不受结果的影响,并且总是在策略上保持一致。如果要描述具有这种行事风格的一个人,我们就会叫他‘机器’。当然,Libratus没有感情,即使拿了一手烂牌,它也会毫不犹豫地押下巨额赌注。”2017年,人类终于遇到了他们的对手:Libratus获得了超过170万美元的筹码,并最终赢得了比赛。
扑克是一种美丽的游戏,这不仅仅因为它涉及心理学、概率和博弈论等领域,而且绝佳的记忆力、计算能力和理性思维也是每个优秀的扑克玩家所必须具备的基础技能。仅拥有这些还不够,职业玩家还必须具有高超的沟通能力。在牌桌上,他们必须读懂对手的“告白”,不仅是他们的坐姿、视线或持牌姿态,还有他们的下注行为所带来的信号(这一点需要职业玩家特别关注)。与此同时,他们自己所传达的“告白”则是越少越好——有时他们还要提供虚假“告白”,希望对手能够上钩。
在以上这些以及其他许多方面,扑克比更具有象征意义的象棋、围棋等抽象游戏,更加接近我们在市场上所经历的现实社会经验,比如在制定策略、发送和读取市场信号、谈判和交易等方面。所有这些因素——用金钱押注、用策略和虚张声势来招摇、读取和发送信号时做出微妙调整等,都让人感觉非常熟悉。因此,这样一台在游戏中击败了扑克冠军玩家的电脑,让我们深感震惊。我们不得不重新审视一个问题:人类在驾驭市场和进行交易方面、在制定战略和进行沟通方面,真的具有无法被模拟的独特性吗?
Libratus所取得的令人印象深刻的胜利表明,一台计算机可能比我们更有能力做出更好的市场交易,或者,至少可以很好地帮助人类进行市场交易。这并不是因为它比我们人脑每秒钟所能进行的运算量要大很多,而是因为和人类不同,计算机的决策不会受到人类认知的约束。
我们看看计算机与人类不同的押注策略吧。大多数人类扑克玩家都不会明白,在底池里赌金很少时,押下大笔赌注的逻辑是什么。如果一个玩家在底池里赌金很少时押下大笔赌注,那么他的对手通常会假设这个下注的人不了解游戏玩法,或者虚张声势得过于明显。因为这样的赌金几乎必然会阻止另一方押下更多赌注,下注人的收益自然也会受到限制。然而,Libratus经常会在这样的情况下押下巨额赌注,最终,这个策略却得到了丰厚的回报。许多认知偏见——从风险评估错误和新信息出现后依然坚持同一种策略的做法,到轻率地漠视赢得较小赌金的做法——都会影响人类决策,让人类拒绝做出为小额赌金押下巨额赌注的选择(也包括其他一些选择)。相反,Libratus在每次出完牌后,都会重新评估自己的策略。到了晚上,它会有条不紊地重新分析自己白天出过的每一手牌,推演出它的人类对手的行为模式,并进一步锤炼自己的策略来积极利用他们的行为模式。而且,尽管Libratus所需处理的信息量如此巨大,它却依然顽强且细致地完成了任务,这是人类决策者所完全不可能做到的。最终结果就是,虽然Libratus所赢的平均筹码并不那么引人注目,但是它赢得的比赛次数比其他对手都多得多。
Libratus对自己的策略进行了重新评估,并且从自己的经历中总结出了经验教训,这就使得它不会把这次锦标赛仅仅“看作”与很多个体的偶然交锋,而是将其看作能够揭示对手行为模式和弱点的系列游戏,而这些游戏却没有将Libratus锁定在一个完全固定的人类行为模式中。这是聪明的谈判者在多轮谈判中使用的一种策略,也是精明的商人采用的一种策略,特别是在多次重复的市场交易中。毫无疑问,Libratus的设计者桑德霍姆教授所构想的是一个商业版本系统,在复杂的市场交易中,它可以代表消费者与商家进行讨价还价。这一切还只是开始。
Libratus的胜利预示着人类经济的一个更深层次、更根本的转变。与Libratus一样,这种转变的驱动力也是数据。
本书评论