站点图标 多伦多书苑

深度学习: 智能时代的核心驱动力量

德州扑克:当机器智能学会了虚张声势

一对一无限注德州扑克是最受欢迎的扑克玩法之一,常见于赌场,无限注投注方式则通常出现在世界扑克系列赛(World Series of Poker)的主赛事中。扑克很有挑战性,因为与国际象棋玩家可以获得相同的信息不同,扑克玩家的信息不完整,而且在最高级别的比赛中,诈唬、欺骗的技巧和拿到的牌一样重要。

数学家约翰·冯·诺依曼(John von Neumann)创立了数学博弈理论,也是数字计算机之父,他就对扑克特别着迷。他说过:“现实生活包括虚张声势,一点欺骗手段,以及自问另一个人会怎么评判我做事的意图。这就是我理论中博弈的内涵。”[28] 扑克是一种博弈,反映了经过进化精炼过的人类智能的一部分。一个名为“DeepStack”的深度学习网络和33名职业扑克选手进行了44852场比赛。令扑克专家震惊的是,它以相当大的优势,一个标准差,击败了最出色的扑克玩家,同时以四个标准差在整体上击败了全部33名玩家——多么巨大的差距(见图1–7)。[29] 如果这一成就能复制到其他基于不完全信息、需要人来做判断的重要领域,比如政治学和国际关系,其影响可能是极其深远的。[30]

图1-7 一对一无限注德州扑克。强势手牌。DeepStack已经掌握了如何在高筹码扑克中虚张声势,以大比分优势击败职业扑克玩家。
Author:

退出移动版