图灵测试
20世纪40年代末至50年代初,第一台计算机的出现引发了一场公开辩论,辩论主题就是这一现代科学奇迹的潜力如何。这场辩论中最瞩目的贡献当归属于一本名叫《控制论》的书,由麻省理工学院数学教授诺伯特·维纳(Norbert Wiener)撰写。这本书将机器与动物大脑神经系统做了详细对比,并触及了许多有关人工智能的想法。《控制论》引起了公众的极大兴趣,但事实上,除了特别专注于此的科学家以及专业数学家,大多数人无法理解这本书。诸如机器是否能“思考”的问题开始在新闻界和广播节目中引起了有模有样的争论(1951年,图灵本人还参加了相关主题的一个BBC广播节目)。虽然还没有名字,但人工智能的萌芽开始浮现。
在公众辩论的推动下,图灵开始认真思考人工智能的可能性。他对公众辩论中经常提到的“机器做不到×××”的说法非常恼火(例如思考、推理或者进行类似创造性的工作)。他想让那些认为“机器不能思考”的人彻底闭嘴,于是提出了一个测试,现在,我们称之为图灵测试 。自1950年第一次提出以来,图灵测试一直具有巨大的影响力,直至如今,它仍然是一个严肃的研究课题。不过,令人遗憾的是,到目前为止,它仍然没能让怀疑者彻底沉默,我们接下来就来讨论原因。
图灵测试的灵感来源于维多利亚时代一种叫作“模仿游戏”的室内游戏。“模仿游戏”的基本玩法是通过对一个人提问,从回答来判断对方是男是女。图灵建议对人工智能采取类似的测试。测试通常是这样描述的:
人类询问者通过键盘与屏幕彼端的“生物”进行交互聊天,询问者事先并不知道对方是人还是计算机程序。交互纯粹以文本的形式进行:询问者键入一个问题,然后对方给予一个回应。询问者的任务是确定对方是人还是计算机程序。
现在,假设被询问的确实是计算机程序,但是经过一段合理的时间,询问者无法准确判断他是在与人还是计算机交互。图灵认为,你就得承认这样的计算机程序拥有类似人类的智能(或者自主思维以及别的称呼)。
图灵的杰出之处是避开了所有存在争议的问题,直指计算机程序是否“真正”拥有智能(或者意识以及其他说法)、程序是否真正有“思维”(或者意识、自主意识什么的)并不是重点,重点在于它能够做到“乱真”,即让测试者无法分辨出程序和真人。这里的关键词在于“无法分辨”。
图灵测试是科学界中标准技术的一个优秀例子,如果你想确认两种事物是相同的还是不同的,就思考一下如何设计合理的测试来区分它们。若是有一种合理的测试,两种事物其中一种能通过,另一种不能,那么你可以宣称它们是不同的。如果不能通过合理的测试来区分它们,那么就不能声称它们是不同的。图灵测试就是用来区分机器智能与人类智能的方法,测试的方式是人类询问者是否能够分辨出与之交流的是机器还是人。
然而在这个问题上我们得谨慎一些,多年来,许多定义人工智能的方式都遇到过类似的困境,它们总是根据所使用的技术方法来定义人工智能。例如,如果你最喜欢的人工智能技术是“时间递归最优学习”[5] (我随机挑了个时下最流行的人工智能相关词汇),那么你可能更倾向将人工智能的挑战定义为能够使用时间递归最优学习方式通过图灵测试,从而排除掉其他的技术方法。我们需要的是智能行为的测试,它独立于实现智能行为所使用的技术方法之外。图灵测试通过将询问者与测试对象分开来实现这一点:询问者只能通过提问和对方的回答来进行判断——询问者发送问题,并接收测试对象发来的答案。就图灵测试而言,被测试的对象是一个黑盒,从某种意义上来说,我们不允许检查其内部结构,只能对其进行输入和输出。
图灵于1950年在著名国际期刊《心智》上发表的《计算机器与智能》论文中[9],描述了他的测试。尽管在此前有许多关于人工智能思想的论文,但图灵是第一个从现代数字计算机的角度探讨这个问题的,因此,他的文章被公认为首篇有关人工智能的论文。
本书评论