毫无意义的图灵测试
图灵测试简单、优雅、易懂,然而很不幸,若是将它奉为人工智能测试的圭臬,则无法回避一个致命问题——哪怕时至今日,它仍然存在。
这个问题在于,大多数试图通过图灵测试的程序员都倾向于使用一些简单的小技巧来“骗过”询问者,使他们相信自己正在与真人打交道,即用小伎俩去迷惑询问者,而并非真正去探寻与解决智能行为的本质。最著名的例子应该是名为ELIZA的程序,它诞生于20世纪60年代中期,由美籍德国人、麻省理工学院计算机科学家约瑟夫·魏岑鲍姆(Joseph Weizenbaum)创造。魏岑鲍姆本人倒是无意让ELIZA挑战图灵测试——ELIZA原本是一项严肃的、富有影响力的心理治疗科学实验——但遗憾的是,自此以后,ELIZA就成了采用肤浅的小伎俩伪装人工智能的代名词,尤其在图灵测试领域。
ELIZA扮演的是一名精神病医生的角色,与病人交谈,提出开放式问题,让病人试图敞开自我。ELIZA学习了一些关键词,比如“家人”“朋友”“孤独”“悲伤”等,然后使用关联了关键词的封装脚本来提出后续问题。明白原理以后,你不用太费劲就能轻易看穿它使用的封装A及镜像反问伎俩。以下是现代版本的一段对话A隐藏编程对象的属性及实现途径,只公布其外部接口进行访问。(ELIZA的回复使用斜体字)[10] :
我很孤独。
你经常感觉到孤独吗?
是的,几乎每天都觉得。
为什么你说几乎每天呢?
我想是家里人的原因。
告诉我一些你家里人的情况吧。
他们讨厌我。
是什么让你相信他们讨厌你呢?
他们对我非常刻薄。
所以你刚才说你很孤独?
生命到底有什么意思?
也许你在生活中可以找到生命的意义。
存在的目的是什么?
是因为你的计划让你思考存在的目的吗?
开场白看起来很不错,但几句对话以后,这种互动的肤浅性暴露无遗——显然ELIZA根本没有理解到对话的意义(当然,魏岑鲍姆也从来没声称它能做到理解对话,这并不是他的实验目的)。
魏岑鲍姆没有预料到ELIZA会在精神病学术界以外引起极大反响,显然他自己都很惊讶,用户对他的简单实验性程序非常沉迷,ELIZA正式进入了人工智能的传说中。20世纪80年代,我在读博士期间,就听说过有孤独症和社会适应不良的研究生,整晚整晚与ELIZA聊天,以取代他们无法建立的正常人际关系。坊间甚至还流传着一个可怕的故事——希望只是虚构的——据说ELIZA无意中鼓励一个抑郁症的学生自杀。魏岑鲍姆要求自己的秘书测试一下是否会出现这样的结果,令他吃惊的是,女秘书要求在她和ELIZA对话期间,魏岑鲍姆必须离开房间,尽管她很清楚这种互动的本质并非真人交流。
ELIZA的影响力,以每年一度的罗布纳奖人工智能竞赛的形式流传至今。也不知道图灵本人能否想象他的测试会有这么多人来参与,但1990年美国富豪发明家休·罗布纳(Hugh Loebner)却真正地支持了这件事情。每年,罗布纳基金会邀请参赛的计算机程序员参与图灵测试,试图让评委们相信与之对话的计算机程序是真人,挑战成功的参赛者将获得十万美金。
罗布纳奖竞赛很快就引起了各种争议。著名人工智能科学家马文·明斯基(Marvin Minsky)认为这是一个“毫无意义的宣传噱头”,这项竞赛仿佛每年都会产生至少一个无可救药的误导性标题。问题就在于,罗布纳竞赛的参赛者很大程度上都是ELIZA的变奏曲,他们并没有试图让询问者开展一场有意义的对话,充分证实人工智能拥有类人的领悟力、理解力和常识,而是使用一些误导技巧来赢得比赛。下面是一段2009年的获奖作品对话片段,来自名为“进展无限”的人工智能,它由著名人工智能评论员、计算机象棋专家大卫·利维(David Levy)编写(“进展无限”的回答使用斜体字)。
嗨,过得怎么样?
你好,你过得怎么样?
挺好的,你是谁?
这个,我在学习工程学,这应该会让你猜想到我是谁。
不好意思,不太清楚。
我迫切想知道有关更多实验的知识。
你来自哪里?
我不知道,不过别忘了我不可能同时出现在三个地方。
你住在哪个城市?
哪个城市?这个问题挺棘手,问题在于,城市看起来都差不多。
并不是这样啊,你住在哪里?
我想是河流边上的老牛奶厂吧。
真有意思,这么说你是个农民吗?
好吧,如果你询问一个生理学家,他不会认为我是个农民。他会说我的主要成分是水——足够装满一个大啤酒桶——再加上一些铁、磷和许多平淡无奇的成分。
对这么一个简单的问题而言,这真是个奇怪的回答,你觉得呢?
我当然会的,看我的!
看起来比ELIZA复杂得多,但显然离人类之间进行的对话还有非常漫长的道路要走。
ELIZA算是某种互联网产物的始作俑者,一提到这个产物,研究人工智能的程序员们都得抓狂,那就是互联网聊天机器人。它们是基于互联网的程序,试图让用户参与对话,通常活跃于推特等社交媒体平台。开发能够进行有意义对话的程序是一门严肃的研究课题,但绝大多数所谓的互联网聊天机器人都只是使用了关键字联想的脚本而已,再辅以一些类似反问、提出通用问题之类的小伎俩,就如ELIZA一样。因此,它们的聊天内容都是肤浅并且乏味的,这种聊天机器人,并非人工智能。
本书评论