分治策略
正如我们所知,通用人工智能是一个庞大而模糊的目标,很难直接达成。因而,黄金年代采用的策略是分而治之。也就是说,与其一口气尝试构建完整的通用智能系统,不如识别出通用人工智能系统所需的各项不同能力,分别构建具备这些能力的体系。这一概念隐含的假设是,如果我们能够成功构建通用人工智能所必需的每一种智能系统,那么,以后将它们组合成一个整体,比起直接构建完整的通用智能系统简单得多。这一基本假设——通用人工智能的研究方向是将精力集中在解决智能行为的各种组件上——成为人工智能研究的标准方案。人们争先恐后地建造各种能够表现智能行为能力的组件。
那么,研究人员关注的主要问题有哪些?首要的也是最难解决的问题,又偏偏是我们认为理所当然应该具备的:感知 。一台机器要在特定的环境中智能地工作,就必须能够获取周围环境的信息。我们人类通过各种机制感知世界,包括五种感觉:视觉、听觉、嗅觉、触觉和味觉。因此,就得研究制作能够感知外界的传感器 。如今的机器人使用各式各样的人工传感器来接收有关环境的信息——雷达、激光雷达、红外线测距仪、超声波测距仪等。但是制造这些传感器本身就是一项复杂的工程,但这还只是问题的一部分。不管数码相机的光学系统有多好,不管相机的图像传感器有几百万还是几千万像素,最终相机所做的事情只是把看到的图像解析成一个个网格,然后为网格中的每一个单元格分配数字,表示它的颜色和亮度。所以,哪怕配备了质量最好的数码相机的机器人,最终它收到的信息也只是一连串的数字。因此,感知领域的第二个挑战是如何解析这些原始的数字,理解它所“看到”的图像。这项挑战远比制作传感器难得多。
通用智能系统的另一个关键能力是通过学习积累经验,这引出了一个名叫机器学习 的人工智能研究分支。就像“人工智能”这个名字本身一样,机器学习也是一个极其不恰当的术语,听起来像是一台机器自己在引导自己学习,从无知开始,变得越来越聪明。事实上,机器学习跟人类学习是完全不同的,它的学习指的是解析和预测数据。例如,在过去数十年里,机器学习的一个巨大成就是出现了可应用的人脸图像识别技术,通常的实现方法是给予程序诸多希望它学习的例子。因此,通过许多人脸图片以及对应人名来训练人脸图像识别程序,最终达到的效果是给它呈现一张图片时,程序就能正确地给出所示图片对应的人名。
问题解决 和制订计划 是两个相关联的能力,它们也与智能行为有关。它们都要求用给定的动作组合来达成目标,而实现的关键在于找到正确的动作序列。例如,象棋或者围棋之类的棋盘游戏,目标是赢得比赛,行动是在棋盘上移动(或放置)棋子,挑战是要找出正确的下棋步数以达到赢得比赛的目的。
而如我们所了解的,在解决问题和制订计划中最根本的难点在于,只需要考虑移动棋子的所有可能结果,虽然从原理上看起来很容易做到,但是实际上执行起来却非常困难,因为棋子可能移动的步骤实在是太多了。
推理也许是诸多与智能相关的行为中最令人崇拜的一种:
它基于现有的事实,用强大的逻辑方式获取新的知识。举一个著名的例子,若你知道“所有的人都是凡人”,你也知道“迈克尔是一个人”,那么就可以推理得出“迈克尔是凡人”的结论。一个真正的智能系统很容易做到这一步,然后,利用新的知识做出进一步推理。例如,知道“迈克尔是凡人”之后,就能推论出“迈克尔有朝一日会死去”“迈克尔死去以后,将不会复活”等等。自动推理就是赋予计算机这样的逻辑推理能力。在第三章中,我们将看到,长期以来,人们都认为这种推理能力应该是人工智能的主攻方向。虽然现在已经不是主流了,但自动推理仍然是人工智能领域中一个重要的分支。
最后是自然语言理解 ,这涉及让计算机理解人类的语言,比如中文或者英文。目前,计算机程序员为计算机编程时,必须使用人造的机器语言:某种有着精确定义、明确规则、专门为计算机构造的语言。这些语言(目前最著名的应该是Python、Java和C语言)比起自然语言(如中文或英文)简单得多。很长一段时间以来,让计算机理解自然语言的主要方法是试图为自然语言加以精准的定义和明确的规则,就像我们定义计算机语言一样。而事实证明,这是不可能的。自然语言太过灵活、模糊和易变,无法用这种方式严格定义,而语言在日常生活中的使用方式更是阻碍了对其进行精确定义的尝试。
本书评论