3.3 本体研究:如何正确描述知识
对于人类来说,相互之间传达知识时,只要能够进行语言交流,就是一件非常简单的事情。那么,我们如何才能将知识传输给人工智能呢?这种针对人工智能传输知识的研究被业界称为“知识表达”。
在人工智能发展初期有一项非常有名的研究,这项研究的目的就是探索如何向人工智能描述知识,它就是“语义网络”。“语义网络”与Web 3.0时代的“语义网”有着异曲同工之妙,“语义网络”能够将人类的语义结构转化成网络化结构的表达方式。在这种表达方式中,“概念”可以用节点表示,通过节点之间的连接就能将各个语义串联起来,最终形成知识库。
比如,我们要将“一个桌子是我的”的信息传输给人工智能,这时就需要我们具体描述桌子的颜色、所有者、材质等相关信息,并将每一个特征设定为一个节点。当所有节点串联起来后,人工智能就能通过这些信息分辨出属于我们的桌子(见图3-8)。
研究者对“语义网络”的研究越深入就越会惊叹人类所拥有的知识量是多么巨大,要想将这些知识全部按照一定的形式进行描述,显然是一件近乎不可能完成的事情。科学就是这样,总会遇到一个又一个困难,而人类也是在不断解决新困难的过程中不断进步。当人们碰到新问题的时候,便会尝试用另外一种方式研究,直到人们将“本体论”融合人工智能的研究后,事情有了新的进展。
17世纪,德国经院学者郭克兰纽首先使用了“本体论”(Ontology)这个词。本体论是探究世界本源或基质的社会学理论。从广义来说,本体论研究的是一切事物的最终本性;而从狭义上来说,本体论则是研究宇宙的本性。不管是从广义来说还是从狭义来说,本体论好像都是一种哲学问题。那么,它与人工智能有何联系呢?
从知识输入的角度来说,如果我们能从事物的本源出发,再通过分级处理信息,就能比较容易地向计算机描述出我们所要表达的信息。我们先来看看图3-9。
图3-9中的箭头代表的是“属于”关系。也就是说,人属于哺乳类,哺乳类属于动物。
如果反向推导,可以推导出一层包含的关系,如人包含手与脚、向日葵包含花与叶等(见图3-10)。
从图3-9和图3-10中可以看出,如果是简单且单一的过程,不管是正向推导还是反向推导都是可以的,这样将知识传输给计算机就能实现既定目标。但是这种推导过程真的万无一失吗?比如,我们反向推导出一家公司有一位经理(公司包含经理),一位经理有两只胳膊(经理包含两只胳膊),就会得出经理的两只胳膊属于公司的结论,这显然不正确。
其实,即便是看起来相同的“属于”关系,实际上也包含着很多不同的关系在其中。对于一架飞机来说,如果没有了机翼,它就不能称为“飞机”,但是不管有没有机身的存在,机翼始终被称为“机翼”。
森林与树木的关系是包含关系,即使森林中的树木被砍掉了一百棵,森林依旧还是森林,树木也还是树木。根据语境的不同,即便是同样的“属于”或“包含”关系也可能会出现不同的意思。在经理的那个例子中,其实经理与胳膊处于两个不同的语境中,因此作为经理身体的一部分,胳膊是不应该出现在公司的语境中的。
对于人类来说,关于本体的研究是一件非常困难的事情,尽管人类能够自如转变语境,并且很轻松地理解语义,但是对于人工智能2.0时代的研究者来说,要把同样的思维用在人工智能身上,其难度可想而知。
本书评论