你该如何面对这个结论?
检测结果呈阳性,我想大多数人都会担心,毕竟,这个测试的准确率可是99%。所以,现在我问你,如果检测结果呈阳性,罹患该流感的概率是多少,我猜大多数人会说0.99(与测试的准确率一致)。
事实上,这个答案错得离谱。你罹患该流感的概率只有十分之一。这似乎违反了直觉,到底是怎么回事呢?
假设我们随机选择1000人做流感测试。我们知道实际感染概率,这1000人中大约有1个人会感染流感。所以我们假设这1000人中确实有1个人感染了流感,而999人没有。
首先我们考虑一下那个罹患流感的可怜人,由于测试准确度是99%,它将有99%的概率检测出患了流感的人。所以,我们可以预期这个结果是正确的(0.99的概率)。
现在来考虑那999个幸运儿,因为测试准确率为99%,所以大概每测试100个人就会有一个误诊。我们测试这999个幸运儿都是没有罹患流感的,预估大概有9~10份测试结果会出现错误。换言之,就是大概有9~10个人,明明没有感染,但测试结果呈阳性。
因此,如果我们对1000人进行流感测试,可以预计其中10到11人的检测结果是呈阳性的。但我们知道,只有一名检测结果呈阳性的人是真患病者。
简言之,由于流感的感染率很低,所以假阳性的被检测者远远多于真阳性(这就是医生为什么很不喜欢依靠单一检测做出诊断的原因之一)。
我们来看看贝叶斯推断在机器人学科中的应用。假设有一个机器人正在探索未知区域,比如一个遥远的星球,或者一片被地震摧毁的废墟之类。我们希望机器人能够探索未知区域并绘制地图。机器人可以通过传感器感知周围环境,但是有一个问题:传感器会错误报告。因此,当机器人进行观察的时候,传感器说“这个位置有障碍物”,可能是正确的,也可能是错误的,我们无法确定。如果机器人默认传感器数据总是正确的,那么它绘制的地图就会出现很大偏差,并且它还有可能根据错误的信息做出移动的决定并撞上障碍物。
这里可以像刚才的流感测试案例一样使用贝叶斯推断,我们利用传感器数据的正确率来更新机器人的信念,通过多次观察来确认障碍物位置,然后逐步完善地图绘制[57] 。随着时间的推移,机器人对障碍物所在的确切位置的判断就会越来越精准。
贝叶斯推断的重要性在于为我们提供了处理不完美数据的正确方法:我们既不丢弃数据,也不全盘相信它是正确的。我们利用它来更新机器人的信念库,通过概率来确定信念库的正确性。
尽管贝叶斯推断的功能强大,但由于人工智能系统经常需要处理大量复杂且相关联的数据,所以要使得贝叶斯推断在人工智能领域得以应用,还需要做大量的工作。为了捕捉数据间的相互关联,人工智能研究人员开发了贝叶斯网络 ,简称贝氏网络,即用图像化的方式来表达数据之间存在的相互关联。贝叶斯网络主要来自朱迪亚·珀尔(Judea Pearl)的研究工作,她是一位非常有影响力的人工智能领域研究专家,在理解和阐明人工智能中概率的作用方面作出了任何人都无法超越的贡献[58] 。图12为我们展示了简单的贝叶斯网络示意,这个贝叶斯网络捕捉到了三个假设之间的关系:你得了普通感冒;你流鼻涕;你头痛。从一个假设到另一个假设的箭头表示它们之间的影响关系。粗略地说,从假设x到假设y的箭头表示假设x的真实性会对假设y的真实性产生影响。例如,你得了普通感冒会影响到你是否流鼻涕,如果你流鼻涕,你有可能得了感冒。这些不同概率之间的关系是通过贝叶斯推断来得到的。如果你想深入了解细节,请参见附录C。







本书评论