安居多伦多
  • 多市生活
    • 多市生活
    • 加国税务
    • 旅游度假
    • 生活安全
    • 行车安全
    • 窍门集锦
  • 多市书苑
    • 热门
    • 小说
    • 教育
  • 家居信息
    • 家居信息
    • 房屋保养
    • 房屋贷款
    • 房屋租赁
    • 房屋建筑
    • 房前屋后
    • 家居风水
  • 健康保健
    • 健康保健
    • 饮食起居
    • 食品安全
    • 健身锻炼
  • 书苑账户
    • 书苑登入
    • 书苑注册
    • 忘记书苑密码
    • 书苑账户信息
    • 关于我们
    • 联系我们
    • 隐私政策
多伦多书苑
在线书籍:随时阅读,随身听书。
所有书籍 | 人文 | 人物 | 人生 | 健康 | 儿童 | 医学 | 历史 | 历史 | 古典 | 哲学宗教 | 商业 | 外国 | 寓言 | 小说 | 教育 | 风水 | 管理 | 语言 |
为使本公益资源网站能继续提供免费阅读,请勿屏蔽广告。谢谢!报告弹出广告被滥用。
  1. 安居多伦多
  2. 网上书苑
  3. 文学
  4. 科普
  5. 暗知识:机器认知如何颠覆商业和社会

暗知识:机器认知如何颠覆商业和社会

2022-05-18 0人点赞 0条评论
点赞
x
语速1.0: 2.0
进度0:

上一页   |   返回目录   |   下一页

贝叶斯学派——机器从结果推出原因的概率

符号学派认为有因必有果,有果必有因。贝叶斯学派问,因发生果一定发生吗?感冒是发烧的原因之一,但感冒不一定都发烧。贝叶斯学派承认因果,但认为因果之间的联系是不确定的,只是一个概率。

我们的经验中比较熟悉的是当一个原因发生时结果出现的概率,例如你感冒后会发烧的概率,但我们的直觉不太会把握逆概率,即知道结果要求推出原因的概率,也就是要判断发烧是感冒引起的概率。贝叶斯定理就是教我们怎么算这样的概率。举个例子,某人去医院检查身体时发现艾滋病病毒呈阳性,现在告诉你一个艾滋病人检查结果呈阳性的概率是99%,也就是只要你是艾滋病人,检查结果基本都是阳性。还告诉你,人群中艾滋病患者大约是0.3%,但所有人中查出阳性的人有2%。

现在问得艾滋病的概率多大?你的直觉反应可能是,要出大事了!现在我们看看贝叶斯定理怎么说。贝叶斯定理如下:

P(得艾滋病|检查呈阳性)=P(得艾滋病)×P(检查呈阳性|得艾滋病)/P(检查呈阳性)=99%×0.3%/2%=14.85%。

也就是说即使他检查呈阳性,他得病的概率也不到15%!这个结果非常违反直觉。原因在哪里呢?在于人群中查呈阳性的概率远大于人群中得艾滋病的概率。这主要是由于检测手段不准确,会“冤枉”很多好人。所以以后不管谁查出了什么病呈阳性,你要问的第一件事是检查呈阳性和得病的比率有多大,这个比率越大就可以越淡定。所以贝叶斯定理告诉我们的基本道理是:一个结果可能由很多原因造成,要知道一个结果是由哪个原因造成的,一定要先知道这个原因在所有原因中的占比。

一个好的医生知道,要判断病人是否感冒,只看是否发烧这一个症状不够,还要看是否有咳嗽、嗓子痛、流鼻涕、头痛等症状。也就是我们要知道P(感冒|发烧、咳嗽、嗓子痛、流鼻涕、头痛……)。贝叶斯定理告诉我们计算上面的概率可以通过计算P(发烧、咳嗽、嗓子痛、头痛……|感冒)获得。为了简化计算,我们这里假设发烧、咳嗽、嗓子痛、头痛这些症状都是独立的,互相不是原因(很显然这个假设不完全对,很可能嗓子疼是咳嗽引起的),这样P(发烧、咳嗽、嗓子痛、头痛……|感冒)=P(发烧|感冒)×P(咳嗽|感冒)×P(嗓子痛|感冒)×P(头痛|感冒)×……

这里每一个概率都比较容易得到。这在机器学习里叫作“朴素贝叶斯分类器”。这个分类器广泛应用于垃圾邮件的过滤。我们知道垃圾邮件往往会有“免费、中奖、伟哥、发财”这类词汇,这类词汇就相当于感冒会出现的症状,垃圾邮件就相当于感冒。过滤垃圾邮件变成了判断在出现这些词汇的情况下这封邮件是垃圾邮件的概率,也就是通过统计P(出现“免费”|垃圾邮件),P(出现“中奖”|垃圾邮件)等的概率,来算出P(垃圾邮件|出现“免费、中奖、伟哥、发财”……)的概率。

同样的原理还被广泛应用在语音识别上。一个单词有各种各样的发音,语音识别就是听到一个发音判断是某个单词的概率。如果我们把“吃饭”这个词的天南地北男女老少的发音都收集起来,统计出“吃饭”这个词和各种发音的频次,我们听到一个发音“洽碗”时,就可以判断是否在说“吃饭”。为什么说贝叶斯朴素分类器是机器学习呢?因为它是通过采集大量数据统计出每个单词和它们分别对应的发音的频率来判断一个发音是什么单词的。这些数据越多,判断的准确性就越高。

在这个例子里,“知识”是知道当一个结果发生时是哪个原因造成的。这个知识被清晰地表达为一个条件概率。机器通过统计每种原因的占比来算出从结果到原因的概率。

上一页   |   返回目录   |   下一页

类似书籍

弯曲的旅行:揭开隐藏着的宇宙维度之谜
弯曲的旅行:揭开隐藏着的宇宙维度之谜
隐藏的行为:塑造未来的7种无形力量
隐藏的行为:塑造未来的7种无形力量
情感机器: 人类思维与人工智能的未来
情感机器: 人类思维与人工智能的未来
宇宙观:一场跨越时空的宇宙探秘之旅
宇宙观:一场跨越时空的宇宙探秘之旅
太空旅行指南
太空旅行指南
从卜筮到大数据:预测与决策的智慧
从卜筮到大数据:预测与决策的智慧
Author:

标签: 暂无
最后更新:2022-05-18
< 上一篇
下一篇 >

本书评论

取消回复

©2021 安居多伦多 - 版权所有

本站由 好事来 Hostlike.com 提供技术支持。