只可意会的“默知识”-暗知识：机器认知如何颠覆商业和社会在线阅读

语速55: 80

进度0:

只可意会的“默知识”

由于舌头翻卷速度严重受限，以神经元连接形式存在大脑中的人类知识只有极少一部分可以被表达出来。而绝大部分知识无法用语言表达，如骑马、打铁、骑自行车、琴棋书画，察言观色、待人接物、判断机会和危险等。这些知识由于无法记录，所以无法传播和积累，更无法被集中。英籍犹太裔科学家、哲学家波兰尼（Michael Polyani，1891—1976）称这些知识为“默会知识”或者“默知识”。波兰尼举了骑自行车的例子。如果你问每个骑自行车的人是怎么保持不倒的，回答会是“车往哪边倒，就往哪边打车把”。从物理学上可以知道，当朝一个方向打把时会产生一个相反方向的离心力让车子平衡。甚至可以精确计算出车把的转弯半径应该和速度的平方成反比。但哪个骑自行车的人能够知道骑车的速度呢？即使知道谁又能精确地把转弯半径控制在速度平方的反比呢？所有骑自行车的人都是凭身体的平衡感觉左一把右一把地曲折前进。世界上大概没有一个人学骑自行车是看手册学会的，事实上也没有这样的学习手册。大部分技能类的知识都类似。

默知识和明知识主要有以下四点区别：

（1）默知识无法用语言和文字描述，因此不容易传播，无法记录和积累，只能靠师傅带徒弟。像大量的传统工艺和技能，如果在一代人的时间里没人学习就会从历史上彻底消失。

（2）获取默知识只能靠亲身体验，传播只能靠人与人之间紧密的互动（你第一次骑自行车时你爸在后面扶着）。而这种互动的前提是相互信任（你不敢让陌生人教你骑自行车）。获得默知识必须有反馈回路（骑自行车摔了跤就是姿势错了，不摔跤就是姿势对了）。

（3）默知识散布在许多不同人的身上，无法集中，很难整合，要想使用整合的默知识需要一群人紧密协调互动。由于无法言传，所以协调极为困难（比如杂技叠罗汉）。

（4）默知识非常个人化。每个人对每件事的感觉都是不同的，由于无法表达，因而无法判断每个人感觉的东西是否相同。

基于对默知识的理解，奥地利经济学家哈耶克（Friedrich Hayek，1899—1992）论证了市场是最有效的资源配置形式。因为市场上的每个人都有自己不可表达的、精微的偏好和细腻的需求，而且没人能够精确完整地知道其他人的偏好和需求，也就是说供需双方实际上无法直接沟通。供需双方最简洁有效的沟通方式就是通过商品的价格。在自由买卖的前提下，市场中每个人只要根据价格信号就可以做出决定。价格可以自动达到一个能够反映供需双方偏好和需求的均衡点。一个价格数字，就把供需双方的无数不可表达的信息囊括其中。这种“沟通”何其简洁，这种“协调”何其有效，这种自发形成的秩序何其自洽。哈耶克根据同样的道理论证了国家或政府永远都无法集中这些不可表达的分散信息。

在机器学习大规模使用之前，人类对于默知识没有系统研究。但现在我们发现机器非常擅长学习默知识。这就给我们提出了三个严肃的问题。

（1）默知识在所有知识中占比有多大？

（2）默知识在人类社会和生活中有多大用处？

（3）如何使用默知识？

第一个问题的简单粗暴的回答是默知识的量远远大于可陈述的明知识。原因是事物的状态很多是难以观察的，更多是不可描述的。人类的描述能力非常有限，只限于表达能力极为有限的一维的语言文字。在所有已经产生的信息中，文字只占极少的比例，大量的信息以图片和视频方式呈现。人类现代每年产生的各种文字大约是160TB。世界最大的美国国会图书馆有2 000万册书，几乎涵盖了人类有史以来能够保存下来的各种文字记录，就算每本书有100万字，这些书的总信息量也只有20TB。而目前用户每分钟上传到YouTube的视频是300小时，每小时视频算1GB，每年上传的量就是157 680TB。如果把每个人手机里的视频都算上，那么视频信息是文字信息的上亿倍。今后这个比例还会不断加大。虽然这些视频或图片都是“信息”，还不是“知识”，但我们也可以想象从视频图片中能提取出的隐藏的相关性的量一定远远大于所有的文字知识。

有了第一个问题的答案，就容易回答第二个问题。很显然，用机器学习从视频和图片中萃取知识是人类认识世界的一个新突破，只要有办法把事物状态用图片或视频记录下来，就有可能从中萃取出知识来。如果视频和图片的信息量是文字的上亿倍，那么我们有理由期待从中萃取出的知识呈爆炸式增长，在社会和生活中起到关键甚至主导作用。人工智能通过观看大量人类历史上的影视作品，可以归纳提取出影视中的经典桥段，创作出新颖的配乐、台词和预告片，供人类借鉴或使用。2016年，IBM（国际商业机器公司）的沃森系统为二十世纪福克斯电影公司的科幻电影《摩根》（Morgan ）制作了预告片。IBM的工程师们给沃森看了100部恐怖电影预告片，沃森对这些预告片进行了画面、声音、创作构成的分析，并标记上对应的情感。它甚至还分析了人物的语调和背景音乐，以便判断声音与情感的对应关系。在沃森完成学习后，工作人员又将完整的Morgan 电影导入，沃森迅速挑出了其中10个场景组成了一段长达6分钟的预告片。在沃森的帮助下，制作预告片的时间由通常的10天到1个月，缩减到了短短的24个小时。同样道理，机器学习可以从海量的生态、生产和社会环境数据中萃取出大量的未曾发现的知识。

第三个问题最有意思。由于机器萃取出的知识是以神经网络参数集形式存在的，对人类来说仍然不可陈述，也很难在人类间传播。但是这些知识却非常容易在机器间传播。一台学会驾驶的汽车可以瞬间“教会”其他100万台汽车，只要把自己的参数集复制到其他机器即可。机器间的协同行动也变得非常容易，无非是用一组反馈信号不断地调整参加协同的每台机器的参数。

如果用一句话总结默知识和明知识的差别那就是波兰尼说的：We know more than we can tell（知道的远比能说出来的多）。明知识就像冰山浮出水面的一角，默知识就是水下巨大的冰山。这两类知识也包括那些尚未发现的知识，一旦发现，人类要么可以感受，例如第一个登上珠峰的人能感受到缺氧；要么从理性上可以理解，例如看懂一个新的数学定理的推导过程。