译后记 不要成为自己创造物的奴隶
《数据资本时代》提到了大数据带来的三个重要变化:信息中介沉淀和共享的大量数据,使消费者不再仅仅依靠价格来评估商品的质量;先进的匹配算法可以从价格以外的多个维度更好地匹配供给和需求;海量数据市场的发展必然会到来,并化解分散与集中、多样与统一的尖锐矛盾。《数据资本时代》一书花了大量笔墨,用具体的事例描绘了数据驱动下商业市场正在发生的变化。
人类自己汇聚了越来越多的数据,发明了越来越好的算法,一手缔造了数据与智能时代。然而,我们的创造物本身,以及我们对这些创造物不加分辨地过度使用,例如甚嚣尘上的数据主义和算法主义,也可能给人类带来十分危险的后果。
首先,数据和算法可能破坏中立性和多样性。
表面上中立的技术,也可以产生非中立的结果。我从2007年开始,就一直做个性化推荐方面的算法研究。个性化推荐系统的算法本身是没有偏见可言的,无非是根据消费者个体以前的购买记录,来预测个体最可能购买的东西,然后做推荐。如果你是一个穷人,以前买过的东西都是相应品类中单价最低的,那么你在系统画像中一个名为“价格敏感程度”的维度的得分会非常高!于是,当你搜索一个关键词后,从前到后翻10页,你看到的都是为像你这样的穷人量身定做的便宜货。随着数据化浪潮的进一步发展,我们个人获取和处理信息的难度会进一步加大,我们会更加依赖各种各样的信息中介。例如,当抵达一个陌生的城市,我们如何规划一条一日游的路线?作为一个新手,我们如何利用在线教育平台选修若干课程,从而了解一个新的领域?我们如何在读书的时候就规划和选择自己的职业道路?我相信,高水平的算法会充分考虑你的家庭、性别、民族、消费水平等因素,替你做出“最适合你的选择”。因此,穷人和富人会抵达城市中不同的角落、下载不同的课程、规划不同的人生。在数据的世界中,不同出身的人所获得的信息差异,可能比现实世界的差异还大,从而他们很可能形成截然不同的视角、格局和能力。
伴随信息通信技术的发展,以及数据的累积和算法的优化,表面上我们可以获取的信息总量大幅度增加,我们的世界变得更加多样化,但实际上情况并非完全如此。因为电子商务平台打破了空间限制,很多原本可以在一个小镇、一个转角经营下去的特色小店,却逐渐消失了。除了主要销售畅销书的大型连锁品牌书店以外,具有店主极强个人偏好的特色书店,现在我们基本上找不到了。尽管我们非常推崇“个性化新闻”,但最近几年大家阅读的新闻和资讯实际上都差不多,因为个性化新闻,在很大程度上也是倾向于推荐你所喜欢的品类中比较流行的新闻——毕竟流行起来的内容更有可能包含被读者喜欢认可的元素。数据和算法总以高效和准确为出发点,很多小众的事物因为无法产生规模效应而被算法慢慢淘汰了。如果世界上只有一种语言,那么效率应该最高。实际上,围绕大语种的数据和算法积累越多,小语种的生存空间就越小。最近,每两周就会有一种语言消亡,这也为希望保护文化多样性的当代人敲响了警钟!
其次,数据和算法可能带来新型的垄断和独裁。
维克托在书中已经勾勒出了这样的场景。因为对消费者需求的洞察、对商品特征的全面刻画以及对两者的精确匹配,都需要大量的数据支撑。所以拥有大量数据的“已经成功的公司”,譬如中国的阿里巴巴和腾讯等企业,将拥有一般企业所无法企及的数据赋予的能力。如果没有可匹敌的数据资源,这种能力上的差距是其他企业无论多么努力都难以弥补的,所以,一种新型的垄断方式很可能形成。它事实上使创新型的企业在没有数据积累的前提下,难以在市场中有效竞争,而那些已经成功的企业会获得越来越多有价值的数据,从而让打破垄断的门槛越来越高。
数据还可能带来新型的独裁。随着政府和大型企业对个人数据掌握的深度和广度的增加,如果我们不按照政府和企业“所希望的方式”生活和消费,我们就可能会在社会保障福利、落户就业、融资借贷等方面遇到各种困难。最终,我们有可能反而成了算法的奴隶,必须按照算法设定的目标努力前进。更可怕的是,数据拥有几乎无限的记忆力,因此我们今天的错误可能会带来很长时间难以消除的影响。你上中学时期的一次由冲动引起的打架斗殴;你上大学时因为攀比借了校园贷,却没有及时还款……这些记录,可能在你30岁的时候影响你申请车贷或者房贷,也可能让你在婚介所的系统中无法与心仪的女孩儿进行匹配,还可能让你的创业融资遭遇挫折。在这种被无限记录和分析的情况下,最佳的选择就是按照政府和大型数据企业设定的主流价值观前进,把那些特立独行的念头从根子上删除。
实际上,维克托在展望大数据美好未来的同时,一直没有忘记和这些可能给人类发展带来冲击的危险做斗争。在这本书中,他提出了累进数据共享授权——要求达到一定市场份额的企业必须向社会开放它的数据。在维克托名为《删除》的著作中,他认为个人有权删除他/她在其他系统中存储的自己的数据,并且个人数据必须要有一个有限的期限,超过这个期限的历史数据不能被用来分析和判断当前的人。遗憾的是,我不得不说,维克托的这些抗争手段,其操作执行的难度巨大,它们和企业追求利润的原始冲动相悖。最终,它们也只会像向想象中的巨人和城堡挥剑的唐·吉诃德一样,有一颗骑士的心,却没有骑士的舞台。
我从不认为数据和算法所追求的高效和准确与人类发展的目标一致。至少,在很多已经充分现代化的地区,我不觉得高效和准确能够给人们带来更多的幸福和快乐。我在瑞士留学的时候,欧洲的朋友讲到中国,总有些敌意。这个敌意不是他们看不上我们,而是他们觉得中国人太努力,工作时间太长,工作效率又很高,这样久而久之,欧洲如果想要立足,就必须加倍努力,这样他们从容淡泊的慢生活自然难以幸存。至于那些能够让人更快找到喜欢听的歌、喜欢看的书、喜欢吃的零食、喜欢的女人的算法,我觉得并不会给我们带来真正的幸福。因为寻觅和尝试的过程,甚至随之而来的痛苦和挫败,都是一个自足灵魂和完整人格所必需的。
数据科学家如同英国著名作家史蒂文森笔下的“化身博士”,他既有善的一面,又有恶的一面;既能为人类带来福祉,也能给人类带来伤害。我不相信人类最美好最柔软的部分能够为数据所描述,也不希望某天我们成为自己创造物的奴隶,为了某种被设定的目标沿着被优化的道路前进。遗憾的是,我还给不出任何避免危险的可行方案。或许,我们只能期望那些化身博士的皮肤下,都有一颗扁鹊般的善心。
2018年8月19日
本书评论