关键在于分享什么
到目前为止,监管机构主要关注的是规模效应和网络效应,它们尚未了解反馈效应对市场构成威胁的严重性。建立在反馈数据基础上的机器学习系统,用它所提供的服务“购买”更多的数据进行创新,其购买成本会随着用户基数的增长而降低。这种感觉就像奇妙的炼金术:将一种通过使用而产生的副产品转化为改进所需的原材料,这就像将铅转化为黄金一样。
这对市场竞争有巨大的影响。由于其庞大的客户基础,现有企业占有大量的反馈数据流,因此它也拥有强大的、基于机器的、可以随意处置的创新资源。初创企业想要与它们进行有效竞争是不可能的,因为初创公司的反馈数据总量还达不到推动产品开发的要求。
越来越多的专家开始担心,机器学习系统正在破坏竞争,其中包括法律学者埃里尔·埃兹拉吉和莫里斯·斯图克。他们主张在现有反竞争行为规定的基础上,人们应该采取另外一些措施。还有一些人甚至建议,应该强迫大公司像开放源代码软件那样“开放”它们的算法,让竞争对手和普通大众都能接触到这些算法。
对算法开放的呼吁误判了问题的根源,对遏制市场集中起不到任何作用。算法既是学习的方法,也是学习的结果。作为方法,算法在公共领域已经得到广泛的使用。输入自适应系统的数据所产生的具体结果,可能会随着每次系统从新数据中学习到新东西而发生变化。因此,能够接触到这些具体结果,也只是相当于获得了对过去进行一次快速浏览的机会。这就像以货币为基础的市场价格,虽然价格包含一些信息,但它缺乏细节。仅靠算法,还不足以让小竞争者和新加入者与现有的竞争者竞争,因为算法不是自适应数据驱动系统在学习时所需要的原材料。
开放算法的错误不在于分享这个观念,而在于分享什么。监管机构要想确保良好的市场竞争性,就应该提出数据共享的要求,而不是提出算法透明度的要求。为此,经济学家延斯·普吕弗(Jens Prüfer)和克里斯托夫·绍特穆勒(Christoph Schottmüller)提出了一个有趣的想法。他们建议,使用反馈数据的大公司共享这些数据(去掉明显的个人身份标识,并严格保证隐私不会被以不恰当的方式泄露)。在权衡这种强制性数据共享对各种不同情况的影响时,他们认为,在大多数情况下,大家的整体净收益会得到提高,特别是在一个现有企业几近统治相关市场的时候。
本书评论