关键在于分享什么-数据资本时代在线阅读

语速55: 80

进度0:

关键在于分享什么

到目前为止，监管机构主要关注的是规模效应和网络效应，它们尚未了解反馈效应对市场构成威胁的严重性。建立在反馈数据基础上的机器学习系统，用它所提供的服务“购买”更多的数据进行创新，其购买成本会随着用户基数的增长而降低。这种感觉就像奇妙的炼金术：将一种通过使用而产生的副产品转化为改进所需的原材料，这就像将铅转化为黄金一样。

这对市场竞争有巨大的影响。由于其庞大的客户基础，现有企业占有大量的反馈数据流，因此它也拥有强大的、基于机器的、可以随意处置的创新资源。初创企业想要与它们进行有效竞争是不可能的，因为初创公司的反馈数据总量还达不到推动产品开发的要求。

越来越多的专家开始担心，机器学习系统正在破坏竞争，其中包括法律学者埃里尔·埃兹拉吉和莫里斯·斯图克。他们主张在现有反竞争行为规定的基础上，人们应该采取另外一些措施。还有一些人甚至建议，应该强迫大公司像开放源代码软件那样“开放”它们的算法，让竞争对手和普通大众都能接触到这些算法。

对算法开放的呼吁误判了问题的根源，对遏制市场集中起不到任何作用。算法既是学习的方法，也是学习的结果。作为方法，算法在公共领域已经得到广泛的使用。输入自适应系统的数据所产生的具体结果，可能会随着每次系统从新数据中学习到新东西而发生变化。因此，能够接触到这些具体结果，也只是相当于获得了对过去进行一次快速浏览的机会。这就像以货币为基础的市场价格，虽然价格包含一些信息，但它缺乏细节。仅靠算法，还不足以让小竞争者和新加入者与现有的竞争者竞争，因为算法不是自适应数据驱动系统在学习时所需要的原材料。

开放算法的错误不在于分享这个观念，而在于分享什么。监管机构要想确保良好的市场竞争性，就应该提出数据共享的要求，而不是提出算法透明度的要求。为此，经济学家延斯·普吕弗（Jens Prüfer）和克里斯托夫·绍特穆勒（Christoph Schottmüller）提出了一个有趣的想法。他们建议，使用反馈数据的大公司共享这些数据（去掉明显的个人身份标识，并严格保证隐私不会被以不恰当的方式泄露）。在权衡这种强制性数据共享对各种不同情况的影响时，他们认为，在大多数情况下，大家的整体净收益会得到提高，特别是在一个现有企业几近统治相关市场的时候。