数据如何共享
AI应用依赖数据,数据越多、越广,AI优化的效果就越好。目前的数据都是一个一个的孤岛,占有数据的机构不一定能最有效地利用数据。目前占有数据的企业没有动力把自己的数据分享给别人,要解决数据共享必须解决以下两个问题。
第一,动力机制。共享的好处是什么或者不共享的坏处是什么?一个方案是建立数据交易平台。提供数据可以赚钱,使用数据要付费。这里的核心是根据数据的数量和质量对数据进行定价。
第二,隐私与安全。企业的数据涉及用户隐私或企业机密。用户的身份信息必须隐掉,这样即使信息被破解也无法对用户造成伤害。企业的数据也需要加密,这样即使数据共享平台也无法看到信息。如何既能加密又能使用数据则是目前的一个研究热点。以目前的分布式数据技术,企业的数据不必离开自己的服务器或数据中心,这样分享数据的企业心里更踏实。
同样的道理,政府也应该根据上述原则尽可能公开数据。这些数据本来就是公共资源,是比金矿更好的资源,金矿一个人挖完了第二个人就挖不到了,数据矿可以让成千上万人用不同的方法挖到不同的宝贝。
本书评论