科技与数据结合
三大关键科技,数据本体和标注、个人偏好匹配算法、机器学习系统,对市场的这次重新配置起到了至关重要的作用。这三大科技使我们能够:
(1)在比较个人偏好时使用标准语言;
(2)在多个维度上更好地匹配个人偏好,选择最佳交易伙伴;
(3)设计出一种行之有效的方法,来全面捕获个人偏好信息。这三项科技的共同之处在于,它们都能够帮助我们将海量数据转换为行之有效的交易决策。这三大科技不仅提高了我们基于数据的选择能力,而且这三大科技本身也是建立在数据基础上的——这就是数据的核心作用。这三大科技将成为经济革命的根基。
过去,婴儿潮一代(1946—1964年出生的人)去度假时,不得不翻阅厚厚的酒店宣传册,还要与旅行社的人见个面,以确定宣传册上那些华丽的营销文字和炫目的照片是否属实。如果有幸认识在某酒店住过的人,他们很可能会按照那个人的建议做出选择——但这只是特例,而不是常态。如今的情况则大为不同。我们在选择酒店时,首先会对海量的信息进行筛选,包括客户评级、记者评论、以前的客人在网络上发布的照片等。我们可以很快地将酒店的位置、便利设施和服务质量进行比较。而且,在谷歌街景的帮助下,我们甚至可以到那里进行一次虚拟的街区旅行。在价格方面,在线比较可以帮助我们很快找到最优价格,及其具体的交易时间和地点。
同样,以价格为基础租赁汽车,或是在价格的基础上寻找拼车的机会,这样的日子也早已一去不复返了。BlaBlaCar公司在20多个国家已经拥有超过4 000万名会员,公司允许乘客和司机一起从多个维度进行配对,包括他们自己报告的健谈程度——从Bla(“看窗外风景匆匆掠过”)到BlaBlaBla(“聊起来没完没了”),不一而足。因为少有机会协商价格,乘客在选择出行时可能就更关注其他信息了。这种方法吸引了不少爱聊天的人:在我写作本书时,每个月已经有400万名乘客通过这家公司约车了。
信息的这种便捷性是令人愉快的,使信息既方便使用,也方便获得(至少在多数情况下如此)。我们旅行的交易效率得到了提高,因为买家和卖家可以更精确地匹配他们各自的偏好。当然,海量数据不仅涌现在旅游业中,当我们在网上购物时,不论买的是书、电子产品,还是衣服,我们除了要考虑能让我们浏览、搜索、比较产品的搜索工具和过滤工具的精确性,还要考虑其他几十种特性。使这一切运转起来的,并不是我们所使用的技术的速度有多快、成本有多低、存储能力有多强,可用信息量的增加也许是原因之一,但是我们之所以能做出更好的选择,更主要的原因是我们使用了一个有效的方法来标记这些信息,并且将其做了分类。
假设要买一件新衬衫,你上网找到你最喜欢的零售网站,点击“衬衫”,网站会提供给你成百上千条选择。但是,通过关注如下诸多因素:尺寸、面料、颜色、合身度、袖子长度、领口类型,甚至品牌,你可以过滤掉一些选择,或者过滤掉那些你不想要的东西,从而选出自己的最爱。所以,你如果想要一件一字领、七分袖、尺寸为8号、蓝色或蓝绿色,且最好是正在减价促销的棉纱针织衫,就只要做出选择就可以了。如果这个网站没有,你可以转移到另一家零售网站。为你提供这么多关于衬衫的信息,网络零售商是怎么做到的?它们把每件商品都贴上描述其服装特色的数据标签。这就要求商家把所有特定类型的产品,比如衬衫,都贴上同一套类别的标签。这些类别也是数据,但是它们是关于数据的数据,也就是元数据。
这一切并不新鲜。自从亚述人将泥板文献首次贴上描述其内容的标签开始,有关信息的信息就开始成为重中之重。今天,高效的分类已必不可少。没有它,我们几乎无法在网上找到任何东西。然而出于同样的原因,分类的过程也变得更加困难。在只有关系型数据库的旧时代,数据是整洁的,因为每个数据字段都具有明确定义,明确到每个字段的内容都具有精确的格式。然而,自20世纪90年代末以来,数字信息的指数级增长对这一秩序提出了挑战,其中很大一部分信息并不完全适合于数据库领域,它们以电子邮件、网页、图像、音频文件和视频文件等形式出现。
以YouTube为例,它是一个视频内容市场,上传者(卖方)与观众(买方)进行交易,通常由第三方市场参与者(广告商)提供资金。为了确保视频能被观看,观众需要能够轻松地找到内容;出于同样的原因,内容提供者也需要其内容能够被迅速发现。除了视频的标题和上传的日期、时间外,为视频添加标签和关键词也是非常重要的,几乎和上传者选择正确的关键词一样重要。
本书评论