5.2.1 众包的案例
开源、分享、大众参与的众包工作方式,一经提出就受到了各个行业的大力推崇。现如今,众包已经遍布我们社会生活中的每一个角落。下面,让我们来看一些众包的例子。
1. Clickworkers
Clickworkers(点击工人)是最早的众包项目之一,通过大量用户的点击,Clickworkers 可以帮助科学家分析火星图像。科学家们为了寻找水存在于火星的证据,需要在卫星图像上识别和测量地貌,比如环形山、山脊、峡谷等,这是一项乏味冗长的工作,需要雇用大量的人力才能完成。行星地质学家弗吉尼亚·古立克(Virginia Gulick)和 NASA(美国国家航空航天局)的软件工程师鲍勃·凯恩斯基(Bob Kanefsky)突发奇想,希望将开源软件的思想用到火星图像分析上,将这些任务放在网上,并“外包”给大众来做。但是,凯恩斯基很快又有了退却的念头:“这些大众能分辨出新的环形山和退化的环形山的差别吗?这对于未经训练的人来说的确是个不小的挑战。”⁴
不过,总归要试一试,于是他们决定先做一个试验来测试一下大众的能力。他们将古立克已经识别、测量和分类好的一共 8.8 万幅火星图片拿出来交给大众,让他们再次识别、分类。由于已经有了标准答案,他们就可以检测大众的能力。NASA 将这个资料库发布到了网上,让那些时刻关注网站的业余天文学家帮助专家来分析图像。他们将这个项目命名为“Clickworkers”(点击工人)。令人吃惊的是,不到一个月,上千名参与者就成功分析了资料库里面的所有图像。大众得到结果的速度比专业人士的速度更快,同时准确度又相当地高——所有的分析结果都与标准答案极其匹配。这让古立克和凯恩斯基兴奋不已。2001 年,NASA重启了 Clickworkers 计划,但这次是动真格的了。志愿者们负责的工作是从美国火星勘察器上传回的上千幅高清图像分析地貌。每个人每天花费 10 分钟的事却帮了古立克的大忙。他们为科学研究做出了真正的贡献 ⁵。
2. 搜寻马航 MH370
2014 年 3 月 8 日凌晨,马来西亚航空公司由吉隆坡飞往北京的 MH370航班起飞后不久就与地面失去联系,机上 239 名乘客下落不明⁶ 。这一事件迅速引起了世界各国的广泛关注,搜救行动也随即展开。例如,美国 DigitalGlobe 公司调动了旗下所有的 5 颗卫星对失事海域进行拍摄。
这 5 颗卫星每天可以采集 300 万平方公里的高分辨率影像 ⁷。然而接下来的问题就是,这么多高清晰卫星图片该由谁分析呢?答案是:众包!
Tomnod 是 DigitalGlobe 公司于 2013 年收购的一家致力于众包的团队,与 Clickworkers 类似,Tomnod 借助众包的力量实现对遥感影像的分析。在马航事件之前,DigitalGlobe 公司曾使用 Tomnod 平台利用众包的力量成功搜寻帆船“妮娜号”,标注台风海燕袭击菲律宾期间受损的建筑民宅等。3 月 11 日,在 Tomnod 页面上开设马航 MH370 失联客机专题页。如图 5-3 所示,在该页面上,事故海域的影像被分割成数个方块并编号,访问者可以通过对某个编号影像的标记,表述自己的判读结果,如标记海面油膜的发现、飞机残骸的发现等。然后 Tomnod 会通过后台对同一区域多个用户的判读结果进行统计分析,一旦足够多的人标记同一个影像,Tomnod 专业团队将会审查确认,并统计排在前十位左右的最为可疑的地区,并与有关政府机构共享信息。随着更多信息的出现和搜索半径的扩大,网站也会及时更新影像数据。⁸
据 Tomnod 众包平台提供的统计数据,在页面开放的第一天,至少 60万人登录网站排查图片,累计点击量超过 650 万次。截至 2014 年 3 月14 日,该网站吸引了 300 多万人,对 290 多万个特征点进行了标记。
上传的卫星图片获得超过 2 亿 5 千万的浏览,平均每个像素点被肉眼至少检查过 30 次。截至 3 月 19 日,Tomnod 众包平台注册用户几近翻倍抵达 48.5 万人,地图阅读量翻了 3 倍,超过 4.8 亿次,众包参与者人数则达到了 630 万。⁹ 此外,访问者还可以通过右下方的“Share this Map”来分享该区域的影像到社交平台或者发送给朋友,来共同分析探讨,为搜寻线索贡献力量。
尽管这个众包项目最终并没有找到失踪的 MH370,但是它无疑向我们展示了大众注意力的威力。
3. 红气球挑战赛
2009 年 12 月 5 日,美国国防先进研究项目局(DARPA,互联网的早期诞生地)为了纪念互联网诞生 40 周年,举办了一场别开生面的比赛。
这个比赛要求参赛队要在尽可能短的时间内寻找到散落在美国各地的10 个红色气球(如图 5-4 所示)。参赛队可以通过众包的方式,将任务分配下去,并要求找到红色气球的人上报他们的位置结果。第一个找到全部 10 个气球的团队获胜,并会得到 40 000 美元的奖励。该比赛的目的就是要测试人们通过互联网组织大量群体以及各种社会资源解决搜寻问题的能力。¹⁰
最终,来自 MIT 的研究团队“Red Balloon Challenge Team”在仅耗时 8 小时 52 分 41 秒的情况下,找出了全部 10 只气球的地点,赢得了 4 万美元的奖金。值得一提的是,MIT 团队在开赛前几天才得知该项挑战赛。
他们采用了一种递归激励的方式将参与者的利益与赢得比赛这一目标紧密地结合了起来,如图 5-5 所示。具体来讲,他们的方法如下:对于每个气球,他们承诺,奖励第一个告知这个气球地点的人 2000 美元,奖励把找到气球的人邀请加入团队的人 1000 美元,然后奖励前面这个邀请人的邀请人 500 美元,以此类推。剩余的奖金将被捐赠给慈善机构。
就是通过这 种方式,他们在短时间内构建了一个庞大的社会网络。
为了辨别可能出现的故意误导地点(实际上也确实发生了,有些参赛团队甚至故意采取这个策略以扰乱其他团队),他们制定了两个策略:第一,观察气球提交地点模式——故意误导通常都局限在同一个地点;第二,比较气球地址和报告人的 IP 所在地址——不一致可以判定为误导。
据赛后 MIT 团队统计,他们的递归激励方式构筑的邀请链条最长达 15个人,扩散团队信息的推文有 1/3 来自美国本土以外,共计有 5000 多名参与者,其中包括一些美国本土以外的人,而且平均每名参与者又将他们团队的信息通知了 400 名朋友,总计大约有 200 万人帮助他们寻找红气球。¹¹ 在如此仓促的准备时间下能取得巨大成功,不得不说,这真的是一个了不起的奇迹!
4. PolyMath 项目
从 Clickworkers 到搜寻马航,再到红气球挑战赛,所有这些众包项目的普遍特征是,它们都是由一系列很小而且彼此独立的任务组成的,我们可以将这些微任务分发给网上的大众。但是,显然还有很多的任务并不具备这种特征,任务的完成需要一个阶段一个阶段地进行,例如数学定理的证明。众包方法是否也适用于这类问题呢?
答案是肯定的,PolyMath 就是一个致力于用众包方法进行数学定理证明的项目。2009 年,数学家威廉·蒂莫西·高尔斯(William Timothy Gowers)在他的博客上发起了一个不寻常的试验,他试图利用众包的方式完成组合数学中著名的 DHJ(the density Hales-Jewett)定理的证明。
在当时,数学家们已经找到了一个证明方法,但这个方法冗余而乏味,并不能为人们提供深刻的洞察。于是,高尔斯希望通过众包的方式找到全新的证明方法 ¹²。
在高尔斯刚刚发布这个证明邀请的时候,仅仅有少数数学家进行了一些简短的评论。然而,仅仅 37 天后,这个帖子就有了 800 个重要评论。
就这样,全球各地的数学家们零散地贡献着自己的想法和评论。3 个月的时间过去后,高尔斯发现 PolyMath 的参与者们已经找到了一个特例的证明,而这个证明是可以推广到整个定理的。此后不久,就在高尔斯他们撰写论文的时候,加州大学的研究生蒂姆·奥斯丁(Tim Austin)就宣称在 PolyMath 重要思想的影响下,他自己也独立地找到了另一种新的 DHJ 定理证明方法。
与以往的数学问题求解不同,PolyMath 项目并没事先进行任务分配和层级化管理,而且整个证明全部是公开透明的,这在人类科学历史上还是第一次,也是有史以来第一次利用众包方式求解这么难的问题。
本书评论