5.1 占意做功
仔细思考就会发现,人类写软件的过程就是一个将占意转化为信息的过程。然而,在大多数情况下,我们总是要花费大量的金钱和精力来组织、策划大规模软件的创作。占意转化为信息的过程并不是自发形成的,而是需要一种自上而下的组织力量。因此,我们会认为是货币、组织管理催生出这些信息的。
然而,诞生于 20 世纪 80 年代的开源软件运动却告诉我们不需要严密的规划和组织,只要有大量程序员能够将自己高品质的占意放到同一件事上,他们就能够创造奇迹。从 Linux、FreeBSD 软件,到现在异常繁荣的各类开源平台,如今这些开源软件已经演化成为了一个堪与商业软件相媲美的力量。它们是程序员通过消耗占意而产出的产物。撰写软件显然需要更高品质的占意。那么较低品质的占意是否也能够输出功呢?答案是肯定的。
比如,我们在第 1 章介绍的 Biomorph(“生物变形”)小程序,玩家参与者不断地点击自己喜欢的生物体图形,就会迫使它们朝向玩家喜欢的方向不断演化。所以,这种点击流最后就能创造出让玩家欣赏的图形,这就是一种“信息结构”。
Biomorph 是一个简单游戏,而美国新墨西哥州立大学的维克托·S. 约翰斯顿(Victor S. Johnston)教授开发了一个人类面孔生成的程序(如图5-1 所示),将这个占意创造信息的过程实用化了。在人类点击的作用之下,面孔会像 Biomorph 那样不断演化,得到我们要找的面孔 ¹。该程序被洛杉矶警方用于辅助目击者寻找杀人凶手。
首先,约翰斯顿等人将成千上万张人脸进行编码。他们用一个基因编码鼻子的形状,一个基因编码眼睛的大小,再用另一个基因编码额头的宽度等。总之,任意给定一串编码就可以对应一张特定的人脸。之后,与Biomorph 程序一样,计算机随机地选择一串编码就能在屏幕上生成一系列人脸,并让人进行选择。
不过,玩这个程序的人不是普通用户,而是凶杀案目击者。他(她)需要选择一张最像罪犯的脸,而不是一张看起来最好看的脸。人们通常不知道如何描述罪犯的面部特征,但却可以轻松地识别出哪一张脸更像凶手。于是,只要目击者在电脑屏幕前不停地点选那些更像罪犯的脸孔,它就会一点点地把真正的罪犯面孔进化出来。洛杉矶警方真的利用这个程序帮助目击者寻找到了杀人凶手。²
慢慢地,这套方法形成了一个特殊的学科叫作交互式进化计算 ,目前它已被广泛地应用到了图形图像处理、语言和声音处理、工业和艺术设计等领域。
从点击鼠标到敲入代码,不同的用户行为需要消耗不同品质的占意资源。从交互式进化计算,到开源软件,它们都是用户占意资源“做功”的结果。
如今,用户“做功”产生出信息结构已经演化成为一个庞大的家族。人们起了不同的名字来概括这一快速增长的新兴领域:包括众包、人类计算、社会计算、群体智能等,它们都是人类占意“做功”的不同表现形式。
马里兰大学人类计算实验室的亚力山大·J. 奎因(Alexander J. Quinn)和本杰明·B. 贝德森(Benjamin B. Bederson)曾于 2011 年撰文³ 将这些占意“做功”的方法进行了统一的分类,并对每一个分类进行了论述和比较,如 图 5-2 所示。
图中,每一个圆圈都表示一个独立的领域,圆圈之间的交叠则表示了两个领域互相重叠的部分。下面我们就对这张图中的每一个领域进行简短说明,重点在于比较不同领域之间的区别和联系。
众包 (crowdsourcing)是由杰夫·豪(Jeff Howe)和马克·罗宾森(Mark Robinson)于 2006 年在《连线》(Wired )杂志提出来的一个新词,它从外包(outsourcing)的概念扩展出来,主要指把那些传统的由一个人或一个公司完 成的工作利用互联网外包给一大群人的做法。
人类计算 (human computation)是路易斯·冯·安(Luis von Ahn)
于 2005 年在博士论文中提出来的一个概念,主要目的是通过互联网和其他技术手段,将人的智力组织控制起来,用于解决计算机尚无法求解的问题。
社会计算 (social computation),则是指那些有助于帮助人们完成集体行动和社会交互、信息交换以及知识聚集的应用与服务。我们熟悉的博客、微博、Wiki、在线交互社区等都属于社会计算的范畴。相比较人类计算和众包,社会计算更加没有目的性,也不用完成指定的任务。但是,社会计算可以促进人与人之间的社会交互,这是它唯一的目的。
群体智能 (collective intelligence),是指一大群个体集合在一起做出一些看起来具有智能表现的行为。群体智能并不一定限制在人上面,而是一个泛化的系统科学概念。比如,蚂蚁群体可以通过简单的交流与互动而找到食物,并沿着一条最短的路把食物搬运回家。
所以,群体智能是一个更大的概念,并不限于人类的占意“做功”,但是很显然,互联网上的集体注意力也属于群体智能的一种。
数据挖掘 (data mining),是一种从海量的数据中挖掘出一些有价值的信息和知识的技术手段。第 2 章介绍的推荐算法和用户数据分析就是典型的数据挖掘。这种将人的占意转化为信息结构的模式与其他技术最大的区别就在于,它需要先用数据记录下人类的行为轨迹,第二步才是从记录的数据中挖掘出知识,所以它是一种间接的占意“做功”。而众包与人类计算则是直接将人的占意转化为信息结构,而且大多都是实时进行的。
下面我们将重点介绍众包和人类计算这两种方式,通过一系列具体的实例来介绍如何利用巧妙的设计将占意转化为信息结构。
本书评论