1995年冬天的一个傍晚,闲来无事的加州理工学院教授斯科特·E·佩吉(Scott E. Page),建立了一个电脑模型,尝试用“人工代理”来解决难题,“人工代理”是根据设定的代码命令互动的小型电脑程序。这样的电脑模拟对经济学家来说很有价值,因为这些模拟提供了一个可控环境,用于测试人类——这种最难预测的种族——如何在诸如金融市场这样的复杂系统中互动。
佩吉用两组人工代理进行模拟。一组代表最完美,最聪明的解决问题者;我们叫它“高智商组”;另外一组代表各种各样的人,他们解决问题的能力各不相同,有的很有才干,但绝大部分不是这样。实验的结果让佩吉大感惊讶,就好像在某所中等大学的教师休息室里,人们会对“穿棕色袜子”①的人不屑一顾。但实验结果却是,“棕色袜子”的表现胜过高智商代理。按理说,一批随机挑选的数学家怎么会超过高智商中最高智商的人?佩吉决定修改一下他的模拟,改变代理的互动规则,然而,他得到了同样的结果。对这个结果,佩吉仍持有怀疑态度,他用另一种计算机语言重写了程序,结果“棕色袜子”还是赢了,一次又一次。
佩吉想知道这是为什么。
就这样,从一个研究突破开始,佩吉开始了长达十多年的专项研究,这一切在2007年开花结果,他出版了一本书,名为《差异性:多样性如何塑造更好的组织、公司、学校和社会》。在书中,佩吉运用逻辑句法和数学精度分析了迅速成长的“集体智能”这一领域。据此,佩吉创造了一个理论框架,解释了为什么群体常常胜过专家。为什么“棕色袜子”能够持续击败高智商代理——“棕色袜子”不如高智商成员那么有才干,但他们有更好的东西:多样性。
这样的一些试验结果奠定了“多样性胜于能力学说”的理论基础。在一定的条件下, “一些随机挑选的解决问题者胜过一群最好的解决问题者。”佩吉理论的核心是:高能力的人是
一群同质化的群体,他们当中很多人在同样的机构里接受培训,可能拥有相似的观点,在解
①西方国家认为穿西服配棕色袜子的人很没有品味,代指在某些方面表现差强人意的人。
决问题时采用同样的技能或者同样的研究方法。总体来说,他们的确比大众优秀,但仅限于某些方面。而许多问题无法仅靠一种思路解决,即使是一组类似的方法也不行。解决这些问题需要“棕色袜子”去尝试一种“精英”绝对想不到的方法。这种理论不仅是种比喻,也不是那种十年后对错未定的有趣发现,它是在逻辑上经得住推敲的真理。
理解“集体智能”最重要的是理解认识的多样化。为了解决问题,预测结果,或者帮助公司制定战略,需要将大众的知识利用起来,这类尝试是众包最主要的应用之一,集体智能则是其中不可缺少的组成部分。
集体智能是团体认知的一种形式,蚁群行动起来就像是一个器官里的各个细胞,在蚁群中发挥作用的就是团体认知。这点我们还能在人类的选举中看到:上百万人的选择产生一个结果。从20世纪初期开始,社会学,行为心理学,乃至计算机科学的学者们,都开始研究这一现象。但在互联网出现后,集体智能有了新的用处,原因很简单,在推动集体智能的发展方面,互联网居功至伟。
众包应用“集体智能”主要是通过三种形式,第一是预测市场,或者说信息市场。在这里,投资者根据自己期待的结果,比如总统竞选胜出者或者奥斯卡最佳影片的获胜者,购买某种“期货”。它的功能很像股票市场:人们开户后,以现行的市场价格买卖股票。
如果投资者低买(也许“最佳影片”有黑马入围),一旦他猜对了,就能大捞一笔。比如,判断2008年美国大选占上风的党派,最好的方法不是根据票数,也不是威望,而是《Slate》杂志上的图表,它反映的是候选人在预测网站Intrade的期货市场上的相对价格。(Intrade显示,在2008年2月,首轮投票选举的星期二后,巴拉克·奥巴马领先于希拉里·克林顿,全国投票几周前,奥巴马的财富有所增加)。
第二种形式,是解决问题,或者叫众播①。需要帮助的人将问题在网络上公开,这样问题就会被一些身份无法确定,但可能帮得上忙的人看到。“创新中心”就是一个这样的例子,它拥有分散在各地的14万名科学家,为世界500强公司解决棘手的研发问题。
第三类是“点子汇”,基本上类似于网上的集体讨论会,只不过要花几周时间而非几个小时。“点子汇”和众包很像,只是前者对提交内容的要求更为开放。这些点子不是为了解决某个特定的问题,而是用于创新。有人指出,这就像互联网上的建议箱,仅此而已。但并不是互联网实现了众包——它只是极大的改善了众包的效果。
集体智能在实践中的应用胜过理论,比如人们常提到的维基百科,虽然它的结果看上去①以竞赛的方式,处理现实中的公司问题,设计出产品与服务。大公司正在接受这种竞赛,用它收集未来商界领袖的创意,以保持竞争优势。
是违背直觉的,有悖于我们一直认为的世界运转的方式——比如说,一般来讲高智商的人应该总是胜过“棕色袜子”,其他事情同理。但互联网提供了一个机会,让我们能重新思考人类对自我行为的理解。因此,在了解集体智能在众包中的应用之前,我们先试着用理论来解释一下为什么它能行得通。
众包植根于一个平等主义原则:每个人都拥有在别人看来很有价值的知识或才华。广义来说,是众包作为桥梁将两者联系起来。也就是说,每个人都拥有自己的特质,每个人都站在众包的中心,这也是违背人类惯性思维的。
我们的特点在于,人人都是环境的天然产物:出生地,家庭,地理环境,经历,以及其他无数在奇怪的熔炉中结合在一起的变量,这些制造出独一无二的个体。这种独特性存在于一大群人中时,就叫多样化。在近20多年的同一性政治(Identity Politics)中,这个词被强加了很多令人遗憾的精神负担。但就众包而言,将概念上的多样化和政治中的多样化区分开是很重要的。学者和企业家们发现,我们的差异之和是一种无限强大的力量,可以用来解决问题,开发新产品,或者仅仅让网络和现实世界都变得更加有趣。17世纪的哲学家迈克尔·蒙田(Michel de Montaigne)曾写到,“世界上没有两个人的意见完全相同,正如两根头发,两个谷粒都不尽相同。差异性是他们最普遍的特性。”蒙田的意思是,我们唯一的共同之处就是我们全然不同。在网络时代,这是件很棒的事。
小改动带来的大不同
奈得·格利(Ned Gulley)正在从事关于群体智能(Group Intelligence)的实验和研究。格利是迈斯沃克软件有限公司的软件设计师,著名的MATLAB软件就是这个公司研发的,该软件被数学家和工程师们用于解决极为复杂的计算问题,其复杂程度让大多数人瞠目结舌。1999年,公司决定举办一个程序设计竞赛。之前的竞赛都是通过邮件进行的,但评选获胜的参赛程序是一项繁杂而乏味的工作。因此格利建议,再举办一个网上竞赛,对这些程序进行实时评级。
公司的目标是:“为MATLAB用户提供一些娱乐活动,同时鼓励大家相互交流优秀的程序。”从人们开始使用电脑之日起,编程竞赛已经成为黑客文化的一部分,原因是:竞赛让技术的提高过程变得像游戏。早在20世纪70年代,大学的计算机系就开始举办各种各样的竞赛,而一些日常生活中的比赛出现的更早。
迈斯沃克公司正在重新发扬这种令人尊敬的传统。乍看之下,格利的建议和传统的方式如出一辙。选手要解决的问题是被称作“销售员路线的问题。”这是一个经典问题:假设一个销售员要走过N座城市,选手要找出一个包含所有给定城市的最短路程的环路。参与者可以提交算法,或者计算机代码,通过一些步骤来引导销售员。比赛在十天后结束,谁的代码最有效率,谁就是获胜者。
但是,格利加了一点小小的改动:为了创造出更好的方案,比赛允许参赛者“借鉴”他人的代码——每个方案在提交后,会很快被打分,排名,然后公布在网页上,其他选手都能看到全部的程序代码。他们可以把最好的代码剪切粘贴,然后加入一些改动重新提交,即使这类改动很小也没问题。如果这种微调能让代码变得更好,那么即使这位选手只改动了几行,也能上升到第一位。
格利说,结果和实际的软件研发过程像极了。“在一个办公室,很多研发人员聚在一起,如果一个人解决了某个问题,大家会围拢在一起看看他是怎么做的,然后恍然大悟的发出一声感叹,再把这个加入他们自己的代码中。”他说。“在我们的文化中,有一个流传很广的谬误,是关于托马斯·爱迪生的,人们认为这个聪明的人会带我们走出困境,当他走进房间,出来后就有了一个绝妙的点子。”实际上,他的大多数突破都是集体努力的成果。格利说“我想要举办一个竞赛,更好的模拟人们的创意遍布全球的真正方式。”
有一点要说明,与其说MATLAB的竞赛是一个众包的例子,不如说它证明了众包如此有效的原理。在这个例子中,它更接近于佩吉的人工代理试验,而不是TopCoder的软件研发方法。后者还利用众包创造出了有别于学术界的产品。
这种对抄袭的鼓励不但没有离间MATLAB的用户,反而让他们前所未有的着迷于自己的工作。来自爱尔兰的选手内森写信给格利说,在最后准备提交代码之前,他激动的浑身颤抖,他为这种情况感到苦恼。
那些最投入的选手们,为了拔得头筹推迟了假期,有的还逃课,甚至抱病参加比赛。格利称MATLAB的竞赛为“上瘾的合作”,这正好呼应了杰克·休斯对TopCoder的描述:“竞争性合作”。
“某个程序员为了修改一个目前获胜的优秀代码,会花一整晚的时间。”然后某个人跟上,再做些微调,接着,他们成了第一。而当初那个程序员也许会想‘这个混蛋!他不过是通过复制我的代码把我踢出局而已。’所以,第一个程序员为了夺回第一的宝座,继续在这个已经改进过的程序上再加入一些改动。” 格利说,“比赛的最终目标不是获胜,而是想出一个让其他所有选手大开眼界的绝妙改动,这就像是一个以声誉为基础的追分系统。”
然而,MATLAB的不同凡响之处,不在于它激发了这股热潮,而是在这十天里,所有人的知识产权被公众随意的反复使用,结果这十天的喧嚣被证明是一种解决问题极其有效的方法。
从1999年开始,公司每年都要举办两次这样的竞赛。格利说,在竞赛快结束的时候,最好的代码比第一天的代码强一千倍。这就是为什么实践让理论奄奄一息。我们如何解释这样让人惊讶的进步?很显然,一切都是因为大众的出现。一群很聪明的程序员合作,最终创造出的方案肯定比他们各自能拿出的最好方案更好。还有一点也很清楚,想法的自由交换促成了整个过程,帮助孕育了一个合作的环境,在这个环境里,好的想法可以变得更好。但这些都无法解释,为什么更有效率的算法相继出现,走势形成一个指数弧线。
有一点很引人注目,最好的程序员做出的贡献并不一定是最有价值的,新手常常给出一些至关重要的改进,带来突破。或者引用格利的话说:“有时候,一个脚本少年(黑客行话,指那些没经验,刚出道的黑客。)想出的改动,会令爱迪生都不得不擦亮眼睛说‘哇!’”
换言之,“棕色袜子”再一次打败了高智商组。这可能又不符合惯性思维,但实际上,在佩吉进行电脑代理竞争试验前50年,解决问题的分布式网络力量已经有所体现了。
多样化与市场
经济学家F.A.海耶克(F. A. Hayek)最著名的成就是,构筑了玛格丽特·撒切尔和罗纳德·里根的自由市场政策,当然,也有人因此对他不满。
海耶克在世纪之交出生于维也纳,希特勒和斯大林执政之时,他已经是享有盛誉的经济学家了。在伦敦经济政治学院,海耶克对计划经济的弊端大加指责,而当时纳粹和苏联政府采用的都是这种经济模式。海耶克认为,市场是一个高效率的机构,它有能力协调经济活动,任何个人或专家尝试干涉它的行为都会带来负面影响。和其他同时代的经济学家一样,海耶克也支持亚当·史密斯关于市场“无形的手”的说法,并为此做了很多事。1974年,因为这个课题的部分研究,他获得了诺贝尔经济学奖。撒切尔夫人和里根都是海耶克的朋友,他从来不想树敌,但争议甚嚣尘上,逐渐掩盖了他的诸多贡献。
在1945年的论文“社会中知识的使用”中,海耶克评论道,那些既不存在于学术界也不存在于公司会议室的知识,那些“某个特殊时空环境下的知识,”社会是无法对这样的知识做出恰当评价的。这样的“局部知识”,现在一般叫“私人信息”,让几乎每个人都拥有自己的独特优势,因为他拥有独一无二的信息,这样的信息可能会创造出有益的用途。” 但如何获取这些分散信息的研究尚未完成。海耶克写到:
“社会的每个成员只能拥有全部知识中的一小部分,因此,对于社会上其余的大部分工作,人们都无从得知……文明之所以存在是因为我们都能从不知道的知识中受益。文明可以帮助我们战胜个人知识的局限,方法之一是改变无知,但并不是通过掌握更多的知识,而是通过利用那些已经存在并将继续广泛分布在大众当中的知识。”
这是在互联网出现之前写的,互联网在汇聚和利用离散信息的能力上,超出了海耶克的想象。MATLAB竞赛是一个很好的实践,试着证明了海耶克的中心论点:对于我们最棘手的问题,大家可能有自己的方法,但摆在我们面前的计划是,将所有的知识汇聚到一个中央仓库。当格利将MATLAB竞赛的开放式设计说成是“逗弄对方,让他说出自己的私人信息”,正是借用了海耶克经济学理论,而这并不是巧合。
格利煞费苦心的搜集了大量的研究资料,从这些资料中他得出结论,为什么这种“上瘾的合作”会如此有效果。
通过线性分析,格利断定,在一段较长时间的微调后,事物会发生质的飞跃。“人们会从代码中找出漏洞,就像鬣狗对动物残骸感到不安,他们会想尽办法折腾,直到某人出现将残骸移走,它才能恢复常态。”
格利创造的图表大概也很容易描述动物的进化过程。基因的突变并不遵循这个线性图,但它的特点也是小的改变和大的飞跃——这是一个由进化生物学家斯蒂芬·杰·古尔德和奈尔斯·艾垂奇发现的“间断平衡学说”的理论核心。
在一些令人信服的证据基础上,格利必然会对这些相似之处有所察觉,并且相信,他掌握的关于MATLAB竞赛的这些资料,很可能会揭示出在社会学和生物学中,事物是如何发展进步的,以及相关的一些更深入的真相。
“在历史课上我们了解到,那些伟人,比如拿破仑,都是独行侠。然而现实生活比这乱得多,在这些导致飞跃和改变的事实之间,涉及到某种复杂的相互作用。”历史需要“脚本少年”——也就是“棕色袜子”的出现,用他们独特的洞察力来重新教育每个人,赋予他们一个全新的视角。
“我们有一些确实很聪明的参赛选手,在一个守旧的竞赛中,他们当中的某个人将获得突破性的发现,这可能是最好的解决方法,仅仅因为他们优秀。但在MATLAB竞赛中,人们会立刻出现,聚在一起对程序进行不断的修改。这不是一个人能做到的。而是一大群人,我们有使用这个超级大的集体大脑的权利。如果我们可以开发这个大脑来治疗癌症,才是真正让人惊叹的事。”
此大众非彼大众
在MATLAB这类竞赛中出现的集体智能,其核心是多样性,但仅仅存在多样性还不够,它也需要维护。
当足够多的人聚在一起,比如在一个酒吧或者聊天室,一种神秘的力量就开始发挥作用。人们或者突出他们的差异,分化成对立的阵营,或者为了达成共识而淡化各自的不同。两种现象有同样的网络效果——大众中的多样化减少了。
人类进化了几千年,才成为高度社会化的群体。在许多情况下,人类和平达成共识的能力攸关生死,比如“一只猛犸象冲过来了,我们要冲上去用鱼叉戳它吗?”但当集体智能发挥作用的时候,共识适得其反,比如在众包模型——信息市场和解决问题的网络中。
2004年,詹姆斯·索罗斯基(James Surowiecki)出版了一本书,叫《群众的智慧》。这本书的书名是对查尔斯·麦凯在1841年出版的经典书籍《群众非同寻常的幻想与癫狂》一书的戏谑,这也是对一哄而起的行为进行严厉的控诉,正是这种盲目跟风导致了17世纪30年代荷兰“郁金香热”那样的灾难 (不必说了,“众包”这个词是借用这两位作家的)。然而,群体智能的理论比索罗斯基的书提前了数十年,事实上,近年来这本书又在迥然不同的领域重新流行起来,比如在社会学和商业管理领域。
《群众的智慧》迎合了当下流行的创造力潮流,这是其他涉及该主题的作品没有过的。这本书列举了一批很有说服力的例子,在这些例子中,大众证明了“三个臭皮匠,赛过诸葛亮”。
一群英格兰农村的采购员是怎么猜中获奖的小公牛不足一磅的?一个班的学生们是怎么猜到糖果罐里有多少颗软糖的?游戏节目“谁想成为百万富翁”的观众为什么一直能击败专家?
——都是依靠群众的力量。这样的轶闻趣事散发着神奇的光泽,再加上集体的想象力,常常成为鸡尾酒会和办公间冷水机边的谈资。不幸的是,因为索罗斯基的保守分析,这些都被删掉了。
事实上,大众的智慧并没有魔法,而且这个表述本身有种误导。In fact there’s no magic to the wisdom
of crowds, and the expression itself is a bit misleading.在上述例子中,大众表现出的智慧和“一群人”并不一样,发挥的作用也不一样。“一群人”包含有一组人像一个单元一样行动的意思,比如说“一群人冲破障碍,带着一点歇斯底里的感觉,突然来找作者。”好吧,作者们很少引起那样疯狂的爱慕,但请领会精神。
群体的定义是“一群因共同特点结合在一起的人”。而共同特点太多,会削弱集体智能,它的活跃程度和一群人中多样化的程度,以及他们表达个人意见的能力成正比。为了表现出色,大众根本不能像一群人那样。
多样化要想战胜能力,还有很多必须满足的限定条件。
首先,这个问题必须真的很难解决。没有人需要一群各式各样的人帮他们系鞋带。
其次,大众必须具备随时解决问题的一些能力。如果要设计一个更高效的核反应堆,随机挑选几个坐地铁上下班的人,肯定很难超过一组核能工程师。即使佩吉的“棕色袜子”也是从大学的教师休息室中挑出来的,而不是从电话本上随便挑的。还必须有一些方法,将每个人的贡献汇合在一起,并加以处理,比如MATLAB竞赛的记分和排名引擎。
最后,参与者必须来自一个足够大的人才库,以确保各种各样的方法都有。另外,他们表达自我个性(也就是他们“局部知识”)的能力必须没有受损。
记住所有这些后,让我们重新来看一下那些乍看不符合惯性思维的例子。比如“糖果罐”:随机挑选更多或更少的学生,都会带来不同,他们会采用一系列策略来解决问题。在这个案例中,聚集机制就是老师收集大家的答案,计算出平均数的能力。但关键是要求学生不参考同桌的答案,独立写下自己的猜测。(MATLAB参赛选手在盗取别人的代码时,不会参考太多意见,彼此隔离保留了他们的多样化。)
现在让我们再来看一下,在游戏节目中,观众答对超过90%的问题的能力。
在“谁想成为百万富翁”这个节目中,选手需要回答15个难度递增的问题。如果全答对了,就会赢得100万美元。问题是多选题,有4个备选项。当他们被难住的时候,可以选择“救生索”,也就是打电话给朋友——估计是比较博学,类似百科全书的那种;或者求助观众。前者的表现让人惊讶,答对的几率是65%;而观众远胜于此,他们的正确率是91%,最优秀的一名选手都强得多,实在令人印象深刻。
这似乎是一个充分的证据,证明群体的智慧胜过其中最聪明的人。但这只是一个例子罢了,它实际是一个简单的算数题:即使一小部分人拥有正确答案,这组人也会准确的将结果预测出来。因为,佩吉写道“错误互相抵消了,正确的答案像奶油一样浮了上来。”这点也很容易解释,比如节目里曾有这样一个问题,雪尔帕人和廓尔喀族是哪个地方的人?A.尼泊尔B.摩洛哥C.厄瓜多尔D.俄罗斯。如果只有4%的观众知道正确答案是A.尼泊尔,剩下的观众可能会从在四个答案中随意猜测,结果是24%的观众猜摩洛哥,24%猜厄瓜多尔,24%猜俄罗斯。但有28%的观众会猜尼泊尔。
当然,猜测这些零碎的问题和改进一个比这上千倍的编码有着巨大的差异。后者不仅让人终身难忘,而且挑战了信仰。但同样的环境——也就是说多样化和合适的条件——对两个例子都适用。
表面上,MATLAB大概能吸引到大部分高智商的程序员。换言之,这是一个根据解决问题的能力而自我筛选的群体,毋庸置疑,最有才华的MATLAB程序员中,有很多人都参与过这个竞赛。
但在多年使用MATLAB计算机语言的过程中,最好的编程员们学到的是相似的技巧和捷径;而缺乏经验的编程员——那些外行——不得不自己想出一些捷径,这便带来了认知上的巨大飞跃,让最终获胜的方法比最初的方法强一千倍。
如果英雄所见略同——在很多场合确实如此——那么其实它只反映了一种思维。或者像佩吉说的,“两个人也不比一个人好,假如他们俩想的一样的话。”一个多样化的群体会为问题带来很多不同的解决方法。他们是如何将这些方法应用到现实问题中的?——这比带领一个销售员通过几个城市要复杂的多——这是我们下一章的主题。 |