返回首页
|
经参·财智
|
经参·思想
|
经参·读书
设为首页
|
加入收藏
经济参考网读书频道
第5章 爆发,无处不在
长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经纪公司的交易;从人和动物的睡眠模式,到魔术师为了保证魔杖时刻停留在空中而做的小动作,所有的一切都证明:爆发,无处不在。 爆发的本质规律:幂律分布 当希特勒开始在政治舞台崭露头角时,早已超过服兵役年龄的刘易斯·弗赖伊·理查森已经从救护小组中退了出来,在佩斯里工业学院(Paisley Technical College)舒舒服服当上了校长。面对德国的军事野心,饱受困扰的理查森在1940 年做出了一个惊人的决定。他辞去了校长职务,选择靠微薄的养老金度过余生。他想专心研究一个问题,而且认为为这项研究放弃丰厚的收入是值得的:他想找出影响战争的规律。 理查森坚信,如果他掌握了产生冲突的原理,就能预防流血事件的进一步发生。他将调查结果记录在他的第二本书《致命争吵的统计数字》(Statistics of Deadly Quarrels)中。跟他第一本研究天气预报的大部头一样,这本书也是连篇累牍,通篇充斥着讨论、公式以及方程式。不过,用这种方法研究有关战争的课题实属罕见。“我认为这是一本数学专著,”跟他同时代的一个人说,“虽然他的研究对象很奇特——就是这项研究使他得到了科学怪人的绰号。” 毫无疑问,没有一家出版社愿意冒险出版理查森这本离奇的书。直到他去世7 年后,这本书才终于出版,但只证明了他预测战争的计划跟预测天气一样,完全失败了。 理查森将1820—1949 年发生的所有知名战争和冲突详细地编纂入目,并一丝不苟地记录了相关细节,比如伤亡人数和参战者的宗教信仰等。他的目标是将专家们发现的战争的传统诱因量化。 ● 经济实力相差悬殊的国家之间是不是更容易发生战争? ● 有共同语言的群体之间是否不易起争端? ● 军备竞赛是不是战争发生的前兆? ● 同样憎恶第三方的两方是否不那么容易打起来? 这些都是战争理论的基本假设,但理查森偏要用高深的数学知识证明它们。最后,他并没有解答出任何一个问题,而是证明了它们都不过是迷思和误解。然后,他以一种近乎残酷的坚定语气总结了自己的研究:“通过这项不朽的研究,我发现几乎没有一项新技术能够找出战争的起因。”数据显示,战争和争端只不过是偶然事件。 我的电子邮件流 我倾向于认为,我发的每封电子邮件都是有目的的,所以发送时间绝对不是随意的。不过,我必须承认对不明就里的旁观者来说,我在2006年8 月18 日星期五那天发的一系列电子邮件都是随意为之。 第一封邮件是在上午8 点49 分发出,另外31 封的发送时间分别为:9 点46 分,9 点49 分,10 点38 分,11 点49 分,11 点49 分,11 点53 分,11 点57 分,13 点46 分,13 点47 分,13 点48 分,13 点59 分,14 点41 分,14 点56 分,14 点58 分,14 点59 分,15 点18 分,15 点20 分,15 点30 分,15 点53 分,15 点58 分,16 点05 分,16 点05 分,16 点07 分,16 点37分,16 点42 分,16 点52 分,17 点05 分,17 点06 分,18点16 分,18 点16 分,以及18 点19 分。 它们只是一系列很容易由随机数生成程序生成的时间戳。如果真是这样,那我的邮件发送模型应该完全符合泊松过程,一种建立在我们所做的每件事都是由偶然驱使的假设基础上的随机事件增量过程。但这一组时间戳真的是随机的吗? 最初5 封邮件中的第一封是在8 点49 分给一个博士后助理的回复,最后一封是11 点49 分发出的,主要内容是我一早上的工作成果。这完全符合泊松过程:3 个小时内发5 封邮件,每两封之间的时间间隔大约是45分钟。而8 分钟后,在11 点49 分和11 点57 分之间,我又连着发出了4封邮件,内容都跟我早上的工作相关。根据泊松公式,在一连串随意发送的邮件中,一封接一封快速发送的可能性仅为0.000 035——也就是说,这种情况每5 个月才会出现一次。也许,那个8 月中旬的星期五不怎么普通。 11 点57 分之后,情况变得正常起来。由于要骑车去学校,再加上午餐,我离开了电脑一会儿。但从14 点41 分开始,我又破了纪录,在接下来的71 分钟里发了11 封邮件。照目前的情况看,这没什么了不起。但如果假设我的行为模型是随意的,根据泊松理论,我这种连珠炮般快速发送邮件的行为要1026 年才会发生一次。鉴于我们推测出宇宙寿命只有1010 年,我那天确实做了件了不起的事。 实际上,那个星期五真的没什么特别之处。如果电脑没有记录我的邮件信息,那天只是再平常不过的一天,事后我也不会记得那天发生了什么事。而且,我的邮件模型也没什么特殊,因为如果我检查一下其他日子的记录,就会发现情况都差不多。 问题是,如果人类行为是随意的话,我的电子邮件流就会均匀分布,但我的通信情况却并非如此。相反,不管是哪一天,在长时间没发邮件之后的一小段时间内,我就会发送大量邮件。事实上,不管哪天检查,我发送邮件的次序都不是随意的,从来都不是。相反,它们往往充满了爆发点(bursts)。 爆发点的出现 20 世纪80 年代后期, 我还在布加勒斯特大学(University of Bucharest)读书,就开始阅读有关混沌理论的书籍,并成了瑞士数学物理学家让- 皮埃尔 ? 埃克曼(Jean-Pierre Eckmann)的粉丝。在他的开拓性研究生涯中,埃克曼成功地将混沌整理成章。他将蝴蝶效应严密化,用无数定律加以证明,而证明过程只有少数能够跟上他那高深复杂的数学语言的专家才能完全理解。2000 年左右,在他写出那本名为《混沌现象和奇异吸引子的遍历理论》(Ergodic Theory of Chaos and Strange Attractors)的书后,埃克曼的研究出现了意想不到的转折。 “有人问我是否能找到‘重篡者’(即历史重篡者或大屠杀否认者) 写的东西,”他说,“虽然我对阅读他们的胡言乱语丝毫没兴趣,但我发现浏览他们的网页是一项挑战。” 因此,他创立了一个能够自动搜索重篡者网页的搜索引擎。当埃克曼的伪谷歌搜索引擎中充斥着反犹太人的言论时,他发现了一个有趣的现象:重篡者的网页频繁地相互链接,形成了一个极易辨认的网络社区。其中只有一个扎眼的异类—— 一位澳大利亚空中观察员的主页。这个主页上有很多重篡者的链接,但它本身的内容却几乎与大屠杀毫不相关。 “我担心我的方法错了,”埃克曼回忆道,“但检查过手头那些网页后,我发现那个主页被引用的原因是它指出在奥斯威辛(Auschwitz)的航拍照片中没有发现烟雾。”重篡者是要以此为证据,证明那里没有烧死人。 埃克曼过去30 年所精通的那些数学方法,每一个都有精密的论证和定理支持,但在面对这个新问题的时候,那些方法仿佛跟捕蝶网面对即将到来的飓风般不堪一击。但埃克曼并未放弃,两年后他又发表了一篇关于网络的论文,重点研究电子邮件通信。首先,他收集了一所大学(他拒绝透露这所大学的名字)中上千名学生、教员以及行政人员的电子邮件记录。 在这个隐私大于天的时代,搜集这些信息可不那么容易,所以他不想透露资料来源也是可以理解的。但有次来我的研究小组的时候,他很慷慨的跟我们分享了这份记录的匿名版。 爆发洞察 2004 年春天,当我在灵感四溢的布达城分析这些数据的时候,我得出了一个明确的结论:所有人的电子邮件都不符合泊松过程描述的那种掷硬币般枯燥而刻板的节奏。相反,每个用户的电子邮件模型都跟我的差不多——它们充满了爆发点,就像暴雨频发的夏末天气,在狂轰滥炸般发送了大量邮件之后,总会有长时间的沉默。 正如我们在前几章看到的,千万不要忽略一个完全随意的模型的偏差,因为它很可能会揭示社会和自然的深层规律。这次的情况就恰恰如此。 幂律,主宰着我们真实生活的节奏 在《致命争吵的统计数字》这本研究战争与和平的书中,理查森发现了随意性的一个显著偏差值:冲突的等级数。一些战争的伤亡人数过百万,而另一些战争的死伤人数只有几十个。这种显著的差异促使他使用伤亡总数的以10 为底的对数来标示战争的等级。根据他的分级方法,1514 年2 月28 日这天,匈牙利人和奥斯曼土耳其人在贝尔格莱德发生的小冲突属于零级,因为当时只有艾利一人死亡。伤亡人数为10 的战争是一级,伤亡人数为100 的是二级。我们之前看到的数千名农民军丧生于骑兵和河流之间的战争为三级。 爆发实践 如果战争真是随机发生的,那么大多数战争的伤亡人数应该都差不多。但理查森发现,1820—1949 年之间发生的282 次战争中,有188 次是三级以下(或死伤人数在千人以下)的小型战争。伤亡人数在1 万人左右的战争相对较少——四级战争只有63 次。但他还是发现6 次六级战争以及两次死伤人数达千万的七级战争。 大家很容易猜到这两次七级战争是两次世界大战。但那6 次死伤人数均达百万的战争可能就不那么出名了。按照时间排列,这些战争分别是:太平天国运动(1851—1864)、西班牙内战(1936—1939)、第一次国共内战(1927—1936)、拉普拉塔大战(the Great War in La Plata,1865—1870)、北美内战(1861—1865),以及十月革命之后的俄国内战(1918—1920)。 通过观察,理查森发现伤亡人数与战争数量之间的关系遵循着一个简单的数学规律——“越少就越大”。也就是说,大部分战争都是死伤几百人的小型战争,而伤亡人数巨大的大型战役则少之又少。 理查森并不是第一个发现这一模型的人。19 世纪的经济学家维弗雷多?帕累托也发现,大多数人都很穷,而少数人则积累了大部分财富。富人的出现并不令人吃惊,因为即使财富的获取是随机的,还是会有人比较富有。令人吃惊的是,帕累托还发现那些富人的富有程度远远超过了财富随机分配能达到的水平。 爆发洞察 理查森和帕累托的研究表明,战争和财富符合幂律分布。具体来讲,很多小事件都是与个别大事件共存的。这意味着,每次世界大战都伴随着无数小战争,而每出现一个比尔?盖茨或洛克菲勒就会有一大群穷人诞生。 1999 年,当我研究网页的出名问题时也跟幂律有过一次亲密接触。我和我的研究团队发现,虽然很多网站都默默无闻,但像谷歌、亚马逊以及雅虎这样的顶级网站总是拥有百万条点击率。我们将这种几支独秀的网络称为“无尺度网络”。在接下来的10 年中,我一直在研究各个领域中(从细胞到因特网)的顶尖者在整个复杂体系中的作用。 爆发洞察 我的经验告诉我,理查森那句“越少就越大”的箴言实际上是误导。它让人们以为幂律分布的主要特征是大事件或大人物占少数——如世界大战、超级富豪,以及万维网上的佼佼者等,而我们在某种程度上也期望他们越少越好。但事实恰恰相反,我们必须仰仗他们的出现,而泊松的理论将这些异常值禁锢了起来。 在随机世界中,谷歌和雅虎不会吸引数以百万的点击率;比尔?盖茨也不会聚集亿万财富;战争更不会造成数百万人的伤亡。然而,真实的世界并非如此。 幂律分布的本质就是它能自然而然地预测出这些稀罕事儿,告诉大家总有严重偏离平均值的异常值。换句话说,一旦幂律出现,我们总能发现异常值。 幂律出现,爆发点就出现 我们从埃克曼的数据中得出的结论很简单:他数据库中的所有用户都不符合随机原理。相反,他们使用的模型都一样:短时间频繁发送邮件后就会有长时间(经常是好几天)的停顿。这当然很好理解。我们会参加会议、看电影、约会、吃饭、睡觉,会做许多各种各样的事情,所以我们无法一直待在电脑旁。等到终于有时间查看邮箱,我们肯定会在短时间内发送很多邮件,我们的邮件模型因此而产生了一个爆发点。然后,其他事情会让我们再次离开电脑,这标志着邮件流中下一个休息时间开始了。 基于这样的生活节奏,人类活动中出现爆发点就不那么稀奇了。有人会说,你的生活方式跟我的大不相同,我们的邮件模型肯定也没有什么相似之处。有些人一周只发几封邮件;有些人一天之内要发上百封;还有些人每天只是扫一眼邮箱;当然,也有些人时时刻刻跟电脑不分离。这就是当人们看到大家的邮件模型都差不多的时候,会觉得那么吃惊的原因。 事实上,当我们检查同一个人每次连续发送邮件之间的时间间隔时,没有人遵循我们熟知的泊松分布。相反,不管是谁,他的模型都符合幂律分布。 爆发洞察 一旦幂律出现,爆发点的出现就在所难免。实际上,幂律预测出大部分邮件都是在短时间内连续发送的,所以我们的邮件模型中出现了一个爆发点。同时,它也预见了人们会数小时或数天不发邮件。跟理查森资料中少有的大型战役,以及帕累托分析的少数富豪是一样的道理,最终,我们的邮件模型遵循着一种内在和谐,短时间的活跃和长时间的耽搁相互交替,形成的一个精确的规律,一个我们从未想到,也不用花费力气去遵守,甚至一开始人们认为其并不存在的规律。 人类行为遵循共同的幂律分布 那又怎样呢?且不说你的生活不只是围着邮件转,就算是,谁又会在乎它们遵循什么数学规律呢?若我们在认为这一切都是随意为之时并未感到困扰,那为什么在知道了它们不是随意发生的时候会耿耿于怀呢? 反过来想,这种爆发吸引人的主要原因就是它不只适用于我们的邮件模型。比方说,在浏览那些我们感兴趣的网站时,我们通常会先点击几个链接,看几篇文章,在上面停留几分钟后再离开。我们很难相信这种随性而又随意的模型遵循什么内在规律,但事实是它确实遵守了。当我的研究小组在测量一个用户在一个网站上连续点击链接的时间间隔时,幂律规律再次映入我们的眼帘。 受到邮件模型与网页浏览习惯具有相似性的激励,我开始搜集其他人类行为中的信息。 爆发实践 不久之后, 我发现伦敦帝国理工学院(Imperial College)的物理学家玛雅?帕祖斯基(Maya Paczusky)和她的学生乌利?哈德尔(Uli Harder)正在研究人们打印资料的时间间隔。爆发点再次出现:我们会在短时间内打印很多资料,然后又转向其他日常事务。 圣母大学的赫斯伯格图书馆(The Hesburgh Library)慷慨地为我们提供了学校学生和教师们借书的详细记录。跟联邦调查局不同,我们不关心大家都读了什么书,只关心每位读者来图书馆的时间。爆发点又一次出现了:一个典型的读者会在几个小时内查阅多本书——可能是为某堂课或是某份论文做准备。然后有很长一段时间都不出现,就像他完全忘掉图书馆这回事儿一样。 我们打电话的模型也差不多。短时间内我们会打多通电话,然后在很长时间内一通都不打。我们之前提到了一位周游世界的朋友哈桑·伊拉希。我们从他记录自己行踪的数千张照片上发现了时间戳。幂律分布再次出现:哈桑在短时间内照了很多张照片,然后就像照相机丢了般,一连几个小时甚至几天都不拍一张。这当然会引起联邦调查局的怀疑——这段期间他去了哪儿呢? 爆发洞察 不论我们观察哪种人类活动,都会发现相同的“爆发”理论:长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经纪公司的交易;从人和动物的睡眠模型,到魔术师为了保证魔杖时刻停留在空中而做的小动作,所有的一切都证明,爆发,无处不在。 我们的研究不再单纯地局限于电子邮件或是网络浏览器,而是要见证人类活动中某种更深层次的联系。这种联系清楚地表明,我们的活动不再是随意为之。就其本身而言,这并不怎么令人吃惊,因为没有人会认为自己受偶然性主导。 每个人的意志都是自由的,这使得所有事情——包括电子邮件、打印资料以及网络浏览等,都变得复杂了起来。不过,不管我们做了什么,我们都不知不觉地遵循着一个规律——幂律规律。理论上虽很简单,但实际上确实令人吃惊。 爆发改变了一切 只要是能清楚地解释以前不能解释的现象,这个规律或模型就显得很重要。诚然,如果牛顿的万有引力定律没有准确地预测出行星、火箭以及卫星的运行轨迹,它就不会有那么大的影响力。爆发理论同样有着类似的预测能力。 还记得我们之前曾预测每条新闻的生命周期为36 分钟吗?在那之后,我们很快又发现大部分新闻的生命周期要比36 分钟长很多——确切地说,应该是36 小时。一开始之所以预测出36 分钟,是因为我们假设点击行为是随意的——就像钍不可思议地变成镭时,钍原子的运动轨迹一样。然而,爆发改变了一切。事实上,一个典型网民大约20 次的日点击量并不是均匀地分布在一天内,而是集中在某几个特殊的爆发点上。 一旦引入爆发理论,我们立刻就得出了正确的结果:是36 小时,而不是36 分钟。我们在浏览自己中意的网站时,绝不会每小时点击一次。一旦我们访问了那个网站,就会一个劲儿地猛点击,然后离开过了数小时或数天后,我们又会回来接着浏览这个网站。所以,我们肯定要用超过36分钟的时间,才能发现一些能够吸引我们不断点击的新内容。 钞票追踪者德克·布洛克曼一开始也假设钞票在乔治网被标记的次数遵循随机但均匀的泊松过程。基于乔治网网民的旅行轨迹具有不可预测性,他的这种假设也不是没道理。但通过进一步观察后,德克发现钞票连续现身之间的时间间隔遵循爆发模式。一张钞票在某个时期内频繁现身后会突然消失,而数月后又会再次出现在人们面前。 比如,我们在第3 章中提到的那张保持最长纪录的钞票:它在2002年7 月两次被注册,然后消失了半年,在接下来的3 个月中它7 次现身,随后又消失了好几个月。没人知道这张长时间销声匿迹的钞票藏在哪里——也许是在某辆车的仪表盘下面的小杂物柜里,也许是在某个年轻人的一条过时牛仔裤口袋里。不管它在哪里,有一件事可以肯定:它两次出现之间的时间间隔不是随机的,而是符合幂律规律的。一旦德克将这种爆发模式和爱因斯坦的扩散理论结合起来,预测出的钞票运动速度就会变慢很多,完全揭开了行动迟缓的钞票的神秘面纱。 用新的眼光审视历史 作为一个热爱和平的贵格教徒,理查森认为应该物尽其用以避免社会的毒瘤,也就是战争和暴力的发生。作为一个科学家,他总是一丝不苟地检验自己信仰的正确性。当发现大部分国家的多数人都死于自杀和意外,而非战争时,他感到非常吃惊。总的来说,战争造成的死亡人数占总死亡人数的1.6%。对此他的总结是:“战争引起了人们太多的关注,但它造成的死亡人数其实比人们想象的要少得多。”他思前想后,最后沮丧地得出结论:“那些好战的人会以战争造成的伤亡比疾病要少为借口继续行恶。”这是一位倾其毕生精力,立志阻止战争冲突的贵格教徒,得出的一个发人深省的结论。 尽管没能成功找出暴力的根源,但理查森的努力促使我们用一种新的眼光审视历史上的争端。 首先,奥帕特村浅滩上的大屠杀事件动摇了传统的兵法经验。十字军的前哨部队和传闻中的同盟者——残忍追杀他们的骑兵团,按理说不该兵戈相向:双方有着共同的敌人——奥斯曼土耳其;大家的语言相通——匈牙利语;大家拥戴同一个人——国王。这些都是理论家口中可能减少争端的条件。 不过,理查森指出这些理论家错了,而且他们的推测只不过是个人臆断。奥帕特惨案颠覆了人们对战争和和平的所有认知,是理查森的理论典范。 但如果理查森是对的,战争和冲突的时间真的不可预测,那伊斯特凡?泰勒格迪,这位国王的亲信又怎敢妄加预言呢?这很可能是拜泰勒格迪无知的鲁莽所赐——他不知道自己的预测缺少根据。但是,理查森的结论是否说明我们的预知注定是幼稚而错误的呢? 研究过去的冲突有个好处,那就是它们的结果不再扑朔迷离,我们可以打开历史书,看看后来发生的事情。所以,跟与他们同时代的人不同,我们只要仔细查阅历史记录就能知道泰勒格迪的预知是否准确。那么就让我们来查阅一下乔治·塞克勒对前哨部队被袭这件事的反应吧。这次袭击事件看似偶然,但肯定有重要诱因。这是十字军东征过程中第一次真枪实弹的作战,是对乔治·塞克勒领导才能以及军队实力的首次检验。
第
1
2
3
4
5
6
7
页
关于我们
|
版面设置
| 联系我们 |
媒体刊例
|
友情链接