涂子沛先生所著的这部大作,是大数据时代的应时之作。
他将数据用在管理和研究方面的发展史,以其在美国的发展过程,作为主要内容。他从美国开国时期的人口普查,作为起点,讨论民主制度如何经过数据的调查,才能发展成为“一人一票”的制度。接着,19世纪中叶,美国向西开发,美国的工程兵团,进行丈量和调查,使美国的地理状况和疆域,都有明白的依据。20世纪,“打孔”的计算方法,开创了后世计算器管理大量数据的技术。到今天,我们日常生活中,因为计算机和网络的普及,无处没有数据的存在。以我老病人为例,疾病的性质,或药物的效果,都必须靠大量的数据,作为诊断和治疗的依据。凡此,都是数据的使用。
美国的社会愈来愈复杂,资本主义的国家,证券交易乃是一桩大事。单单用统计来管理证券,已经不太够用。大概在最近30来年,许多大证券商,为了要预测经济的起落和某一种产业的兴衰,大量地使用不同产业之间的关系,也顾及国际贸易的情形。这些私营的企业界,几乎都能相当精准地判断市场的情形。于是,管理证券交易的美联储,实际上就是美国的中央银行,也必须更细密地运用许多数据,以掌握经济的全貌,然后再决定对市场供应的货币是从宽还是从紧。这才是“大数据”的第一次使用。
中国古代兵书《孙子兵法》就说过:“算则胜,不算则不胜;多算胜,少算则不胜。”此处的“算”字,就是如何利用数字,来估计各种因素。一个能干的将领,打一次战役,要考虑到天时、地利、人和,这都是可以用数字表现的。但是,一个治国的领袖,在上述因素以外,还得考虑许多其他的条件。1942年,日本偷袭珍珠港,以为可以一棒打死美国。他们没算到,美国工业的实力,有充分的再生力量,三个月之内,美国立刻就能恢复足够的海空实力。这就是日本军人,只知道计算战役,不会计算战争。到今天,安倍野心勃勃,处处挑衅,他志在日本复兴。他的计算,大概又是计算自己现在的兵力和科技能力;他没有算到,自己的原料供应不够,能源不能自主,人口结构老化:这就是“算”得不够。
“大数据”之“大”,就在于将各种分散的数据,彼此联系,由点而线,由线而面,由面而层次,以瞻见更完整的覆盖面,也更清楚地理解事物的本质和未来的取向。人脑的结构,足够发挥联想力和推论。我们每天的日常生活,时时刻刻在不知不觉中,做“大数据”的工作,将许多因素综合在一起,作为行动和决定的依据。只是一个国家或一个社会的发展,不能全靠眼睛看得见的一些讯息,有许多事物,必须依靠全面和长期的发展情况,才能真实地反映当时一切决定的背景和条件。
今天信息科学的发展,已经能够产生、存储并实时地分析处理大量的信息,整合多个源头的数据,形成全面的多项关系,指出线性的发展方向,引导我们有广阔的视野。计算机今天处理数据的能力和速度,已经超过最聪明的个人。可是,用计算机的还是“人”,如何驾驭这些数字,还是“人”在设计。只是,我们必须要有此认识:今天的世界,已经千丝万缕,将各地、各种行业、各种条件,纠缠成一个复杂的全球网络。管理大企业和管理国家,必须要有足够的信息,了解多种多样的情况,以全面地理解各种问题及其彼此的关联。即使是对个人而言,因为越来越多的行为已经转变为电子化的记录,其生活也和大数据息息相关。“大数据”这个课题,十分重要,我盼望有更多的学者,在这方面提出更多的作品。
涂子沛先生的大作,是讨论大数据较早的中文作品;在此以前,还罕见讨论数据为管理方式的书籍。这本书,主要是以美国社会中数据的使用为例。我知道他一心想用这些例子,提醒中国的读者:在信息科学高度发展的今天,我们不能再忽略数据的使用。涂子沛先生开启了一道大门,我相信,后面会有更多的开展,让大家进入这一个重要的现代文化园地。
(著名历史学家、美国匹兹堡大学历史系荣誉讲座教授)