1948年,费城德雷克赛尔理工学院(Drexel Institute of
Technology)的两名研究生约瑟夫·伍德兰德(Joseph Woodland)和伯纳德·西尔弗(Bernard Silver)无意间听到当地一家连锁杂货店的总裁邀请他们的系主任主持一项研究以解决商品信息自动读取问题。于是他们借鉴摩尔斯电码中点和短线的使用,想出了一套类似斑马条码的条形码表示方法。1951年,一台能够将条形码转化为数字的机器问世了。它有一张桌子那么大,用一张巨大的油布包裹着,使用500瓦的灯泡作为光源。“那灯泡亮得足以灼伤人们的眼睛,”伍德兰德后来回忆说。
1966年,也就是西尔弗不幸于38岁英年早逝的那一年,这项发明实现了商业化。当时,全美国连锁食品企业协会(National Association of Food
Chains)号召其旗下机构使用收银机来加快收银速度,而最早的系统是于1972年安装于辛辛那提克罗格(Kroger)百货公司的一套RCA系统。不过,为了真正实现高效率,必须由生产商在商品包装上印上条形码,而不是依赖商场员工现场去贴标签。因此,该协会创制了统一商品码(UGPC) ,这可以说是我们今天使用的通用商品代码(UPC)的鼻祖。1974年,在俄亥俄州特洛伊市的马什(Marsh)超级市场,第一套实用的条码识别体系成功地识别出了一件十片装的黄箭口香糖,这包口香糖现在已经被收藏进了史密斯索尼亚学会博物馆(Smithsonian)。1981年,美国国防部要求其采购的所有商品都要带有条形码,而UPC系统成为主流。今天,在全世界140多个国家里,每天都有50亿件商品在通过条形码被识别。
当我们进入第三层次秩序,条形码就变成为了沟通物流商品和其相关数字信息的桥梁。在人们分享书单的网站librarything.com,上传一张图书条形码照片就可以将这本书所有必要的信息都添加到你的个人图书馆中,它甚至可以自动添加封面照片。PULP,也就是个人普适图书馆项目,是由微软参与开发的公司内部资料室管理体系。其名称起得非常贴切,而其目的是让所有公司可以用同样的方式建立资料室。当我们拥有一个识别第三层次对象的代号,它就可以充当一片智能叶片,因为有了它,关于这片叶子的所有评论、元数据和相关人就都能够被找出来了。
不过,还是存在一个障碍。每一位员工和顾客都明白,6件装厨房用百洁布包装上面的条形码代表的是一整包商品,如果收银员刷六次条形码,顾客就可以理直气壮地指责这个收银员不知道条形码是如何工作的。在第二层秩序中,生产商必须明确他要用一组条形码来表示哪些商品;而在第三层次中,任何一个人,只要他拥有一个因特网账户,就可以随心所欲地从任何地方搜集信息,从在线资源的“吸塑包装”中提取一个想法或者一张图片。在第二层次中,只有在生产商决定了产品的组成及其包装方式的情况下,条形码才能进行正确识别。而在第三层秩序中,给一片叶子印上ID号(身份识别符)就是将它变成一片智能叶片的第一步。
这意味着在着手链接叶片让它们变聪明之前,我们首先得决定每片叶子是什么。
指向的价值
《女装日刊》报道说,“在周一召开的全国零售商品协会大会上,差点因为后来者没有能够参加UPC条形码的扩大会议而爆发斗殴”。那是1987年,UPC毫无争议地得到了市场的普遍接受,在那次大会召开的时候,已经有25 000个生产商在使用这种编码,而新的产业感觉这是一个提高生产效率的好机会,已经跃跃欲试、急切想搭上这条船。服装业在1986年将UPC作为非强制性标准。1989年,因为海产品通常都是以随机重量销售的,海产品业得到批准,拓展了其使用的UPC数字位数。这项举措效果非常好。几年之后,它再次增加了数字位数。
UPC数字不但提高了结帐的速度,还提高了整个库存盘点追踪过程的效率,销售成本也降低了,因为它极大丰富了经销商的数据库。通常在准备一件商品的销售时,经销商只需要添加一条更加显眼的数据,价格,就可以了。在1986年进行的一项研究中,80%的企业说他们的UPC设备投入不到2年就收回了成本,45%说他们的投资不到1年就出效益了;1/4的企业认为每年直接节省的金额达到100万,间接节约金额也与此相当(折算成现在的美元价值大约是17万),全国零售商品协会大会的UPC会场人满为患也就不足为奇了。
UPC数字创造出了一套全局性信息体系,而这个体系推动了全球性商业体系的建成,而真正使得UPC实现全面统一还需要大量工作。UPC数字由12个数字组成,不过,从2005年开始,零售商们的解码器也开始能够同时识别13位的欧洲物品编码(EAN)了。一个UPC编码被分成三组代码,生产商识别码;产品识别码;还有一位用以防伪的根据其它数字计算出来的数字。生产商识别码是由拥有UPC系统的全球标准化组织(GS1)分配的,不过产品的识别码是由生产商自己确定的,而产品码的构成是由生产商和销售商需要的盘点方式决定的,冬装生产商经常会给小号、中号和大号的风雪帽分配不同的号码,也会给不同的颜色分配不同的号码,尽管从某种定义上来讲,它们其实是同一种产品。
生产商可以为任何产品分配任何数字,而没有必要雇佣杜威式的编目人员来判断他们是否应该将“风雪帽”放到冬装或是外出服装类别之下。什么数字都行。但是,这也意味着在行业内部及行业之间,识别码没有任何意义。通用电气生产的荧光灯泡的UPC编码跟德国喜万年(Sylvania)生产的荧光灯泡的编码之间没有任何联系。因此,库存管理体系无法用它们的UPC来统计到底销售了多少灯泡。1998年制定的联合国商品及服务标准编码(UN Standard P&S
code)采取了与此截然相反的方法,其代码中的数字意义丰富,代表了一个巨大的5级树形结构。该结构给从猫咪到选举权保护协会这样千差万别的事物进行了分类(猫咪:活动植物及其附件>活动物>活家禽。选举权保护协会:组织和俱乐部>民权组织协会及运动>人权倡导及保护协会)。为了减少商务摩擦,人们整合了这两个体系。2003年,UNSPSC将这个体系的管理权移交给了管理UPC的机构。但是这种合并不可能是彻底的,因为UPC主要用于商品包装,而联合国这套编码则是用于全球范围内原材料的流通。世间万物如此多姿多彩,而我们对它们的看法也永远不可能达成一致,即使出于最良好的愿望,采取最统一的领导,也总会留下一些杂乱无章无法分类的部分。
UPC是个成功的典范,但它使用的技术已经过时了,形成于20世纪70年代,那时候计算机跟百老汇明星的更衣室一样大。现在微小的无线射频识别标签(RFID)能够传播贴有该标签的商品的信息。而比起RFID标签来,生产商更喜欢条形码,因为条形码是印在商品包装盒上的,而RFID标签必须购买、编程然后安装。但是,RFID拥有比UPC更大的信息容量,而且可以直接整合进计算机系统。RFID标签已经被应用到了自动收费车道、奶牛识别、美国能源部禁用物质检测和伊拉克维和物资装备追踪上。克罗格百货估计,安装在温度计上RFID标签可以减少一半的鲜货腐烂损失,一年为该连锁机构节省几亿美元。由沃尔码资助阿肯色大学进行的一项研究表明,使用RFID标签之后,补充缺货商品的速度加快了3倍。弗吉尼亚3家医院使用RFID来追踪管理上万件可移动的医疗设备,这样他们就可以用更少的设备完成更多的工作了。医院估计一年就可以收回成本。特别是在标签价格已经降低的条件下,这些统计数字促使许多企业开始将RFID用于自己产品的包装。这种做法实质上就是在其物理体系中植入数字化的元数据,物理对象甚至可以变成“spime”,也就是科幻作家布鲁斯·斯特林(Bruce Sterling)给那些位置和身份状态能够被随时追踪的物理对象起的名字。商品的这种智能化不但方便了销售商,也让生产商获益,因为这个体系可以告诉他们顾客都在干什么。
条形码被印在了甜麦圈包装盒上,而RFID悄悄进入了桔色的风雪帽里,智能化内容,也就是思想和信息的数据包,则没有那么容易被定位,而BBC正在发现,对其库存中的元素进行细致入微的标识是很有好处的。
BBC 庞大的资料室里,不光存放着数百万小时的电视和广播节目,还藏有超过400万张照片,120万张CD和聚乙烯唱片,还有BBC旗下5个交响乐团的400万份曲谱。即使每一份资料都仔细地标注了题目、主题、播出时间,如果一位制作人希望从一部关于全球化的记录片中找到15秒钟的关于北京交通拥堵的胶片,这些信息还是一点儿忙也帮不上。将每个节目看作一片智能叶片并不会自动将这个节目中的所有元素都转化成智能化信息,解决这个问题的方法就是创造出更多的元数据。由约翰·古德(John Good)和卡罗尔·欧文斯(Carol Owens)倡导的一个项目制定了一套标准化元数据,将它们添加到了BBC的资料中。古德指着构成BBC内容的7、800个产品单位,指出了一个最显而易见的事实:“所有系统都必须知道‘主题’的意思”。标准化标签保证了编目人员不会随意混用“名字”或者“节目名称”这样的字眼,搜索者也就不必因为术语不统一而找不到自己想找的内容。一旦大家对标签的使用达成一致,数据就可以用标准化的方式被转化。这样一来,就不会出现某个片断被命名为“蒙蒂·派森(Monty Python):第 11集”,而另外一个则被命名为“蒙蒂·派森的飞行马戏团 #12”这种情况产生。要是这种情况发生的话,计算机体系有可能没有办法找出这个节目的所有片段。BBC体系标准化了超过300种不同的属性,可以被用于标记各种材料:包括主题、制片人、语言、时长、媒体类别,甚至它是否获过什么奖。古德说,它可以用来标识各种内容,大到一整套节目,小到某个节目报导某个国家的某一帧画面。
而第二项行动则开始于2003年,由汤姆·科茨(Tom Coates)和马特·韦布(Matt webb)领导,关注“人们如何查找节目编排,如何在其中遨游,如何使用它们”。而科茨和韦布总会遇到一个非常根本的问题:即使有了BBC的新闻标准化体系,人们还是无法就每个标识符号到底指向什么内容达成一致,是一个系列?一季?还是某个特别的译制版本?一组直播节目?复播节目的编号是不是会变化?科茨和韦布最后决定,最有用的对象是集,这样的单元最适应了解观众对节目看法这个目的。比如说某电视系列节目中特定的一集,或者晚间8点到10点爵士乐广播节目的某一次广播。因此,除了标签之外,每一集都被分配了一个5位的识别码,它跟UPC代码一样不具意义,通常被添加到自动生成的网站的地址末尾。不过,科茨和韦布了解,想要查找《蒙蒂·派森》系列第11集的人也许也想看这部剧集的其他各集。因此,这个系统自动为整套剧集创造了一个网址,而每一集都作为网页被分别列在每个系列之下,就像是网址www.usa.con/florida/mian.htm和www.usa.com/florida/orlanda.html的网页差不多。节目网址的树形结构反映了不同节目之间的重要联系。
为了决定什么元素应该使用标识码,这两个系统都选取合适的单元来作为可用、可识别的叶片,而标识码充当了钩子的角色,上面可以挂上所有必需的元数据,方便用户自行筛选内容。有了这样的体系,制片人就可以再次使用小到一帧画面的部分,而观众则可以找到整部剧集,这两个系统,无论是结合使用还是分开使用,都能够帮助人们以智能化的方式指向其核心资源,而这些资源的附加值因此得到了巨大提升。 |