时事分析 | 创新及科技发展 | 2013-12-30 | 《星岛日报》

数据中心搁置 大数据时代如常运作



Google放弃在香港兴建数据中心,不管是基于商业考虑还是政治因素,都是对香港资讯科技产业发展的打击。往者已矣,现在香港需要思考的,是怎样走以后的路。近年各大企业都在建立自己的数据中心,主要原因是要适应「大数据」时代的需求。趁今次事件吸引了社会对资讯科技发展的关注,社会不妨反思,除了数据中心,我们在其他范畴是否已经准备就绪,迎接「大数据」时代的来临?

电脑及互联网科技日益发达,人类所保存的数据资料已达前人无法想象的地步。在各种科技帮助下,每秒都有大量数据产生及保存。这些数据大部分未经整理,但通过大数据分析技术(Big Data Analytics),有时可以从中得到意想不到的启示。

大量、高速、种类多

要判断何谓大数据,一般要视乎其数量、累积速度和种类,简称「3V」(Volume, Velocity, Variety)。这概念于2001年由数据分析员Doug Laney于一篇关于数据管理的报告中提出。[1]据估计,2011年全球产生的数据量达1.8ZB[2],将这些资料储存在32GB版本的iPad,所需要的iPad数量,足以兴建一堵比中国万里长城平均高出两倍的iPad长城。[3]现在社交网站facebook,每天就有三亿五千万张照片上载。[4]至于累积速度,据麦肯锡在2011年的推算,全球数据量正以每年40%的速度增长。[5]另外,大数据的种类繁多,除了较有系统的统计数字、资料库数据,还包含文本、影像、声音等零碎资料。

要在大量、累积速度愈来愈快、种类繁多的数据中寻找意义,需由大数据科学家以超级电脑及数学模型进行分析。Microsoft、 IBM、 Oracle等科网公司已经开发出大数据管理方案以抢占这一新兴市场。

大数据分析技术为数据分析开拓了新的领域,不再囿于取样困难及数据过时的问题。由于资料涵盖极广,大数据可从更多角度分析,提高准确性。大数据分析技术的应用在大企业里颇为流行。货运公司UPS为旗下超过十万辆货车及司机配备电子装备,记录及分析路面情况、货车行走路线,以调整运输路线、改善送递时间以及节省燃料。[6]美国百货公司Macy’s则从社交网络、交易纪录等上百亿GB的数据,找出将销售量提高一成的市场策略。[7]根据麦肯锡的报告,有效使用大数据可为零售企业带来六成的营业利润率增长。[8]

提升公共服务质素

公共服务方面,大数据的好处也十分明显。Google藉着对比搜寻关键词及传统流感监控系统资料,总结出各地的流感趋势,结果竟跟政府部门的流感趋势预测相当吻合,而且Google公布的趋势预测能够每天更新,比使用传统资料更快。[9]IBM为香港政府的《2014数码21资讯科技策略》所作的顾问报告中,也提及在医疗、交通、教育等方面,均可借助大数据分析技术,从巨量数据中发掘改善现行措施的方案。[10]

美国政府已经意识到大数据的重要性,奥巴马政府上年正式启动「大数据研发先导计划」(Big Data Research and Development Initiative),联合六个联邦部门投入二亿美元改善及开发对数码数据的整理和运用。其涵盖的层面有国防、国土安全、能源、医疗、太空等。[11]荷兰城市燕豪芬则将大数据应用在改善交通系统上,与IBM及半导体生产商NXP合作推行一项为期半年的智能交通计划,在参与计划的汽车安装感应器,形成一个汽车联网。联网内汽车行驶时的路面状况、煞车、加速、全球卫星定位位置等大量变动中的数据,可即时传回IBM,以分析路面状况,迅速提醒有关部门及驾驶者,减少交通意外。[12]

根据麦肯锡的研究,大数据分析可帮助欧洲各地政府节省15%至20%行政开支,工作效率亦有望在2012至2021年间每年提升0.5%。[13]在德国,大数据分析便协助劳工部门取消及改善一些欠缺效率的援助计划,这不但缩短了失业人士寻找工作的时间,还为政府每年节省100亿欧元。[14]

在大数据的使用上,香港公营部门也有作出尝试。医院管理局于2002年开发「临床资料分析系统」,储存了大量到公营医院求诊病人的病历、逾十亿项化验报告资料、开药纪录,并以每天四百多万项资料的速度增长。系统能够为医生提供有关病历、用药等数据分析,务求提高医生的诊治效率。[15]此外,香港国际机场和运输署也分别使用大数据分析处理行李运送及管理路面交通。[16]

挑战与未来

推动大数据及先进分析技术之余,我们不能忽视处理大量个人资料的挑战。斯诺登揭露美国政府监控本土以至海外人士,便让世人察觉在电子产品和互联网普及的时代,所谓的私隐原来可以被轻易泄露。在民间,个人资料的收集与使用同样备受关注,早前便有健身中心被指收集过多资料,遭个人私隐专员公署批评。[17]类似的矛盾,在大数据时代只会愈来愈多。改进营运效率与保障私隐之间取舍,将成为大数据能否继续向前发展的关键。

大数据之大在于其包罗万有,与主题无关的资料有时也可提供意想不到的解读,但如何分辨甚么资料值得储存、分类,并剔出没有代表性的杂音,不是轻而易举的事。荷兰政府的统计部门处理网上数据时,便遇到这种困难。[18]面对种种挑战,如果香港政府能够妥善处理,运用各部门所掌握的资料提升制订政策及公共服务的水平,这样比能否争取特定企业在港兴建数据中心,相信更具示范作用。

 


1  Doug Laney, 3D Management: Controlling Data Volume, Velocity, and Variety, Meta Group, 2001.
2  电脑资料容量单位,1.8ZB相当于1.8万亿GB。
3 「活用统计数据」,政府统计处,2012年12月3日。
4 “Facebook Users Are Uploading 350 Million New Photos Each Day”, Business Insider, Sep 18, 2013. http://www.businessinsider.com/facebook-350-million-photos-each-day-2013-9
5 “Big data: The next frontier for innovation, competition, and productivity”, McKinsey & Company, June 2011.
6 “UPS Crunches Data to Make Routes More Efficient, Save Gas”, Bloomberg, Oct 30, 2013.
http://www.bloomberg.com/news/2013-10-30/ups-uses-big-data-to-make-routes-more-efficient-save-gas.html
7 “Retail Goes Shopping Through Big Data”, CNBC, Apr 15, 2013. http://www.cnbc.com/id/100638141
8  同5。
9  Google Flu Trends. http://www.google.org/flutrends/intl/zh_tw/about/how.html
10 Consultancy Services for the Digital 21 Strategy Review for the Office of the Government Chief Information Officer, IBM, Sep 2013.
11 “Obama Administration unveils “Big Data” Initiative: Announces $200 million in new R&D investments”, Office of Science and Technology Policy, Executive Office of the President, Mar 29, 2012.
12 “Smart In Car Trial car data real-time accessible to improve traffic flow and increase traffic safety”, ERTICO, Feb 21, 2012.
http://www.ertico.com/smart-in-car-trial-car-data-real-time-accessible-to-improve-traffic-flow-and-increase-traffic-safety/
13 同5。
14 同5。
15『医局建「临床宝库」对症下药』,《星岛日报》,2013年7月3日。
16 “Smarter Hong Kong, Smarter Living: Consultancy Services for the Digital 21 Stratgey Review for the Office of the Government Chief Information Officer”, IBM China / Hong Kong Limited, September 2013.
17「California Fitness 向会籍申请人收集过度的个人资料违反私隐条例规定」,个人资料私隐专员公署,2013年12月5日。http://www.pcpd.org.hk/chinese/infocentre/press_20131205.htm
18 Nicolaes Heerschap, “Internet as a new source of information for the production of official statistics. Experiences of Statistics Netherlands”, Aug 29 2013.