時事分析 | 創新及科技發展 | 2013-12-30 | 《星島日報》

數據中心擱置 大數據時代如常運作



Google放棄在香港興建數據中心,不管是基於商業考慮還是政治因素,都是對香港資訊科技產業發展的打擊。往者已矣,現在香港需要思考的,是怎樣走以後的路。近年各大企業都在建立自己的數據中心,主要原因是要適應「大數據」時代的需求。趁今次事件吸引了社會對資訊科技發展的關注,社會不妨反思,除了數據中心,我們在其他範疇是否已經準備就緒,迎接「大數據」時代的來臨?

電腦及互聯網科技日益發達,人類所保存的數據資料已達前人無法想像的地步。在各種科技幫助下,每秒都有大量數據產生及保存。這些數據大部分未經整理,但通過大數據分析技術(Big Data Analytics),有時可以從中得到意想不到的啟示。

大量、高速、種類多

要判斷何謂大數據,一般要視乎其數量、累積速度和種類,簡稱「3V」(Volume, Velocity, Variety)。這概念於2001年由數據分析員Doug Laney於一篇關於數據管理的報告中提出。[1]據估計,2011年全球產生的數據量達1.8ZB[2],將這些資料儲存在32GB版本的iPad,所需要的iPad數量,足以興建一堵比中國萬里長城平均高出兩倍的iPad長城。[3]現在社交網站facebook,每天就有三億五千萬張照片上載。[4]至於累積速度,據麥肯錫在2011年的推算,全球數據量正以每年40%的速度增長。[5]另外,大數據的種類繁多,除了較有系統的統計數字、資料庫數據,還包含文本、影像、聲音等零碎資料。

要在大量、累積速度愈來愈快、種類繁多的數據中尋找意義,需由大數據科學家以超級電腦及數學模型進行分析。Microsoft、 IBM、 Oracle等科網公司已經開發出大數據管理方案以搶佔這一新興市場。

大數據分析技術為數據分析開拓了新的領域,不再囿於取樣困難及數據過時的問題。由於資料涵蓋極廣,大數據可從更多角度分析,提高準確性。大數據分析技術的應用在大企業裏頗為流行。貨運公司UPS為旗下超過十萬輛貨車及司機配備電子裝備,記錄及分析路面情況、貨車行走路線,以調整運輸路線、改善送遞時間以及節省燃料。[6]美國百貨公司Macy’s則從社交網絡、交易紀錄等上百億GB的數據,找出將銷售量提高一成的市場策略。[7]根據麥肯錫的報告,有效使用大數據可為零售企業帶來六成的營業利潤率增長。[8]

提升公共服務質素

公共服務方面,大數據的好處也十分明顯。Google藉着對比搜尋關鍵詞及傳統流感監控系統資料,總結出各地的流感趨勢,結果竟跟政府部門的流感趨勢預測相當吻合,而且Google公佈的趨勢預測能夠每天更新,比使用傳統資料更快。[9]IBM為香港政府的《2014數碼21資訊科技策略》所作的顧問報告中,也提及在醫療、交通、教育等方面,均可借助大數據分析技術,從巨量數據中發掘改善現行措施的方案。[10]

美國政府已經意識到大數據的重要性,奧巴馬政府上年正式啟動「大數據研發先導計劃」(Big Data Research and Development Initiative),聯合六個聯邦部門投入二億美元改善及開發對數碼數據的整理和運用。其涵蓋的層面有國防、國土安全、能源、醫療、太空等。[11]荷蘭城市燕豪芬則將大數據應用在改善交通系統上,與IBM及半導體生產商NXP合作推行一項為期半年的智能交通計劃,在參與計劃的汽車安裝感應器,形成一個汽車聯網。聯網內汽車行駛時的路面狀況、煞車、加速、全球衛星定位位置等大量變動中的數據,可即時傳回IBM,以分析路面狀況,迅速提醒有關部門及駕駛者,減少交通意外。[12]

根據麥肯錫的研究,大數據分析可幫助歐洲各地政府節省15%至20%行政開支,工作效率亦有望在2012至2021年間每年提升0.5%。[13]在德國,大數據分析便協助勞工部門取消及改善一些欠缺效率的援助計劃,這不但縮短了失業人士尋找工作的時間,還為政府每年節省100億歐元。[14]

在大數據的使用上,香港公營部門也有作出嘗試。醫院管理局於2002年開發「臨床資料分析系統」,儲存了大量到公營醫院求診病人的病歷、逾十億項化驗報告資料、開藥紀錄,並以每天四百多萬項資料的速度增長。系統能夠為醫生提供有關病歷、用藥等數據分析,務求提高醫生的診治效率。[15]此外,香港國際機場和運輸署也分別使用大數據分析處理行李運送及管理路面交通。[16]

挑戰與未來

推動大數據及先進分析技術之餘,我們不能忽視處理大量個人資料的挑戰。斯諾登揭露美國政府監控本土以至海外人士,便讓世人察覺在電子產品和互聯網普及的時代,所謂的私隱原來可以被輕易洩露。在民間,個人資料的收集與使用同樣備受關注,早前便有健身中心被指收集過多資料,遭個人私隱專員公署批評。[17]類似的矛盾,在大數據時代只會愈來愈多。改進營運效率與保障私隱之間取捨,將成為大數據能否繼續向前發展的關鍵。

大數據之大在於其包羅萬有,與主題無關的資料有時也可提供意想不到的解讀,但如何分辨甚麼資料值得儲存、分類,並剔出沒有代表性的雜音,不是輕而易舉的事。荷蘭政府的統計部門處理網上數據時,便遇到這種困難。[18]面對種種挑戰,如果香港政府能夠妥善處理,運用各部門所掌握的資料提升制訂政策及公共服務的水平,這樣比能否爭取特定企業在港興建數據中心,相信更具示範作用。

 


1  Doug Laney, 3D Management: Controlling Data Volume, Velocity, and Variety, Meta Group, 2001.
2  電腦資料容量單位,1.8ZB相當於1.8萬億GB。
3 「活用統計數據」,政府統計處,2012年12月3日。
4 “Facebook Users Are Uploading 350 Million New Photos Each Day”, Business Insider, Sep 18, 2013. http://www.businessinsider.com/facebook-350-million-photos-each-day-2013-9
5 “Big data: The next frontier for innovation, competition, and productivity”, McKinsey & Company, June 2011.
6 “UPS Crunches Data to Make Routes More Efficient, Save Gas”, Bloomberg, Oct 30, 2013.
http://www.bloomberg.com/news/2013-10-30/ups-uses-big-data-to-make-routes-more-efficient-save-gas.html
7 “Retail Goes Shopping Through Big Data”, CNBC, Apr 15, 2013. http://www.cnbc.com/id/100638141
8  同5。
9  Google Flu Trends. http://www.google.org/flutrends/intl/zh_tw/about/how.html
10 Consultancy Services for the Digital 21 Strategy Review for the Office of the Government Chief Information Officer, IBM, Sep 2013.
11 “Obama Administration unveils “Big Data” Initiative: Announces $200 million in new R&D investments”, Office of Science and Technology Policy, Executive Office of the President, Mar 29, 2012.
12 “Smart In Car Trial car data real-time accessible to improve traffic flow and increase traffic safety”, ERTICO, Feb 21, 2012.
http://www.ertico.com/smart-in-car-trial-car-data-real-time-accessible-to-improve-traffic-flow-and-increase-traffic-safety/
13 同5。
14 同5。
15『醫局建「臨床寶庫」對症下藥』,《星島日報》,2013年7月3日。
16 “Smarter Hong Kong, Smarter Living: Consultancy Services for the Digital 21 Stratgey Review for the Office of the Government Chief Information Officer”, IBM China / Hong Kong Limited, September 2013.
17「California Fitness 向會籍申請人收集過度的個人資料違反私隱條例規定」,個人資料私隱專員公署,2013年12月5日。http://www.pcpd.org.hk/chinese/infocentre/press_20131205.htm
18 Nicolaes Heerschap, “Internet as a new source of information for the production of official statistics. Experiences of Statistics Netherlands”, Aug 29 2013.