时事分析 | 创新及科技发展 | 2016-04-09 | 《经济日报》

让人工​​智能领导人民?AlphaGo战胜棋王的启示



人工智能系统AlphaGo在围棋对弈中,打败南韩棋王李世乭[1],令人对「机器学习」(machine learning)的技术刮目相看。其实在公共政策层面,AlphaGo的胜出也别具意义。因为部分国家的政府和公共机构,近年已开始借助「机器学习」技术,代替人类作出简单决定。当科技继续推进,机器的学习乃至思考能力更高,日后由机器担当「人类智慧的化身」,制订政策,领导人民,或许不只是科幻故事的桥段。

围棋的变化「无穷如天地,不竭如江河」,达10的171次方之数,有说比宇宙里的原子数目更多;要以人工智能计算围棋的所有变化,战胜棋王级别的高手,被不少人视为「不可能的任务」。 AlphaGo采用的「机器学习」技术,却是另辟蹊径,学习了人类高手大约3,000万个围棋走法,而且还透过自我对弈,发掘新战略,领略取胜之道。 [2]

累积现实数据 不断修正预测模型

「机器学习」是怎么一回事呢?简单而言,「机器学习」鉴古知今,根据计算大量输入值和输出值之间的关系,「学懂」去预测输出值。 [3]比方说我们想知道学生学习时数与测验成绩的关系,起初我们先给系统一个模型和相关参数,例如假设学生不温书会有50分,温习5小时可得满分,系统就会以一条方程式来呈现温习时数与测验成绩之间的关连。下一步是输入「学习材料」,也就是一些真实世界中的例子,让系统比较方程式和真实情况的落差,然后作出调整,让方程式更贴近现实情况。这个步骤不断重覆,透过更多的实例参照和调整,一步一脚印改善模型,直至模型完善,能以学生温习时数去预测测验分数。 [4]

也有情况,是不需由人类去输入模型或指明要学习目标,例如Google的一组电脑网络,能够在「看」过约1,000万个从YouTube影片撷取的图像后,「学会」辨别猫的出现。 [5]

「机器学习」的应用范畴,还包括互联网搜寻技术、智能电话上的语音辨认系统、电子邮件系统识别「垃圾邮件」功能,以至侦测涉及诈骗的不寻常交易或缴费等。 [6]Google甚至希望相关技术将来能有助人类应对更难解的问题,例如制作气候模型及分析疾病数据。 [7]

辨认邮件地址 识别违例泊车

现实中,亦已有政府机构应用「机器学习」,代替人类做繁琐工作。以美国邮政署为例,「机器学习」技术推动了光学文字辨认技术,令软件可以取代人眼辨认收件人的地址,再由机器为邮件分门别类。在2013年5月,软件已经能辨认近98%手写邮件及99.5%非手写邮件的地址。 [8]香港邮政的「机械拣信系统」始于1990年投入服务,由系统读取信件地址,将拣信程序自动化。新的系统自2009年6月起全面运作 ,而当局正分阶段为拣信机安装中文光学文字阅读功能,以便自动将印有中文本地地址的信件分类,预计新功能可于今年全面投入服务。 [9]

在澳洲,悉尼的曼利议会(Manly Council)则运用「机器学习」技术处理北部海湾区(Northern Beaches)的违例泊车,包括旅游巴在沙滩附近逾时停泊,以及车辆错占残疾人士专用车位。经过「学习」后,程式能够从监控镜头画面,识别车位是否有巴士停泊,并用电邮传送画面给相关人员,让他们只在有需要时才出动巡逻,而估计该项技术每年开支大约只需54美元。这项技术也有潜质用于其他方面,包括在运动场地不宜使用时,自动通知运动员,也可用于分析人群聚集情况,决定是否要作出疏散人群指示。 [10]

寻找污染源头 「检举」潜在罪犯

现时的「机器学习」技术,甚至已有能力做到更高层次的分析工作,应用范畴牵涉到人类的健康、自由以至生命安全的领域。在内地,科技公司IBM在2014年与北京市政府合作,开发一套空气污染预测系统,用电脑分析从空气质素监察站、气象卫星和光学感应器,甚至社交媒体获取的实时资讯,学习如何预测未来72小时空气污染物的源头和扩散情况。 [11]当局现在有时会禁制全市工厂运作应对空气污染,但政府将来的应对工作可以做得更精细,例如利用数据分析寻找空气污染物的源头,知道哪些工厂需要停工,哪些可以继续运作。 [12]

在美国,大约有三分二的释囚会在出狱后三年内因再犯罪被拘捕。麻省理工学院(Massachusetts Institute of Technology)统计学教授Cynthia Rudin运用「机器学习」,以33,700名人士的犯罪史,建立一些据称可以预测释囚再犯机会的模型。模型会按照多个准则为囚犯计分,若然总分高于某个水平,就意味该人士较大机会在获释后三年内再犯事。 Cynthia Rudin教授指出,这类预测再犯罪行为的模型,可用于作出社会服务资源分配、政策制订,以至判刑、缓刑和假释的决定。 [13]

另外,根据一些泄密文件显示,美国国家安全局(National Security Agency,下简称「国安局」)似乎曾试验一套用上「机器学习」技术的系统,判断有什么人为恐怖分子传话带信。该系统与科幻电影系列《未来战士》(The Terminator)里的奸角──人工智能系统「Skynet」(「天网」)同名,并且根据巴基斯坦大约5,500万个手提电话使用者的资讯,包括他们如何移动、与何人通话、何时关掉手提电话等因素去判断。 [14]

演算法非全然客观 离不开人为决策

「机器学习」的潜在应用范畴广泛,似乎可以肩负愈来愈重大的责任。然而责任愈大,只镬愈大;处理垃圾电子邮件的系统出错,最多只会令人误删重要邮件,但从以上例子可见,当「机器学习」技术应用到公共服务上,其错误可以影响到人身自由和安全。虽然人类也可能犯上同样错误,但官员犯错,公众理论上尚可追究,机器犯错,人类却奈佢唔何。

再者,人工智能的决策,并非必然客观,要人类心悦诚服地接受机器领导,恐怕不易。鼓励创新的英国组织Nesta在其有关「机器学习」的报告指出,不同的「机器学习」方法,即使是用上同一套资料,也可以演算出截然不同的结果,原因之一,是不同演算法所采用的假设各异,而资料分析亦难免涉及人类的主观判断,例如哪个模型最佳、什么变量(variable)最合适。 [15]因此机器的决定,始终会受把关人影响。

据报道,上文提到的泄密文件显示,美国国安局的Skynet系统根据所得的资讯,计算出国际媒体半岛电视台伊斯兰玛巴德(Islamabad)支部的负责人Ahmad Zaidan,有最大机会替恐怖分子当「传话人」。 [16]「天网」恢恢,疏而不漏,但世事未必都给「天网」看透。虽然Ahmad Zaidan与恐怖组织阿尔盖达成员有紧密联系,会定期会面、交谈和替他们传话[17],然而,这可能只是出于记者使命,未必意味他抱有恶意或是与恐怖分子同伙。如何运用Skynet所得出的这个结果,仍然需要人类作出判断。

机器也「歧视」?

关注网络公民权益和人权组织民主与科技中心(Center for Democracy and Technology)提出,从「机器学习」技术产生的决定和结论可能有歧视成分,或者加深不公平现象,其理论是各个演算法终究是由人类输入的资料和所订的准则中「学习」,结论难保不偏不倚。举例说,将深宵驾驶列为计算汽车保险的考量因素,背后可能假设了深宵驾驶的人经常流连酒吧,故此更易发生意外,不过这种假设也可能对从事夜间工作的人构成不公。 [18]

要避免不公,订立演算准则时须小心谨慎,Cynthia Rudin认为,制​​订一个可以影响判刑的预测模型时,不应用「种族」作为模型的因素,以免人们因种族而受到更重惩罚。她和她团队的模型,不单没有放进种族因素,连社会人口特征也避免使用。 [19]

决策理据或无人知晓

借助人工智能系统为公共事务作决定,另一个问题是如何向公众解释。以机器决定什么工厂要关闭,工厂负责人会质疑为什么他的工厂要在雾霾天停产,其他工厂却不需;在囚人士也会想知道为何他们的刑期较长,其他人则较短。不过由「机器学习」技术作出的决定,背后理据有时会无从稽考。曾在Google当软件工程师的David Auerbach指出,即使是设计程式的工程师,自身也未必可以清楚解释程式为何作出了某个决定,而当「机器学习」创造更多的协助分类的演算法,工程师不懂解释的情况也会日益普遍。 [20]若然政府根据「机器学习」技术得出的结论去作政策决定,却只知其然而不知其所以然,自然难以服众,因此在什么情况下接受机器领导,终归需要人类自行思考。

英国政府在2015年12月推出《数据科学的道德框架草稿》(Data Science Ethical Framework Draft),以协助政府及数据人员在应用数据科学时,决定可以做什么及应该做什么。 [21]框架提出,牵涉到数据科学的政府项目,愈公开透明愈好,例如相关人员能以浅白英语去解释所使用的工具、数据和演算法。其他的建议还包括清楚指出项目带来的公共利益、「机器学习」技术所用数据的质素和代表性、了解公众对于使​​用其个人资料的期望,以及保障数据安全等等。 [22]

要公众安心接受「机器学习」技术,前提是政府和公众对此已经有深入的了解。英国皇家学会在2015年就「机器学习」开展的工作项目,目标包括希望英国和欧盟的政策制定者以至英国公众,可以更了解这项技术的潜能、机遇和挑战。项目亦会触及「机器学习」现时和未来五至十年的应用、这些应用为政府政策和社会带来什么意义,以及这门技术引起的社会、道德和法律等问题。学会将在今年年底或2017年初推出报告,供英国和欧盟负责制订政策的人士参考。 [23]在香港,政府将在九龙东硏究发展「智慧城市」,借数码科技及智能资讯,改善城市管理和公共服务[24],当中会否采用「机器学习」技术,以及如何迎接这项技术带来的挑战,值得关注。

「机器学习」技术用途广泛,可以衍生出围棋大师AlphaGo,也可以衍生反恐工具Skynet。早前网络流传一段讯息,有人自称「约翰.康纳」(与《未来战士》角色同名),声称从2029年回到现在,目标是摧毁Google总部,阻止地球到2029年时,被电脑「天网」统治,而AlphaGo则被视为「天网」雏形。不过该人在穿越时光途中,意外掉在中国,需要阅读讯息的人捐助路费,让他可以前往Google总部云云。 [25]该段讯息,自然被视为笑话一则,但人工智能渗入生活的各个层面,已是不争之事。 Google是否存在 ,也阻挡不了它的步伐。

 

1 "AlphaGo's ultimate challenge: a five-game match against the legendary Lee Sedol," Google Asia Pacific Blog, http://googleasiapacific.blogspot.hk/2016/03/alphagos-ultimate-challenge.html, accessed March 17, 2016.< br /> 2 "AlphaGo: using machine learning to master the ancient game of Go," Google Official Blog, https://googleblog.blogspot.hk/2016/01/alphago-machine-learning-game-go.html, last modified January 27, 2016.
3 Harry Armstrong, "Machines That Learn In The Wild," Nesta..., July 2015, http://www.nesta.org.uk/sites/default/files/machines_that_learn_in_the_wild.pdf, p. 4.
4 Danny Sullivan, "How Machine Learning Works, As Explained by Google," Marketing Land, http://marketingland.com /how-machine-learning-works-150366, last modified November 4, 2015.
5 Quoc Le, "Building High-level Features Using Large Scale Unsupervised Learning," Research at Google, https://plus. google.com/ ResearchatGoogle/posts/EMyhnBetd2F, last modified June 27, 2012.
6 Stephen Goldsmith, "Innovation: What's the Next Phase?" government technology, December 1, 2015, http://www.govtech.com/data/Innovation-Whats-the-Next-Phase.html; Harry Armstrong; "Machines That Learn In The Wild," Nesta..., July 2015, http://www.nesta.org.uk/sites/default/files/machines_that_learn_in_the_wild.pdf, p. 5.
7 同2。
8 Simon Lidberg, Benjamin Wright-Jones, "Microsoft Analytics: The Next Wave," Sqlbits, https://sqlbits.com/Downloads/465/Microsoft Analytics The Next Wave SQL Bits - MSFT - 12.pdf , accessed March 15, 2016, pp. 5-7, Ron Nixon, "Last of a Breed: Postal Workers Who Decipher Bad Addresses," The New York Times, May 3, 2013, http://www.nytimes.com/2013/ 05/04/us/where-mail-with-illegible-addresses-goes-to-be-read.html?_r=0.
9 「香港便览:香港邮政」,香港特别行政区政府新闻处,2015年12月。
10 Marie Sansom, "Sydney council uses machine learning to crack down on parking pests," GovernmentNews, November 2, 2015, http://www.governmentnews.com.au/2015/11/sydney-council-uses-machine-learning-to-crack-down -on-parking-pests.
11 "IBM Research Launches Project 'Green Horizon' to Help China Deliver on Ambitious Energy and Environmental Goals," IBM, http://www-03.ibm.com/press/us/en/pressrelease/44202.wss, last modified July 7, 2014; "Featured research: Green Horizon," IBM, http://www.research.ibm.com/labs/china/greenhorizon.html, accessed March 15, 2016; Louise Watt, "Beijing authorities use technology in pollution battle," Associated Press, December 9, 2015, http://bigstory.ap.org/article/b5cd6040107b4bcabda9a0ba39251be7/beijing-authorities-use-technology-pollution-battle.
12 Louise Watt, "Beijing authorities use technology in pollution battle," Associated Press, December 9, 2015, http://bigstory.ap.org/article/b5cd6040107b4bcabda9a0ba39251be7/beijing-authorities-use-technology-pollution-battle.
13 "MIT Sloan professor ​​uses machine learning to design crime prediction models," MIT Sloan Management, http://mitsloan.mit.edu/newsroom/press-releases/mit-sloan-professor-uses-machine-learning-to-design-crime-prediction-models , last modified April 23, 2015.
14 Martin Robbins, "Has a rampaging AI algorithm really killed thousands in Pakistan?" The Guardian, February 18, 2016, https://www.theguardian.com/science/the-lay-scientist/2016/feb/18/has -a-rampaging-ai-algorithm-really-killed-thousands-in-pakistan.
15 同3。
16 同14。
17 同14。
18 AR Lange, "Digital Decisions: Policy Tools in Automated Decision-Making," Center for Democracy & Technology, January 14, 2016, https://cdt.org/files/2016/01/2016-01-14-Digital-Decisions_Policy-Tools- in-Auto2.pdf, pp. 3-4.
19 同13。
20 David Auerbach, "The Code We Can't Control," Slate, January 14, 2015, http://www.slate.com/articles/technology/bitwise/2015/01/black_box_society_by_frank_pasquale_a_chilling_vision_of_how_big_data_has.html.
21 "Data Science ethics," Data in government, GOV.UK, https://data .blog.gov.uk/2015/12/08/data-science-ethics, last modified December 8, 2015. 注:框架暂时仍是草稿,而非正式政策文件。
22 "Draft Data Science Ethical Framework," United Kingdom Cabinet Office, December 2015, https://data.blog.gov.uk/wp-content/uploads/sites/164/2015/12/Data- science-ethics-short-for-blog-1.pdf.
23 "Machine Learning," The Royal Society, https://royalsociety.org/topics-policy/projects/machine- learning, last modified November 20, 2015; "Machine Learning: Project scope," The Royal Society, https://royalsociety.org/topics-policy/projects/machine-learning/project-scope, accessed March 16, 2016.
24 「智慧城市@九龙东」。取自起动九龙东办事处网页:http://www.ekeo.gov.hk/tc/smart_city /index.html,最后更新日期2016年3月17日。
25 「网传短讯指AlphaGo将统治地球『未来抵抗军首领』掉落中国 吁助购机票毁Google总部」。取自明报新闻网网站:http://news.mingpao.com/ins/instantnews /web_tc/article/20160313/s00004/1457880773520,最后更新日期2016年3月13日。