时事分析 | 教育及人力资源 | 2016-10-13 | 《经济日报》

求学可以求分数:促进学习的评分制度



近年亚洲地区,包括香港、日本、台湾、南韩、新加坡,都先后推动教育制度改革,从推动学生背诵知识,转为让学生学懂运用知识。 [1]早在2000年,香港的教育统筹委员会便在「香港教育制度改革建议」中提出改革入学机制,减少测验考试。 [2]教育统筹局在2004年透过电视广告宣传「求学不是求分数」的口号[3],至今相信许多市民仍印象深刻,但亦成为「离地」的代名词。因为在现行升学制度下,「求学」与「分数」的关系仍然密切,而家长亦抱怨该口号往往成为子女懒散的借口。 [4]

不单是香港,在亚洲其他地区如台湾,在进行教育改革时亦会面对类似问题。台湾当局为了减轻学生升学压力,现时大部分初中毕业生已可免试进入高中或其他职业训练学校,但仍保留入读大学的升学考试。而为了维持学生的学习动机,评分机制亦由「常模参照」,即透过「拉曲线」呈现的相对成绩,转型为「标准参照」,又称绝对分数。 [5]

从相对分数到绝对分数的改革

香港其实较台湾更早经历这个过程,例如去年争议不休的全港性系统评估(TSA)在2004年推出之际,便是采用绝对分数的「水平参照」作为试验机制[6],现时新高中学制下的中学文凭试,亦已将过去在会考及高考采用的「常模参照」评级方法改为「水平参照」,同样是由相对分数转为绝对分数。 [7]

所谓「常模参照」是指考生成绩是按全体考生的相对表现来评分。评分方式是先选定一批近年在公开考试表现较为稳定的学校作为「对照组」,以他们的表现作为标准,以制定不同等级的百分比;然后考评局会根据这些「分數线」为參加考试的所有学生分配等级。 [8]换言之,在「常模参照」机制之下,考生最后所得的评级与整体考生的水平相关,如果整体水平下滑,那么排名较前的考生虽同样可获「 A」级,实力却没有保证。至于「水平參照」评级制度,则是根据具体的等级描述和示例,为考生实际达到的水平评级,不再与其他考生比较,其等级也不会受其他考生的表现影响。 [9]

由于每次考试的试卷深浅不一,如采用绝对分数,对于在不同年份参加考试的考生未尽公平。支持绝对分数优于相对分数的研究[10],提出了两点反驳,首先是相对分数只能让固定比例的考生获得某个评级,这样会令部分优秀学生的实际水准无法在评级上反映出来。 [11]此外,采用相对分数会制造一个驱使学生互相对抗竞争的环境[12],甚至传递「你成功代表我失败」的「零和游戏」讯息[13],催化学生之间的恶性竞争,例如变得不愿意分享个人的读书心得。

评分方式改变了 却不足以改变文化

因此教改转换评分方式之后,理论上可以创造较宽松而又能让学生力求上进的环境。然而,理想与现实之间终究存在鸿沟,单纯的制度转变未必能完全改变教育文化,这也是教改推行至今面对的樽颈。

让人记忆犹新的典型案例,正是上述的TSA。 TSA是教育改革的措施之一,由2004年开始推行,比文凭试更早采用「水平参照」评分,理论上只是「提供资料让学校及教师具体地了解学生在基本能力方面的强项与弱项,从而优化学与教的计画」[14],但后来却演变为恶性竞争,成为让学生竞相操练的元凶。箇中原因众说纷纭,但有一点可能最值得注意,就是TSA被许多学校认定与跨校评比相关[15],实质上就与「水平参照」的精神──避免同侪间恶性竞争──相违背,于是最终还是回到零和游戏的恶性循环,只是单位从「学生」变成「学校」。

借力打力 用考试成绩引导学生协作

由此可见,改革评分方式只是教改的第一步,并不代表学习风气能够风行草偃地转变。最近美国宾州大学华顿商学院教授Adam Grant撰文,除了主张在教学中应利用「绝对」而非「相对」的评分方式,同时还身体力行,在强调个人成绩绝不受同学影响的前提下,推动学生小组协作,进行一场改变学习风气的实验。

在2012年,Adam Grant首次在期末考试的设计上动脑筋,在全卷最困难的多项选择题部分,参考电视游戏节目《百万富翁》的做法,让学生有权在考试期间在他们最不确定答案的一题不作出任何选择,改为写下一个他认为最有可能懂得该问题的同学名字。如果被选同学在该题答对了,那么他们二人都将获得分数。 [16]

在这项制度下,学生之间逐渐形成一种合作文化,更多学生开始尝试在小组中学习,在小组中互相分享知识,同时了解彼此。让Adam Grant感到惊喜的是,在有关设计实施之后,即使未计入奖励分数,全班平均成绩按年提升了2%。到了2014年期末考前,已经有学生主动提议把班级分为「阅读」及「摘要写作」两组,并随即就有人表示愿意分享他已经完成的学习笔记给全班同学。许多学生主动贡献自己的独特见解,亦有人为大家设计了练习测验。于是,该年度全班平均分又再度提升了2.4%。 [17]

近年亚洲地区,包括香港在内的教育改革运动,多循削减考试的方式来减轻学生考试压力,这固然有助解决部分问题,但如升学制度上「考试」与「收生」的基本模式没有根本变化,则「教」与「学」亦难以产生太大改变。 [18]在此前提下希望学生能够做到「求学不是求分数」,终究是虚愿。

透过改变评分方式,固有利于减少学生、乃至学校陷入恶性竞争,但再进一步改善教学文化,需要如上述例子的培养协作文化,真正激发学生自主学习的动机,才可谓功德圆满。如此「分数」虽是旧瓶,却已换上新酒。日后如何深化理念落实,避免如TSA异化的问题产生,值得社会深思。

1 程介明,〈无试学期! 〉,《信报财经新闻》,2016年7月29日,A16页。
2 「改革入学机制及公开考试,创造空间」,《香港教育制度改革建议》,教育统筹委员会,2009年9月,第39页。
3 〈04年宣扬求学不是求分数〉,《苹果日报》,2015年10月29日,A12页。
4 〈Px、求学不是求分数〉,《苹果日报》,2004年4月17日,E14页。
5 「简介与目的」。取自国民中小学学生学习成就标准本位评量网站:http://www.sbasa. ntnu.edu.tw/SBASA/Assessment/assessment1.aspx ,查询日期2016年9月22日。
6 黄家梁,〈评估异化 竞相操练〉,《信报财经新闻》,2015年11月7日,A20页。
7 羅范椒芬,「水平參照评级的意义」。取自伯特利中学网站: http://www.bethel.edu.hk/subject/334_net/prepare_334/info/level.pdf ,最后更新日期2006年5月14日。
8 同7。
9 同7。
10 Pradeep Dubey and John Geanakoplos, "Grading Exams: 100, 99, 98,...Or A, B, C?" Games and Economic Behavior 69 (2010), p.72.
11 Adam Grant, "Why We Should Stop Grading Students on a Curve," The New York Times, September 10, 2016, http://www.nytimes.com/2016/09/11/opinion/sunday/why-we-should-stop-grading-students-on-a-curve.html?smid=fb-nytimes&smtyp=cur&_r=2.
12 同11。
13 同11。
14 「全港性系统评估:简介」。取自香港考试及评核局网站: http://www.bca.hkeaa.edu.hk/web/TSA/zh/Introduction.html ,查询日期2016年9月22日。
15 黄家梁,〈评估异化 竞相操练〉,《信报财经新闻》,2015年11月7日,A20页;「全港性系统评估(TSA)学校篇」。取自香港考试及评核局网站: http://www.bca.hkeaa.edu.hk/web/TSA/zh/pdf/tsa_hkeaa_leaflet_preview_chi.pdf ,查询日期2016年9月22日;「小三TSA 到底考什么?」。取自经济日报网站: http://topick.hket.com/article/901652/【懒人包】小三TSA 到底考什么? ,最后更新日期2015年10月20日。
16 同11。
17 同11。
18 同1。