引用格式:杨卫, 郑泉水, 侯杰泰, 申继亮, 刘坚, 刘益东. 以教育评价改革助推教育强国建设(专家笔谈)[J]. 中国考试, 2025(6): 15-26.
作 者
侯杰泰,香港中文大学原副校长,教授。
通过全面深入地分析国际学生评估项目(PISA)的研究数据和实证结果,可以对全球教育系统进行深度解构[2],这为我国教育改革提供了多维度的镜鉴。笔者从资源投入、教育均衡、教学效率、技术应用、教育生态优化五个方面,系统梳理PISA测评数据所揭示的教育发展规律。
一、教育资源的投入和配置与学业成就之间存在明显的边际递减效应 多年的PISA测评数据显示,教育投入与学业成就之间并非线性相关,而是呈现显著的边际递减效应。以PISA2022测评为例,OECD参测成员国家/地区的平均数学成绩为472分,平均教育投入为每年102612美元[3]。以教育投入为横坐标、数学成绩为纵坐标,进一步构建所有参测国家/地区的数学成绩与教育投入的关系。可以看到,数学学科在生均投入每月4500元人民币以下(2018年PISA约为3000元人民币)时,投入越多成绩越好,但达到该阈值后其边际效益锐减,这时怎样使用教育经费比教育资源投入多少更为重要。 显而易见,我们可以采用同一分析方法找出我国三十多个省市的扶贫线(阈值),在阈值以下是资源越多成绩越好,超过阈值之后即为怎样用钱比增加投入更为重要。此外,通过分析瑞典、新加坡等一些私立教育占比较高以及高社会经济地位孩子更为集中的学校发现,过度依赖私立教育可能会削弱公共教育质量,这对不同地方及我国民办教育规范发展具有警示意义。 二、教育均衡发展的双重维度 综合PISA2018、2022国际比较研究发现:芬兰、挪威、丹麦等国学校之间能力差异非常小,教育基本达到区域均衡。然而,由于这些学校并不依据学生能力选择学生,即能力不同的学生被随机分派到不同的学校,因此所有学校的校内学生能力差异都非常大。如果教师不额外采用超强力度协助学习能力较差的学生,则“不能放弃任何一个学生”“一个都不能少”等目标很难实现。例如,英国、美国、芬兰等国家的学校内差异极大,所有学校都有不少能力极差的学生。 而在亚洲的很多地方,如日本、中国的京沪苏浙、新加坡等因为有小学升中学的考试或中考制度,所以导致学校之间能力差异甚大。相较而言,因为不同能力的学生被分流到不同的学校,所以学校内的学生能力差异较小。此外,校内差异程度在亚洲不同地方的表现不同,如我国京沪苏浙地区的校内学生能力差异显著低于其他地区。通过调查发现,京沪苏浙地区的学生即使是能力稍弱,也会通过自身努力或在老师监督下取得较大进步,从而降低校内差异,这是他们的明显优势。 为了更好地促进我国教育均衡发展,在借鉴PISA测评结果的基础上,我们可以比较及监察不同省市在优质、均衡、学校间、学校内的各种能力差异,以了解不同地区的教育质量及支持系统。 三、学习效率及成绩的代价 学习效率是PISA测评的一项重要考查内容,通过测评分数除以校内外学习总时间得到该项分数,即计算PISA每一分的成绩需要学生每周学习多少小时。以PISA2015、PISA2018测评成绩为例,OECD参测国家/地区的学习效率存在明显差异。由结果可知,各参测国家/地区在学校上课时间差别不大,但课外用于学习的时间差别很大。其中,芬兰教育系统以每天极短的课外功课时间实现了学业成就的高效产出,学习效率显著高于其他国家/地区;亚洲(中国澳门除外)学生所用学习总时长较长,但平均学习效率处于中等水平;我国参测四省市的校内外学习时间均处于较高水平,其平均学习效率处于中等偏下位置。由此推测,我国四省市的部分地区存在以时间换分数、学习效率低下等现象[4],但这并不是说我国学生学习更为迟缓,而是反映了学习边际效应递减将整个学习效率拖低的事实。例如,很多学生学习一个小时就已经可以达到90分,但要想达到92分还需要再多学10个小时。 四、善用信息技术 二十世纪九十年代末,计算机开始进入学校教育,教育界开始试行并推动将信息科技应用于教育领域。通过比较PISA2000至PISA2012这十多年间学生的阅读素养成绩与在学校使用计算机完成作业的学生占比情况可知,使用计算机完成作业的学生占比越高,其阅读素养成绩反而呈下降趋势。由此可知,计算机进入校园以后,并不一定能提高学生的学习能力,因此还要不断地研究及监察使用计算机及科技与教育之间的关系。 近年来,随着ChatGPT等生成式人工智能(AI)的高速发展,一些国家紧急制定了相应的管控政策和要求,揭示了高科技技术的双刃剑效应。例如,澳大利亚在2024年11月发布公告禁止16岁以下青少年使用社交媒体;新加坡发布了严格的屏幕使用指南[5]。对此,我国教育领域亟须建立AI应用分级管理制度,如在基础教育阶段侧重思维、创意培育工具开发,高等教育阶段强化技术、态度、伦理教育,同时还要特别要警惕生成式人工智能对元认知能力发展的潜在影响,构建教育领域正确使用、定向开发、过程监控的人工智能应用框架。 五、教育生态的系统优化 在PISA调查问卷中,当提问学生“30岁可能在做什么工作”时,不同国家/地区的学生作答情况差异较大。例如,美国15岁学生中认为自己30岁时会从事科技领域工作(工程、科学、医疗卫生、计算机等)的人数占比高达37%,但他们的科学素养成绩是整体较低的;加拿大、英国、新加坡学生认为自己会从事STEM(科学、科技、工程、数学)工作的也很多,占比约为30%。这种科学素养与就业领域的非对称性特征,可能与不同国家/地区特有的科技创新生态系统密切关联,学生认为科学素养能帮助他们今后的工作及学习,并认为无论将来做什么工作,都需要科学素养。 反观我国参测学生可知,学生整体的科学素养得分很高,但愿意在30岁时参与科技工作的人数却很少。由此说明,学生对科学学科的兴趣和素养并未转化为职业倾向和职业选择,他们认为科学成绩只是申请大学的工具,今后从事的工作并不一定与科学相关。实际上,现在的工作几乎都离不开科技成果的使用甚至开发,如教师要学习使用新的智慧课堂软件。因此,我国学生对科学素养的消极态度容易导致未来科研人才的流失,这种现象值得教育领域人士深思。 没有实证数据,很难判断谁的意见或猜想更为准确。PISA研究展示了多种非常有启发性的研究分析方法,借鉴这些方法可以比较我国不同省市地区的教育情况,从而更深入、精准地进行教育改革,以推动我国基础教育向更高质量、更可持续的方向发展。
参考文献略