首页    >    教育资讯
杜玲玲:基于中学物理竞赛的拔尖创新人才选拔机制研究

2024-03-05

原创 杜玲玲 中国考试 2024-01-26 16:17 北京原文刊载于《中国考试》2024年第1期第45—52页。作 者:杜玲玲,北京教育科学研究院副研究员。摘 要:我国的中学学科竞赛活动,是引导和培养具备科学家潜质的青少年群体的重要途径。40年来,中学物理竞赛促进了一大批学生科学素养的提升,促进了中学物理师资队伍建设和教育教学改进,也取得了优异的国际奥赛成绩,有利于拔尖创新人才选拔和培养。但在实践中也存在功利性强、竞赛教练资源缺乏、竞赛发展水平区域差异巨大、奥赛成绩辉煌但拔尖创新人才仍显不足等问题。为提升我国拔尖创新人才自主培养能力,促进高质量教育体系建设,应将物理竞赛对拔尖创新人才的选拔与激发学生学习兴趣相结合,保持选拔工具的科学性和有效性,重视拔尖创新人才的非认知能力培养,发挥竞赛对常规教学的促进作用,完善竞赛的体制机制建设。关键词:拔尖创新人才;选拔机制;物理竞赛;教育评价改革党的二十大报告提出加快建设高质量教育体系。全面提高人才自主培养质量,着力造就拔尖创新人才,成为新时期教育改革与发展的重点[1]。2009年国家首次推出“基础学科拔尖学生培养计划”,2018年教育部等6部门进一步实施基础学科拔尖学生培养计划2.0[2],其中数学、物理等基础学科受到广泛关注。拔尖创新人才通常是指具有创新意识、创新精神、创新思维和创新能力,并能在研究工作中取得创新成果的人才,本文中特指具有扎实理论基础和知识储备、强烈的社会责任感、创新精神和创新能力并存、具备科研潜质的中学生。研究发现,科学、技术、工程、数学领域的竞赛在影响学生日后的职业选择方面效果尤为显著,竞赛的成功参与者比同龄人更有可能从事相关学科的研究,并取得高于平均水平的成就,学科竞赛被视为学校教育之外,培养学生创新动机和提高创新技能的一种有力措施[3]。参加竞赛的高中生科学素养水平较未参加的学生提升更高[4]。学科竞赛对推进教学内容及课程体系改革、改善办学水平、培养学生创新能力和综合素质也有重要的促进作用[5]。在我国,基础教育阶段开展的学科竞赛活动历经多年发展,被视为引导和培养具备科学家潜质的青少年群体的重要途径之一。本文以参赛学生规模较大、发展较为充分的全国中学生物理学科竞赛为例,结合文献研究和重点调研、访谈,研究竞赛模式对于拔尖创新人才的选拔和培养作用、成效与问题并提出政策建议,探索加快建立健全拔尖创新人才培养体系的中国经验和模式。一、我国中学生物理竞赛的学生选拔及培养现状(一)中学生物理竞赛选拔机制全国中学生物理竞赛(中国物理奥林匹克,CPhO)自1984年首次举办至今,已有40年历史,和数学竞赛一起成为国内最受中学生欢迎、规模最大的学科类竞赛赛事[6]。以2021年为例,有来自5000多所中学的近90万名学生参加全国中学生物理竞赛。经过预赛、复赛,每年参加决赛的学生人数从1984年首届的76人增加到2021年的480人。决赛中的前50名选手入选国家集训队,集训队再选拔5名学生,于次年7月代表中国参加国际物理奥林匹克竞赛(International Physics Olympiad,缩写为IPhO),另外选出8名学生参加亚洲物理奥林匹克竞赛。其中,IPhO是最负盛名的国际中学生物理竞赛,主要目的是测试最高水平的知识、批判性思维、问题解决能力、演示和分析实践以及理论和实验物理等实际操作技能[7]。竞赛集训队成员,特别是获奖选手,成为各高水平大学争相录取的对象[6]。(二)物理竞赛的试题特点中学物理竞赛对学生的学科核心素养提出了更高要求,但没有脱离基础教育培养目标,仍然注重考查学生的基础知识、基本技能,激发高中学生热爱物理、钻研物理,持续提升分析问题和解决问题的能力,并帮助他们改进学习方法,学会学习、学会思考。通过综合梳理对竞赛试题的研究发现,我国物理竞赛试题特点包括以下7个方面。一是理论试题信息含量丰富[8]。近年来物理竞赛关注科技前沿成果,注重调动学生用物理知识解决实际问题,试题情境包含大量信息,要求学生不仅具备良好的阅读能力,也要具备良好的信息提取能力,从实际问题情境中看到事物的本质,提取关键且必要的信息,并建立恰当的模型,进行分析。二是力学和电磁学成为竞赛内容的重点和难点。力学和电磁学是高中阶段物理学习的主要内容,因此CPhO近5年预赛卷中高考考点比例平均为71%,2020年甚至达到87.5%,其中力学和电磁学模块占比超过总分的2/3,光学、热学、近代物理部分一共占1/3[9-10]。复赛、决赛的知识深度和广度都高于高考,对知识点之间的相互联系和结构的考查也比较综合。复赛中综合性试题平均占比在30%左右,几乎都是与力学知识点的结合[11]。决赛中综合性试题平均占比在60%左右,对参赛学生提出了更高要求[12]。三是注重考查学生的科学素养。物理核心素养包括物理观念、科学思维、科学探究、科学态度与责任4个方面。对CPhO预赛2014—2018年试题的研究发现,物理观念考查占预赛试题的14.5%,对科学态度与责任的考查占比在25%以下。科学思维则分为模型建构、科学推理、科学论证、质疑创新,其中预赛对科学推理的考查占65.5%,对模型建构的考查占27.4%,对科学论证的考查仅占7.1%,但几乎没有对学生质疑和创新能力的考查[10]。四是考查学生的高阶思维能力。CPhO预赛对能力的考查以运用为主,分析能力次之,评价、创新能力未直接体现,该结构体现了预赛的基础选拔作用和普适性特点[8]。有研究者运用SOLO分类理论,对CPhO复试2008—2018年试题进行分析,发现拓展抽象结构水平问题占比最高,学生须学会从抽象的物理情境中挖掘新的信息,将抽象问题具体化。关联结构类问题占比次之,单点和多点结构类问题考查较少。电磁学部分对思维能力的考查最为明显,其次为力学、热学、近代物理、光学[13]。五是对数学素养要求较高。物理竞赛需要用到大量数学知识和数学方法解题,对CPhO预赛2014—2018年的试题研究发现,抽象思维占23.7%,逻辑推理占3.1%,数学建模占1%,直观想象占13.4%,数学运算占58.8%。复赛、决赛中微积分内容的考查大幅增加了计算量,而且决赛中涉及的数学知识更复杂,思维难度要求也更高[12]。可见,物理竞赛对学生的数学素养提出了较高要求,需要具备从物理现象中抽象出数学关系的能力和数形结合能力。六是试题情境设置侧重生活实践和科学前沿。竞赛试题重视科学技术在社会生产、生活及发展中的应用,可分为联系生活实际、科学前沿成果、物理学经典理论3种类型。联系生活实际的试题是学生在日常生活中遇到的具体问题,需要举一反三,广泛联系所学知识。科学前沿试题以最新的科研成果为背景,将其研究过程予以模型简化引导,必要时给出一些已知条件,使学生体验科研工作,关注前沿物理学热点问题。物理学经典理论给出科学家当时研究问题的背景,再现研究思路、发现过程。七是复赛和决赛体现出对人才的较强选拔性和甄别性特征。有研究者对湖南省参加全国36~37届竞赛学生的成绩分析发现,复赛低分段所占比例达80%,决赛中间段占70%,这表明经过复赛选拔的学生具有扎实基础和优异思维能力,这也体现出物理竞赛的强选拔性和甄别性,决赛成绩未呈现两极分化,分布较为均匀[14]。(三)物理竞赛学生的培养情况根据竞赛流程,可以将学生培养分为两个阶段,一是决赛前学校教育中的常规培养,二是获得全国竞赛一等奖的前50名学生的集中培养。在第一阶段,并不是所有普通高中都能开设竞赛类培养课程。开展培养的学校,通行模式是在高一学年面向有兴趣和学科特长的学生开设物理竞赛选修课程,通过课程难度和学生接受程度自然淘汰,于高一学年末确定参加竞赛的学生。学校还会定期邀请高校专家对学生进行辅导,一些省份的高校物理学院会对进入省队参加全国决赛的学生进行集中培训,也有些学生会在校外机构学习竞赛内容,但仍以学校教学为主。课程的内容和教材,由每所学校的学科竞赛教练根据竞赛大纲自行决定或编写。通常而言,高一主要是学习课程知识,教师教授和学生自主学习相结合,高二以习题和实验为主,主要采用学生探讨的形式,培养思维能力和解决问题能力。一些物理竞赛的学生同时还参加数学竞赛。在第二阶段,获得全国竞赛一等奖的前50名学生组成集训队,通过短期集中培训,从中选拔能够适应国际竞赛和亚洲竞赛的选手,组成国家队参赛。中国自1986年组织参与国际物理奥林匹克竞赛以来,一直由北京大学、中国科技大学、复旦大学、南京大学、南开大学和清华大学轮流承担国家队集训选拔和国际比赛的任务。当年承担任务的高校组建奥林匹克物理竞赛工作小组,成员由若干教学、科研工作经验丰富的教师组成。一般在集训前会制定明确的集训、选拔方案,并收集有关物理竞赛的资料。通过和学生交流、制定详细教学计划,会在教学中有针对性地突出重点,通过科学、规范、严格的培训帮助学生用已有或给定的知识对所提出的问题进行分析、建立模型和解答。二、我国中学物理竞赛的成效及问题(一)竞赛取得的成效首先,促进了学生科学素养的发展。学科竞赛为学生提供了锻炼思维的机会,促进了他们获得新知、对问题进行深入探讨、增强学习兴趣,提高了解决问题的技巧性和创造性。对问题的科学探索和研究具有过程性,锲而不舍的钻研精神和科学态度,也有利于学生学习品质和学习能力的提升,促进了他们科学素养的早期培养。我国物理竞赛目前已形成较为良好的生态,每年参与初赛的学生人数已接近90万,为国家储备了大批对科学感兴趣,并且有一定科学素养的后备人才。其次,有利于拔尖创新人才的选拔和培养。学科竞赛能更好地关注学生的个体差异和发现学生的独特才智,是对我国人才评价方式的完善,符合以素养为核心的现代教育要求,有利于及早发现和培养青少年创新人才。竞赛的准备阶段主要靠选修课和集训完成,时间相对紧张,需要学生进行大量的课外自学和思考;竞赛中的探究性问题往往需要从多个角度思考和进行探索。竞赛还会改变学生原有的学习轨迹,要求他们不仅要制定科学的学习计划,还要有稳定、坚强的意志,有信心和勇气面对各种挫折挑战。因此,自学能力、高阶思维和问题解决能力、抗压抗挫能力是竞赛选拔出的资优学生最为重要的特征。再次,促进了学科教师队伍的建设。参加竞赛的学生大多智力超常,指导教师需要对竞赛的研究性、前沿性进行自觉学习、深入研究,一定程度上促进了中学教师拓宽视野。竞赛同时促进了中学物理教师教学水平的提高,涌现出一批业务成绩卓著的中青年教师,且多人获评特级教师,有利于教师整体队伍的建设[6]。又次,促进了物理学科常规教育教学的改进。竞赛题兼具综合性、创新性、思维延伸性特点,内容灵活多样、新奇有趣。这不仅为高中课堂教学注入了新的活力,也为中学教材和课程改革提供了参考,提高了学生的自学能力和逻辑思维能力,有利于高中课堂教学质量的提升。竞赛提高了物理实验教学水平,实验任务不仅促进了中学物理实验室的建设,也使那些对物理学习兴趣浓厚的学生显著提高了实验水平[6]。一些竞赛试题来源于相关学科的研究成果,具有新颖性、启示性和方向性,往往对中学物理教学起到导向作用。通过学科竞赛的教学试验,可以掌握现阶段学生学习知识的能力和全国学生能力的综合指数,通过对学生学习能力的相关数据及未来人才发展情况的分析,可以更好地制定高中物理课程新课改内容。最后,取得了优异的国际物理奥林匹克竞赛成绩。截至2022年,我国一共参加了36届国际物理奥林匹克竞赛,共选派出178位选手参赛,获得146枚金牌、21枚银牌、9枚铜牌,以及2个表扬奖[15]。近10年,我国每年参加国际奥赛的选手都获得金牌。中国队从2000年亚洲物理奥林匹克竞赛首次举办即开始参赛,截至2021年,共参加18届赛事,选派出153位选手,获得144枚金牌、7枚银牌、1枚铜牌,1个表扬奖,为国家赢得荣誉。(二)竞赛中存在的问题首先,功利性升学偏离了学科竞赛初衷。竞赛最显著的功能是发现、选拔、培养特殊人才,但目前这一功能已受到质疑,原因主要体现在:1)功利化倾向。学校、家长和学生参与奥林匹克竞赛更注重能否通过获奖取得顶尖大学的保送或入选“强基计划”等资格,逐渐违背了竞赛初衷,演变为学生之间激烈的升学竞争,带来巨大的学业压力。2)培训急于求成。很多学校采取集中强化培训的方式,让学生在很短时间内大量学习高深知识,课程进度过快而无法做到循序渐进,这种急功近利的短期培训方式很容易消磨学生的信心和兴趣,还会对其他学科的学习产生负面影响。3)过于强调应试技巧。目前的一些竞赛题往往设置诸多障碍,学生需要在审题和对应试技巧的摸索中花费大量时间,影响了对核心知识和必要能力的掌握,竞赛培训体系也有待改进完善[16]。其次,优质教练资源十分稀缺。关于竞赛课程的开设和竞赛学生的培养,最突出的问题是师资力量。承担竞赛课程的教师需要引导拔尖人才坚定探索物理学前沿问题的信念,但当前中学阶段的竞赛教练,无论从数量还是综合素质上都不能满足相应要求。高中物理竞赛教师队伍存在结构不合理、数量严重短缺、学科知识不足、稳定性不高、压力过大等问题[17]。再次,竞赛发展水平存在较大的地域差异。我国物理学科竞赛发展水平的区域间不平衡问题表现显著。2013—2021年入选国际物理奥林匹克竞赛国家集训队的学生,主要集中在湖南、浙江、湖北、北京、河北、上海等6省市,广西、新疆、内蒙古、甘肃、云南、贵州等10余个省(区、市)没有学生入选。此外,各省每年获得全国中学生物理竞赛一、二、三等奖的人数也存在省域差异、校际差异,前述竞赛成绩最好的6个省市,入选国家集训队的学生基本集中在省市内最好的几所高中[18]。又次,我国奥赛成绩辉煌却仍缺乏拔尖创新人才。竞赛从本质上来说是一种基于学科核心素养创造性设计的、需要短时间内完成的竞技性活动,对考试范围、性质都有明确规定;而从事科研创新则是以探索未知为主题、充满创造性的活动。历来对于中国奥赛成绩辉煌却仍缺乏拔尖创新人才的诟病不绝于耳,实际上这是有一定相关性、但本质不同的两个问题。首先,拔尖创新人才并不全靠奥赛培养,也不能把尖端人才的缺失归咎为奥赛制度本身。人才培养是一个长期过程,不能一蹴而就,中学只是成长的一个阶段。其次,常见的批判认为师生、家长过于看重名次,学生参赛只为获得名次而非出于兴趣爱好,加上竞赛模式过于看重应试技巧而不注重科研能力、综合素质,从而导致参赛学生未能成长为拔尖创新人才。实际上,有过奥赛经历的科学家普遍认可竞赛在识才、选才方面不可替代的价值,但也表示竞赛能够培养的,仅仅是从事科学研究需要具备的能力中的一小部分,过度训练反而事倍功半,在认知和心理上都阻碍了学生其他能力的发展。他们主张尊重教育规律和拔尖创新人才成长周期,强调平衡的教育,将竞赛视为整个科学甚至文化教育的一部分,跳脱其功利性的不良影响[19]。最后,学科竞赛活动对拔尖创新人才培养和选拔效果的研究不足。国外针对学科竞赛活动开展过不同角度的研究,主要包括追踪获奖选手的后续发展情况以考察竞赛选拔实际效果;调查竞赛对选手继续学习科学和从事科学事业的动机影响、为选手带来的成就感与归属感,以及分析竞赛活动为科学课堂教学带来的积极效果等。针对中学生5大学科竞赛,有研究发现,学科竞赛在提升学生的科学兴趣和价值观认同方面效果较为明显,对学生有良好的职业导向。具体表现包括:参赛选手深化学科兴趣并在后来的学术与职业生涯中取得杰出成就;学科竞赛活动能强化学生的自我效能,竞赛奖项为学生带来学术生涯中最具成就感的时刻,也为后续专业学习带来短期的相对优势,但这两项效果在我国竞赛活动中仅达到中等水平,有待加强[20]。总体而言,国内文献较多关注各学科奥赛试题介绍分析和备赛经验,对拔尖创新人才培养和选拔效果的研究较少。三、促进拔尖创新人才选拔培养的政策建议通过学科竞赛模式,可以较早发现拔尖创新人才,但我国各个学段的学科竞赛培训尚未形成贯通培养机制,多年积累的培训策略未能广泛转化和促进常规教学。竞赛发展不均衡、选拔人才总量有限、创新素养和创新能力培养尚未成为教育常态等,都大大制约了拔尖创新人才自主培养的质量和数量。基于上述研究,本文提出借鉴竞赛选才机制和培养策略的5条政策建议,以期加快建立健全拔尖创新人才选拔培养的中国模式。(一)坚持拔尖创新人才选拔与学生科学兴趣激发结合我国中学生物理竞赛分为5个阶段,不同阶段的选拔目标和侧重点各有差异,应坚持将识别拔尖学生和激发更多学生学习兴趣相结合。初赛和复赛阶段,应以鼓励更广泛的教师和学生参与为主,设置与IPhO相关、不容易找到解决方案的独特任务,以促进学生通过研究性学习加深对物理学科的了解。决赛和集训队阶段,一方面要强调学生的选择性和培训训练;另一方面也要保护其科学学习兴趣,保证能够参与并取得优异成绩的学生确实具备学科天赋、学习能力和心理素质。因此,可以开展丰富的竞赛学生与研究人员、同龄人之间的交流对话、短途旅行等活动,鼓励参加过比赛的学生参与评卷和交流互动。通过配合高中课程改革、高校招生制度改革和正向引导社会舆论,扭转学校、教练、学生和家长的功利性备考,让参与竞赛的学生回归到对科学本身的兴趣和对科学问题的积极探索中。就科学素养普及功能而言,竞赛试题完全可以面向全体中学生,但从发现和选拔人才的角度而言,竞赛的确只适合有浓厚兴趣和较强数理能力的少数学生。如果强制多数学生投入高强度的竞赛训练,则违背了教育规律。如何让超常学生在发展物理学科能力的同时感受灵活、理性的思维方式,始终保持对物理的学习兴趣,是开展竞赛活动首要考虑的因素。认知目标和情感目标间的相互作用是大多数选择参加竞赛学生的最初动机,保持对学科的兴趣比竞赛得奖更为重要。(二)提高竞赛选拔工具的科学性和有效性竞赛作为拔尖创新人才选拔的一种模式,选拔手段的质量会直接影响选拔效果。全国物理竞赛将试题+实验设计+操作作为选拔手段,不仅要选拔出物理学科的拔尖人才,作为指挥棒,也担负着引导物理竞赛教育方向的责任。目前对物理竞赛试题的研究主要集中在试题内容、解题方法、能力要求等方面,今后需要加强对选拔工具科学性和有效性的研究,一方面分析试题的难度、区分度和信效度,另一方面要保持试题质量的稳定性。从引导竞赛教育方向的角度,要明确试题的测评框架,既保证知识内容合理,又以素养为导向,同时能够贴近实际情境和物理学科的前沿动态,引导竞赛以培养学生的核心素养为目标。(三)重视拔尖创新人才的非认知能力培养能在竞赛中取得优异成绩的学生,具备成为拔尖创新人才的智力基础,教师在培养过程中还需要重视他们非认知能力的发展。在人格和个性方面,培养学生的独立性和批判性思维、强烈的好奇心、求知欲与浓厚的兴趣、高度的社会责任感和事业心、执着的追求和坚忍不拔的毅力;在创新素养方面,培养学生的创新思维、创新精神、创新意识和创新能力;在情绪管理方面,帮助学生学会识别、监控、管理自己和他人的情绪,并利用这些情绪信息指导自己的思想和行为;在领导和管理素养方面,帮助学生在学校一些特定的情境中充当领导和管理者角色,吸引和影响他人共同实现目标,包括战略思考和规划能力、应变协调能力和团队协作力等[21]。(四)发挥竞赛对日常教学的促进作用首先,培养学生对物理学习的兴趣。竞赛中有相当多的题目与当前物理研究热点有关,这在日常教学中同样重要。可以通过多种方式提高学生以物理学眼光探索世界的求知欲,培养学生的科研兴趣。其次,创设源于现实的物理情境,培养学生抽象建模能力。常规教学可以借鉴竞赛决赛试题,尤其是在进行抽象模型教学时,多设置一些源于真实世界的物理情境问题,有助于培养学生的抽象建模能力。最后,培养学生的推理、论证和问题解决能力。物理竞赛需要学生通过推理和论证,解决复杂的、陌生情境中的新问题,推理与论证的过程涉及大量公式推导、物理量关系运算、数学模型建构等,加强数学素养的培养,也是培养学生推理、论证能力的有效手段。此外,还应发挥竞赛对实验教学的促进作用。实验探究不仅是竞赛中的重要考试模块,也是高中物理课程的重要内容。物理实验在提出问题、猜想和假设、制订方案、实施过程和得出结论中渗透了较多的质疑和创新因素,可以考查学生的基本物理实验技能和创造性解决实际问题的能力。教师可以结合课程标准中“学生必做实验”“活动建议”和教材中的“课题研究”模块,把它们分成“实验室操作类”“实践活动类”内容,通过物理实验搭建适应创新素养培养的教学实施路径,为创新人才培养奠定基础。(五)完善竞赛体制机制建设首先,教育部门应加大对基层物理竞赛资源支持力度。大部分学校一方面缺乏了解、熟悉竞赛的优质师资,另一方面缺乏相应的实验设备,课程教学也处于摸索阶段。国家层面虽然大力倡导、鼓励学校开展面向创新人才选拔的竞赛教育,但缺乏相应的资源支持体系。国家层面除了在获奖名额上对薄弱地区倾斜外,更应该加大对师资培训和课程资源的支持。省级教育主管部门也应建立相应的保障体系,加大对县域中学开展竞赛教育的支持。其次,适当增加竞赛的集训名额。在大学进行集中培训,有利于学生更全面地认识和思考物理问题,在高中阶段就能从学科本质出发理解物理。目前的集训队只有50个名额,可以进一步将名额扩展到获得决赛一等奖的所有学生。考虑到高校所能承担的学生培训容纳量,可以让一等奖的学生分散在不同大学的物理学院进行培训,再选拔进入国家队。由此扩大资优学生的人才池,培养和引导他们成长为拔尖创新人才的几率也会大幅增加。最后,在教育条件较好的地区,可试点建设一批科技高中,探索中学和大学的人才贯通培养渠道,识别、筛选和培养一批天才少年,做好制度设计、创新课程设置和培养方案,超常规配置教学、科研资源和师资力量,培养拔尖创新人才。总之,基于中学物理学科竞赛在拔尖创新人才选拔和培养中的经验,应针对性解决其中存在的突出问题,探索面向更多学生的普惠培养方案,激发学生学习兴趣,大比例提升拔尖人才选拔和培养的基数,畅通具有天赋和潜力学生的选拔和培养通道,进一步优化相关体制机制建设,进而提升我国拔尖创新人才自主培养能力,促进高质量教育体系建设,为国家培养更多未来领军人才和国际一流科学家。参考文献

李传宗:新高考改革对大学生专业兴趣的影响研究

2024-03-05

原创 李传宗 中国考试 2024-01-29 15:30 北京原文刊载于《中国考试》2024年第1期第62—71页。作 者:李传宗,北京师范大学教育学部硕士研究生。摘 要:专业兴趣是衡量本科人才培养质量的关键指标。基于第3批高考改革省份高校3万余份学生调查数据,考察高考改革能否有效促进学生的专业兴趣及其作用机制。研究发现,新高考生源大学生专业兴趣显著高于传统高考生源大学生,专业匹配度在其中发挥关键的中介作用,新高考生源大学生的专业兴趣在专业类别、家庭背景和学校背景等方面存在群体差异。可通过完善生涯教育体系、改善教育资源配置等措施巩固改革成果,进一步提升学生的专业兴趣。关键词:新高考;高考改革;专业兴趣;专业匹配;生源质量;高考评估高考作为连接基础教育与高等教育的桥梁,具有“牵一发而动全身”的重要战略地位,是深化教育领域综合改革的杠杆和抓手。评估高考综合改革成效,对于深化完善先行试点省份改革、稳步推进后续推广省份改革以及凝聚全社会改革共识等具有重要意义[1]。服务选才是高考的基本使命与核心功能,也是高考改革评估的重要维度,新高考生源质量得到社会的广泛关注,被视为评价高考综合改革成效的重要参考。专业兴趣作为学生发展领域的重要议题和衡量本科人才培养质量的关键指标,能够反映新高考生源质量。越来越多的学生通过新高考进入高等教育阶段,他们的专业兴趣表现如何呢?本研究将围绕新高考能否有效促进大学生的专业兴趣这一问题开展调查。一、文献综述新一轮高考改革已推行近十年,就人才选拔的基本使命而言,现有高考改革评估研究主要集中于新高考能否促进公平选才和科学选才两个角度。就高考服务选才的公平性而言,一方面,研究者们讨论了招生计划分配、考试内容、考试方式和招生录取方式等新高考政策的公平性问题[2]。另一方面,研究者们关注新高考背景下弱势群体的教育获得问题和学校教育的补偿效应[3-4]。就高考服务选才的科学性而言,学者们主要从高考成绩与排名、学习适应性和学业表现等3个方面考察了新高考的生源质量[5-7]。研究表明,新高考促进了高中-大学教育衔接,能够帮助学生更好地适应大学学习和提升学业表现[8-9];但也有证据显示,理工科大学生似乎在新高考背景下面临更大的学习困难[10]。兴趣在教育活动中处于能动地位[11],是影响学生学业和生涯发展的关键因素,新高考背景下大学生的专业兴趣表现既关乎人才选拔的科学性问题,也关乎学生发展的公平性问题,值得进一步探讨。专业兴趣是大学生对其所学专业领域表现出的偏好,反映了大学生对学习本专业感到满足的心理和情感状态[12]。参照Hidi和Renninger提出的兴趣发展四阶段模型,专业兴趣介于最初的个人兴趣和稳定的个人兴趣之间,其发展具有长期性和相对稳定性的特点[13]。大量研究表明,作为重要的内部性动机,专业兴趣能够激发学生的求知旨趣,有效促进学生的学习投入和深度学习,是预测学生专业承诺、学业成就和科研创新的重要因素[14-17]。学生的专业兴趣不仅需要在高等教育阶段培养,还涉及基础教育与高等教育衔接的复杂过程[18]。学生在进入高校开始接受专业教育之前,便已经基于自己的特长、爱好,以及关于某些学科或职业的认知形成了初始兴趣。有研究表明,学生的初始专业兴趣受到个体、家庭、学校、政策等多种因素的影响,如个人学术动机与学业水平、家庭支持、学校生涯教育、志愿填报机制等[19]。一方面,学生在基础教育阶段形成的初始兴趣会影响学生的专业选择和大学期间的学业表现[20-21];另一方面,过重考量功利因素而做出的专业选择也可能会有损于学生在高等教育阶段的专业兴趣发展,导致教育过程的异化,妨害学生成长成才[22]。从我国高等教育实践来看,学生的专业兴趣不足始终影响人才培养质量,是提升我国拔尖创新人才自主培养能力必须攻克的难关[23-24]。高考综合改革以实现学生“学其所好,考其所长,录其所愿”为政策目标,旨在增加学生的选择,尊重学生的兴趣爱好和受教育权利,引导学生全面发展,提升人才选拔效率和培养质量[25]。引导学生根据兴趣和特长选择专业是新高考的重要价值导向,有利于提升学生初始兴趣与录取专业间的匹配程度,促进学生高等教育阶段的专业兴趣发展。目前,学界关于新高考生源大学生的专业兴趣表现尚未形成一致的研究结论。例如,鲍威和金红昊对浙江和上海新高考生源大学生的调查显示,新高考生源大学生在专业选择方面具有优势,学校生涯规划教育和新高考专业录取机制有利于提升学生同专业的适配度,显著提升了大学新生的专业兴趣[26];但沈彦彬等则得到上海新高考生源大学生的学习兴趣不足的结论[27]。总而言之,目前关注新高考生源大学生专业兴趣的文献相对较少,研究结论也尚未达成一致。通过新高考进入高校的大学生是否确如政策预期表现出更高水平的专业兴趣,还需要通过调查数据来分析评估。随着第4批和第5批改革省份高考综合改革方案的发布,以第3批推行高考改革的8省市为代表的“3+1+2”科目选考模式将成为未来全国高考的主要模式。因此,本研究将第3批改革省市学生作为新高考生源大学生的代表,考察新高考能否促进大学生的专业兴趣发展,以期为高考综合改革平稳推进及高校人才培养质量提升提出建议。二、研究设计(一)数据来源本研究数据来源于2023年6月针对第3批实施高考综合改革的河北、辽宁、江苏、福建、湖北、湖南、广东、重庆等8省市开展的大规模问卷调查。8省市于2018年启动高考综合改革,迄今共有2021级和2022级两届学生经由新高考进入大学。项目组在每个省市选取了“双一流”建设高校、普通本科院校和专科院校各两所作为研究样本,面向2021级(大二)和2022级(大一)的高校学生线上发放《关于考试招生制度改革的调查问卷》,依据填答时间和填答质量剔除不符合要求的无效样本后,本次调查共回收有效问卷55546份。为更好比较新高考生源大学生和传统高考生源大学生在专业兴趣方面的差异化表现,考虑到本科院校和专科院校在专业类型划分和人才培养模式等方面的不同,筛选出本科院校的学生样本,并剔除人数较少的军事学和交叉学科的学生样本;此外,考虑到不同批次启动新高考的省市实施的选考科目政策等有所不同,选取生源所在地为河北、辽宁等8省市的学生样本作为新高考生源大学生的代表,选取生源所在地为吉林、山西等2019年前暂未启动新高考改革省份的学生样本作为传统高考生源大学生的代表。最终得到33663份高校学生样本,其中男生16780份,女生16883份;新高考生源学生24685份,传统高考生源学生8978份;普通本科院校学生22283份,“双一流”建设高校学生11380份;2021级学生14128份,2022级学生19535份。(二)研究假设新高考相较于传统高考的突出特点之一便是打破高中教育文理分科的二元模式,实施科目选考制和走班制,有助于学生根据自身兴趣爱好和学科特长选择考试科目,提升高中学习和专业录取的获得感与满意度,进而满足多元化的教育需求,促进学生全面发展。基于此,提出研究假设1:假设1:不同生源类型学生的专业兴趣存在显著差异,高考改革对大学生专业兴趣具有显著促进作用。新高考推行平行志愿填报模式,能够降低专业调剂风险并引导学生在志愿填报时从“总分匹配”转为“专业导向”,进而提升学生与被录取专业之间的匹配程度[28-29]。新高考背景下,高中学校的生涯规划教育和志愿填报指导得到加强,有助于帮助学生理性选择选考科目和高考志愿,从而提升其对专业录取的满意度[30]。相较于传统高考,新高考注重引导学生关注个人长远的生涯发展,通过推行科目选考制、改革志愿填报模式、完善生涯教育等多项举措,提升学生同大学专业之间的匹配程度。基于此,提出研究假设2:假设2:不同生源类型学生同专业之间的匹配程度存在显著差异,高考改革对提升大学生专业匹配度具有显著促进作用。研究表明,专业匹配对学生的学习投入和学业表现具有显著的促进作用,专业匹配程度越高,学生对所学专业越喜爱[31]。基于此,提出研究假设3和研究假设4:假设3:专业匹配度对专业兴趣具有显著促进作用。假设4:专业匹配度在生源类型和专业兴趣之间发挥中介作用。综上,聚焦高考改革成效和高校学生发展,建立图1所示的生源类型、专业匹配度和专业兴趣的简单中介关系模型。(三)变量说明本研究的因变量为大学生的专业兴趣,即大学生对自己所学专业的个体倾向和情感状态,由“我对自己所学专业感兴趣”“我对学习本专业充满热情”“我非常热爱我的专业,不会选择转专业”3个观测题项的得分均值来表征(Cronbach's α=0.895),每个题项的赋值按李克特7点计分,得分越高表明学生的专业兴趣水平越高。本研究的自变量为生源类型,使用虚拟变量,将生源地为8省市的学生定义为新高考生源,赋值为1;将生源地为2019年前暂未启动新高考改革省份的学生定义为传统高考生源,赋值为0。本研究的中介变量为专业匹配度,即大学生的兴趣、能力、性格特点和教育背景等与自己所学专业之间的匹配程度,由“我对当前录取的专业满意”“我的选考科目与大学所学专业匹配”“我的综合条件比较适合学习本专业”3个观测题项的得分均值来表征(Cronbach's α=0.862),每个题项的赋值按李克特7点计分。本研究的控制变量包括3个部分。第一,控制个人基本特征变量。其中,性别使用虚拟变量,女生赋值为0,男生赋值为1;年级使用虚拟变量,2021级为0,2022级为1;专业类型使用社会类学科(包括经济学、法学、教育学、管理学)和理工类学科(包括理学、工学、农学、医学)两个虚拟变量表征,分别赋值为1,人文类学科(包括哲学、文学、历史学、艺术学)赋值为0。第二,控制家庭背景因素变量。其中,城乡因素使用虚拟变量,按照高考时的户籍所在地定义为农村家庭和城市家庭,分别赋值为0和1;家庭文化资本使用父母最高学历表征,父母最高学历为大学专科及以上定义为高文化资本家庭,赋值为1,反之赋值为0;家庭社会地位使用父母职业类型表征,父母至少有一人为管理技术人员(包括国家机关、党群组织、企业、事业单位负责人和专业技术人员)定义为高社会地位家庭,赋值为1,反之赋值为0。第三,控制学校背景因素变量。其中,高中学校背景使用学校类型表征,省会城市优质高中和地市优质高中定义为优质高中,赋值为1,城区普通高中和县域高中定义为非优质高中,赋值为0;大学学校背景使用虚拟变量,“双一流”建设高校赋值为1,其他本科院校赋值为0。此外,本研究还设置了首选科目、选科组合、志愿录取模式3个变量来对新高考生源大学生群体进行类别划分。具体而言,根据首选科目可划分为选考物理和选考历史两类群体;根据选科组合可划分为传统理科组合(选科组合为“物理+化学+生物”)、传统文科组合(选科组合为“历史+政治+地理”)、文理交叉组合(选科组合为其他类型)3类群体;根据志愿录取模式可以划分为院校专业组和院校+专业(类)两类群体。三、研究结果与讨论本研究主要采用独立样本T检验、多元回归分析、Bootstrap中介效应分析以及方差分析等方法进行数据分析,得到以下结果。(一)两类大学生专业兴趣的差异性分析使用独立样本T检验分析两类大学生的专业兴趣是否存在显著差异(见表1)。从专业兴趣的平均情况来看,无论是新高考生源大学生(M=5.22, SD=1.353)还是传统高考生源大学生(M=5.05, SD=1.389),都表现出了较高水平的专业兴趣。分年级来看,不同生源类型大学生专业兴趣的大二平均水平相较于大一平均水平,均出现0.1分左右的略微下滑。可能的原因是随着新高考改革政策的深入实施与不断完善,越来越多的学生能够进入到自己感兴趣的专业领域学习和探索;而进入高等教育阶段后,学生的专业兴趣本身又会随年级升高而发生变化。专业兴趣产生于学生对专业的认识和了解过程,随着年级的升高,大学生对自己所学专业有了更加清晰和全面的了解,其专业兴趣水平也会发生变化。有研究表明,大学生对自己所学专业感兴趣和不感兴趣的学生比例都会随着年级升高而增加,大二往往是学生专业兴趣发生转变的关键时期[18]。无论是全体学生还是各个年级的学生,分析结果均表明,新高考生源大学生的专业兴趣始终显著高于传统高考生源大学生,初步验证了研究假设1,即高考综合改革有利于促进学生的专业兴趣发展。(二)生源类型对大学生专业兴趣的影响使用多元回归分析进一步探索高考综合改革对大学生专业兴趣的影响。表2呈现了生源类型对大学生专业兴趣影响的逐步回归结果,从模型1到模型4逐步纳入核心自变量生源类型和控制变量个人基本特征、家庭背景因素及学校背景因素。模型1的回归分析结果与T检验结果相同,生源类型能够显著影响大学生专业兴趣,与传统生源大学生相比,新高考生源大学生表现出了更高水平的专业兴趣。模型2到模型4的回归结果表明,个人基本特征、家庭背景因素和学校背景因素都会显著影响大学生的专业兴趣。具体而言,男生相较于女生、2022级相较于2021级、人文类学科相较于社会类学科、高文化资本家庭相较于低文化资本家庭、高社会地位家庭相较于低社会地位家庭、优质高中毕业生相较于非优质高中毕业生,以及就读于“双一流”建设高校的学生相较于就读于普通本科院校的学生,均表现出更高水平的专业兴趣,且差异达到显著水平。同时,在逐步纳入控制变量的过程中,生源类别始终对专业兴趣具有显著性影响且回归系数符号保持不变,表明新高考生源大学生的专业兴趣显著优于传统高考生源大学生的分析结果具有稳健性,研究假设1得到验证。此外,鉴于模型4的解释变量均为二分变量,比较各解释变量的B系数可以发现,生源类型对大学生专业兴趣的影响力超过了性别、专业、家庭文化资本等其他因素,且在控制个人基本特征、家庭背景因素和学校背景因素的条件下,新高考生源大学生相较于传统高考生源大学生在专业兴趣方面的平均分高出0.393。这表明以增加学生选择性为突出特色的新高考有助于引导学生根据自己的兴趣特长选择科目与专业,高考改革在促进学生专业兴趣发展的过程中发挥了关键作用。(三)生源类型影响大学生专业兴趣的机制使用多元回归分析探索生源类型影响大学生专业兴趣的机制,回归分析结果如表3所示。模型5是以专业匹配度为被解释变量进行回归分析,结果表明在控制个人基本特征和家庭及学校背景因素后,生源类别能够显著影响专业匹配度,新高考生源大学生的专业匹配度显著高于传统高考生源大学生,研究假设2得到验证。模型6以专业兴趣为被解释变量,在模型4的基础上纳入中介变量专业匹配度。回归分析结果表明,在控制个体、家庭和学校背景因素后,专业匹配度对专业兴趣具有显著性影响,能够显著促进大学生的专业兴趣,研究假设3得到验证。与模型4相比,模型6的R2大幅跃升,表明纳入专业匹配度后模型的解释力度显著增强;生源类别的标准化回归系数有所下降,但仍然显著,推测专业匹配度可能在生源类型与专业兴趣之间起中介作用。为进一步验证专业匹配度的中介作用,使用Bootstrap法(5000次)对专业匹配度的中介效应进行检验,结果如表4所示。生源类型-专业匹配度-专业兴趣路径的中介系数为0.1989,总效应、直接效应和中介效应的Bootstrap95%置信区间均未包含0,表明专业匹配度在生源类型影响专业兴趣中的中介效应显著,占比高达69.30%,研究假设4得到验证。这一结果表明,新高考生源大学生之所以在专业兴趣方面的表现显著优于传统高考生源大学生,在相当大的程度上是因为新高考有效促进了学生高考录取的专业匹配度。(四)新高考生源大学生专业兴趣的群体差异使用独立样本T检验和方差分析探究8省市新高考生源大学生专业兴趣的群体差异,为便于呈现方差分析中事后比较的结果,分别使用a、b、c指代相应的选科组合或专业类型,分析结果如表5所示。新高考生源大学生专业兴趣在个人基本特征、家庭背景因素、学校背景因素和高考志愿录取因素方面均存在显著性差异。具体而言,在个人基本特征方面,男生高于女生、2022级高于2021级、首选科目为物理的学生高于首选科目为历史的学生、选考科目为传统理科组合的学生高于传统文科组合和文理交叉组合的学生、理工类学科的学生高于人文社科类学生、人文类专业的学生高于社科类专业的学生。就选科和专业差异而言,理工类科目和专业的学生专业兴趣更高可能与“3+1+2”模式下“重理轻文”趋势被强化有关[32]。在家庭背景因素方面,城镇家庭、高文化资本家庭和高社会地位家庭学生的专业兴趣显著更高,这意味着家庭社会经济地位对学生专业兴趣具有显著性影响,优势阶层家庭在获取高考政策和大学专业等信息方面存在优势[3],更容易帮助子女在科目选择和志愿填报方面做出理性选择,进而提升专业匹配度和专业兴趣。在学校背景方面,优质高中和“双一流”建设高校的学生专业兴趣显著更高。高水平学校学生的专业兴趣更高可能有3方面的原因。首先,就读于高水平学校的学生学业表现更佳,而学业表现和专业兴趣之间存在高度相关。其次,高水平学校教育资源丰富,生涯规划教育更加完善,能够有效提升学生的自主选择能力,促进专业匹配度和专业兴趣。最后,无论是高水平高中还是高水平高校,理工科学生占比更高,学校层次差异可能在某种程度上也像性别差异一样受到了选科或专业差异的影响。在高考志愿录取因素方面,实施院校+专业(类)志愿录取模式省份的学生专业兴趣显著高于实施院校专业组省份的学生。这表明取消专业调剂、更加突出专业导向的高考志愿录取政策能够有效提升学生的专业匹配度,进而提升学生的专业兴趣。四、研究结论与建议通过上述分析,本研究得到如下3点结论:1)新高考生源大学生的专业匹配度和专业兴趣显著高于传统高考生源大学生,高考综合改革有效提升了学生同所学专业之间的匹配程度,促进了大学生的专业兴趣发展;2)专业匹配度在生源类型和专业兴趣之间发挥着中介作用,中介效应占比为69.30%,高考综合改革主要通过提高学生同所学专业之间的匹配程度促进了学生的专业兴趣发展;3)新高考生源大学生的专业兴趣水平存在显著的群体差异,男生、2022级、选考科目和专业类型偏理工类、家庭社会经济地位较高、就读于高水平学校和志愿录取模式为院校+专业(类)的学生,专业兴趣更高。结果表明,就实现科学选拔人才的政策目标而言,新高考显著提升了学生的专业匹配度和专业兴趣,有利于提高高校生源质量和人才培养质量,促进学生全面而有个性的发展,是高考回归教育功能的突出表现。但新高考背景下,来自教育基础薄弱学校和弱势家庭的学生在专业选择和专业兴趣发展方面仍然处于劣势。为巩固改革成果,进一步提升学生的专业匹配度和专业兴趣水平,提出3点建议。首先,要坚持高考改革方向,兼顾个人志趣、学校发展和社会需求。新高考改革之“新”的突出表现在于充分尊重和保障学生的学习权和选择权,尽可能满足学生多元化、个性化的教育需求与教育期待,改革方向符合高等教育普及化背景下教育多元化发展的趋势。但高考在教育功能之外,还肩负着促进社会公平,满足经济社会发展需求等多重功能,需要在多方利益相关主体和多种价值取向之间取得平衡[33]。学生自主选择权的骤然放大可能导致学生功利化选科、科学素质下降等问题,影响高校人才培养质量。因此,在坚持增加学生选择性的同时,还要加以规范和引导,实现学生个人志趣同学校与社会的发展需求相契合。其次,要完善改革配套举措,强化学生同专业和选考科目的匹配度。在新高考实施科目选考制的背景下,提高学生的专业匹配度在相当程度上意味着强化学生-选科-专业的耦合关系。一方面,优化选考科目和大学专业之间的匹配度是提升学生专业匹配度的前提。《选考科目指引》以政策的形式实现了大学专业与相应选考科目的强制性关联,有利于提升学生-专业知识性匹配;但部分专业的选考科目要求值得进一步调研和商讨,如历史学类专业是否应该要求必须选考历史科目等。另一方面,引导学生在科目选考和志愿填报时做出理性的教育选择是提升学生专业匹配度的基础。保障学生学习权和选择权落到实处的关键在于完善生涯教育体系,提升学生的自主选择能力和生涯规划能力。最后,要促进资源均衡分配,保障基础薄弱学校和弱势阶层教育公平。新高考显著提升了学生专业兴趣水平,但出身于基础薄弱学校和弱势阶层家庭的学生在专业兴趣发展方面仍处于不利地位。应当进一步改善基础薄弱学校的教育教学条件,关键是加强教师队伍建设,通过吸引优质师资和加强职业培训提升教师的专业化水平和生涯规划指导能力。此外,要充分发挥学校教育资源对弱势阶层家庭子女的补偿效应,一方面帮助弱势阶层学生做好生涯规划,另一方面促进弱势阶层家长的教育参与。同时,还要借助教育信息化建设促进新高考背景下的教育公平,一方面要整合各方教育资源,面向全体学生提供生涯教育和升学指导;另一方面要建立数字化的跟踪评估系统,为学生的教育选择提供个性化指导。五、研究展望受各种因素的限制,本研究还存在一些不足,如研究对象未纳入前两批改革省市的学生、未控制省间差异等。主要有如下几方面的考虑,第一,本调查获取的前两批尤其是第一批改革省市的学生样本量偏少;第二,不同批次改革省份实施的高考改革方案在科目选考政策等方面存在较大差异;第三,新高考改革采取由点及面、分批推进的改革策略,其重要原因之一便是考虑到不同省市的发展水平差异,第3、4、5批改革省市均推行“3+1+2”选考模式表明这些省份在一定程度上存在相似的教育发展背景。此外,本文初步研究了新高考背景下的大学生专业兴趣,后续研究需要进一步探讨相关话题。第一,随着高考综合改革的逐步推行,继续考察新高考背景下大学生专业兴趣的变化及其影响因素,对指导教育实践具有重要意义。第二,教育公平性问题不可能仅仅通过高考改革彻底解决,但高考改革是否有助于缩小弱势学生群体在专业选择和专业兴趣发展方面的劣势需要进一步考证。第三,不同省份的新高考政策存在差异,本研究发现院校+专业(类)的志愿录取模式更有助于提升专业匹配度和专业兴趣,其他高考政策对专业兴趣的影响有待进一步研究。第四,本研究发现首选科目不同及专业类型不同的学生群体在专业兴趣方面存在群体差异,理工科学生的专业兴趣显著更高,新高考是否加剧了选考科目和专业类别间的地位差距及该现象可能带来的影响,值得进一步关注和探讨。参考文献

新高考投档方式对本科专业生源质量的影响 ——基于15省(市)高考录取数据的实证分析

2024-01-02

——基于15省(市)高考录取数据的实证分析原文刊载于《中国考试》2023年第11期第73—84页。作 者吴宇川,北京大学教育学院在读博士生。丁延庆,北京大学教育学院/教育经济研究所副教授,通信作者。摘 要:新高考投档方式通过缩小投档单位与录取单位之间的差异,可以释放考生的专业偏好、减少保守填报行为,并对本科专业生源质量产生影响。基于2016—2021年15省(市)的高考录取数据统计,通过双向固定效应模型分析得出3点结论:1)改革不仅提升了高偏好专业的生源质量,也提升了本科专业整体生源质量的平均水平;2)改革后不同专业生源质量的变化方向并不相同,高偏好专业相对低偏好专业在生源竞争中更具优势;3)选考科目要求相对严格的专业,其生源质量在改革中更容易受到冲击。基于上述结果,提出应加强对基础学科专业生源质量的监测与支持、设置专业选考科目要求时要平衡生源质量与学科发展之间的关系、规范高校以热带冷策略工具的使用等3方面建议。关键词:新高考;高考改革;投档方式;生源质量;平行志愿;双向固定效应模型1 问题提出  为了更加科学高效地选拔和培养人才,提升考生与高校之间的匹配度,我国的高考投档方式经历一系列变化。相较于更为传统的顺序志愿投档方式,新高考改革启动前各省(市)普遍实行的院校平行志愿投档方式被认为“缩窄”了院校录取分数范围,有效提升了考生—院校的匹配质量[1],但考生—专业的匹配问题并未得到学界的充分关注。在院校平行志愿时期,由于专业调剂规则的存在,考生可能被自己低偏好的专业录取,因此考生的专业选择自由也受到一定程度的限制[2]。随着中国高等教育从精英化阶段步入大众化、普及化阶段,人民群众对高等教育的需求早已超越“有大学可上”的低标准,考生及其家庭对自由选择专业的诉求愈发强烈。新一轮高考改革的突出亮点和目标之一就是增加考生的选择权[3],尤其是增加考生的专业选择权,这体现了国家加快推进教育高质量发展、办好人民满意教育的理念与价值追求。  根据《国务院关于深化考试招生制度改革的实施意见》提出的“改进投档录取模式,推进并完善平行志愿投档方式,增加高校和学生的双向选择机会”新要求[4],截至2023年,已经有14个省(市)的考生在新高考投档方式规则下参加了高校招生录取。新高考改革前,这些省(市)在本科招生批次均实行院校平行志愿投档,即各省(市)招生办以院校作为投档单位,将考生的电子档案依据平行志愿规则投送给高校,高校收到考生档案后再以专业作为录取单位对考生进行专业分配及录取。在该过程中,如果考生填报的专业均已录满且考生服从专业调剂,高校就会将考生调剂到尚未录满的专业。由此可知,专业调剂是投档单位与录取单位不一致的产物。新高考改革实施后,第一批新高考省(市)的投档方式转变为“专业组平行志愿”或“专业平行志愿”两种模式,前者以“专业组”为投档单位,以专业为录取单位,仍保留专业调剂规则,如北京、天津;后者将投档单位和录取单位统一为专业,不再保留调剂规则,只要符合专业报考要求,考生的投档专业和录取专业一致,如山东、辽宁。  投档方式的变化有可能改变高校的专业生源格局。新高考改革将院校拆分为若干专业组或专业进行招生,甚至取消专业调剂,这势必会降低冷门专业从校内其他专业获得高质量调剂生源的可能性。自高考改革启动以来,探讨改革对专业生源影响的研究较多。例如:有研究认为,新高考改革实施的平行志愿投档方式提高了学生的专业认同感,提升了学生的学业表现,同时也提升了高校相对强势专业的生源质量[3];还有研究认为,专业平行志愿投档造成高校内部生源质量两极分化,不同专业之间录取分数悬殊,冷门和弱势专业面临生存危机[5];有研究提出,新高考“专业导向”的投档方式能驱动高校优化专业布局、提升专业内涵、凝练专业特色[6]。  然而,上述这些论断多源于理论分析,缺乏足够的证据支持,并且对高考改革后具体专业的生源质量变化方向也未形成一致性意见。以对浙江省新高考改革前后“双一流”建设高校的录取数据进行分析为例,就存在着多种研究结论。例如:马莉萍等发现,人文、社科、经管、工学和实验班专业在改革后生源质量显著提升,而理学、农学、医学这3类专业的生源质量没有显著变化[7];卜尚聪等发现要求“必选多门”的专业生源质量在改革后有所下降[8];金红昊等研究发现医学类专业的生源质量在改革后有所提升,而材料工程类、土木工程类、能源工程类、电气工程类、机械工程类等工学专业的生源质量却出现不同程度的下滑[9];王旭辉认为优质生源主要是向医学、人文社科类的热门专业集聚[10]。从研究设计的角度分析,上述实证研究存在一定的局限性,如样本范围有限,只考察某一类高校或单一省(市),开展政策影响评估时只对比改革省(市)改革前后的生源质量,缺乏非改革省(市)的对照分析等。这些局限或许是上述各研究无法对改革后专业生源质量变化形成一致判断的重要原因。  优质生源是大学建设的重要基础,高水平大学之间的竞争始于优质生源的竞争[11]。科学评估新高考投档方式对专业生源质量的影响,可以为高校生源竞争举措提供实证依据,并对新高考改革政策调整具有一定的参考价值。鉴于此,本研究从理论和实证两个方面进行研究。理论分析主要阐释投档方式影响专业生源质量的传导机制;实证分析方面,以2016—2021年15省(市)的高考录取数据为基础,利用各省(市)改革进度差异所形成的自然实验机会,通过双向固定效应模型(two-way fixed effects model, TWFE)更加系统地考查投档方式变化对本科专业生源质量产生的具体影响。为尽可能地克服已有研究的局限,本研究将所有本科高校均纳入样本范围,不仅对比改革省(市)不同专业的生源质量变化,也有针对性地设置非改革地区的对照分析,且改革省(市)既包括实行专业平行志愿的地区,也包括实行专业组平行志愿的地区。2 理论分析与研究假设  高校的招生录取问题是经济学中典型的双边匹配问题[12-13]。在我国,每年的高考投档都关涉1000多万人的专业匹配问题,因此也被认为是当今世界上规模最大、影响最为深远的匹配实践[14]。高考投档方式影响考生的志愿填报行为,志愿填报行为影响考生—专业的匹配过程;因此,本研究认为新高考投档方式可以通过“改革→考生行为→生源质量”这一影响传导机制对本科专业生源质量产生影响。  新高考投档方式可以通过缩小投档单位与录取单位之间的差异,释放考生的专业偏好,减少考生的保守填报行为。一方面,改革释放考生的专业偏好。专业平行志愿规则将投档单位与录取单位统一为专业,考生可以直接填报高偏好专业而不用担心被调剂;专业组平行志愿虽然保留了调剂规则,但调剂范围从院校内各专业缩小至专业组内各专业,考生被调剂至低偏好专业的概率降低,因此考生的专业偏好也得到一定程度的释放。另一方面,改革减少考生的保守填报行为。改革前,考生如果要避免被调剂到低偏好专业,通常采取“保守填报专业志愿甚至院校志愿以确保专业录取”的保守策略。改革后,专业平行志愿规则下考生不会被调剂,即使是专业组平行志愿,考生也可以通过放弃填报低偏好专业所在专业组来规避低偏好专业,亦无需采取保守填报策略。总之,考生专业偏好释放、保守填报行为减少,即优先填报高偏好专业而不是低偏好专业,不仅影响考生—专业的匹配过程,而且影响专业生源质量。  参照前述已有研究思路,本研究建立考生—专业匹配模型,见图1。模型假设的4个前提条件分别为:S1、S2、S3、S4共4名考生,其高考成绩关系为s1>s2>s3>s4;某高校的两个招生专业分别为M1、M2,且每个专业招生2名;所有考生的真实专业偏好顺序均是M1优先于M2,即对所有考生而言,M1为高偏好专业,M2为低偏好专业;采用平行志愿规则进行匹配。根据上述条件可知,志愿填报存在两种可能情况。第一种,大部分考生优先填报高偏好专业,个别考生优先填报低偏好专业。如S1、S3、S4这3位考生的第一志愿是M1,第二志愿是M2,即优先填报高偏好专业;S2考生的第一志愿是M2,第二志愿是M1,即优先填报低偏好专业。按照平行志愿规则,匹配结果为S1→M1、S2→M2、S3→M1、S4→M2,且M1专业的录取分数最高为s1、最低为s3,M2专业的录取分数最高为s2,最低为s4。第二种,所有考生均优先填报高偏好专业,即S1、S2、S3、S4的第一志愿都是M1,第二志愿都是M2。按照平行志愿规则,匹配结果为S1→M1、S2→M1、S3→M2、S4→M2,且M1专业的录取分数最高为s1,最低为s2,M2专业的录取分数最高为s3,最低为s4。  对比两种志愿填报情况可知:当存在个别考生优先填报低偏好专业时,高偏好专业的录取最低分更低,低偏好专业的录取最高分更高;当考生都优先填报高偏好专业时,高偏好专业的录取最低分提升,低偏好专业的录取最高分下降。由此说明,用专业录取最低分衡量专业生源质量时,考生专业偏好释放、保守填报行为减少将会提升高偏好专业的生源质量,同时使低偏好专业的生源质量保持相对稳定,从而有助于专业整体生源质量平均水平的提升。  根据上述分析结果,提出以下3个研究假设:  假设1:新高考投档方式提升高偏好专业的生源质量。  假设2:较之低偏好专业,新高考投档方式使高偏好专业在生源竞争中更具优势。  假设3:就平均效应而言,新高考投档方式提升本科专业的生源质量。3 研究设计3.1 样本选择与数据来源  利用双向固定效应模型进行改革政策影响评估的前提是,改革与未改革省(市)的专业生源质量在改革前具有相近的变化趋势,即存在平行趋势假设。本研究在预研究中采用事件研究法进行探索性分析,以保证样本省(市)满足平行趋势假设且数量最大化。最终,以2016—2021年全国15个省(市)的高考本科专业录取面板数据(panel data)为分析基础,其中采用新高考投档方式的地区有北京、天津、山东、湖北、福建、广东、辽宁、河北、重庆,尚未实行新高考改革的地区有黑龙江、贵州、云南、江西、河南、安徽。之所以选择这些省(市),是因为在预研究时发现上述改革地区与未改革省(市)满足可比性要求。在利用自然实验进行政策影响评估时,需要划分具有可比性的实验组和对照组。为便于叙述,下文将已实行新高考投档方式的省(市)统称为“改革组”,即实验组;将尚未实行改革的省(市)统称为“未改革组”,即对照组。样本分类情况见表1。经过数据清洗与跨年匹配,最终得到覆盖14619个高校招生单位、76642个专业招生单位,5年(期)共计383210条本科专业录取数据,其中实验组数据208735条(54.5%),对照组数据174475条(45.5%)。高考录取数据主要来自各省(市)招生考试院官网及其出版的《志愿填报指南》一书,专业的学科门类划分参照《普通高等学校本科专业目录(2021年修订版)》,高校所在省(市)的经济相关数据来自国家统计局官网。3.2 模型建构与变量设计3.2.1 生源质量与可比性调整  衡量高校生源质量的方法众多,但多数实证研究以高考成绩作为衡量标准[15-18]。考虑到不同地区、年份的高考分数不具有等值性,本研究使用专业录取最低分对应的省(市)排名,即专业录取排名作为专业生源质量的衡量标准。同时,在新高考考试科目模式为“3+3”的省(市)中,其改革前区分文理科序列的排名值并不能与改革后不区分文理科的排名值直接比较,因此要对“3+3”省(市)改革前的排名数据进行可比性调整。已有研究主要采用两类调整方案,分别为单线调整方案和多线调整方案[9]。单线调整方案指根据某条既定的等值线(如本科线)对排名进行调整。如某省文理科本科线上考生总计10万,其中文科考生2万,本科线上考生总人数是文科考生人数的5倍。假设本科线附近文理科考生的生源质量相当,将文科本科线上考生的排名值乘以调整系数5,得到不区分文理的全省(市)排名。多线调整方案比较复杂:首先将改革省(市)在改革前的高考分数划分成700分及以上、600分段、500分段、400分段、400分以下5个区段,假设每条区段线附近文理科考生的生源质量相当;其次,计算文科或理科各区段的考生人数,以及各区段不区分文理科的考生总人数,将不区分文理科的考生总人数除以文科或理科考生人数作为该区段文科或理科排名的调整系数;最后,将文科或理科排名值乘以调整系数,即可得到不区分文理的排名值。以2019年北京高考分数为例,文理科600分段有考生9771人,其中文科考生1951人,文科600分段的调整系数为5.01=9771/1951。根据北京市2019年高考文科一分一段表,文科660分排名全市第122名,将122乘以调整系数5.01,即得到调整后不区分文理的排名为第611名。  本研究在基准分析中采用多线调整方案对“3+3”省(市)改革前的排名进行调整,并在稳健性检验中采用以本科线作为等值线的单线调整方案。3.2.2 模型与变量  政策影响评估要解决内生性问题,尤其要避免无法观测到的遗漏变量可能造成的评估偏误。双向固定效应模型可以通过差分形式将影响因素中不随观测单位个体和时间变化的因素剔除,是解决内生性问题的有效方法。参照吴宇川、丁延庆等研究[16,19],本研究主要采用双向固定效应模型评估新高考投档方式对专业生源质量的影响,具体模型如下。在上述模型中,i表示专业招生单位,j表示高考省(市),t表示年份。MRijt表示专业i在j省(市)t年的专业生源质量。由于不同层级高校录取排名值的绝对变化量所代表的生源质量变化程度不同,不能进行直接比较,因此要对MRijt取自然对数后再纳入模型。Refjt为“新高考投档方式”虚拟变量,是本研究关注的核心变量,标记高考省(市)j在t年的投档方式是否为专业组平行志愿或专业平行志愿(两种投档方式只需满足其一,则虚拟变量取值为1,基底为院校平行志愿)。Majorij表示专业个体的固定效应,控制专业之间无法观测且不随年份变化的固定差异;Yeart表示年份的固定效应(即招生年份的虚拟变量),控制年份之间无法观测且不随专业变化的固定差异;εijt表示随机误差。  X为一系列控制变量,具体包括:1)SRBijt与SRTijt,指专业i所属院校在j省(市)t年的院校录取最低与最高排名;2)Rehotij,t-1,指专业i在j省(市)t-1年的专业相对热度,计算公式为(院校录取最低排名-专业录取排名)/院校录取最低排名,标记专业i在所属院校所有招生专业中的相对热度;3)Numjt与Numj,t-1,指高考省(市)j在t年和t-1年的考生人数;4)Zynumjt,指高考省(市)j在t年的可填报志愿数量;5)Tier1jt与Tier2jt,指单批次和双批次虚拟变量,标记高考省(市)j在t年的本科批次设置是否为单批次或双批次,基底为三批次;6)DFMit,指双一流学科虚拟变量,标记专业i在t年是否已进入第一批“双一流”建设学科名单;7)GDPi,t-1与PCDIi,t-1,指专业i所属院校所在省(市)在t-1年的地区生产总值与人均可支配收入。  该模型本质上是对比2017至2021年改革和未改革省(市)之间专业生源质量的差别。如果Refjt的回归系数在统计学上显著,说明改革对专业生源质量产生显著影响。回归系数大于0,说明专业录取排名值增大,生源质量下降;反之,说明录取排名值减小,生源质量提升。由于模型中的MRijt取自然对数,因此核心变量回归系数的具体值表示录取排名值的变化率,β=0.01表示新高考投档方式使专业录取排名值增大1%。4 研究结果4.1 基准分析  由于专业的强弱与考生的偏好具有较强的相关性,因此本研究以相对强势、相对弱势专业分别表征高、低偏好专业进行分析检验。学科评估是教育部学位与研究生教育发展中心按照国务院学位委员会和教育部颁布的《学位授予和人才培养学科目录》,对具有博士硕士学位授予权的一级学科进行的整体水平评估[20]。虽然学科评估的对象是研究生专业,但考虑到研究生专业建设质量与本科专业建设质量具有高度一致性,本研究仍然使用具有权威性的学科评估结果对本科专业进行强弱界定。根据第四轮学科评估结果,“C+”及以上档级的专业在所有评估学科中排在前50%[20],因此本研究将“C+”及以上档级的专业界定为相对强势专业,将未参评专业界定为相对弱势专业。  表2为双向固定效应模型的回归结果,各回归均控制了相关控制变量与专业、年份固定效应,后续回归处理与此相同。回归1、2使用全部专业样本,回归3、4使用相对强势专业样本,回归5、6使用相对弱势专业样本。为了防止极端值对回归结果的干扰,回归2、4、6的样本中剔除了专业录取排名最小和最大0.1%的边缘样本。在回归1、2中,核心变量“新高考投档方式”的回归系数均显著小于0,这意味着在控制了相关控制变量及专业个体和年份的固定效应后,新高考投档方式的平均效应表现为提升本科专业的生源质量,由此说明研究假设3成立。回归3、4中核心变量的回归系数亦显著小于0,说明相对强势专业在改革后生源质量有所提升。由于相对强势专业是高偏好专业的表征,因此,可以认为新高考投档方式提升了高偏好专业的生源质量,由此说明研究假设1成立。与相对强势专业回归结果形成鲜明对比的是,回归5、6的结果显示相对弱势专业在改革后生源质量没有显著变化。考虑到相对弱势专业是低偏好专业的表征,可知较之低偏好专业,新高考投档方式更有利于高偏好专业的生源竞争,由此说明研究假设2成立。4.2 稳健性检验  为进一步检验基准分析结论的稳健性,采用更改专业生源质量衡量方法、更改可比性调整方案两种方式进行二次检验。  首先是更改生源质量衡量方法。基准分析中,因变量专业生源质量以专业录取最低分对应的省(市)排名即专业录取排名来衡量,稳健性检验1对应更改以专业相对录取排名来衡量。所谓专业相对录取排名由专业录取排名除以高考省(市)当年考生人数,反映录取排名值在该省(市)所有考生中的相对位置。相对应的,回归模型中院校录取最低与最高排名也类似处理,更改为相对指标。执行上述更改后重新对双向固定效应模型进行回归,核心变量回归系数的正负与显著性没有变化。  其次是更改可比性调整方案。在基准分析中,对“3+3”省(市)改革前的排名值以多线调整方案调整,稳健性检验2对应更改为以本科线作为等值线的单线调整方案调整。更改可比性调整方案后重新对双向固定效应模型进行回归,结果显示:全部专业样本与相对强势专业样本回归的核心变量回归系数显著小于0;相对弱势专业样本回归的核心变量回归系数不显著。  综上,两种稳健性检验的分析结果与基准分析结果一致,即与基准分析结论相同。4.3 异质性分析4.3.1 对不同学科专业生源质量的影响  考虑到部分学科门类专业样本量有限,本研究对专业的学科分类进行以下调整:1)合并哲学、文学、历史学、艺术学学科门类为“人文”学科;2)合并经济学、管理学学科门类为“经管”学科;3)单列法学类专业类为“法学类”学科,将法学学科门类下的其余专业(包括政治学类、社会学类、民族学类、马克思主义理论类、公安学类专业)与教育学学科门类合并为“其他社科”学科;4)其余专业学科分类保持不变。针对调整后的学科专业进行分样本回归,结果见表3。从表中可以看出,新高考投档方式对不同学科专业的生源质量存在异质性的影响:理学专业的生源质量因改革而降低,经管、工学、医学专业的生源质量因改革而提升,人文、法学类、其他社科、农学、实验班专业的生源质量并没有受到改革的显著影响。4.3.2 对不同专业类专业生源质量的影响  为了更加细致地考查新高考投档方式对特定专业类专业生源质量的异质性影响,对不同专业类分样本进行探索性分析,结果见表4。 表4呈现了部分具有代表性的回归结果,大致可以分为两类。第一类为高偏好专业类,如回归16~22中的公共卫生与预防医学类、建筑类、航空航天类、临床医学类等,这些专业类的专业生源质量有所提升,且提升的幅度超过所属学科的平均水平。第二类为低偏好专业类或传统专业类,如数学类、物理学类、化学类、交通运输类、纺织类专业等,其中部分专业类所属学科在改革后整体生源质量有所提升,但其专业生源质量并没有显著提升,甚至受改革影响而有所下降。可见,不论改革产生何种方向的影响,高偏好专业在生源竞争中总是处于相对优势地位,而一些低偏好专业、传统专业即使在整体利好的政策环境中也无法改变竞争弱势的境况。上述回归结果在一定程度上证明研究假设2成立。4.3.3 对不同选科要求下专业生源质量的影响  新高考改革前,在“3+文综/理综”的考试科目模式下,专业的选科要求或者全文、全理,或者不限选科。新高考改革后,专业选科要求更加多元,可分为不限选科、必选一门、必选多门。为了考察改革对不同选科要求下专业生源质量的异质性影响,本研究对不同选科要求的专业进行分样本回归。  表5中回归30~32为不限选科、必选一门、必选多门三类选科要求专业的回归结果。从回归结果可以看出,新高考投档方式可以提升选科要求为不限选科或必选一门的专业的生源质量,但选科要求为必选多门的专业,其生源质量有所下降。进一步分析特定选科要求专业生源质量受改革的影响。回归33~35为须选物理专业的回归结果,其中:回归33的系数不显著,说明对于要求选考物理的专业,改革的平均效应表现为对其生源质量没有显著影响;回归34的结果说明选科要求为必选一门且必选为物理的专业,生源质量因改革而有所提升;回归35的结果说明选科要求为必选多门且必选包括物理的专业,生源质量因改革而有所下降。回归36~38为须选化学的专业的回归结果。对于要求选考化学的专业,改革的平均效应表现为降低其生源质量;选科要求为必选一门且必选为化学的专业,生源质量并未因改革而有显著变化;选科要求为必选多门且必选包括化学的专业,生源质量会因改革而有所下降。从回归34、35、37、38的结果可知,不论必选物理还是化学,“必选多门”类专业的生源质量在投档方式变化后下降。由此说明,选考科目要求相对更加严格的专业,其生源质量更易在改革中受到冲击。5 结论与建议  本研究以2016—2021年15省(市)的高考录取数据为基础,利用各省(市)改革进度差异所形成的自然实验机会,通过双向固定效应模型分析更加系统地考察投档方式变化对本科专业生源质量所产生的影响。5.1 研究结论  第一,新高考投档方式不仅提升了高偏好专业的生源质量,也提升了本科专业整体生源质量的平均水平。事实上,在高招录取分省(市)定额的制度下,如果没有大规模的扩招或缩招,专业生源竞争是零和博弈,不可能所有专业的生源质量均有所提升。根据本研究建立的考生—专业匹配模型可知,考生专业偏好释放、保守填报行为减少不仅可以提升高偏好专业的生源质量,还可以使低偏好专业的生源质量保持相对稳定,因此可以使专业整体生源质量的平均水平上升。在这一过程中,低偏好专业的录取最高分下降,这意味着投档方式变化对高偏好专业的利好是以牺牲低偏好专业的生源为代价,因此仍然是零和博弈。  第二,改革后不同专业生源质量的变化方向并不相同,高偏好专业在生源竞争中更具优势。本研究分析发现,相对强势的专业在改革后生源质量有所提升,而相对弱势专业的生源质量没有显著变化;经管、工学、医学专业的生源质量因改革而提升,理学专业的生源质量有所降低,人文、法学类、其他社科、农学、实验班专业的生源质量没有显著变化;公共卫生与预防医学类、建筑类、航空航天类、临床医学类等高偏好专业的生源质量有所提升,且提升幅度超过所属学科的平均水平;而数学类、物理学类、化学类、交通运输类、纺织类等专业的生源质量不仅没有显著提升,甚至受改革影响而有所下降。  第三,选考科目要求相对更严格的专业,其生源质量更容易在改革中受到冲击。改革之初,教育行政主管部门为了鼓励高校发挥招生自主权,并未对专业的选科要求作详细、严格的限定。但在改革实践中,由于担心考生会优先选择选科要求较宽松的专业,从而导致选科要求严格的专业生源数量、质量下降[21-22],一些高校因此故意降低计划招生专业的选科要求,甚至不作任何限制[23-24],尤其是那些缺乏“名校”光环的高校,即使希望科学设置选科要求,也可能出于规避招生风险的考虑而被动采取跟随策略。本研究通过实证分析证实,严格选考科目要求的确会造成专业生源质量的下降,因此高校的顾虑也并非杞人忧天。5.2 专业发展建议  首先,应加强基础学科专业生源质量的监测与支持。本研究发现,数学类、物理学类、化学类等基础学科专业的生源质量受改革影响而有所下降。基于发达国家的实证研究可知,数理等基础学科专业在人力资本积累上较其他专业具有更高的正外部性,对促进经济增长与创新具有重要意义[25-26]。这类专业生源质量的持续下滑必将给国家的教育、人才与科技发展战略带来消极影响,因此,要在生源质量监测的基础上予以必要的政策支持。例如,政府可以通过强基计划、基础学科拔尖学生培养计划、“双一流”建设等政策对重点学科专业予以资源倾斜;同时在政策上引导高校分类发展,完善专业的评价、整改、退出机制,将国家、社会急需的专业办精办好。高校也需要加强专业布局调整与专业建设,主动与高中合作,向高中生普及更多的专业背景知识,辅助他们做好专业与职业规划,避免在志愿填报时盲目追求所谓的热门专业[27]。  其次,高校在设置专业的选考科目要求时,要平衡生源质量与学科发展之间的关系。目前,教育部印发的《普通高校本科招生专业选考科目要求指引》已经更新至第三版,意在引导高校设置合理的选科要求,在政策允许范围内平衡生源质量与学科发展之间的关系。对高校而言,无论选择哪些学科作为招生专业的选考科目要求,权衡取舍的前提与关键是切实论证招生专业的必要学科素养。本研究通过实证分析发现,新高考投档方式可以提升“不限选科或必选一门”的专业生源质量,但“必选多门”尤其是必选科目中包含物理或化学的专业生源质量会有所下降。因此,从招生录取策略角度分析,“必选一门”的方式是较好的选择,因为它在保证专业生源拥有必要学科素养的同时,还可以保证生源质量不会受到显著的消极影响。  最后,国家教育行政主管部门应进一步规范高校以热带冷策略工具的使用。高校为了保护冷门、弱势等低偏好专业的生源,在新高考投档规则的框架内常以大类招生的方式将冷热门专业“捆绑销售”。例如部分高校以实验班、精英班等大类专业作为招生噱头,将冷热门专业简单拼凑合并招生,行策略招生之举而无大类培养之实[28]。事实上,通过赋予考生更多的选择权,倒逼高校重视学科建设与专业结构优化本是新高考改革的初衷,但以热带冷策略工具的过度使用却极大浪费了国家的政策资源,提高了改革成本。因此,国家教育行政主管部门亟须出台相关指引文件,规范高校的大类招生行为,厘清高校自主权的边界,让相关规则的应用回归初心。 参考文献:(略)(免责声明:本文转载于《中国考试》,文章观点与本栏目无关,如涉侵权,联系立删!)

家庭社会经济地位对初中生学业成绩的影响

2023-12-20

原文刊载于《中国考试》2023年第11期第85—94页。作 者杨莉,清华大学教育研究院在读博士生。 摘 要:我国目前已基本实现义务教育有保障的目标,但仍然存在教育结果不公平的问题。基于中国教育追踪调查2013-2014学年的基线数据,分析家庭社会经济地位对初中生学业成绩的影响,以及父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望这4类家庭非货币性资源投入在两者之间的中介作用。研究发现:家庭社会经济地位能够显著正向预测初中生的学业成绩;4类家庭非货币性资源投入在两者间均发挥部分中介作用,能够降低家庭社会经济地位差距造成的初中生学业成绩差异。本研究可为初中阶段教育公平相关政策的制订提供参考依据,以期推动我国初中后阶段教育公平目标的实现。关键词:家庭社会经济地位;初中生学业成绩;家庭非货币性资源投入;考试公平1 问题提出  2010年,中共中央、国务院印发《国家中长期教育改革和发展规划纲要(2010—2020)》,明确提出“形成惠及全民的公平教育”的战略目标[1]。截至2019年底,全国99.8%的义务教育学校(含教学点)的办学条件已达到基本要求[2]。根据国务院新闻办公室2021年8月印发的《全面建成小康社会:中国人权事业发展的光辉篇章》白皮书,农村贫困家庭子女义务教育阶段辍学问题已实现动态清零[3]。  2020年,我国已基本实现义务教育有保障的目标[4],但教育结果不公平的现象仍然存在,且主要表现在家庭背景等先赋性因素对学生学业成绩及教育机会获得的显著影响[5-6]。相较于高中及高中后教育阶段,初中阶段学业成绩与家庭背景的关系更值得探讨。这主要有3方面原因:其一,在我国现行招生考试制度下,无论是中考还是高考,考试分数都是后一阶段教育机会和教育质量的重要影响因素;其二,学业成绩具有累积性特征,义务教育阶段的学业成绩能够显著预测中考与高考成绩,高等教育阶段的不平等通常是初中升高中阶段不平等的延续[7];其三,随着教育阶段的上升,家庭社会经济地位、家庭文化背景对教育获得的影响逐渐减弱,有研究提出家庭因素对中考阶段的影响大于高考阶段[8]。在这一社会背景下,研究家庭背景等先赋性因素对初中生学业成绩的影响及其作用机制,其结论不仅可以促进初中阶段的教育公平,甚至能够为优化教育全局环境提供参考。  家庭背景主要通过增加对子女的货币性与非货币性资源投入这两条路径影响学生学业成绩[9],其中,非货币性资源投入的可塑性更强,更应获得学者与政策制定者的关注。具体而言,高家庭货币性资源投入表现为,为孩子购置更好的学习产品、通过购买学区房等方式让孩子进入条件更好的学校等。家庭对子女的货币性资源投入力度受到家庭经济条件的约束,不同家庭经济背景学生所获得的该投入差异悬殊。高家庭非货币性资源投入表现为,为孩子付出更多时间、为子女提供情感支持、对子女具有较高教育期望、采取更合理的养育方式等。有研究发现,虽然家庭社会经济地位是预测父母对子女教育投资的重要因素,但养育子女的方式并不完全取决于这种地位,父母的价值观更能决定他们对子女教育的参与[10]。另一项研究结果表明,与货币性资源相比,非货币性资源对中国儿童的成就影响更大,而且与家庭财富或收入不显著相关[9]。因此,基于非货币性资源投入视角的相关研究发现对制订促进教育公平的政策可能更有参考意义。基于此,本研究主要关注家庭社会经济地位、家庭非货币性资源投入与学业成绩三者之间的关系,并试图回答以下两个问题:1)家庭社会经济地位对初中生学业成绩的影响如何;2)各类家庭非货币性资源投入能否在家庭社会经济地位与初中生学业成绩间发挥一定的中介作用。2 文献综述2.1 家庭背景对学业成绩的直接影响  关于家庭背景对学业成绩影响的研究,可追溯到美国社会学家Coleman等于1966年发布的《教育机会均等》(Equality of Educational Opportunity)报告。该研究发现,在排除很多其他家庭因素的情况下,仅是父母受教育程度、家庭拥有物、父母对子女的教育期望等家庭层面的因素就已经能够解释子女学业成绩10%~25%的变异[11]。这一结论引起了研究者对家庭层面因素的广泛关注。此后,一系列实证研究支持了Coleman的结论,并进一步探究了其他家庭背景因素对成绩的影响。浦小松分析我国14418名中学生样本发现,父母受教育程度对子女成绩的正向影响显著,父母从事职业类型对子女成绩的影响较小[12]。李佳丽和何瑞珠基于中国教育追踪调查(China Education Panel Survey, CEPS)2013-2015年追踪数据的研究发现,经济状况好、父母职业地位以及父母受教育水平高的家庭的子女,其语文、数学、外语3科平均成绩显著高于弱势家庭子女,例如,富裕家庭子女的平均成绩比困难家庭子女高出10分左右[13]。Dahl和Lochner分析了美国青少年纵向调查数据库的4500名儿童和母亲的配对数据,发现家庭收入每增加1000美元,子女数学成绩与阅读成绩合计将提高标准差的6%[14]。除上述显著影响学业成绩的家庭层面变量之外,家庭社会经济地位这一衡量家庭背景的综合指标也对学生成绩具有显著影响。已有研究发现,家庭社会经济地位越高的学生,其学业成绩越好[15-16]。2.2 家庭背景对学业成绩的间接影响  已有文献不仅分析了家庭背景对学业成绩的直接影响,还从家庭投入等视角探究了其间接作用机制。倪雨菡等分析广州市12所中学500多名初三学生的样本发现,家庭学习资源、课堂参与在家庭社会经济地位与初中生阅读成绩间起着双重中介作用[17]。基于CEPS 2014年数据,薛海平探究了家庭资本影响教育获得的双通道机制,发现家庭资本能够同时通过学校教育机会优势与教育培训机会优势提升初中生在校成绩,进而影响初中生的高中及高等教育机会获得[18]。Long和Pang对来自我国5个城市约5000名九年级学生样本的研究结果表明,社会经济地位的3个组成部分(家庭拥有物、家庭教育资源和父母受教育程度)通过父母对子女的教育期望这一中介变量,对学生的数学成绩和问题解决能力(problem-solving achievement)产生显著影响[19]。李忠路和邱泽奇基于中国家庭跟踪调查2010年基线调查数据的研究发现,教育机会差异(包括体制内的重点学校与市场上的校外补习服务)和家长教育参与是家庭背景影响儿童学业成就的两条路径[20]。陈依婷和杨向东通过对某省会城市1000多名八年级学生数据的分析发现,亲子沟通与学业自我效能感均在家庭社会经济地位与数学成绩之间起部分中介作用[21]。Bae和Wickrama以441名12-14岁的韩国青少年为分析对象,发现父母监管和青少年的校外时间使用模式是家庭背景影响学生学业成绩的中介变量[22]。  综上所述,家庭层面的货币性资源投入(如家庭学习资源投入、为子女报补习班)及非货币性资源投入(如父母监管、亲子沟通)都会在家庭背景与学生学业成绩间发挥中介作用,这些发现为本研究的模型设定提供了重要依据。同时,在以下方面还有待进一步探讨:第一,国内部分研究的数据采集于某一个或某几个城市,从而导致样本的全国代表性相对较差;第二,在衡量学生学业成绩时,国内部分研究采用了家长报告的学生成绩等级或改编自国际学生评估项目(Program for International Student Assessment, PISA)问卷得到的成绩数据,前者的主观性太强,可能存在较大测量误差,而后者得到的成绩与学校考试成绩并不能完全等同,学校考试成绩或排名才是决定学生能否获得下一教育阶段入学机会的关键;第三,目前还没有文献将多个家庭非货币性资源投入变量纳入同一分析框架,但相较于家庭货币性资源投入,对家庭非货币性资源投入的干预或改善更为容易。鉴于此,本研究将基于具有全国代表性的CEPS数据,以学校提供的期中考试成绩为因变量,从家庭非货币性资源投入的视角,分析家庭社会经济地位对初中生学业成绩的影响,以及父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望等因素在两者之间的中介作用。3 研究设计3.1 数据来源  本研究数据主要来自CEPS 2013-2014学年的基线数据,该调查由中国人民大学中国调查与数据中心设计并组织实施。CEPS基线调查按多阶段的概率与规模成比例的抽样方法,在全国范围内抽取了112所学校、438个初中班级。入样班级的全体学生及家长、3门主科教师、班主任以及所在学校领导均被作为调查对象,最终获得近20000名初一与初三学生样本。问卷内容涵盖学生个人的基本信息、学业表现、教育经历、家庭以及学校等层面的信息,能够满足本研究主题的需要。根据本研究设计,将具有缺失变量的样本进行了删除,最终得到的有效样本为16742名初中生。3.2 变量说明3.2.1 因变量  研究因变量是2013年秋季学期学生的语文、数学以及英语3门主科的平均成绩。CEPS数据库记录了由受访学校直接提供的3门主科成绩的原始分,以及按学校与年级对3门主科原始分分别进行标准化处理后的得分。由于本研究采用的分析模型控制了班级固定效应,这一模型估计策略使得由受访学校提供的原始分同样具有可比性[23]。因此,最终采用3门主科的原始分,并对其取均值得到本研究的因变量。3.2.2 自变量  研究自变量为家庭社会经济地位。由于父母职业、学历以及家庭经济状况等因素具有高度相关性,将其通过因子分析等方法进行降维处理在理论上是可行的;且目前国际上相对成熟的基础教育质量评估项目,如PISA也采用家庭社会经济地位这一指标衡量学生家庭背景。因此,为简化模型,借鉴PISA的做法将家庭社会经济地位作为家庭背景的代理变量。具体而言,参照任春荣的分类[24],对父母最高受教育程度、父母最高职业、学生家庭经济状况、家庭藏书变量进行因子分析,得到家庭社会经济地位变量,结果显示KMO值为0.71,Bartlett’s球形检验的p值小于0.001,表明上述4个变量适合做因子分析。3.2.3 中介变量  研究主要讨论家庭非货币性资源投入在家庭社会经济地位与学业成绩之间的中介效应,因此,选取父母监管、亲子交流、家长与学生朋辈群体互动以及父母对子女的教育期望等4项作为中介变量。  参照Mu和Hu的研究[25],父母监管变量根据学生问卷中的以下8个题目构建:“你的父母在以下事情上管你严不严:作业、考试,在学校表现,每天上学,每天几点回家,和谁交朋友,穿着打扮,上网时间,看电视的时间。”所有题目的选项均为“不管”“管,但不严”“管得很严”,分别计为1分、2分、3分,并取8个题目得分的均值作为父母监管变量得分;得分越高,表明父母的监管力度越大。  根据李佳丽和胡咏梅的研究[26],亲子交流变量的构建综合了学生问卷中的5个题目:你父母是否经常与你讨论以下问题,分别是“学校发生的事情”“你与同学的关系”“你与老师的关系”“你的心情”“你的心事或烦恼”。所有题目的选项均为“从不”“偶尔”“经常”,分别计为1分、2分、3分,并取5个题目得分的均值作为亲子交流变量得分;得分越高,表明亲子交流越频繁。  参考周东洋和吴愈晓的做法[27],家长与学生朋辈群体互动这一变量来自家长问卷中的两道题目,分别是“您认识与孩子常在一起的朋友吗?”“您认识与孩子常在一起的朋友的家长吗?”。两个题目的选项均为“不认识”“认识一部分”“全部认识”,分别计为0分、1分、2分,并取两个题目的得分之和作为家长与学生朋辈群体互动变量得分;得分越高,表明家长与学生朋辈群体互动越多。  父母对子女的教育期望这一变量来自家长问卷中的题目“您希望孩子读到什么程度?”。借鉴张阳阳和谢桂华的变量定义方式[28],将答案选项中的“受教育程度”转换为“受教育年限”,具体转换方式为:初中毕业=9年,中专/技校/职业高中/普通高中=12年,大学专科=15年,大学本科=16年,硕士研究生=19年,博士研究生=23年。经过上述转换后,父母对子女的教育期望的取值范围为9~23,是连续型变量。3.2.4 控制变量  在个人层面,研究控制了学生性别(男生=1,女生=0)、年龄(连续型变量)、是否独生子女(是=1,否=0)、是否住校(是=1,否=0)以及户口类型(农业户口=1,非农户口=0)。此外,还控制了班级固定效应,目的是尽可能降低学校与班级层面的不可观测变量对学业成绩的影响。控制班级固定效应的具体做法为:先将学生所在班级这一多类别变量转化为多个虚拟变量,然后将其中一个虚拟变量作为参照组不纳入模型,将其他班级虚拟变量全部纳入回归模型。3.3 分析策略  借鉴温忠麟和叶宝娟在论文中提到的逐步法[29],通过构建方程(1)-(3),检验家庭非货币性资源投入的中介效应。此外,由于研究的中介变量与因变量均为连续型变量,因此采用普通最小二乘法估计方程(1)-(3)的回归系数。  Score=β0+cSES+β1I+θ+e1        (1)  M=α0+aSES+α1I+θ+e2             (2)  Score=γ0+c'SES+bM+γ1I+θ+e3(3)  方程(1)主要分析家庭社会经济地位与学业成绩的关系。其中,Score是因变量,表示学生学业成绩;SES是核心解释变量,表示学生的家庭社会经济地位,系数c表示家庭社会经济地位对学业成绩的总效应;I表示个体层面的控制变量;θ是班级固定效应;e1是随机误差项。  方程(2)用于分析家庭社会经济地位与中介变量的关系。其中,M表示中介变量,分别是父母监管、亲子交流、家长与学生朋辈群体互动以及父母对子女的教育期望;系数a是在控制了其他变量的影响之后,家庭社会经济地位对中介变量M的效应,研究将对4个中介变量分别进行回归分析,其他变量的含义与方程(1)相同。  在方程(3)中,系数b是在控制家庭社会经济地位及其他变量的影响之后,中介变量M对学业成绩的效应;系数c'则是在控制中介变量M与其他变量的效应之后,家庭社会经济地位对学业成绩的直接效应。中介效应等于系数a与b的乘积,总效应c、直接效应c'与中介效应ab的关系为:c=c'+ab。4 研究结果4.1 描述统计结果  研究首先以家庭社会经济地位的均值为界将全样本分成两组,其中低于均值的样本属于低家庭社会经济地位组,高于均值的样本则属于高家庭社会经济地位组,然后采用独立样本t检验分析不同家庭社会经济地位学生在学业表现以及家庭非货币性资源投入方面的差异。结果如表1所示,可以看到,所有学生的平均成绩是81.422分,家庭经济社会地位高于均值的学生(以下简称“高家庭社会经济地位学生”),其学业成绩显著优于家庭经济社会地位低于均值的学生(以下简称“低家庭社会经济地位学生”),前者比后者高13.666分。与学业成绩的检验结果一样,高家庭社会经济地位学生在4类家庭非货币性资源投入方面的得分也都高于低家庭社会经济地位学生,并且这种差异均具有统计显著性。例如,高家庭社会经济地位学生的父母监管得分为2.375,比低家庭社会经济地位学生(2.313)高0.062,达到显著性差异水平。      在学生个人特征方面,所有样本的平均年龄约为14岁,男女比例相等,有32%的学生在学校寄宿,44%的学生属于独生子女,农业户口学生占比为55%。4.2 家庭社会经济地位对初中生学业成绩的回归结果  研究采用逐步法分析家庭社会经济地位对初中生学业成绩的影响,并检验家庭非货币性资源投入在两者间的中介作用。  方程(1)和方程(3)的回归分析结果如表2所示。其中,模型(1)为基准模型,在控制了班级固定效应以及个人层面因素的情况下,家庭社会经济地位对初中生学业成绩具有显著的正向影响。家庭社会经济地位每提高1个单位,初中生学业成绩显著提高2.653分,即方程(1)中的系数c显著。模型(2)至模型(5)分别在模型(1)的基础上,加入了父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望。可以发现,这4个中介变量均对学生学业成绩具有显著正向影响,表明方程(3)中4个中介变量的系数b都显著。此外,这些中介变量均能够降低回归模型中家庭社会经济地位的回归系数,并且父母对子女的教育期望这一变量使家庭社会经济地位的系数下降幅度最大,由2.653降至1.869。由此能够推测,在4个中介变量中,父母对子女的教育期望的中介效应最大。4.3 中介效应检验结果  方程(2)的回归结果如表3所示,可以看出,在控制个人层面因素及班级固定效应之后,家庭社会经济地位能够显著提高父母监管力度、亲子交流频率、家长与学生朋辈群体互动程度以及父母对子女的教育期望,即方程(2)中的系数a均显著。根据逐步法的检验原理,因为系数a与b均显著,表明本文的中介效应均显著。此外,当系数a与b均显著时,逐步法的检验效力要高于Bootstrap法,因而不再采用Bootstrap法进行中介效应检验。同时,由于方程(3)中分别加入4个中介变量得到的系数c'也都显著,说明这4个中介变量均起着部分中介作用。      表4呈现了4个中介变量的总效应、各个中介变量的直接效应、中介效应以及中介效应占总效应比值。由表4可知,家庭社会经济地位对初中生学业成绩的总效应为2.653;在家庭非货币性资源投入这4个中介变量中,父母对子女的教育期望这一变量的中介效应最强,占总效应的29.53%,验证了前文的推测,其次是亲子交流,占总效应的9.64%,而家长与学生朋辈群体互动和父母监管的中介效应相对较弱,分别占总效应的2.39%和0.87%。5 研究结论与讨论  本研究基于CEPS 2013-2014学年的基线数据,以家庭社会经济地位作为指代家庭背景的变量,分析其对初中生学业成绩的影响,以及4类家庭非货币性资源投入因素在两者之间的中介作用,得到如下结论:  第一,不同家庭社会经济地位初中生的学业成绩以及家庭非货币性资源投入存在显著差异。独立样本t检验结果表明,高家庭社会经济地位学生的学业成绩显著优于低家庭社会经济地位学生;此外,与低家庭社会经济地位学生相比,高家庭社会经济地位学生的父母对子女的监管更加严格,与子女的交流更加频繁,与子女朋辈群体的互动更多,并且对子女抱有更高的教育期望。这与已有相关研究结论基本一致,即低家庭社会经济地位初中生在学业成绩与家庭非货币性资源投入方面具有双重劣势地位。  第二,家庭社会经济地位、家庭非货币性资源投入均对初中生学业成绩具有显著的正向影响。家庭社会经济地位越高,学生学业成绩越好,表明取样时我国教育不公平问题较为突出。此外,从4类家庭非货币性资源投入来看,父母监管对学生学业成绩的影响显著为正,可能的解释是,父母对子女“作业、考试”“在学校表现”等方面的严格要求,能够使子女了解家长的标准,从而端正学习态度,而良好的学习态度有利于学生学业成绩的提升[30]。此外,亲子交流也能够显著提升子女成绩,结合已有研究发现,亲子交流可能通过影响子女的学业自我效能感[31]、自我控制能力和学校适应能力[32],从而间接影响子女成绩。与父母监管、亲子交流对子女成绩的影响类似,家长与学生朋辈群体互动同样能够显著正向预测子女成绩;不同之处在于,父母监管、亲子交流这两类家庭非货币性资源投入是父母与子女双方之间的互动,而家长与学生朋辈群体互动则是父母与孩子的朋友,以及与孩子朋友的家长之间的互动。以往研究发现,父母与孩子朋友及其家长的互动越多,学生参与补习的可能性越大、家庭补习花费也越高[27];且大部分研究表明,适当的补习有利于提高学生成绩[33-34]。因此,家长与学生朋辈群体互动可能通过家庭对子女的货币性资源投入这一途径影响子女成绩。与前3类家庭非货币性资源投入的作用一样,父母对子女的教育期望越高,则学生学业成绩越好,其背后的原因可能是,随着父母对子女教育期望的提高,子女自身的教育期望、子女的学习时间,以及家庭货币性资源投入也会相应提高或增加[35-36],这些因素都能够提升子女的成绩。总体来看,4类家庭非货币性资源投入可能主要通过影响学生个人层面的因素(如学习态度、学业自我效能感)与家庭货币性资源投入,进而影响学生成绩。  第三,家庭非货币性资源投入在家庭社会经济地位与初中生学业成绩间发挥着部分中介作用。一方面,家庭社会经济地位能够直接提高初中生学业成绩;另一方面,家庭社会经济地位较高家庭还会通过增加家庭非货币性资源投入,包括父母监管力度、亲子交流频率、家长与学生朋辈群体互动,以及父母对子女的教育期望,从而间接提升初中生学业成绩。关于这些家庭非货币性资源投入影响成绩的具体路径,前文结合以往研究发现和本研究对中介变量的操作化定义进行了较为详细的分析,此处不再赘述。  第四,父母对子女的教育期望这一变量的中介效应最大,其次是亲子交流,而家长与学生朋辈群体互动、父母监管的中介效应相对较小。从中介效应占总效应的比值来看,父母对子女的教育期望能够中介将近30%的家庭社会经济地位对学业成绩的影响;亲子交流次之,为10%左右;排名第3的是家长与学生朋辈群体互动,为2.39%,父母监管的中介效应最小,仅为0.87%。  综上所述,初中生学业成绩受到家庭社会经济地位等先赋性因素的显著影响,家庭非货币性资源投入能够在一定程度上降低家庭社会经济地位对学业成绩的正向影响。这些研究发现对促进教育结果公平的政策具有一定的参考价值:一方面,应该重点帮扶家庭社会经济地位较差学生,以降低家庭背景因素带来的学业表现差异;另一方面,推动家庭教育指导服务中心建设,引导弱势家庭父母适当提高对子女的教育期望、加强与子女及其同辈群体的互动与沟通以及对子女的监管。  本研究存在以下不足:其一,研究使用的是截面数据,所以只能分析变量间的相关关系,无法确定某些影响路径的因果关系;其二,研究对家庭非货币性资源投入影响学业成绩的机制的探讨只是初步的、探索性的,有待采用实证数据对其进行检验;其三,家庭非货币性资源投入的中介效应可能受到教师、学校层面因素的调节作用[37-38]。因此,在后续研究中,可以采用追踪数据,分析家庭非货币性资源投入等因素在家庭社会经济地位与初中生学业成绩间的链式中介作用,以及有调节(如教师、学校层面因素)的中介作用。 参考文献:(略)(声明:本文选自《中国考试》,版权归属原作者,文章观点与本栏目无关,如涉侵权,联系立删!)

第十四届海峡两岸心理与教育测验学术研讨会 暨全国教育统计与测量学术年会会议综述

2023-11-07

骆方 王珊:第十四届海峡两岸心理与教育测验学术研讨会暨全国教育统计与测量学术年会会议综述原文刊载于《中国考试》2023年第9期第87—94页。作 者骆方,北京师范大学心理学部教授。王珊,北京师范大学心理学部研究助理。摘 要:第十四届海峡两岸心理与教育测验学术研讨会暨全国教育统计与测量学术年会近日于广州成功举办,会议主题为人工智能时代下的心理与教育测量。会议共设有5个主会场、24个分会场,交流研究报告216篇、海报展示83篇,来自两岸三地高校和相关机构的409位专家学者出席了此次会议。会议涵盖心理测验理论与技术、信息科技与测验发展、教育测验新进展、人事测评理论与技术、临床与咨询中的心理测验、发展性诊断与测评、统计模型新进展等议题,集中展示了海峡两岸暨香港专家学者研究的前沿成果和最新进展,促进了心理与教育测量领域的学术交流。 关键词:海峡两岸心理与教育测验学术研讨会;全国教育统计与测量学术年会;人工智能;心理与教育测量;智慧教育;智慧评价   2023年8月12日至13日,第十四届海峡两岸心理与教育测验学术研讨会暨全国教育统计与测量学术年会在广州华南师范大学成功举办。研讨会由中国教育学会教育统计与测量分会、中国心理学会心理测量专委会以及中国测验学会(台湾)3家学术机构联合发起,自1993年起每两年一届,轮流在海峡两岸举办,旨在深入探讨心理与教育测验及统计科学等前沿发展议题,带动并活跃海峡两岸学术氛围,促进海峡两岸学术交流。  本届研讨会主题为人工智能时代下的心理与教育测量。会上,两岸三地的409位学者齐聚一堂,来自北京师范大学、华东师范大学、江西师范大学、华南师范大学、台湾师范大学、台北教育大学、台中教育大学、台南大学、成功大学、台北商业大学、香港中文大学等70余所高校,以及教育部教育考试院、微软亚洲研究院等20余家教育考试机构、中小学和相关企业的代表共同参会。1 海峡两岸携手并进,心理与教育测量同仁共迎人工智能新时代  我国教育评价改革目前处于攻坚克难阶段,亟需多学科融合的教育评价技术创新的积极推动。2020年10月13日,中共中央、国务院印发《深化新时代教育评价改革总体方案》,强调要“创新评价工具,利用人工智能、大数据等现代信息技术,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价。”[1]这充分体现了我国对人工智能(artificial intelligence, AI)与大数据等新技术、新手段助力教育评价改革的重视和期望。1.1 人工智能助力提升教育的综合评价、过程评价和增值评价水平,完善教育评价机制  围绕大会主题,中国教育学会常务副会长李天顺教授提出,在深入研究各级各类教育内在规律和时代特征的基础上,发挥自身专业特长,为解决教育评价的难题贡献智慧和力量。一是着眼健全综合评价,充分运用人工智能助力的教育评价,进一步全面评估学生发展。例如:利用数字化、信息化等手段来客观记录学生品行的日常表现和突出表现,完善德育评价;使用可穿戴设备等新型设施和技术,记录学生日常体育参与情况和体质健康水平;等等。二是着眼强化过程评价,进一步深度挖掘教育和学习过程中的数据。过程性评价的关键一环是数据获取和应用,如何借助人工智能和教育大数据技术,对学生进行一系列过程性、伴随性、无觉察的测评,使测评的方式和类型更加丰富、结果更加准确,是强化过程性评价的重要抓手。三是着眼探索增值评价,进一步了解学生的成长和进步。借助人工智能和大数据挖掘算法的支撑,便于更加精确地评估每一名学生的成长曲线,进而更加深入地了解学生的成长和进步。四是着眼完善评价机制,进一步探索更深层次的教育教学规律。通过挖掘、分析教育大数据,量化学习过程,表征学习状态,发现影响因素,找到干预策略,从更深层次揭示教育规律,使其为区域教育管理提升等教育实践服务,推动教育评价结果更好、更扎实地发挥作用。1.2 人工智能等新技术推动测量方法和测验工具的创新发展  人工智能时代的到来,使心理与教育测量领域面临诸多机遇和挑战,也推动了测量方法和工具的创新与发展。中国测验学会(台湾)理事长林素微教授认为,两岸无论从实践需求、面临的挑战和学科发展机遇上,都存在着很多共性的特点。林素微教授分享了台湾地区数字教学与数字化测评的发展现状与成效。顺应大型国际调查的发展趋势,中国测验学会(台湾)致力于推广教育大数据资料的串接、分析与应用,包括国际阅读素养进展研究项目(PIRLS)、国际数学与科学趋势研究项目(TIMSS)、国际学生评估项目(PISA)、国际公民意识和公民素养研究项目(ICCS)、国际计算机与信息素养研究项目(ICILS)等国际调查。此外,会上讨论并分享的数字化测验与评价的技术与实务应用、信息科技在教育与心理测量上的应用等内容,为教育政策规划提供了参考。1.3 心理与教育测量技术进步,推动教育事业高质量发展  心理与教育测量在教育发展中具有重要意义,既为教育决策提供科学依据,又能很好地推动教育综合发展。作为大会承办单位,华南师范大学党委书记王斌伟认为,当前人工智能技术正以前所未有的速度和广度影响着我们的生活。在实现全面建设社会主义现代化国家的目标过程中,优质的教育和人才培养是关键因素。会议以“人工智能时代下的心理与教育测量”为主题,具有重大的现实意义和深远的战略意义,旨在进一步推动心理与教育测量朝向数字化、信息化的方向发展,进一步促进心理与教育测量学科建设,为推动教育考试事业高质量发展、培养高素质的社会主义建设者和接班人,进而实现中国式教育考试现代化提供有力支持。2 主会场高屋建瓴,聚焦数字化考试与教育手段提升  随着信息技术的飞速发展,借助数字化手段获得大量的学习和行为数据成为可能。应用数字化、智能化信息技术手段,深入分析数据,用以发现学习趋势、认知模式和效果评估等方面的规律,从而指导教育改革和个体干预。2.1 建设与智慧教育相适应、服务智慧教育的数字化考试系统  教育部教育考试院党委副书记、副院长于涵研究员在专题报告中提到,作为国家教育制度的组成部分,我国大规模教育考试在保障教育公平公正、服务拔尖创新人才培养、促进人力资源优化、助力经济社会发展等方面发挥着积极作用。随着国家教育数字化战略行动深入推进,利用现代数字技术和理念助力教育考试内容、形式、评价及治理改革,建设与智慧教育相适应、为智慧教育服务的数字化考试体系(简称智慧考试),是我国教育考试现代化进程中一项重要且急迫的任务。教育部教育考试院聚焦国家教育数字化战略行动总体要求,对标智慧教育总体架构,以数字化思维重构考试业务流程,提出以智慧考试为核心概念的全新考试业务系统,描绘我国大规模教育考试数字化发展的愿景和技术路线。智慧考试服务于智慧教育主要体现在3个方面:第一,为智慧教育提供高质量的数据资源,包括面向考试全环节的海量题库、命题素材、无感信息和考生作答信息等;第二,智慧考试的评价结果在教学端服务于学生学习和学校教学,在教育端服务于教育评价和教育改革;第三,通过可及性更好的考试促进教育公平,通过准确性更高的评价保障教育质量,通过适配性更强的考试与智慧教育总体架构实现深度嵌套、全面融合。2.2 拓展自适应个性化学习、评估与反馈的教育新模式  人工智能技术可以更精确地衡量个体的认知、情感和学习进展。个性化测量手段能够实现对个体认知、情感和学习进展进行精准化测量,分析其学习状态与学习结果,为每个学习者设计定制化的评估方式和学习计划。基于人工智能的自适应学习和测量系统则能够根据学生的表现和需求调整教材和测验的难度和内容,使学习过程真正基于学生自身水平进行,从而更好地满足其学习需求和发展潜力。  台湾地区于2017年至2020年实施前瞻基础建设计划,已完成智慧教室与网络带宽设施。疫情发生后,在现有数字化建设基础下,台湾当局提出《推动中小学数字学习精进方案》,规划数字内容充实、行动载具与网络提升及教育大数据3项计划,加速数字化教学推动,以期达成教材更生动、书包更轻便、教学更多元、学习更有效、城乡更均衡五大目标;建设“因材网”,涵盖1-12年级学科教材、素养教材、游戏教材和资讯科技等内容。系统实现了计算机化动态测评学习分析,动态测评由选择题组成,当学生尝试作答错误时,系统会针对错误类型给予适当的反馈,在评估的同时协助学生学习与解题。2.3 依托过程测评,为复杂问题解决能力评估提供全新测评范式  北京师范大学心理学部刘红云教授较为全面和系统地总结介绍了近几年复杂问题解决能力的过程测评与测量模型发展。自20世纪90年代,核心素养(key competencies)已成为全球范围内教育实践和研究领域的重要议题。核心素养的复杂性使得传统的教育测验范式难以直接应用,需要教育测量理念、方法和技术的系统性革新。近年来,信息技术进步为以复杂问题解决能力为代表的核心素养测评提供了全新的测评范式。依托计算机的交互式测验,能够在仿真任务情境下实时记录学生的反应过程,对学生解决复杂问题解决能力的过程进行测评,并保存为过程数据。过程数据蕴含关于学生认知与思维活动的丰富信息,对这些信息进行挖掘与分析有利于对学生潜在能力进行更加准确的估计。  在专题报告中,刘红云教授系统介绍了过程测评的缘起、特点以及测验设计的核心内容并结合过程测评,对数据挖掘方法与测量模型结合的前景进行了展望。2.4 加速领域融合创新进程,提升与丰富心理与教育测评技术及手段  心理测验诞生至今已逾百年,现已被广泛应用于教育、企业管理、临床医疗等领域,发挥了重要作用。然而,传统心理测验本身的一些局限,如问答形式带来的个体焦虑与外在表现水平的降低、自陈式量表造成的不认真作答和作假现象、测验曝光率过高等问题,使其在应用中面临诸多挑战。  信息技术发展为心理与教育测评技术和手段的创新提供了新的解决思路。北京师范大学心理学部黎坚教授介绍了基于游戏的评估方式与最新进展。基于游戏的评估(game-based behavior assessment, GBA)是指通过游戏或者游戏化的活动来对某一对象进行评估。从心理学的角度来说,GBA就是采用游戏的方式,对一个人的能力、人格等心理特质和行为进行量化评估。由于具有可玩性、隐蔽性与仿真性3大优势,GBA能够较好地应对传统心理测验面临的受测者作答动机不高、测验焦虑、测验情境远离现实等问题,已逐渐应用于实践。  北京师范大学心理学部骆方教授团队则开发了系列人机交互式测验,包括创造力、批判性思维、复杂问题解决、计划能力、科学探究能力等测验。这些测验基于证据中心设计(evidencecentered design)框架研发,采用不同测验任务载体,对测验过程性数据的分析也各有不同。报告介绍了从基本的场景化设计、情境性设计到基于虚拟现实的多种设计方式,并从题目作答正确性、作答反应时间和文本数据3方面实现自动化计分。报告强调基于测验的目的和施测条件需要选择恰当的方法来完成整个测验的研发过程,为实际的测验设计与开发提供了经验借鉴。  台中教育大学教育资讯与测验统计研究所的吴慧珉助理教授介绍了高阶能力题型及其自动计分机制的相关研究。研究利用自然语言处理预训练的BERT(bidirectional encoder representation from transformers)模型语言识别技术,对文字进行自动识别,将其运用于考生作答发音的评分中,大幅降低人工评分的主观性和不确定性研究通过计算机手段辅助,模拟了一系列问题情境,使得测评情境更加真实、更能准确评估高阶能力,如可以实现对数学开放题的自动化评分,体现了自然语言处理的能力与优势。  技术进步推动心理与教育测量领域发展,而心理与教育测量手段也能够反向为技术发展提供一些有趣的研究与评价视角。来自湖南师范大学测评研究中心的杨志明教授研究团队,结合英语原著《Charlotte’s Web》阅读训练编制了一套批判性思维测试并分析了ChatGPT的作答结果。结果发现,ChatGPT给出的作答理由比较肤浅,基本上是从题干或答案选项中重抄一部分文字,这可能也意味着ChatGPT在回答问题时重在计算文本之间的相似度,而不是具有真正的思考能力。3 分会场报告异彩纷呈,共同探索教育与心理测量发展新路径  此次研讨会开展了多种形式的学术交流。研讨会共设有5个主会场,24个分会场,汇集学术前沿报告发言216篇、海报报告发表83篇,涉及统计模型新进展、发展性诊断与测评、心理测验理论与技术、信息科技与测验发展、教育测验新进展、人事测评理论与技术、临床与咨询中的心理测验等重要议题。与会专家在各自领域的探讨与研究,为人工智能时代下的心理与教育测量描绘了精彩的未来图景。3.1 统计模型的前沿进展  在统计方法及其应用分会场,与会者围绕统计建模及应用前沿进展展开了深入的探讨。一方面,聚焦于心理统计领域的方法前沿问题,围绕追踪数据分析、结构方程模型等主题广泛开展方法研究,提出新的统计分析方法以及优化改进已有方法的新思路,为心理、教育等学科研究的开展奠定统计方法基础。另一方面,从心理学理论和实证数据出发,应用前沿统计分析方法探究变量之间的关系,挖掘数据中的规律。例如,探讨家庭照料与老年人生活满意度之间的关系、分析父母教育卷入类型、探究学习动机对学习投入的影响等。这些实证研究为心理学理论的构建和验证提供了实证基础,为日常生活和教育教学等提供了有益的启示,有效地促进了统计分析方法的发展以及心理学理论的建构与验证。学者们在会场中积极交流研究成果,探讨前沿统计方法和应用课题,进一步推进了统计方法领域研究的进展。3.2 认知诊断研究进展  在认知诊断专场报告中,与会者汇报了认知诊断研究的前沿进展,具体包括如下议题:在认知诊断模型开发上,基于实际提出参数与非参数化的多策略模型等,并联合作答数据与过程性数据构建模型;为了解学习者的动态学习过程,开展基于两阶段增强信息的研究,构建学习模型;为提高认知诊断计算机化自适应测验(cognitive diagnostic computerized adaptive testing, CD-CAT)结果准确性,促进其实践应用,从参数与非参数结合等方面开发新选题方法,探索在线标定方法和可修改答案CD-CAT;梳理Q矩阵理论及其进展,对Q矩阵估计、被试拟合指标、贝叶斯参数估计等进行研究;基于已有理论研究,积极展开应用研究,将认知诊断应用于数学核心素养评估、比例推理学习进程等。所报告的研究兼具深度和广度以及创新性,丰富了认知诊断领域研究的内容,为该领域的研究提供新的视角与思路。在教育测评中可服务于教师的因材施教以及学生个性化学习方案的制定,以达到诊断结果促进学习和教学、有效减轻学生考试压力和负担的目的,最终促进智慧学习、高效学习、轻松学习。3.3 题目作答时间建模与应用  在题目作答时间(response time, RT)建模与应用分会场报告中,与会参与者探讨了RT这一具有代表性的多模态数据在心理与教育测量中的理论和实践应用价值。例如:为进一步实现对传统题目作答精度(response accuracy, RA)和 RT的准确客观分析,提出基于广义项目反应理论模型簇和对数正态RT模型的广义联合层级建模框架;为探究潜在能力和潜在加工速度之间的并行交互发展,提出针对纵向RA和纵向RT数据的纵向联合建模框架。在模型构建之外,面对心理与教育测量中快速猜测等异常作答检测所面临的难点问题,与会者还探讨了RT在快速猜测等异常作答检测中的应用,提出联合RA和RT的变点分析法、联合RA和RT的诊断分类树模型和联合RA和RT的混合层级认知诊断模型。这些模型建构和实践应用对于加快推进心理与教育测量中多模态数据的分析与利用具有重要价值,既为我国智能化考试的数据分析提供方法学支持,促进我国智能化考试落地,也为学习科学和教育数据挖掘等相关领域研究者提供方向参考。3.4 心理健康新型测评的研究与实践  在心理健康新型测评专场报告中,与会者分享了与特殊测评技术和机器学习算法结合的心理健康评估的研究现状,还探讨了如何简化和优化传统的心理健康评估工具,以适应数字时代的需求,为实现心理健康的准确测评提供了全新视角。与会者围绕心理健康测评中的热点难点问题展开讨论:针对传统测评无法解决的社会称许性的问题,提出采用投射测验和条件推理测验等形式的测验进行测量;针对传统测评筛查费时费力的问题,提出结合大数据和算法实现无侵扰大规模测量。在中国式教育考试现代化的背景下,这些方法技术创新为更客观、全面地评估学生的心理状态提供了可能,有助于更好地关注学生的整体发展,对于推进心理健康测评领域的技术创新和应用具有重要价值。3.5 组织中的人事测评新视角  在组织中的人事测评专场报告中,与会者聚焦当前人事测评领域难题,结合层面理论、项目反应理论、认知诊断理论等测量理论和机器学习领域视角,针对测量工具的理论构想设计与验证、受测者作假及甄别、自适应题库的建设等一系列亟待解决的前沿问题展开探讨,为解决上述问题提供了充足的理论与数据分析模型。在前沿理论的指导下,与会者探讨了各测量形式及其应用优势:基于游戏的评估能够较好解决受测者的测验焦虑等问题;迫选测验和条件推理测验能够较好应对作答过程中受测者的作假行为倾向、具有较高的抗作假能力;而开放式情境测验则能够在具备高拟真性的同时,使用ChatGPT实现自动化评分。各专项报告从测评形式设计、受测者作答模式、测评数据分析、测评题库建设等角度出发,探索实践应用问题的理论解决方案,锚定理论研究构想的落地应用场景。在人工智能这一时代背景下,专项报告形成的智慧结晶为组织中的人才选拔与评估贡献新思路,为人事测评领域研究开阔新视野。3.6 人机交互式测评技术探索  在人机交互式测评专场报告中,与会者从测评的任务设计、测评的数据分析和测评的实践应用3个角度出发,探讨了人机交互式测评、基于游戏的测评等人机交互式测评工具在心理测量领域的巨大潜力。所报告的研究多采用反应时间、眼动数据、过程性指标等丰富的数据类型对复杂任务进行分析,介绍如何使用序列分析、网络分析等方法,在过程性数据的帮助下分析任务完成过程中的个体差异。在新型测评的开发过程中,测验的设计思路、收集的过程性数据的类型和数量以及使用过程数据的方式都发生了巨大的变化;随着技术的不断发展与进步,新型测评还可能采集更广泛的数据,包括生物识别(如心率、面部表情)和基于手势的输入。技术的进步使得设计和开发各种精巧、便携的测评工具成为可能,随着统计建模和数据分析的发展,还可以实现更快地收集、分析、可视化评估数据,有助于在学习环境中进行更有效的测评。除此之外,基于交互性、新颖性、及时反馈等特点,交互式测评工具还可以被用于训练和辅助学习。人机交互式测评不仅可以帮助提升学生的思考能力和学习方式,而且有助于更加全面地评估学生的能力,在教育和考试领域具有广阔前景。3.7 ChatGPT在心理与教育测评场景中的应用  在ChatGPT与心理教育测评专场报告中,与会者对以ChatGPT为代表的生成式AI大模型在心理教育测评领域中的现有及潜在应用场景进行了讨论。有学者报告了在作文自动化评分、开放式测验作答评分等任务上ChatGPT模型的表现,展示了ChatGPT在心理教育测评任务上的巨大潜力。此外,如何审视ChatGPT这种通用人工智能也成为热议的话题,有研究者从人格、高阶思维等视角,通过专业的心理测验工具对人类群体、ChatGPT、GPT4等进行了评价对比,提出GPT系列大模型尚存在的不足。这些研究结果对如何建立长久的人机协同机制、如何应用大模型改进心理教育测评等提出新的思路,对探索大语言模型技术如何服务于中国式教育考试现代化具有重要学术意义和参考价值。3.8 教育质量监测和学业测评  教育质量监测和学业测评分会场的报告人来自高校、中小学和教育测评机构,报告主题涉及质量监测、测验改进、学习分析3个方面。与会者探讨了区域基础教育质量监测的需求和挑战,提出以整合的思路建构区域教育质量监测方案,以应对监测结果应用不足的问题;围绕测验的开发与改进,与会者探讨了测量理论和方法、心理学实验方法、人工智能与技术对命题和测验编制、测验实施、评分技术、分数报告等方面的进展;与会者还探讨了基于人工智能对学生学习过程的刻画,以及对不同类型学生的识别和帮助的策略,为教师的教学改进提供了新的可能。这3个方面的报告,充分体现出监测与改进融合、测评与学习融合、测验技术与人工智能融合的重要性与必要性。此外,也可以从与会者的交流中了解到,高校、中小学和教育机构的合作十分必要,且前景广阔。3.9 人工智能时代教育测量学面临的挑战与机遇  在人工智能与教育考试专场报告中,与会者探讨了人工智能时代教育测量学面临的挑战和机遇,提出智慧考试学评融合的理论架构,把量子测量的思路和方法引入教育测量,为构建人工智能时代下的教育测量基础理论提供全新视角。在理论探讨的基础上,与会者还探讨了高校人才选拔中的热点和难点问题:针对高考综合改革中的选考科目等级计分问题,提出借助统考科目成绩为选考科目建立通用能力量尺的思路;为对标人工智能时代下的人才需求,提出从评价理念、试题呈现、评卷方式等维度改革考试内容和形式的思路。这些理论探讨和实践改革思路聚焦教育考试高质量发展,探索适应人工智能时代要求的教育考试新理论、新模型、新应用,打造为育人选才全过程服务的考试新业态,对于加快实现教育考试现代化具有十分重要的意义。此外,本场报告以教育考试机构中青年学者为主体,面对人工智能技术的发展,他们以数字化思维重构考试业务流程,对数字化考试业务系统进行学理化阐释、学术化表达,为教育考试学术共同体的建设和发展注入了新的活力。  经过为期两天的高密度学术交流,主题丰富、层次多样的研究报告使与会者充分了解教育与心理测量领域的前沿进展和热点问题,对如何利用技术进步、迎接技术挑战有了更为深入的思考,对人工智能浪潮下心理与教育测量未来发展趋势有了更加清晰的认识;各领域的专家学者也各尽所能,来自不同地区、不同类型单位的专家学者、研究生、中小学教师以及教育机构与企业的实践工作者等,相互平等交流、深入探讨学术问题、碰撞学术思想、助力学术互鉴,推动构建海峡两岸暨香港学术共同体的融合发展。  大会将“海峡两岸学术交流杰出贡献奖”郑重授予侯杰泰教授、吴武典教授、车宏生教授和冯伯麟教授等4位教授,以表彰他们在推动海峡两岸学术交流与合作中作出的突出贡献。另有24位参会代表获得“青年学者大会论文奖”。  特别感谢陈睿、曾平飞、涂东坡、詹沛达、田雪涛、李辉、王欣夷、程雪迎、张照辉等同志对本文的贡献。 参考文献: