2025-10-27
原创 旷野从“教的设计”走向“学的设计”——构建以学生为主体的“四有”课堂 一、现状:学生“缺席”的课堂 课堂上,一个常见的现象让人纠结:老师台上讲得口干舌燥,台下学生却眼神涣散,甚至伏案昏睡。我们不禁要问:为什么精心准备的教学,却唤不醒一颗颗求知的心?问题的根源,或许就在于我们的课堂里,“教”占据了中心,而“学”的主体——“学生”却缺席了。 二、症结: “目中无人”的教学设计 许多老师抱怨学生不在状态,却很少反思,我们的教学设计,真的把学生装进去了吗?我们习惯于从“教”的立场出发:教学目标源于课标,教学过程环环相扣,提问设计看似周密。然而,这一切如果脱离了鲜活的、具体的“人”,便成了无的放矢。 这就像一位厨师,只研究菜谱的华丽和烹饪技巧的精湛,却不问食客的口味与饥饿程度。我们深耕教材内容的分析,却忽略了最根本的学情分析。学生现有的知识起点在哪里?他们的兴趣点是什么?他们会遇到哪些困难?不了解这些,课堂就无法与学生的生命经验产生连接,他们自然成了“局外人”和“旁观者”。 三、 对策:构建以学生为主体的“四有”课堂 要让课堂里“有”学生,就必须让课堂从“教堂”变为“学堂”。基于此,我尝试提出“四有”课堂的构想,让理念落地生根。 1. 有任务:点燃学习的引擎 任务不是模糊的“听讲”或“看书”,而是具体、明确、有挑战性、与学生相关的学习指令。它应该位于学生的“最近发展区”——“跳一跳,能够到”。一个优质的任务,能瞬间将学生从被动接收状态,拉入主动探索的赛道。无论是解决一个实际问题,完成一个小组项目,还是攻克一个知识难点,明确的任务给了学生清晰的目标感和归属感,让学习真实地发生。 2. 有跟进:贯穿全程的护航 布置任务绝非终点,而是教师工作的新起点。跟进意味着教师要走下讲台,成为课堂上的“巡视员”和“观察员”。学生在做什么?遇到了什么障碍?哪些小组进展顺利?哪些学生需要帮助?跟进是过程性管理,它能及时发现问题,防止学生“掉队”或“摸鱼”,确保每一个学生都在任务的轨道上运行。没有跟进的任務,无异于“放任自流”。3. 有反馈:制造照亮前路的灯反馈是学生了解自己学习状况的唯一途径。它必须及时、具体、可操作。不仅仅是“对”或“错”的判断,更要说明“为什么对”“如何改进”。一句“这个思路很棒,请继续说”是鼓励性反馈;一句“你这一步做对了,但如果能……结果会更准确”是指向性反馈。及时的反馈能让学生随时校准方向,体验解决问题过程中的每一步喜悦与成长。4. 有鼓励:提升自信的阳光这一点在我们乡村学校尤为重要。许多孩子内心敏感、自信心不足。课堂上,教师的一个微笑、一个肯定的眼神、一句真诚的表扬,都可能成为点燃他们学习热情的火种。鼓励不仅要给予那些又快又好的“学霸”,更要慷慨地给予那些速度虽慢但一直在努力、虽然答错但勇敢表达的学生。让每个学生都感受到“我被看见了”、“我的努力有价值”,这是让他们从心理上融入课堂的关键。 四、感悟:看见,才能“有”学生最近看了《名校的那些“秘密”》一书,觉得名校之所以成为名校,其光环之下,隐藏的并非什么高深莫测的“秘密”,而往往是一些教育本质的回归与坚守,其中唤醒与点燃最为重要。而唤醒和点燃的前提是,我们必须首先“看见”学生。构建“四有”课堂,正是要求我们每一位教师,将目光从教材、教案,更多地投向学生——了解他们的起点,设计他们的任务,跟进他们的过程,反馈他们的成果,鼓励他们的成长。这条路或许漫长,但只要我们开始行动,让课堂里真正“有”了学生,即使是乡村学校的课堂,也一定能焕发出应有的生机与活力。那时,昏昏欲睡的现象将不复存在,取而代之的,是一双双闪烁着思考光芒的明亮眼睛。(免责声明:本文转载于《穿过九月的星空》公众号,转载旨在分享与交流,版权归属原作者,文中观点与本栏目无关。如涉侵权,联系立删!))
2025-10-27
原创 徐步达 在今天的课堂上,“问题驱动”已成为许多同仁引导学生思考和培育学生核心素养的重要策略,其基本原理,是使学生在分析、解决问题的过程中,“自然而然”的掌握知识、技能,形成能力、素养。在“问题导学”新思——谈“问题串”的分类(一)中,我也对问题串的类型进行了探讨。 那么,好的问题(串)究竟是如何设计出来的?我想,以下策略或可参考。 一、将教材中的陈述变问题 教材的各章节中有大量对学科知识、技能的陈述,我们完全可以将这些陈述转化成问题或创设为情境,以实现问题驱动。 例如,对“**的规律是**”,可转化为“你能发现**的规律吗”;“这要用到**解决**”转化为“面对**应如何解决”等。此种处理虽简单、直接,但也凸显了教师坚持“问出来而非讲出来”的意识。 二、对教材中的问题进行引用、拆分、整合 除陈述事实外,教材中也自带引导学生探究新知、总结规律的问题。 对此,我们可依据学情,或直接引用问题,或将某问题拆分为几个有递进关系的子问题,或将某几个问题整合为一个大问题,或改变问题原有表述的方式、调整问题原来所处的环节等。 例如,在人教版数学七年级上册“有理数的减法”第2课时中,教材对加减混合运算的操作进行了以下两步处理。第一步,依据“减去一个数,等于加这个数的相反数”,将减法全部转化为加法。第二步,为简化书写,可省略括号和加号,进而将加减号看作正负号。 然而,由于学生未必会按照上述思路作答——如有的学生可能会依据已接触的有理数的化简,根据负号的个数去掉括号、简化算式,实现一步到位——因此,我们也可直接抛出“这个算式你想如何计算”的问题,根据学生的现场反应,决定是否两步并作一步走。 该处理就属于对教材的既定思路进行了“整合”。总之,老师的主观能动性在于“用教材教”,而非“教教材”。 三、站在学生的基础“问”障碍点 除用好教材,我们还要在认真调研学情、充分换位思考的基础上,想想学生在已有知识储备、认知能力的基础上,可能会在哪些环节产生思维困点,我们就要在这些困点上搭建原创性思维支架、设计原创性问题串。 尤其是在解题训练环节,教材更不可能提供现成的思路,这更需要老师将学生答题思路与命题思路紧密结合,设计可引导学生作答的问题串。上图引自《中学数学教学参考》2025年8月下旬刊的一篇文章(作者单位系西安理工大学附属中学),其彰显了作者意图在学生可能的思维障碍点搭建问题支架。 由于学情和教学思路的差异,我们不必完全照搬——例如,由于第(1)问难度不大,我本人可能不会设计问题1、2,而是根据学生作答情况现场追问、整理思路——但作者设计的问题串,还是非常值得学习的。 四、站在学生的发展“问”突破点 解决障碍点是守住底线,突破难点是追求上限。因此,我们还要在站在学生发展的角度,提出有挑战性的、可突破难点的问题。 例如,学习乘法公式时,在学生用代数运算推导出(a+b)² =a² + 2ab + b² 的结论后,为使学生加深理解、提升能力,我们可继续设计如下问题。 问题1:一个二项式的平方,为什么会成一个三项式?2ab 是如何产生的? 问题2:我们虽能从运算的角度说明,但为更好的“看见”这一事实,不妨尝试用几何图形来解释。先画一个边长为 (a+b) 的大正方形,并尝试将其分割成几个小图形,你能说明这个大正方形的面积,正好等于 a² + b² + 2ab 吗? 问题3:通过识图,(a+b)² = a² + b²错在哪? 问题4:类比上述思路,(a-b)² 的结果是什么?你能从代数运算、几何图形变换两个角度,去证明你的猜想吗? 以上问题串的设计,虽未跳出教材的基本框架,却可引导学生相对自然的突破学习难点,体会数形结合的价值,并利于培育学生推理能力、几何直观、创新意识等数学核心素养。 有什么样的教学理念,就会产生什么样的教学策略。只要我们深刻意识到“问题解决”才是学生学习的核心,就会调动自己的一切教学智慧,为设计好的问题、创设好的情境而努力。(免责声明:本文转载于《步步留声》公众号,转载旨在交流与分享,版权归属于原作者,文中观点与本栏目无关。如涉侵权,联系立删!)
2025-10-23
引用格式:王蔷, 柳丽萍, 常玉梅. 高中英语学业水平合格性考试依标命题的内涵、意义与举措[J]. 中国考试, 2025(10): 32-39.作 者王蔷,北京师范大学外国语言文学学院教授,首都师范大学特聘教授。柳丽萍,外语教学与研究出版社研发中心部门主任。常玉梅,山西省教育科学研究院高中中心副主任,高中英语教研员。摘 要:为贯彻落实《教育强国建设规划纲要(2024—2035年)》与《普通高中英语课程标准(2017年版2020年修订)》的相关要求,本研究首先厘清高中学业水平合格性考试的性质特点,分析新修订普通高中英语课程标准的主要变化及其对合格性考试的命题要求。在此基础上,研究重点探讨依标命题的内涵要义与实践意义,针对当前命题中存在的问题,提出以课程标准为根本依据的改革举措,包括严守课程标准核心要求、遵循学业质量水平基准、立足真实情境和语篇考查语言运用能力、规范全流程管理等。关键词:高中英语学业水平合格性考试;依标命题;课程标准;高中英语;评价改革根据中共中央、国务院印发的《教育强国建设规划纲要(2024—2035年)》和《深化新时代教育评价改革总体方案》等文件要求,深化教育评价改革、不断提高各学科命题质量,充分发挥考试命题的育人导向作用,已成为当前推进和落实素养导向新课程改革的重要举措[1-2]。考试评价改革直接关系到课程教学改革的推进与课程目标的有效落实,更关乎国家人才培养的方向与质量。特别是随着《普通高中英语课程标准(2017年版2020年修订)》的颁布实施,落实核心素养培养目标已成为新时期课程改革的主要任务[3]。本研究旨在深入阐释高中英语学业水平合格性考试依标命题的内涵与意义,针对命题实践中存在的与新课标契合度不高等问题,提出系统性改进举措,为命题机构人员提供理念指导与实操指引,充分发挥考试评价在深化课程改革、落实育人目标中的导向与支撑作用。一、高中学业水平合格性考试与高中英语课程标准(一)高中学业水平合格性考试概况2014年9月,国务院印发《关于深化考试招生制度改革的实施意见》,明确了我国今后一个时期考试招生制度改革的总体目标、主要任务与具体措施,并将“完善高中学业水平考试”列为重要举措之一[4]。同年12月,教育部出台《关于普通高中学业水平考试的实施意见》,对该项考试工作进行全面部署,明确要求各地在全省范围内统一组织实施普通高中学业水平考试。考试由省级教育行政部门依据国家课程标准和考试要求统一管理,范围覆盖国家规定的所有学习科目,内容以课程标准为依据。高中学业水平考试旨在检验学生达到国家规定学习要求的程度,其成绩将作为高中生毕业和升学的重要参考[5]。高中学业水平考试分为合格性考试和等级性考试(或选择性考试)。合格性考试成绩是普通高中学生毕业以及高中同等学力认定的主要依据。国家课程方案规定,除综合实践活动课程纳入综合素质评价外,其他科目均实行合格性考试,考试内容为必修内容;等级性考试(或选择性考试)一般分为五个等级,由高到低依次为A、B、C、D、E,各等级的具体比例由各省(区、市)根据基本教学质量要求和命题情况等确定,成绩纳入高考招生录取总成绩,考试范围涵盖必修和选择性必修的课程内容[6-7]。作为普通高中学业水平考试的重要组成部分,合格性考试是国家级教育考试,具有检验学生是否达到国家规定必修课程学业要求、评估高中毕业水平及认定高中同等学力的功能。同时,它也是学生参加相应科目等级性考试的依据。因此,合格性考试不仅具有评价普通高中必修阶段教学质量的作用,还为高等学校招生录取提供重要参考。2019年,《国务院办公厅关于新时代推进普通高中育人方式改革的指导意见》再次强调,高中学业水平考试命题必须紧扣课程标准,坚持立德树人正确导向,体现基础性、综合性、应用性和创新性要求,确保考试内容与课程目标、教学要求保持一致[7]。本文重点探讨高中英语学业水平合格性考试(以下简称合格性考试)依标命题的问题。(二)高中英语课程标准《普通高中英语课程标准(2017年版2020年修订)》(以下简称课程标准)是国家课程标准,体现了国家对基础教育课程的基本规范与要求,也是深化基础教育综合改革,落实素养导向育人目标,统筹课标、教材、教学、评价和考试等环节的指导性文件。课程标准提出了包含语言能力、文化意识、思维品质和学习能力四大要素的英语学科核心素养目标,构建了包含六要素的课程内容结构,并研制出高中英语学业质量标准,明确了学生在完成课程后应达到的学科核心素养水平及关键表现。课程标准为高中阶段实施阶段性评价、合格性考试与等级性考试命题提供了依据,引导考试命题把握素养导向的育人方向,将考查目标、考查内容、考试形式及水平要求等与新课标建立有机连接。通过创设真实情境、设计真实任务,该标准旨在考查学生的高阶思维能力和综合运用所学知识解决实际问题的能力,科学评估学生英语学科核心素养发展情况,从而促进教、学、考的有机衔接,形成育人合力[3]。二、英语合格性考试的功能定位及依标命题的内涵意义(一)高中英语合格性考试高中英语合格性考试是根据普通高中课程方案、课程标准和教育部有关学业水平考试的规定,由省级教育行政部门组织实施的国家教育考试。该考试属于标准参照的成就性考试,考试对象为完成高中英语必修课程的学生,主要目的在于考查学生经过必修课程的学习后是否达到国家规定的英语学习要求及其达成程度。考试结果既是判断高中学生能否毕业的依据,也为升学提供参考[3],同时为监测高中英语课程的实施质量提供数据支持。高中英语合格性考试的命题导向对学校的教育教学具有重要引导作用,是落实立德树人机制、实现育人目标的重要保障。该考试对于全面贯彻党的教育方针、提升高中英语必修课程质量、促进素质教育发展具有重要意义和深远影响。为此,高中英语合格性考试命题工作需全面、全方位、全过程以课程标准为依据组织与实施[3]。依标命题的核心在于建立课程标准与考试命题之间的有效关联[8],实现从“静态性”的课标文本陈述向“动态性”的命题实践转化[9]。(二)依标命题的内涵高中英语合格性考试的“依标命题”,本质上是将课程标准的要求作为命题的唯一标尺,全面贯彻课程标准从理念到目标的整体要求,呼应教学与评价的顶层设计,确保考试内容与课程育人目标相一致。其核心内涵在于以课程标准为根本依据,系统落实各项要求,科学评价学生在完成必修课程后英语学科核心素养的发展水平。具体而言,依标命题有着以下五个层面的含义。第一,依标命题是对课程标准规定的课程性质、理念、目标、内容、学业质量、评价建议的全方位回应,不应窄化地理解为命题仅需参照“内容要求”。依标命题意味着考试需全面实现与课程标准的一致性。课程标准明确了英语课程兼具工具性与人文性,倡导素养导向、实践主线、综合育人的理念。因此,依标命题需超越“知识本位”局限,既要考查学生运用语言进行沟通与交流的能力,也要通过素材和任务设计体现文化浸润与思维发展的育人价值。第二,依标命题需切实遵循课程标准提出的素养目标,以语言能力、文化意识、思维品质、学习能力四项核心素养的融合发展为考查核心,体现课程的基础性、综合性和实践性特征。命题过程中应同步考查学生的语言理解与表达能力、文化认知与价值取向,以及在解决问题过程中所表现的思维特质,体现核心素养的整体性。第三,依标命题需严格对标“六要素整合”的必修课程内容框架,基于主题、依托语篇,考查学生灵活运用语言知识、语言技能和学习策略,理解文化知识与文化内涵,在真实语境中理解和表达意义与情感态度、分析和解决问题的综合能力。此外,对标课程内容还意味着考查内容不越界、考查载体不孤立。一方面,内容选择应严格限定于必修阶段涵盖的主题范围、语篇类型、语言知识及技能要求,杜绝超标或降标命题;另一方面,命题须以语篇为基本考查单位,通过完整的语篇素材(而非孤立的词汇或句子)创设语境,引导学生整合运用语言知识、技能与学习策略理解意义、表达观点,体现六要素的内在关联。第四,依标命题须严格参照“学业质量水平一”的标准进行设计。课程标准明确将“学业质量水平一”确定为学生完成必修课程后应达到的基本要求,该水平是合格性考试命题与评分的直接依据。这意味着试题难度须精准对应“水平一”的能力描述,考查内容应严格呼应其14项具体素养表现指标,避免脱离语境的机械考查(如单纯语法填空或单词拼写等),而应设计如“在语篇中判断语法正确性”或“根据情境补全内容”等任务,确保命题与指标要求保持一致。此外,依标命题应始终坚持“标准参照的成就性考试”的本质属性,以学生是否达到必修课程学业要求为评判核心,而非进行选拔性排序。第五,依标命题需将课程标准中关于考试评价的要求系统贯穿于命题工作的全流程,包括命题指导思想的确立、命题规划与多维细目表的编制、试题的设计、参考答案与评分标准的制定,以及试题审查等各个环节。命题人员应以课程标准为依据,明确每道试题所考查的核心素养类型与水平层次,确保试题设计科学、目标清晰、内容规范,赋分维度与权重设置科学合理。综上,依标命题不仅要求英语命题在内容与形式上符合课程标准规定,更要在理念层面坚持素养立意和育人导向;在技术层面做到科学规范、系统一致,使考试成为课标要求的“镜像”——从考查目标到内容边界,从能力标准到评价导向,从命题设计到组织实施,均以课程标准为根本依据,最终实现“以考验学、以考促教”,确保高中英语必修课程的育人目标落到实处,有效发挥合格性考试对学生学业成就和教学发展的引导与促进作用。(三)依标命题的意义首先,依标命题是落实素养导向育人目标的根本保障。当前,我国基础教育已进入核心素养时代[9]。课程标准作为国家课程的纲领性文件,明确提出了语言能力、文化意识、思维品质、学习能力融合发展的育人目标,是统筹“课标—教材—教学—评价”的核心依据。坚持依标命题,本质上是将课标中的素养目标转化为可操作、可考查的实践载体,包括创设真实语言情境,设计综合性、探究性任务,注重考查学生的高阶思维能力及运用所学知识解决实际问题的能力,避免机械记忆类试题的堆砌等。这一过程不仅为教师准确把握课标核心理念提供了具象化参照,更为教学从知识灌输转向素养培育提供明确指引,推动学生从被动接受式学习转向主动探究式学习,从而保障高中英语必修课程育人目标的实现,避免教育实践偏离素养导向的方向。其次,依标命题是深化新时代教育评价改革的关键举措。《深化新时代教育评价改革总体方案》指出,教育评价事关教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向[2]。考试作为教育评价的重要方式与教育教学的关键环节,是推进教育评价改革的核心内容之一。试题命制的方向与内容体现国家意志,尤其在命题导向、素材选择,内容结构以及情境任务设计等方面,对教育教学具有反拨作用,直接影响素养导向的教育目标落地与人才培养质量提升。因此,唯有强化教育评价改革,坚持素养立意和学科育人导向的考试命题,才能推动高中英语新课标理念、目标和要求在教学各环节落地生根。再次,依标命题是保障考试公平性与结果可靠性的核心标尺。高中英语合格性考试作为省级组织的国家教育考试,核心功能在于评估学生是否达到必修课程的基本要求,公平性是其价值根基。课标中的“学业质量水平一”为命题提供了统一的能力基准,依标命题即严格对标该水平设定试题难度与内容范围,既要防止超标命题,也要避免命题低于标准,确保所有学生在同一评价尺度下接受考查。同时,依据课标制定评分标准(如素养表现分层描述)可减少主观误差,真实反映学生达标情况。这种命题方式不仅保障了考生的公平权益,也让考试数据具备横向(区域/校际)与纵向(不同年份)可比性,既为基层学校改进教学提供依据,也为国家评估全国或区域高中英语必修阶段的教育质量、推动课程政策优化提供可靠的数据支撑。最后,依标命题是提升高中英语教育质量的有效路径。高中英语合格性考试是检验必修阶段教学效果的重要阶段性考试,其数据反映了区域和学校的教学质量现状。然而,当前合格性考试在诊断教学问题和推动教学改进方面的功能尚未有效发挥。依标命题能够从以下两个方面激活其质量提升功能:一是以课标为依据明确考查范围与能力要求,使考试结果准确反映教学中存在的薄弱环节;二是通过依标命题生成的考试数据,为不同区域和学校提供“横向对比—问题诊断—针对性改进”的科学依据,避免教学改革的盲目性。最终,通过“依标命题—数据诊断—教学优化”的闭环,推动普通高中英语教育质量的整体提升。三、现行高中英语合格性考试命题实践中存在的主要问题自新课标颁布以来,尽管依标命题的理念已提出数年,但目前高中英语合格性考试仍未能全面落实依标命题。这一方面源于各相关方对合格性考试的性质与目的认识尚不清晰,另一方面各省命题队伍的专业能力与技术水平也存在差异。此外,国家层面缺乏对合格性考试命题工作的统一业务指导,也是原因之一[10]。2022年,教育部课程教材研究所组织启动了高中学业水平合格性考试制度和命题质量研究工作。根据工作方案,2024年英语学科评估组对全国部分省市命题机构的命题质量进行了评估。在依标命题落实上,主要问题体现在课标理念与内容落实不全面、命题偏离学业质量标准要求、依标命题未能贯穿试题命制的全流程等三个方面。(一)课标理念与内容要求落实不全面近期对部分地区高中英语合格性考试命题质量的评估显示,受命题人员对课程标准理解差异及各地教育资源不均衡的影响,当前命题工作尚未充分落实课标理念和内容要求。具体表现为三个问题:其一,主题覆盖不全面,尤其缺失“人与自然”类主题的选材;其二,素材多局限于日常生活类话题,未能充分融入社会主义先进文化、革命文化等内容,缺乏对学生爱国情怀与奋斗精神的引导;其三,试卷结构与考查维度存在短板,既缺少对口语能力的考查,情境设置脱离真实语言使用场景,又存在脱离语篇的单句选择题、翻译题等碎片化考查形式,难以有效评价学生综合运用语言解决问题的能力。(二)命题偏离学业质量标准要求在实际命题过程中,合格性考试的难度控制往往倾向于迎合合格率要求,而非严格依据学业质量标准进行命题[11]。由于试题难度受合格率牵制,导致命题普遍过于简单,具体表现为思维考查停留在基础层面、阅读语篇篇幅不足、语言知识考查侧重机械记忆、写作任务要求偏低等。这一问题使得考试难以真实反映学生的实际学业水平。长此以往,合格性考试必将流于形式,既无法客观评估高中英语教育必修课程的教学质量与人才培养成效,弱化了合格性考试的诊断与评价功能,也背离了其作为标准参照性考试的属性,偏离了设计初衷[10]。(三)依标命题未能贯穿试题命制的全流程尽管各省命题工作普遍包含“制定规划—编制细目表—命制试题—拟定评分标准—审查试题”等核心环节,并明确强调以课程标准为依据,但课程标准的要求并未切实融入各个环节。具体表现在三个方面:其一,对命题规划重视不足,质量把控不严,多维细目表存在要素不齐全、维度划分模糊等问题;其二,素材选取与题型设计偏重碎片化知识,忽视课程标准所倡导的素养导向,导致试题考查目标不明确,综合性、应用性和开放性体现不足;其三,评分标准设定过于简略,试题审查往往流于形式。由于命题的各环节与课程标准脱节,试卷的科学性、合理性与公平性难以得到有效保障。四、高中英语合格性考试依标命题的改革举措为有效解决当前高中英语合格性考试命题中存在的课标落实不全面、偏离学业质量标准、全流程依标不足等问题,切实贯彻对标课标全域要求、聚焦素养导向的依标命题内涵,充分发挥考试评价在促教促学、保障公平、提升质量方面的作用,本文从考查内容、难度控制、命题方式及保障机制四个维度,提出以下四点改革建议。(一)锚定课标核心要求,全面落实素养导向育人目标针对当前存在的课标理念与内容落实不全面、素养考查缺失等问题,应严格依据课程标准中关于课程性质、目标与内容的要求,推动命题工作从知识考查向素养考查转型。首先,在考查内容方面,应确保考查主题覆盖“人与自我、人与社会、人与自然”三大语境,尤其需要补足“人与自然”主题的内容短板;所选素材应积极融入中华优秀传统文化、革命文化与社会主义先进文化,强化价值引领,避免过度依赖日常类话题。其次,在素养融合方面,应坚持以语言能力为基础,将文化意识、思维品质、学习能力的考查有机融入试题设计——理解性试题注重语篇意义与价值观提炼,表达性试题侧重观点阐述与问题解决,杜绝脱离语境、停留在单句层面的碎片化知识考查。最后,在考查形式上,应依据课程标准对语言技能的整体要求,统筹纸笔考试与口语测试,丰富题型结构,确保听、说、读、看、写各项技能的全覆盖,避免重读写、轻听说的失衡问题。(二)严守学业质量水平基准,解决难度“向合格率妥协”问题针对命题偏离学业质量标准、试题偏易导致考试功能弱化等问题,应坚持以课程标准中的“学业质量水平一”作为命题难度的唯一基准,回归合格性考试作为标准参照性考试的本质属性。在难度把控上,须严格依据“水平一”对思维层次、语篇类型、任务要求的描述进行命题。具体而言,应确保思维品质的考查既涵盖基础认知,也体现初步探究能力;阅读语篇应保持类型多样和篇幅适度,符合必修阶段的教学实际;写作任务应强调个人意义的表达,避免机械仿写,杜绝为追求合格率而降低命题标准。在质量保障方面,应坚守既不超纲也不低于课标要求的底线,通过建立“命题组初定—专家复核—试测验证”三级机制,校准试题难度系数,确保考试结果真实反映学生是否达到必修课程的基本要求,从而避免合格性考试流于形式。(三)立足真实情境与语篇,考查学生运用语言解决问题的能力为呼应依标命题中语言为解决实际问题服务的内涵,针对当前存在的情境不真实、脱离语篇等问题,应以“真实语篇+真实任务”为载体,全面考查学生运用语言解决问题的能力。首先,在语篇选择方面,应选用地道且逻辑连贯的当代英语语篇,涵盖记叙文、说明文等不同体裁,并融入文字、图表等,杜绝脱离语篇语境、孤立考查语言知识的命题方式。其次,在情境设计上,应创设学生熟悉的真实场景,避免因城乡或地域差异导致的公平性问题;试题任务应模拟真实语言使用场景,如记录信息、补全图表、表达观点等,引导学生在“做事情”中运用语言。最后,在任务构建方面,应增加综合类试题比例,设计“提取信息—分析整合—阐释评价”的递进式任务,考查学生综合运用知识解决问题的能力,体现课程标准所强调的语言综合性与应用性的理念。(四)规范全流程管理,确保依标要求贯穿始终为解决当前命题工作中依标命题未贯穿全流程、环节衔接松散的问题,应构建以“课标统领—闭环管控”为特征的标准化命题流程,将课标要求渗透到命题各关键环节,从根本上保障考试的公平性、科学性与结果可靠性。首先,在顶层设计阶段,需以课标为核心锚点,构建“考试方案—命题规划—多维细目表”三级设计体系。作为宏观纲领,考试方案的核心职能是“定方向”,以课程标准为唯一遵循,明确合格性考试作为“标准参照的成就性考试”的本质属性、设置整体目标与试卷结构等。在此基础上,命题规划承担中观落地职能,聚焦“学业质量水平一”的要求,细化考查重点、设置难度系数,将方案的宏观方向转化为可执行的命题框架,为整个命题流程的质量管控提供战略性框架。而多维细目表则是连接课标与试题的微观蓝图[12],通过明确每道试题对应的核心素养、考查内容、题型、难度、分值等要素,将抽象的课标要求与命题规划框架进一步具象化,既帮助命题人员准确落实课标要求,提升试题的科学性与准确性[9],也为后续试题审查、试卷评估提供可量化的对照依据[13]。其次,在试题命制阶段,应以课程标准为标尺严格控制内容质量。素材选取应全面覆盖三大主题语境并体现育人导向,情境设计须贴近学生真实生活,任务设置应实现素养融合考查。在此基础上,应建立“命题组内部审核—课程专家外部评审—政治方向审查”三重把关机制。再次,在评分与审查阶段,应以课标为基准,保障评价公正。评分标准与阅卷细则的制定须严格依据课程标准中的学业表现描述,设定符合考查目标的赋分维度与权重,同时为赋分点提供具有代表性的参考示例,兼顾阅卷的实操性与效率,从评分环节保障评价的公正性与结果可靠性。最后,在考后反馈阶段,应以课标为依据,形成改进闭环。基于考试统计数据(如区域/校际素养达标率、各题型得分率、核心素养考查维度的覆盖度等),系统分析命题与课标要求的契合程度,既要诊断是否准确落实课标内容,也要评估是否有效考查素养目标。五、结束语高中英语合格性考试依标命题是打通“课标—教学—评价”闭环、实现教学评一致性的核心纽带,也是发挥考试评价的正向反拨作用、落实素养导向育人目标的关键抓手。本文通过系统阐释依标命题的内涵要义,明确了以课程标准为纲领的命题逻辑。在目标维度上,应坚守素养导向课程目标与“学业质量水平一”的14项具体指标要求,坚持合格性考试作为标准参照考试的本质属性;在内容维度上,需立足主题引领、六要素整合的课程内容,确保考查全面覆盖必修课程的核心内容;在实施维度上,须以标准化流程贯穿命题各环节,通过多维细目表将课标要求具体化,并依托审查机制保障命题质量。实践表明,唯有坚持素养导向的命题理念,通过真实情境的任务设计、多模态语篇的合理选用以及科学评分标准的制定,才能有效发挥考试评价对教学的正向反拨作用,进而推动英语学科核心素养落地,发挥考试评价在教育强国建设中的重要推动作用。未来,应进一步建立课标要求与命题实践之间的常态化调适机制,利用考后数据反哺课标落地、命题优化和教学改进,为深化新时代教育评价改革提供有力支撑,为教育强国建设与高质量人才培养注入内生动力。参考文献略。
2025-10-23
引用格式:黄丽燕, 赵连杰, 吕生禄, 等. 高中英语学业水平合格性考试命题质量评估框架的构建与应用[J]. 中国考试, 2025(10): 49-57.作 者黄丽燕,华南师范大学教授。赵连杰,首都师范大学副教授。摘 要:本研究基于语言测试有用性框架等理论,构建了包含命题导向、命题规划、试卷设计、试题设计、参考答案与评分标准五个部分的高中英语学业水平合格性考试命题评估框架,并以A省2024年高中英语合格性考试为例进行验证分析。结果表明,该评估框架具有实践可行性,能有效诊断命题质量;当前考试命题在规范性和基础性方面表现良好,基本符合高中英语课程标准的要求。同时,研究也发现命题中存在选材的时代性不足、语言能力考查不全面等问题。该研究为完善高中英语学业水平合格性考试质量评估体系、推进学科核心素养落地提供了理论与实践参考。关键词:高中英语学业水平合格性考试;考试命题质量评估;语言测试有用性;评估框架命题质量评估是监控考试设计、施测、评分、分数解释与使用的科学性和有效性的重要环节。一方面,命题质量评估能够通过量化指标(如平均分、难度、区分度等)精准诊断试卷质量的优劣,为命题改进提供依据;另一方面,科学的命题质量评估能确保考试科学性,有效引导教学实践,促进学生素养发展。评估框架构建是开展命题评估的关键环节,是确保考试内容有效性、公平性与导向性的基础,对实现以评促教、促进学生发展的最终目标具有核心价值。本文基于教育测量理论,参考国内外相关研究成果,探索高中英语学业水平合格性考试(以下简称高中英语合格性考试)命题质量评估框架的构建逻辑与实践路径,为教育行政部门、命题机构及一线命题人员在评估框架构建、命题规范制定与命题质量改进等方面提供理论与实践参考。一、考试命题质量评估的理论基础(一)考试命题质量评估的理论依据考试命题质量评估,一般基于经典测验理论(classical testing theory)和项目反应理论(item response theory)两种主要的测量理论[1]。经典测验理论以信度(reliability)和效度(validity)为核心指标。信度反映测量结果的稳定性,可通过重复测试或平行试卷的分数一致性判断试题的可靠性;效度则关注考试是否准确测量目标构念[2]。经典测验理论在标准化考试中广泛应用,其分析方法易于理解和操作,但该理论体系存在两个明显局限:一是测验结果受样本特征和测验内容的双重影响,导致参数解释缺乏稳定性;二是通过平均分、标准差等传统信度指标评估测验可靠性,难以精准刻画测量误差的分布特性,评估精度相对有限[3]。项目反应理论则通过数学模型提升评估的科学性。在该理论框架下,考试命题质量评估通过数学模型对试卷和题目特性进行系统性统计分析,核心在于利用概率模型同时估计学生能力(θ)与题目参数(如难度b、区分度a、猜测c),从而实现对考试质量的科学诊断。具体而言,题目参数的估计基于学生答题数据与理论模型的匹配程度。项目反应理论支持通过参数筛选优化题目分布,剔除低区分度或难度极端的题目,并结合自适应测试动态调整题目难度以提高测量效率。与传统经典测验理论相比,项目反应理论的优势在于其参数独立于样本群体,能够提供更为稳定、可比较的测验结果,并支持跨版本试卷的等值化分析[4]。这一理论不仅提升了命题的科学性,也为考试公平性、精准性和适应性提供了理论支撑,但在实践中仍面临技术门槛高、应用成本大的挑战。考虑到评估的可操作性等问题,命题单位一般会在经典测验理论框架下开展命题质量评估。此外,学界还提出多种效度验证框架为试题质量评估提供理论指导。以Weir的社会—认知效度框架(social-cognitive validity framework)[5]为例,效度验证可划分为考前与考后两个阶段:考前阶段通过理论效度明确需测量的核心构念,并以情境效度确保任务设计与真实应用场景的一致性;考后阶段则通过评分效度验证评分结果的稳定性,借助准则关联效度将测验结果与外部标准进行对比,同时运用后果效度评估测验对教育实践及社会层面的潜在影响,最终形成从构念界定、情境设计到评分验证、准则关联及后果评估的完整效度验证链条。除了相关理论指引,在考试命题质量评估实践中,政策文件、课程标准[如《普通高中英语课程标准(2017年版2020年修订)》[6],以下简称课程标准]等也是构建试题质量评估框架的重要依据。近年来,人工智能与大数据技术的应用进一步推动了评估方法的革新,如自然语言处理技术用于作文评分一致性分析,或通过机器学习模型预测试题的区分度。(二)测试有用性框架Bachman与Palmer提出的测试有用性(test usefulness)框架为语言测试效度验证与质量评估提供了学理指导。该框架包含信度、构念效度、真实性、交互性、可行性及后效六类测试质量属性。信度体现测试结果的稳定性与一致性,构念效度反映测试是否准确测量目标能力,真实性强调测试任务需贴近真实语言应用场景,而交互性关注语言的交际功能,可行性与测试实施的可操作性相关,后效关注测试对教学实践的正向或负向影响[7]。在测评质量评估中,信度与构念效度是评估框架的核心要素。信度关注测量结果的一致性与稳定性,要求学生在相同测试条件下重复作答时能获得相近的分数。为实现这一目标,试题设计需在多个方面满足技术规范:首先,题目表述必须严谨无歧义,以确保测量目标构念的准确性;其次,难度与区分度须合理平衡,避免因过易而无法区分不同能力层次的学生,也防止因过难而影响学生信心;最后,测试实施的标准化(如时间控制、环境一致性)与评分标准的统一性(如主观题评分细则的明确化)同样是保障信度的关键环节[8]。以某省高中英语合格性考试的写作部分为例,评分采用双盲评分与量化标准。统一培训评分教师,作文按语言准确性等12项指标进行批改,并由专家进行抽检复核。通过统一培训、量化标准、复核流程,有效降低主观偏差,体现了高信度特征。构念效度聚焦于测试工具是否真正测量了预设的目标,核心在于内容覆盖的全面性与代表性。具体而言,试题须系统覆盖考查目标,选材须贴近真实语言运用场景,并通过多元化题型设计评估学生的综合语言运用能力。例如,阅读理解部分选取“人工智能对英语课堂教学的影响”(人与社会)与“亲子沟通中的隔阂与理解”(人与自我)两篇文章,既确保语言知识的覆盖广度,又通过现实议题激活学生的批判性思维与语言运用能力,对接学科核心素养的培养要求,促进构念效度的实现。真实性与交互性作为语言测试的两个重要质量属性,通过模拟真实语言使用场景与构建动态交际环境,共同强化试题的实践导向性。真实性的核心在于确保测试任务与实际语言运用的契合度。选材须反映典型交际情境(如邮件撰写、旅游胜地介绍等),通过语境化设计引导学生在具体场景中应用语言知识。同时,任务设计须兼顾语言技能的综合运用与问题解决能力的培养。例如,以校园垃圾分类项目实施效果调查报告为阅读理解材料,要求学生分析项目实施中的挑战,并撰写一份建议书。该设计不仅检测学生的语言能力(如建议书结构与撰写),还通过模拟学生参与校园治理的真实场景,引导其运用批判性思维评估项目合理性,提出改进建议。交互性则聚焦语言学习的交际属性。其技术实现包含两个层面:一是任务设计的互动性,通过合作型任务(如小组讨论、角色扮演)或跨文化交际任务(如模拟国际交流场景),促进师生、生生间的多维度互动;二是测试形式的多样性,如口试、合作型写作等,使测试过程本身成为语言实践场域。例如,应用文写作任务要求学生以学校音乐节为主题向国外笔友介绍活动,这种角色扮演式任务既强化语言交际功能,又通过跨文化交际深化语言应用能力。可行性与后效分别从实施适配性与教育生态影响两个维度反映测试价值。可行性关注测试设计与现实条件的适配度,要求其在科学性与可操作性之间建立动态平衡。例如,试卷阅读量、测试时长等设计须与考试目标匹配,评分流程应避免过度复杂化以降低执行成本。后效评估需从命题引导与数据应用两方面体现价值。一方面,题目设计应通过真实情境任务(如社会热点分析、校园生活案例)引导教学关注课程目标,促进教师优化教学策略;另一方面,考试结果需通过数据反馈(如区域能力差异、考生的薄弱环节)为教学改进和教育决策提供依据,实现以评促教、以评促学[9]。测试有用性框架所涵盖的六类测试质量属性之间相互关联、相互制约。例如,一个信度较高的口语测试可能因效度或真实性不足而影响其实际价值。命题者须在各类属性间寻求动态平衡,既要避免过度追求效度导致测试复杂度增加,也要在提升真实性的同时确保可行性。这种系统性考量最终指向以评促教、以评促学的价值旨归。测试有用性框架在提出后的十余年间,逐渐成为指导语言测试效度验证的重要模式,为考试质量评估提供了理论支撑[10]。二、高中英语合格性考试命题评估框架根据课程标准,英语学科的教学与测评需以发展学生的学科核心素养为目标,落实立德树人根本任务。高中英语合格性考试的考查目标、考查内容及实施方式均须体现促进英语学习、优化教学实践、监控学业质量等多重功能[6]。基于此理念,教育部课程教材研究所的高中英语合格性考试研究课题组(以下简称课题组)在系统梳理测试有用性框架等相关理论的基础上,结合课程标准等政策文件,构建了高中英语合格性考试命题评估框架,帮助命题人员把握考查目标与价值取向,并通过系统审视试题质量、对照标准发现问题等方式优化设计,最终实现命题质量的整体提升。课题组构建的高中英语合格性考试命题评估框架主要包含命题导向、命题规划、试卷设计、试题设计、参考答案与评分标准五个部分。(一)命题导向命题导向是试题设计的核心指导思想,它决定了考试的价值取向和考查目标。命题导向涵盖四个评估指标:坚持立德树人、落实依标命题、体现时代特征和引导教育教学。首先,命题应严格遵循立德树人的根本任务,将社会主义核心价值观及中华优秀传统文化融入试题,通过具体题目,增强考生的爱国主义情怀和民族自豪感,让考生通过作答展现理想信念与品德修养。其次,命题必须依据课程标准,确立素养导向的命题思路,合理规划考试目标、内容和形式,确保全面覆盖学生应掌握的知识和技能,并根据课程标准中的学业质量标准科学设定考试难度,在保障考试信效度的同时,体现教育公平原则。再次,命题应反映时代特征,体现习近平新时代中国特色社会主义思想及社会主义现代化建设成就,具有国际视野,关注气候变化等全球性热点问题,及时反映学科前沿动态和社会发展新成果,鼓励学生拓宽知识面和主动探索新兴领域。最后,命题应引导教育教学改革,促进区域高中教育均衡发展,落实五育并举。通过考试检验学生的学习效果,引导其形成健康文明的行为习惯和积极向上的生活态度,同时推动教师优化教学方法,培养学生解决问题的能力,提升学科素养水平。(二)命题规划命题规划是试题设计的基础,它确保了考试的科学性和规范性。命题规划包括命题方案和多维细目表的编制,旨在确保考试既能准确衡量高中学生毕业应达到的基本要求,又能促进学生的全面发展。命题方案必须明确指导思想,结合国家形势、教育评价改革要求及地域教情学情,具体规定命题的方向、原则与重点,以此作为命题的总纲和依据。方案应突出学科素养立意,合理设置学科考试目标、试卷结构与难度,强调基础性,体现合格性水平考试的特点,确保考试的公平性和科学性。多维细目表是命题规划的重要组成部分,其栏目设置应完整,基本要素需齐全。这包括考试目标、考试内容、考试要求(如分值与权重)、评分原则和难度预估等五个方面,所有内容表述均须准确规范,以便于实际操作。核心素养目标应在多维细目表中科学规划,确保覆盖课程核心内容。试题任务须明确,考查内容结构合理,题型与题量布局均衡,分值分配科学,依据学业质量标准设定试题难度,确保试卷设计既科学合理,又能有效评估学生知识掌握情况与综合能力发展水平。合理的命题规划不仅可检验学生的学习效果,更能推动教学实践重视核心素养的培养。(三)试卷设计试卷设计是试题质量的重要体现,直接关系到考试的可行性和有效性。试卷设计涵盖试卷结构和试卷规范两个方面,须全面落实命题方案和多维细目表的预设,涵盖素养、内容、分值和难度结构等要素。试题应从素材、情境、设问、题型等角度科学调控难度,确保区分度合理且科学。应减少机械记忆试题,优化题型搭配。建议试卷中的客观题约占比70%,主观题约占比30%。在试卷规范方面,试卷篇幅要适中,确保大多数学生能够在规定时间内完成。版式设计清晰,字体、字号、标点等应用规范,信息栏、标题、说明完备无歧义。图表、数据等表达准确,图文材料来源可靠且无政治性或科学性错误,图片清晰美观,文字引用合理。试题内容避免重复,选择题选项逻辑关系合理无争议。答题卡填写要求明确,非答题区域标记明显,听力录音语速适中发音清晰。题目编制应遵循语言测试原则,描述清楚、要求明确,确保考试公平公正,真实反映考生能力,确保考试的有效性和科学性。(四)试题设计试题设计质量是评估的核心内容,它直接影响考试的效度和信度。试题设计质量评估主要从试题情境、试题任务及试题的综合性、应用性、开放性等方面展开。首先,试题情境应体现多样性,涵盖人与自我、人与社会、人与自然三大主题,并通过多模态语篇实现类型和呈现方式的多样化。情境材料应真实可信,反映现实生活中的典型现象和问题,同时要贴近学生的实际生活和认知水平,确保复杂度与难度相匹配。此外,情境设置须兼顾公平性,避免因学生生活经验差异(如城乡背景)导致测试偏差。试题应选择普适性更强的语境,或通过题干补充必要信息,确保所有学生基于公平起点作答。其次,试题任务类型应多样化,既要考查学生的基础知识和技能掌握情况,也要评估他们解决实际问题的能力。任务目标应从不同角度和层级考查学生的思维品质发展水平,建议学习理解层次题目(如理解文本简单细节的题目)占40%~50%,应用实践层次题目(如完形填空题中关于词组应用的题目)同样占比40%~50%,而迁移创新层次题目(如根据情境展开书面表达的题目)占5%~10%。任务难度应符合学生的知识范畴和能力水平。最后,在试题的综合性、应用性和开放性上,应设置读写、听写等综合技能试题,题目应能检验学生调动并综合运用各种知识和技能解决问题的能力,包括分析日常生活、学习活动及文化交流中的问题,以培养良好的沟通能力。同时,鼓励学生独立思考,大胆创新,灵活使用所学知识、技能和策略来表达个人认识、见解和看法。(五)参考答案与评分标准参考答案与评分标准的制定是命题流程的重要环节,其科学性直接保障考试的客观性与公正性。参考答案必须与试题卷和答题卷的编号完全一致,确保无缺漏,保证每道题都有对应的解答。答案应正确简明,避免任何政治性、科学性错误或学术争议,并且符合学生的知识范畴和能力水平。对于客观性试题,提供的参考答案应准确唯一;而对于主观性试题,参考答案应表述准确完整、清晰明确,字数合理,示例与设问关系紧密一致,体现试题的开放性特征,同时具有示范性和典型性,以及正确的价值导向。在评分标准方面,需要根据考查目标设置合理的赋分点及相应分值,采用等级赋分与要素分析赋分相结合的方法,以准确评价学生的语言表达能力。对于主观性试题的评分细则,应在充分试评的基础上制定,重点关注学生作答所展现出的核心素养水平。评分标准应体现科学性与公平性,既鼓励学生在考试中真实展示能力与个性思维,也为教师提供明确的教学改进依据。综上所述,高中英语合格性考试评估框架是由五个部分构成的一个有机整体,其各要素的系统汇总如表1所示。三、高中英语合格性考试命题评估框架的应用实践及发现的问题课题组依托构建的评估框架,对2024年全国七份高中英语合格性考试试题质量进行系统评估,并以A省为典型案例开展深入分析,旨在验证该体系的适用性与有效性,揭示高中英语合格性考试的命题特征与存在的问题,为考试质量的持续改进提供实践参考。(一)命题导向课题组从坚持立德树人、落实依标命题、体现时代特征和引导教育教学四个维度对命题导向进行系统评价。A省英语试题具有正确的价值导向,试题在语言能力考查中有效融入了品德修养、文化认知等教育目标。例如,通过介绍首位女性诺贝尔奖得主、健康饮食及中国文学典籍的阅读语篇等传递奋斗精神、倡导良好生活习惯,以及强化文化自信。然而,试题仍存在两方面不足:一是德育渗透不够全面,多数语篇局限于日常话题与基础文化内容,在弘扬社会主义先进文化、培养审美意识和爱国情怀等方面存在欠缺;二是核心素养考查缺乏系统整合,语言能力与文化意识、思维品质、学习能力的关联性不足,对真实语境下跨文化交际能力的考查仍显薄弱。在依标命题方面,试题基本符合课程标准的要求,依据课标理念和要求设计考试形式,通过贴近真实语言使用的听、读、写等任务考查学生的语言运用能力。试卷依托主题语境和语篇材料,侧重语言知识与技能的综合应用。然而,依标命题中仍存在三方面不足:一是学业质量标准水平一要求的口语能力、多模态资源运用及文化素养考查未得到体现;二是考试形式以分项测试为主,缺乏综合性任务设计;三是主题语境覆盖不完整,仅涉及“人与自我”和“人与社会”的主题,欠缺“人与自然”的相关内容。此外,试题在时代性和引导教育教学方面存在明显不足。具体表现为:其中一篇阅读理解的话题“笔记本电脑”过于陈旧,建议替换为AI技术、智能手机或新能源汽车等具有时代特征的内容;听力材料中体育运动和天气讨论等传统话题重复出现,缺乏时尚类等反映当代社会发展的听力素材。试卷虽以主题引领和语篇依托为考查思路,但未能充分体现课程标准要求,内容深度与思维要求偏低,缺乏对创新性思维和问题解决能力的考查,难以有效引导教学方式改革和学生自主、合作、探究式学习的开展。(二)命题规划课题组通过深入分析多维细目表,对命题规划的科学性与规范性开展系统评估。A省的多维细目表尝试整合题型、分值、语境内容、知识点、语篇类型、语言知识、学业质量水平、核心素养、预估难度、题目出处等要素,融入了核心素养导向的设计理念,但仍存在以下三方面问题。首先,关键要素体系不完整,既缺少可操作的考试目标设定和评分标准说明,也未建立清晰的维度划分逻辑,导致各栏目功能定位模糊,难以形成有效的命题指导框架。其次,核心素养与学业质量标准的对应关系缺乏明确界定,语言技能、文化意识等具体素养要求未细化分解,造成考查目标覆盖不均衡,未能全面对接学业质量标准水平一的核心要求。最后,专业术语使用存在偏差,如题型分类未体现功能区分(如未区分理解类和推理类题目),“知识点”等概念内涵界定不清,削弱了细目表对命题实践的科学指导价值。(三)试卷设计课题组从试卷结构和试卷规范两个维度对试卷质量展开评价。值得肯定的方面包括:试卷满分为100分,由客观题与主观题构成,通过题型的科学分配系统覆盖听力、阅读与写作能力的考查需求;学习理解、应用实践与迁移创新三个层次的能力目标均有考查(题目占比分别为54.5%、25.5%和20%),且整体难度梯度较为均衡;试卷篇幅适中,80%的学生能在规定时间内完成;版式设计规范,语言表达严谨,未出现政治性、科学性或文字表述错误。与此同时,试卷也存在三个方面的不足之处:其一,客观性试题占比偏高(80%),略超课题组建议的70%标准,主观性试题占比偏低,可能影响综合语言运用能力的充分考查;其二,试卷素材原创性不足,部分语篇直接引用往年高考题或模拟题(如短文填空题源自高考题);其三,个别选择题存在文字内容与试题素材直接关联的问题(如完形填空题中部分答案直接引用素材中的文字),若考生仅依赖素材中的显性信息作答,可能弱化对语言运用能力的考查,进而影响测试效度与公平性。(四)试题设计课题组从试题情境、试题任务及试题的综合性、应用性、开放性等方面进行试题质量评价。整体上,试题情境设计较为合理。情境材料贴近学生认知水平与生活实际,如英语学习技巧介绍、感谢信写作等;选材兼顾文化多样性,如涉及中国文学等普适性内容;体裁(说明文、记叙文、应用文)具有多样性。然而,试题命制仍存在两方面不足:一是情境呈现方式单一,过度依赖文字材料,缺乏图表、思维导图等多模态资源,不利于学生综合思维能力的发展;二是情境设计的时代感与公平性有待提升,部分题目(如英语角写作)对经济落后地区考生存在背景知识壁垒,且较少结合现代科技、文化交流等贴近现实的场景。在试题任务设计方面,存在类型单一与考查深度不足的问题。试题仅包含选择题、填空题、改错题和写作题四类,侧重基础知识与技能的考查,对语言综合运用能力及高阶思维能力的考查较弱。具体问题包括:一是部分题目设计不合理,如阅读理解题目中采用“Which is true?”的提问方式,实质接近判断题,不符合选择题设计规范。二是选项设置存在缺陷,部分干扰项逻辑牵强,过度使用绝对化表述(如“must”“all”),且出现褒贬对立的选项(如四个选项中包含三个贬义词和一个褒义词)。此类设计易使考生通过选项分布规律而非题干内容判断答案,削弱对语言运用能力考查的有效性。三是题目排列顺序需优化,如阅读理解题目的设置顺序与阅读素材内容的逻辑顺序不一致。综合来看,上述问题在一定程度上影响了测试效度。在试题的综合性、应用性与开放性方面,存在一定局限:一是未曾尝试通过读写联动、听写协同等任务考查学生的综合语言运用能力;二是缺少引导学生通过分析推理解决复杂问题的题目设计;三是开放性表达任务较少,仅写作题为学生提供了一定开放性发挥空间。(五)参考答案和评分标准试卷参考答案与评分标准整体较为规范。客观题答案具有唯一性且能有效区分知识掌握水平,主观题作文评分标准从内容、语言、衔接等维度系统评估写作质量,参考范文的提供有助于统一评分尺度。然而,此部分存在两方面不足:一是改错题评分细则不够完善,未明确“识别错误但存在拼写问题”等特殊情况的处理方式;二是书面表达评分标准表述需进一步具象化,如第五档“具备较强语言运用能力”的描述缺乏可操作性,易导致评分主观性增强,影响评分一致性。总体而言,基于对A省的试卷试题分析,课题组发现,当前高中英语合格性考试命题存在一些共性问题。尽管试卷在基础规范性上表现良好,如遵循课程标准、评分标准清晰、客观题区分度较好,且通过参考范文统一了主观题评分尺度,但整体设计仍显保守。语篇素材更新滞后,部分选题直接引用往届高考题或教辅材料,缺乏反映前沿科技领域的时代性内容;文化融入多停留于传统层面,未能有效拓展国际视野。题目设计对综合能力的考查明显不足,既缺少读写结合、听说结合等跨技能整合任务,应用性题目也多局限于信息提取,较少涉及批判性思维或创新表达。评分细则的可操作性较弱,改错题对特殊错误的处理缺乏明确说明,作文评分中“语言运用能力”等表述过于抽象,容易引发评分主观性偏高的问题。这些现象反映出当前高中英语合格性考试命题在综合性和创新性方面的提升空间依然较大。四、结束语考试命题质量评估是保障教育公平与育人实效的重要环节,其意义不仅在于科学衡量教学成果,更在于为课程改革与教学实践提供有效反馈。本研究参考语言测试有用性框架等理论,结合我国高中阶段教育的现实需求及核心素养导向,构建了契合课程标准的高中英语合格性考试命题质量评估框架。通过对A省2024年高中英语合格性考试的试卷试题分析,验证了该体系在诊断命题质量中的实践价值,也揭示了当前考试设计在素材创新性、能力综合性与评分科学性等方面存在的共性问题。研究表明,唯有建立扎根我国教情学情且符合语言测试理论的命题质量评估框架,才能系统识别命题实践中的问题,并为考试内容的优化提供科学依据。未来需通过建立常态化诊断评估体系,动态优化命题机制,推动考试评价体系实现从知识技能取向向核心素养取向的系统转变,从而构建以评价驱动教学改进、促进学生发展的教育实践路径。参考文献略。
2025-10-23
引用格式:刘欧, Jonathan Rockhind, 王媛, 等. 职业教育与培训国际评估项目PISA-VET概述及启示[J]. 中国考试, 2025(10): 76-84.作 者刘欧,ETS研究院副总裁。Jonathan Rockhind,ETS研究院资深战略研究员。王媛,ETS研究院资深项目经理。Jason Weedon,ETS战略合作副总裁。Michael Ward,OECD资深政策分析师。Marieke Vandeweyer,前OECD资深政策分析师。TSE Chi Sum,OECD分析师。金婧(译),教育部教育考试院助理研究员。摘 要:职业教育与培训在许多国家的经济发展中发挥着重要作用,然而,目前尚缺乏能够反映各国学生职业能力表现的国际评估数据。本文针对PISA-VET这项旨在评估职业教育学生技能和素养的国际大规模测评项目进行整体性介绍。该项目的评估领域涵盖技术知识、职业知识以及可迁移的就业技能三大维度。PISA-VET旨在通过对各国学生的表现进行基准测试来填补数据空白,明确有助于同伴学习的教育实践,促进教育与劳动力市场的衔接,并推动职业教育成为一条重要的发展途径。关键词:职业教育与培训;PISA-VET;职业能力测评;国际大规模测评一、研究背景职业教育与培训(Vocational Education and Training, VET)是一个国家教育体系的重要组成部分[1-2]。尽管目前尚没有一个全球统一的数据可以精确量化VET学生的总体规模,但许多国家都有数量可观的VET学习者。以美国为例,近年来共有超过800万中学生和大学生参加了VET项目[3]。在全球范围内,澳大利亚、中国、德国和瑞士等国已建立起较为完善的职业技术教育体系,为本国学生提供服务。截至2025年,中国接受职业教育的学生人数已超过3000万[4]。此外,VET在未来也具有巨大的发展潜力。例如,德国的VET市场规模预计将从2024年的5400万美元增长至2030年的8700万美元,复合年均增长率达8.3%[5]。现有研究指出,参与VET与高中阶段学生的学业成绩、毕业率、大学入学准备程度以及就业技能均呈正相关[6-7]。德国联邦经济合作与发展部(German Federal Ministry for Economic Cooperation and Development)已将VET发展确立为支持终身学习的关键组成部分[8]。VET不仅有助于满足经济发展对各类技能人才的需求,也为青少年和成人提供了除学术教育之外的另一条发展路径。有证据表明,高质量的职业类课程能够有效促进从学校到职场的过渡,并有助于降低辍学率[1]。有研究预测,VET将通过培养学生适应劳动力市场变化的技术能力与可持续技能,显著影响一个社会未来的劳动力结构[9]。当前,VET体系正在应对数字时代所带来的挑战与机遇,重点包括数字化转型、绿色转型、劳动力市场预测、双轨制教育体系和政策影响等[10-11]。与近几十年来广泛受益于国际大规模评估的普通教育相比,VET的国际可比性评估数据仍较为缺乏。由于此类数据的缺失,各国在评估自身VET体系的表现以及借鉴国际先进经验方面面临一定局限。目前,VET的相关比较数据并不完整,且多局限于入学率和就业结果数据。随着政策制定者对VET数据的需求日益增长,这些数据的重要性不断提升。其不但有助于比较各国之间及VET领域内的相对成果,从其他VET体系的成就决定因素中发现政策启示,还可以用于对不同VET体系的生均教育投入与产出进行对比分析[2]。二、PISA-VET项目概述(一)项目目标经济合作与发展组织(OECD)发起的国际学生评估项目(PISA),对全球90多个国家学生的素养及其在真实情境中应用知识的能力进行有效测评[12]。受此项目启发,PISA-VET致力于适时收集职业教育课程质量和效果的有关数据,比较各国内部及国际VET项目的技能水平,分析学员学习特征差异,并为改进VET课程提供政策建议。通过建立类似于PISA模式的周期性测评机制,PISA-VET将有助于观察课程改革的趋势与影响,并促进同行及国家间互鉴互学。政策制定者、雇主、学生和社会合作伙伴均可从中获取洞见,进而提升VET项目在质量、相关性、公平性和有效性方面的整体表现。PISA-VET的目标之一在于提高职业教育与培训的质量与吸引力。OECD、ETS及其合作伙伴将职业教育视为教育体系的重要组成部分并予以充分重视,致力于使其成为各类学习者的理想选择,包括有志于从事特定职业的青年学生、将VET视为通向高等教育途径的学习者以及需要提升技能或再就业培训的成年人。PISA-VET的另一个目标是为未来的职业教育需求提供前瞻性依据。鉴于技术的迅猛进步,VET相关行业与职业也处于快速发展之中。PISA-VET有助于识别新兴行业的需求,并能够将一套原则性方法应用于当前职业范畴之外的框架构建与评估开发。例如,随着人工智能、数字工具以及其他职业领域(如机器人制造维护技师)重要性提升[13],PISA-VET研究团队正在开发相关领域的测评框架。(二)发展现状在汲取PISA评估经验与VET政策专业经验的基础上,OECD目前已联合澳大利亚、巴西、德国和阿拉伯联合酋长国等多个国家,携手各类VET机构的专家、雇主单位(包括西门子、澳大利亚旅游培训机构)以及全球技能活动项目(如世界技能大赛WorldSkills)主办方,共同开发了一项针对VET项目学习者专业技能进行测评的国际评估项目。该举措依托多项国家及行业层面在职业技能应用评估方面的已有成果,旨在实现这些评估方法的首次大规模跨国比较。2024年,OECD与ETS正式合作启动评估开发工作,目前已在明确PISA-VET中职业专项技能与通用就业能力(employability skills)的测评任务方面取得进展[2]。同时,一系列操作相关问题也在推进中,包括测评任务承载平台的选择、真实场景中表现评估的可行性、不同形式任务的心理测量分析、分数报告设计以及如何协助参与国有效利用评估结果。未来两年内,OECD和ETS将继续与各参与国及领域专家展开合作,探讨以下问题:如何在不同国家间衡量特定VET项目的学习成效?哪些类型的题目最适合评估特定的VET能力?这些评估题目在不同国家之间的有效性与可靠性如何?在这一开发阶段结束时,专家组将起草一份报告回答上述问题,并完成首套经过效度验证的评估工具开发。基于此阶段的成果,PISA-VET将随后进入试点实施阶段。(三)目标群体PISA-VET将重点关注即将在6个月内完成初始职业培训课程的VET学习者,涵盖商业管理、汽修技师、电工、医疗保健、旅游与酒店管理五个专业领域。选择这些职业领域是因其在国际上具有重要的经济价值与增长潜力,相关领域职业教育参与程度较高,从业人员职业生命周期较长,且已有国际公认的框架、职业标准、资格认证和评估工具可供参考,同时能够兼顾职业类型和学习者性别的平衡。之所以把即将完成VET课程的学习者作为评估目标群体,是因为PISA-VET旨在学习者获得首个职业资格证书之前,对其所具备的专业技能进行基准测试。尽管未设置具体的年龄限制,但参与评估的学习者年龄大多在18岁至20岁之间。值得注意的是,部分国家或地区教育体系因非线性的教育路径设置,VET群体中的成年学习者居多;该群体也将被纳入评估范围,并进行独立分析。还有一点需要指出的是,参与评估的学习者技能水平应符合《国际教育标准分类》(International Standard Classification of Education)中的三至四级或《欧洲资格框架》(European Qualifications Framework)中的三至四级要求。这些标准既适用于全日制在校学习的学习者,也适用于校企联合培养模式的学习者。(四)测评框架PISA-VET的核心是一套于2024年3月19日发布的新框架[2],该框架是评估体系的理论基础与发展路线图。它明确了PISA-VET初始阶段需重点关注的五个领域,界定了各职业所需的知识与技能及其评估方式,并制定了测试设计与数据分析的指导原则。PISA-VET框架针对每一个所选职业领域描述了其核心技术能力(core technical capability)。以汽修技师为例,核心能力包括调查能力(如收集车辆信息并据此给出结论、指导后续操作的能力)与修复能力(如制定维修方案以修复损坏、排除故障、满足制造商标准和完成维修要求的能力)。此外,该框架还明确了评估开展的情境(context)。例如,电工专业的评估将在商业与公共区域、家庭及工业环境三类情境下进行。框架中另一个关键维度是流程(processes),它定义了每一职业领域的核心操作流程。以商业管理为例,其流程包括信息识别、信息与情况分析、知识与技能应用以及对相关问题进行评估和反思[2]。表1展示了一组商业管理领域的任务示例,涵盖了该职业所要求的全部能力、流程和内容知识。(五)目标技能鉴于技术的快速发展和专业技能生命周期的不断缩短,未来的VET人才需同时掌握专业技术与就业技能,以适应劳动力市场的动态变化[14-15]。为全面把握未来劳动力所需的知识与技能,PISA-VET将在评估中同时涵盖职业技能和就业技能两大维度。职业知识及技能主要针对与五个选定职业领域密切相关的技术性与专业性能力,就业技能则涵盖使VET从业者能够在各种工作环境中高效开展工作的通用技能。PISA-VET就业能力评估体系包括四种技能:一是读写能力(literacy),国际成人能力评估调查(Programme for the International Assessment of Adult Competencies,PIAAC)将其定义为通过获取、理解、评估与反思书面文本,以实现个人目标、发展知识体系与潜能,并参与社会活动的能力[16];二是问题解决能力(problem solving),参考PIAAC第二轮评估中对“适应性问题解决能力”(adaptive problem solving)的界定,指个人在缺乏现成解决方案的动态情境中实现目标的能力,该过程涵盖定义问题、搜集信息、在多样化的信息环境和具体情境中实施解决方案等一系列认知与元认知活动[16];三是任务完成能力(task performance),依据社会与情感能力测评(Survey on Social and Emotional Skills,SSES)的定义,涵盖责任感、自我控制、勤奋、实现目标的动力和毅力[17];四是协作能力(collaboration),同样依据SSES的定义,指关注理解他人、共情关怀、冲突管理、维持积极人际关系和建立信任等社会能力[17]。(六)测评方式PISA-VET将采用三种主要形式来评估学习者的职业技能,包括知识选择题、模拟任务及现场演示。1.知识选择题知识选择题是对VET学生专业领域知识掌握情况的传统评估方式,每道题目设有四个选项,其中仅有一个为正确答案。该类题型在考查学生对分散知识点的识记与理解方面具有较高效率,但在评估复杂问题解决能力方面则存在不足[18]。2.具有交互特征的模拟任务鉴于VET领域中诸多职业的复杂性,模拟任务为评估VET从业人员在解决实际工作问题中的技能提供了有效途径,如提供汽车维修服务、在医院护理病人或在酒店应对客户需求等。交互式模拟有助于衡量以实践为导向的技能以及在具体情境中应用学科知识的能力,能够通过简化的形式呈现VET从业者所需掌握的工作流程。与选择题型的知识评估相比,模拟任务更具真实性,能够捕捉问题解决过程中更为细微的认知与行为表现[19]。PISA-VET中所采用的模拟任务将根据德国ASCOT(Technology-Based Assessment of Skills and Competencies in VET)专家组开发的测评模拟任务原型进行修改。ASCOT 是一项由德国联邦教育与研究部(German Federal Ministry of Education and Research)资助的研究计划,主要目标是改进评估,特别是VET能力的数字化评估。ASCOT通常侧重于真实情境中的工作要求来开发模拟任务,以全面评估学习者的专业技术能力与跨领域综合素养[20]。尽管模拟任务在能力评估方面具有潜在优势,但在开发与评分环节仍面临两个主要挑战。其一,因需真实呈现问题解决过程,交互式模拟任务比传统的静态评估开发难度更高。其二,相较于选择题对分散知识点进行评分,问题解决能力的评估更为复杂,需依靠内容领域与评估领域专家的专业判断来制定严格的评分标准[21]。3.现场演示任务六十多年来,世界技能组织(WorldSkills International)一直致力于开发基于专家评判的职业特定技能现场演示评估。在世界技能大赛中,来自全球各国的参赛团队需要通过现场演示解决复杂的专业性工作任务,以此展示专业能力[22]。此类演示任务主要用于评估情境判断、决策制定等复杂技能,以及个体在真实工作环境中的操作流程与行为表现等。评分标准由专家评委制定,通常包含客观评价(如某项指标是否达成)和主观评价(如专家对最优解决方案的判断理由)。因为其能够在最大程度上反映实际工作环境中的任务执行情况,现场演示任务通常被认为是最具真实性的评估方式;同时,由于能够直接反映VET学习者的能力水平,其在分数解释方面效度最高,相关评估可以直接关联受过培训的VET从业者在实际职业环境中的表现。然而,与任何评估方式一样,现场演示也存在一定的局限性。其高度真实性要求评估场景须完全模拟真实职业环境,因此在大规模组织实施方面面临挑战。例如,在世界技能大赛中,汽车技术类项目要求选手使用真实车辆进行操作。同样地,如果是直升机维修项目,则需调用真实的直升机。酒店接待类项目则需安排演员扮演客人与选手进行互动。可以想见,这种高度仿真的评估方式需要投入大量资源并进行周密的组织安排。另外一项挑战是评分。由于多项评估环节具有非标准化特征,通常需要多名专家评委共同参与制定评分标准并进行实际评分,以确保评分结果的一致性[2]。三、下一阶段评估计划目前,OECD与ETS正在共同推进PISA-VET的设计开发。已有14个国家同意参与该阶段工作,其中澳大利亚、巴西、哥伦比亚、德国、希腊、葡萄牙和阿拉伯联合酋长国将作为数据采集国,比利时(佛兰德地区)、爱尔兰、蒙古、荷兰、土耳其、英国和美国作为非数据采集国。数据采集国将在五个选定的VET领域分别招募300名学生,开展实地试测评估;非数据采集国则作为扩展专家组成员,为PISA-VET的概念框架与评估设计提供反馈并参与论证。在全面开发阶段启动之前,ETS将在两个国家针对1~2个职业领域的少量职业能力题目进行用户测试,并同步开展认知访谈。该举措旨在深入了解VET学习者在回答问题时的思维过程。访谈将收集学习者对题目的内容相关性、表达清晰度、评估难度以及整体测评体验的反馈意见。所获取的有关认知负荷、可用性与可行性的反馈数据将用于优化下一阶段的评估工具。完成认知访谈后,将进入全面开发阶段。为此,已组建了一个由ASCOT与ASCOT+项目开发团队、世界技能大赛命题专家,以及来自政府部门、研究机构、私营行业与国际组织的140余名技能与评估领域专家构成的专家小组。该专家组将为评估任务的选择提供建议,以确保评估内容在代表性、文化相关性、与测评框架的一致性方面达到预期标准。评估工具完成开发并通过审查后,ETS将针对PISA-VET选定的五种职业类别,在每个参与国招募300名学生开展实地测试。对于选择题和数字模拟任务,将采用心理测量方法进行分析,以评估题目信度、难度和区分度,以及不同知识与技能领域之间的相关性。现场演示任务也将采用心理测量分析,以验证其信度、多评分者间的一致性,以及该类任务得分与其他评估模块得分之间的相关性。开发阶段的测试结果将以两份报告的形式呈现。第一份是方法论报告,主要用于记录测试的技术性发现,也包括各参与国的具体结果以及跨国比较。第二份是操作性报告,旨在为试点阶段提供实施框架,包括抽样设计、测试设计、报告要求和实施信息。考虑到参与国分布于全球各地,所有评估内容将被翻译为相应目标语言,并进行适当本土化调整,以确保评估在语言、心理及文化维度上的适宜性。目前,项目团队正在研究可用于施测、评分及生成分数报告的技术平台。其中,重点考量的功能包括能否支持复杂模拟任务与交互式题型、是否具备整合现场演示任务数据的能力以及是否允许考生在模拟任务中回溯并修改先前答案。四、PISA-VET对中国职业技术教育的影响与启示近年来,中国职业教育与培训规模迅速扩大。2023年,全国接受职业教育的学生总数超过3400万人,其中中等教育和高等教育阶段的人数各占约一半。截至同年,职业教育毕业生人数累计约1100万,占城镇新增就业人口的45%。在先进制造业、战略性新兴产业和现代服务业等新增就业岗位中,职业教育毕业生占比超过70%。同时,职业教育教师队伍也持续壮大,从2012年的130万人增长至2023年的145万人[11]。2026年,世界技能大赛将在中国上海举行。OECD和ETS已与世界技能组织建立战略合作伙伴关系,并将借鉴其在职业技能评估与竞赛方面的成熟经验,推动PISA-VET的开发工作。此次在上海举办国际赛事,为政府机构、教育组织与行业企业等利益相关方提供了一个深入了解PISA-VET宗旨的机会,并可以探讨中国相关组织机构以知识合作伙伴身份参与该项目、贡献中国方案的可能性。中国政府投入了大量资源发展职业教育与培训,因此监测学生在职业技能及更广泛的就业能力方面的学习成效显得尤为关键[23]。PISA-VET为全面评估学生学习成效提供了一个具有广泛应用前景的框架,不仅涵盖从事技术性工作所需的专业知识与技能,还关注实际工作中需要的可迁移能力,如沟通协作与问题解决能力等。此外,PISA-VET采用多种测评方式,以全面反映职业教育与培训学习的复杂性。目前,中国的职业教育评估仍主要聚焦于特定岗位所需的专项技能,对就业能力的关注相对不足,而这些能力对于职业教育学生在未来不断变化的工作环境中实现可持续发展具有重要意义。鉴于此,PISA-VET为中国政策制定者、教育者及研究者在评估职业教育成效时提供了更全面的能力维度参考,并可能进一步影响课程设置与教学实践的改革方向。此外,受以选择题为主的传统评价方式影响,中国的职业教育评估仍主要依赖标准化的纸笔测试形式[24]。PISA-VET则提供了一个能够融合多种评估形式的理论框架与操作模型,既能保证测评效率,也可兼顾对真实性任务的测评需求。通过模拟任务和现场实操演示,学生将得以展现自己应对复杂工作情境及实施最优技术解决方案的能力。PISA-VET还为职业教育机构提供了更好地对接雇主需求的机会,尤其是在应对未来技能需求变化方面。界定人工智能时代的职业所需核心知识与技能时,职业教育培训者与雇主应在人才培养目标与学习成效证明方面达成共识。PISA-VET所强调的技能可进一步强化教育体系与劳动力市场之间的衔接,中国的职业教育与培训项目也可由此设计出与雇主需求更相匹配的课程。当前,不少中国职业教育课程仍偏重职业知识与技能的传授,未能系统培养学生的通用就业能力,导致学生易被视为“技术容器”或“高级机器人”[25]。PISA-VET的评估结果可为职业教育管理者提供参考,以评估课程与教学在现代化改进方面的需求,系统规划如何将就业能力融入培养与评价体系,从而培养兼具专业素养与精湛技艺的人才[25-26]。PISA-VET的一个主要目标在于为参与国家及地区提供政策层面的参考依据。同时,该评估结果也可作为学生建立技能档案的依据,能够系统记录其所掌握的核心知识与技能。在雇主日益倾向于以技能为本(skills-based)进行招聘的背景下,技能档案有助于促进学生从学校向职场的顺利过渡。随着越来越多的雇主从“唯学历”的招聘标准转向以技能为本的招聘策略和内部人才培养发展机制[26-27],学生也需要通过成绩单以外的非传统途径来展示自身能力。目前,中国已有部分学校和企业在这方面展开初步探索。例如,北京商学院推出了“职业素养护照”;苹果(中国)有限公司则推出了学习档案袋。然而,有研究指出,这种质性评估方法的主要局限在于其结果缺乏可比性[28]。由于在识别与归类学生行为、选取能力指标和确定基准方面难度较大,这些方法高度依赖于评分者间的一致性,操作上面临较大挑战。面对这些挑战,PISA-VET提供了一种更具可操作性的解决方案,即通过让学生参与具有明确国际标准的评估任务,展示自身能力,从而为其职业技能与素养提供具备高信效度和可比性的证明。参考文献略。