首页    >    教育资讯
专家笔谈之一 ∣ 杨卫:教育评价的三重境界: 从竞争力到领导力的进阶之路

2025-06-13

引用格式:杨卫, 郑泉水, 侯杰泰, 申继亮, 刘坚, 刘益东.  以教育评价改革助推教育强国建设(专家笔谈)[J]. 中国考试, 2025(6): 15-26.编者按:教育兴则国家兴,教育强则国家强。2025年1月,中共中央、国务院印发《教育强国建设规划纲要(2024—2035年)》(以下简称《强国纲要》),对加快建设教育强国做出了全面战略部署。《强国纲要》明确了到2027年和2035年我国教育发展的主要目标,提出了九个方面的重点任务。在此背景下,由中国教育发展战略学会教育评价专业委员会和湖南师范大学联合主办的“第四届教育评价学术年会”于2025年3月28日至30日在湖南长沙召开,会议主题为“以教育评价改革助推教育强国建设”,共计800余位教育行政部门领导、专家学者、教师和研究人员到会交流,讨论内容涵盖高等教育评价改革、职业教育评价、基础教育评价、区域教育评价、数智赋能教育评价、教育评价牵引高校人才选拔与培养等多个专题领域。在专委会秘书处协助下,本刊整理摘编了大会特邀主旨报告的六位专家发言要点,汇总为一期专家笔谈,以飨读者。作 者杨卫 浙江大学教授,中国学位与研究生教育学会会长当前,全球教育格局正经历深刻变革,我国教育评价体系亦面临人才培养从“量”到“质”的转型。如何构建兼具公平性、专业性、科学性的评价机制,成为学界与政策制定者共同关注的焦点。笔者从评价基础、方法分类、境界进阶及现实挑战四个方面展开讨论,以期为完善中国特色教育评价体系提供理论参考。一、教育评价的基础:公平性与专业性的双重基石教育评价体系的构建需要以公平性与专业性两大核心原则为根基。公平性是评价结果得到广泛认同的前提,缺乏公平的评价容易沦为“人气竞赛”,丧失公信力;而专业性则要求评价主体与内容高度适配,即“专业人做专业事”。在此基础上,评价体系还需兼顾成长性,通过方法创新提升对颠覆性成果的包容性、适用面的广度与深度,以及评价结果的实际影响力。评价方法可类比于法学体系中的规则法与案例法两大范式。规则法强调自上而下的标准化框架,注重客观性、逻辑性与普适性;案例法则依托典型案例的动态修正能力,凸显专业性与灵活性。实践中,多数评价体系介于二者之间,形成主客观交织的混合模式。例如,高校教师绩效评估从完全量化的KPI(关键绩效指标)转向专家调整的柔性指标,正是规则法与案例法结合的典型尝试。二、教育评价方法的分类图谱与实践演进现有评价方法可归纳为从完全客观到高度主观的连续谱系。完全客观刚性评价以量化考核为代表,优势在于标准化,但容易忽视学科差异性,如文科成果可能因经费、专利等指标难以量化而处于劣势。为弥补这一缺陷,专家调整的柔性指标应运而生,通过专家介入修正刚性体系的不足,提升学科适配性。进而言之,规则导向的客观筛选强调程序正义,如首轮“双一流”学科评选通过专家制定规则后导入数据完成,但其局限性在于规则制定初期缺乏数据支撑。相比之下,主客观混合机制更趋平衡,常见于大学排名与学科评估,既依托客观数据,又纳入专家意见。在一些评审中,深度数据支持的专家评审(如学术期刊审稿)与同行评议(如国家自然科学基金函评)逐渐占据主导,前者以数据辅助决策,后者则依赖专家主观判断。对于涉及人才选拔与晋升的评价,前置条件约束的专家评审成为主流,如职称晋升与学位答辩需在限定框架内行使裁量权。而无规则的专家评议则完全依赖专家经验与直觉,如重点研发计划评审等。这一分类表明,评价体系的科学化并非追求绝对客观,而需在规则与弹性、数据与经验之间寻求动态平衡。三、教育评价的三重境界:从竞争到引领的跃迁教育评价的终极目标在于推动教育机构实现竞争力、持续力与领导力三重境界的跃迁。第一境界为竞争力,体现为机构在特定领域的不可替代性。其核心要素包括特色鲜明、发展动能强劲与真材实料。特色需在某一赛道形成“硬核优势”,如理工科大学的尖端技术突破;发展动能则强调成果增速,如中国学术产出的全球占比跃升;真材实料要求成果真实可信,资源扎实可靠。此阶段评价聚焦“专项一流”,通过量化指标凸显比较优势。第二境界为持续力,标志着机构超越竞争逻辑,转向生态系统的健康度。评价重心随之调整为可持续发展能力、高质量内涵建设与文化包容性。可持续发展摒弃“唯排名论”,关注学科、团队与教育的长期质量;高质量内涵建设涵盖跨学科融合、原创理论产出等;文化包容性则需尊重多元标准,避免“一刀切”抑制创新。例如,当前我国顶尖高校如北大、清华等已初具生态型特征,但仍需深化结构性改革。第三境界为领导力,是教育评价的最高境界。其表现为全球教育中心地位的确立、哲学高度的价值引领与范式输出能力。全球教育中心需吸引顶尖师资与学生,孕育新学派与新理念;哲学高度则要求成为真善美价值观念的策源地,如古希腊学院或我国春秋时期的稷下学宫;范式输出能力体现在制定国际标准与主导议程设置方面。此境界尚无现代高校完全达成,但应成为长远愿景。四、现实挑战:“五唯”痼疾与评价体系的破局重构“五唯”(唯分数、唯升学、唯文凭、唯论文、唯帽子)是当前评价体系的主要顽疾,其问题症结在于“唯”——单一化导向导致创新受限、学科失衡与人才异化。破解之道需从三个方面入手。首先,构建谱系化评价标准。依学科、岗位差异设计多元指标,如文科重思想性与社会影响,理工科重技术转化与应用价值。其次,动态优化“帽子”体系。人才称号应服务于教育评价生态体系建设,避免异化为资源垄断工具,可探索简化谱系、强化流动性。最后,强化过程性评价。要关注成果背后的社会价值、教育贡献与长期影响,而非仅注重数量化产出。教育评价的本质是教育价值观的具象化。从竞争力到领导力的进阶,不仅需要方法论的创新,更需哲学层面的反思——评价应服务于人的全面发展与社会的可持续进步。未来,我国教育评价体系可进一步借鉴规则法与案例法的优势,构建兼具刚性底线与弹性空间的“韧性评价模式”。唯有如此,方能为全球教育治理提供中国智慧,推动教育真正迈向真善美的理想境界。参考文献略

专家笔谈之二 ∣ 郑泉水:破界创生:数智时代 创新人才培养与评价的新范式

2025-06-13

引用格式:杨卫, 郑泉水, 侯杰泰, 申继亮, 刘坚, 刘益东.  以教育评价改革助推教育强国建设(专家笔谈)[J]. 中国考试, 2025(6): 15-26.作 者郑泉水清华大学钱学森班首席教授,深圳零一学院创始院长当今数智时代,科技的飞速发展正深刻改变着人们的生活与教育。人工智能、大数据等新兴技术的广泛应用,使得许多传统知识与技能逐渐被数字智能所取代。在这样的背景下,未来的教育评价应如何适应时代的需求,培养出真正具备创新能力和个性化成长的高素质人才?创生教育理念可以提供一个答案。一、传统教育评价的局限性与个性化成长的困境传统教育评价体系往往侧重于对知识掌握程度的考查,以考试成绩为主要衡量标准。这种评价方式在一定程度上能够筛选出基础知识扎实的学生,但其局限性也日益凸显。首先,它无法全面衡量学生的综合素质与个性特长。每个学生都是独一无二的个体,拥有不同的兴趣、特长和潜力,传统评价试图用一把尺子去衡量所有人,这无疑会压抑学生的个性发展。其次,这种评价方式容易导致学生过度追求分数,忽视对知识的深入理解和应用能力的提升。许多学生为了在考试中取得高分,往往采取死记硬背、刷题等机械式学习方法,缺乏对知识的真正理解和创新思维的培养。在数智时代,这种局限性更加明显。随着人工智能等技术的发展,许多重复性、规律性的知识和技能将被机器取代。未来社会需要具备创新思维、社会适应技能和解决复杂问题能力的人才。然而,传统教育及其评价体系难以培养出这样的人才。例如,美国有超过400万的Z世代(通常指1995年至2009年间出生的一代人)大学生,他们虽然接受了高等教育,但却面临就业困境,其教育经历未能提供充足的个性化成长空间,没有培养其适应未来社会的能力。二、创生教育理念的提出与实践创生教育强调以创生为内生动力,鼓励学生自主探索、获取资源,促进学生创新能力的提升和个性化成长。未来的教育评价不应仅关注学生的知识掌握程度,而应更加注重学生的综合素质、创新能力和社会适应能力的培养。清华大学钱学森班长达16年的人才培养探索便是一个成功案例。钱学森班的学生从清华大学优秀学生中经二次选拔产生,本身已经具备较高的学术水平和综合素质。钱学森班的培养目标是让每个学生都能在个性化成长的道路上取得成功,培养他们的自信和创新能力。以个性化的研究课题、丰富的学习资源和自由的学术氛围为依托,钱学森班的学生在创新能力和个性化成长方面取得了显著成果。许多学生在本科阶段就开始进行自己的研究项目,取得了优异成绩,并在国内外学术会议上发表研究成果。创生教育理念已推广到南昌大学等其他高校,这些高校也创办了类似钱学森班的实验班,取得了良好效果。这些实验班的学生在个性化成长和创新能力方面表现出色,证明了创生教育理念的可行性和有效性。三、X型学生与A型学生:教育评价的两种路径在创生教育理念中,学生可以分为X型和A型两类。X型学生指具有探索精神、敢于冒险、注重个性化成长的学生。他们善于发现自己的兴趣和特长,勇于尝试新的事物,不拘泥于传统的学习方式和评价标准。而A型学生则指那些追求完美、注重成绩、按照传统教育模式学习的学生。他们在学习过程中往往更加注重分数和排名,力求在每门课程中都取得优异的成绩。传统教育评价更适合A型学生,而创生教育理念则更注重培养X型学生。X型学生在个性化成长和创新能力方面具有更大潜力,能够在未来社会中更好地适应变化、解决复杂问题。然而,目前的教育评价体系却往往压抑X型学生的发展,使他们逐渐变成了A型学生。因此,我们需要改变教育评价方式,为X型学生提供更大的发展空间。高考作为我国最重要的教育评价方式之一,对学生的成长和发展具有深远影响。高考改革是实现创生教育理念的关键。具体来说,高考应创新试题设计,更加注重考查学生的思维能力和创新能力。通过这种方式,可以为X型学生提供更多机会,使其在高考中脱颖而出。此外,还应重视高考评价的多元化。高考评价不应仅局限于考试成绩,还应包括对学生的综合素质、创新能力、社会实践能力等多方面的评价。通过多元化的评价方式,更加全面地衡量学生的能力和潜力,为学生的个性化成长提供更多机会。四、创生教育的未来展望创生教育理念提供了一种全新的教育评价和人才培养模式。它强调以学生为中心,注重个性化成长和创新能力的培养,为学生提供更多的发展空间和机会。在未来的教育改革中,应积极探索创生教育理念的实践应用,推动教育评价体系变革。关于创生教育的理论基础和实践指南,均整理于笔者的《破界创生:从清华钱学森班到深圳零一学院的创生教育》一书之中[1]。希望更多的教育工作者和学者关注创生教育理念,共同推动教育改革的发展,为我国培养出更多具有创新能力及个性化成长的高素质人才,为我国在全球科技竞争中取得优势地位提供人才支撑。参考文献略

专家笔谈之三 ∣ 侯杰泰:数据驱动下的教育变革:PISA测评的启示

2025-06-13

引用格式:杨卫, 郑泉水, 侯杰泰, 申继亮, 刘坚, 刘益东.  以教育评价改革助推教育强国建设(专家笔谈)[J]. 中国考试, 2025(6): 15-26.作 者侯杰泰,香港中文大学原副校长,教授。通过全面深入地分析国际学生评估项目(PISA)的研究数据和实证结果,可以对全球教育系统进行深度解构[2],这为我国教育改革提供了多维度的镜鉴。笔者从资源投入、教育均衡、教学效率、技术应用、教育生态优化五个方面,系统梳理PISA测评数据所揭示的教育发展规律。一、教育资源的投入和配置与学业成就之间存在明显的边际递减效应多年的PISA测评数据显示,教育投入与学业成就之间并非线性相关,而是呈现显著的边际递减效应。以PISA2022测评为例,OECD参测成员国家/地区的平均数学成绩为472分,平均教育投入为每年102612美元[3]。以教育投入为横坐标、数学成绩为纵坐标,进一步构建所有参测国家/地区的数学成绩与教育投入的关系。可以看到,数学学科在生均投入每月4500元人民币以下(2018年PISA约为3000元人民币)时,投入越多成绩越好,但达到该阈值后其边际效益锐减,这时怎样使用教育经费比教育资源投入多少更为重要。显而易见,我们可以采用同一分析方法找出我国三十多个省市的扶贫线(阈值),在阈值以下是资源越多成绩越好,超过阈值之后即为怎样用钱比增加投入更为重要。此外,通过分析瑞典、新加坡等一些私立教育占比较高以及高社会经济地位孩子更为集中的学校发现,过度依赖私立教育可能会削弱公共教育质量,这对不同地方及我国民办教育规范发展具有警示意义。二、教育均衡发展的双重维度综合PISA2018、2022国际比较研究发现:芬兰、挪威、丹麦等国学校之间能力差异非常小,教育基本达到区域均衡。然而,由于这些学校并不依据学生能力选择学生,即能力不同的学生被随机分派到不同的学校,因此所有学校的校内学生能力差异都非常大。如果教师不额外采用超强力度协助学习能力较差的学生,则“不能放弃任何一个学生”“一个都不能少”等目标很难实现。例如,英国、美国、芬兰等国家的学校内差异极大,所有学校都有不少能力极差的学生。而在亚洲的很多地方,如日本、中国的京沪苏浙、新加坡等因为有小学升中学的考试或中考制度,所以导致学校之间能力差异甚大。相较而言,因为不同能力的学生被分流到不同的学校,所以学校内的学生能力差异较小。此外,校内差异程度在亚洲不同地方的表现不同,如我国京沪苏浙地区的校内学生能力差异显著低于其他地区。通过调查发现,京沪苏浙地区的学生即使是能力稍弱,也会通过自身努力或在老师监督下取得较大进步,从而降低校内差异,这是他们的明显优势。为了更好地促进我国教育均衡发展,在借鉴PISA测评结果的基础上,我们可以比较及监察不同省市在优质、均衡、学校间、学校内的各种能力差异,以了解不同地区的教育质量及支持系统。三、学习效率及成绩的代价学习效率是PISA测评的一项重要考查内容,通过测评分数除以校内外学习总时间得到该项分数,即计算PISA每一分的成绩需要学生每周学习多少小时。以PISA2015、PISA2018测评成绩为例,OECD参测国家/地区的学习效率存在明显差异。由结果可知,各参测国家/地区在学校上课时间差别不大,但课外用于学习的时间差别很大。其中,芬兰教育系统以每天极短的课外功课时间实现了学业成就的高效产出,学习效率显著高于其他国家/地区;亚洲(中国澳门除外)学生所用学习总时长较长,但平均学习效率处于中等水平;我国参测四省市的校内外学习时间均处于较高水平,其平均学习效率处于中等偏下位置。由此推测,我国四省市的部分地区存在以时间换分数、学习效率低下等现象[4],但这并不是说我国学生学习更为迟缓,而是反映了学习边际效应递减将整个学习效率拖低的事实。例如,很多学生学习一个小时就已经可以达到90分,但要想达到92分还需要再多学10个小时。四、善用信息技术二十世纪九十年代末,计算机开始进入学校教育,教育界开始试行并推动将信息科技应用于教育领域。通过比较PISA2000至PISA2012这十多年间学生的阅读素养成绩与在学校使用计算机完成作业的学生占比情况可知,使用计算机完成作业的学生占比越高,其阅读素养成绩反而呈下降趋势。由此可知,计算机进入校园以后,并不一定能提高学生的学习能力,因此还要不断地研究及监察使用计算机及科技与教育之间的关系。近年来,随着ChatGPT等生成式人工智能(AI)的高速发展,一些国家紧急制定了相应的管控政策和要求,揭示了高科技技术的双刃剑效应。例如,澳大利亚在2024年11月发布公告禁止16岁以下青少年使用社交媒体;新加坡发布了严格的屏幕使用指南[5]。对此,我国教育领域亟须建立AI应用分级管理制度,如在基础教育阶段侧重思维、创意培育工具开发,高等教育阶段强化技术、态度、伦理教育,同时还要特别要警惕生成式人工智能对元认知能力发展的潜在影响,构建教育领域正确使用、定向开发、过程监控的人工智能应用框架。五、教育生态的系统优化在PISA调查问卷中,当提问学生“30岁可能在做什么工作”时,不同国家/地区的学生作答情况差异较大。例如,美国15岁学生中认为自己30岁时会从事科技领域工作(工程、科学、医疗卫生、计算机等)的人数占比高达37%,但他们的科学素养成绩是整体较低的;加拿大、英国、新加坡学生认为自己会从事STEM(科学、科技、工程、数学)工作的也很多,占比约为30%。这种科学素养与就业领域的非对称性特征,可能与不同国家/地区特有的科技创新生态系统密切关联,学生认为科学素养能帮助他们今后的工作及学习,并认为无论将来做什么工作,都需要科学素养。反观我国参测学生可知,学生整体的科学素养得分很高,但愿意在30岁时参与科技工作的人数却很少。由此说明,学生对科学学科的兴趣和素养并未转化为职业倾向和职业选择,他们认为科学成绩只是申请大学的工具,今后从事的工作并不一定与科学相关。实际上,现在的工作几乎都离不开科技成果的使用甚至开发,如教师要学习使用新的智慧课堂软件。因此,我国学生对科学素养的消极态度容易导致未来科研人才的流失,这种现象值得教育领域人士深思。没有实证数据,很难判断谁的意见或猜想更为准确。PISA研究展示了多种非常有启发性的研究分析方法,借鉴这些方法可以比较我国不同省市地区的教育情况,从而更深入、精准地进行教育改革,以推动我国基础教育向更高质量、更可持续的方向发展。参考文献略

黄锡汝 等:初中科学实践课堂评价的困境、方向与路径

2025-05-21

引用格式:黄锡汝, 周文叶, 顾亭亭. 初中科学实践课堂评价的困境、方向与路径[J]. 中国考试, 2025(5): 44-52.作 者黄锡汝,女,华东师范大学课程与教学研究所在读博士生。周文叶,女,华东师范大学课程与教学研究所教授。顾亭亭,女,华东师范大学课程与教学研究所在读硕士生。摘 要:科学教育在提升国家科技竞争力、培养创新人才的过程中发挥着基础性作用。随着我国教育评价改革的推进与科学课程学习方式的变革,科学实践愈发受到重视,课堂评价和学业成就评价方式也需随之革新,其核心在于通过实践性评价捕捉学生做中学、用中学、创中学的实际表现。然而,当前科学实践课堂评价中存在认知理解偏差、方法工具匮乏等问题。为解决这些问题,评价目标需从传统的知识掌握向问题解决能力培养转变,评价内容需从低阶单一向高阶融合转变,评价方式需从纸笔测验向表现性评价转变。实践课堂评价改革应从制订多类型评价目标、设计表现性评价任务、开发高质量评分规则等举措入手,确保评价的科学性和有效性,提升科学实践的育人成效。 关键词:科学实践;课堂评价;科学素养;科学教育;教育评价改革科学教育在提升国家科技竞争力、培养创新人才的过程中发挥着基础性作用。《教育强国建设规划纲要(2024—2035年)》提出要加强科学教育,注重学生的科学素养培养。在这一宏观背景下,科学实践显得尤为重要,它是落实素养导向的科学课程与教学的有效途径,在学生科学素养的发展中发挥着关键作用。《义务教育科学课程标准(2022年版)》(以下简称新课标)明确指出,义务教育科学课程是一门体现科学本质的综合性基础课程,具有实践性[1]。新课标将“探究实践”确定为科学课程的核心素养内涵之一,倡导以探究和实践为主的多样化学习方式,让学生主动参与、动手动脑、积极体验,经历科学探究以及技术与工程实践的过程[1]。实践取向的科学教育需要新的课堂评价和学业成就评价模式,以评估学生在日常实践活动中的表现,以及是否具备解决现实问题的实践能力[2]。然而,初中阶段的科学实践如火如荼,其课堂评价却未能同步跟进。沿袭传统模式的课堂评价,既不能有效衡量学生在科学实践中的综合能力,从实践取向上反映学生真实素养水平,也不能提供有效的评价反馈以帮助学生改进其在科学实践中的表现,发挥促进学习的作用。在此背景下,本文尝试剖析当前科学实践课堂评价所面临的问题与挑战,分析课堂评价难以有效促进学生科学实践能力发展的原因,并在此基础上,从理论角度阐明其改进方向,提出具体的改革路径建议,以期为优化初中科学实践课堂评价、提高学生科学素养提供参考。一、科学实践课堂评价的现实困境 科学实践让学生通过具身参与主动进行知识建构,体验知识由何而来、去往何处,在学习和运用科学知识的过程中体悟科学的价值与实践的意义,形成科学观念、掌握思维方法、发展探究能力、树立责任态度。它强调学习不是根据预先设定按部就班进行,而是一种不断生成和修正的状态,是一个动态、弹性、可持续的过程[3]。 然而,由于部分教师对科学实践的认知较为形式化和浅表化,重知识轻能力、重理论轻实践的知识教育观仍普遍存在。譬如,有研究发现,调查样本中90.9%的八年级物理教师认为知识的理解与应用在科学素养中至关重要;认为数据的收集与分析等实践要素应占据重要地位的教师仅占15%[4]。这种认知失衡导致课堂教学呈现出知识本位特征。在实际课堂教学中,科学基本事实和基础知识的教授依然占据主要地位,科学实践往往流于形式[5],得不到充分展开,“教”而非“做”的现象较为普遍[6]。因此,针对科学实践的评价往往侧重于将对科学基本事实和基础知识的掌握程度作为衡量学生科学实践能力的标尺,忽略了对学生实践表现的综合性评价[7]。有研究指出,在科学实验类活动中,课堂评价多以一问一答、一问多答等形式进行,教师发起的师生对话占92.4%,大多数问题由教师主导提出,其中封闭性问题占92.8%[6]。这种评价导向不仅无法全面反映学生真实的科学素养水平,更可能抑制学生实践能力的发展,造成“重教轻学”现象。 此外,目前大多数教师使用终结性测评工具对科学实践进行评价,存在对学生的学习结果做出对/错、优良等简单评价、忽视学生在过程中的表现、缺少形成性评价等问题[8]。教师往往依赖于通过纸笔测验进行评价,不仅评价方式单一,也背离了科学实践本质,难以评估学生的实际能力表现[9]。纸笔测验所遵循的标准化测量范式与科学实践所需的情境化评价要求存在根本性错位,无法全面评估学生的实验设计、数据解读等综合实践能力。对此,有学者尝试引介国外科学实践相关评价工具,如美国针对科学实践设计的课堂评估任务模板(Integrating Science Practice into Assessment Tasks)等[2]。但由于国情和教育理念差异、教学情境适配性等问题,这些工具并未能在我国实现本土化转化应用。评价方式和工具的缺乏,使得教师在对科学实践这一学习方式进行评价时无从下手,大多数教师依然沿用传统评价方式。即使一部分教师尝试针对科学实践进行评价设计,但由于缺乏高质量的评价案例参照,质量也往往良莠不齐。有研究者在实际调研中发现,科学实践评价量规形同虚设的现象较为普遍[10]。 总之,当前科学实践课堂评价主要面临两大现实困境:一是教师对科学实践的认知存在偏差,导致评价无从下手;二是科学实践缺少与之相匹配的有效评价方法和工具,导致实践效果不明显。教师对科学实践的本质内涵认识不足,也导致其对科学实践的评价定位不准,不清楚科学实践课堂评价是什么、评什么、为什么评,成为制约课堂评价有效实施的首要难题。而教师对科学实践的评价缺乏有效的方法和工具,不清楚科学实践具体怎么评、用什么评,使得教师难以全面判断学生在科学实践中的表现与进步。这些困境不仅限制了科学实践的实施效果,也阻碍了学生科学素养的全面提升,因此亟须寻求行之有效的方案,推动科学实践课堂评价的改进与优化。二、科学实践课堂评价的改进方向 为解决上述困境和问题,初中科学实践课堂评价亟须对标课程育人要求,充分发挥课堂评价促进科学素养落地的导向作用。新课标提出,利用具有探究性和操作性的任务或问题有效测评学生的能力,突出评价方式的实践性[1]。具体而言,可以从评价目标、评价内容、评价方式三个方面做出调整与改进。 (一)评价目标:从知识掌握到真实问题解决传统科学课堂教学主要依赖于教师讲授和单向提问,将学生的学习任务简化为程序性的探究方案、观察和结果,其核心目的在于阐释并验证既定的科学知识。这种目标取向往往导致学生缺乏参与实践的机会,难以触及更高层次的思考与决策过程,甚至容易将科学实验视为一种决定科学见解的机械化过程[11],如此,学生在学校所学的知识技能与社会实际需求之间的差距会越来越大[2]。为弥合这一差距,科学实践的评价目标需要实现从知识掌握到真实问题解决的根本转变,促使学生像科学家一样思考和实践。科学实践是一个依托真实情境、与现实生活和社会实践紧密关联的过程,强调技能迁移、融会贯通,致力于解决现实生活中的实际问题。科学实践将学生的角色从被动的知识接受者转变为主动的意义建构者,学生需要根据在实践中遇到的新现象、新问题,协商出新的实践方案[2],培养面对不确定性、复杂性情境时解决真实问题的高阶思维能力[12]。因此,科学实践课堂评价的目标应指向学生在真实情境中的问题解决能力,强调学生在融合科学核心素养的实践活动中的真实表现。教师需要通过情境化的驱动性问题唤醒学生的实践兴趣,并借助科学论证、科学建模等多种实践方法,加强科学知识与学生个人经验、现实生活、社会实践之间的联系,架起科学学习与现实世界之间的桥梁,引发学生灵活运用所学解决真实问题的实践行动,并由此评估学生的科学理解与实践能力,而不是一味把学生封闭或局限在知识世界里进行“机械备考”和“虚假实践”。 (二)评价内容:从低阶单一到高阶融合在传统科学实践课堂评价中,评价内容往往是低阶单一的,大多关注某一特定的科学要素,并且多集中在科学学科内部,鲜少关注学生的跨学科综合实践。然而,科学实践是一个多要素相互作用的整体过程,涉及科学概念、科学思想、科学探究、科学态度等多个方面。同时,许多科学问题不是单一学科知识所能解决的,而是需要综合运用多个学科技能交互协作[13]。 为了促进学生科学素养的整体发展,帮助他们适应未来复杂多变的科学和社会环境,科学实践的评价内容亟须实现从低阶单一向高阶融合的转型升级。一方面,科学教育评价不应孤立地评估学生对核心概念或思想的理解,而脱离其在科学实践中的应用能力。相反,应当将这两者综合起来,考查学生是否在掌握科学概念的同时还能够将其灵活应用,通过科学实践活动来观察、调查自然世界,解决有意义的真实问题[14]。另一方面,当前的科学评价过分局限于单一学科领域,有必要引入跨学科内容和方法加以完善,以此激发学生的创造性和综合性思维[15],使学生能够扎实掌握科学核心概念,并有能力通过跨学科方式综合运用这些概念,以应对新情况、新现象和新情境等。 因此,科学实践课堂评价应更加关注科学观念、思维方式、探究方法以及科学态度等高阶要素的培养与评估,同时鼓励学生将不同学科的知识和方法整合起来,以解决复杂的科学问题。这意味着评价不应仅停留在学生对基础科学知识的记忆和理解层面,而应深入考查他们如何运用这些知识理解科学现象、解决科学问题。教师需要从整体出发,设计开放的综合性评价内容,将科学实践核心概念与其他学科进行整合,引导学生在多个学科的交互性实践中更好地理解科学知识如何获得、科学问题如何解决以及科学如何把具有跨学科普遍意义的概念联系起来。 (三)评价方式:从纸笔测验到表现性评价在当前的科学教育中,纸笔测验仍是评价的主要手段,考查学生对实验步骤、操作流程和注意事项的记忆与理解。然而,纸笔测验主要反映学生的认知能力,并不能全面反映他们的科学实践能力和科学素养,无法有效检测其动手能力、创新思维以及科学态度等。相较于纸笔测验,表现性评价可以更全面地评估科学实践能力。它要求学生在现实的科学探究活动中实际运用这些技能,通过操作真实的设备和材料来解决问题[16]。在科学教育中,表现性评价通常指操作型表现性评价(hands-on performance assessment)[17]。学生通过观察、探索和推理,利用真实材料进行小型调查、实验等方法解决问题。这种评价方式能够充分收集有关学生表现的信息,从而对学生的科学学习过程及所掌握的技能进行有效评估,包括掌握科学方法、进行科学推理,以及为实现特定结果而采取某一程序或策略[18]。更重要的是,表现性评价为学生提供了实践机会,使他们通过拟定解决方案而不是回忆事实来展示和应用科学知识与技能,进而提升问题解决能力、推理能力,并对复杂科学现象建构起认知模型[16]。 因此,科学实践课堂评价应超越传统的纸笔测验,积极探索并实施表现性评价这一更为生动有效的评价方式。教师需要设计具有挑战性的科学实践任务,提供真实的设备和材料资源,引导学生亲手操作,亲身体验科学探究的过程,让学生能够在实践中深化对科学原理的理解。同时,教师需要观察、记录和分析学生在完成任务过程中的表现,以全面、准确地评估学生的科学实践能力及素养水平,并提供有针对性的指导和反馈,促进学生的持续发展。三、科学实践课堂评价实施路径 从评价目标的转变到评价内容的优化,再到评价方式的革新,旨在加强课堂评价的探究性和操作性。换言之,上述改进方向可以经由评价目标制订、评价任务设计以及评分规则开发三种举措得以落实。下面以义务教育科学课程核心概念“人类活动与环境”中的学习内容“自然灾害”为例,具体阐释如何以多类型评价目标指引科学实践方向,以表现性评价任务作为载体促进实践落地,同时以高质量评分规则来保障实践成效,从而实现高质量的初中科学实践课堂评价设计。 (一)以多类型评价目标指引实践方向作为一个融合系列科学要素且广泛涉及多学科领域的综合性过程,科学实践课堂评价的目标必须体现全面性,涵盖知识性、推理性、技能性、成果性、情感性等多种类型,以确保从多方面、全方位地捕获学生在科学实践中的表现信息。同时,评价目标旨在引导学生在评价过程中从多方面投入努力,通过完成实践任务,不仅在知识、技能和思维能力上获得提升,也促进情感态度价值观的积极发展,实现综合素养的提升。因此,教师在制订评价目标时,需立足整体视角,兼顾各类目标,避免片面强调知识、技能或单一追求成果创造和情感体验,确保评价目标的多元化与综合性,以全面促进学生问题解决能力的提升。 美国学者Chappuis在《促进学习的课堂评价:做得对用得好》一书中明确指出,优质课堂评价的关键要素之一便是清晰的目标[19],具体包括五个方面内容。其一,教师应重视知识性目标,即学生对科学事实性信息、程序性知识以及相关概念的理解[19]。虽然教师不应只将注意力放在科学知识上,但也不可对之盲目忽视或舍弃。知识性目标构成了其他类型学习目标的基础,不存在无知识的推理、无知识的熟练表现和无知识的产品开发[19]。没有科学知识作为基础,科学实践不免陷入“巧妇难为无米之炊”的窘境。其二,教师应关注推理性目标,即学生在科学实践中有效运用所学知识进行思考的过程,包括推断、分析、比较、分类、评价以及综合[19],帮助学生通过科学实践发展高阶思维、实现深度学习。其三,教师需要重视技能性目标,即学生在科学实践中的实时行为和表现[19],培养学生的真本领、硬功夫,而不仅仅是掌握“知道如何做”的程序性知识。其四,教师要引导学生展现成果性目标,即形成成果,如用手工制品来呈现学习结果等,将自身对科学的理解和思考外显出来,使科学核心素养“可视化”[19]。成果性目标不仅是衡量知识和推理能力的参照,同时形成成果本身就是一种学习形式。其五,教师不应忽视情感性目标,即影响学生学习方法的态度、动机和兴趣等教育体验的“副产品”,包括积极和消极情感两个方面,以及其中多种情感强度水平[19]。 本研究参考了斯坦福大学表现性评价任务库中的极端天气规划应对(Planning for Extreme Weather)评价任务设计[20],依据新课标中的课程内容要求对其进行适应性改编,以契合我国科学实践的内涵特征与情境需求。以“自然灾害”的学习为例,课堂评价可以设计为要求学生结合信息技术调查特定地区的自然灾害,分析和解读相关数据,并预测未来的灾难性事件,以减轻其影响。具体评价目标如下:1)分析并解释自然灾害的概念和分类(知识性目标);2)计划并开展一项关于特定地区自然灾害的调查,建构有关自然灾害的数据模型(图形/图表/地图等),制作探究海报(技能性目标、成果性目标);3)分析并阐释自然灾害数据及其模型,感受自然灾害如何影响人们的生产生活(推理性目标、情感性目标);4)基于对自然灾害数据模型的分析,预测未来的灾害趋势(推理性目标)。 以上评价目标不仅包含基本的科学知识(如自然灾害的概念和分类),还涉及科学思维的培养(如分析并阐释自然灾害数据及其模型),能够锻炼学生的科学探究技能(如开展调查、数据收集、处理和分析),同时鼓励学生进行成果创造(如制作海报)。在这一过程中,学生需要综合运用科学、地理、数学、信息技术等学科领域的知识和技能,体现出评价目标的跨学科性和综合性。同时,评价目标中的情感性目标(如感受自然灾害如何影响人们的生产生活)不仅可以培养学生的同理心和责任感,还有助于促进其科学态度的形成。这种对自然灾害影响的深刻理解和情感体验,有助于学生更加积极地参与到问题解决的过程中。此外,对自然灾害数据模型进行分析并预测未来的灾害趋势,不仅可以考查学生的推理思维,评价任务还直接指向其真实问题解决能力的发展。 (二)以表现性评价任务推动实践落地科学实践课堂评价强调学生在真实性情境中,通过融合多方面科学要素以及进行跨学科实践解决现实问题的能力,其根本目的在于对学生在真实情境中完成复杂任务或解决复杂问题的过程表现及结果做出判断,并促进学生的深度学习以及高阶思维发展,最终实现科学素养的提升。科学实践课堂评价应将表现性评价作为主要路径,让学生在真实问题情境中,展示运用所学知识和技能的水平,旨在引发核心素养的相关表现[21]。表现性评价是促进科学实践在课堂中落地的重要抓手和关键推动力,学生完成表现性评价任务的过程即解决真实问题的实践过程。 在设计与表现期望相关的评价任务时,教师需要考虑四个方面的问题:1)期望学生运用的概念模型及证据;2)适合学生认知水平的评价情境;3)任务特征选项(如基于计算机的模拟或动画、纸笔书写和绘画等)以及这些选项中的哪些对于激发学生的期望表现至关重要;4)揭示学生理解和技能水平的证据类型[22]。具体而言,科学实践表现性评价任务的设计首先需要提供真实或模拟真实的科学实践情境,指定学生在任务中需要完成的实践目的或挑战(如调查、实验等),同时需要明确学生在任务中的角色(如科学家、工程师等),以及学生用以展示其对素养目标掌握程度的作品或表现形式(如调查报告、海报等),以作为评估学生素养水平的证据。此外,还需要确定任务结果的受众,即学生的作品或表现给谁看、为谁完成[21]。 基于前文所设定的评价目标,表现性评价任务可设计如下:想象你是一位科学家,请以小组为单位,计划并开展一项调查,探究我国某个地区的自然灾害发生情况及规律,以海报的形式呈现探究过程及结果,并预测该地区未来的自然灾害发生趋势,为科学家、工程师、救援队等群体的防灾减灾、应急救灾工作提供参考,以尽可能减轻自然灾害的影响。教师可以创设“我国是自然灾害频发的国家,如山区的泥石流、东南沿海地区的台风、北方地区的干旱、南方地区的洪涝等,都给人们的生产生活造成了严重危害。作为小科学家,我们如何探究不同地区自然灾害的发生规律,为防灾减灾、应急救灾等提供解决方案,以尽可能减轻自然灾害的影响呢?”这一真实情境,引导学生以“小科学家”的角色,计划并开展一项关于我国某地区自然灾害发生情况的探究活动,并制作一张海报,内容包括调查地点、研究问题、待收集的数据、数据收集表、数据结果显示(图形/图表/地图等)、对研究问题的回答等信息。具体而言,学生需要完成如下任务:1)明确自然灾害的概念和分类,选择一种自然灾害进行解释和分析;2)提出一个关于某地区自然灾害的可调查的研究问题,计划并开展数据收集;3)根据收集结果构建数据模型,以图形/图表/地图等形式进行呈现;4)分组对数据进行分析和解释,并征求另一个小组的反馈,以改进本组的数据呈现和解读;5)以小组为单位,使用自己的数据来概述自然灾害问题,预测未来十年该地的灾害趋势,以指导科学家和工程师等考虑自然灾害的未来影响和解决方案。 (三)以高质量评分规则保障实践成效不同于传统评价只以结论的获取作为终点的做法[23],科学实践课堂评价强调对学生的科学实践表现进行多维度、全方位的动态评价,关注学科以及跨学科素养的发展。评分规则作为教师课堂教学评价的指导,可以在多方面促进学生的学习。高质量的评分规则是确保科学实践评价有效实施的重要因素,它不仅可以明确教师的评价标准和评分细则,而且可以让学生清楚地了解到在科学实践任务中高水平的表现具体是什么样、如何可以达成[24]。科学实践的评分规则应当具备完整、清晰和一致的评价维度、等级水平、描述语设置和表现样例,重视学生在科学实践中的形成性表现,不仅需要评估各方面科学要素,也要关注跨学科层面的发展。 科学实践课堂评价覆盖学生科学学习的不同方面,因此完整的评分规则应同时指向科学实践、核心概念以及跨学科概念,囊括与评价任务相关的重要方面。以前文表现性任务为例,首先,要基于课程标准明确三个评价维度,包括科学实践、核心概念和跨学科概念。以科学实践为首要层面,结合核心概念和跨学科概念,综合考量后可提炼出一个涵盖评价目标的高质量表现[25],见表1。其次,要关注学生在实践中的外在表现,应当对每个评价维度下的具体行为进行清晰界定,以确保这些表现是可直接观察到的,而非依赖于评分者的主观推论[26]。评价维度还应当与课程标准和评价任务保持内在一致性,并在评价任务的提示中明确告知学生具体的评价要求,为学生理解评价维度提供支持。再次,等级水平和描述语也是评分规则的关键要素。理想状态下,评分规则若包含多个等级水平便能够更充分地覆盖学生的表现并提供详尽信息。然而,过多的等级划分也可能制约学生在科学实践中的形成性表现和创造性发挥。因此,在设置等级水平数量时,需要在清晰传达目标期望的同时,确保其处于可管理的限度内,以实现评价维度与等级水平之间的平衡[27]。各等级水平的描述语应当足够清晰而简练,准确界定在科学实践中所期望的学生表现,以便师生双方能够依据评分规则,有针对性地改进教与学的过程[28]。最后,高质量的评分规则还应包括表现样例,即符合评分规则中某一等级描述的实例,在等级描述下给出相应的学生表现案例,为教师和学生理解和运用评分规则提供支持,见表2。四、结束语 科学实践作为新课程背景下育人方式的重要变革,担负着为国家培养具有科学素养和创新能力的高质量人才的重要使命,急需与之相匹配的课堂评价,以捕捉学生在实践过程中的行动表现,着力促进学生科学素养的提升。本文在深入剖析当前科学实践课堂评价所面临困境的基础上,针对评价目标、评价内容以及评价方式三个方面,提出了明确的改进方向,并结合案例提供了初中科学实践课堂评价设计策略。未来研究还需更多关注如何构建和应用科学实践的多层次、多角度素养评价体系,以更好地推进与深化素养导向的教育评价改革。 参考文献略

王薇:中小学德育评价PDCA循环模型的建立与应用

2025-05-21

引用格式:王薇. 中小学德育评价PDCA循环模型的建立与应用[J]. 中国考试, 2025(5): 35-43.作 者王薇,北京教育科学研究院研究员。摘 要:当前,中小学德育评价存在理论支撑不足、系统性缺失、衔接性不够、工具化倾向明显等现实问题。借鉴国际PDCA理论,本研究构建了一个由计划(Plan)、执行(Do)、分析(Check)、应用(Act)四个环节构成的德育评价循环模型。评价目标指向马克思主义全面发展学说,评价内容兼顾德育实践活动过程与结果,评价方式融合质性描述与量化分析,评价应用指向持续改进的完整体系。为实现中小学德育工作持续性改进和评价体系的系统化构建,德育评价应建立一体化评价标准,强化家校社协同育人评价机制,以数智化德育评价推动评价模式转型。 关键词:德育评价;中小学;PDCA循环理论;评价模型立德树人是新时代学校教育的根本任务。为全面贯彻党的教育方针,培养德智体美劳全面发展的社会主义建设者和接班人,中小学必须把德育工作摆在素质教育的首要位置,将立德树人作为学校工作的核心目标。2017年,教育部颁布《中小学德育工作指南》,要求切实将党和国家关于中小学德育工作的要求落细落实,着力构建方向正确、内容完善、学段衔接、载体丰富、常态运行的德育工作体系[1]。如何提高学校德育工作的专业化、规范化和实效化水平,使德育工作目标更明确、体系更完善、反馈更及时、效果更明显,是中小学需要研究并加以解决的现实问题。本文从德育评价理论与现实问题出发,探索构建中小学校德育评价PDCA循环模型,以期为立德树人根本任务的落实和学校德育工作的持续改进提供参考。一、中小学德育评价的理论与现实问题 近年来,随着《中小学德育工作指南》等文件的出台及各地实践探索,中小学德育评价在制度化、规范化建设上取得了积极进展。然而,德育评价的理论根基与实践体系仍面临深层挑战,在评价理念、内容架构、实施逻辑与功能发挥等方面存在诸多现实问题,亟须从系统性视角深入剖析与破解。 (一)德育评价的理论支撑不足德育评价首先要解决“依据什么评”的问题,即用什么评价理论来指导德育评价。一方面,仅用教育评价的一些基本理论来指导德育评价往往存在适切性不足的问题。因德育评价有其特殊性和复杂性,它允许对一部分对象作出非客观化的分析判断、对思想品德中的某些特征只给出定性描述,不像学业评价那样可以进行相对客观的实证分析和得到量化结果。现实中,一些学校在学生品德评价中移植学业评价的百分考核制,将文明礼貌、集体意识等抽象的品德指标机械量化,如“帮助同学”对应10分、“主动值日”对应5分等,忽视了道德行为背后的动机差异与情感体验,暴露出对理论生硬套搬的问题缺陷。另一方面,德育评价并非伦理学中的行为评价,它不是针对单个行为进行个体分析,而是在综合大量行为群的基础上进行总体评价[2]。目前,德育评价理论中的一些基本问题,如德育评价目标制订的依据和方法、德育评价的可能性与困难性、主体与客体、范围和功能、质量和效度、德育评价方法的多元性和科学化、德育评价结果的分析和运用等,都有待德育和评价研究者展开深入研究。 (二)德育评价内容的系统性缺失目前,关于我国中小学德育评价内容的研究大多围绕思想品德测评展开,就学生品德评价的内容方法提出了诸多建设性意见[3],重点关注学生品德的评价范围。从系统性角度而言,德育评价不应只关注品德评价,还应将视野扩大到包括德育课程、活动和制度在内的学校德育工作评价;不应只解决如何测和如何评的技术问题,还应解决如何鉴定德育评价质量、解释评价结果、避免评价负效应影响等价值问题[4]。例如,一些学校的德育评价仅强调对学生是否遵守行为规范的结果进行打分,忽视了对校园文化节、志愿服务等德育活动的过程性评估。同时,德育评价不应只解决评价方案制订和评价内容设计的理论问题,还应解决方案实施、应用等实践性问题;不应只偏重于某种评价模式的推介应用或个别试点学校的具体操作程序,以及特定实验场景下的局部实施方法,还应建立起真正适应我国中小学德育工作实际和学生品德发展规律的评价机制,更有效地推进立德树人根本任务的落实。 (三)德育评价体系的分层分类与学段衔接不畅与西方国家德育仅指道德教育(moral education)不同,我国的德育目标旨在通过课程育人、文化育人、活动育人、实践育人、管理育人、协同育人等途径,培养学生的政治素质、道德品质、法治意识和行为习惯,形成积极健康的人格和良好心理品质。在此观念下形成了“大德育”的教育内容,涉及理想信念教育、社会主义核心价值观教育、中华优秀传统文化教育、生态文明教育、心理健康教育等。因此,德育评价活动须建立起适合“大德育”观念的评价体系。当前,德育评价目标缺少系统设计和过渡衔接,评价内容缺少针对性的分类分层,普遍忽视真实情境下道德行为发生的情境性和复杂性,以及品德形成的阶段性和德育工作的长效性,评价体系缺少相应的结构效度[5]。以社会责任感评价指标为例,评价观测点应体现学生在小学、初中、高中不同学段的认知差异:小学侧重遵守纪律,初中侧重社会实践,高中侧重公民意识等,不能搞“一刀切”。此外,中小学德育评价实践大多仍采取一次性或阶段性评价,缺乏持续性和连贯性;德育评价结果在学校后续教育教学管理中的应用明显不足,未能充分发挥评价的导向和改进作用。 (四)德育评价的表层化倾向明显当前,中小学德育评价存在评价内容同质化、评价方法过于注重量化、评价主体单一、评价结果使用功利化等问题,在一定程度上脱离了学生的真实生活[6]。德育评价是对德育活动实施效果的价值判断,而衡量德育实施最终效果的则是学校德育工作的改进和学生道德行为水准的提升[7]。在实践中,不少学校将德育评价方法的科学化简单地等同于量化方法,在对学生的品德做出评价时,习惯于构建德育评价指标,人为设定评价权重和评价标准,对学生德育水平进行量化评分或划定等级,片面追求评价的标准化和定量化,未对德育工作开展的针对性和实效性予以充分重视。这是以量化评分代替德育评价产生的弊端。例如,一些学校实施的“品德分数大比拼”“品德成长排行榜”等都是不可取的做法,因为这会导致学生为争分而刻意表现,忽视了道德情感的内化过程,暴露了评价中重结果轻过程、重分数轻体验的功利化倾向,背离了德育育人的本质。二、中小学德育评价PDCA循环模型的基本思路与框架 针对当前中小学德育评价中存在的问题,亟须引入科学的理论模型以破解实践困境。PDCA循环理论所蕴含的持续性改进理念、系统性架构及螺旋上升机制,与德育评价追求的目标导向、过程管理和质量提升高度契合,为构建兼具科学性与实践性的德育评价体系提供了新的方法论视角。 (一)PDCA循环理论对学校德育评价的适用性PDCA循环理论的提出可追溯到二十世纪二十年代,美国休哈特(Walter A. Shewhart)提出计划—执行—检查(Plan-Do-See,简称PDS)模型的雏形[8]。美国管理学家戴明(W. Edwards Deming)对PDS模型做了进一步补充完善,发展成为计划—执行—检查—处理(Plan-Do-Check-Act)模型,简称PDCA循环模型[9]。 PDCA理论的核心思想是持续性改进,即通过不断优化评价内容、思路、方法、措施等,帮助管理者达成管理目标,实现管理质量的提升[10]。PDCA循环包括四个周而复始的步骤,即计划、执行、检查、处理。计划指目标的确立和工作计划的制订;执行指计划的落实,方案的具体操作实施;检查指对计划的执行进行检验,判断目标达成情况及完成效果,肯定经验,找出问题;处理指进一步处理检查结果,提炼成功经验,在下一循环中适当推广,并总结反思失败教训,对未解决的问题提出有针对性的措施,归入下一个PDCA循环中加以解决。其中,处理是整个循环理论的核心和关键,总结经验并查找不足,为下一轮循环提供改进目标和方向。在上述四个环节中,处理既是一个周期的最后环节,也是下一周期首个环节的前提和基础,处理和计划的无缝衔接形成PDCA循环式递进圈,由此构成质量可持续改进的模型[11](见图1)。该循环是确立目标、执行计划、验证效果、分析问题、改进提升的过程,精髓在于不断发现问题、改进问题,实现质量的阶梯式上升,形成自我改进、自我完善的机制,达成良性循环的目标。教育领域引入PDCA循环理论主要是通过对学校评价的研究分析来提升管理工作质量[12]。在此之前,学校管理主要关注三个环节,即计划、实施、总结;引入PDCA循环理论后,遂形成计划、实施、评价、总结的循环回路。在该循环中,计划是在评价和总结的基础上针对发现问题所制订的计划,实施是计划的严格落实和条件保障,评价是对计划目标达成度的阶段性判断和检验,总结是对照目标进行回顾分析并提出改进措施的总结。由此,计划、实施与总结环环相扣,融为一体,使目标制订、计划执行、工作改进的逻辑性更强,关联性更紧密,通过管理促进提升得到更有效的保障。 德育工作是学校工作的重要内容,但德育管理并不像学校管理那样重视评价功能的运用。事实上,德育评价周而复始,需要经历从方案制订、组织实施再到分析改进的过程,不断循环以确保德育评价的持续推进,促进学校德育质量提升。这一过程与PDCA理论循环圈非常相似,因此PDCA理论适用于学校德育评价模型的构建研究。 (二)学校德育评价PDCA循环模型的特征与价值1.学校德育评价PDCA循环模型的特征由于中小学德育工作的独特性,德育评价引入PDCA循环体系后需要做出一些必要的调整,具体表现在五个方面。一是德育评价目标的确立,应从将德育视为学校的局部工作,转变为依据学校办学理念落实立德树人根本任务的整体设计;二是德育评价内容的制订,应从学校管理者的行政工作,转变为全体师生的共同愿景和操作方案;三是德育评价方式和方法的选择,应从标准化的量化打分,转变为听取教师、学生和家长的意见和建议,特别是充分考虑学生的内心体验、情感认同和成长需求;四是德育评价主体的转变,应从单一的外部评价,转变为包含教师、班级、年级等在内的自我评价与外部评价相结合;五是德育评价结果的反馈,应从无法反映建设性意见的等级分数,转变为学校管理人员、教师的问题讨论、交流分享和未来展望等。 作为学校德育评价的实施模型,PDCA循环体系具有以下三个核心特征。一是四个环节紧密相连,密切衔接。学校德育评价PDCA循环体系由计划、执行、分析、应用四个环节构成,关联起来才能形成闭环,任何一个环节都不可或缺。二是大循环嵌套小循环,层层递进。学校德育评价是一个大循环,其中包含各部门、各专项工作的中循环,各学段、各年级的小循环,以及各班级、各教师的微循环,形成如图2所示环环相嵌的格局[13]。每个层级的循环均向总目标推进,微、小、中、大循环目标一致,层层递进,推动德育评价实践效果和德育工作整体质量的提升。三是循环周而复始,螺旋上升。学校德育评价PDCA体系的运转不是一次性的,而是周期性循环往复。每次评价都能解决一些问题,使工作得到一定改观,遗留及发现的新问题则会进入下一轮循环中继续处理;经过周而复始的解决与改进,实现德育工作质量进阶式提升,形成学校德育评价的阶梯式运转模式。2.学校德育评价PDCA循环模型的实践价值学校德育评价PDCA循环模型对于落实立德树人根本任务,推进全员全程全方位育人具有三个方面的实践价值。一是系统性。德育评价是一项系统性工程,涉及的部门繁杂、人员众多,容易出现工作混乱和条理性不强等问题。PDCA循环评价体系能有效消除德育工作各自为政的弊端,将学校的德育处、学生处、年级组、班级等组织起来,通过大环带动小环,形成上级牵引下级的评价模式,使各部分在各自运行的基础上整体推动学校育人工作。二是发展性。通过每级循环中对新问题的发现和解决,推动学校德育工作向更高层次发展,由此避免在各级循环中,问题未被及时发现或未得到足够重视和真正解决。由于PDCA螺旋上升基本态势的保持,一些在本学期没有解决的问题并不会被掩盖,而是会随着循环推进到下一周期被重新提出,直至问题解决。PDCA循环体系正是基于一个个问题的解决,达到循环往复、持续提升的效果。三是操作性。新时代大思政工作在基础教育阶段具有重要的战略意义,但中小学德育工作依然存在“说起来重要,做起来次要,忙起来不要”的实施困境,缺乏针对性、实效性的问题解决方法。PDCA循环体系为学校德育评价提供了可操作的模型支架,为德育工作的改进提供了工具支撑。 (三)学校德育评价PDCA循环模型的建立1.计划阶段(P):德育评价目标指向马克思主义人的全面发展学说德育评价是教育评价的薄弱环节,根源在于学界尚未形成统一理论共识。有研究指出,德育价值观是理论构建与方法应用的基础,其认知偏差会直接削弱评价的客观性与科学性[14]。因此,德育评价的理论根基必须深植于马克思主义人的全面发展学说中,以党和国家教育政策为导向,凸显德育本质特性。 计划阶段是学校德育评价PDCA循环周期内的初始环节,清晰的德育评价目标和明确的评价计划是PDCA德育评价循环取得实效的必要前提。该阶段可分为四个操作步骤。首先,分析现状,查摆问题。即根据上一轮评价循环周期总结出的问题,结合实地调研与访谈等方法,确定本轮循环需要解决的问题,如德育课程内容缺乏衔接、学生对德育活动兴趣不足、德育工作实效性不强等。其次,剖析原因,寻找根源。通过组织学校德育干部、班主任、科任教师等参与讨论,认真分析问题产生的原因,提炼可能对德育活动内容和形式等产生影响的因素。再次,找准关键因素,确定目标。对讨论中提出的若干影响因素进行比较,找出主要、直接的影响因素,作为本轮PDCA德育评价的主攻方向;同时,结合上级教育行政部门对中小学德育工作提出的总体要求,以及该学期德育工作的基本任务,从综合布局出发确定德育评价的整体目标,各部门、年级、班级及教师则负责拟定各级组织及个人的德育评价具体目标。例如,某小学在计划阶段通过学生调查问卷发现,劳动教育评价存在重形式、轻体验的问题,据此将构建劳动素养发展性评价体系作为本轮评价工作目标,明确家务劳动过程记录、校园劳动岗位执行等具体指标。最后,制订措施,提出计划。基于学校德育评价目标的顶层设计,在分析问题原因和制订整改措施的基础上,针对上一轮评价发现的问题和本轮评价的总体任务,制订德育评价总体方案,各部门、年级、班级及教师制订整改计划,包括年级德育评价方案、班主任评价方案、各学科课程思政评价方案等。 2.执行阶段(D):德育评价内容应兼顾德育实践活动过程与结果在教育研究中,品德评价与德育评价常被混淆,实则二者内涵不同。品德评价是德育工作的关键,旨在培育符合社会需求的人才。德育评价本质是聚焦德育活动成效,评估思想品德的发展状况[15]。但若仅以学生品德成长来评判德育实践效果,则容易陷入形式主义与功利化困境。在学校德育评价PDCA循环模型里,德育评价要涵盖德育工作过程与成效,兼顾立德树人的过程和结果,如此才能凸显其价值。 执行阶段作为学校德育评价PDCA循环的主体环节,按照既定的评价目标执行行动方案,是PDCA评价循环实现工作质量提升的核心任务。该阶段可分为四个操作步骤。首先,按照计划,执行措施。即对照德育评价目标,按照计划阶段既定的评价计划落实行动方案。涉及学校相关部门及教师,则应认真完成职责范围内的相关任务,分别在课程育人、文化育人、活动育人、实践育人、管理育人、协同育人方面执行德育评价计划的具体措施。其次,关注进展,协调跟进。执行阶段不仅涉及评价计划的落实,还应根据党和国家的教育评价政策要求,做到及时跟进和修订完善。再次,挖掘资源,多元评价。德育评价的实施需要充分吸纳不同群体参与评价过程,整合校内外资源,发挥家校社协同育人力量。例如,学校可以建立由班主任、科任教师、心理教师、社区人员组成的评价团队,班级则可以组建以家委会为代表的评价主体。例如,有中学在法治教育主题活动中,邀请社区民警担任校外评委,家长通过家校共育平台记录学生在社区普法活动中的表现,形成学校+家庭+社会三方评价数据的实时汇聚。最后,收集信息,记录过程。在实施德育评价方案时,务必及时收集评价信息,这些信息不仅包括评价的主题、内容、方式、过程及效果,也包括学生参与德育活动的收获、体会和反思等。这些过程性评价资料的积累,既是德育评价分析结果的基础性材料,也是下一阶段德育评价循环的起点和依据。 3.分析阶段(C):德育评价融合质性描述与量化分析2020年,《深化新时代教育评价改革总体方案》发布,提出改进结果评价、强化过程评价、探索增值评价、健全综合评价的要求[16]。这一文件对德育评价产生了深远影响,推动德育评价摆脱工具理性束缚,凸显人文关怀。从哲学视角看,人文主义取向的德育评价秉持以人为本,聚焦学生道德品格的生成、发展与整体塑造,综合运用质性与量化方式,回归学生道德人格和品格发展的本体价值[17]。 分析阶段是学校德育评价PDCA循环的关键环节,为整个评价提供丰富的评价结果。分析阶段的引入,既是对德育评价方案目标达成度的判断,也是对评价效果进行总结和反思的直接依据。该阶段也可分为四个实施步骤。首先,确立标准,制订评价细则。即根据德育评价目标和内容确立评价标准,制订可操作的评价细则。在评价标准的确定上,可以按照学校整体要求建立统一的绝对评价基准,也可根据各部门和教师的具体工作,建立适合每个个体的差异化评价标准。其次,选择评价方法,开发评价工具。即建立德育评价数据库,存储和管理评价信息。研发适合学校的德育评价系统,将德育主题、内容、方式、过程等纳入其中,随时上传德育评价过程记录。学校可运用信息技术自主开发德育成长云平台,记录学生参与志愿服务的时长(量化数据),收录学生在活动中的反思日志、同伴评价等,描绘出每个学生的道德情感发展曲线,为个性化精准分析提供依据。再次,解释结果,判断目标达成情况。按照德育评价细则进行评价信息的质性判断和量化分析,对评价结果做出从简单到复杂的解释说明,向学校不同教职工群体推送。最后,提炼经验,查找问题。该阶段以形成清晰简明的评价结论为目标,肯定德育工作中的成功之处和取得的经验,对相应人员予以肯定和奖励;同时,明确评价结果中显现的问题,并告知相关人员,以此作为处理和改进后续工作的重要依据。 4.应用阶段(A):德育评价应用指向持续改进的完整体系德育评价是一个完整、连贯的过程,应包含确定评价目标、设计评价指标体系、组织与实施评价以及分析评价结果等环节[18]。在教育评价改革背景下,德育评价数智化转型成为必然趋势,能有效增强评价结果应用效果[19],推动学生在智能技术与德育评价的融合中,获得独立思考和反思自身道德发展的能力,实现智能技术与德育评价的协同发展[20]。 应用阶段是学校德育评价PDCA循环在一个周期内的最后环节,同时也是下一周期开始前的准备阶段。该环节是完成德育评价PDCA整个闭环的过渡阶段,但在实际工作中往往被忽视。如果忽略这一阶段,就无法形成评价闭环,可见此阶段在PDCA循环体系中具有重要作用。 应用阶段也可分为四个实施步骤。首先,整理意见,提出改进建议。根据上一阶段(C阶段)形成的评价结论,将评估过程中收集到的所有意见和建议进行归类整理,分别从学校干部、教师、学生、家长等相关群体的视角形成德育工作改进建议,尤其应关注德育工作方向的正确性、内容的适切性和方式的多样性。其次,总结经验,宣传推广。即及时归纳总结上一阶段评估形成的成功经验和做法,在适当情况下交流分享德育工作的成果和心得,扩大其在校内的影响力,为进一步推广奠定基础。例如,一些学校将家长德育观察员制度化,成为学校常规工作,每学期末召开家校评价成果发布会,将优秀家长评价案例汇编成册,形成可复制的协同育人模式。再次,保持稳定,形成评价制度。一方面,学校要持续推进循环评价以保证其应用的长期有效性;另一方面,要将证明行之有效的措施制度化,形成稳定的德育评价流程,并制订标准化操作指南,确保评价工作的规范一致性。最后,聚焦问题,转入下一循环。对分析阶段发现的问题进行整理归纳,将本循环周期内仍未解决的问题以及出现的新问题转入下一循环,作为新的PDCA周期的起点阶段的重点内容,形成德育评价不断改进和持续完善的动态过程。三、中小学德育评价PDCA循环应用的展望与建议 中小学德育评价PDCA循环模型为提升德育质量提供了理论框架与实践路径。针对不同阶段德育特点,建立具有衔接性和一体化的评价标准、强化家校社协同育人评价机制以及借助数智技术推动评价模式转型,不仅是完善德育评价体系的必然要求,更是顺应时代发展趋势、促进学生全面成长的关键举措。 (一)针对不同学段德育特点,建立衔接性一体化的德育评价标准在构建学校德育评价体系的过程中,深刻认识并尊重不同年级学生心理发展特征及小学、初中、高中各学段德育工作的独特性,是确保评价体系科学性和富有实效的关键。小学阶段的学生处于品德形成的基础期,德育评价应侧重日常行为习惯的养成、基本道德观念的树立及社会责任感的初步培养;评价标准宜采用直观、具体的行为指标,如诚实守信、团结友爱等;评价方式应简单易行,便于学生理解与自我反思。进入初中学段,随着学生自我意识的增强和抽象思维的发展,德育评价应更加注重价值观的引导和道德判断力的培养,评价标准应融入公民意识、法治观念及初步的人生规划意识,鼓励学生参与社会实践,通过角色扮演、情境模拟等方式深化道德认知。在高中阶段,学生面临更加复杂的社会环境与人生选择,德育评价需强调道德自律、批判性思维及社会责任感,评价标准应体现对多元文化的理解尊重、对社会责任的主动担当及对未来生活的积极规划,评价方式应包含项目式学习、社会服务、领导力展示等多元设计。例如,某十二年一贯制学校建立全学段红色基因传承评价体系,小学低年级设置认识国旗国徽、学唱红色歌曲等具象指标,实施红色勋章收集的游戏化评价;初中阶段设置红色故事宣讲、社区红色志愿等实践指标,采用项目完成度+同伴互评的过程性评价;高中阶段设置红色文化调研、红色精神创新表达等研究型指标,采用学术报告+社会影响评估的发展性评价,实现感知—实践—创新的螺旋上升,使德育评价真正成为学生品德成长的导航仪。 建立衔接性一体化的德育评价标准和评价细则,需紧密结合学校办学理念和育人目标,在PDCA循环模型中构建符合学生成长规律与各学段德育工作特点的阶梯式评价目标,通过计划—执行—分析—应用的循环往复实现评价标准的动态优化,为培养德智体美劳全面发展的社会主义建设者和接班人奠定基础。 (二)强化家校社协同育人评价机制构建家校社三位一体协同育人机制,目的不仅在于实现多方主体共同参与,也在于构建家校社协同育人评价机制,发挥评价的导向功能、诊断功能和反馈功能。德育评价不应局限于学校内部,而应拓展至家庭和社会,形成全员参与的格局;也需突破校园边界,与生活紧密相连,成为一种生活教育[21]。因此,德育评价要取得实效,必须吸收家长和社会评价。首先,在评价主体上,应打破学校单一评价的局限,构建学校、家庭、社会多元参与的评价体系,充分发挥家长、社区等主体的育人作用;其次,在评价内容上,既要关注学生的在校表现,也要重视其在家庭和社会中的行为实践,将品德修养、社会责任、家庭美德等纳入评价范畴;再次,在评价方式上,可通过家校联系手册、社区实践记录、成长档案袋等形式,实现评价信息互通共享,在PDCA循环中建立基于多元评价数据的收集机制(计划阶段)、协同分析机制(检查阶段)与改进反馈机制(处理阶段);最后,在评价结果运用上,应建立正向激励机制,将评价结果作为改进家校社协同育人工作的重要依据,促进三方形成育人合力。 例如,杭州市上城区创新构建家校社协同评价机制,为基础教育阶段的德育评价树立了典型样例。他们通过由班主任、家长代表、社区教育专员组成的三方评价委员会,开发家庭美德存折、社区实践护照等工具,记录学生在家庭孝亲、社区服务等场景的表现,并依托学校日常观察+家庭情景记录+社区实践档案的数智化平台整合数据,生成每学期的协同育人成长报告。该机制不仅设立家校社协同育人先锋榜以表彰优秀家庭和社区,还针对评价中发现的问题(如家长参与度不均),启动专属爸爸班、乐学父母成长营等专项改进计划,形成基于PDCA循环的问题发现—精准干预—持续优化的协同育人闭环管理,被教育部列为全国家校社协同育人典型案例。 (三)以数智技术赋能德育评价,推动评价模式转型在数字化与智能化深度融合的时代背景下,数智赋能教育评价已成为必然趋势。随着大数据、云计算等技术的蓬勃发展及广泛应用,针对智能化德育评价开展技术探索显得尤为迫切,促使传统德育评价由单向度、结果导向、标准化向智慧化转型,实现评价数据的精准采集、动态分析和智能反馈。中小学校可利用智慧校园平台记录学生的日常行为数据,结合机器学习算法,构建个性化的德育画像;通过区块链技术确保评价数据的真实性和可追溯性,增强评价的公信力;借助虚拟现实(VR)和增强现实(AR)技术,创设沉浸式德育场景,提升评价的实践性和体验感。值得注意的是,智能技术在德育评价中的应用并非单纯的信息技术测评,而是在全面收集学生道德行为资料的基础上,以图像、音频、文本等多元化形式,立体、直观、个性化地展现评价结果。其中,线上档案袋评价便是典型例证。相较于每学期一次的传统成长档案袋静态评估,线上档案袋能够实时捕捉并记录学生的成长轨迹,多方评价主体能在德育课程与活动中进行即时反馈,同时也赋予学生持续自我完善的机会。德育智能评价系统能够整合学生的课堂学习表现、校园生活行为、社区实践记录等不同内容和各类场域的即时数据,通过大数据分析自动生成品德发展过程性报告,同时提供个性化改进建议,支持家校社三方实时查看评价数据,共同制订育人方案。 数智赋能不仅使德育评价更加科学化、精细化,实现数据采集—智能分析—精准干预—效果反馈的闭环管理,而且通过技术手段支撑PDCA循环模型在德育评价实践中的落地,推动评价从静态结果转向动态过程,从经验判断转向数据驱动,从标准化评价转向个性化发展,形成计划—执行—分析—处理的数智循环改进体系,为学生的全面发展提供更加精准的成长支持。 参考文献略