《深化新时代教育评价改革总体方案》提出,要改进结果评价,强化过程评价,探索增值评价,健全综合评价。
在这“四个评价”当中,综合评价是重点,也是根本。因为如果不指向学生综合发展,结果评价和增值评价容易变成评价分数,过程性评价也可能走向形式主义,评价便失去了意义和价值。
(资料图片)
但同时,综合评价又是痛点、难点和卡点。核心素养时代,究竟如何健全综合评价?想回答这个问题,我们需要明确两点: 综合评价不是什么?综合评价是什么?
综合评价不是什么
综合评价不是知识点的拼接
上世纪80年代,我们引进了布鲁姆的教育目标分类学及掌握学习法。当时我是一名教研员,用双向细目表来架构命题框架,改进考试命题。在那个年代能够这样做,是很先进的,因为在双向细目表的引导下,能够确保命题的覆盖面比较广,也确保教学在某些方面不能超纲。
但这就是我们今天追求的综合评价吗?显然不是,因为综合不是简单的汇总、相加。今天强调素养导向,素养不限于知识点,也不限于认知范畴,而识记、理解、应用都是认知范畴。
如果用一个公式来说, 素养=(知识+能力)*态度,它强调态度价值维度。态度为正,就是正能量;态度为负,就是负能量。而双向细目表限于认知维度,跟素养导向的综合评价是有偏差的。
而且,双向细目表强调考试,即学生要在规定的时间、规定的场所,回答相同的问题。这样能考出真正的素养吗?我说可以,也并非完全可以,因为 最重要的素养是不能通过考试的方式来评价的。
综合评价不是五育观测点的相加
目前,中小学流行的综合评价,是把学生的综合素质分成了思想品德、学业水平、身心健康、审美素质、劳动与综合实践五个方面,每个方面再分解成三级指标。比如,审美素养被分解为美育实践、美感表达、艺术特长三个指标,每个指标对应4-5个观测点。整体而言,综合评价就细分成了五六十个观测点。
这一套体系对于破除“唯分数论”是有价值的,它关注到分数之外的很多方面;像劳动与综合实践,就是过去很少关注的维度。这相对于双向细目表的评价是有进步的。
但是,这样的综合评价仍然是有问题的。
第一个问题,综合评价表现为各个五育观测点的简单相加,在非常细致的分解式考评之下,学生的个性、活力、灵气就被淹没了。
第二个问题,综合评价一般都是通过同学评、老师评、家长评来评出等级或者得出分数。但这些指标缺少一定的可操作性,所以多是凭主观印象进行评价,不那么客观;不同学校的把握也不太一样,缺少一定的可比性。
第三个问题更严重,在这样一套评价指标体系下,课程对接的是学业水平,课程被狭隘地理解为智育;然后在学业水平之外,专门突出了德育、体育、美育等,严重窄化了课程的育人功能,评价因而容易走向形式主义。
学校育人以课程为载体,同样,学生综合评价也应与课程对接,通过健全课程落地的机制,由课程体系予以保证,不是另外设立一套与课程关系不大的评价体系。 如果评价能够嵌入课程实施过程,落地在每一门课程,学生的综合素质一定能够得到发展。
综合评价不是全时空的跟踪、监控
说到综合评价,现在学校比较时髦的是 “数字画像”,即依靠穿戴设备和图像设备,对每个学生的行踪进行全方位地记录,并在此基础上得到学生画像。
数字画像有两个好处,一是便利,可以通过大数据的实时记录、自动汇集、连接,形成庞大的“数据自我”;二是比较客观可靠,不再是凭主观印象进行评价。
但随之而来的问题也不少:
第一,数据是随机采集的,缺乏必要的结构;
第二,被记录的是某些行为及其模式,而不是动机、情感、态度、信仰等。学生的动机、情感、态度、信仰能够被这些数据体现出来吗?我表示怀疑。
第三,无所不至的“强制性透明”摧毁了所有的有机表达,剩下的只有机器连接的过程,人变成了完全透明的机器。
我们需要思考的是,全时空的跟踪、监控这件事究竟对不对?这件事如果发生在我们自己身上,是什么感觉?己所不欲,勿施于人。如果我们自己都不愿意接受这一套,请不要把它用在学生身上,何况是未成年儿童。
伴随着现代化的进程,人的活动有着私人领域和公共领域之分,而私人领域不应该是透明、公开的。但全时空的追踪把所有东西都记录下来,产生庞大的数据,无论是暴露在自己面前还是在别人面前,都会感到非常吃惊。 面对这样的媒体和数字“暴力”,我想,应该说“不”。
综合评价是什么?
接下来,我们就来正面回答“综合素质评价是什么”这一问题。但首先,我们需要明白“综合是什么”。
综合是调动多样化心理社会资源
应对挑战、完成任务的过程
下面是两个学习任务的例子。
示例1:6年级数学任务设置
规划一次出游:教师介绍主题,激活学生以前规划出游的知识。
引导学生讨论:讨论内容为以前学校或家庭到哪里出游过或其他外出情况。绘制一个图表,通过列出学生的首选清单,展示全班的优先选择,然后对他们最想出游的地方投票,全班讨论最优选择。
每个学生的任务:基于他们对班级投票情况的分析,建议他们班可以去哪里出游;基于图表显示的每个地点的距离、门票价格和公交车费,计算每个学生三个不同地点的出游费用;使用成本图表中呈现的信息,评价学生要去动物园的提议;基于对所有信息的分析,给教师写一个短信,对班级应该选择哪个地点出游给出建议和佐证。
示例2:高中语文任务设置
10-11年级学生编辑一个在线电子版文集《人工智能与劳动世界》,具体任务是为文集准备前言,做如下事情:
决定以什么顺序选取哪些文本(至少包含6个文本),这些文本至少体现两种以上的观点和文本形式;甄别和讨论文本所体现出来的关于两者关系的不同看法;为每个文本写一个段话,阐明选取的理由及与其他文本的关联性;提出一系列问题,让读者集中思考文本中的观点。
上面这两个任务有什么特点? 一是真实性,反映真实的生活或工作需求; 二是开放性,有着充分的自主空间; 三是迭代性,完成这样的挑战性任务需要较长的时间,允许学生从错误中学习。
在完成挑战性任务的过程中,学生的知识、技能、价值观自然而然发生了整合,这个过程叫做综合。综合是真实的、自然的,不是预先设定的。 综合的过程,就是核心素养形成的过程。
所以,素养不是学而即得的知识;按照经合组织的定义,素养不只是知识与技能,还包括在特定情境中,通过利用和调动心理社会资源(包括技能和态度)满足复杂需要的能力。
综合素质评价要义的两个方面
由此,综合素质评价的要义体现在两个方面。
一是从挑战性任务的完成过程中看重要素养的发展情况。
比如上面的示例2,就能看到多方面的素养,包括:学生组织安排及阐释、推介文本、满足读者需求的意识和能力;多渠道阅读获取信息、梳理探究与书面表达能力;对技术世界与劳动世界的基本态度。
所以,综合评价不是评价“今天学会了吗”“今天作业交了没有”“今天晚自习上了没有”。如果综合评价被理解为这种方式,我们将把学生引向哪里?到最后,学生就会失去自主性。 评价关注学校课程着力培育的重要素养,而非学而即得的知识、技能,以引导教育教学的方向。
二是把学生各方面的情况结合起来,看个性潜能和特长。
具体来说,是对学生的发展可能性作出前瞻性评估,对个人潜质与院校培养目标的匹配度做出判断,借以引导后续学业、生涯规划,决定是否报考或录取。 它要求把“抽象的人”还原为现实生活中的具体个人,并放在一定情境中去理解。
基于学生作品的综合评价
基于以上对综合评价的思考,我认为,未来综合评价的一个出路或者选择,是基于学生作品的综合评价。
作品是学生重要素养发展
的关键证据
作品是学生完成挑战性任务过程当中所形成的学习成果,也是学生重要素养发展的关键证据。
为什么这么说呢?作品集中展示了学生的理解和行动: 选择做什么,表明他的价值取向; 怎么做的,反映他的思维过程和行为方式;做到什么程度,表明了他的潜能和个性品质。
同时,作品具有整合性质,可涵盖所有素养发展过程,而不限于标准化考试所能反映的内容。比如,曹雪芹是个什么样的人呢?我们可以从《红楼梦》这个作品中找到答案。
这样的学生作品,不同于一般的课堂作业,而是属于一种挑战性任务。刚才提到,学习任务的特点是真实性、开放式、迭代性。同样,在任务当中所形成的学习成果即作品,也有3 个特性。
第一,真实性。任务是真实的,作品也应该是真实的,反映了学生的真实想法和行动。
第二,专业性。在完成挑战性任务时,学生要运用学科和专业领域的重要观念、方式去分析解决;同时运用一定领域或者学科的表达方式,包括符号、语言,来呈现成果。这使得学生要像专家一样思考问题、解决问题。
第三,迭代性。完成挑战性任务一般不是一次性的,需要反复迭代更新,直到最后个人基本满意为止。
那么,怎样的学习成果,才算是作品呢?主要有以下四类。
一是阅读笔记,致力于掌握给定的学科材料,做整理、归纳、比较、阐释和评论。比如,围绕某个专题的书籍资料进行整理,就是典型的阅读笔记。
二是研究成果,即围绕某个问题进行观察、调查、实验等,获得规律性的认识。通常所说的研究性学习报告,就属于研究成果。
三是创意表达,即围绕感兴趣的话题,运用多种媒介方法技术,进行个性化地设计、制作、表演、表达等。在高中,学生这方面的创意表达比较丰富多样。
四是实践报告,即走向社会、挑战自我,完成特定目标任务过程的报告,包括改变自我和改变世界两个方面。比如学生的志愿服务,就是反映学生是否具有一定的责任担当,能否运用所学去完成任务、接受挑战的重要证据。
围绕关键证据
——作品的综合评价
有了作品作为关键证据,如何进行综合评价呢?主要有三个环节。
第一个环节,获取作品;这是评价的基础。
在课程实施过程中,设计有关项目任务,或者学生自定义项目,对作品形成、记录过程做必要指导和规范。比如学生读书,摘要和笔记可以设计规定的模板,包括什么时候读什么书、主要内容是什么、作者的观点是什么、自己是怎么看的,等等。每个学生要在规定学习领域完成并提交作品。
第二个环节,解释作品。这是评价的关键和难点。
解释作品可以有多方面的参照体系,包括学生个人成长经历、所处的社会文化环境等,以此来解读作品的意义,对于重要素养的发展意味着什么,达到了什么目标,进阶到了什么水平。
其中,最重要的参照是要有一定领域的通用量规。关于量规,我举一个例子。中国学生发展核心素养中,有一个素养是健康生活,如何来评价这一素养呢?有人把它分解成以下 6 个水平。
水平1:在指导下,我可以尝试一些新的东西,看看我自己喜欢的程度。
水平2:在指导下,我可以尝试一些新的东西,看看我自己喜欢的程度;我可以注意到,如果我吃了什么东西后感觉不舒服(如胃痛、皮疹、头痛),我可以告诉别人。
水平3:我可以尝试新的东西(如食物、活动、书籍),找出自己喜欢和不喜欢的东西;如果我周围的东西或我吃过的东西让我感觉到不舒服(如胃痛、头痛),我可以开始注意到问题的规律,并告诉我的照顾者/或另一个我值得信赖的成年人。
水平5:我可以设定一个与锻炼、营养或睡眠有关的个人目标,并实施一个或多个新的策略或习惯,以帮助我实现我的目标;我可以认识到导致不健康思想或行为的触发因素和/或消极影响;我可以定期将时间投入到使我感到快乐、自豪或有使命感的关系和活动中;我可以调查哪些特定的身体不相容(如过敏原、糖类),我可以积极尝试避免它们。
可以发现,这个量规不是在空谈健康管理,也不是很具体地谈做法,比如要勤洗澡、勤刷牙等,而是介于两者中间。同时,它的进阶非常明晰明了。最后,它是从学生的口吻,通过非常通俗的语言来表达。
学生素养涉及很多方面,关于重要的素养,能不能研制出通用、能理解的量规?这件事挑战挺大,又相当重要。因为当下的评价,是一个项目设计一个量规,不好用,不科学,看不出进阶,彼此之间也不能比较。
第三个环节,分享作品并改进后续学习;这是评价的归属。
具体来说,通过在线汇集、家校沟通会议等,促进学生思考“作品为什么是这个样子”,从中反思改进自己的品质、能力。教师也要从中反思:这个作品符合你的期待吗?符合教育的期待吗?符合素养的要求吗?并在这个过程当中,与学生展开持续的对话。
总之,基于作品的综合评价,指向重要素养,比如文化理解、健康生活、高阶思维等;学生自主把握,不是被动监控;嵌入到课程实施过程当中,不是在课程在另搞一套;连贯一致,贯穿整个小学乃至中学全程。当然,基于作品的评价,也不是唯一的出路。
综合评价是学生核心素养培育的一个重要支点,希望我们能通过这个支点来撬动教育的未来。
来源 | 整理自作者在2023小学课程周主题峰会的演讲
作者 | 柳夕浪
责编 | 张凯
美编 | 姗姗
执行主编 |安迪