高等教育增值评价:缘起、争论及反思

编辑日期:2023-04-03 作者: 阅读:1
【字体:

    教育评价作为教育改革发展的重要环节,深刻影响着教育发展方向和办学导向。我国高等教育界对增值评价的研究尚处在初步引进阶段,虽已有一些颇具规模的实践,但仍缺乏对增值评价所面临的争论和深层次问题的追本溯源的梳理分析。

    一、高等教育增值评价的缘起与发展

    “增值”原本是经济学中的概念,通常指用于生产产品的原材料成本或供给成本与产品价值之间的差额。在高等教育语境中,“产品”即为学生,“价值”为学生所拥有的知识和技能,将学生进入大学前后所具备的知识和技能相比较,之间的差异便被认为是高等教育带来的增值。

    (一)第一阶段:理念萌芽时期

    1966年的《科尔曼报告》认为教育机会均等不能仅局限于依靠平等的投入来衡量,而应将关注的重心转到独立于家庭背景的学生学业成就。这种对教育投入与产出进行综合分析的思维,客观上带出了增值的理念,促生了增值评价方式,为高等教育增值评价的萌生奠定了思想基础。1970年加州大学洛杉矶分校高等教育研究所创始主任阿斯汀(Astin)在一项关于大学影响的研究中提出了“输入—环境—输出”模型(input-environment-output model,IEO)。该模型旨在衡量学生的输入和输出情况,以此来推断大学是否以及如何给学生带来影响。

    在这一阶段,研究者们跳出以往结果性评价追求单一标准的思维框架,开始关注教育投入与产出,试图解释学校教育是如何对学生发展产生影响的。

    (二)第二阶段:实践探索时期

    1975年,美国东北密苏里州立大学校长迈克柯兰(McClain)构思并初步实施了针对该大学的增值评价计划,通过跟踪学生的大学经历,分析大学对学生成长的影响。该计划有3个主要目标,即了解学生潜能、证明大学对学生生活产生了积极影响以及证明该校毕业生在全国范围内具有竞争力。评价方式是分别在学生入学时、大学就读期间、毕业前和毕业后进行问卷调查。调查结果被用于改善课程教学,帮助大学明确并振兴使命。这是早期大学注重学生成长变化并采用增值评价的创新尝试,其经验为其他大学提供了有益借鉴。

    这一时期高等教育增值评价由初发理念转向付诸实践,成为衡量并提升教育质量的重要手段。增值评价明确了学生的主体地位,关注学生在接受教育后的成长变化,评价结果也被作为学校问责的依据。该阶段的探索为高等教育增值评价的后续应用扩展提供了可能性。

    (三)第三阶段:反思改造时期

    20世纪90年代以来,高等教育增值评价从理论到实践持续发展,多种基于增值理念的评价模式和工具被开发出来。如:1999年,美国国家中学后教学改进中心设计并实施了“大学就读成果调查”(Collegiate Results Survey,CRS)。2000年,库(Kuh)设计了“全美大学生学习性投入调查”(NSSE),NSSE在全美范围内启动,通过调查收集一年级和高年级大学生参与学校为其学习和个人发展提供的计划和活动的信息,来考察高等院校的教育质量。同年,美国教育援助委员会开发了“大学生学习评价”(Collegiate Learning Assessment,CLA)等评价项目,旨在通过衡量本科教育对学生的影响来评估教育质量。CLA关注大学教育对学生成长变化的影响,并侧重考察学生的批判性思维、问题解决等高阶思维能力。

    这一时期学生参与理论的提出,进一步扩充了增值评价的理论基础,增值评价在实践的检验中得以不断反思、改进。除上述评价工具外,具有代表性的还有美国教育考试服务中心水平轮廓考试(ETS Proficiency Profile,EPP)、学术能力与进步测试(Measure of Academic Proficiency and Progress,MAPP)、大学生就读经验问卷调查(College Student Experience Questionnaire,CSEQ)等。经过半个多世纪的发展,增值评价作为一种发展性评价方式被运用于不少国家和地区的高等教育领域。增值评价是通过对比学生入学成绩、能力起点与接受学校教育的结果,来考查学生学业成就的“增值”,据此判断学校教育对学生的影响。

    二、关于增值评价及高等教育增值评价的争论

    (一)理念之争:关于评价方式的科学性与公平性

    关于增值评价最基本的争论围绕增值的理念展开,主要探讨评价方式的科学合理性及公平性。支持者认为,增值评价是具有动态特征的发展性评价方式,是对以测量、描述和判断为主的前三代评价方式的改进,符合注重个体与环境互动的第四代评价的原则。增值评价注重成长的相对值,也更有利于增强学生和学校发展的主动性。同时,增值评价可以将学校的教育作用从众多非教育性因素中分离出来,如家庭背景、学校经费等,进一步保证了评价的相对公平性。质疑者则认为,每个人都可能比他人更容易学习或掌握某方面的知识或技能,这种个人禀赋的特殊性会使相同的学校教育体现在不同学生个体上的效果差异较大,增值评价很难测量出个体差异性造成的教育效果差异。

    (二)过程之争:关于评价过程的准确性与有效性

    增值评价的第二个重要争论在于过程方面,围绕增值评价的准确性与有效性展开,具体包括问责效用和指标选取。麦卡弗里(McCaffrey)等人赞同劳登布什的观点,反对将增值评价作为问责的依据,认为需要建立实证数据库来匹配增值评价的指标与教师效能的联系。还有研究者指出,不同学科标准会对增值分数产生影响;学校或教师还会采用策略去适应评估,导致增值分数变得不可靠。也有研究者认为,评价分数在学校层面是可靠的,但是从学生个体层面来看,仅通过学生回答有限数量的问题来判断能力,其可靠性值得商榷。也有研究者指出,增值评价在指标选取上需考虑不同价值维度,采用多元指标,通常难以用于评价专业教育及通识教育。

    (三)结果之争:关于评价结果的诊断性与应用性

    在高等教育增值评价当中,对评价结果的诊断性持肯定态度的学者认为,增值评价在追踪评价的过程中能够提供诊断性预测与反馈。教育评估的根本目的是激励和帮助学校改进教育工作,特别是有关人才发展的评估,其用途主要是反馈,收集有益信息服务于相关各方,而不是仅仅用来判断谁是合格或不合格的。也有研究者对增值评价的结果使用提出了疑义,如皮克林(Pickering)和鲍尔斯(Bowers)认为,增值评价结果的实际意义比统计意义更值得分析,要按照不同的课程目标及实际情况对结果进行分类讨论。他们进一步提出,学生在某方面进步显著可能是由于教师在课程中对该领域强调得过多,而学生在某方面没有进步可能是由于这些领域需要更高阶段的培养,因此对学生成绩、能力、素养的增值分析要视实际情况而定。贝内特(Bennett)关注到教育成效的滞后性,认为大学教育对学生的增值或许在数年后才得以展现,因而需要评估的对象是毕业数年的校友,而不是即将毕业的高年级学生。芬奇(Fincher)认为当前的教育理论或政策并不能为增值评价在高等教育中的开展提供指导,增值评价也不能具体解释大学课程安排、专业领域、大学氛围、教学方式方法和教学质量是如何给学生学习结果带来影响的。舍米斯(Shermis)认为大学生学习评价的目的是大学的自我改进,而不是将大学教育作为一种商品,用评价结果将不同大学进行排序。大学和教师应该探索的是如何满足学生的教育需要而不是避免被问责。

    三、反思:高等教育增值评价的局限与挑战

    (一)工具主义惯性

    增值评价依旧使用一种标准化的测试方式,通过对学生进行多次标准化测试,直接对比能力变化以获取差值。把增值评价作为问责依据这一工具导向则很容易扭曲增值评价,将会使教师的教学选择趋同。因为大学和教师将不再愿意做有风险的创新和尝试,而会通过趋同的策略来获得评价上的好成绩。

    (二)优绩主义陷阱

    所谓优绩主义(meritocracy),是主张社会与经济的奖赏应当依据才能、努力和成就这些“优绩”来决定。增值评价预设社会分配是基于能力和功绩,与其他因素无关,它虽然在方法上分离了家庭等初始因素,强调个体自身的进步,但不同家庭的文化资本已经产生了深刻的影响并内化于学生身上。教育的根本目标是实现每个人自由而全面的发展,真正的教育只可能是因人而异的全面质量概念,而不应该是对某些卓越模板的形式化计算和简单模仿,增值评价反而将教育带入优绩主义陷阱。

    (三)天花板效应

    “天花板效应”,是指优秀学生或优质生源学校因原有起点高、增值空间有限而不可能获得较大进步幅度,因而得到较低增值评价结果的现象。“天花板效应”很容易造成增值评价结果与经验事实之间的悖论。有学者提出,现实中可能存在“牛津”“剑桥”等教育实力强的“名牌大学”带给学生的增值反而小于技术类院校的情况。

    四、总结与启示

    推行增值评价的专家和教育管理者从效率的角度认为增值评价能够反映教育的全过程,具有科学性和可操作性;而学校和教师从育人的角度大多认为这种评价无法覆盖所有的努力和影响因素。尤其是在高等教育领域,学生的成长与发展涉及的因素更多,标准更加多元和难以统一。

    因此,增值评价的实施需注意以下几点:第一,要将增值评价与我国高等教育实际情况相结合。应将我国独特的教育目标和使命纳入增值评价的维度之中,并致力于生成、完善本土化的相关理论。第二,注重增值评价与结果评价、过程评价、综合评价等评价方式的协同融合。由于高等教育具有成效滞后性、学科复杂性、教学多样性等属性,任何一个评价体系都不能覆盖教育的全过程并反映所有人的努力,在使用增值评价时也要注重同其他评价方式互补。第三,使用增值评价结果时应当保持审慎态度。如在分析、使用增值评价结果时应当考虑到“天花板效应”等测量缺陷,正视高等院校的类型差异,在评价教育质量时做到具体问题具体分析。

(摘编自《复旦教育论坛》2022年第6期  作者:胡娟 徐鑫悦)