基础教育质量监测的几个基本问题

基础教育质量监测的几个基本问题
基础教育质量监测的几个基本问题

基础教育质量监测的几个基本问题

作者:华南师范大学许世红胡中锋发表时间:2012年06月19日

质量是事物、产品、工作的优劣程度,标准是衡量事物的依据、指标和尺度,准则是判断事物价值的原则。某一事物、产品和工作的质量是由多个准则、多项指标、多个尺度构成的。人们的价值、准则和标准不同,就会得出不同的质量判断。例如,对中国菜肴的质量判断就有多个准则和尺度,而不同的人又可能对同一事物或产品(如:同一道菜)得出不同的质量判断。对于教育的质量,同样如此。

一、教育质量与基础教育质量

教育质量主要是指学校与教育机构在既定的社会条件下,培养出的学生素质、提供的相关服务满足社会现实和长远需要的充分程度。由于教育的需求是多元的,办学主体是多元的,学校类型是多元的,专业门类是多元的,教育目标是多元的,培养方式是多元的,学生个性发展是多元的,……,因此,教育质量与教育水平也是多元的,它们反映的是特定的学习者在特定时间、地点以及特定环境下获取的知识、技能、能力、价值观等与实际需要相关的程度。

基础教育中,中小学校承担了为国家培养合格公民、社会建设者与未来领袖的责任,既需要传承民族的优秀文化,又需要体现时代与社会的发展需求、吸收国际先进理念,为学生的未来发展奠定共同基础;也需要关注每一位学生的个性发展,为学生的自主成才创造条件。因此,中小学校的教育质量自古以来就是社会、家庭、学生共同关注的焦点,也是世界各国教育改革的根本目标。现在人们不再关注教育应该是什么,能提供什么,而开始考察学校教育到底取得了什么,我们的学生到底学到了什么。

从育人角度而言,人们常常将基础教育质量具体化为如下两个方面:(1)学生的学业成就水平,(2)学生在学校中所获知识、技能及态度为其离开学校进入社会生活所做准备的适切性,本文简称其为“学生的综合素质”。其中,学生的学业成就水平主要用教育目标系统所规定的学习标准(即国家课程标准)作为衡量指标,它体现的是教育过程的实际特征和学习水平上所观察到的变化。学生的综合素质则更多采用社会期望标准进行衡量,社会期望标准往往是动态发展的,需要采用定性、定量等多种方式进行测量与评价。

虽然基础教育质量主要关注的是学生的学业成就水平和综合素质,即教育成果的质量;但对教育质量的分析往往需要综合考虑教育投入(即为教学所提供的人与物的资源质量)、教育过程(即教学实践的质量)、教育结果(即教学的产出与结果)这三个内在相关的维度。对基础教育质量开展监测也必须兼顾这些因素。

二、教育质量监测及其分类

教育质量监测是一个系统工程,它是通过制订监测标准、开发测量工具、抽取适当样本、收集大量数据来实现对教育质量的分析与诊断。开展教育质量监测的目的是希望通过质量控制达到教育的优化。由于质量监测主要采用定量分析的方式研究教育质量,其得出的结果往往具有客观性和可推广性,因此,许多国家常常以大规模质量监测的结果为依据调整国家的教育政策与决策。作为一项研究,教育质量监测有着多种的分类。下面主要列出四个分类标准及其相关内容。

1.按监测的实施者分类

实施教育质量监测的人员需要具有专业的教育测量与评价技能,他们主要分为三个层次与类别:学校的教学管理人员,科研部门的研究者,政府行政部门的管理者。具体而言,学校的教学质量管理部门,如教导处,主要对学校的教育教学质量进行微观研究;地方教育行政与教研部门,如区(县)教育局、督导室、教研室等,采集的监测数据主要从中观层面分析区域教育教学质量的特征;而高等院校的科研部门或各级研究机构,则从中观、宏观的层面研究教育的现象、问题或规律;至于国家、省、市级的教育行政部门,则在相应层面上对基础教育的课程进行全面的质量监控。例如,国际学生评估项目(PISA)就是由经济合作与发展组织(OCED)开发并实施的学生能力评价项目,它主要选取义务教育末期(15 岁)的学生作为测评对象,重点考察学生在阅读、数学和科学方面所具备的应用知识、技能和解决问题的能力。

2.按监测的对象分类

根据研究的需要,质量监测的对象既可以是学生、教师,也可以指向教育管理和教学环境等多个因素。对于学校而言,教育质量的关注重点是学生的学业水平发展状况与综合素质的培养,因此,监测对象主要是学生及其相关学习状况。对于区域而言,教育质量评估需要全面、客观地反映所辖学校办学的真实状况,就必须兼顾学校的办学条件、师资的配备情况、学校的管理水平等多个因素,因此,根据研究目的确定的监测对象也可能是教师,或者学校管理者,甚至是教育经费、教育资源、生源质量等。而从国家、高等院校、研究机构的层面而言,监测对象的选择更是灵活多样。例如,英国成立“教育标准办公室”(OFSTED),每4~6年对全英的所有公立中小学进行一次检查,从“学校类型、学校特点、领导与管理水平、办学水平(包括学生成绩,学生的态度、价值观和个性发展)、教学质量、学生从课程和其他方面获得的学习机会、学校对学生的关心程度、家校配合”等方面就学校提供的教育质量,学生所达到的教育水准,学校对资金的使用有效性,以及学生在思想方面、品德方面、社会方面和文化方面的发展情况提出报告。

3.按测量手段分类

质量监测的主要研究方法是测量,根据测量手段的不同,质量监测大致可以分为纸笔测量、心理测量、生理测量、行为测量、统计测量等五种形式。(1)纸笔测量的主要工具是问卷(含试卷),测量的主要对象是学生,主要采用抽样调查的方式采集数据;(2)心理测量的主要工具是量表,测量的主要对象是学生,主要采用抽样调查的方式采集数据;(3)生理测量的主要工具是测量设备,测量的主要对象是学生,主要采用抽样调查的方式采集数据;(4)行为测量的主要工具是教学行为记录,测量的主要对象是教师,往往采用目标定向的方式采集信息,用S-T方法对教学的“过程与方法”进行测量和评价,用Flanders 课堂互动分析对教学中的“情感、态度和价值观”进行测量和评价;(5)统计测量的主要工具是测量模型,测量的主要对象是教学管理与教学环境等,主要采用普查的方式采集信息,利用专业的统计方法(如主成分分析、马尔可夫分析等)进行分析。

由于纸笔测量和心理测量容易操作,因此在目前的质量监测中使用最为广泛。生理测量因受到设备条件的限制不能广泛使用,往往多用于研究。行为测量与统计测量对质量监测的实施者要求较高,因此适用面也受到一定的限制。

4.按监测内容分类

质量监测的内容可以是多方位、全过程、多层次的。例如,对于学生而言,质量监测的内容既可以是具体的学科素养,如数学素养、阅读素养、科学素养、人文素养等;也可以是学习态度,学习习惯;还可以是价值观,生活方式,等等。对于教师而言,质量监测的内容既可以是教师的学科专业素养,也可以是其教育教学技能,还可以是其价值观、工作态度、工作压力、职业幸福感、工作成就等等。对于学校管理、地方教育行政而言,质量监测的内容既可以是教育理念、办学方向、办学规划,也可以是教育资源的调配、教育政策的制定与落实等。如我国各地的初中毕业生学业考试就主要从学生的学科学业水平的角度对各地的初中毕业生学习状况进行监测与评价。

三、基础教育质量监测的基本特点

基础教育质量监测的测量目标通常与学生、教师相关,而学生与教师都具有主观能动性,不仅容易受到外界影响,而且也会受到自我心理暗示、身体状况等多种因素的影响;因此,质量监测通过测量方式获取的信息往往只是受测对象某个方面能力与表现的一个估计值,这个估计值难以全面衡量受测对象的真实状况,需要综合考虑多种因素。具体而言,基础教育质量监测具有如下四个基本特点。

1.影响监测目标的背景变量多元

教育质量不仅涉及学生、教师,还受制于学校硬件与软件建设、教育经费、政府支持等多个因素,选定一个监测目标实施质量监测时,由于涉及的相关背景变量众多,因此,在开展这项研究时,从确定监测对象、监测内容、监测标准、监测方法,到采集与分析数据等,各个环节都需要极其慎

重。

2.监测对象的可度量化水平较低

教育质量与企业产品质量或服务质量不同。企业管理中的产品质量或服务质量相对单一,可以用客观的指标进行评估,甚至可以分为国际标准、国家标准、部颁标准、企业标准等多个层次来衡量。教育质量往往涉及人的心理特征与思维活动,由于这些心理特征与思维活动没有明确的物理与生理属性,无法直接测量,因此人们设计出特定的测量问卷与量表,通过分析监测对象解答测量问卷与量表的过程与结果情况来推测其具备某种能力的特点与水平,这种推测与分析的准确度依赖于解释者的水平。另外,像情感、态度与价值观等内容,目前难以用量化的方式进行准确度量,因此更需要明确质量监测的有限性。

3.实施监测的专业化要求高

质量监测希望能够客观地测量教育质量,并能够探索造成不同质量状况的影响因素,这就对进行质量监测时采用的监测工具提出了很高的要求。只有监测工具的质量有保障,基于监测工具采集的数据与信息才能够较为客观地反映出希望测量的教育质量。因此,开展教育质量监测前,需要对相关的制作与使用监测工具的研究人员进行专业培训,确保监测工作基础的可靠性与有效性。

4.监测结果体现的是整体状况

教育质量监测的结果主要用于帮助学校、教育行政部门了解本校、本地区教育质量的现状,并通过探求学业表现与教学、家庭、社区等背景变量间的关系,指导、引导整个教育体系向着提高教育质量的方向迈进。因此,在使用监测结果时,应更多地从发展的角度来改进现有工作,而不只是关注个别现象,进行评价与排序。

四、基础教育质量监测的三个注意

基础教育质量监测虽然存在背景变量多元、可度量化水平较低、实施专业化要求高等诸多的局限性,但是由于基础教育质量监测的结果相对客观,组织实施的可操作性强,监测分析可以做到通俗易懂,借助基础教育质量监测还可以进行多层面、多角度、跨区域甚至国际间的教育质量对比研究,因此,在教育实践领域的应用越来越得到高度的重视与广泛的应用。采用监测方式开展基础教育质量的研究时,需要注意以下三点问题。

1.制作监测工具时应体现较为清晰的参照标准

教育质量监测都有其特定的目的、功能及适用范围。例如,欧盟 2001 年的“学校教育质量”报告列出了评价教育质量的16 个标准,涵盖了学业成就、成功和转变、学校教育管理、资源和结构等

四个方面;因此,在编制监测工具时,要明确监测的性质与功能,确保监测数据使用与解释的合理性。又如,国际教育成就评价协会(IEA)组织的国际数学与科学能力倾向研究(TIMSS)主要测试四年级和八年级学生的数学与科学成绩,主要评价四年级、八年级学生达到课程目标的情况,这种监测属于标准参照测验,是以考生对测验目标或内容的掌握程度作为标准,对测验分数进行解释。再如,我国每年都组织的中考与高考,它们均属于常模参照测验,是以全体考生在大规模测验中所得到的成绩分布为标准,衡量考生在这一测验上所得到的成绩在全体成绩分布中所处的地位。因此,制作监测工具时应体现较为清晰的参照标准,方便人们理解。

2.实施监测时应尽量避免无关因素干扰

为了保证监测结果的有效性与可靠性,除了把好监测工具制作质量关外,还需要严格控制监测的实施过程,确保实施过程的公平性与合理性,并做好评分组织管理工作,以有利于监测数据与相关信息收集的准确性与客观性。例如,PISA2006 以科学为主要测试领域,阅读与数学为其次要测试领域,测试共有选择题、封闭式问答题、简答题、复合选择题、开放式问答题等五种题型,其中,开放式问答题和部分简答题没有固定答案,需要评分专家进行人工编码,其依据是参加试题审核与试题修订两个阶段的实验性测试(Pilot testing)的学生作答;需要评分专家人工评分的试题大约占总试题量的 45%,PISA设计了试题本轮转程序、评分培训、分类计分、多次评分、评分检查等质量控制环节,以确保各个国家(经济体)之间评分的公平性和一致性。

3.正确认识监测结果

由于教育质量监测采用量化的方式反馈监测结果,而人们总是希望量化的监测结果是教育质量的最好测度,于是在解释监测结果时,往往将监测结果数字的高低与教育质量的高低直接对等,仿佛这种做法比其它评价方法显得更加公平、公正。但从教育测量角度来看,对教育测量结果的认识需要综合考虑多种因素。首先,教育测量结果涉及多个背景变量,而且这些背景变量的界限模糊,难以明确区分主要变量与次要变量,如果测量结果出现异常,就需要从多个角度寻找原因,而不是直接归因于教育质量的高或低。其次,测量结果的解释应放在大的测量对象所在群体中进行分析,脱离测量对象群体单独谈论某一个测量结果数据的高低,其价值很有限。另外,测量结果往往是对教育质量进行的间接推理,它受限于测量工具的命制质量,也受根据工具赋分的评卷过程影响,在解释测量结果时,也需要交待这些相关因素。

五、基础教育质量监测的问题与反思

教育质量监测现在我国教育界已经成为一个政策议题,它不仅激起教育理论界的研究热情,也引发了各地教育行政部门、民间研究机构积极开展这方面的实践探索。2006年5月,教育部依托上海市教育科学研究院成立了教育部基础教育监测中心,对基础教育发展进行宏观监测,通过提供系统数据

信息监测全国及各地区基础教育发展状况,为国家基础教育宏观管理和政策制定提供决策支持服务,为地方政府部门提供信息与咨询服务。2007年,在北京师范大学成立教育部基础教育质量监测中心,开展质量监测工作,拟定质量监测标准,研发质量监测工具,指导各省、市、自治区根据本省的情况开展相关的监测工作。全国各省、市、自治区也相继成立了有关的研究机构或申报了相关的研究课题,积极开展专项研究,例如,广州市教育局自2003年起,积极构建区域中小学生学业质量监测体系,市教研室积极研制义务教育学科学业质量评价标准,并分别于2010年夏、2011年夏进行义务教育阶段学生学业质量抽检,探索义务教育优质均衡发展的有效途径。然而,基础教育质量监测对中小学校、教育机构的反拨作用也呈现出不少令人担忧的问题,主要集中在如下三个方面。

1.学校教育物化与异化现象加剧

教育是生活的需要,教育价值就是教育对现实社会和人的生活带来的好处。如果教育质量监测过于强调群体同一划归的教育质量标准,忽略教育质量的个别化和差异性;过于强调静态式的评价活动,忽视动态发展变化的评价作用;那么教育质量标准在看似公平的外衣下掩饰了事实上质的不公平。

目前所开展的基础教育质量监测首先将教育理念与实践分解为一系列实证地可观察的行为活动,即表现指标,然后,将这一系列的指标转化为可操作化、可量化、以至可计算总和的评估,这样就把学校教育标准化到一个普遍而单一的评价尺度上,按照这个尺度进行的教育就能得到奖励,而这个尺度不能测量到的教育质量要素则被边缘化甚至是得不到认可。这样以来,学校教育理念不仅可能被物化为一套固定的、标准化的指标,而且教育实践也可能逐渐偏离教育的本质。这样的监测,可能导致学习就只是追求标准化、数量化的公开考核成绩及制度化的证书、文凭,其结果成就了一种“应试主义”、“分数主义”及“文凭主义”的学习取向。

由于缺乏科学的、全面的、客观的教育质量评估,以学习成绩、升学率作为学校评价和资源分配的主要标准甚至是唯一标准的现象仍然普遍存在。如果教育质量监测仅仅关注学生的学业质量水平,那么,学校教育中“不考不教、少考少教、考什么教什么”的现象就会愈演愈烈,这是所有人都不愿意见到的。

2.教育质量监测的权利与权限界限模糊,导致统考横行

我国目前的学生学业成就评价权力分散于地方、学校、课堂等多个层面,各种权力持有者在实施学生学业成就评价时,几乎不受任何监控,以至于各种名义的统考横行,而考试本身的专业品质却没有得到有效的保障,甚至高考、中考这样的高利害考试都缺少关于实体(考试的技术质量)和程序(事先的审定机制和事后的监督机制)方面的专业游戏规则。这种混乱带来的后果十分严重,需要引

起政府的高度关注。

3.教师工作负担与学生学业负担加重

我国的基础教育质量监测研究与实施尚处于起步阶段,如何处理好质量监测与日常进行的教育评价的关系,需要重点分析与探讨。如果我们混淆了教育监测与学校、教师、学生评价的界限,那么,监测的实施就很容易被异化,被歪曲。现在,不少地区的教育质量监测常常遇到学校与社会的诸多误解,其中最大的误解就是把质量监测等同于统考,等同于对具体学校和特定师生的评价;所以,从学校到教师,常常想出许多应对之策,比如,为了应对质量监测(统考),甚至小学生都需要做五次及以上的模拟考试,个别学校甚至不惜弄虚作假,其后果是加重了学生和教师的负担,对教育有百害而无一利。

建国以来,我国教育发展的着力点基本还处在办学规模、办学条件、教育投入方面,从政府到社会,人们更多地是以普及率、入学率、毕业率、达标率这样一些相对比较粗放的指标来衡量全国及各地的教育水平;这是与经济、社会发展阶段和发展水平相适应的,也是不可逾越的。随着国家经济实力的增强,教育政策法规的健全,知识经济、信息时代对教育质量提出了更高的要求;基础教育课程改革吸取了世界各国的经验制定了国家课程标准,如何有效利用质量监测全面考察课程标准在各地各级各类学校的落实情况,如何有效地向政府、社会、学校、家长甚至是学生报告为祖国未来培养人才的教育办学质量,事关国家发展战略,已经迫在眉睫。

基础教育质量监测是一项具有高度专业性的工作,需要教育学、心理学、教育统计学、教育评价学、心理测量学、课程教学论、教育管理学、计算机软件编制等方面高度的专业知识和技术的支撑。当前,仅仅依靠地方教研部门、行政部门或研究机构单打独斗,尚不足以各自独立承担起质量监测的所有专业工作。高等院校的专业科研力量与行政部门的政策支持、教研部门的组织与管理相结合,才能够提高学业质量监测的科学性与有效性。

关于中国教育质量标准的框架与思考

作者:基础教育评价专业委员会理事长、北京教科院院长时龙发表时间:2012年06月29日

一、教育质量、教育质量标准与教育评价

教育质量监测的一个上位思考就是教育质量标准,在《国家中长期教育改革和发展纲要(2010——2020年)》中多次提到教育质量标准,而且在提到教育质量标准的时候会涉及到这样几个问题:教育质量、教育质量标准、教育评价。《国家中长期教育改革和发展纲要(2010——2020年)》中有多

种表述,我列举其中的主要表述方式供大家参考:

“把提高质量作为教育改革发展的核心任务。”,这个核心任务如何推进、如何实施,关键词是教育质量;“树立以提高质量为核心的教育发展观。”教育发展观涉及诸多因素,但最核心的是教育质量;“制定教育质量国家标准,建立健全教育质量保障体系。”这是纲要中一个非常明确的表述,中国的教育质量一定要有国家标准;“改进教育教学评价。根据培养目标和人才理念,建立科学、多样的评价标准。开展由政府、学校、家长及社会各方面参与的教育质量评价活动。做好学生成长记录,完善综合素质评价。探索促进学生发展的多种评价方式,激励学生乐观向上、自主自立、努力成才。”这段话中蕴含了非常重要的诸多信息,要提高教育质量就要改进教育评价标准,还要开展多方面参与的教育质量评价活动。

因此,我认为我们要讨论三个概念:教育质量、教育质量标准、教育评价。教育质量是教育发展的价值和预期;教育质量标准是价值和预期的准则与尺度;教育评价是基于价值、预期、准则、尺度的衡量、分析与干预。

二、教育质量标准的必要性和复杂性

教育质量与教育历程相伴而生,并不断走向专业化。这就决定了教育质量标准制定的必要性。

对此,我不在此赘述。我主要想谈谈教育质量标准的复杂性。众所周知,教育是复杂社会问题,所以教育质量标准及教育评价必然是一个复杂的系统,具有复杂性。在开展教育质量标准的研究和教育质量评价的过程中,往往发现这样一些问题:我们所做作的工作是制定规则的,我们希望教育能按照一定的规则来发展,我们也能按照一定的规则评价教育的发展,但是实质上教育的发展暗含着许多的潜规则:如升学率、分数线等等,这些潜规则就意味着教育的复杂性和教育评价的复杂性,同时也造成教育质量标准制定的复杂性。因此,我们在制定教育质量标准时一定要考虑下面这些问题:一是价值判断。开展教育质量评价要制定指标体系,为此要进行数据收集、整理、发布,这些是显性的工作,隐性的工作是价值的判断。用什么样的价值判断来选择我们如何开展教育质量评价工作,也就是说我们开展教育质量评价时要考虑我们的培养目标以及办什么样的教育。

二是评价目的。评价目的和评价对象是紧密相关的,这在《国家中长期教育改革和发展纲要(2010——2020年)》中已经作了非常准确的表述,我们需要进一步学习和领会。我认为评价目的是促进学生发展能力、促进学校发展能力、促进教师发展能力、促进政府统筹和推进教育发展的能力。

三是标准确定。这是教育质量评价中一个很重要的问题。标准是什么,不好回答,这是要认真开

展研究的。其实标准是存在的,只是我们目前所接触的标准是各具特色,甚至可以说是五花八门。像高等院校的排行榜,很多机构在研究并发布排行榜,由于标准不统一,排行榜就不一样。

四是谁来评价。谁来评价涉及四个方面的问题:一是自我评价。教育发展首行要有自我评价,如果都是外部评价,这样的评价是不完善的;二是行政部门评价。尤其是在义务教育或基础教育阶段,行政部门评价很重要,这也是政府的责任。这种评价在一定意义上也属于自我评价;三是专业化的中介评价机构;四是社会评价。这种评价是媒体、舆论等方面的评价,但也是教育评价的重要平台。

五是评价什么。评价什么是和价值判断、教育理想、教育理念紧密相关的。不同的评价有不同的角度,涉及到很多方面,如学业水平、学科水平、办学条件、教育发展、学校发展、公众和社会对教育的满意度、学生的能力等。面对诸多因素,我们的评价的重点是什么?我认为应该把学生的能力发展作为评价的重要内容,而不是某几科的分数,这些分数背后隐含很多问题,分数只不过是显性的数据。

六是信息选择。在研究和制定国家教育质量标准时选择什么样的信息和指标来作为标准的描述是一个基础的问题,同时也涉及了中国教育质量标准的价值和选择,涉及到到底要培养什么人。《国家中长期教育改革和发展纲要(2010——2020年)》对培养什么样的人有很多表述,但给我影响最深刻的一句话是:培养学生服务国家、服务社会的责任感、勇于探索的创新精神和实践能力,这里没有一句话讲到分数。这是我们在制定和研究质量标准时要特别注意的问题。

七是测量工具。测量工具是直接开展质量标准制定和评价的重要条件,在选择测量工具时一定要结合中国的国情。

八是相关因素。这个相关因素基本是一个框,凡是涉及教育质量标准制定和评价的教育系统外部的因素都要考虑在内。如果教育质量标准研制和评价仅仅就教育论教育,只在教育圈中运行是不全面的,因为教育自身的问题和发展与经济社会发展问题紧密相关。

九是社会反应。教育质量标准制定和评价要充分考虑社会反应。这种社会反应主要来自两个方面:一是舆论、一是家长,这些反应在一定程度上能促进教育的发展。

十是公众感受。公众感受与社会反应紧密相连,对公众的感受给予充分关注,这也是教育质量标准制定的一个重要因素。

三、我国教育质量标准制定的基本框架

教育质量标准应该包括五个方面:教育条件质量标准、教育过程质量标准、教育结果质量标准、

学校发展质量标准、教师专业发展能力标准。

(一)教育条件质量标准

教育条件质量标准包括学校建筑、设施设备、场地、器材、图书仪器、学校规模、师资配备等,它是衡量教育条件是否达到质量标准的准则或尺度。通过将教育条件与教育条件质量标准进行比较,可对全国、一个地区、一个学校的教育条件达到增长率条件质量标准的程度做出评价。目前我国各地教育条件质量是不平衡的,《国家中长期教育改革和发展纲要(2010——2020年)》规定国家财政中教育经费支出在2012年要达到4%,这4%首先要保证教育条件达标。

(二)教育过程质量标准

教育过程质量标准是衡量教育过程质量的尺度与准则,包括衡量教育过程质量和教学过程的质量标准,可对全国、一个地区、一个学校的教育过程、教学过程达到国家教育过程质量标准的程度做出评论。教育的硬件条件具备后,教育的过程如何是最关键的。

(三)教育结果质量标准

教育结果质量标准包括促进学生思想品德公民素养发展、身体心理素质发展、文化科学素质发展、艺术素养发展和促进学生创新精神和实践能力发展。我们这里所说的教育结果是指学生全面发展的能力结果,不是指某一学科的成绩和分数。

(四)学校发展质量标准

教育最基本的单元是学校,政策的落实、资金的投入最终都要看学校的质量,要看是否办好每一所学校,办出有特色高水平的学校。

(五)教师专业能力发展标准

教师的专业能力直接关系到教育的培养能力,教育的发展在很大程度上取决于教师的专业能力的发展,如教育的均衡化在很大程度上体现的就是师资的状况。目前虽然有一些标准和研究,但远远不能满足教育发展的实际需要。

四、中国国家教育质量标准的基本准则

(一)价值性

制定教育质量标准一定要考虑其价值性,用什么样的价值来评判教育质量和教育发展,用什么样

的教育理念来规划教育、干预教育、诊断教育。开展教育质量标准研究,要有一个选择,是以学科为主导还是能力为主导,这就是价值性。

(二)民族性

民族性也叫本土化,开展教育质量标准的制定和研究一定要结合中国国情、结合本地区的实际。

(三)国际性

进行教育质量标准的研究不能抛开国际交流和国际比较,要借助国际化充实本土化的教育质量标准研制。

(四)基础性

教育质量标准应该具有普适性,适用于全国所有同级同类学校的最基本的标准。

(五)发展性

教育质量标准应该是以教育质量的基本标准为基础,而又不受这些标准限制的标准,要体现它自身的发展。

(六)可测性

教育质量标准从总体上看是可测的,有利于实施。可测性要求教育质量标准是科学性的、公正性的。但有些东西确实不好测,比如如何用一把尺子测量人的发展特别是个性化发展,这就要求要结合教育自身的情况开展研究。

五、研制教育质量标准的初步思考

(一)我国国家教育质量标准存在的问题

1.缺乏完善、系统的教育质量标准。

2.有关教育质量标准缺少沟通协调。

3.开展教育质量标准的尚不深入。

(二)国家教育质量标准的设想

1.开展全国教育质量现状调查。对教育过程和教育结果的现状的调查。

(1)全国不同地区各级各类学校教育条件(教育资源配置现状调查;

(2)全国不同地区各级各类教育过程现状调查;

(3)全国不同地区各级各类学校教育结果现状调查

2.综合运用现代技术手段分析全国不同地方各级各类学校教育质量现状,制定各级各类学校教育条件、教育资源配置、教育过程、教育结果质量标准。

3.编制各级各类学校教育质量标准监测工具。

4.设计各级各类教育质量监测机构(政府的、半政府的、民间的)的功能。

关于教育质量评价

作者:雅安市委书记徐孟加发表时间:2012年06月18日

在初等教育中,很容易看见的事实是一种因噎废食的情况,即为了迎合所谓的素质教育,而忽视了学生记忆、计算等基本功,造成了很多孩子在基本书写、基本运算、基本知识上的薄弱。这一种薄弱,甚至影响到了孩子进入中等乃至高等教育后的继续教育。从教育测评的科学性分析,摈弃了精确的质量表述,在较为模糊的优良中差判定下,教师教育的针对性明显下降,教育质量在缺乏明确的指标说服情况下,滑坡在所难免。甚至可以看见一些极端的情况,有些鼓吹素质教育的老师,把精力花在了自己的业余事情上,教育使命感明显下降。

一味的推崇所谓的素质教育对于一个发展中国家而言,是不足取的。作为我国当前的教育功能,除了普及性任务以外,还承担着淘汰及选拔精英的功能。如果没有严酷严格的科学的评级体系,其中不公平的东西会更多,进而严重的影响和谐社会的建设进程。无论阶层间流动的渠道被完全阻塞,而代之以名目繁多无明显界限的所谓素质内容的无形栅栏,对于底层向上的浮动无疑是悲剧性的,对于其信心的影响也是悲剧性的。

有些人反对应试教育的理由显得非常荒唐,就是说应试教育鼓励的是死记硬背。但事实上,稍有教育学和心理学基本知识的人都知道,在智力的构成要素中,记忆力是非常的核心因素,记忆力不被重视和开发,对于孩子的成长而言的损失是非常巨大的。而要检验记忆力是否被重视和开发,应试教育是非常必要的。或者说,具有科学性的教育测评是非常必要的。可以肯定的说,远在市场产业化之前,应试教育就已经萌生。学生,家长,老师,甚至教育机构一路愤慨激昂地声讨应试教育,一路井井有条地跟随应试教育的步伐走过了二十多个春秋。教育测评理所当然的会导致人员分流,主要是学生在分数的界限下向不同的职业方向流动,(但是,可以明确的是,虽然教育测评会带来分流,但这种分流无疑比没有任何数字型指标确定的分流更能说服被分流人员),其次是老师(因为学生的分

流,显而易见的带来教师在不同分数段类型的学校流动),人员分流比造成且增大等级差异(但这种差异是经过自己努力可以通过教育测评改变的,后天的努力因素较之于先天的父辈荫庇更能带来受众的相对公平感)。

教育是实现社会最终公平的后天可以努力的重要途径之一。社会各阶层之间的变迁强调流动渠道的畅通特别是向上流动渠道的畅通,是构建社会主义和谐社会的重要基础内容之一。而广义的普及意义的教育对实现个人的阶层流动乃至跨越,其象征意义大于实质意义。因此,只有保证高水平的选拔精英的教育长期存在并向寒门学子敞开大门,才有可能从根本意义上减少社会阶层变迁中的代际继承效应,最大限度地使个人努力的成分重要起来。

虽然说,教育测评本身存在一个弊端,因为测评毕竟是死的东西,人是活的,自然有人会采用迎合测评为进身手段,而非提高自我为基准,正因为存在这个弊端,因此人员分流后提高学习效率的优势不明显,但拉大人与人之间的意识差距是必然的。(有强烈的外在因素干扰)。

在德国的教育上,一直施行的是类似的评测制度。学生小学是没有分的,但升中学时就有区分了,半强制性的划定普通中学、职业中学。中学毕业时,普通中学的学生仍然面临的是层层划分。无论评测是否会有弊端,是否会造成学生不在同一起跑线等问题,一个新的措施,总会有这样那样的缺点的,重要的是发现问题进而改进。坐而论道,不如起而行,去做了,就是好的。我们已经发现了应试教育的弊端,那么,学习国外经验进行改革,推行评测,只要能在一定程度上改进了教育的现状,那就是好的,再发现了评测的问题了,再改进就好。不能因噎废食,因为评测可能有的问题而不搞应试教育了。小平同志说过,改革就是摸着石头过河的干活,现在有了一块石头了,我们还要站在河中央先开个会讨论一下这块石头的地质构造吗?至于说教育测评后造成了人员分流,很容易形成强者越强、弱者越弱的景况,这样在社会上无形中拉大了人与人之间的意识差距。但我们的改革不就是为了打破原有的僵化体制,造成每一个人的差异,从而促使有能者多劳多得的新的有活力的机制的形成吗?有差距就是为了有竞争。为了消除差距而停止改革,是开历史的倒车。再说了,不进行评测就没有差距了吗?不照样有重点中学、普通中学之分吗?上大学不也会个第一批第二批的吗?实行评测反倒有助于我们打破分数的僵化分类,使更多的有能者不会因英语或其他功课的偏科而丧失掉进一步深造的机会,从而产生出更多的人才。做事的不能因为说事的叨叨而一事无成。

事实上,著名历史学家黄仁宇教授曾经就中国在近代落后的历史原因追溯中分析到,从明朝开始的对数目字管理的忽视、模糊化倾向是重要原因。同样,作为教育测评,只应该在实践中更加完善、更能反映学生自身的潜质和努力程度、更能够提供社会各阶层流动的空间和渠道,而不能在实践中成为一种华而不实的技术化工具和装点门面的说辞。

可以明确的是,在科学的发展过程中,剥离生物的、感性的、直觉的、具象的表层,追溯物理的、抽

象的、理性的、规律的本质,既是人脱离自然界后掌控自然界的必然要求,更是人对自身存在的各种生命之外的意义的判断。在这一过程中,怀疑态度、追问态度、辨证态度是科学精神的基本内涵。只有始终怀有思辩立场的研究,才能更接近于本质和规律。也就是说,从生理、物理到哲理、数理的跨越,是人逐渐超脱于普遍意义上的世俗生活的过程。从根本上讲,这是人最宝贵的自由。

建立符合国情的基础教育质量评价标准和质量监测标准

作者:教育部督导办公室副主任林仕梁发表时间:2012年06月28日

基础教育质量监测在国际上已经不是新鲜事,但对我们来讲,仍然是一件新事物。去年上海代表作为一个地区参加了国际经合组织实施的PISA,在国内产生了很大影响。但我觉得PISA仅仅是可供参考的在某一方面作一个比较的通行的评价标准,它是按年龄段进行考核测试的,而在我们国家15岁的年龄段差距很大,农村和城市间的差距更大,农村这个年龄可能在上初一,而城市有可能在上初三或者高一了。因此我认为,如果我们要真正了解国家的教育质量,必须建立符合中国国情的基础教育质量评价标准体制和质量监测标准。

近几年,国家对基础教育质量监测越来越重视,社会的反映越来越强烈,各级各类领导都对质量监测的相关问题做出了重要指示和明确要求。国务院给教育部的一项重要任务就是建立和完善教育质量评估制度、建立教育质量评价体系。这些问题在去年颁布的《国家中长期教育改革和发展规划纲要(2010—2011年)》中都有体现,这既体现了国家对这项工作的重要指示,也是我们做具体工作的一个指导。

早在2007年,中央编制委员会办公室就批准教育部成立了教育部基础教育质量监测中心,在国家层面正式启动了基础教育质量监测工作。虽然开展一些测试,但总的来讲还处于初级阶段,质量

监测的标准和工具还没法与国际上一些专业组织和发达国家的评价机构相比。我们国家虽然在经费上加大了投入,但是专业研究力量上的差距还很大,我们国家的学生数量很大,教育发展不平衡,要制作统一的教育质量标准确实很难。袁贵仁部长说过,如果我们的标准能够真正反映国家教育质量水平,就是国际标准。我们国家东部、中部和西部的教育状况不同,要制定一个质量标准就会碰到很多困难。另外,从教育督导团的工作来讲,虽然近十几年来评估的力度在加大,但在评价政府履行教育职责、在评价学校办学水平的时候,仍然缺乏教育质量的科学标准。

目前,我们对于监测的内涵和国家层面、省市级层面、学校层面的监测任务和中心工作还缺乏一个统一的认识,所以,我希望这次专题研讨会可以围绕这些问题进行讨论。

下面我结合自己的工作介绍一些情况,谈谈自己的看法。

一、基础教育质量监测要为实现《国家中长期教育改革和发展规划纲要(2010—2011年)》的

战略主题和核心任务服务

基础教育质量监测是推进教育健康发展的一种手段、一种工具,其目的是提高教育质量、推进素质教育开展。这也是规划纲要提出的战略主题和核心任务。

《国家中长期教育改革和发展规划纲要(2010—2011年)》在许多地方都提到了做好基础教育监测的相关工作。例如,第四章第八条巩固提高九年义务教育水平中提到:提高义务教育质量。建立国家义务教育基本标准和监测制度;第十条减轻中小学生课业负担中提到:规范办学行为,建立学生课业负担监测和公告制度;在第五章第十二条全面提高普通高中学生综合素质中提到:建立科学的教育质量评价体系,全面实施高中学业水平考试和综合素质评价;在第十一章第三十二条创新人才培养模式中提到:建立健全教材质量的监管制度;在第十一章第三十三条改革教育质量评价和人才评价制度中提到:根据培养目标和人才理念,建立科学、多样的评价标准;在第十五章第四十七条转变政府教育职能中提到:建立和完善国家教育基本标准。整合国家教育质量监测评估机构及资源,完善监测评估体系,定期发布监测评估报告;在第二十一章第六十七条组织开展改革试点中提到:完善教育质量监测评估体系,定期发布测评结果。

综上所述,我们可以看出基础教育质量监测体系的改革不仅涉及义务教育,也涉及高中阶段教育;不仅涉及人才培养体制改革,也涉及国家教育管理行政体制改革。希望通过我们一系列的工作能实现规划纲要提出的战略主题和核心任务。

二、基础教育质量监测的规律和原则

目前国际上监测项目很多,主要是偏向于学生所掌握的适应社会需要的能力建设,这不等同于学业监测。比如PISA项目,它就是离开了具体的国家的课程体系来进行的。作为国家本身的教育监测体系,一定要考虑国家本身的课程体系和教育发展的基本水平。

我觉得法国的评估体系值得我们借鉴。法国的评估体系是由三套评估体系组成:第一套是诊断性的评估。通过对不同年级不同学科的学生进行监测,了解学生在学习过程中的问题。这些问题有的是学生的问题、有的教师问题、还有的学校管理体制的问题。把这些问题反馈给学校和老师,帮助他们改进管理工作和教学工作,以达到提高教育质量的目的;第二套是终结性的监测评估。这种评估类似于我国的小学和初中毕业考试,但是组织机构不一样,我们国家这种类型的考试由不同层次的管理机构组织,没有统一的机制,法国则是全国统一组织;第三套是PISA测试。通过参加PISA测试了解法国的基础教育质量,通过这种考试进行国际比较,了解法国在国际上的层次和水平。这种评估体系中前两套是立足本国,了解本国的水平,后一种是了解在国际上所处的位置,这种方法对我们有非常重要的参考价值。

我们目前所进行的许多监测从规律和原则来讲,换汤不换药,其实还是在做考试。当然考试从某种意义上来说也是一种监测方式,但它与我们所强调的监测的内涵不一样,我们的教育质量监测一定要重视四个方面的问题:一是既要关注学业成绩,还要关注学生能力;二是要关注学生学业情况存在的各种差异,如学校间差异、城乡间差异、县域间差异;三是要关注教学的效率。要关注影响学生学习的相关因素,如学习习惯、正确的学习态度、积极的人生观和学习兴趣等;四是要关注学生的学习规律和人才的成长规律。学习是一个循序渐进的过程,但在学校的教学活动当中,有很多拔苗助长的现象;另一方面要关注学生的心理健康,目前我国学生的忧郁的程度一般要比国外学生高,自我感觉和对社会的认识、在学校的人际关系问题比国外学生更为突出。

我们的监测不是一般意义上的考试,也不是针对具体学习和具体的人,是为了监测学生完成课标内容后的能力和综合素质,是为了了解学生间差异及因素影响,只有这样才能做出正确的归因分析。

三、基础教育质量监测要成为教育督导评估的工作基础和专业支撑

刘利民副部长进行专题调研时谈到:现在全国都在落实《国家中长期教育改革和发展规划纲要(2010—2011年)》,推进均衡发展是义务教育重中之重。但是,基本均衡、相对均衡、高位均衡的标准是什么。不能是只是看办学条件、看硬件,得看教育质量,但质量上的均衡标准很难制定。

刘利民副部长希望我们的教育质量监测标准不要照搬国外标准,要为当前我国义务教育的重中之重服务,我们建立的教育质量监测体系,同时成为评估义务教育均衡发展的体系,成为对学校、对政府进行督导评估的体系。

浙江省提出要把基础教育质量监测的结果作为评价区县教育现代化的重要指标,这是一个很好的探索。教育质量的现代化不再是指学生的考分,而是要把涉及的教育质量方方面面的因素都要考虑进去。

基础教育质量监测是一个非常重要的事情,国家正在考虑要整合资源,要成立专门的部门机构来实施。目前成立了一些专门的监测机构,但运行状况不是太理想。其实质量监测部门不同于一般的教育教学部门和教育科研部门,但现在只有在这两个部门中才有专业的人来做这件事。从发展的趋势来看,质量监测部门需要独立进行运作,因为它是介于教学和科研之间,它是为行政部门服务,它要把在监测中的技术成果转化为政策依据,把对教育质量的专业判断变成决策支撑,这样才能利于通过监测结果发现问题,总结经验;才有利于对政府、对学校做出客观的评价。

四、基础教育质量监测要整合资源、明确定位、有序推进

目前我国的质量监测分好几个层面开展工作,那么每个层面的任务究竟是什么?

国家层面的任务应该是制定标准、开发工具、组织实施监测、指导地方开展监测、提供技术指导;

省一级的机构要考虑如何在执行国家的标准的前提下结合本省的情况补充和完善监测工具,还要承担国家分配的部分任务。比如协助国家组织监测,搜集数据等;学校要转变观念,了解质量监测的目标和要求,根据目标和要求组织实施;

教育督导部门代表国家行政部门,要把国家规划、意图及时反映给监测部门,教育质量监测中心和督导部门要经常沟通,双方共同商量和规划,一定要避免双方工作脱节。另外,教育督导部门要积极参与质量监测的相关工作,了解监测的过程、工具、结果等,还要用好监测的结果。教育督导机构在今后的发展过程中将成为相对独立的机构,它的主要任务是公布监测结果,执行监测结果,审核监测报告,把握监测的基本走向。

希望各地的科研部门、监测部门和学校都要参与进来,共同努力,为我国基础教育健康发展做出贡献。

学业评价应着眼于学生全面发展

作者:张贵勇发表时间:2012年06月13日

以学科知识、书本知识为主,内容过于窄化,方法单一,主要通过纸笔测试,日常教学与评价的关注点指向升学考试……种种弊端使得当前的中小学生学业评价饱受诟病。而刚刚结题的“中小学生学科学业评价标准的研究与开发”课题,从提高教师评价能力出发,提供了多种类型的评价方法与样例,并侧重对学生情感、态度与价值观评价方面,进行了有益探索。

日前,国家社科基金“十一五”规划(教育学科)国家课题“中小学生学科学业评价标准的研究与开发”成果公开报告会在人民教育出版社举行。课题推出了与新课程标准相配套的中小学生学业评价标准。该标准希望实现两大功能,一是提供学生在知识与技能,过程与方法,情感、态度与价值观方面应达到的标准,并达到可观察、可测量的程度;二是指导教师如何评价学生是否达到了标准。这些学业评价标准除了以评价方法建议、评价样例和学生作品示范评价方法运用外,最引人关注的还是在评价内容上有了实质性的突破:提出了评价学生的情感、态度与价值观,以及解决实际问题能力的方法、途径和体系,尽管还称不上完善,但已初显学生学业评价的核心与趋势。

初中生物学业评价标准有这样一个样例:“很多人认为家蝇是一种令人讨厌的害虫,它滋生于垃圾堆并从中觅食,然而,人们又从家蝇的生存环境、独特的形态和生理特征上获得了灵感……关于家

蝇在自然界中的作用及其与人类的关系,你还知道哪些事例?请举出两个,并谈谈你的认识。”对此,北京师范大学教授、高中生物课程标准研制组核心成员朱正威评价:“该题采用开放式的问题,考察学生对家蝇相关知识的了解,并能认识到任何一种生物与人类的关系都存在有益的一面。评价样例具有开创性,特色鲜明,填补了国内生物学评价中有关对学生情感、态度与价值观评价的空白。”

“本评价体系更强调质性评价和表现评价,有助于克服已往评价中存在的片面性和诸多积习。”课题负责人、人民教育出版社原总编辑徐岩告诉记者,当前我国有关学业评价标准的某些成果更类似于教参或练习册,其适用范围有限,有的甚至是单纯为设计纸笔考试框架而设计。而该课题基于学业评价的视角,依据课程标准,详细描述学生在不同学段的学习结果,并提供了评价方法和评价样例,有助于帮助教师和教育质量监测部门等评价学生是否达到了课程标准的要求,有助于为各地学业水平考试提供参考,为教材编写和教学资源开发提供指南。

据了解,学业评价标准初稿完成后,为了检验各学科学业评价标准初稿的科学性和可行性,包括对表现标准、评价方法、评价样例进行实践检验,筛选、设计、积累更多更好的评价样例,并收集真实的学生作品及教师评注,课题组一方面在学校进行实验,一方面征求专家意见。课题组在全国各地选取了城市、乡镇、农村的中小学试用评价标准,进行了纸笔测试、表现评价样例试用、课堂观察、学生作品分析、问卷调查等。同时,课题组还邀请专家学者对评价标准初稿进行审读,提出意见和建议。

据课题组学术秘书、人教社科研部丁朝蓬研究员介绍,该学业评价标准提出的是绝大多数学生都可以且应达到的合格标准,是标准参照的评价,没有随意增加难度,因此不会增加学生负担。评价标准中建议的评价方法和样例类型多样,如属于表现评价的历史话剧创作、自选材料制作细胞模型、制作某个国家的旅游手册、模拟法庭辩论、收集种子等活动,都比纸笔测验更生动、更有趣,也更能展现学生的个性和优势,预计将会受到学生欢迎。另外,这些生动的样例或活动都是在教学中可以使用的方法,可以成为教学活动的一部分,原则上宜粗不宜细,不追求评分的精确,也不强制教师必须完成,因此不会给教师增加过多的负担。

“学业评价应着眼于学生的全面发展。可以说,该课题研发的学业评价标准与课程标准倡导的理念完全一致,学生和教师在接受上并无困难。”在徐岩看来,真正的困难是学校和教师往往被升学率裹挟,不愿改变现行的评价方法,但可以肯定的是,运用多元评价方式,关注情感、态度与价值观发展,在终身发展的基点上构建学生评价标准,才是未来学业评价体系的大势所趋。

相关文档
最新文档