西方教育评价的发展历程
国外教育评价的发展历程

在这一时期的标志是大量测量技术的运用,评价者仅仅扮演“测 量技术员的角色”。
测量的弊端: 无论是知识测验还是人格测验,都只能做中断的
测定,不能全部了解人格的发展与知识学习过程, 完全忽视了学生在态度、兴趣、情感等方面的表现;
测验只是注意于客观的信度,忽略了质的分析, 不足以说明效度;
教师为测量成绩所采用的学业测验,根本就是 教科书中心主义;
3.教育测量的兴盛期(1915---1930年)
1905年,法国人比纳(A·Binet)为适应对弱智儿童进行 教育的需要,制定了第一个实用的智力测验量表。《比 纳—西蒙量表》,比纳被称为智力测量的鼻祖。
1908年,美国教育家斯通(C·Y·stone)提出了客观化测 试算术的方法。美国的30-40个大学校系统采用新的客观测 验方法,对一些教育活动进行综合测量,测量内容为算术、 拼字、书法和英语作文,以评价教学质量。
1882年,英国高尔顿(SirF·Galton) 在伦敦设立了人 类学测验实验室,对人类个别差异进行研究。他在统计 学者皮尔逊(K·Pearson)的帮助下,设计了许多统计方 法。一些教育家借鉴这些统计方法,把不同学生的学习 能力与学习效果量化,并加以客观比较。
1897年,美国人莱斯(J·M·Rice)发表了《拼字实验 》 他对20所学校的1.6万名学生所作的拼字测验的结果,测 验表明:8年中每天花45分钟同每天花15分钟进行拼字练 习的学生的测验成绩并没有多大区别。因此,他提出要 对教学方案进行改进。 在以上这些测量研究潮流的推动下,一场教育测验运动兴 起了。
教育评价的历史发展
2016
第一节
西方教育评价的发展
美国现代教育评价专家马道斯(George F.Madaus)和斯 塔弗尔比姆把教育评价发展划分为以下七个时期: (1)变革时期(1792—1900); (2)效率与测验时期(1900—1930); (3)泰勒时期(1930—1945); (4)萌芽时期(1945—1957); (5)发展时期(1958—1972); (6)专业化时期(1973—1983); (7)扩展与整合时期(1983—2001)
第四代评估——教育政策

Xi’an Jiaotong University
• 我们需要一些模型、范式、一套方法工具,它可 以突破传统的西方科学,并允许本土知识作为围 绕社会行动计划的一种有意义的话语形式出现。 第四代评价具有这种可能性。 • 再次,第四代评价受到普遍欢迎,因为它不依赖 于特定的话语,除了那些多义、多元化利益的具 有发言权。
Xi’an Jiaotong University
3.教育测量的兴盛期(1915---1930年) 教育测验已发展成三种不同性质的测验:学力测智 力测验和人格测验。 在学力测验方面,据统计,从桑代克发表书法量 表到1928年为止,已有标准心理测验和标准学力 测验三千余种之多。 在智力测验方面,A· Binet《比纳—西蒙量表》等 在人格测验方面,1921年,华纳德着手试作人格 测验;1924年至1029年,H· Hartshorne等人组织 了人格教育委员会,着手研究人格测验工具,并 不断加以改进。
The Interpretive Turn:“解释学转 向”
• 历史,文学和社会科学学科中的解释学转向,可 以被看作是一种认识,即事实只有在一些理论框 架内是“事实” ,事实上,很多所谓的科学是一 个理论话语系统内的主张( Bloland ,1995)。 这是相当接近上自然或第四代评价提出的社会建 构原则的声明。 • 社会建构主义断定,两种现实并存,并在同一域 内运作: • 第一个现实存在于有形的物体,地点和事件,存 在于有特定的社会和历史地点和社会性兴趣的个 人、团体。 • 第二个现实主要存在个人和团体的头脑,并且由 人们对有形的、物理的现实感受组成。
Xi’an Jiaotong University
• 显然,收集这样的社会/心理结构的工具是:定性 方法。这是强调定性工具作为最佳的了解手段— 但不是“测量” —利益相关者的意义输入活动 (meaning-imputing activities)无疑增加了对第 四代评估只使用定性研究的误读,这显然是一个 错误的印象,来源于阅读的失败或误读。 • 意义理解的认知活动,和并有关这些活动的数据 收集(尤其是收集定性数据)是构成,重构和修 正(改造,扩大,放大,反思,延伸纠正)结构 的形式,它们是高度解释性活动。 • 因此,社会建构主义能很好包含在在过去的20年 里影响着历史,政治学,人类学,社会学,语言 学和各种文学研究的解释学转向中。
教学评价的发展历程

教学评价的发展历程教学评价的发展历程教学评价是对教学价值的评价,产生于西方,到现在已经历了四个时代:第一代评价--测量式的"测验",其活动主要是考试,有口试和笔试两种形式。
这就是把教学评价说成教育测量的历史根源,影响最典型的是:"学校是人才的加工厂""学生是原料和产品""教师是加工者"。
第二代评价--一般称为"描述",从20世纪30年代初到50年代中期,代表人物是美国著名心理学家泰勒,他提出泰勒模式或称泰勒原理,用以确定学习结果与教育目的之间的程度来定义教育评价。
学习目标→学习策略→学习过程→学习结果↓______________↑(泰勒评价流程图)基本特点:把教育结果与预定教育目标相对照的过程,是根据预定的教育目标对教育结果进行客观描述的过程。
评价的关键是确定清晰的、可操作的行为目标。
评价不等于考试和测验,而考试和测验可以成为评价的一部分。
这一代评价即所谓的"科学评价"。
第三代评价--称为"判断",从20世纪50年代中期到70年代,教育评价本质上是判断,人们对已经确立的教育目标质疑,认为它们也应该成为评价开始的对象、进而涉及到对判断的质疑:判断是否应作为评价的一项基本活动?判断是够需要标准?如果需要,如何建立价值中立的客观标准?因此对目标也要加以判断。
这一评价的特点是:把评价视为价值判断的过程,评价不只是根据预定目标对结果的描述,预定目标本身也需要进行价值判断。
第三代评价也有很大影响,现在常见的"形成性评价""目标游离评价""内在评价""过程性评价"等都是第三代评价的观念。
人们认为前三代评价的缺陷有三个:其一,管理主义倾向。
管理者决定了评价,在评价中出现了管理者无过失、评价者无决定权、其他评价利益相关者无法表述自己的观点维护自己的利益,评价可能有失公允。
西方学校教育发展历程简述

西方学校教育发展历程简述西方学校教育的发展历程可以追溯到古希腊时期。
当时,教育的目的是培养良好习惯和智慧,教育方式多为口传或面授。
随着罗马帝国的兴起,西方学校教育进入了文艺复兴时期。
在文艺复兴时期,欧洲的学校教育开始向形式化和体系化的模式转变。
大学和专业学院的兴起,为西方教育提供了更为完整的教育体系和更为规范的学术评价体系。
此时的学校教育主要依靠书本和讲座,强调知识的传授和学生的自我掌握能力。
到了近代,以美国和欧洲为代表的西方国家开始推行强制教育制度。
此时候的学校教育注重培养学生的批判性思维和创造性思维能力,并且强调对于学生精神上的发展的重视。
主流教育理念包括:孩子先天的天赋决定其音乐和艺术潜力,因此花费大量时间和精力为孩子寻找音乐和体育天赋等;此时还有George Sherman的“教育原理找到了运动员和其他领域的天才,他们都有特别的身体特征和行为习惯。
”;珍妮范肯头对教育和人类身体和心理发展的研究则是本时期的新颖理念。
20世纪初,新教育运动兴起,西方教育注重学生的个性化和探究式学习。
这一时期的典型代表是芬兰,在这个国家教育制度中,学校选用“敢于尝试”和“错了就改进”的教学方法,注重“学生快乐、学生为中心”的教育理念。
日常教学中不会严格按照要求诱导学生,忽视其天性的能力。
芬兰教育的模式成为全球教育的一个典范,被其他国家争相学习。
互联网的出现也给西方教育带来了深刻的影响。
如今,越来越多的学校开始探索在线教育和混合式学习。
MOOC(Massive Open Online Course)成为教育科技的一大热门,越来越多的人通过网络进行远程学习和学习。
综上,西方学校教育发展历程经历了从古希腊时期口传为主,到文艺复兴时期形式化和体系化,再到近代推行强制教育制度,到新教育运动兴起,再到互联网的出现等多个阶段,不断地推陈出新、丰富多彩。
今天西方的学校教育越来越注重学生的个性化和探究式学习,旨在通过丰富多彩的教学方法,为学生的全面发展提供更加广泛的机会和条件。
教育评价的历史和发展

唐宋以来,由于政治的需要,统治者越来越重视 科举,学校为其左右,日益成为科举的附庸, 学校教育的教学内容与方法,必须适应科举的 需要,考试制度更是如此,尤其考试方法,几 乎完全依照科举考试。
1897年,美国人莱斯——一位教育行政 官员,发表了著名的拼字测验
2、开拓期(1900—1915年)
1904年,美国心理学家桑代克发表了《精神与 社会测量学导论》,这是一本划时代的巨著, 标志着教育测量运动的开始 ,桑代克被称为教 育测量运动之父。他提出“凡是存在的东西都 有数量,凡是有量的东西都可以测量。”这一 命题虽言过其实,却引发了人们对于教育测量 的广泛兴趣及探索的热情。
1、西方教育评价的产生和发展大致经历了哪几 个阶段?
2、教育评价起源于哪里?说明理由
3、教育测验运动产生的背景是什么?其产生的 标志是什么?
4、把教育评价作为一门科学进行研究是从什么 时候开始?是什么原因促使了“评价运动”发 生?
5、我国古代考试制度的演变历程是怎样的?
6、我国教育评价的发展趋势有哪些?
尽管如此,在1300年的时间里,学校的考试制度还是取得了 一定的改进和发展。特别是宋朝出现的积分法,以及至元、 明时期进一步发展形成的积分制。
如明朝国子监规定,在高年级的孟、仲季月分别进行一次考 试,每次试卷分三等,文理俱优者得一分,理优文劣者得 半分,俱劣者不得分向定量评价的开始,在我国 教育评价发展史上无疑是一个重要的进步。
第一,无法准确地测量人的社会态度、审美情趣等重要 的人才素质。测量只关心数量,因人格发展方面的许 多因素是无法完全数量化的。
第一章西方教育评价发展

四、判断阶段(多元模式期)
这一阶段侧重于“判断”,时间自20C50A~70A, 即“第三代评价时期”,教育评价在本质上被认 为是“判断”,判断目标、价值标准等。
时代社会背景: 1957年苏联发射第一颗人造地球卫星,引起美国 全国轰动,究其原因,美国人认为是自身教育质 量不高所致。 1958年,《国防教育法》出台,拨款投入中小学 理科及外语的教育,教育评价也因此而有所更新。
三、描述阶段(目标分析期)
这一阶段侧重于“描述”,时间自20C30A~50A, 也即“第二代评价时期”。
教育评价本质上被认为是“描述”,
即描述教育结果与教育目标的一致程度,真正的 教育评价就诞生于此时。
“课改”背景:这一阶段的教育评价是随着“八 年研究”(一场规模大、历时长的“课改”实验) 而兴起的;
第四,泰勒认为,教育评价是个变化着的概 念,因为社会在变化,教育在发展,评价没 有一个永恒的概念和模式。这对于后来的教 育评价的研究是一个巨大的启示。
泰勒的研究使人们意识到:通过简单的事实性测验 不能引发高级的心理过程,也不能测定高级的心理 过程; 纯粹的事实性知识的教学并不能促进其他教育目标 的实现。 在泰勒的影响下,英美等国家出现了许多针对评价 而设计的教育目标体系,其中以泰勒亲自参与并指 导的布卢姆的教育目标分类学的研究最为著名。
古罗马时期的教 育信条:“男孩的 耳朵是长在背上 的。”
人们发现,笔试较之口试有诸多优点:
1、考试比较公平。 2、考试评价的效率比较高。 3、考试全面,总结教训。
这一阶段教育评价的主要特点:
1、整个教育评价主要以考查作为手段来 检查学生掌握知识的情况。
2、纸笔考试评价已经产生。
2教育评价的历史和发展

尽管如此,在1300年的时间里,学校的考试制度还是取得了 一定的改进和发展。特别是宋朝出现的积分法,以及至元、 明时期进一步发展形成的积分制。 如明朝国子监规定,在高年级的孟、仲季月分别进行一次考 试,每次试卷分三等,文理俱优者得一分,理优文劣者得 半分,俱劣者不得分,一年内积分达到八分者为及格。这 是我国教育从单纯定性评价走向定量评价的开始,在我国 教育评价发展史上无疑是一个重要的进步。 科举考试制度,废于清末,历时1300年,是我国历时最长的 一种选士制度,对我国乃至世界的考试制度有重要的影响。 孙中山先生说:“现在各国的考试制度,差不多都是学英 国的。穷流溯源,英国的考试制度,原来还是从我们中国 学去的。”
目标游离模式
斯克里文首先提出的一种更具有客观性 的模式。强调应重视预期不到的“副效 应”或“相反效应”的影响,主张作出 评价结论的依据,不是方案制定者的主 观意图,而是活动参与者所获得的全部 结果。
应答模式
由斯塔克首先提出后由他人进一步发展 而形成的。主要用于评价教育计划,它 的主要特征是回答关心教育计划的所有 人提出的问题。
传统考试的弊端
第一,考评范围太窄,往往只是局限于 一些记忆性的知识与技能,不能全面衡 量人才的质量 第二,评分标准不客观。传统考试多采 用主观试题,缺乏统一的评分标准。因 而,结果的主观随意性很大。 第三,命题程序也不够科学,缺乏对试 题的筛选与验证。
二、 教育测量运动时期(19世纪初---本世 纪30年代) (一)西方的教育测量运动 1、萌芽期(1800—1900年) 1864 年,世界上第一个教育测量的量表 产生,由一名叫乔治 · 费舍的学校校长编 制。 1897 年,德国心理学家冯特建立了第一 所心理实验室,主张加强对实验条件的 控制,实现测量标准化
浅析国外教育评价发展的主要阶段及特点_胡玲翠

中国校外教育 理论 教研探索06/2007浅析国外教育评价发展的主要阶段及特点◆胡玲翠 许有教育评价已经成为各国用来管理高等教育的有效手段,分析国外教育评价的不同发展阶段,总结各阶段的特点,对于丰富和深化我国教育评价理论有重要的理论价值,对于推动教育评价实践的发展有重要的实践意义。
国外教育评价 主要阶段 阶段特点 教育评价的发展历史始终以对教学的评价为发展主线。
随着教育评价研究的深化,教育评价的范围逐步扩大,由最初单纯对教学的评价发展到对教师、学校、教育管理人员等的评价。
但其评价的核心仍然是教学评价。
因此教学评价,即所谓的教育评价是伴随着教育的出现而出现,并伴随教育研究的发展而逐步发展起来的。
就教育评价的发展历程来看,主要可以分为以下四个阶段。
一、以测量为标志的第一代教育评价(1900-1930)第一代教育评价出现在十九世纪后期至20世纪30年代。
英国的高尔顿通过对个体差异的长期研究,于1869年发表了《遗传的天才》一书,揭开了教育测量的序幕。
1879年,德国的冯特在莱比锡首创了心理实验室,使实验心理学家逐步摸索出了一套测量方法,对教育测量的发展产生了积极影响。
十九世纪最后十年,各种测量随着心理实验的发展层出不穷:1889年厄恩编制的测验,将能力分为知觉、记忆、联想和运动机能等四种;1892年波尔顿试行记数测验,测量儿童记忆力;1896年艾宾浩斯首先用填充法测量学生智力;1896年皮尔逊改进了他的老师高尔顿的相关系数的计算,在法国数学家布拉维的研究基础上创立了积差相关公式;1897年,美国的莱斯发表了他对20个学校的1600名学生所作的拼字测验的结果,更引起了人们对测验方法的普遍关注,对后来教育测量的发展产生了深远的影响。
在这种背景下,1904年,美国的桑代克发表了《心理与社会测量导论》一书,系统地介绍了统计方法和编制测验的基本原理。
该书提出了“凡存在的东西都有数量,凡有数量的东西都可以测量”的基本观点,为教育测量奠定了理论基础,对教育测量学的建设与发展做出了巨大贡献。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西方教育评价的发展历程
一般来说,虽然教育评价制度的最初萌芽是我国古代的考试制度,但教育评价制度和理论的真正形成和发展是19世纪后半期以来西方尤其是美国教育家努力的结果。
所以,世界范围内教育评价的发展一般指西方教育评价的发展。
西方教育评价的发展可以分为两个阶段:
一、教育测验阶段
教育评价是从教育测验中发展起来的。
从19世纪后半期开始到本世纪30年代,教育测验阶段经历了约80年的时间。
这一阶段的中心问题是学生个体测验的客观化和标准化问题,它又可以分为下述三个阶段:
1.萌芽期
19世纪上半期以前的西方各国,学校考试主要是对学生逐个进行口试。
1845年,美国初等学校普及,学生人数剧增,对众多的学生一一口试已不可能。
于是,在美国著名教育家贺拉斯·曼(Horace Mann)的倡导下,波士顿市教育委员会率先在美国以笔试代替口试,从而开始了以统一的试卷测验众多学生的新时期。
为了提高书面测验的客观性,力求测验的客观化,英国格林威治医学院院长费舍(G.Fisher)搜集了许多学生的考试成绩,并依据一定的价值标准汇编成成绩量表,试图为当时的考试提供一个可供参考的客观标准。
但由于种种原因,费舍的工作没有引起当时人们的足够重视。
1897年的莱斯(Joseph Rice)拼字测验引起了人们对教育测验问题的极大关注。
这一年,莱斯发表了他对20个学校一万六千名学生所做的拼字测验的结果,结果表明:8年中每天花45分钟同每天花15分钟进行拼字练习的学生测验成绩并没有什么区别。
这一结论尽管遭到了不少人的反对,但它引起了人们对测验问题的普遍关心,推动了教育测验问题的研究。
莱斯也因此被人们称为教育测验的创始人。
2.开拓期
前面提到的教育测验先驱们,仅仅是试图用一定的测验尺度寻求一定客观量的结果。
教育测验的客观化、标准化受到极大重视还是开拓期的事情。
教育测验的开拓期是指从1904年到1915年这十余年的时间。
1904年,美国心理学家桑代克(E.L.Thorndike)发表了《心理与社会测量导论》,标志着教育测验开拓期的开始和教育测验运动的开始。
在这本书中,桑代克系统地介绍了统计方法以及编制测验的基本原理,
并提出了著名的论断:“凡是存在的东西都有数量,凡有数量的东西都可测量。
”这一论断对教育测验的发展起了很大的推动作用。
3.兴盛期
教育测验的兴盛期是指自1916年至1930年这15年的时间。
1916年斯坦福大学教授推孟(L.M.Terman)主持修订了法国心理学家比奈(A.Binet)的智力量表,首次引用了德国人斯登(W.Stem)提出的智商概念,从而使心理测验达到了较为成熟的阶段。
在心理测验的基础上,教育测验也迅速发展起来。
这一时期的教育测验已发展成为包括上述智力测验、学历测验和人格测验三种不同性质的测验。
在学历测验方面,据统计,到1928年止,已有标准心理测验和学历测验三干多种;在人格测验方面,1921年,华纳德(G.G.Fernald)着手试做人格测验,1924年至1929年,哈芝恩(H.Hartshorne)等人组织了人格教育委员会,专门研究人格测验工具,并使之相当精密。
二、教育评价阶段
随着教育测验的发展,教育测验的一些弱点也逐步暴露出来。
因而,随着教育测验兴盛期的结束,自本世纪30年代开始,教育评价的概念被提了出来。
教育评价阶段经历了从30年代到现在五六十年的时间。
这一阶段一般可以分为下面三个阶段:
1.测验运动的批评期
随着教育测验运动的不断发展,人们认识到了教育测验的一些不足,如教育测验尽管能使考试客观化、标准化,但它不能对人的全部进行测量,即使是包含面很广的学历测验也不能测得学历的全部领域,从而也就无法把握教育的所有方面。
因此,教育测验运动在很多方面受到人们的批评。
当然,教育测验运动在这一时期受到批评,还有其深刻的政治、经济原因。
1929年,美国发生了大规模的经济危机,经济危机使得大批青年失去了就业机会,只能涌向中学。
而当时中学课程的设置主要是以升大学为目的,不适应整个社会和失业青年的需要。
在这种情况下,美国俄亥俄州立大学教授泰勒(Ralph W.Tyler)在卡内基基金会的资助下,于1934年开始了历时8年的课程与评价研究,这就是教育评价史上著名的“八年研究”。
“八年研究”的结果表明,当时的课程和测验都是以教科书为中心的,并不能真正反映学生全面发展的情况。
在对以前的测验进行批评的基础上,泰勒提出了一套以教育目标为核心和依据的课程编制和测验编制的原则,试图以此把社会的要求和学生个人的需要反映在课程和测验之中,并正式提出了教育评价的概念。
根据泰勒的观点,教育评价就是衡量实际活动达到教育目标的程度,测验只是它的一个手段。
泰勒的理论在当时受到了较为广泛的欢迎。
2.平衡发展期
这一时期主要是指从1940年到1957年。
在这一时期里,泰勒“八年研究”报告中关于教育评价的理论和方法逐步被人们接受,人们普遍认识到教育评价是教育领域中的重要课题,因此,不少人着手发展泰勒的评价模式,并研究每种教育活动的教育目标。
比较有代表性的研究是布鲁姆(B.S.Bloom)关于教育目标分类的工作。
所有关于教育目标的研究对于完善泰勒的教育评价理论均起了重要作用。
但总的来说,这一时期教育评价处于平稳发展的时期,没有什么新成就和新突破。
3.专业化时期
这一时期是指从1957年至今。
1957年,前苏联第一颗人造地球卫星上天,在美国朝野引起了巨大反响。
美国人在深刻反省后的结论是他们在科技方面的落后反映了教育上的落后。
为此,他们开始了较大规模的教育改革。
在教育评价领域,人们也重新考察了当时占统治地位的泰勒模式,认为泰勒模式存在着根本性的缺陷。
具体地说,教育评价如果以目标为中心和依据,那么目标的合理性又根据什么来判断呢?教育活动除了达到预期的目标之外,还会产生一些非预期的效应与效果,这些非预期的效应和效果要不要进行评价呢?等等。
在这种背景下,泰勒模式的权威性受到挑战,各种教育评价模式应运而生。
各种评价模式的出现,又更进一步激发了人们对评价活动的研究兴趣。
由此,教育评价迅速成为一种专业化活动——高等学校中出现了为数众多的教育评价专业点,多种专门研究教育评价的专著、文章相继问世,各种评价中心也纷纷创立。