--教育统计与测量PPT课件
合集下载
第七章 教育统计与教育测验 PPT课件

例如:考试成绩,温度
第一节 变量与变量的 种类 二、变量
4.定比变量 定义:既有测量单位又有绝对零点的变量。 特征:有测量单位和绝对零点;可比较大小, 能进行四则混合运算 例如年龄和收入这两个变量,固然是定距变量,同时又是定比变量,因为 其零点是绝对的,可以作乘除的运算。如A月收入是60元,而B是30元,我 们可以算出前者是后者的两倍。智力商数这个变量是定距变量,但不是定 比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某 人的智商是0分就是没有智力;同时,由于其零点是不固定的,即使A是 140分而B是70分,我们也不能说前者的智力是后者的两倍,只能说两者相 差70分。因为0值是不固定的,如果将其向上移高20分,则A的智商变为 120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原 先的两倍了。摄氏温度这一变量也如此。定比变量是最高测量层次的变量
第二节 描述统计
一、统计表 3.次数分布表:用来描述一组数据中每一数值 或一段数值内数据出现的次数。用于了解该 组数据的分布情况。 次数分布表绘制的步骤: ①求全距; ②确定组距和组数; ③决定组限; ④分组登记次数。
试验或调查研究所得资料,往往有很多观 察值,如有几百个观察值时,未加整理就 很难得到明确的概念。如果把这些观察值 按大小或数据的类别分组,制成关于观察 值的不同组别或不同分类单位的次数分布 表,就可以看出资料中不同表现的观察值 与其频率间的规律性,即可以看出资料的 频率分布的初步情况,从而对资料得到一 个初步概念。次数分布表的制作方法,根 据变数种类不同而略有不同,分述如下。
例如:人数、身高、速度
第的级别最低;
定类变量属于定性型;定距和定比变量属于定 量型;定序变量可以看成是定性型,也可以看 成是定量型。
教育统计与测量

X i max:第i题的总分值; kP 1 选择题的难度系数校正 CP = , K为选项数 k 1
Xi Pi = X i max
X i:考生第i题的平均得分; :考生第i
高低分组法:两端组被试(各27%)得分率的均值 高低分组法
PH + PL P = 2
题目的区分度
区分度:题目区分被试能力、水平的能力,又称鉴 区分度 别力。 D 区分度的估计方法 相关法:计算题目得分与总分相关。其中 相关法 积差相关适用于多值计分题目; 积差相关 点二列相关适用于二值计分题目。 点二列相关 高低分组法:以高分组和低分组在特定题目上得 高低分组法 分率之差作为衡量区分度的指标。
名人谈教育统计与测量
从事教育的人若不懂教育统计学就不能称为教育科学家。 心理学家、教育学家 艾伟 在一些教育科学论文里大都是抽象文字描述和典型事例 说明,缺乏定量分析,很难说有多高的科学性。 姚依林 “统计是制定政策的主要依据” 怎样运用数据和我们的科学水平有关,停留在生动和突 出事例来说明问题这样的水平是危险的,容易犯宽大的毛 病,结果会导致脱离实际的偏向。 费孝通 “开展教育社会学研究”
y2 1600 100 100 100 900 2800
xy 80 -10 0 -10 60 120
∑
区分度估计值:题分与总分的积差相关系数。 区分度估计值:题分与总分的积差相关系数。 积差相关系数
∑ (X r=
i
X )(Yi Y )
y
n σ xσ
=
∑ xy ∑x ∑y
2
2
=
120 10 × 2800
提高测验信、效度的方法
测验中题目的数量应适当,不能太少。 紧密围绕教学大纲和教学目标命题。 考核内容应全面,并能有效代表学生应掌握的知识 领域。 测验的整体难度适当,不同类型、不同难度的题目 应保持恰当比例。 少出偏题、怪题,一般应以考察基础知识和基本能 力为主。
Xi Pi = X i max
X i:考生第i题的平均得分; :考生第i
高低分组法:两端组被试(各27%)得分率的均值 高低分组法
PH + PL P = 2
题目的区分度
区分度:题目区分被试能力、水平的能力,又称鉴 区分度 别力。 D 区分度的估计方法 相关法:计算题目得分与总分相关。其中 相关法 积差相关适用于多值计分题目; 积差相关 点二列相关适用于二值计分题目。 点二列相关 高低分组法:以高分组和低分组在特定题目上得 高低分组法 分率之差作为衡量区分度的指标。
名人谈教育统计与测量
从事教育的人若不懂教育统计学就不能称为教育科学家。 心理学家、教育学家 艾伟 在一些教育科学论文里大都是抽象文字描述和典型事例 说明,缺乏定量分析,很难说有多高的科学性。 姚依林 “统计是制定政策的主要依据” 怎样运用数据和我们的科学水平有关,停留在生动和突 出事例来说明问题这样的水平是危险的,容易犯宽大的毛 病,结果会导致脱离实际的偏向。 费孝通 “开展教育社会学研究”
y2 1600 100 100 100 900 2800
xy 80 -10 0 -10 60 120
∑
区分度估计值:题分与总分的积差相关系数。 区分度估计值:题分与总分的积差相关系数。 积差相关系数
∑ (X r=
i
X )(Yi Y )
y
n σ xσ
=
∑ xy ∑x ∑y
2
2
=
120 10 × 2800
提高测验信、效度的方法
测验中题目的数量应适当,不能太少。 紧密围绕教学大纲和教学目标命题。 考核内容应全面,并能有效代表学生应掌握的知识 领域。 测验的整体难度适当,不同类型、不同难度的题目 应保持恰当比例。 少出偏题、怪题,一般应以考察基础知识和基本能 力为主。
教育研究方法 【第7章】 教育统计与测量 教学PPT课件

第1节
抽样与测量
2. 外部效度 外部效度指实验结果能普遍推论到样本的总体和其他同类现象中去的程度,即结论的普遍代表 性和适用性。 为了提高外部效度,让研究结果具有更大的应用价值、适用性和可推广性,就要考虑研究情境 的普遍性。比如,让研究场景更接近现实生活,尽可能在多样化群体中随机抽取有代表性的样本, 增大样本覆盖面和样本量,等等。 外部效度与内部效度是相互影响的。
JIAOYUYANJIU FANGFA
目录
CONTENTS
PART 01
抽样与测量
PART 02
描述统计
PART 03
推断统计
第7章 教育统计与测量
第1节 抽样与测量 第2节 描述统计 第3节 推断统计
第1节
通过本章的学习,你将能够
● 掌握抽样的策略和技巧; ● 理解信度、效度、描述性统计、推断性统计等术语; ● 理解并掌握测量及相关统计的分析技巧; ● 学会对量的研究数据进行描述性统计和推断性统计分析; ● 理解统计分析中常见的问题以及解决途径。
第1节
抽样与测量
案例7-1 抽样的表述方法
采用三阶段随机整群抽样的方法对中国中部省会城市的所有初中一、二年级(7年级和8年 级)的儿童进行抽样。第一阶段以该市17个区的经济、教育发展水平以及人口数量为指标,采 用聚类分析得到四个类别,从每个类别中随机抽取一个区。第二阶段是对入样区的所有学校抽 样。根据学校所在的位置、学校性质、学校类型及经费等级四个方面进行分类并随机抽样。第 三阶段是对入样学校的班级进行抽样。入样班级的儿童、儿童的家长、班级对应的教师、学校 对应的校长都填写了相应的问卷。
效度是指研究中所获得的研究结果的正确度以及可推广程度。 研究结论的正确程度反映的是研究的内在效度,是指研究结果与研究目标的吻合度和达成度。 研究的外在效度就是指研究结果的可推广程度。
教育统计和测量 11页PPT文档

3
网络资源库的建设与管理
三、网络资源库项目建设计划具体内容
1、网络资源库建设项目估算 2具、体包网括络:资源库建设计划 具((((资①②③④3案时资进工统、体源对录支支主工监目1234例间源行作所) ) ) )包管 各 入 持 持网要作控。《:估估估量需设设设设括理 种 资 各 音考量项络延教延算算算估的:系 资 料 种 频计计计计虑与目安育安统 料 有 方 素: : 。 算 工资网资系资从花进具两式材大技大:作对对源络源统源备行种的查开费展学术学量完完对资管管库库以查形查询始时情学《《进成成完源理理目下、式询技建到间况教》教行本本成功录:功术库功功录设交 紧 ,育 精育估项 项 本能、单能;的能能服付密以: 删 个 (项技品技算目目项模务、 资 如用联便术课术。所所目目块系改 料 关户系能学程学需需所进化统等 随 键使,保建》》时的需功 机 词结度用合质设精精间人花能 录 查构安上理保; 入 询计品品的力费权式排, 、系的分量划课课大资的限系大 层统安配按任程程资 体 一另概源工量 级管统管排工时源 系务建建种一计、作资 查理管库 结依 源 种 为理。作完分设设是种算硬量料 询目 构据 类 功 中、理包要量成批 、配计计集是。件多录:设网型能心计等量模括把,开表划划中分资少服络和,,计费:录糊用人严发任管布务资要以分规源及入查管户员密项系源实学模划务理式和每;询理统库现科块。管书:管软一等有的的知进、理)理件项两资各识行分;、:资子种布源系
第三节 项目管理
随着教育技术理论与实践不断发 展,教育技术管理内容不断丰富, 特别是大型教学系统开发项目和 网络资源库建设项目越来越多, 就产生了项目管理的需要。
第三节 项目管理
一、教育技术项目管理的含义与特点
含义:教育技术项目管理就是对教学设计和项目开发过程的 计划、监督与调控。 为使项目开发成功,项目管理者必须对项目的立项、工作 范围、需要的资源、要实现的任务、所需的工作量(成 本)、进度的安排和可能遇到的风险等作到心中有数。 项目管理者通常具有更大的控制权和灵活性。
网络资源库的建设与管理
三、网络资源库项目建设计划具体内容
1、网络资源库建设项目估算 2具、体包网括络:资源库建设计划 具((((资①②③④3案时资进工统、体源对录支支主工监目1234例间源行作所) ) ) )包管 各 入 持 持网要作控。《:估估估量需设设设设括理 种 资 各 音考量项络延教延算算算估的:系 资 料 种 频计计计计虑与目安育安统 料 有 方 素: : 。 算 工资网资系资从花进具两式材大技大:作对对源络源统源备行种的查开费展学术学量完完对资管管库库以查形查询始时情学《《进成成完源理理目下、式询技建到间况教》教行本本成功录:功术库功功录设交 紧 ,育 精育估项 项 本能、单能;的能能服付密以: 删 个 (项技品技算目目项模务、 资 如用联便术课术。所所目目块系改 料 关户系能学程学需需所进化统等 随 键使,保建》》时的需功 机 词结度用合质设精精间人花能 录 查构安上理保; 入 询计品品的力费权式排, 、系的分量划课课大资的限系大 层统安配按任程程资 体 一另概源工量 级管统管排工时源 系务建建种一计、作资 查理管库 结依 源 种 为理。作完分设设是种算硬量料 询目 构据 类 功 中、理包要量成批 、配计计集是。件多录:设网型能心计等量模括把,开表划划中分资少服络和,,计费:录糊用人严发任管布务资要以分规源及入查管户员密项系源实学模划务理式和每;询理统库现科块。管书:管软一等有的的知进、理)理件项两资各识行分;、:资子种布源系
第三节 项目管理
随着教育技术理论与实践不断发 展,教育技术管理内容不断丰富, 特别是大型教学系统开发项目和 网络资源库建设项目越来越多, 就产生了项目管理的需要。
第三节 项目管理
一、教育技术项目管理的含义与特点
含义:教育技术项目管理就是对教学设计和项目开发过程的 计划、监督与调控。 为使项目开发成功,项目管理者必须对项目的立项、工作 范围、需要的资源、要实现的任务、所需的工作量(成 本)、进度的安排和可能遇到的风险等作到心中有数。 项目管理者通常具有更大的控制权和灵活性。
《教育统计与测量》课件

人工智能技术可以通过自然语言处理 、图像识别等技术,实现多样化的教 育测量方式,满足不同场景和需求。
教育统计与测量的未来展望
随着技术的发展和社会的进步, 教育统计与测量将不断拓展其应 用领域和范围,为教育事业的发 展提供更加全面和深入的支持。
教育统计与测量将进一步融合多 学科的理论和方法,形成更加科 学和系统的理论体系和实践框架
对数据进行整理、分类和概括,以描述 数据的集中趋势、离散程度和分布形态 。
VS
详细描述
描述性统计是教育统计的基础,主要包括 数据的收集、整理、分类、概括等步骤。 通过对数据的描述,可以了解数据的集中 趋势(如平均数、中位数等)、离散程度 (如标准差、变异系数等)和分布形态( 如偏度、峰度等),从而对数据有一个初 步的认识和评估。
量化结果解释
对量化结果进行解释,说明各评 价指标的具体表现情况。
05
教育统计与测量的发展 趋势
大数据在教育统计中的应用
大数据技术为教育统计提供了海量的数据来源,使得教育数据的收集和分析更加全 面和深入。
大数据技术能够实时监测和分析教育过程,为教育决策提供科学依据,提高教育管 理的科学性和有效性。
实验设计
总结词
根据研究目的和假设,合理安排实验条件和操作,控 制干扰因素,以提高实验的内部效度和外部效度。
详细描述
实验设计是教育统计中不可或缺的一部分,它是教育研 究中的重要环节。一个好的实验设计需要考虑多种因素 ,如实验目的、实验假设、实验变量、实验操作、实验 对象等。通过合理的实验设计,可以有效地控制干扰因 素,提高实验的内部效度和外部效度,从而使得研究结 果更加可靠和科学。在教育研究中,实验设计的应用非 常广泛,可以帮助研究者深入了解教育现象和教育过程 ,为教育实践和教育改革提供科学依据。
教育统计与测评导论new[1]PPT课件
![教育统计与测评导论new[1]PPT课件](https://img.taocdn.com/s3/m/7589ceb4f18583d048645966.png)
5
内容简介
一 教育统计
描述性统计,概率论基础,推断性统计, 方差分析, 回归分析
二 教育测量
教育测量概述,
测验的质量分析,
考试的质量分析,
考试设计与试题编制,
测验分数的转化与组合, 项目反应理论
三 教育评价
教育评价概论,
教学评价,
学校、教师和学生的评价, 教育评价中的多元分析方法
6
第一章 描述性统计
数理统计是指应用概率论来研究统计学的学科。
教育学与心理学中的许多问题借助于统计学都可以量化,从 而揭示教育规律和心理规律。
7
§1.1 怎样获取数据
数据也称为资料,我们把搜集记录下来的数量依据称为数据。 在实际工作中,一般采用调查的方法来取得数据。
把所考虑对象的全体称为总体或母体,其中每一个对象称为 个体;而从总体中抽取的一部分个体称为样本或子样,样本中 所含个体的数目称为样本容量。
一班 二班 三班 总计
男
23
22
24
69
女
25
24
22
71
总计
48
46
46
140
22
§2.2 随机变量及常见分布
一.随机变量
1.离散型随机变量及概率分布
X , x1 x2 pi , p1 p2
xn pn
pi 0,i1,2,3, ; p(xi)1. i1
例 某学生参加一项智力竞赛,共回答3个问题, 求该生答对题目数的概率分布列。
—
P(A) p,P(A)1 p q 2)重复进n行次试验, p在每次试验中保持.不变
34
n重伯努利概型中A出现次K的概率为
P(X K) Cnk pk (1 p)nk,K 0,1,, n. 称为二项公式,由此式给出的概率分布叫二项分布,
内容简介
一 教育统计
描述性统计,概率论基础,推断性统计, 方差分析, 回归分析
二 教育测量
教育测量概述,
测验的质量分析,
考试的质量分析,
考试设计与试题编制,
测验分数的转化与组合, 项目反应理论
三 教育评价
教育评价概论,
教学评价,
学校、教师和学生的评价, 教育评价中的多元分析方法
6
第一章 描述性统计
数理统计是指应用概率论来研究统计学的学科。
教育学与心理学中的许多问题借助于统计学都可以量化,从 而揭示教育规律和心理规律。
7
§1.1 怎样获取数据
数据也称为资料,我们把搜集记录下来的数量依据称为数据。 在实际工作中,一般采用调查的方法来取得数据。
把所考虑对象的全体称为总体或母体,其中每一个对象称为 个体;而从总体中抽取的一部分个体称为样本或子样,样本中 所含个体的数目称为样本容量。
一班 二班 三班 总计
男
23
22
24
69
女
25
24
22
71
总计
48
46
46
140
22
§2.2 随机变量及常见分布
一.随机变量
1.离散型随机变量及概率分布
X , x1 x2 pi , p1 p2
xn pn
pi 0,i1,2,3, ; p(xi)1. i1
例 某学生参加一项智力竞赛,共回答3个问题, 求该生答对题目数的概率分布列。
—
P(A) p,P(A)1 p q 2)重复进n行次试验, p在每次试验中保持.不变
34
n重伯努利概型中A出现次K的概率为
P(X K) Cnk pk (1 p)nk,K 0,1,, n. 称为二项公式,由此式给出的概率分布叫二项分布,
《教育统计与测量》课件

探讨等价测量方法在教育领域的应用, 包括内、外部一致性的测量等。
3 非等价测量方法
4 常用方法比较
介绍非等价测量方法的优缺点及适用场 景,如项目测量、多维测量等。
比较和总结各种测量方法的特点和应用 场景,帮助听众选择恰当合适的测量方 法。
教育统计应用
1
学校教育统计分析
介绍如何利用趋势分析、卡方检验等方法对学校的教育数据进行详尽分析,并对 其实现教学目标进行量化评估。
测量理论基础
测量的定义和特点
基本原理和要求
介绍测量的基本特征,包括精确度和可靠度等。
阐释测量的基本原理和要求,如明确测量对象 和测量方法等。
误差与控制
讲解测量误差产生的原因及其控制方法,如重 复测量、多角度测量等。
教育测量方法
1 测量工测量工具及其特点,如问卷、 观察和测试等。
教育统计与测量
本课程介绍教育统计与测量基本概念、测量理论、教育测量方法、以及教育 统计的应用,帮助听众深入了解教育领域的数据分析和评估。
教育统计介绍
统计基本概念
课程将从统计基本概念出发,介绍数据分析方法及其应用。
历史沿革
讲述教育统计从古至今的发展历程,以及现代教育数据分析方法的兴起。
内容和作用
探讨教育统计的应用,如数据驱动的教育决策、教育资产管理、学生评估等。
结语
思考题
总结
学会如何用数据驱动决策的同时,如何更好地 应用数据,在抉择之中更加精密、科学、高效、 准确?
本课程通过介绍教育统计与测量的基本概念、 测量理论基础、教育测量方法和教育统计应用 等方面帮助听众全面了解教育领域的数据分析 和评估。
2
学生发展与评价
探讨如何结合学生学习能力、特点以及校内的支持服务等来对学生进行全面评估。
教育统计与测量 PPT课件

所以估计录取分约为87分。
右半面积P=0.375 右尾面积0.125 横轴Z=1.15
显著性检验的基本思想:
检验样本统计量与总体ຫໍສະໝຸດ 数间的差异,是由 抽样误差所致,还是存在本质的不同?
如:某区外语考试平均分为70分,某校随 机抽取部分学生成绩其平均分为73分,这 3分之差,是随机造成的,还是该校的成绩 确实比全区的一般水平高呢?需要进行显著 性检验进行说明。
水平相同,这时考试信度最大,信度最大值等于1,国外要求0.90
试卷信度系数:
2
r
hh
r xx 1
r hh
相关系数
x y 1 n (
n i1
r s s hh
区分度指数与评价标准
区分度指数 D 0.40以上 0.30—0.39 0.20—0.29 0.19以下
试题评价 很好
良好,修改会更佳 尚可,仍需修改 差,必须淘汰
2、主观性试题区分度
D=
n
sH sL
(最高分 最低分)
式中:D 为区分度指数;
sH 为高分组得分总数;
sL 为低分组得分总数;
n 为高(或低)分组人数;
Z
x1 x 2
s s 2
2
1
2
n1 n 2
例子:高中二年级随机抽取语文成绩,考察文理科生语文成绩有无显著差异?
理科生150名,平均分76.4分,标准差12分;
文科生120名,平均分79.8分,标准差9分;
H H 解:因为 n > 30, 所以使用Z检验;
:
0
1
2
:
1
1
2
——两组在成匹配的情况下(实验组与控制组)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
哪一科离散程度大?即两极分化严重?
C
V x 1
1 100 2.40 100 2.67 90
1
C
V x 2
2 100 2.00 100 2.86 70
2
Q
CV
2
CV
物理科离散程度大。
1
(2)单位相同,但平均分相差很大;
例2:两班语文成绩, 甲班平均分96分,标准差3.50分; 乙班平均分78分,标准差3.28分;哪一班成绩的离散程度大?
估计录取分数线
育才高中拟招收200名外地考生,参加考试共计1600人, 平均分78分,标准差8分,试估计录取分数线。
解:学生成绩视为正态分布,录取率为 200 1600 0.125
即求正态分布右尾面积0.125对应的Z值; P(面积比率)=0.5-0.125=0.375 由正态分布表:Z=1.15
=0.01时,Z=2.58对应的阴影部分面积两侧分别为0.005;
1、样本平均数与总体平均数差异的显著性检验
(1)总体正态分布,总体标准差已知,大样本; 用Z检验。
x
Z
0
n
这里:x 为样本平均数, 为总体平均数,
0
为总体标准差, 85分,总体标准差8分,
0.05 2.228 2.201 2.179 2.160 2.145 2.134 2.120 2.110 2.101
0.01 3.169 3.109 3.055 3.012 2.977 2.947 2.921 2.898 2.878
df
0.05
0.01
解:
H :
0
0
H :
1
0
72.6 70
t
1.35 取 0.05 自由度df 26 1 25
9.6 26 1
查 t 值表,
t Q
(25) 2.06
0.05 2
t t
p
2
0.05
所以接受原假设,成绩没有显著差异,这种说法有95%的可靠性。
部分 t 值表
df 10 11 12 13 14 15 16 17 18
显著性检验中,首先假设差异是不显著的,这是一种反证法的思想。
选择显著性水平 0.05或 0.01
这里 是个小概率——接受错误假设的可能性是多少,
或拒绝正确假设的可能性是多少; 若达到一定的界限值, 则拒绝原假设,接受其相反的备择假设; 否则接受原假设。
n 30时,为大样本,用Z检验;n<30时,为小样本,用t检验。
甲班35人,班级平均分83分,这种差异是本质的还是偶然的?
H H (1)建立假设: :
0
0
备择: :
1
0
计算统计量Z,
83 85
Z
1.48
8 35
取 0.05
z 1.96
z Q z
P(样本统计量在抽样分布中出现的概率)> 0.05
所以差异不显著,接受原假设,班级与年组成绩基本一致,差异是偶然 的,这种判断有95%的可靠性。
所以拒绝原假设,差异是显著的。
当n< 30 时,样本平均数服从自由度为 n-1 的 t 分布, 所以用 t 检验。 自由度小,与正态分布曲线差别大,当自由度大于30时, t 分布曲线与正态分布曲线几乎重合。
x
t
0
s n 1
例子:县初一数学竞赛,平均分70分,某班参加26人,平均分72.6分,
标准差9.6分,问该班的成绩与全县比较是否显著?
应用范围: (1)一组数据,例如:一班期末考试的语文成绩; (2)两组数据,但单位相同,且平均分相差很小; 例如:一班与二班期末考试的语文成绩, 尤其是当平均分相同时,哪个班成绩更均衡?
2、变异系数: CV 100
X
应用范围:(1)两组数据单位不同;
例1:一班数学平均分90分,标准差2.40分; 物理平均分70分,标准差2.00分;
x x 甲 96分, 乙 78分, 甲 3.50分, 乙 3.28分;
CV甲
3.50 96
3.66,CV乙=
3.28 78
4.21
V V Q C 乙>C 甲 乙班的离散程度大。
三、地位量数 标准分: 表示数据距离平均分的位置量数;
Z x-x s
平均分以上各点的Z分数为正值, 平均数以下各点的Z分数为负值, 平均数的Z分数为零。
Z检验表(双尾检验)
Z 1.96 0.05
Z 2.58 0.01
Z值范围 P值 差异显著性 接受或拒
绝原假设
Z<1.96 P>0.05 不显著 接受
1.96
0.05
z<2.58
P>0.01
显著
Z 2.58 P 0.01 特别显著
拒绝 拒绝
=0.05时,Z=1.96对应的阴影部分面积两侧分别为0.025;
Q x x sz 78 81.15 87(分)
所以估计录取分约为87分。
右半面积P=0.375 右尾面积0.125 横轴Z=1.15
显著性检验的基本思想:
检验样本统计量与总体参数间的差异,是由 抽样误差所致,还是存在本质的不同?
如:某区外语考试平均分为70分,某校随 机抽取部分学生成绩其平均分为73分,这 3分之差,是随机造成的,还是该校的成绩 确实比全区的一般水平高呢?需要进行显著 性检验进行说明。
例子:年级数学平均分90分,标准差4.20分; 年级外语平均分68分,标准差5.40分;
该生数学92分,外语80分,哪科成绩比较好?
z1
92-90 4.20
0.48
z2
80-68 5.40
2.22
z z Q
1
外语成绩较好。
2
正态分布曲线下面积的应用
标准正态分布曲线:横轴为Z,纵轴为Y,P为面积——概率值, 整个面积为1,Z=0两边面积各0.5;曲线无限趋近于横轴。
(2)总体方差未知—— n > 30 时,
这时,可用样本方差替代总体方差。
例子:高中入学考试,语文总平均分78分,某初中班49人,
平均分75分,标准差9分,问该班成绩的差异显著性。
解:
H :
0
0
H :
1
0
75 78
Z
2.33
9 49
取
0.05 z 1.96
Q z z P 0.05
教育统计与测量 —— 成绩评价与试题评价
市教师进修学院研训处 赵炜 zhaowei2612392@
成绩评价
一、集中量数
平均分
x x N
二、差异量数
1、标准差:反映全部数据的差异情况——两极分化的程度;
( X X )2
N
X 2 ( X )2
N
N
实际计算时,可使用计算器直接按键。
C
V x 1
1 100 2.40 100 2.67 90
1
C
V x 2
2 100 2.00 100 2.86 70
2
Q
CV
2
CV
物理科离散程度大。
1
(2)单位相同,但平均分相差很大;
例2:两班语文成绩, 甲班平均分96分,标准差3.50分; 乙班平均分78分,标准差3.28分;哪一班成绩的离散程度大?
估计录取分数线
育才高中拟招收200名外地考生,参加考试共计1600人, 平均分78分,标准差8分,试估计录取分数线。
解:学生成绩视为正态分布,录取率为 200 1600 0.125
即求正态分布右尾面积0.125对应的Z值; P(面积比率)=0.5-0.125=0.375 由正态分布表:Z=1.15
=0.01时,Z=2.58对应的阴影部分面积两侧分别为0.005;
1、样本平均数与总体平均数差异的显著性检验
(1)总体正态分布,总体标准差已知,大样本; 用Z检验。
x
Z
0
n
这里:x 为样本平均数, 为总体平均数,
0
为总体标准差, 85分,总体标准差8分,
0.05 2.228 2.201 2.179 2.160 2.145 2.134 2.120 2.110 2.101
0.01 3.169 3.109 3.055 3.012 2.977 2.947 2.921 2.898 2.878
df
0.05
0.01
解:
H :
0
0
H :
1
0
72.6 70
t
1.35 取 0.05 自由度df 26 1 25
9.6 26 1
查 t 值表,
t Q
(25) 2.06
0.05 2
t t
p
2
0.05
所以接受原假设,成绩没有显著差异,这种说法有95%的可靠性。
部分 t 值表
df 10 11 12 13 14 15 16 17 18
显著性检验中,首先假设差异是不显著的,这是一种反证法的思想。
选择显著性水平 0.05或 0.01
这里 是个小概率——接受错误假设的可能性是多少,
或拒绝正确假设的可能性是多少; 若达到一定的界限值, 则拒绝原假设,接受其相反的备择假设; 否则接受原假设。
n 30时,为大样本,用Z检验;n<30时,为小样本,用t检验。
甲班35人,班级平均分83分,这种差异是本质的还是偶然的?
H H (1)建立假设: :
0
0
备择: :
1
0
计算统计量Z,
83 85
Z
1.48
8 35
取 0.05
z 1.96
z Q z
P(样本统计量在抽样分布中出现的概率)> 0.05
所以差异不显著,接受原假设,班级与年组成绩基本一致,差异是偶然 的,这种判断有95%的可靠性。
所以拒绝原假设,差异是显著的。
当n< 30 时,样本平均数服从自由度为 n-1 的 t 分布, 所以用 t 检验。 自由度小,与正态分布曲线差别大,当自由度大于30时, t 分布曲线与正态分布曲线几乎重合。
x
t
0
s n 1
例子:县初一数学竞赛,平均分70分,某班参加26人,平均分72.6分,
标准差9.6分,问该班的成绩与全县比较是否显著?
应用范围: (1)一组数据,例如:一班期末考试的语文成绩; (2)两组数据,但单位相同,且平均分相差很小; 例如:一班与二班期末考试的语文成绩, 尤其是当平均分相同时,哪个班成绩更均衡?
2、变异系数: CV 100
X
应用范围:(1)两组数据单位不同;
例1:一班数学平均分90分,标准差2.40分; 物理平均分70分,标准差2.00分;
x x 甲 96分, 乙 78分, 甲 3.50分, 乙 3.28分;
CV甲
3.50 96
3.66,CV乙=
3.28 78
4.21
V V Q C 乙>C 甲 乙班的离散程度大。
三、地位量数 标准分: 表示数据距离平均分的位置量数;
Z x-x s
平均分以上各点的Z分数为正值, 平均数以下各点的Z分数为负值, 平均数的Z分数为零。
Z检验表(双尾检验)
Z 1.96 0.05
Z 2.58 0.01
Z值范围 P值 差异显著性 接受或拒
绝原假设
Z<1.96 P>0.05 不显著 接受
1.96
0.05
z<2.58
P>0.01
显著
Z 2.58 P 0.01 特别显著
拒绝 拒绝
=0.05时,Z=1.96对应的阴影部分面积两侧分别为0.025;
Q x x sz 78 81.15 87(分)
所以估计录取分约为87分。
右半面积P=0.375 右尾面积0.125 横轴Z=1.15
显著性检验的基本思想:
检验样本统计量与总体参数间的差异,是由 抽样误差所致,还是存在本质的不同?
如:某区外语考试平均分为70分,某校随 机抽取部分学生成绩其平均分为73分,这 3分之差,是随机造成的,还是该校的成绩 确实比全区的一般水平高呢?需要进行显著 性检验进行说明。
例子:年级数学平均分90分,标准差4.20分; 年级外语平均分68分,标准差5.40分;
该生数学92分,外语80分,哪科成绩比较好?
z1
92-90 4.20
0.48
z2
80-68 5.40
2.22
z z Q
1
外语成绩较好。
2
正态分布曲线下面积的应用
标准正态分布曲线:横轴为Z,纵轴为Y,P为面积——概率值, 整个面积为1,Z=0两边面积各0.5;曲线无限趋近于横轴。
(2)总体方差未知—— n > 30 时,
这时,可用样本方差替代总体方差。
例子:高中入学考试,语文总平均分78分,某初中班49人,
平均分75分,标准差9分,问该班成绩的差异显著性。
解:
H :
0
0
H :
1
0
75 78
Z
2.33
9 49
取
0.05 z 1.96
Q z z P 0.05
教育统计与测量 —— 成绩评价与试题评价
市教师进修学院研训处 赵炜 zhaowei2612392@
成绩评价
一、集中量数
平均分
x x N
二、差异量数
1、标准差:反映全部数据的差异情况——两极分化的程度;
( X X )2
N
X 2 ( X )2
N
N
实际计算时,可使用计算器直接按键。