第四章 差异量数

合集下载

第四章差异量数

第四章差异量数

Q3在70-74组。
将Lb 5 4.5, f Q1 2 5, Fb 2 4, i 5, N 4.7 , 得 3 6代入公式 4 36 24 Q1 5 4.5 5 25 5 6.9
将Lb 6 9.5, f Q1 1 8, Fb 1 0 1 , i 5, 3N 4.8, 得 108 代入公式 4 1 0 8 1 0 1 Q3 6 9.5 5 18 7 1.4
1 6, 2 5.3, 3 7, 4 8.2
50 90 52 85 48 88 51 92 则Xt 50 52 51 48 89
d1 X 1 X t 90 89 1 d 2 X 2 X t 58 89 4 d 3 X 3 X t 88 89 1 d 4 X 4 X t 92 89 3
平均差、方差、标准差、差异系 数等
第一节
标准差
一、全距:一组数据中最大值与最小值之 差,又称极差。(用符号R表示。)
全距的优缺点: 优点:概念清楚,意义明确,计算简便。
缺点:易受两个极端的数值影响。
二、方差和标准差
方差(又称为变异数、均方)。是表示一组数据离散
2 S 程度的统计指标。一般样本的方差用 表示,总体

X
100
(4.9)
式中:CV 为差异系数; 为标准差;X 为平均数。
2、差异系数的作用

比较不同单位(现象)资料的差异(变异)程度
比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况
差异系数CV又称为相对标准差,属于相对差异量
数,不具有测量单位。在算术平均数不为零的情况

教育统计学_第四章 教育统计学之差异量

教育统计学_第四章 教育统计学之差异量
敏 因此,全距只能作为差异量的粗略指标,
在编制频数分布表示决定全距范围之用。
二、四分位距: 以一定顺序排列的一组数据中间部位50%个频数
距离的一半作为差异量指标。
QD
Q 3
Q 1
2
QD 表示四分位距
Q 表示第三个四分位距(第75%百分位数) 3
Q 1
表示第一个四分位距(第25%百分位数)
1.原始数据计算法 例如:教育学专业99级学生教育测量学成绩如
105-
107.5
14
110-
112.5
9
115—
117.5
4
120-
122.5
3
125-
127.5
2
总和
100
累积频数 3 11 23 44 68 82 91 95 98 100
解:全距=127.5—82.5 =45 或者,全距=130-80=50
评价
优点:概念清楚,意义明确,计算简单 缺点:易受两极端数值影响,反映不灵
差异量
表示一组数据变异程度或离散程度的量称为 差异量。 用多边图把几组数据的频数分布表示出来, 我们可以很直观地了解数据的变异性或离散程度。
A、B、C三个平行班在某次数学考试上的得分情况。 三个班的平均数差别不大,而各班的离散程度却有很明 显的不同。在这三个班中,B班的分数分布(高、狭)范 围最窄,最整齐;C班的分数分布(平、宽)范围最广, 变异最大。这是用图所进行的直观分析和判断。若用一 个统计量概括地说明数据的变异程度或离散程度的特征, 这个统计量就是差异量。
乙组
20 40 60 80 100
对于一个小组的成绩,我们通常用平均数来代表各 组的成绩。但在这样的情况下,仅用平均数就不能正确 反映两组的区别。

统计学第四章

统计学第四章

第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。

数据的分布特征不仅有集中趋势,还有离中趋势。

以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。

两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。

【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。

即A 组较集中,B 组较分散。

因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。

差异量:表示一组数据的离中趋势或变异程度的量称为差异量。

常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。

第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。

优点:意义明确,计算方便。

缺点:反应不灵敏,易受极端值影响。

二、四分位距(一)四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。

)(1.4213Q Q QD -=QD :表示四分位距; Q 3:表示第三四分位数;Q 1:表示第一四分位数。

所以:四分位距的公式又为:22575P P QD -=(二)四分位数的计算方法 1、原始数据计算法(1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。

【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:(1)先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q 1=18 Md =27 Q 3=34(2)求出Q 1、Md 、Q 3;(3)将Q 1、Md 、Q 3的得数代入公式(4.1)。

第四章 差异量数

第四章 差异量数

例2:比较两组女童体重的差异情况
表4—2 某市两组女童体重的调查资料
平均数 2个月组 6岁组 5.45千克 19.02千克 标准差 0.62千克 2.12千克
解:
CV 1
S 0.62 100 0 0 100 0 0 11.4 0 0 5.45 X
CV 2
1
S 2.12 100 0 0 100 0 0 11.2 0 0 19.02 X
组。
二、平均差
(一)定义:平均差是指一组数据中,
每一个数据与该组数据的平均数离差的绝 对值的算术平均数,通常用AD表示。 (二)计算公式
AD
Xi X n
例1:有5名被试的错觉实验数据如下, 求其平均差。
被试
错觉量
1
16
2
18
3
20
4
22
5
17
(ms)
解:已知n=5

AD Xi X
优点:① 反应灵敏; ② 严密确定;
③ 容易计算;④ 适合进一步代数运算; ⑤ 受抽样变动的影响小; ⑥ 简单明了。 缺点:应用方差和标准差比较两个不
同数据的次数分布,必须保证两数据的
单位相同。而且两数据的平均水平比较 接近。
四、差异系数
(一)定义
差异系数是指标准差与其算术平均数
的百分比。它是没有单位的相对差异量


2
2.根据原始数据计算方差和标准差的公式
Xi Xi S n n
2 2 2
Xi Xi S n n
2
2

原始数据的计算公式等价于定义公式,当两
个公式计算结果有出入时,应以原始数据计算公 式的结果为准,因其更准确。

统计心理-第四章 差异量数

统计心理-第四章 差异量数

第二节 平均差、方差与标准差
一、平均差 • 1. 意义: 次数分布中所有原始数据与平均
数绝对离差的平均值。一般用符号A.D.或 M.D. 来表示。 • 2. 计算: • (1)原始数据求平均差
A.D. Xi X
n
例题:
有5名被试的错觉实验数据如下,求其平均差。
被试
1
2
3
4
5
错觉量 16
18
i 1
N


i 1
N

i




(三)总标准差的合成
St
N 1
S
2 1

d
2 1
N2
S
2 2

d
2 2
Nk
S
2 k

d
2 k
N1 N2 Nk
k
k
N
i
S
2 i

N
i
d
2 i
i1
i1
k
Ni
i1
S

t


准差
注意:只有应用同一种观测手段,测量同一 个特质,只是样本不同时,才能应用该公式 合成方差和标准差。
易受极端值的影响; 易受取样变动的影响; 未考虑数据的分布。
7 8 9 10 7 8 9 10 全距只是一种低效的差异量数,主要用 于对数据的预备性检查,了解数据的大概 范围,以确定如何统计分组。
二、百分位差(percentile)
• 为了避免极端数据的影响,将数据的两 端各截去10%,即P10和P90之间的距离作 为差异量数。
负号,应用较少。
二、方差与标准差

差异变量1

差异变量1

Q1=1.7 Q=(2.2-1.7)/2=0.25
Q3=2.2
(2)数据分组后(次数分布表)计算法
Q Q 3 Q1 2
其中
这里 L b 表示百分位数所在组的精确下限, b 表示小于L b F 的各组次数的和, f 表示百分位数所在组的次数;
例:下表为一个年级期末考试数学的分数,求四分位差?
21
6 4 4 3 2 2 1
43
22 16 12 8 5 3 1
合计
196



未分组资料的百分等级 PR=100-{(100R-50)/N|}, 其中R是原始分数排列顺序数,N是指总人数 (样本的总人数)。 例如:小东在30名同学中语文成绩是80分,排 列第5名,则其百分等级为: PR=100-{(100*5-50)/30}=85 百分等级为85即指,在100名被试中,语文成 绩低于小东的80分的有85人。
R=Xmax– Xmin
次数分布表的全距一般是最大一组与最小一组的组中值 之差,或者是最大一组上限与最小一组下限之差。
例:下列数据是实验中所得的,10个被试的跳远距离:2.0、 2.3、2.5、1.9、1.6、1.5、2.8、2.2、1.7、1.8(单位m), 求这组数据的全距是多少? R=Xmax– Xmin=2.8—1.5=1.3m
第四章 差异量数
差异量数的概念
差异量数就是对一组数据的变异性(离中趋势) 特点进行度量和描述的统计量。它反映了次数分 布中数据彼此分散的程度。 常用的差异量数有全距、四分位差、百分位 差、平均差、标准差与组数据中最大值与最小值之差。全距用R表示。
全距的计算方法 原始数据的全距是最大值与最小值之差。
85-89
80-84 75-79

第四章 差异量数

第四章 差异量数

三、由各部分的标准差合成总标准差的计算方式
已知总体中各部分的标准差,若求其总标准 差,可用下面公式进行合成: (4.6) 式中: t为总标准差; N t 为总体中数据的个 d 数; i为各部分数据的标准差;i 为各部分平 均数与总平均数之差,即 di X i X t 。其中
Nt
t
例6.某小学四年级248名学生的平均身高为 143.52厘米,标准差是6.48厘米;平均体重
30.28千克,标准差4.56千克,试比较身高与体
重两变量的离散程度。
解:
CV身高
6.48 100= 100 4.52 X 143 00 15.06 X 30.28
=
50 90 52 85 48 88 51 92 50 52 48 51
= 89
d1 X 1 X t 90 89 1 d 2 X 2 X t 85 89 4 d 3 X 3 X t 88 89 1 d 4 X 4 X T 92 89 3
第四章

差异量数
第一节 标准差 第二节 四分差 第三节 差异系数 第四节 相对地位量数 习 题与思考题
描述一组数据离中趋势(波动性)的量数,称 为差异量数。
差异量数有:绝对差异量数和相对差异量数 两种。绝对差异量数包括全距、平均差、四分差 、方差、标准差等,相对差异量数有差异系数和 峰态量数、偏态量数。
本章重点介绍标准差、四分差、差异系数, 并学习标准分数和百分等级两个相对地位量数。
第一节 标准差
一、标准差的概念 二、标准差的计算方法

1、对原始数据计算标准差
2、对次数分布表计算标准差

(完整版)心理与教育统计学第4章差异量数

(完整版)心理与教育统计学第4章差异量数
心理与教育统计学
复习专题:
平均增加率与几何平均数 平均增加量与算术平均数
一列数据分别为X1,X2,X3…Xn, 按一定的比例关系变化,则:
1
X2 X1
2
X3 X 2
N 1
XN X N 1
1 2 N 1
Mg N1 12 N1
Mg N1 X 2 X 3 X N X1 X 2 X N 1
160
170
180
190
A
B
4.1 全距与百分位数
• 4.1.1 全距
• 全距(range)又称为两极差,用符号R 表示。
• 用最大值(maximum)减去最小值 (minimum)得到全距。
R X max X min (4.1)
全距的特点: • 全距是最粗糙的差异量数,只利用了数据
中的极端值; • 容易受极端值的影响;
]
(4.5)
PR 百分等级; X 给定的原始分数。
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
60-
5
12
55-
4
7
50-
2
3
4.54+79.5=84.04
45-
1
1
合计
58
精确组限 79.5~84.49
5/7=0.71
采用次数分布表计算百分位数
PP
Lb
P 100
N
Fb
i fP
(4.4)
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限; fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数; i为组距。
X N X N 1 cN 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

标准差。
——由各部分的标准差合成总标准差的计算方法
sT
N s N d N
2 i i i
2
i i
sT为总标准差;si为小组标准差; Ni为各小组个数; di=总平均数-各小组平均数
例:在三个班级进行某项能力研究,三个班测查结果的平均数 和标准差分别如下,求三个班的总标准差。 班级 人数 n
未分组资料求四分位数的方法同中数。
分组资料Q1和Q3的求法,Q1和Q3的公式分别为
N Fb Q1 Lb 4 i f Q1 3N Fb Q3 Lb 4 i f Q3
(3.7)
(3.8)
Q1
式中:L b 为该四分位数所在组的实下限;f
, f Q3 分
别为Q1,Q 2 所在组的次数;F b为小于该四分位数所 在组下限的次数之和;i 为组距;N 为总次数。
②求 ③代入公式:
,填入表内第5、6、7列。
di , d , S
2 i
2 i
St 8.77
45(81 1.04 ) 38(64 16.16 ) 40(100 24.8) 45 38 40
例 某年级四个班的学生人数分别为50人、52人、 48人、51人。期末数学考试各班平均成绩分别为 90分、85分、88分、92分,标准差分别为6分、
组距
f
150~156
156~162 162~168 168~174 174~180 180~186 186~192 192~198 合计
3
9 25 34 20 7 1 1 100
运用上 述方法计 算左边数 列的全距
优点:
计算简单、 直观。
缺点:
(1)受极端值影响大; (2) 没有度量中间各个单位间 的差异性,数据利用率低,信息丧 失严重; (3)受抽样变动影响大,大样 本全距比小样本全距大。
3
6 7 14 16 35 42 30 21 6 4 4 3 2 2 1
196
193 187 180 166 150 115 73 43 22 16 12 8 5 3 1
合计
196
解:因83属于80-84组,所以有f=14 Fb=166, Lb=79, i=5, N=196。 将上述数值代入公式,得
62
57 52 47 42
6
42 58 30 5
9.20
4.20 -0.80 -5.80 -10.80
84.67
17.65 0.64 33.62 116.61
507.99
741.37 36.99 1008.72 583.05

144
3483.16
——由各部分的标准差合成总标准差的计算方法 • 方差具有可加性特点。当已知几个小组数据的方差或 标准差时,可以计算几个小组联合在一起的总的方差 或标准差。 • 注意:只有应用同一种观测手段,测量的是同一种特 质,只是样本丌同的数据时,才能计算合成方差或者
例 某校四年级举行数学竞赛,一班、二班分别派九名选手
表4-1 一班成绩统计表
X X- X (X- X )^2 92 19 361 90 17 289 83 10 100 80 7 49 75 2 4 70 -3 9 62 -11 121 55 -18 324 50 -23 529
参加,如下表。试比较两个班的成绩。
1786

X
i
X

2
n
14.09
再求四年一班的平均数和标准差。得
X 73

X X
i
2
5948
X
X

2
n
25.71
从以上计算可知,两班平均数都是73分,说明两
班的平均水平相同。但它们的标准差丌同,说明
两班成绩的差异程度很丌相同。一班的差异程度
5.5分、7分、8.2分。求四个班成绩的总标准差。
解:设N1=50, N2=52, N3=48, N4=51
X 1 90, X 2 85, X 3 98, X 4 92 s1 6, s2 5.3, s3 7, s4 8.2 50 90 52 85 48 88 51 92 则Xt 50 52 51 48 89
60-64
55-59 50-54 45-49 40-44
62
57 52 47 42
6
42 58 30 5
9.20
4.20 -0.80 -5.80 -10.80
84.67
17.65 0.64 33.62 116.61
507.99
741.37 36.99 1008.72 583.05

144
3483.16
第二节 平均差、方差、标准差
要测定变量值的离中趋势,尤其是要测定各变量值相对亍平均数
的差异情况,一个很自然的想法就是计算各变量值不算术平均数
的离差。平均差是离差绝对值的算术平均数。 1.对于未分组资料
2.对于分组资料
[例1] 试分别以算术平均数为基准,求85,69,69,74, 87,91,74这些数字的平均差。
将Lb 69 .5, f Q1 18, Fb 101, i 5, 3N 108 代入公式4.8, 得 4 108 101 Q3 69 .5 5 18 71 .4
最后将求得的Q1和Q3代入公式,得
Q3 Q1 Q 7.27 2
即144名学生外语成绩的四分位差为7.27分。
们常识,易亍理解。
• 计算考虑了每一个数值,稳定可靠。丌易受样本抽样影 响。 • 缺点 • 计算过程中求绝对值,丌适合迚行下一步代数运算。
第二节 平均差、方差、标准差
• 标准差是一组数据中每个数据不其算术平均数之差 的算术平均数的算术平方根。用符号S表示X

2
n
——未分组资料计算标准差 1、基本公式法
[例2] 试以算术平均数为基准,求下表所示数据的平均差。
组距 150~156 156~162 162~168 168~174 174~180 180~186 f 3 9 25 34 20 7
186~192 192~198
合计
1 1
100
第二节 平均差、方差、标准差
• 平均差优缺点:
• 优点: • 平均差优亍四分位差和极差。 • 用离开平均数的平均距离表示数据的离散程度,符合人
2
表示次数。
例2 用原始数据法计算表4-1的标准差 解:∑X=657,∑X2=49747 N=9,代入公式(4.2)

X
N
2
X N
2

2

49747 657 9 9 14 .09
——分组资料标准差的计算方法
分组资料指编制成次数分布的资料,此时以组中值作
百分位差
• 百分位差是指两个百分位数之差。 • 常用的百分位差有两种:p90-p10 ,p93-p7
• 百分位数能够较好的反映一组数据的离散程度。
百分等级
•百分位数 百分等级
• 百分等级是指一组有序数据中某一数据以下所含
次数占总次数的百分比,通常用符号PR表示。 •在教育上,常用百分等级表示一个分数在团体中的 相对位置。百分等级越低,个体在团体中所处的地 位越差。如果某分数的百分等级PR=70,则表明团 体中有70%的人的成绩低于该分数。
f X Lb 100 PR Fb i N 14 83 79 .5 100 166 5 196 90
即该生成绩的百分等级为90,表明团体中有 90%的学生成绩低于他的成绩。
四分位差
• 中间50%的次数的距离的一半。简言之:第三四 分位数和第一四分位数的差值的一半。 • 避免全距受极端值影响大的缺点。 • 通常不中位数配合使用。
表4-2 二班成绩统计表
X X- X (X-X )^2 100 27 729 97 24 576 95 22 484 85 12 144 80 7 49 75 2 4 62 -8 64 40 -33 1089 20 -53 2089
解:先求四年一班的平均数和标准差。算得
X 73
X
X

2
1.全距(Range)
最大值和最小值之差,也叫极差。全 距越大,表示变动越大。
R =Xmax– Xmin
[例] 求74,84,69,91,87,74,69的全距。 [解] 把数字按顺序排列:69,69,74,74,84,87,91
R =Xmax– Xmin =91—69=22
对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限 或最大组的上限减去最小组的组中值
对于分组资料,计算百分等级的公式为
f X Lb 100 PR Fb i N
例 196名学生外语考试成绩的次数分布表如下。 某考生分数为83,求其百分比等级是多少?
196名学生外语成绩次数分布表
组限 次数 累积次数(由下向上)
95-99
90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24
第四章 差异量数
第四章 差异量数
• 差异量数是对一组数据的变异性(离中趋势)迚
行度量和描述的统计量。 • 常用的差异量数:
– 绝对差异量数:全距、四分位差、百分位差、平均差、 标准差、方差等。 – 相对差异量数:异众比例、平均差系数、标准差系数 (差异系数)和一些常用的偏态系数。
相关文档
最新文档