第四章 差异量数
第四章差异量数

Q3在70-74组。
将Lb 5 4.5, f Q1 2 5, Fb 2 4, i 5, N 4.7 , 得 3 6代入公式 4 36 24 Q1 5 4.5 5 25 5 6.9
将Lb 6 9.5, f Q1 1 8, Fb 1 0 1 , i 5, 3N 4.8, 得 108 代入公式 4 1 0 8 1 0 1 Q3 6 9.5 5 18 7 1.4
1 6, 2 5.3, 3 7, 4 8.2
50 90 52 85 48 88 51 92 则Xt 50 52 51 48 89
d1 X 1 X t 90 89 1 d 2 X 2 X t 58 89 4 d 3 X 3 X t 88 89 1 d 4 X 4 X t 92 89 3
平均差、方差、标准差、差异系 数等
第一节
标准差
一、全距:一组数据中最大值与最小值之 差,又称极差。(用符号R表示。)
全距的优缺点: 优点:概念清楚,意义明确,计算简便。
缺点:易受两个极端的数值影响。
二、方差和标准差
方差(又称为变异数、均方)。是表示一组数据离散
2 S 程度的统计指标。一般样本的方差用 表示,总体
X
100
(4.9)
式中:CV 为差异系数; 为标准差;X 为平均数。
2、差异系数的作用
比较不同单位(现象)资料的差异(变异)程度
比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况
差异系数CV又称为相对标准差,属于相对差异量
数,不具有测量单位。在算术平均数不为零的情况
统计学第四章

第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反应不灵敏,易受极端值影响。
二、四分位距(一)四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
)(1.4213Q Q QD -=QD :表示四分位距; Q 3:表示第三四分位数;Q 1:表示第一四分位数。
所以:四分位距的公式又为:22575P P QD -=(二)四分位数的计算方法 1、原始数据计算法(1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:(1)先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q 1=18 Md =27 Q 3=34(2)求出Q 1、Md 、Q 3;(3)将Q 1、Md 、Q 3的得数代入公式(4.1)。
第四章 差异量数

例2:比较两组女童体重的差异情况
表4—2 某市两组女童体重的调查资料
平均数 2个月组 6岁组 5.45千克 19.02千克 标准差 0.62千克 2.12千克
解:
CV 1
S 0.62 100 0 0 100 0 0 11.4 0 0 5.45 X
CV 2
1
S 2.12 100 0 0 100 0 0 11.2 0 0 19.02 X
组。
二、平均差
(一)定义:平均差是指一组数据中,
每一个数据与该组数据的平均数离差的绝 对值的算术平均数,通常用AD表示。 (二)计算公式
AD
Xi X n
例1:有5名被试的错觉实验数据如下, 求其平均差。
被试
错觉量
1
16
2
18
3
20
4
22
5
17
(ms)
解:已知n=5
则
AD Xi X
优点:① 反应灵敏; ② 严密确定;
③ 容易计算;④ 适合进一步代数运算; ⑤ 受抽样变动的影响小; ⑥ 简单明了。 缺点:应用方差和标准差比较两个不
同数据的次数分布,必须保证两数据的
单位相同。而且两数据的平均水平比较 接近。
四、差异系数
(一)定义
差异系数是指标准差与其算术平均数
的百分比。它是没有单位的相对差异量
2
2.根据原始数据计算方差和标准差的公式
Xi Xi S n n
2 2 2
Xi Xi S n n
2
2
原始数据的计算公式等价于定义公式,当两
个公式计算结果有出入时,应以原始数据计算公 式的结果为准,因其更准确。
统计心理-第四章 差异量数

第二节 平均差、方差与标准差
一、平均差 • 1. 意义: 次数分布中所有原始数据与平均
数绝对离差的平均值。一般用符号A.D.或 M.D. 来表示。 • 2. 计算: • (1)原始数据求平均差
A.D. Xi X
n
例题:
有5名被试的错觉实验数据如下,求其平均差。
被试
1
2
3
4
5
错觉量 16
18
i 1
N
i 1
N
i
(三)总标准差的合成
St
N 1
S
2 1
d
2 1
N2
S
2 2
d
2 2
Nk
S
2 k
d
2 k
N1 N2 Nk
k
k
N
i
S
2 i
N
i
d
2 i
i1
i1
k
Ni
i1
S
:
t
总
标
准差
注意:只有应用同一种观测手段,测量同一 个特质,只是样本不同时,才能应用该公式 合成方差和标准差。
易受极端值的影响; 易受取样变动的影响; 未考虑数据的分布。
7 8 9 10 7 8 9 10 全距只是一种低效的差异量数,主要用 于对数据的预备性检查,了解数据的大概 范围,以确定如何统计分组。
二、百分位差(percentile)
• 为了避免极端数据的影响,将数据的两 端各截去10%,即P10和P90之间的距离作 为差异量数。
负号,应用较少。
二、方差与标准差
差异变量1

Q1=1.7 Q=(2.2-1.7)/2=0.25
Q3=2.2
(2)数据分组后(次数分布表)计算法
Q Q 3 Q1 2
其中
这里 L b 表示百分位数所在组的精确下限, b 表示小于L b F 的各组次数的和, f 表示百分位数所在组的次数;
例:下表为一个年级期末考试数学的分数,求四分位差?
21
6 4 4 3 2 2 1
43
22 16 12 8 5 3 1
合计
196
未分组资料的百分等级 PR=100-{(100R-50)/N|}, 其中R是原始分数排列顺序数,N是指总人数 (样本的总人数)。 例如:小东在30名同学中语文成绩是80分,排 列第5名,则其百分等级为: PR=100-{(100*5-50)/30}=85 百分等级为85即指,在100名被试中,语文成 绩低于小东的80分的有85人。
R=Xmax– Xmin
次数分布表的全距一般是最大一组与最小一组的组中值 之差,或者是最大一组上限与最小一组下限之差。
例:下列数据是实验中所得的,10个被试的跳远距离:2.0、 2.3、2.5、1.9、1.6、1.5、2.8、2.2、1.7、1.8(单位m), 求这组数据的全距是多少? R=Xmax– Xmin=2.8—1.5=1.3m
第四章 差异量数
差异量数的概念
差异量数就是对一组数据的变异性(离中趋势) 特点进行度量和描述的统计量。它反映了次数分 布中数据彼此分散的程度。 常用的差异量数有全距、四分位差、百分位 差、平均差、标准差与组数据中最大值与最小值之差。全距用R表示。
全距的计算方法 原始数据的全距是最大值与最小值之差。
85-89
80-84 75-79
(完整版)心理与教育统计学第4章差异量数

复习专题:
平均增加率与几何平均数 平均增加量与算术平均数
一列数据分别为X1,X2,X3…Xn, 按一定的比例关系变化,则:
1
X2 X1
2
X3 X 2
N 1
XN X N 1
1 2 N 1
Mg N1 12 N1
Mg N1 X 2 X 3 X N X1 X 2 X N 1
160
170
180
190
A
B
4.1 全距与百分位数
• 4.1.1 全距
• 全距(range)又称为两极差,用符号R 表示。
• 用最大值(maximum)减去最小值 (minimum)得到全距。
R X max X min (4.1)
全距的特点: • 全距是最粗糙的差异量数,只利用了数据
中的极端值; • 容易受极端值的影响;
]
(4.5)
PR 百分等级; X 给定的原始分数。
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
60-
5
12
55-
4
7
50-
2
3
4.54+79.5=84.04
45-
1
1
合计
58
精确组限 79.5~84.49
5/7=0.71
采用次数分布表计算百分位数
PP
Lb
P 100
N
Fb
i fP
(4.4)
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限; fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数; i为组距。
X N X N 1 cN 1
心理统计学-课程讲义4

【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
心理与教育统计学第4章差异量数

4.3.2 标准分数
某班平均成绩为90分,标准差为3分,甲生得94.2分,乙生得89.1分,求甲、乙两个学生的Z分数各是多少?
Z分数乘以标准差即为原始分到平均值的距离。
Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。
标准分数的性质
所有原始分数的Z分数的平均数为0
58×0.8=46.4 46.4-40=6.4 6.4×0.71=4.54 4.54+79.5=84.04
84.50
83.79
83.07
82.36
81.64
80.93
80.21
79.50
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限;
01
fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数;
学生身高标准分数分布
(4) 若原始分数呈正态分布,则转换得到的所有Z分数为均值为0、标准差为1的标准正态分布。
标准分数转换对数据分布的基本形状没有影响
01
04
02
03
可比性。不同性质的原始分数,转化为标准分数后可以进行比较。
可加性。标准分数为抽象数值。
明确性。可以知道该分数在全体分数中的位置。
稳定性。 假设有两套测量某种能力心理测验,同一个人做,其原始分可能差异较大,但是标准分较为稳定。
4.1.5 四分位差
其中:
(4.6)
四分位差:
用次数分布表计算四分位差
成绩
频数f
累加频数
95-
2
58
90-
3
56
85-
6
53
80-
7
47
75-
8
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、由各部分的标准差合成总标准差的计算方式
已知总体中各部分的标准差,若求其总标准 差,可用下面公式进行合成: (4.6) 式中: t为总标准差; N t 为总体中数据的个 d 数; i为各部分数据的标准差;i 为各部分平 均数与总平均数之差,即 di X i X t 。其中
Nt
t
例6.某小学四年级248名学生的平均身高为 143.52厘米,标准差是6.48厘米;平均体重
30.28千克,标准差4.56千克,试比较身高与体
重两变量的离散程度。
解:
CV身高
6.48 100= 100 4.52 X 143 00 15.06 X 30.28
=
50 90 52 85 48 88 51 92 50 52 48 51
= 89
d1 X 1 X t 90 89 1 d 2 X 2 X t 85 89 4 d 3 X 3 X t 88 89 1 d 4 X 4 X T 92 89 3
第四章
差异量数
第一节 标准差 第二节 四分差 第三节 差异系数 第四节 相对地位量数 习 题与思考题
描述一组数据离中趋势(波动性)的量数,称 为差异量数。
差异量数有:绝对差异量数和相对差异量数 两种。绝对差异量数包括全距、平均差、四分差 、方差、标准差等,相对差异量数有差异系数和 峰态量数、偏态量数。
本章重点介绍标准差、四分差、差异系数, 并学习标准分数和百分等级两个相对地位量数。
第一节 标准差
一、标准差的概念 二、标准差的计算方法
1、对原始数据计算标准差
2、对次数分布表计算标准差
三、由各部分的标准差合成总标准差的计 算方式
一、标准差的概念
一组数据中每一数值与其算术平均数的差 ,数学上称为“离差”。 离差平方之算术平均数的算术平方根称为 标准差。总体标准差用 符号表示,样本标准 差用 S 符号表示。计算公式为:
将求得的 Q1和 Q3数值代入公式(4、7) Q3 Q1 92.577 80.611 Q 5.98 2 2
第三节 差异系数
标准差和四分差都是绝对差异量数,它们与 原始数据有相同的测量单位。 要比较单位不同或者虽然单位相同但平均数 相差较大的两组数据的离散程度,不适合用绝对 差异量数,需使用相对差异量数来比较。 相对差异量数不具有实际测量单位,它是以 差异系数的大小抽象地反映数据的离散程度。
1 3
i
例5. 某小学六年级120名学生数学考试成绩的次数 分布如下表,求其成绩的四分差。
N 解: 120 f 则 Lb 79.5 ,Q1 18 (4.8)得:
N , 4 30
,Q1 所以所在组为80—84组。 F , b 26 , i 5 。代入公式
N 120 Fb 26 Q1 Lb 4 i 79.5 4 5 80.611 f Q1 18
(二)标准分数的计算
标准分数的计算比较简单,只要已知一组 数据并求得其算术平均数和标准差,就可以求出 某一个原始数据对应的标准分数,其步骤为: (1)计算原始数据的 与 ; X X (2)计算离差 X ; (3)代入公式 X X 。 Z
例8.有10名学生的考试成绩如下表,求各个成绩 的标准分数。
N i ( i2 d i )
2
而 N1 N 2 N K N t
N1 X 1 N 2 X 2 N k X K Xt N1 N 2 N K
例3、某年级四个班的学生人数分别为50人、52 人、48人、51人。期末数学考试各班的平均成绩 分别为90分、85分、88分、92分,标准差分别 为6分、5.5分、7分、8.2分。求四个班成绩的总 标准差。
fX c2 N
(4.4) 2 ( 4.5) fX c
N
式中,X c 表示组中值; f 表示各组对应的次数; N 为总次数。
例2.某班45名学生的语文成绩如表4-4,求其 标准差。
解:将上述表中计算的中间结果代入公式(4.5) 得
fX
N
2 c
2 fX c 332615 3855 7.26 N 45 45 2
解:求得 X 82 , 9.94 ,根据公式(4.11)
计算得到各个原始分数对应的标准分数,如表4
-6的第3列。
例9.已知A、B两班英语考试成绩如下表。
甲生是A班的学生,成绩为70分。乙生是B班的 学生,成绩也是70分。求甲、乙两人成绩的标准 分数。
解: X X 70 80 甲生的标准分数为: Z甲 = 2 5 4
图4—2 四分差和四分位数之间的关系
二、四分差的计算方法
四分差的计算公式为:
Q3 Q1 Q 2
(4.7)
式中, Q 表示四分差; Q1 表示第1四分位数; Q3表示第3四分位数。
1.
对原始数据计算四分差
求法:将各个数据按大小顺序排列;再将 数据的个数N 除以4,然后根据求中位数的方法 N 1 Q1 Q1的位置为 )和第3四 求出第1四分位数 ,( 4 2 Q3 的位置为 3N 1 ),将其代入公式 分位数Q3 ( 4 2 (4.6),即可求得四分差。
Z XX
(4.11)
式中, X 表示原始数据; X 表示原始数据的算术平均数; 表示原始数据的标准差。
标准分数是以算术平均数为参照点,以标准差 为单位,表示每一个原始数据在其团体中的相对 位置。 标准分数有正有负,如果原始数据大于算术平 均数,则标准分数为正值;如果原始数据值小于 算术平均数,则为负值。标准分数的绝对值越大, 则说明原始数据距算术平均数越远。 标准分数没有测量值的单位。
差异系数也叫变异系数,或称相对标准差, 用符号 CV 表示。它是标准差与平均数的比值, 不具有实际测量单位。公式为: CV 100 X (4.10) 式中 , CV 表示变异系数; 表示标准差; X 表示平均数。 从公式中可以看出,变异系数大,表明数据的 离散程度大,反之数据的离散程度小。
, Fb 74 , Q3 f
3N 因 为 4 90
Q , 3 所 以 所 在 组 为 9 0 — 9 4 组 。 则 Lb 89.5, 代入公式(4.9)得 26 , i 5
3N 3 120 Fb 74 Q3 Lb 4 i 89.5 4 5 92.577 f Q3 26
(米)。
X2
N
2 32.51 16 = 0.25 8 8
(米)。
从上例可以看出,虽然两组数据的平 均数都是2.00米,但两组数据的标准差不 同。 两组数据的差异程度不同,平均数的可 靠性不同。
2. 对次数分布表计算标准差
计算公式为:
f ( X c X )2 N
3.82 100 2.57 X 148 .54
CV六年级
若仅从绝对差异量数标准差来看,六年 级学生的身高的标准差要比一年级学生身高的 标准差稍大一些。但由于这两组数据的平均数 相差较大,用变异系数比较其离散程度,结果 一年级学生身高的离散程度反而比六年级的大 一些。
第四节
相对地位量数
因此 t = =
N i ( i2 d i2 ) Nt
N1 N 2 N 3 N 4
2 2 2 2 2 N1 ( 12 d i2 ) N 2 ( 2 d 2 ) N 3 ( 3 d 32 ) N 4 ( 4 d 4 )
50(6 2 12 ) 52[5.5 2 (4) 2 ] 48[7 2 (1) 2 ] 51(8.2 2 3 2 ) 50 52 48 51
1
3
Q3 Q1 79.5 62 Q 8.75 2 2
2.
对次数分布表数据计算四分差
首先计算出 Q1与 Q3两点数值,然后代入公式(4.7) 即可。计算 Q1和 Q3的公式为: N Fb Q1 Lb 4 i (4.8) f Q1 3N Fb Q3 Lb 4 i (4.9) f Q3 式中,Lb 表示该四分位数所在组的下实限; f Q 、 表示 Q1 、 3 所在组的次数; Q fQ Fb 表示该四分位数所在组下一组对应的向上 累积次数;表示组距;为总次数。 N
解: 设
N1 50, N 2 52, N 3 48, N 4 51
X 1 90, X 2 85, X 3 88, X 4 92
1 6, 2 5.5, 3 7, 4 8.2
则
N1 X 1 N 2 X 2 N 3 X 3 N 4 X 4 Xt N1 N 2 N 3 N 4
CV体重 CV身高
体重的离散程度比身高的离散程度大。
例7.已知某校一年级学生的平均身高 为124.20厘米.标准差为3.26厘米;六年级
学生的平均身高为148.54厘米,标准差为
3.82厘米。试比较两个年级身高的离散程 度。
解
CV一年级
3.26 100= 100 2.62 X 124 .20
例4. 20名学生英语测验成绩为52、79、73、 60、45、44、89、87、65、81、68、79、67、 80、65、64、72、66、48、83,求测验成绩 的四分差。
解:先将20个数据按从小到大顺序排列:44、 45、48、52、60、64、65、65、66、67、68、 72、73、79、79、80、81、83、87、89。 然后确定 Q1和Q3 的位置,由于 N 20 ,所以Q1 60 64 20 1 Q 62 ;Q 的位置 的位置是 4 2 5.5 ,则 3 2 3 20 1 是 4 2 15.5 ,则 Q 79 80 79.5 。代入公式 2 (4.6)得