(完整版)心理与教育统计学第4章差异量数

合集下载

教育统计学第04讲 差异量数

教育统计学第04讲 差异量数

25~29 139 268 29.89 75~79 70 1809 95.21
20~24 147 429 22.58 70~74 98 1739 91.53
15~19 151 282 14.84 65~69 134 1641 86.37
10~14 98 131 6.89 60~64 131 1507 79.32
四分位数通常与中数联系起来共同应用,中数可 以看作是第二四分位点。
对于未分组数据求四分位差,Q1、Q3可依照未分 组数据求中数的方法求得。
20
(一)四分位差的计算
例:假设有数组:0,10,20,30,40,50,60 ,70,80,90,100,110.
第一个四分位为第三位和第四位的中位数,即: Q1=(20+30)/2=25;
f (x x)3
3
N
4
f (x x)4 N
用来表示一个分 布中偏斜度或偏 态性的指标
用来表示一个分 布中峰态性的指

26
二、平均差
⒈定义:平均差(average deviation),是所有原
始数据与平均数绝对离差的平均值。一般用AD表

2. 计算:
X X
AD N
用中位数作集中量时,常用四分位距作差异量。
22
例 分组数据求四分位差
组限
95— 90— 85— 80— 75— 70— 65— 60— 55—
次数
1 4 6 9 12 8 5 4 1
自下而上 累计次数
50 49 45 39 30 18 10 5 1
算法:
①计算累计次数N=50 ②计算四分位数与四分差:
解:由一个原始分数求低于它的分数比例,是一个 求百分等级的问题,利用公式:

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。

(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。

这些特殊性常表现为数据的变异性。

因此,只用集中量数不可能真实地反映出它们的分布情形。

为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。

2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。

缺点是较难理解,运算较繁琐,易受极端值的影响。

(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。

因此,方差是推论统计中最常用的统计量数。

(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。

(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。

(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。

(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。

当组距不确定,其他差异量数都无法计算时,可以计算四分位差。

但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。

教育统计学_第四章 教育统计学之差异量

教育统计学_第四章 教育统计学之差异量
敏 因此,全距只能作为差异量的粗略指标,
在编制频数分布表示决定全距范围之用。
二、四分位距: 以一定顺序排列的一组数据中间部位50%个频数
距离的一半作为差异量指标。
QD
Q 3
Q 1
2
QD 表示四分位距
Q 表示第三个四分位距(第75%百分位数) 3
Q 1
表示第一个四分位距(第25%百分位数)
1.原始数据计算法 例如:教育学专业99级学生教育测量学成绩如
105-
107.5
14
110-
112.5
9
115—
117.5
4
120-
122.5
3
125-
127.5
2
总和
100
累积频数 3 11 23 44 68 82 91 95 98 100
解:全距=127.5—82.5 =45 或者,全距=130-80=50
评价
优点:概念清楚,意义明确,计算简单 缺点:易受两极端数值影响,反映不灵
差异量
表示一组数据变异程度或离散程度的量称为 差异量。 用多边图把几组数据的频数分布表示出来, 我们可以很直观地了解数据的变异性或离散程度。
A、B、C三个平行班在某次数学考试上的得分情况。 三个班的平均数差别不大,而各班的离散程度却有很明 显的不同。在这三个班中,B班的分数分布(高、狭)范 围最窄,最整齐;C班的分数分布(平、宽)范围最广, 变异最大。这是用图所进行的直观分析和判断。若用一 个统计量概括地说明数据的变异程度或离散程度的特征, 这个统计量就是差异量。
乙组
20 40 60 80 100
对于一个小组的成绩,我们通常用平均数来代表各 组的成绩。但在这样的情况下,仅用平均数就不能正确 反映两组的区别。

张厚粲《现代心理与教育统计学》(第4版)章节题库-差异量数(圣才出品)

张厚粲《现代心理与教育统计学》(第4版)章节题库-差异量数(圣才出品)

6.已知一组数据 6,5,7,4,6,8 的标准差是 1.29,把这组中的每一个数据都加上
3 / 18
圣才电子书 十万种考研考证电子书、题库视频学习平台

5,然后再乘以 2,那么得到的新数据组的标准差是( )。 A.1.29 B.6.29 C.2.58 D.12.58 【答案】C 【解析】标准差有三个特性:①每一个观测值都加同一个常数 c 之后,得到的标准差等
2.研究者决定通过每一个分数除以 10 来对原始分数进行转换。原始分数分布的平均 数为 40,标准差为 15。那么转换以后的平均数和标准差将会是( )。
A.4,1.5 B.0.4,0.15 C.40,1.5 D.0.4,1.5 【答案】A
1 / 18
圣才电子书 十万种考研考证电子书、题库视频学习平台
5 1.92
5.某学生某次数学测验的标准分为 2.58,这说明全班同学中成绩在他以下的人数百分 比是( ),如果是-2.58,则全班同学中成绩在他以上的人数百分比是( )。
A.99%,99% B.99%,1% C.95%,99% D.95%,95% 【答案】A 【解析】Z=2.58,查正态分布表可得 p=0.99,即该生的数学测验标准分为 2.58 时, 全班同学中成绩在他以下的人数百分比为 99%;同理,当该生的数学测验标准分为-2.58 时,全班同学中成绩在他以上的人数百分比也为 99%。

【解析】平均数的特点是在一组数据中,每一个数都乘以一个常数 c 所得的平均数为原 来的平均数乘以常数 c,因此转换后的平均数为 4;标准差的特点是每一个观测值都乘以一 个相同的常数 c,则所得的标准差等于原标准差乘以这个常数,因此转换后的标准差为 1.5。
3.已知平均数 M=4.0,S=1.2,当 X=6.4 时,其相应的标准分数为( )。

第四讲 心理统计学-差异量数

第四讲 心理统计学-差异量数

5
¾第一节 全距和百分位差
6
一、全距(range)
¾又称两极差,用符号R表示 ¾计算公式为:R=Xmax-Xmin ¾特点:
是最简单、最容易理解的差异量数 是最粗糙、最不可靠的值
仅仅用了极端值计算 受抽样变动的影响
7
二、百分位差
¾ (一)百分位数(percentile) 它是指量尺上的一个点,在此点以下,包括数 据分布中全部数据个数的一定百分比。第P百 分位数就是指在其值为P的数据以下,包括分 布中全部数据的百分之p,其符号为Pp 。
26
标准差的特性
¾ 每一个观测值都加一个相同常数C之后,标准差 不变
¾ 每一个观测值都乘一个相同常数C之后,得到标 准差等于原标准差乘以这个常数。
¾ 每一个观测值都乘一个相同常数C之后,在加上 一个常数d后,得到标准差等于原标准差乘以这个 常数C。
27
3
¾标准差的优点: 反应灵敏 计算公式严密 容易计算 适合代数运算 受抽样变动影响小 简单明了
∑ ∑ ∑ s
2 T
=
Ni
s
2 i
+
Ni
d
2 i
Ni
∑ ∑ ∑ sT =
N
i
s
2 i
+
Ni
d
2 i
Ni
s2T 为 总 方 差 , sT 为 总 标 准差, si为各小组标准差 Ni为各小组数据个数 di= X T − X i XT 表示为总平均数,
X i小组的平均数
25
总方差和总标准差的特性
¾ 方差的特性 是对一组数据中各种变异总和的测量,具有 可加性和可分解性特点。 可以利用方差的可加性去分解和确定属于不 同来源的变异(如组间、组内等),进一步 说明各种变异对总结果的影响。

(完整word版)现代心理与教育统计学

(完整word版)现代心理与教育统计学

心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。

具体内容:1数据分组:采用图与表的形式。

2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列 3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。

作用:用样本推论总体。

具体内容:1如何对假设进行检验。

2如何对总体参数特征值进行估计。

3各种非参数的统计方法。

心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。

(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。

(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。

特点:数字只是事物的符号,而没有任何数量意义。

统计方法:百分数次数众数列联相关卡方检验等。

(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。

(年级)特点:没有相等单位没有绝对零点。

不表示事物特征的真正数量.统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。

3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。

(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。

统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。

4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。

(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。

在统计中处理的数据大多是顺序数据和等距数据。

(完整版)现代心理与教育统计学

(完整版)现代心理与教育统计学

心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。

具体内容:1数据分组:采用图与表的形式。

2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。

作用:用样本推论总体。

具体内容:1如何对假设进行检验。

2如何对总体参数特征值进行估计。

3各种非参数的统计方法。

心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。

(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。

(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。

特点:数字只是事物的符号,而没有任何数量意义。

统计方法:百分数次数众数列联相关卡方检验等。

(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。

(年级)特点:没有相等单位没有绝对零点。

不表示事物特征的真正数量。

统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。

3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。

(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。

统计方法:平均数标准差积差相关Z检验t检验F检验等。

4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。

(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。

在统计中处理的数据大多是顺序数据和等距数据。

三按照数据是否具有连续性离散数据连续数据变量观测值随机变量变量:指心理与教育实验观察调查种想要获得的数据。

心理统计学-课程讲义4

心理统计学-课程讲义4

【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。

【学习方法】了解、理解、计算与应用。

【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。

【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。

但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。

描述一组数据波动情况的量数成为差异量数。

差异量数常用来衡量集中量数的代表性程度。

差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。

差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。

第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。

标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。

(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。

即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。

二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。

例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。

试比较两个班的成绩。

4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心理与教育统计学
复习专题:
平均增加率与几何平均数 平均增加量与算术平均数
一列数据分别为X1,X2,X3…Xn, 按一定的比例关系变化,则:
1
X2 X1
2
X3 X 2
N 1
XN X N 1
1 2 N 1
Mg N1 12 N1
Mg N1 X 2 X 3 X N X1 X 2 X N 1
160
170
180
190
A
B
4.1 全距与百分位数
• 4.1.1 全距
• 全距(range)又称为两极差,用符号R 表示。
• 用最大值(maximum)减去最小值 (minimum)得到全距。
R X max X min (4.1)
全距的特点: • 全距是最粗糙的差异量数,只利用了数据
中的极端值; • 容易受极端值的影响;
]
(4.5)
PR 百分等级; X 给定的原始分数。
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
60-
5
12
55-
4
7
50-
2
3
4.54+79.5=84.04
45-
1
1
合计
58
精确组限 79.5~84.49
5/7=0.71
采用次数分布表计算百分位数
PP
Lb
P 100
N
Fb
i fP
(4.4)
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限; fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数; i为组距。
X N X N 1 cN 1
c1 c2 cN 1
c c1 c2 cN1 N 1
c ( X 2 X1) ( X 3 X 2 ) ( X N X N1) N 1
平均增加量: c X N X1
N 1
如果数据按比例增加,适 合求平均增加率;
如果数据按一定数量增加, 适合求平均增加量。
5 4
58
7 3
P90
84.5
90 100
58
47
5 6
88.83
1
P90 P10 88.83 58 30.83
4.1.4 百分等级
• 某一数值在一组数据中所处的百分位置, 称为该数值的百分等级(percentile rank)
• 符号为PR
PR
100 N [Fb
(X
Lb )
fP i
数值: 2 3 5 5 7 9 12 15 15 16 次序: 1 2 3 4 5 6 7 8 9 10
P10
(n 1)P% j g
Pp (1 g) X j gX j1
求P10:(10 1)10% 1 0.1
j=1;g=0.1
P10 (1 0.1) 2 0.1 3 2.1
(2)采用次数分布表计算百分位数
合计
频数f 2 3 6 7 8 11 9 5 4 2 1 58
(P90—P10)
累加频数
58
首先计算P10和P90对 应的累加次数
56
58×10/100=5.80
53
58×90/100=52.20
47 40 32 21 12
PP
Lb
P 100
N
Fb
i fP
P10
54.5
10 100
58
3
Mg N 1 X N X1
增加率的定义:
N 1
X N X N 1 X N 1
则: X N X N 1(1 N 1)
1 N 1
XN X N 1
由于
所 以
N 1
XN X N 1
1
一列数据分别为X1,X2,X3…Xn, 按一定数量增加,则:
X 2 X1 c1
X 3 X 2 c2
20
20
15
15
Frequency Frequency
10
10
5
5
Mean = 160.479 Std. Dev. = 8.68513 N = 100
Mean = 159.6089 Std. Dev. = 4.78489 N = 100
0
0
130
140
150
160
170
180
190
130
140
150
全距的应用: • 主要用于对数据作预备性检查,了解数据
的大概分布范围; • 确定统计分组,编制次数分布表。
4.1.2 百分位数
• 百分位数又称为百分位点,指两量尺 上的一个点,在此点以下,包括数据 分布中全部数据个数的一定百分比。
• P百分位数将所有数据分为两部分,小 于该数值的个数与总的个数的比值为 P%。
(1)根据原始数据计算百分位数
数值: 2 3 5 5 7 9 12 15 15 16 次序: 1 2 3 4 5 6 7 8 9 10
P10
P50
P50即中数,位于第5号数据和6号数 据之间。 P10位于第1号数据和第2号数据之间
SPSS计算百分位数的方法:
求累加次数: (n 1)P% j g
n 表示数据的个数; P 表示百分位数; j 表示整数部分; g 表示小数部分
(4.2)
求百分位数:Pp (1 g) X j gX j1 (4.3)
Xj表示第j个数据值;
参考文献:虞仁和, 胡国清, 孙振球, & 黄正南. (2010). 关于百分位 数直接计算法的进一步探讨. 中国卫生统计, 27(3), 307-308.
4.1.3 百分位差
• 由于全距表示一组数据的离散程度时, 受极端数据的影响。
• 可用百分位差表示离散程度,百分位 差是指两个百分位数之差。
• 如: P90-P10,P93 -P7 。 • 百分位差不能很好地反应中间数据的
分布情况,常作为辅助差异量数
用次数分布表计算百分位差
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
第4章 差异量数
• 4.1 全距与百分位数 • 4.2 平均差、方差与标准差 • 4.3 标准差的应用 • 4.4 差异量数的选用
• 差异量数是对一组数据的变异性,即 离中趋势特点进行度量和描述的统计 量,也称为离散量数(measures of dispersion)
• 差异量越大,表明数据越分散、不集 中;差异量越小,表明数据越集中, 变动范围越小。
( P80百分位数)
84.04
84.50 7 83.79 6 83.07 5 82.36 4
81.64
3
80.93
80.21 2
成绩 95- 90- 85- 80- 75- 70-
频数f 2 3 6 7 8 11
累积频数
58 56 53 47 40 32
79.50 1
65-
9பைடு நூலகம்
21
58×0.8=46.4 46.4-40=6.4 6.4×0.71=4.54
相关文档
最新文档