第04章 差异量数思考题

合集下载

教育统计学第04讲 差异量数

教育统计学第04讲 差异量数

25~29 139 268 29.89 75~79 70 1809 95.21
20~24 147 429 22.58 70~74 98 1739 91.53
15~19 151 282 14.84 65~69 134 1641 86.37
10~14 98 131 6.89 60~64 131 1507 79.32
四分位数通常与中数联系起来共同应用,中数可 以看作是第二四分位点。
对于未分组数据求四分位差,Q1、Q3可依照未分 组数据求中数的方法求得。
20
(一)四分位差的计算
例:假设有数组:0,10,20,30,40,50,60 ,70,80,90,100,110.
第一个四分位为第三位和第四位的中位数,即: Q1=(20+30)/2=25;
f (x x)3
3
N
4
f (x x)4 N
用来表示一个分 布中偏斜度或偏 态性的指标
用来表示一个分 布中峰态性的指

26
二、平均差
⒈定义:平均差(average deviation),是所有原
始数据与平均数绝对离差的平均值。一般用AD表

2. 计算:
X X
AD N
用中位数作集中量时,常用四分位距作差异量。
22
例 分组数据求四分位差
组限
95— 90— 85— 80— 75— 70— 65— 60— 55—
次数
1 4 6 9 12 8 5 4 1
自下而上 累计次数
50 49 45 39 30 18 10 5 1
算法:
①计算累计次数N=50 ②计算四分位数与四分差:
解:由一个原始分数求低于它的分数比例,是一个 求百分等级的问题,利用公式:

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。

(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。

这些特殊性常表现为数据的变异性。

因此,只用集中量数不可能真实地反映出它们的分布情形。

为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。

2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。

缺点是较难理解,运算较繁琐,易受极端值的影响。

(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。

因此,方差是推论统计中最常用的统计量数。

(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。

(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。

(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。

(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。

当组距不确定,其他差异量数都无法计算时,可以计算四分位差。

但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。

张厚粲《现代心理与教育统计学》(第4版)章节题库-差异量数(圣才出品)

张厚粲《现代心理与教育统计学》(第4版)章节题库-差异量数(圣才出品)

6.已知一组数据 6,5,7,4,6,8 的标准差是 1.29,把这组中的每一个数据都加上
3 / 18
圣才电子书 十万种考研考证电子书、题库视频学习平台

5,然后再乘以 2,那么得到的新数据组的标准差是( )。 A.1.29 B.6.29 C.2.58 D.12.58 【答案】C 【解析】标准差有三个特性:①每一个观测值都加同一个常数 c 之后,得到的标准差等
2.研究者决定通过每一个分数除以 10 来对原始分数进行转换。原始分数分布的平均 数为 40,标准差为 15。那么转换以后的平均数和标准差将会是( )。
A.4,1.5 B.0.4,0.15 C.40,1.5 D.0.4,1.5 【答案】A
1 / 18
圣才电子书 十万种考研考证电子书、题库视频学习平台
5 1.92
5.某学生某次数学测验的标准分为 2.58,这说明全班同学中成绩在他以下的人数百分 比是( ),如果是-2.58,则全班同学中成绩在他以上的人数百分比是( )。
A.99%,99% B.99%,1% C.95%,99% D.95%,95% 【答案】A 【解析】Z=2.58,查正态分布表可得 p=0.99,即该生的数学测验标准分为 2.58 时, 全班同学中成绩在他以下的人数百分比为 99%;同理,当该生的数学测验标准分为-2.58 时,全班同学中成绩在他以上的人数百分比也为 99%。

【解析】平均数的特点是在一组数据中,每一个数都乘以一个常数 c 所得的平均数为原 来的平均数乘以常数 c,因此转换后的平均数为 4;标准差的特点是每一个观测值都乘以一 个相同的常数 c,则所得的标准差等于原标准差乘以这个常数,因此转换后的标准差为 1.5。
3.已知平均数 M=4.0,S=1.2,当 X=6.4 时,其相应的标准分数为( )。

第四章 差异量数

第四章 差异量数

例2:比较两组女童体重的差异情况
表4—2 某市两组女童体重的调查资料
平均数 2个月组 6岁组 5.45千克 19.02千克 标准差 0.62千克 2.12千克
解:
CV 1
S 0.62 100 0 0 100 0 0 11.4 0 0 5.45 X
CV 2
1
S 2.12 100 0 0 100 0 0 11.2 0 0 19.02 X
组。
二、平均差
(一)定义:平均差是指一组数据中,
每一个数据与该组数据的平均数离差的绝 对值的算术平均数,通常用AD表示。 (二)计算公式
AD
Xi X n
例1:有5名被试的错觉实验数据如下, 求其平均差。
被试
错觉量
1
16
2
18
3
20
4
22
5
17
(ms)
解:已知n=5

AD Xi X
优点:① 反应灵敏; ② 严密确定;
③ 容易计算;④ 适合进一步代数运算; ⑤ 受抽样变动的影响小; ⑥ 简单明了。 缺点:应用方差和标准差比较两个不
同数据的次数分布,必须保证两数据的
单位相同。而且两数据的平均水平比较 接近。
四、差异系数
(一)定义
差异系数是指标准差与其算术平均数
的百分比。它是没有单位的相对差异量


2
2.根据原始数据计算方差和标准差的公式
Xi Xi S n n
2 2 2
Xi Xi S n n
2
2

原始数据的计算公式等价于定义公式,当两
个公式计算结果有出入时,应以原始数据计算公 式的结果为准,因其更准确。

统计心理-第四章 差异量数

统计心理-第四章 差异量数

第二节 平均差、方差与标准差
一、平均差 • 1. 意义: 次数分布中所有原始数据与平均
数绝对离差的平均值。一般用符号A.D.或 M.D. 来表示。 • 2. 计算: • (1)原始数据求平均差
A.D. Xi X
n
例题:
有5名被试的错觉实验数据如下,求其平均差。
被试
1
2
3
4
5
错觉量 16
18
i 1
N


i 1
N

i




(三)总标准差的合成
St
N 1
S
2 1

d
2 1
N2
S
2 2

d
2 2
Nk
S
2 k

d
2 k
N1 N2 Nk
k
k
N
i
S
2 i

N
i
d
2 i
i1
i1
k
Ni
i1
S

t


准差
注意:只有应用同一种观测手段,测量同一 个特质,只是样本不同时,才能应用该公式 合成方差和标准差。
易受极端值的影响; 易受取样变动的影响; 未考虑数据的分布。
7 8 9 10 7 8 9 10 全距只是一种低效的差异量数,主要用 于对数据的预备性检查,了解数据的大概 范围,以确定如何统计分组。
二、百分位差(percentile)
• 为了避免极端数据的影响,将数据的两 端各截去10%,即P10和P90之间的距离作 为差异量数。
负号,应用较少。
二、方差与标准差

第四章 差异量数

第四章 差异量数

三、由各部分的标准差合成总标准差的计算方式
已知总体中各部分的标准差,若求其总标准 差,可用下面公式进行合成: (4.6) 式中: t为总标准差; N t 为总体中数据的个 d 数; i为各部分数据的标准差;i 为各部分平 均数与总平均数之差,即 di X i X t 。其中
Nt
t
例6.某小学四年级248名学生的平均身高为 143.52厘米,标准差是6.48厘米;平均体重
30.28千克,标准差4.56千克,试比较身高与体
重两变量的离散程度。
解:
CV身高
6.48 100= 100 4.52 X 143 00 15.06 X 30.28
=
50 90 52 85 48 88 51 92 50 52 48 51
= 89
d1 X 1 X t 90 89 1 d 2 X 2 X t 85 89 4 d 3 X 3 X t 88 89 1 d 4 X 4 X T 92 89 3
第四章

差异量数
第一节 标准差 第二节 四分差 第三节 差异系数 第四节 相对地位量数 习 题与思考题
描述一组数据离中趋势(波动性)的量数,称 为差异量数。
差异量数有:绝对差异量数和相对差异量数 两种。绝对差异量数包括全距、平均差、四分差 、方差、标准差等,相对差异量数有差异系数和 峰态量数、偏态量数。
本章重点介绍标准差、四分差、差异系数, 并学习标准分数和百分等级两个相对地位量数。
第一节 标准差
一、标准差的概念 二、标准差的计算方法

1、对原始数据计算标准差
2、对次数分布表计算标准差

(完整版)心理与教育统计学第4章差异量数

(完整版)心理与教育统计学第4章差异量数
心理与教育统计学
复习专题:
平均增加率与几何平均数 平均增加量与算术平均数
一列数据分别为X1,X2,X3…Xn, 按一定的比例关系变化,则:
1
X2 X1
2
X3 X 2
N 1
XN X N 1
1 2 N 1
Mg N1 12 N1
Mg N1 X 2 X 3 X N X1 X 2 X N 1
160
170
180
190
A
B
4.1 全距与百分位数
• 4.1.1 全距
• 全距(range)又称为两极差,用符号R 表示。
• 用最大值(maximum)减去最小值 (minimum)得到全距。
R X max X min (4.1)
全距的特点: • 全距是最粗糙的差异量数,只利用了数据
中的极端值; • 容易受极端值的影响;
]
(4.5)
PR 百分等级; X 给定的原始分数。
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
60-
5
12
55-
4
7
50-
2
3
4.54+79.5=84.04
45-
1
1
合计
58
精确组限 79.5~84.49
5/7=0.71
采用次数分布表计算百分位数
PP
Lb
P 100
N
Fb
i fP
(4.4)
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限; fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数; i为组距。
X N X N 1 cN 1

统计课后思考题答案

统计课后思考题答案

统计课后思考题答案统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科它收集处理分析解释来自各个领域的数据并从中得出结论。

1.3解释描述统计和推断统计描述统计它研究的是数据收集处理汇总图表描述概括与分析等统计方法。

推断统计它是研究如何利用样本数据来推断总体特征的统计方法。

1.5解释分类数据顺序数据和数值型数据统计数据按所采用的计量尺度不同分定性数据分类数据只能归于某一类别的非数字型数据它是对事物进行分类的结果数据表现为类别用文字来表述定性数据顺序数据只能归于某一有序类别的非数字型数据。

它也是有类别的但这些类别是有序的。

定量数据数值型数据按数字尺度测量的观察值其结果表现为具体的数值。

统计数据按统计数据都收集方法分观测数据是通过调查或观测而收集到的数据这类数据是在没有对事物人为控制的条件下得到的。

实验数据在实验中控制实验对象而收集到的数据。

统计数据按被描述的现象与实践的关系分截面数据在相同或相似的时间点收集到的数据也叫静态数据。

时间序列数据按时间顺序收集到的用于描述现象随时间变化的情况也叫动态数据。

1.6举例说明总体样本参数统计量变量这几个概念对一千灯泡进行寿命测试那么这千个灯泡就是总体从中抽取一百个进行检测这一百个灯泡的集合就是样本这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量变量就是说明现象某种特征的概念比如说灯泡的寿命。

1.7变量的分类变量可以分为分类变量顺序变量数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.8举例说明离散型变量和连续性变量离散型变量只能取有限个值取值以整数位断开比如“企业数”连续型变量取之连续不断不能一一列举比如“温度”。

1.8统计应用实例人口普查商场的名意调查等。

1.9统计应用的领域经济分析和政府分析还有物理生物等等各个领域。

第二章思考题2.4自填式面访式和电话式各自的长处和弱点自填式优点 1调查组织者管理容易2成本低可进行大规模调查3对被调查者可选择方便时间答卷减少回答敏感问题压力。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.标准差在心理与教育研究中除度量 数据的离散程度处还有哪些用途?
• 作为一个非常优秀的差异量数,标准差有着非常广 泛的用途。 • (1)差异系数。 • 比较同质性数据的离散程度的大小时,如果平均数 相同,可以直接比较标准差的大小。但是: • ①当进行两个或两个以上的样本资料不同质; • ②即使是同质性数据,其平均数相差较大时;比较 其变异程度就不能采用标准差,而需采用标准差与 平均数的比值(相对值)来比较。 • 变异系数可以消除单位和(或)平均数不同对 两个或多个资料变异程度比较的影响。
P100例4-10利用Z分数求总和
问题:如果这两个考生只录取一个该录取谁?
• ③表示标准测验分数
• 经过标准化的心理或教育测验,如果其常模分数 接近正态,常转化为标准正态分数。其转化公式 为: • Z′=aZ+b • 式中Z′为正态标准分数z=(X-X) /σ , a,b为常数,σ为测验常模的标准差。 • 如:韦氏离差智商为:IQ=15Z+100 注:T分数一般是指对学生的各科成绩计算 标准分数。转换公式为T= 10 *Z+50
• ②已知不同质的观测值的次数分布为正态时, 可用Z分数求不同的观测值的总合或平均值, 以表示个体在团体中的相对位置。 • 例如高考各科成绩为正态分布,但各科成绩 的难易度不同,因此各科成绩就属于不同质 的分数,如果简单地将各科成绩加起来或求 平均数,这是不科学的。如果用Z分数求综 合才更有意义,也更科学。
第四章
差异量数思考与练习题
• 1.度量离中趋势的差异量数有哪些?为什么要度量 离中趋势? • (1)有全距、四分位差、百分位差、平均差、标准 差和方差等。 • (2)在心理与教育研究中,要全面描述一组数据的 特征,不但要了解数据的典型情况,而且还要了解 特殊情况。这些特殊性常常表现为数据的变异性。 因此,只用集中量数不可能真实地反映出它们的分 布情形。为了全面反映数据的总体情况,除了必须 求出集中量数外,这时还需要使用差异量数。
• 例题:某校期中考试物理均分为80,标准差 为4分,英语成绩均分为78,标准差为10分, 某生物理成绩和英语成绩均为85分,问该生 的英语成绩和物理哪一科更好? • 解:Z物理=(85-80)/4=1.25 • Z英语=(85-78)/10=0.8 • 问该生的英语成绩和物理哪一科更好? • 答:该生物理成绩好于英语成绩
2.各种差异量数各有什么特点?
• ①标准差计算最严密,它根据全部数据求得,考 虑到了每一个样本数据,测量具有代表性,适合 代数法处理,受抽样变动的影响较小,反应灵敏。 缺点是易受极端数据的影响。 • ②方差的描述作用不大,但由于它具有可加性, 是对一组数据中造成各种变异的总和的测量,通 常采用方差的可加性分解并确定属于不同来源的 变异性,并进一步说明各种变异对总结果的影响。 因此,方差是推论统计中最常用的统计量数。
(3)异常值的取舍
• 在一个正态分布中,平均数上下一定的 标准差处,包含有确定百分数的数据个 数。根据这个原理,在整理数据时,常 采用三个标准差法则取舍数据,即如果 数据值落在平均数加减三个标准差之外, 则在整理数据时,可将此数据作为异常 值舍弃。(3σ原则)
4.应用标准分数求不同质的数据时应注意什么问题?
• 解:
S
X X 22N NhomakorabeaN
1.37
≈ 1.37
AD

i 1
n
xi X n
• ≈1.19
• 答标准差为1.37,平均差为1.19。
6.计算p53(第2章习题4.)所列 次数分布表的标准差、四分差。
f ( x x )2 解(1)应用公式: S f fx 2 ( fx) 2 / f
• ③全距计算简便,容易理解,适用于所有类 型的数据,但它易受极值影响,测量也太粗 糙,只能反映分布两端值的差值,不能显示 全部数据的差异情况,仅作为辅助量数使用。 • ④平均差容易理解,易于计算,能说明分布 中全部数值的差异情况,缺点是会受两极数 值的影响,但当数据较多时,这种影响较小, 因有绝对值也不适合代数方法处理。
• 应用标准分数求不同质的数据总和时, 应注意不同质的观测值的次数分布应该 是正态的。因为标准分数是线形变化, 不改变原始分布的形态,只有原始分布 是正态时,转化后的标准分数才是正态。
5.计算下列数据的标准差与平均差:11.0, 13.0,10.0,9.0,11.5,12.2,13.1, 9.7,10.5。
S
f ( Xc X ) f

fx
( fx ) / f
f
• S=11.82
Q1 Lb
1 N Fb 4 f
i
3 N Fb 4 Q3 Lb i f
Q3 Q1 Q3 1 4 4 2
1 55 9 4 Q1 39.5 5 42.89 7
1 65 12 4 Q1 150.25 12.5 159.10 6
Q3 Q1 Q 7.76 2
答:标准差为11.82,四分位差为7.76
3 55 35 Q2 54.5 4 5 58.41 8
• 可做一些练习题(P50)
• ⑤百分位差易理解,易计算,不易爱极值影响, 但不能反映出分布的中间数值的差异情况,也 仅用作辅助量数。 • ⑥四分差差意义明确,计算方便容易,对极端 值不敏感,较不受极端值影响。当组距不确定, 其它差异量数都无法计算时,可以计算四分位 差。但是,四分位差无法反映分布中所有数据 的离散状况,不适合使用代数方法处理,受抽 样变动影响较标准差大。 • 通过比较,可以发现标准差和方差价值大,它 们的应用也比较广泛,因此,一般称标准差、 方差为高效差异量。相比较而言,其它差异量 数,如全距、平均差、百分位差和四分位差等 缺点比较明显,应用也受到限制,故称它们为 低效差异量数。
f
求次数分布表的标准差,得s≈26.3 (2)应用公式:
Q1 Lb
1 N Fb 4 f
*i
3 N Fb Q3 Lb 4 *i f
1 65 12 4 Q1 150.25 12.5 159.10 6
1 65 12 4 Q1 150.25 12.5 159.10 6
(2)标准分数 标准分数是以标准差为单位,表示一个分数在团体中所处位置 的相对位置量数。
标准分数的应用: ①用于比较分属性质不同的观测值在各自数据分布中相对位置 的高低。这样就能进行不同观测值的比较。 • 相对位置包括两层意思:一是表示原数目以平均数为中心, 以标准差为单位,所处距离的远近或方向;二是表示表示原 数目在该组数据分布中的位置,即在该数目以上或以下的数 目有多少。如果是正态分布中,这两个意思合而为一,在偏 态分布中就不能同一。 ②已知不同质的观测值的次数分布为正态时,可用Z分数求不同 的观测值的总合或平均值,以表示个体在团体中的相对位置。
3 65 45 4 Q2 187.25 12.5 192.45 9
Q3 Q1 Q 16 .68 2
答:标准差为26.3,四分位差为16.68
7. p107
• 解:由于两组数据平均数和标准差都 有很大的差异,因此应该用差异系数 比较两组数据的离散程度。 • 将数据代入公式: S CV ×100%,得
X
• CV1=(0.7/1.3)×100%=53.85%
• CV2=(1.2/4.3)×100%=27.91%
• 答:5cm组的差异比10cm组的离散程度大
8.P1073
• 求总标准差不做要求。
9.求下表数据分布的标准差和 四分位差。(p107)
• 解:应用分组数据求标准差和四分位差的公式求 解: 2 2 2
相关文档
最新文档