4数理统计·差异量数2013
合集下载
差异量数ppt课件

9
10
11
Q1
Lb
1N 4
f
Fb
i
115727 Q124.54 16 528.33
Q3
Lb
3N 4
f
Fb
i
315798 Q339.54 24 543.61
12
箱线图 (box-plot)
13
14
形状的分布与箱线图
15
16
百分等级与百分位数
➢ 百分等级是指一组有序数据中某一数据以下所含次数占总次数的百分比,通常用 符号PR表示 ➢ 在教育上通常用百分等级表示一个分数在团体中的相对位置。百分等级越低,个 体在团体中所处的位置越差。如果某分数的百分等级PR=70,则表明团体用有70% 的人成绩低于该分数 ➢ 与百分等级相对应的数值为相应的百分位数
➢ 一个数与平均数之差是8,其对应的z分数为0.5。总体的标准差是多少?
➢ 在一个分数分布中,X = 62的z分数为0.5, X = 52的z分数为-2.00。求分数分布的平均 数和标准差。
47
➢ 周一下午,Bill在英语考试中的分数是73分,整体的平均数是μ=65,σ=8。在同一天, John在数学考试中的分数是63,整体的平均数是μ=57,σ=3。谁的分数更好些,Bill还 是John ?解释你的答案。
17
百分等级的计算---未分组数据
PR
100(1R) N
➢ R-给定分数在团体中的等级,N-总的数据个数
18
➢ 例:15名学生的考试成绩如下:98,93,62,92,91,92,65,66,90,87,78, 86,81,85,83。问90分学生百分等级是多少?
解:将成绩从大到小排序: 98,93,92,92,91,90,87,86,85,83,81,78,66,65,62。
04第四章 差异量数

第三节 标准差的应用
二、标准分数
2、标准分数的性质 、标准分数的性质
分数无实际测量单位, ①Z分数无实际测量单位,是以均值为参照点, 分数无实际测量单位 是以均值为参照点, 以标准差为单位的一个相对量,为等距数据。 以标准差为单位的一个相对量,为等距数据。
分数的平均数为0, ②一组原始数据转换得到的Z分数的平均数为 ,标 一组原始数据转换得到的 分数的平均数为 准差为1。 准差为 。若原始数据呈正态分布(normal distributions), ) 则转换所得的Z分数服从正态分布 分数服从正态分布N( , )。 则转换所得的 分数服从正态分布 (0,1)。
第四章 差异量数
第一节 全距和百分位差 平均差、 第二节 平均差、方差与标准差 第三节 标准差的应用:差异系数和 标准差的应用:
标准分数
第四节 差异量数的选用
第一节 全距和百分位差
一、全距 P80
又称两极差, 最大值与最小值之差来表示离中 又称两极差,用最大值与最小值之差来表示离中 趋势,符号R(range),公式 R = X max − X min 趋势,符号 ( ),公式 ),
3、标准分数的优缺点 、标准分数的优
优点:可比性;可加性;明确性;稳定性。 优点:可比性;可加性;明确性;稳定性。
缺点:计算相对繁琐;常为负数或带有小数,难理解。 缺点:计算相对繁琐;常为负数或带有小数,难理解。
第三节 标准差的应用
二、标准分数
4、标准分数的应用(适用前提:正态变量)P97 、标准分数的应用 适用前提:正态变量)
自习例 例题计算 [自习例4-2] 自习
平均差、 第二节 平均差、方差与标准差
三、方差与标准差 P87
方差:离均差平方的均值,符号S 方差:离均差平方的均值,符号 2,公式
4数理统计·差异量数2013

2.四分差
为了修正全距受两极端数值影响的缺点,在一个 次数分布中,中间50%的次数的全距之半称为四分 差(四分位距)。 将数据从小到大排列后分成频数相等的四段,则 第1与第2段的分界点称第1个四分位数。第3与第4 段的分界点称第3个四分位数。 四分差就是第3个四分位数与第1个四分位数之差 的一半。
对应的数的加权平均数。
思考:假如Q1的位置是5.75,第5个数是60,第6个数
是64,请问Q1是多少?
10
四分差的计算步骤
1、将一组数据按大小秩序排列 2、计算Q1和Q3对应的位置 : N/4+1/2,3 N/4+1/2
3、对应出Q1和Q3对应的数值
4、套用公式
Q3 Q1 Q 2
|X X | AD N
平均差意义明确,计算简单,每个数据都参加了计算,涉及到
全部的离差,反应灵敏。
计算要用绝对值,不便于代数运算。 平均差与离均差(离差)不同。离均差表示每一个观测值与平
均数的距离大小,数值有正有负,离均差的总和为零。
14
平均差或离均差都有一些不足,如绝对值或正负号。 考虑取离均差的平方。
李红菊
1
主要内容
描述统计 (一)统计图表(数据分布) (二)集中量数(数据特征值) (三)差异量数(数据特征值) (四)相对量数(数据特征值) (五)相关量数(数据关系)
2
讨论
两个班数学成绩平均分一样,各学生的成绩是否一样?
3
集中量数
数据的次数分布的基本特点之一是集中趋势,指 数据分布中大量数据向某方向集中的程度。 用来描述一组数据这种特点的统计量被称为集中 量数,即描述一组数据集中趋势的量数。
11
为了修正全距受两极端数值影响的缺点,在一个 次数分布中,中间50%的次数的全距之半称为四分 差(四分位距)。 将数据从小到大排列后分成频数相等的四段,则 第1与第2段的分界点称第1个四分位数。第3与第4 段的分界点称第3个四分位数。 四分差就是第3个四分位数与第1个四分位数之差 的一半。
对应的数的加权平均数。
思考:假如Q1的位置是5.75,第5个数是60,第6个数
是64,请问Q1是多少?
10
四分差的计算步骤
1、将一组数据按大小秩序排列 2、计算Q1和Q3对应的位置 : N/4+1/2,3 N/4+1/2
3、对应出Q1和Q3对应的数值
4、套用公式
Q3 Q1 Q 2
|X X | AD N
平均差意义明确,计算简单,每个数据都参加了计算,涉及到
全部的离差,反应灵敏。
计算要用绝对值,不便于代数运算。 平均差与离均差(离差)不同。离均差表示每一个观测值与平
均数的距离大小,数值有正有负,离均差的总和为零。
14
平均差或离均差都有一些不足,如绝对值或正负号。 考虑取离均差的平方。
李红菊
1
主要内容
描述统计 (一)统计图表(数据分布) (二)集中量数(数据特征值) (三)差异量数(数据特征值) (四)相对量数(数据特征值) (五)相关量数(数据关系)
2
讨论
两个班数学成绩平均分一样,各学生的成绩是否一样?
3
集中量数
数据的次数分布的基本特点之一是集中趋势,指 数据分布中大量数据向某方向集中的程度。 用来描述一组数据这种特点的统计量被称为集中 量数,即描述一组数据集中趋势的量数。
11
第四章 差异量数

用频数分布表示全距的方法是:最大一 组与最小一组组中值之差,或者是最大 一组上限与最小一组下限之差。
意义:全距概念清楚,意义明确,计 算简单,但因它仅由最大值与最小值 而求得,易受两极端数值影响。不考 虑中间数值的差异,反应不灵敏。只 能作为差异量的粗略指标,在编制频 数颁布表时决定全距范围之用。
分数 组中值x 45-50-55-60-70-75-80-85-总和 47.5 52.5 57.5 62.5 67.5 77.5 82.5 87.5 f 1 2 0 2 3 8 fX 47.5 52.5 57.5 62.5 67.5 77.5 1 2 0 2 3 8 fX2 47.52 52.52 57.52 62.52 67.52 77.52 1 2 0 2 3 3
σx, σ2x
σ 2x =148506.3 /37(2290/37)2 =183.078σ
x
7 82.5 7 7 87.5 7 37 2290.0
82.52 7 87.52 7 148506.3
= 183.078 =13.53
二、全距(Range)
全距是一组数据中最大值与最小值之差, 又称极差。用R表示。 原始数据:用最大值减去最小值。
方差和标准差计算方法
原始数据计算法 频数分布表计算法
X 2 X 2 2 x ( ) N N
X X 2 x ( ) N N
2
注意比较
fX 2 fX 2 2 x ( ) N N
fX 2 fX 2 x ( ) N N
例:48个学生数学分数方差、 标准差的组中值计算表
第四章 差异量数
Measures of Variation
心理统计
方差 Variance 标准差 Standard deviation 全距 Range 四分差 Quartile 差异系数 Relative deviation
第四章 差异量数[24页]
![第四章 差异量数[24页]](https://img.taocdn.com/s3/m/c0f5fef2a5e9856a571260a5.png)
样本的标准差为: S=∑(X-)2n-1=∑x2n-1
四、分组数据的标准差和方差
在需要手工计算大量数据的时候,通 常的策略是先对数据进行分组。上一章中 已经提及分组数据的平均数、中位数的计 算方法,那么分组数据的标准差和方差又 是如何计算的呢?公式如下:σ=∑f(Xc-) 2N或σ=∑fX2cN-(∑fXcN)2
6.假定数据服从正态分布,求总体中小于-2σ的 百分比以及大于+3σ的百分比。
练习与思考
7.有些统计书中将数据集的异常值定义为距离其 均值三个标准差的测量值,其根据是什么?
8.假设某数据集近似服从正态分布,那么其全距 与标准差之间的关系如何?
9.某班期末考试,语文平均成绩为82分,标准差 为6.5分;数学平均成绩为75分,标准差为5.9分; 外语平均成绩为66分,标准差为8分。问哪一科成 绩的离散程度大?
R=Xmax-Xmin
第二节 平均离差、方差和标准差
一、平均离差
平均离差(average mean deviation)是所有原始 数据与平均数离差的平均值。一般用符号 AMD表示。
AMD=∑(X-)n=∑xn
二、方差
为了避免负数的出现,最好的办法是 取离均差的平方,然后相加起来,就得到 了离均差的平方和,即∑(X-)2 ,用这 个平方和再除以总个数,得到的值就是方 差。
练习与思考
4.某工厂制造一种手电筒电池,该工厂声称其制 造的电池中,至少有96%的电池寿命为95~105小 时,该厂随机抽取1 000节电池进行测试,测得平 均寿命为100小时,若该厂的声明是正确的,那么 样本标准差的最大可能值是多少?
5.已知某组数据近似正态分布,平均数是50,标 准差是5。那么,有多少人的成绩在平均数上下 一个标准差之内?有多少人的成绩在平均数上下 两个标准差之内?有多少人的成绩在平均数上下 三个标准差之内?
四、分组数据的标准差和方差
在需要手工计算大量数据的时候,通 常的策略是先对数据进行分组。上一章中 已经提及分组数据的平均数、中位数的计 算方法,那么分组数据的标准差和方差又 是如何计算的呢?公式如下:σ=∑f(Xc-) 2N或σ=∑fX2cN-(∑fXcN)2
6.假定数据服从正态分布,求总体中小于-2σ的 百分比以及大于+3σ的百分比。
练习与思考
7.有些统计书中将数据集的异常值定义为距离其 均值三个标准差的测量值,其根据是什么?
8.假设某数据集近似服从正态分布,那么其全距 与标准差之间的关系如何?
9.某班期末考试,语文平均成绩为82分,标准差 为6.5分;数学平均成绩为75分,标准差为5.9分; 外语平均成绩为66分,标准差为8分。问哪一科成 绩的离散程度大?
R=Xmax-Xmin
第二节 平均离差、方差和标准差
一、平均离差
平均离差(average mean deviation)是所有原始 数据与平均数离差的平均值。一般用符号 AMD表示。
AMD=∑(X-)n=∑xn
二、方差
为了避免负数的出现,最好的办法是 取离均差的平方,然后相加起来,就得到 了离均差的平方和,即∑(X-)2 ,用这 个平方和再除以总个数,得到的值就是方 差。
练习与思考
4.某工厂制造一种手电筒电池,该工厂声称其制 造的电池中,至少有96%的电池寿命为95~105小 时,该厂随机抽取1 000节电池进行测试,测得平 均寿命为100小时,若该厂的声明是正确的,那么 样本标准差的最大可能值是多少?
5.已知某组数据近似正态分布,平均数是50,标 准差是5。那么,有多少人的成绩在平均数上下 一个标准差之内?有多少人的成绩在平均数上下 两个标准差之内?有多少人的成绩在平均数上下 三个标准差之内?
4 第四章 差异量数

第三四分位为第九位和第十位的中位数,即:
Q3=(80+90)/2=85。 四分位差Q=(Q3-Q1)/2=(85-26)/2=29.5
24
在分组数据中:
n f b25 Q1 LQ1 4 i f Q1
3n f b75 Q3 LQ3 4 i f Q3
LQ:表示Q所在组的下限 N:表示总频数 fb:表示小于Q所在组下限的频数总和 i:表示组距
16
(五)用累加次数分布曲线图求百 分位数。P83 是一种粗略的计算方法
17
三、百分等级分数
百分等级分数与百分位数相反,它是事 先知道分布中的一个原始分数,再求这个原 始分数在分布中所处的相对位置—百分等级。
百分等级分数指出原始数据在常模团体 中的相对位置,百分等级越小,原始数据在 分布中相对位置越低;百分等级越大,原始 数据在分布中相对位置越高。
18
1 百分等级分数的计算公式
PR Fb
X Lb f
i N
100
式中:Lb 为某特定原始变量所在组的下限 Fb 小于Lb的累积频数
f 为某特定原始变量所在组的频数
N 为数据总的次数
i 为组距
19
2 百分等级分数的应用
例2 表4-1所列的考试分数分布中,已 知某应试者的考分为82分,问在这次考试 中低于该应试者的人数比例。
2 i 2 2 i
i
X X )
2
2X Xi N X
Xi X N X2 N X2
i
X
X 2(
X i2 2 X i2
N ( X i ) 2
) X i
X N (
N N
差异量数

10 CV男 = × 100 = × 100 = 10.53 95 X σ 11 CV女 = × 100 = × 100 = 13.75 80 X
σ
因CV女>CV男,所以女生成绩的离散程度 大于男生成绩的离散程度。
通常,一组数据的平均数较大,其标准差也较 大;平均数较小,其标准差也较小。因此,比较单 位相同但平均数相差较大的两组数据的离散程度时, 若直接用标准差比较可能是不准确的。
第四节 相对地位量数
一、标准分数 (一)标准分数的概念 标准分数是原始数据与算术平均数之差除以 标准差所得之商,用符号Z表示,计算公式为
Z=
XX
σ
(4.10)
式中:X 为算术平均数; σ为标准差
;X 为原始数据。
从公式可以看出,标准分数可以为正、负 或零值。它的含义是以平均数为标准,以标准 差为单位表示一个数据在团体中的相对位置。 标准分数为1,表明原始数据在平均数以上一个 标准差的位置;标准分数为-2,表明原始数据在 平均数以下2个标准差的位置。 (二)标准分数的性质 当一组数据的每个数值都转化为标准分数 后,则标准分数的平均数为零,标准差为1, 即 Z = 0, σ z = 1。
(4.9)
式中 :CV 为差异系数
; σ 为标准差 ; X 为平均数 。
CV属于相对差异量数,不具有测量单位。差 异系数越大,表时离散程度越大;差异系数越小, 表明离散程度越小。 (二)应用时机 1、比较单位不同的各组数据的离散程度时。 2、比较单位相同但平均数相差较大的各组数 据的离散程度时。 二、差异系数的计算方法
= 14.09
(二)分组资料标准差的计算方法
这里的分组资料指编制成次数分布的资料,此 时以组中值作为各组的代表值。计算公式为
统计心理-第四章 差异量数ppt课件

73.98
• ②求di,di2,Si2 ,填入表内第5、6、7列。
•
•
例:在三个班级进行某项能力研究,三个班测查结果 的平均数和标准差分别如下,求三个班的总标准差。
班级 人数 平均分 标准差
n
Xi
Si
di
d
2 i
S
2 i
1 45 75 9 1.02 1.04 81
2 38 78
8 4.02 16.16 64
XC
X
n
:
组限
95— 90— 85— 80— 75— 70— 65— 60— 55— 合计
分组数据求平均差
f
XC
1
97
4 92
6 87
9 82
12 77
8 72
5 67
4 62
1
57
50
计算
1.n5,0X7.73
组限
95— 90— 85— 80— 75— 70— 65— 60— 55— 合计
分组数据求平均差
2. 差异量数包括:全距、四分位差、百分位差、 平均差、标准差与方差等等。
:
第一节 全距与百分位差
一、全距
1. 定义 全距(range)又称两极差,用符号
R表示,是说明数据离散程度的最简单统 计量。
2. 计算
RXma xXmin
排R序越大后,说明离散程度越大。
:
第一节 全距与百分位差
一、全距
3. 全距的优缺点 优点:计算简便、容易理解。 缺点:粗糙,不灵敏;
3 40 69 10 -4.98 24.8 100
例:求总标准差
• 解:①求总平均数: Xt
N1 X1 N2 X 2 N3 X 3 N1 N2 N3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自学
21
二、方差与标准差
(五)性质和意义
方差与标准差是表示一组数据离散程度的最好指标。 方差是对一组数据中各种变异的总和的测量,具有可加性和 可分解性的特点,可以用来确定不同来源的变异性和各种 变异对总变异的影响。 标准差是一组数据方差的算术平方根,它不可以进行代数计 算,但有以下特性:
• 如果
Y X C
4
差异量数
数据的次数分布的基本特点之一是离中趋势,指 数据分布中数据彼此分散的程度。 用来描述一组数据这种特点的统计量称为差异量 数,即对一组数据的变异性,也就是离中趋势的度 量和描述。 用来衡量集中量数的代表性程度。
5
主要内容
差异量数
一、简易差异量数:全距、四分差 二、方差和标准差 三、差异系数
李红菊
1
主要内容
描述统计 (一)统计图表(数据分布) (二)集中量数(数据特征值) (三)差异量数(数据特征值) (四)相对量数(数据特征值) (五)相关量数(数据关系)
2
讨论
两个班数学成绩平均分一样,各学生的成绩是否一样?
3
集中量数
数据的次数分布的基本特点之一是集中趋势,指 数据分布中大量数据向某方向集中的程度。 用来描述一组数据这种特点的统计量被称为集中 量数,即描述一组数据集中趋势的量数。
|X X | AD N
平均差意义明确,计算简单,每个数据都参加了计算,涉及到
全部的离差,反应灵敏。
计算要用绝对值,不便于代数运算。 平均差与离均差(离差)不同。离均差表示每一个观测值与平
均数的距离大小,数值有正有负,离均差的总和为零。
14
平均差或离均差都有一些不足,如绝对值或正负号。 考虑取离均差的平方。
29
本章需上交的作业
三、1,3 四、比较几种差异量数(标准差、四分位数、差异系
数)的适用条件。
30
11
一、简易差异量数
2.四分差
分组数据:
自学
12
差异量数度量的理想形式
1.利用全部数据计算; 2.仅用一个数值刻画相对于均值的平均偏离程度; 3.对不同的数据集,当离散程度变大时该数值亦 变大。
13
二、方差与标准差
(一)平均差
指每个数据与该组数据的算术平均数离差的绝对值的算术
平均数,通常用AD表示。
③ 方差更多的时候在统计推断中使用,特别是方差 分析,便是利用了方差的可加性。
④ 同质数据,且平均数相差不大。
24
各种差异量数的优缺点
全距计算简便。但受极端数的影响,不能显示全 部数据的差异情况。 四分差计算容易,不受极端数的影响。但很难反
映分布中所有数据的离散状况。 平均差容易计算,好理解,但受极端数的影响, 不适合代数方法处理。 方差具有可加性,推论统计中最常用的统计量数。 标准差:计算最严密,适合代数法处理,受抽样 变动的影响较小,反应灵敏。但较难理解,运算 麻烦,受极端值的影响。
差异量数分为绝对差异量数(具有变量单位)和 相对差异量数(无实际单位)
6
一、简易差异量数
1.全距
全距是一组数据中最大值与最小值之差,又称极差,
用R表示。 计算简单,容易理解,是描述数据离散程度最为
简单的测量值。 易受两极端数值影响,不能反映中间数值的差异 情况,反应不灵敏。
7
一、简易差异量数
8
一、简易差异量数
2.四分差
公式: 通常与中位数配合使用。 适用条件:
Q3 Q1 Q 2
1)极端数据出现; 2)两端个别数据模糊或分组资料不确定组限。
Q1,Q3的位置分别是? 见书47 例6
9
四分位数的位置不是整数,怎么办?
有关的四分位数就是与该小数相邻的两个整数位置上
则 则
SY S X
• 如果
Y C X
SY C S X
C>0
二、方差与标准差
(五)性质和意义 1.特点:
①反应灵敏; ②计算公式确定严密;
③容易计算;
④适合做进一步代数运算; ⑤简单明了。
23
二、方差与标准差
(五)性质和意义 2.适用条件:
① 如果一组数据的集中量采用算术平均数表示,那 么差异量要用标准差表示。 ② 在计算其他统计量如计算差异系数、相关系数、 标准分数等时,常常需要用标准差。
15
二、方差与标准差
(二)方差 方差是离差平方的算术平均数。用 公式为:
2
表示。其定义
(X X ) N
2
2
16
二、方差与标准差
(三)标准差 标准差是方差的平方根,用 表示。其定义公式为:
(X X )
N
2
标准差和方差是描述数据离散程度最常用的差异量。 总体标准差
样本标准差 S
17
二、方差与标准差
18
二、方差与标准差
(四)计算 1.基本公式 2.原始数据计算
2
X
N
2
X
N
2
X
N
2
X
N
2
ห้องสมุดไป่ตู้19
二、方差与标准差
(四)计算 3.分组数据计算:
自学
20
二、方差与标准差
(四)计算 4.标准差的合成
2.四分差
为了修正全距受两极端数值影响的缺点,在一个 次数分布中,中间50%的次数的全距之半称为四分 差(四分位距)。 将数据从小到大排列后分成频数相等的四段,则 第1与第2段的分界点称第1个四分位数。第3与第4 段的分界点称第3个四分位数。 四分差就是第3个四分位数与第1个四分位数之差 的一半。
CV CV
X X
100 100%
27
1、比较计量单位不同的数据资料的差异程度
1975年上海市区6岁男童体重与身高数据
平均数 体重 19.39千克 标准差 2.16千克 差异系数 11.14%
身高
115.87厘米
4.86厘米
4.19%
28
2、比较单位相同而平均数相差较大的两组资料的差异程度 1975年上海市区两组女童体重的数据 平均数 2个月组 6岁组 5.45千克 19.02千克 标准差 0.62千克 2.12千克 差异系数 11.38% 11.15%
对应的数的加权平均数。
思考:假如Q1的位置是5.75,第5个数是60,第6个数
是64,请问Q1是多少?
10
四分差的计算步骤
1、将一组数据按大小秩序排列 2、计算Q1和Q3对应的位置 : N/4+1/2,3 N/4+1/2
3、对应出Q1和Q3对应的数值
4、套用公式
Q3 Q1 Q 2
25
1975年上海市区6岁男童体重与身高数据
平均数
体重 身高 19.39千克 115.87厘米
标准差
2.16千克 4.86厘米
1975年上海市区两组女童体重的数据
平均数 2个月组 6岁组 5.45千克 19.02千克
标准差 0.62千克 2.12千克
26
三、差异系数
差异系数是指标准差与算术平均数的百分比,用CV表示, 它没有单位,属于相对数,用公式可表示为:
21
二、方差与标准差
(五)性质和意义
方差与标准差是表示一组数据离散程度的最好指标。 方差是对一组数据中各种变异的总和的测量,具有可加性和 可分解性的特点,可以用来确定不同来源的变异性和各种 变异对总变异的影响。 标准差是一组数据方差的算术平方根,它不可以进行代数计 算,但有以下特性:
• 如果
Y X C
4
差异量数
数据的次数分布的基本特点之一是离中趋势,指 数据分布中数据彼此分散的程度。 用来描述一组数据这种特点的统计量称为差异量 数,即对一组数据的变异性,也就是离中趋势的度 量和描述。 用来衡量集中量数的代表性程度。
5
主要内容
差异量数
一、简易差异量数:全距、四分差 二、方差和标准差 三、差异系数
李红菊
1
主要内容
描述统计 (一)统计图表(数据分布) (二)集中量数(数据特征值) (三)差异量数(数据特征值) (四)相对量数(数据特征值) (五)相关量数(数据关系)
2
讨论
两个班数学成绩平均分一样,各学生的成绩是否一样?
3
集中量数
数据的次数分布的基本特点之一是集中趋势,指 数据分布中大量数据向某方向集中的程度。 用来描述一组数据这种特点的统计量被称为集中 量数,即描述一组数据集中趋势的量数。
|X X | AD N
平均差意义明确,计算简单,每个数据都参加了计算,涉及到
全部的离差,反应灵敏。
计算要用绝对值,不便于代数运算。 平均差与离均差(离差)不同。离均差表示每一个观测值与平
均数的距离大小,数值有正有负,离均差的总和为零。
14
平均差或离均差都有一些不足,如绝对值或正负号。 考虑取离均差的平方。
29
本章需上交的作业
三、1,3 四、比较几种差异量数(标准差、四分位数、差异系
数)的适用条件。
30
11
一、简易差异量数
2.四分差
分组数据:
自学
12
差异量数度量的理想形式
1.利用全部数据计算; 2.仅用一个数值刻画相对于均值的平均偏离程度; 3.对不同的数据集,当离散程度变大时该数值亦 变大。
13
二、方差与标准差
(一)平均差
指每个数据与该组数据的算术平均数离差的绝对值的算术
平均数,通常用AD表示。
③ 方差更多的时候在统计推断中使用,特别是方差 分析,便是利用了方差的可加性。
④ 同质数据,且平均数相差不大。
24
各种差异量数的优缺点
全距计算简便。但受极端数的影响,不能显示全 部数据的差异情况。 四分差计算容易,不受极端数的影响。但很难反
映分布中所有数据的离散状况。 平均差容易计算,好理解,但受极端数的影响, 不适合代数方法处理。 方差具有可加性,推论统计中最常用的统计量数。 标准差:计算最严密,适合代数法处理,受抽样 变动的影响较小,反应灵敏。但较难理解,运算 麻烦,受极端值的影响。
差异量数分为绝对差异量数(具有变量单位)和 相对差异量数(无实际单位)
6
一、简易差异量数
1.全距
全距是一组数据中最大值与最小值之差,又称极差,
用R表示。 计算简单,容易理解,是描述数据离散程度最为
简单的测量值。 易受两极端数值影响,不能反映中间数值的差异 情况,反应不灵敏。
7
一、简易差异量数
8
一、简易差异量数
2.四分差
公式: 通常与中位数配合使用。 适用条件:
Q3 Q1 Q 2
1)极端数据出现; 2)两端个别数据模糊或分组资料不确定组限。
Q1,Q3的位置分别是? 见书47 例6
9
四分位数的位置不是整数,怎么办?
有关的四分位数就是与该小数相邻的两个整数位置上
则 则
SY S X
• 如果
Y C X
SY C S X
C>0
二、方差与标准差
(五)性质和意义 1.特点:
①反应灵敏; ②计算公式确定严密;
③容易计算;
④适合做进一步代数运算; ⑤简单明了。
23
二、方差与标准差
(五)性质和意义 2.适用条件:
① 如果一组数据的集中量采用算术平均数表示,那 么差异量要用标准差表示。 ② 在计算其他统计量如计算差异系数、相关系数、 标准分数等时,常常需要用标准差。
15
二、方差与标准差
(二)方差 方差是离差平方的算术平均数。用 公式为:
2
表示。其定义
(X X ) N
2
2
16
二、方差与标准差
(三)标准差 标准差是方差的平方根,用 表示。其定义公式为:
(X X )
N
2
标准差和方差是描述数据离散程度最常用的差异量。 总体标准差
样本标准差 S
17
二、方差与标准差
18
二、方差与标准差
(四)计算 1.基本公式 2.原始数据计算
2
X
N
2
X
N
2
X
N
2
X
N
2
ห้องสมุดไป่ตู้19
二、方差与标准差
(四)计算 3.分组数据计算:
自学
20
二、方差与标准差
(四)计算 4.标准差的合成
2.四分差
为了修正全距受两极端数值影响的缺点,在一个 次数分布中,中间50%的次数的全距之半称为四分 差(四分位距)。 将数据从小到大排列后分成频数相等的四段,则 第1与第2段的分界点称第1个四分位数。第3与第4 段的分界点称第3个四分位数。 四分差就是第3个四分位数与第1个四分位数之差 的一半。
CV CV
X X
100 100%
27
1、比较计量单位不同的数据资料的差异程度
1975年上海市区6岁男童体重与身高数据
平均数 体重 19.39千克 标准差 2.16千克 差异系数 11.14%
身高
115.87厘米
4.86厘米
4.19%
28
2、比较单位相同而平均数相差较大的两组资料的差异程度 1975年上海市区两组女童体重的数据 平均数 2个月组 6岁组 5.45千克 19.02千克 标准差 0.62千克 2.12千克 差异系数 11.38% 11.15%
对应的数的加权平均数。
思考:假如Q1的位置是5.75,第5个数是60,第6个数
是64,请问Q1是多少?
10
四分差的计算步骤
1、将一组数据按大小秩序排列 2、计算Q1和Q3对应的位置 : N/4+1/2,3 N/4+1/2
3、对应出Q1和Q3对应的数值
4、套用公式
Q3 Q1 Q 2
25
1975年上海市区6岁男童体重与身高数据
平均数
体重 身高 19.39千克 115.87厘米
标准差
2.16千克 4.86厘米
1975年上海市区两组女童体重的数据
平均数 2个月组 6岁组 5.45千克 19.02千克
标准差 0.62千克 2.12千克
26
三、差异系数
差异系数是指标准差与算术平均数的百分比,用CV表示, 它没有单位,属于相对数,用公式可表示为: