第三章 统计参数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

刻划变量出现(一组数据)的分散程度
,即数据分布的离散程度。
第一节 集中量数
• • • • 一、众数 二、中数 三、算数平均数 四、其他集中量数 (一)几何平均数 (二)加权平均数 (三)调和平均数
一、众数(Mode)
1、定义
又称密集数、通常数,符号Mo,它指在 一组数中出现次数最多的那个数。 2、计算方法 直接找出现次数最多的那个数。
■例2 [时间固定]
在一个学习实验中,统计了6名被试在2个
小时内完成的解题量,依次为24题、 20题、 16题、12题、 8题、 4题,试问这6名被试 每小时的平均解题量是多少?
■ 例子
三个不同被试对某词的联想速度如下表,
求三个被试的平均联想速度。
被试
A B
联想词数
13 13
wenku.baidu.com时间(分)
2 3
C
13
二、中数(Median)
1、定义
又称中位数,符号Mdn,是指位于一组数 据中较大一半与较小一半中间位置的那个
数。中数所处的位置以表示。
■注:这个数可能是数据中的某一个,也 可能根本不是原有的数据。
2、计算方法及分类
⑴ 未分组数据求中数的方法(无重复数据)
是将数据依大小次序排列: ◆若数据个数为奇数,则取数列中间的 那个数为中数; ◆若数据个数为偶数,则取中间两个数 的平均数为中数。
■例子
3、6、7、7、7、9、20、60
3、皮尔逊经验公式(数据偏态分布)
M
o
3Mdn 2 X
皮尔逊经验法只有当次数分布呈现正态或接近正态时, 才能使用。
4、应用范围 ◆一组数据出现不同质的情况 ◆一组数据中出现极端数据,也用众数 作为集中量数的粗略估计。 ◆当数据属于称名变量时我们必须使用众数。
x
i
CX
4、平均数的意义
应用最广泛的一种集中量数。是总体均
值(或“真值”)的最佳估计。
X n
依概率1

■通俗的理解
设共有n个观察数据,第i个为 X i ,设真
值或总体均值为 ,则有:
观察值与真值的差为:
d i X
i

d X
i
i
n
d
n
i
X
n
d
n
i
■例
①求数据3、6、7、9、20的中数;
②求数据3、6、7、9、20、60的中数;
⑵ 未分组数据求中数的方法(有重复数据)
■例子
求数据11、11、11、11、13、13、13、 17、17的中数;(数据个数为奇数)
4 4 12.5 13 13.5
■例子
求数据11、11、11、11、13、13、13、
二、平均差(average deviation)
1、平均差公式(以符号AD表示)
设一组原始数据为
x , x ,, x
1 2
i
n

则计算平均差的公式:
X A.D.
i
X
n
x
n
■ xi 是离均差;
■例
有5个被试的错觉实验数据如下,求其平均
差?
1 2 3 4 5 被 试 错觉量(单位:毫秒) 16 18 20 22 17
表3-1 利用公式求分组次数表中中数
组限
65— 60— 55— 50— 45— 40— 35— 次 数 3 4 11 13 8 6 3
自下而 自上而下 上累积 累积次数 次数
i N Md Lb Fb f 2 5 48 49.5 17 13 2 52.19 i N Md La Fa f 2 5 48 54.5 18 13 2 52.19
上一个常数C则所得到的新数组的平均数为原
来数组的平均数加上常数C,即:
1 n C) X C ( x i n i 1
③性质3
给一组数据中
x , x ,, x
1 2
n
的每一个数乘
上一个常数C,则所得到的新数组的平均数 为原来数组的平均数(设为 X )乘以常数 C,即:
1 n C n i 1
f
Md
◆ Lb 为中数所在组的精确下限;
◆ F b 为中数所在组以下各组的累积次数;
◆ f Md 为中数所在组数据的个数;
◆ i 为组距;
■等价公式2
Md La

N F a 2 i
f
Md
L 为中数所在组的精确上限; ◆ F 为中数所在组以上各组的累积次数;
a a
◆ f Md 为中数所在组数据的个数;
数的一定百分比。第m位百分位数就是指
在数值Q以下包含了分布中全部数据的百
分之m,这个Q就是第m位百分位数。记
作Pm。 ?P50表示什么。
⑵计算公式(次数分布表数据)
1.00 .98 .95 .91 .83 .72 .55
76~
77
||||| ||||| ||||
14
.14
36
.36
3、算术平均数的性质
①性质1
一组数据 x1 , x2 ,, xn 中每一个数与 平均数之差(称为离均差)的总和等于 0,即:
(x
i 1
n
i
X) 0
②性质2
给一组数据 x1 , x2 ,, xn 中的每一个数加
◆估计数据次数分布是否呈偏态;
估计指标
M-Mo>0,正偏态
M-Mo<0,负偏态
7、平均数、中数、众数的关系
⑴正态分布 ⑵偏态分布
Mo
Mdn
M
M
Mdn
Mo
四、其他几种集中量数 (一)几何平均数 1、几何平均数计算
⑴统计学表示法: X g 或 Mg
⑵计算公式
设有一组观察数据
则公式为:
n Xg
x , x ,, x ,

N

1
X
i
■N为数据个数
X
i
是第i个观察数据,或第i个变量值;
2、调和平均数适用范围
调和平均数在描述速度方面的集中趋势
时,优于其他平均数。 ◆工作量固定,记录被试完成相同工作量 所需时间 ◆时间量固定,记录被试完成的工作量
■例1 [工作量固定]
有一学生15分钟学会生词30个,后10分钟学会
生词也是30个,问该生平均学习速度是多少?
欲研究介于
s
1

s
2
两感觉之间的感觉的
物理刺激是多少,随机抽取10个被试,让其 调节一个可变的物理量的刺激量,使所产生
的感觉恰好介于 s1 与 s2 之间,然后测量所调
节的物理量,结果如下: 5.7、6.2、6.7、6.9、7.5、8.0、7.6、10.0 、15.6、18.0。求介于
s
1

s
2
之间的感
第二章 常 用 统 计 参 数
分布表与分布图在表示变量观察数据分布 时存在先天缺陷。这种缺点可以利用随机变 量分布的数字特征得以克服。
[问题]反映变量次数分布特征主要有哪些呢?
1、集中趋势
指的是数据分布中大量数据向某方向集
中的程度。用以刻划集中程度的统计量,
即集中量数。(平均数等)
2、离中趋势 (离散性)
X甲 100cm X 100cm 甲
X X 100cm 乙 100cm 乙 X丙 X 100cm 丙 100cm
R甲 20cm R乙 8cm R丙 8cm
优点:简便,应用广泛,如说明传染病、食物
中毒的最短、最长潜伏期等。
缺点:只利用了最大值和最小值两个极端值,
不能反映组内其他数据的变异度,且受样本含 量的影响较大。
②观察数据整理成次数分布表后平均的计算
X

f N
X
c
■注
◆公式隐含了观察数据在各分组区间均 匀散布的假设; ◆
X 、f分别是各分组区间的组中值与
c
相应次数
88名高考考生数学成绩统计结果
分组区间 组中值 划记 次数 相对次数 (频率) 累加次 数 累积相对次数
97~ 94~ 91~ 88~ 85~ 82~ 79~
17、17、18的中数;(数据个数为奇数)
5 4 12.5 13 13.5
⑶ 分组数据求中数的方法
①分组数据的中数
当观察数据整理成次数分布表以后, 中数的求取也是取序列中将N(观察数 据总数)平分为两半的那点作为中数。
②中数的计算公式
i、分组次数分布表中数公式
Md Lb
N F b 2 i
一、全距(Range)
又称极差,即一组变量值的最大值与最 小值之差。 R X X
max min
例:三组同龄男孩的身高值(cm)
90 95 105110 110 甲组: 90 95 100 100 105 甲组: 96 98 102104 104 96 98 100 100 102 乙组: 乙组: 96 99 101104 104 96 99 100 100 101 丙组: 丙组:
AD 1.92
2、评价
①它是一个能较好地刻划数据分布离散
程度的差异量数; ②不足之处是它利用了绝对值以致不便于 作进一步代数演算,故其实际应用上被 方差或标准差取代;
三、百分位差
1、百分位差/百分位数(percentile) (1)内涵:
它指的是量尺上的一个点(数),在
此点以下,包括数据分布中全部数据个
1 2 n
x x ... x
1 2
n
2、适用场合 (1)直接应用基本公式计算几何平均数
①当一组数据中存在极端数据,分布呈偏 态时; ②在心理物理学的等距与等比量表实验中,只能用几何 平均数。
(2)一组数据彼此间变异较大,几乎是按一定的 比例关系变化。
■比较适合求平均增长率
■例(心理物理学)
X
g
觉平均物理刺激量是多少?
8.55
■例2(平均增长率)
在一项有关阅读能力的实验中,阅读的遍
数与每遍理解的程度依次是:第一遍:40% 第二遍:52%,第三遍:65%,第四遍:75% 第五遍:86%,第六遍:97%。问在该实验 中被试阅读程度的平均进步率是多少?阅读
理解程度的平均增加比率又是多少?
X 0
X
5、评价 ①优点
*反应灵敏 *确定严密 *简明易解
*计算简单 *适合进一步演算 *较小受抽样变化的影响等优点。 ②缺点 *算术平均数易受极端数据的影响; *无法对模糊数据进行处理;
6、应用平均数的原则
⑴ 同质性原则
⑵ 平均数与个体数据结合的原则 ⑶ 平均数与方差相结合的原则
(二)加权平均数(Mw)
1、计算公式
w X w X w X M w w w
1 1 2 2 n w 1 2 n n
■ wi 即权数,刻划各变量在构成总体
的相对重要性
2、为什么要加权?
在实际测量数据中,有些数据的权重不
一样,此时刻划数据分布的中心位置只能 用加权平均数。(生活例子)
观察数据的平均数
总体均值
2、公式
①未分组观察数据平均数
1 X N
x
i 1
N
i
其中: X 是算术平均数;
N是总体容量;
x 是变量X的第i次观察值;
i
[例]某项研究在一年级学生总体中抽取出10
名被试,测得他们的分数为60、70、65 、78、98、64、89、75、69、75,试 求他们的平均分数。
98 95 92 89 86 83 80
|| ||| |||| ||||| ||| ||||| ||||| | ||||| ||||| ||||| || ||||| ||||| ||||| ||||
2 3 4 8 11 17 19
.02 .03 .04 .08 .11 .17 .19
100 98 95 91 83 72 55
②没有反映所有数据的信息,从而具有较大 的抽样误差,不如平均数稳定.也无法进 行进一步的数学分析。
4、应用
◆出现两极端数据时;
◆ 当次数分布的两端数据或个别数据不清 楚时; ◆ 快速估记时;
三、算 术 平 均 数
简称平均数、均数或均值,为与其它几 种平均数相区别,也称算术平均数。 ■符号表示:M、 、X、 Y
3 7
18
31 39 45 48
48 45 41 30 17 9 3
[例]求下列数据的中数
分组区间 96~99 93~96 90~93 87~90 84~87 81~84 78~81 75~78 次数 2 3 4 8 11 17 19 14
ⅱ、累加曲线求中数示意图
3、中数的特点
①计算简单,不受极端数据影响;
■例子
某课题组在全国8个省区进行了一项调查,
各省区接受调查的人数和平均数如下表,求 该项调查的总平均数。
省区代码 1 2
人数 627 268
平均分数 98 60
3
4 5
400
670 411
82
96 80
6
7 8
314
610 500
65
96 88
(三)调和平均数MH
1、计算公式
M
H

1 1 1 1 1 N XN X1 X 2
25
第二节 差 异 量 数
• A:7 7 8 8 8 9 9 • B:4 5 7 8 9 11 12 • C:1 4 7 8 9 12 15
• 集中量数是指量尺上的一点,而差异量 数是量尺上得一段距离,是趋势。
第二节 差 异 量 数
一、全距 二、平均差 三、百分位差 四、四分位差 五、方差与标准差
相关文档
最新文档