第三讲 描述统计之常用统计参数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17、17、18的中数;(数据个数为奇数)
5 4 12.5 13 13.5
⑶ 分组数据求中数的方法
①分组数据的中数
当观察数据整理成次数分布表以后, 中数的求取也是取序列中将N(观察数 据总数)平分为两半的那点作为中数。
②中数的计算公式
i、分组次数分布表中数公式
Md Lb
N F b 2 i
x
Hale Waihona Puke Baidu
i
CX
4、平均数的意义
应用最广泛的一种集中量数。是总体均
值(或“真值”)的最佳估计。
X n
依概率1

■通俗的理解
设共有n个观察数据,第i个为 X i ,设真
值或总体均值为 ,则有:
观察值与真值的差为:
d i X
i

d X
i
i
n
d
n
i
X
n
d
n
i
■例
①求数据3、6、7、9、20的中数;
②求数据3、6、7、9、20、60的中数;
⑵ 未分组数据求中数的方法(有重复数据)
■例子
求数据11、11、11、11、13、13、13、 17、17的中数;(数据个数为奇数)
4 4 12.5 13 13.5
■例子
求数据11、11、11、11、13、13、13、
M
o
3Mdn 2 X
4、应用范围 ◆一组数据出现不同质的情况 ◆一组数据中出现极端数据,也用众数 作为集中量数的粗略估计。
[Exercise]
The data about annual salaries of Management and Exployees of XYZ company are presented below ,can you calculate the values of the mode ,the median and the mean (three different measures of central tendency ) $72,000.00 54,000.00 26,400.00 19,200.00 19,200.00 19,200.00 19,200.00 18,000.00 16,800.00 16,800.00 16,800.00 14,400.00 14,400.00 14,400.00
[例]求下列数据的中数
分组区间 96~99 93~96 90~93 87~90 84~87 81~84 78~81 75~78 次数 2 3 4 8 11 17 19 14
ⅱ、累加曲线求中数示意图
3、中数的特点
①计算简单,不受极端数据影响;
②没有反映所有数据的信息,从而具有较大 的抽样误差,不如平均数稳定.也无法进 行进一步的数学分析。
X 、f分别是各分组区间的组中值与
c
相应次数
88名高考考生数学成绩统计结果
分组区间 组中值 划记 次数 相对次数 (频率) 累加次 数 累积相对次数
97~ 94~ 91~ 88~ 85~ 82~ 79~
98 95 92 89 86 83 80
|| ||| |||| ||||| ||| ||||| ||||| | ||||| ||||| ||||| || ||||| ||||| ||||| ||||
4、应用
◆出现两极端数据时;
◆ 当次数分布的两端数据或个别数据不清 楚时; ◆ 快速估记时;
三、众数
1、定义
又称密集数、通常数,符号Mo,它指在 一组数中出现次数最多的那个数。 2、计算方法 直接找出现次数最多的那个数。
■例子
3、6、7、7、7、9、20、60
3、皮尔逊经验公式(数据偏态分布)
上一个常数C则所得到的新数组的平均数为原
来数组的平均数加上常数C,即:
1 n C) X C ( x i n i 1
③性质3
给一组数据中
x , x ,, x
1 2
n
的每一个数乘
上一个常数C,则所得到的新数组的平均数 为原来数组的平均数(设为 X )乘以常数 C,即:
1 n C n i 1
X 0
X
5、评价 ①优点
*反应灵敏 *确定严密 *简明易解
*计算简单 *适合进一步演算 *较小受抽样变化的影响等优点。 ②缺点 *算术平均数易受极端数据的影响; *无法对模糊数据进行处理;
6、应用平均数的原则
⑴ 同质性原则
⑵ 平均数与个体数据结合的原则 ⑶ 平均数与方差相结合的原则
N是总体容量;
x 是变量X的第i次观察值;
i
[例]某项研究在一年级学生总体中抽取出10
名被试,测得他们的分数为60、70、65 、78、98、64、89、75、69、75,试 求他们的平均分数。
②观察数据整理成次数分布表后平均的计算
X

f N
X
c
■注
◆公式隐含了观察数据在各分组区间均 匀散布的假设; ◆
刻划变量出现(一组数据)的分散程度
,即数据分布的离散程度。
第一部分:集中趋势
一、算 术 平 均 数
简称平均数、均数或均值,为与其它几 种平均数相区别,也称算术平均数。 ■符号表示:M、 、X、 Y
观察数据的平均数
总体均值
2、公式
①未分组观察数据平均数
1 X N
x
i 1
N
i
其中: X 是算术平均数;
第二章 常 用 统 计 参 数
分布表与分布图在表示变量观察数据分布 时存在先天缺陷。这种缺点可以利用随机变 量分布的数字特征得以克服。
[问题]反映变量次数分布特征主要有哪些呢?
1、集中趋势
指的是数据分布中大量数据向某方向集
中的程度。用以刻划集中程度的统计量,
即集中量数。(平均数等)
2、离中趋势 (离散性)
f
Md
◆ Lb 为中数所在组的精确下限;
◆ F b 为中数所在组以下各组的累积次数;
◆ f Md 为中数所在组数据的个数;
◆ i 为组距;
■等价公式2
Md La

N F a 2 i
f
Md
L 为中数所在组的精确上限; ◆ F 为中数所在组以上各组的累积次数;
a a
◆ f Md 为中数所在组数据的个数;
2 3 4 8 11 17 19
76~
77
||||| ||||| ||||
14
中数 动差
3、算术平均数的性质
①性质1
一组数据 x1 , x2 ,, xn 中每一个数与 平均数之差(称为离均差)的总和等于 0,即:
(x
i 1
n
i
X) 0
②性质2
给一组数据 x1 , x2 ,, xn 中的每一个数加
二、中数
1、定义
又称中位数,符号Mdn,是指位于一组数 据中较大一半与较小一半中间位置的那个
数。中数所处的位置以表示。
■注:这个数可能是数据中的某一个,也 可能根本不是原有的数据。
2、计算方法及分类
⑴ 未分组数据求中数的方法(无重复数据)
是将数据依大小次序排列: ◆若数据个数为奇数,则取数列中间的 那个数为中数; ◆若数据个数为偶数,则取中间两个数 的平均数为中数。
相关文档
最新文档