统计描述(离散趋势的描述)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

盘编号 甲


580
1 560 520 510 560
2 540 510 505 540 520
3 500 500 500 500
4 460 490 495 480
5 440 480 490 460
合计
2500 2500 2500 440
420
均数 500 500 500
甲 乙丙
常用统计指标:
全距或极差(range) 四分位数间距(quartile interval) 方差和标准差(variance&standard deviation) 变异系数(CV coefficient of variation)
N
1. 方差(variance)是离均差平方和的均数,反映一

21)

39.2
(天)
P75

60

12 18
(118 75% 77)

67.7
(天)
8
思考题:
某地120名正常成人血清铜含水量umol/L频数表
组段 9.0~ 10.0~ 11.0~ 12.0~ 13.0~ 14.0~ 15.0~ 16.0~ 17.0~ 18.0~ 19.0-20.0
合计
当nX % 为带有小数位时:
wenku.baidu.com

P X X
[ trunc( nX %)1]
当nX % 为 整数时:
PX

1 2

X
(nX
%)

X (nX %1)
2
例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名 患者的住院天数从小到大的排列如下,试求第5百分位数
患和第99者百:分1位2数。3 4 5 6 7 8 9 L 117 118 119 120
(二)百分位数
百分位数(percentile)是一种位置指 标,用PX 来表示。
一个百分位数 PX 将全部变量值分为两部 分,在不包含 PX 的全部变量值中有X % 的变量值比它小,(100 X )% 变量值比它 大。
1
1.直接计算法
设有x个原始数据从小到大排列,第x 百分位数的计算公式为:
频数f 3 4 12 13 17 22 18 13 11 5 2 120
频率% 2.5 3.3 10.0 10.8 14.2 18.3 15.0 10.8 9.2 4.2 1.7 100
累积频数fc 3 7 19 32 49 71 89 102 113 118 120
累积频率pc% 2.5 5.8 15.8
(n 2

fL)
6
例2-10 某地118名链球菌咽喉炎患者的潜伏期 频数表见表2-5第(1)、(2)栏,试分别求中位数 及第25、第75百分位数。
天数 (1)
12~ 24~ 36~ 48~ 60~ 72~ 84~ 96~ 108~
表 2-5 118 名链球菌咽喉炎患者的潜伏期
人数 f
累计频数
(2)
P100
料分为四等份,上四分位数和下四分位
数之差就是Q:
Q=P75-P25
P75
➢ 下四分位数:QL P25
P50
➢ 上四分位数: QU P75
✓比全距稳定;可用于一端或两端无确切数
P25
值的偏态资料。
✓未考虑每一个观察值。
P0
三、方差与标准差
❖ 全距和四分位数间距都未全面考虑观察值的变异 情况,为了克服该缺点,需计算总体中每个观察
2.频数表法

公式:
PX

LX

iX fX
(nX % fL )
式中LX 、iX 和 fX 分别为第X 百分位数所在组段的下限、组距和频数,
fL 为小于LX 各组段的累计频数,n 为总例数。
5
当 X% 50% 1 时,公式(2-9)即为中位数的计算公式
2
M

P50

L50

i50 f50
值x与总体均数的差值(x-),称为离均差。
❖ 由于∑(x-)=0,不能反映变异的大小,而用 离均差平方和 ∑(x-)2(sum of deviation
from mean)反映。同时还要考虑到观察值个数N
的影响,用其均数,即得到总体的方差,用2表
示。
❖ 公式为:
2 (X )2
❖ 统计学中把个体间的差异称为变异性(variation)。 所谓变异性是指在同质条件下的观察单位,其同一 标志的数据间的差异性。用以描述一组数值变量资 料观察值之间参差不齐的程度,即离散程度或变异 度的指标,称为离散指标或变异指标。
例:设甲、乙、丙三人,采每人的耳垂血,然后作红 细胞计数,每人数5个计数盘,得结果如下(万/mm3)
住院天数:1 2 2 2 3 3 4 4 5 L 40 40 42 45
n=120,120X5%=6,为整数:
P5

1 2
X (6)

X (7)

1 2
(3
4)

3.5(天)
例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名 患者的住院天数从小到大的排列如下,试求第5百分位数 和第99百分位数。
一、全距(Range)
全距,用R表示:即一组变量值最大值与最 小值之差,亦称极差。对于书中例8.1数据, 有
R=5.59–3.60 =1.99(mol/L)
R越大,变异度越大;R越小,变异度越小。
简单,但仅利用了两端点值,稳定性差。
二、四分位数间距(quartile range)
➢ 四分位数间距,用Q表示,若将一组资
26.6 40.8 59.1 74.1 84.5 94.1 98.3 100.0
请求出M,75%,95%的值及算术均数的值
9
三 离散趋势的描述
❖ 反映集中趋势的指标(平均数),表示一组观察值 的平均水及集中特性,并可作为总体的一个代表值 加以应用。但是它没有表达其所代表的总体中各个 个体之间的差异。
(3)
4
4
17
21
32
53
24
77
18
95
12
107
5
112
4
116
2
118
累计频率(%) (4) 3.4 17.8 44.9 65.3 80.5 90.7 94.9 98.3
100.0 7
M

P50

48
12 24
(118 2
53)

51
(天)

P25

36

12 32
(118 25%
患 者: 1 2 3 4 5 6 7 8 9 L 117 118 119 120
住院天数: 1 2 2 2 3 3 4 4 5 L 40 40 42 45 12099% 118.8,带有小数,取整后trunc(118.8)= 118
P99 X ( trunc (118.8 ) 1) X (119 ) 4 2 (天 )
相关文档
最新文档