统计学:计数资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:某社区共有10000人。现随机抽检居民800人的粪便中, 蛔虫阳性200人,如在全社区进行驱虫治疗,需准备多少 份药物?(求蛔虫阳性率的95%或99%可信区间)
P 蛔虫阳性人数 200 100% 100% 25% 检查总人数 800
P(1 P) 0.25 (1 0.25) 1.53% n 800
常用率指标:
发病率、患病率、漏诊率、误诊率、治愈率、死亡 率、病死率等。
发病率
同期内新发生某病的病例数 k 观察期内可能发生某病的平均人口数
(时点)患病率
检查时发现的某病现患病例数 k 该时点受检人口数
治愈病人数 100% 接受治疗人数
治愈率
(粗)死亡率
同年死亡总数 1000 ‰ 某年总人口数
动态数列中的指标:
绝对增长量 累计增长量:某年指标数值-基数年指标数值 逐年增长量:某年指标数值-前一年指标数值 发展速度 定基比发展速度:某年指标数值/基数年指标数值 环比发展速度:某年指标数值/前一年指标数值 增长速度 增长速度=发展速度-1 可以是负数 定基比增长速度:定基比发展速度-1 环比增长速度:环比增长速度-1
同年死于某种疾病的人数 100000 / 10万 某年平均人口数
同期因该病死亡人数 100% 观察期间内某病患者数
某病死亡率
某病病死率
源自文库
例:某地年平均人口数为1000000,计算下 表中各种传染病的发病率
疾病名称 发病人数 发病率(1/10万)
痢疾
肝炎 流脑
3685
2111 522
368.5
211.1 52.2
畸形儿例数
构成%
1
2
14
19
16.4
24
20.7
18
15.5
19
16.4
13
11.2
3
2.6
1
0.86
1
0.86
1
0.86
116
100.0
0.86 1.70 12.1
2. 计算相对数时分母不宜过小
例:“某医师收治了4名风湿性关节炎患者,用秘方治疗 一年后患者病情明显好转,则该医生用祖传秘方治疗风湿 性关节炎的有效率为100%”,这种说法是否正确?为什么?
甲指标 相对比 乙指标
结果可以是甲是乙的几倍,也可以是甲是乙 的几分之几。 分子分母可以是绝对数,也可以是相对数。
例:某地某年出生婴儿中,男性婴儿为240人,女 性婴儿为228人,计算出生婴儿性别比例:
男性婴儿数 240 出生性别比 1.05 女性婴儿数 228
例:某地某病死亡率1949年为3.3/10万,1980年 为0.1/10万,计算这两年该病死亡率之比:
死因构成
死因顺位
死亡原因 构成比(%) 死因顺位
恶性肿瘤
脑血管病 心脏病 呼吸系统 损伤与中毒
24.93
20.41 17.61 13.36 5.87
1
2 3 4 5
(二)率、频率
说明某种现象发生的机会大小的指标。
计算:率
该现象实际发生数 比例基数 可能发生某现象的总数
比例基数(k)可以是100%、1000‰、10000/万、 100000/10万等。
3. 正确计算平均率(总率) 所有组分子之和除以所有组分母之和 例:P49表5.4
4. 两个相对数比较时,注意可比性
治疗分组 成人组
旧疗法
治疗人数 痊愈人数 治愈率% 100 50 50.0 200
新疗法
治疗人数 痊愈人数 治愈率% 100 50.0
儿童组
合计
200
300
20
70
10.0
23.3
100
300
10
110
10.0
36.7
内部构成不同时,如需比较两个总率,可以用标准化法 标准化法的基本思想:采用统一的标准构成以消除构成 不同对总率的影响,使通过标准化后的标准化总率具有 可比性。
治疗分组 成人组 儿童组 合计
旧疗法 治疗人数 痊愈人数 治愈率% 100 200 300 50 20 70 50.0 10.0 23.3 200 100 300
P
发生某现象的观察单位数 80 100% 100% 4% 可能发生该现象的观察单位数 2000
SP
p(1 p) 4% (1 4%) 0.44% n 2000
(二) 总体率的估计
用样本率P估计总体率π 95%(或99%)可信区 间。
样本量N不太小,P不太接近0或1,np>5且n(1p)>5时,样本率近似正态分布。此时总体率的 可信区间为: P±zαSP
n1 p1 n2 p2 pc n1 n2
qc 1 pc
某研究调查了5000名服用口服避孕药的40~44岁妇女,3 年内有13人发生心肌梗塞;另调查10000名没有服用口服避 孕药的40~44岁妇女,3年内有7人发生心肌梗塞,口服避 孕药对40~44岁妇女发生心肌梗塞是否有影响?
1949 年死亡率 3.3 死亡率之比 33倍 1980 年死亡率 0.1
(四)动态数列
按照一定的时间顺序,将某事物的统计指标依次排列起来, 便于观察和比较该事物在时间上的发展变化趋势。
年份 (1) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 符号 (2) a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 学生 人数 (3) 4200 4500 4800 4900 5150 5320 5510 5780 5950 6000 绝对增长量 累计 逐年 (4) (5) --300 600 700 950 1120 1310 1580 1750 1800 300 300 100 250 170 190 270 170 50 发展速度(%) 定基比 环比 (6) (7) 100.0 100.0 107.1 114.3 116.7 122.6 126.7 131.2 137.6 141.7 142.9 107.1 106.7 102.1 105.1 103.3 103.6 104.9 102.9 100.8 增长速度(%) 定基比 环比 (8) (9) --7.1 14.3 16.7 22.6 26.7 31.2 37.6 41.7 42.9 7.1 6.7 2.1 5.1 3.3 3.6 4.9 2.9 0.8
(五)应用相对数的注意事项
1. 区别率和构成比
例:某产院拟分析畸形儿与母亲分娩年龄的关系,检查 了新生儿4470例,畸形儿116例,得以下资料,据此得 出结论:“母亲年龄在25~28岁时,畸形儿发生率最 高”,以上结论是否合理?为什么
母亲年龄 21 23 24 25 26 27 28 29 30 31 32 33 合计
SP
95%可信区间:p±1.96SP= 25%±1.96×1.53%
22.0%~28.0%
99%可信区间:p±2.58SP= 25%±2.58×1.53% 21.1%~28.9% 如果按最多需要量准备,则需10000×0.289=2890份药物。
(三)率的z 检验
计数资料的假设检验是为了比较两个相对数是否来 自同一总体。通过比较两个样本率(构成比)去推 论其总体率(构成比)是否相同。 对率进行z 检验需满足: 样本量N不太小,P不太接近0或1 np>5且n(1-p)>5
H0:该批产品合格,即该批产品有害微生物感染率为1% H1:该批产品不合格,即该批产品有害微生物感染率超过1% =0.05
本例,n=100,X=3<5,不满足近似正态分布的条件,不能 用正态分布来近似。可以直接计算H0成立的情况下,得到至 少发生3例的概率P。 P =P(X≥3)=1-P(X<3)=1-(P(X=0)+P(X=1)+P(X=2)) =1-[(1-0.01)100+C1100×0.01×(1-0.01)99+C2100×0.012×(1-0.01)98]
=0.0795>0.05
从100份样本中检出至少3份污染的概率大于0.05,不拒绝H0, 尚不能认为这批产品不合格。
2. 两个样本率比较的z 检验 假设
H0:π1=π2
H1:π1≠π2
检验统计量计算公式:
p1 p2 z S( p1 p 2)
S( p1 p 2) 1 1 pc qc ( ) n1 n2
各构成比之间相互制约,某一组成部分数量的 变化会使所有组成部分的构成比都改变。
计算:
被观察事物内部某一组成部分的观察单位数 100% 同一事物各组成部分的观察单位总数
例:计算下表中各种疾病病人数占总病人数的构成比
疾病名称 痢疾 肝炎 流脑 麻疹 其它 合计
发病人数 3685 2111 522 411 850 7579
构成比(%) 48.6 27.9 6.9 5.4 11.2 100.0
痢疾构成比 = 痢疾发病人数/总人数×100% = 3685/7579×100% = 48.6%
人口构成
老年系数:
65岁及以上人口数 100% 总人口数
老龄化人口: 老年系数超过10% (发达国家为60岁及以上人口比重超过10%)
H0:π=π0老年患者胃出血的发生率和一般患者的一样 H1:π≠π0老年患者胃出血的发生率和一般患者不一样
α=0.05
0.2 1 0.2 p 0.0324 n 152 p 0 0.316 0.2 48 z 3.58 p 0.316 p 0.0324 152
麻疹 其它 合计
411 850 7579
41.1 85.0 757.9
注意计算构成比 和率的不同。
痢疾发病人数 痢疾发病率 100000/ 10万 年平均人口数
3685 100000/ 10万 368.5 / 10万 1000000
(三)相对比
定义:两个有联系的同类指标之比。
计算:
新疗法 治疗人数 痊愈人数 治愈率% 100 10 110 50.0 10.0 36.7
以旧疗法人数为标准人口数
治疗分组 标准治 疗人数 旧疗法 原治愈率 % 预期治愈人数 新疗法 原治愈率 预期治愈人数 %
成人组
儿童组 合计
100
200 300
50.0
10.0 23.3
50
20 70
50.0
10.0 36.7
(一)率的抽样误差与标准误
由于抽样的原因造成的样本率与总体率之间的差 别,叫做率的抽样误差。 样本率的抽样误差的大小用率的 标准误 表示
标准误越小,抽样误差越小,用样本率估计总体 率的可靠性越大。
计算方法
P
(1 )
n
SP
p(1 p) n
pq n
例:某市为了解已婚妇女子宫颈癌的患病情况进行抽样调查, 随机抽取了2000人,患者80例。试求此患病率的标准误。
50
20 70
甲组:标化率23.3%,乙组:标准化率23.3%
标准化法的注意事项 (1)标化率不能反映实际水平,只能用于比较。
(2)选用标准不同,标化率会改变,但比较结果 只能有一个,不能改变。
(3)对于标化率,也要作显著性检验。
三、 计数资料的统计推断
样本
总体
(样本率、样本构成)
(总体率、总体构成)
计数资料的
统计分析
一、基本概念
计数资料(定性资料、分类变量)
绝对数:实际观察得到的数据。 相对数:两个有关指标之比,用于比较。
二、计数资料的统计描述
——相对数
相对数: 是两个有关系的指标之比。 常用相对数:构成比、率、相对比 样本指标用P表示,总体指标用π 表示。
(一)构成比
一事物内部某一组成部分的观察单位数与该事 物名组成部分的观察单位总数之比。 各部分构成比总和100%。
1. 一个样本率与总体率比较的z 检验 假设
H0:π=π0
H1:π≠π0
z p 0
检验统计量计算公式:
p
判断概率及统计推断结论:
z>zα,P<α,拒绝H0,差别有显著性,两总体率不相等。 z<zα,P>α ,不拒绝H0,差别无显著性,不认为两总体率不相等。
根据以往经验,一般溃疡病患者中有20%发生胃出血症状。现 某医院观察65岁以上溃疡病菌人152例,有48例发生胃出血症 状,问老年溃疡病患者胃出血发生率是否与一般患者不同?
3.58>1.96,P<0.05,拒绝H0,接受H1,差别有显著性,两总 体率不相等,老年溃疡病患者与一般患者胃出血发生率不同。
0 1 0
当样本量太小,或P接近0或1时,样本率不服从正态 分布,此时可以直接计算概率。
例:某微生物制品的企业标准是有害微生物感染不得 超过1%(0)。现从一批产品中随机抽出100件 (n),发现有害微生物感染的产品有3件(X)。问 这批产品是否合格?
相关文档
最新文档