分类变量资料的统计推断教案
预防医学(二)第十七章 分类变量资料的统计 分析

第二节 分类变量资料的统计推断
• 一、率的抽样误差与标准误 • 由随机抽样造成的样本率和总体率的差异,以及各样本率 之间的差异称为率的抽样误差。 • 率的抽样误差可用率的标准误来表示 • 率的标准误的计算
• σp为率的标准率,π为总体率,n为样本含量
第二节 分类变量资料的统计推断
• 二、总体率的可信区间估计 • 方法:查表法、正态近似法 • 1.查表法 • 当样本含量较小(如n≤50),特别是p接近于0或1时,可根 据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。
第三节 卡方检验(X2检验)
• 一、四格表资料的X2检验 • 2.假设检验步骤 • (1)建立检验假设,确定检验水准 • H0:π1=π2,即试验组与对照组的总体有效率相等。 • H1:π1≠π2,即试验组与对照组的总体有效率不等 • α=0.05(双侧检验) • (2)计算检验统计量
• A为实际频数 • T为理论频数
第三节 卡方检验(X2检验)
• 三、行✖列表资料的X2检验 • 例:某医院用3种方案治疗急性无黄疸型病毒性肝炎 254例, 观察结果见下表,问3种疗法的有效率是否不等。
• 检验假设具体步骤: • H0:3种治疗方案的有效率相等
第三节 卡方检验(X2检验)
• 三、行✖列表资料的X2检验 • 检验假设具体步骤: • H1:3种治疗方案的有效率不全等,α=0.05
第二节 分类变量资料的统计推断
• 四、率的u检验 • 2.计算检验统计量 • (2)两样本率比较的u检验
• 其中P1和P2为两样本率,Sp1-p2为两样本率之差的标准误, P含c量为两样本合并率,Pc=(X1+X2)/(n1+n2),n1和n2分别为两样本
预防医学之分类变量的统计推断

• 常用指标有:发病率、死亡率、出生率等
应用相对数的注意事项
• 防止概念混淆;分析时不能以构成比代替 率
• 计算相对数的分母一般不宜过小 • 正确地合并估计率(平均率或合计率) • 相对数比较时要注意可比性
防止概念混淆
春
10
10.00
春
10
10.00
夏
20Biblioteka 20.00夏20
20.00
秋
30
30.00
秋
30
30.00
冬
40
40.00
冬
40
40.00
相对数比较时的可比性
甲院
乙院
科室
出院人数 治愈人数 治愈率(%) 出院人数 治愈人数 治愈率(%)
内科 876 295 33.67
329 104 31.61
外科 305 292 95.74
• 可见这两组资料内部的构成不同(不同的科室治愈 率是不同的),可比性差,不可直接比较总治愈或 合计治愈率
率的标准化
• 采用统一的标准对内部构成不同的各组频率进行 调整,而后对比各组标准化率的方法称为率的标 准化法
• 调整后的率为标准化率,简称标化率(standard rate),或调整率(adjusted rate)
患病人数 9 13 91
102 12 227
患病率(1/万) 0.9 2.9 13.0 16.0 37.5 7.9
60岁以上年龄段为高血压的高危年龄段!
相对数
• 对分类变量汇总后,通常这些频数不能直 接比较;分类资料的统计描述与推断中通 常使用相对数,而不是绝对数
分类变量资料的统计分析培训课件

精
35
样本率与总体率的比较
p
p
u
p
1
n
精
36
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者,围 术期出现并发症有100例,并发症发生率为26%,问 该院直肠癌患者围术期并发症发生率与一般情况比 较有无统计学差异。
本例,样本率为26%,np和n(1-p)均大于5,可采 用u检验。
第十章 分类变量资料的统计分析
精
1
主要内容
分类变量资料的统计描述 分类变量资料的统计推断 卡方检验
精
2
第一节 分类变量资料的统计描述
• 什么是分类变量资料? • 用什么指标进行描述?
•甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50 人,何地较为严重? •若甲地易感儿童667人,而乙地易感儿童250人。
精
37
1. 建立检验假设
H0: =0,H1: 0,=0.05
2. 计算u值 u 0.3 0.26 1.713 0.3(1 0.3) 385
3. 确定P值,判断结果
本题u=1.713<1.96,P>0.05,按=0.05的水准不拒绝H0,
差异没有统计学意义,故尚不能认为该院直肠癌患者围 术期并发症发生率与一般情况不同。
精
23
率的标准化应注意的问题
(1)当各比较组内部构成(如年龄、性别等)不同时, 应对率进行标准化后,再作比较。
(2)标准化率只表明各标化组率的相对水平,而不代表 其实际水平。
(3)两总率各分组对应的率有明显交叉时,则不能用标 准化率进行比较。
(4)如为抽样研究资料,两样本标准化率的比较也应作 假设检验。
第十七章分类资料的统计推断

H0 :1=2,… H1 :12,… =0.05
(2)求检验统计量值
c2
a
ad bc n /
bc da
22 n
cb
d
251 7 27 60 / 22 60
32 28528
2.89 (2 1)(2 1) 1
(3) 确定P 值,作出推断结论
2 0.05,1
3.84
P>0.05….
• n ≥ 40,且Tmin ≥ 5时,用2检验基本公式和专用公式
• n≥ 40,但1≤Tmin<5时,用2检验校正公式 • n<40,或Tmin<1时,或P≈α用四格表Fisher确切概率法
校正公式:
2 c
( A T 0.5)2 T
( ad bc n)2 n
2 c
(a
b)(c
d )(a
阴性
b d
b+d
合计
a+b
c+d a+b + c+d
2
(ad bc)2 n
, 1
(a b)(c d )(a c)(b d )
为了不计算理论频数T, 可由基本公式推导出,直接由各 格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式abc
❖(3) 确定P 值,作出推断结论
查2界值表:
2 0.05,1
3.84
2 0.025,1
5.02
2 0.01,1
6.63
故P < 0.01,按=0.05的检验水准,拒绝 H0,接受H1,差别有统计学意义,可认为 女生的患病率高于男性。
二、四格表资料2检验的专用公式
组别 A组 B组
第13章 有序分类变量的统计推断——非参数检验

13.3.1 Mann-Whitney
U检验
记X和Y的秩和分别为WX和WY,满足 WX+WY=N(N+1)/2。 当X的样本全部排在Y的样本前面时, WX达到最小m(m+1)/2,定义统计量
U= WX -m(m+1)/2
当原假设成立时,两个样本交错出现, 分布均匀,U不会太小或者太大。反之, 如果U偏小或者偏大,则原假设不成立。
13.3.2 分析实例
例13.2
一家权威的房屋建筑协会 提供了最流行的家居装修工程的 成本数据,能否得出厨房的装修 成本与主卧室的装修成本存在差 异呢? 数据见npara2.sav
13.3.2 分析实例
AnalyzeNonparametric Tests 2 independent Samples
第13章计推断非参数检验有序分类变量的统第13章有序分类变量的统计推断非参数检验?131非参数检验概述?132两个配对样本的非参数检验?133两个独立样本的非参数检验131非参数检验概述?1311非参数检验的意义?1312非参数检验预备知识1311非参数检验的意义?非参数检验nonparametrictesting是指在总体不服从正态分布且分布情况不明时用来检验数据资料是否来自同一个总体假设的一类检验方法
13.3.1 Mann-Whitney
U检验
SPSS中提供了四种方法: Mann-Whitney U法(曼-惠特尼U检 验):
通过对平均秩的研究来实现推断的。 类似单样本检验的K-S法,通过对分布的 研究来实现推断。
Kolmogorov-Smirnov Z法:
13.3.1 Mann-Whitney
分类统计的教案5篇

分类统计的教案5篇(实用版)编制人:______审核人:______审批人:______编制单位:______编制时间:__年__月__日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的实用资料,如工作报告、工作计划、心得体会、合同方案、演讲稿、作文大全、教案、述职报告、调查报告、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor.I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of practical materials for everyone, such as work reports, work plans, reflections, contract proposals, speeches, essay summaries, lesson plans, job reports, investigation reports, and other materials. If you want to learn about different data formats and writing methods, please stay tuned!分类统计的教案5篇优秀的教案应该根据学生的不同特点和学习风格进行个性化的设计和调整,详细的教案可以促使我们深入思考教学目标和评价标准,使教学更加有针对性和明确性,下面是本店铺为您分享的分类统计的教案5篇,感谢您的参阅。
预防医学之分类变量的统计推断

直接标准化率——标准选取
❖ 选择一个有代表性的、内部构成相对稳定的 较大人群作为标准;例如全国人口、全省人 口
❖ 将要比较的两组资料合并后作为共同的标准 ❖ 将要比较的两组中任意一组作为共用标准
直接标准化率
期望生存
人数
ei=nipi
×
= 268
×
v 并非所有 含“率” 的指标都表达是发生的可能性大 小,很多情况下这些含“率”的指标是相对比
v 例如:
5岁以下儿童死亡率=某年5岁以下儿童死亡数 同年活产儿总数
孕产妇死亡率=某年孕产妇死亡数 同年活产儿总数
proportion vs. rate
某年某市高血压发病情况 某年某市畸胎发病情况
相对数比较时的可比性
构成等
3、率
v 率rate含义:反映某一时间段内,某一事件出现的机会大小(近 似于一段时间内发生某事件的平均概率)
v 计算公式:
率 = 某 一 时 间 内 发 生 某 现 象 的 个 体 数 K 同 期 可 能 发 生 该 事 件 的 总 个 体 数
K 可 以 根 据 具 体 情 况 取 % 、 000、 1万 、 110万 等 ; 时 间 通 常 取 一 年 。
2、构成比
v 构成比proportion含义:反映事物内部某个部分占总 体的比重;分子包含在分母中
v 计算公式:
构 成 比 = 某 一 组 成 部 分 个 体 数 比 例 基 数 K 同 一 事 物 内 部 各 组 成 单 位 个 体 的 总 数
K 可 以 根 据 具 体 情 况 取 % 、 000、 1万 、 110万 等 。 v 特点:无量纲、在0~1间取值、不独立性、可加性 v 常用指标有:性别构成、疾病构成、年龄构成、职业
医学统计学分类变量资料的统计推断

率的标准误的意义
▪ 率的标准误小,说明抽样误差较小,表示 样本率与总体率越接近;
▪ 率的标准误大,说明抽样误差较大,表示 样本率与总体率相距较远。
▪ 有研究者在某地采用随机整群抽样法获得 642名青少年,调查其留守情况,得出留守 率为16.98%,求其留守率的标准误。
▪ 已知n=642,p=0.1698,则
单侧α= 0.05
本例,n=304,p=0.316,π0=0.2,则有
u=5.06>1.645,p<0.05,则拒绝H0,接受H1,老年 胃溃疡患者出血率高于一般胃溃疡患者。
案例
▪ 某地调查了50岁以上吸烟者200人中患慢 性支气管炎者41人,患病率为20.5%;不 吸烟者162人中患慢性支气管炎者15人, 患病率为9.3%。
案例
▪ 2003年,某学校欲了解大学生乙肝表面抗原 携带情况以评价防控措施,随机抽取1000名 大学生,做乙肝表面抗原检查,查得乙肝表 面抗原阳性者52人,乙肝表面抗原阳性率为 5.2%,欲用此率推断该校大学生乙肝表面抗 原总体阳性率。
例
▪ 某校大学生乙肝表面抗原总体阳性率的 95%的可信区间:
分类变量资料的 统计推断
二项分布
▪ 考虑一系列彼此独立的随机试验,每次试 验只有两个可能发生的结果,且每种结果 发生的可能性是一定的,即发生和不发生 的概率分别是:和1- ,那么这n次试验 中发生或者不发生的次数服从二项分布。 (没有“排列”的意义,而体现了“组合” 的意义)
只有两个可能发生的结果
▪ 问题
➢ 据以上资料能否下结论说吸烟者慢性支气管炎 患病率高于不吸烟者?
➢ 用什么方法对两个率进行比较?
吸烟组和不吸烟组慢性支气管炎患病率比较