卫生学课件:第十章 分类变量资料的统计分析

合集下载

分类变量资料的统计分析培训课件

分类变量资料的统计分析培训课件


35
样本率与总体率的比较
p
p
u

p
1
n

36
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者,围 术期出现并发症有100例,并发症发生率为26%,问 该院直肠癌患者围术期并发症发生率与一般情况比 较有无统计学差异。
本例,样本率为26%,np和n(1-p)均大于5,可采 用u检验。
第十章 分类变量资料的统计分析

1
主要内容
分类变量资料的统计描述 分类变量资料的统计推断 卡方检验

2
第一节 分类变量资料的统计描述
• 什么是分类变量资料? • 用什么指标进行描述?
•甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50 人,何地较为严重? •若甲地易感儿童667人,而乙地易感儿童250人。

37
1. 建立检验假设
H0: =0,H1: 0,=0.05
2. 计算u值 u 0.3 0.26 1.713 0.3(1 0.3) 385
3. 确定P值,判断结果
本题u=1.713<1.96,P>0.05,按=0.05的水准不拒绝H0,
差异没有统计学意义,故尚不能认为该院直肠癌患者围 术期并发症发生率与一般情况不同。

23
率的标准化应注意的问题
(1)当各比较组内部构成(如年龄、性别等)不同时, 应对率进行标准化后,再作比较。
(2)标准化率只表明各标化组率的相对水平,而不代表 其实际水平。
(3)两总率各分组对应的率有明显交叉时,则不能用标 准化率进行比较。
(4)如为抽样研究资料,两样本标准化率的比较也应作 假设检验。

医学统计学--变量的分类与统计资料的类型 PPT课件

医学统计学--变量的分类与统计资料的类型  PPT课件
• 3、总体(population)和样本(sample) • (1)、总体(population):是根据研究 目的确定的同质研究单位的全体。更确 切地说是同质研究单位某种变量值的集 合。 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
医学课件 18
二、统计学中的几个基本概念
• 研究单位:一个人 • 变量:红细胞数 • 同质:同某地、同2002年、同成年男子、 同正常。 总体:1)某地所有的正常成年男子 2)某地所有的正常成年男子的 红细胞数
医学课件
37
三、统计资料的类型
变量与统计资料的分类方法 1.概述 2.数值变量(numerical variable)和计量资料 (measurement data) 3.无序分类变量(unordered categories variable ) 和计数资料 (enumeration data) 4.有序分类变量(ordinal categories variable)和等 级资料(ranked data)
医学课件 19
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围 • 2)无限总体(infinite population):研 究单位数是无限的 • 例如:高血压患者←无时间、空间限制。
Prop(2001.5~2011.5)=0.11, 结合Mendel历次报告的其它实 6 医学课件 验结果,每次都有如此好的吻合的概率约 10万分之4。
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题

医学统计方法—分类变量资料的统计分析

医学统计方法—分类变量资料的统计分析
定义:相对数是两个有联系的指标之比,反映事物的相对 水平。
常用类型: ➢率(rate) ➢构成比(constituent ratio) ➢相对比(relative ratio),等
概念:又称频率指标或强度指标,是指某一现象在一定条件 下实际发生的例数与可能发生该现象的总例数之比,用以说 明某现象发生的频率或强度。
2
91 1 4.90
bc
9 1
(3)确定P值:

x
2界
值表,来自得x 2 0.05,1
3.84
x2 0.01,1
6.63。
现 x2 =4.90,x2> x20.05, 故 P<0.05 (4) 做出推断结论:
按α=0.05水准,拒绝H0 ,接受H1,差异有统计学 意义,可以认为两种培养方法的效果不同, A培养基 效果优于B培养基。
计算相对数时应有足够的样本含量; 资料分析时不能以构成比代替率; 资料的对比应注意其可比性; 样本率(或构成比)的比较应考虑抽样误差。
表 某年某医院两种疗法治疗某传染病各型的治愈率(%)
病型
新疗法
传统疗法
治疗例数 治愈例数 治愈率 治疗例数 治愈例数 治愈率
普通型 350
重型
150
217
药物 甲药 乙药 合计
表1 两药物疗效的比较
有效
无效
合计
65 (57.4) 17(24.6)
82
40 (47.6) 28 (20.4)
68
105
45
150
表内蓝体数字为实际頻数,括号里数字为 理论頻数,是假设两药物疗效无差别算得
若假设H0:π1=π2成立,四个格子的实际频数 A 与理论 频数 T 相差不应该很大,即统计量x2值不应该很大。如 果x2值很大,则反过来推断A 与T 相差太大,超出了抽样 误差允许的范围,从而怀疑H0的正确性,继而拒绝H0, 接受其对立假设 H1,即π1≠π2 。

人卫第八版《卫生学》数值变量资料的统计分析-文档资料

人卫第八版《卫生学》数值变量资料的统计分析-文档资料

集中趋势的描述
(一)算术均数(arithmetic mean)
简称均数(mean),可用于反映一组呈对称 分布的变量值在数量上的平均水平。其计算方 法有直接法和加权法 (二)几何均数(geometric mean)
用 G 表示,可用于反映一组经对数转换后 呈对称分布或数据之间呈倍数关系或近似倍数 关系资料的平均水平。其计算方法有直接法和 加权法。
正态分布的特征和曲线下面积分布规律
正态分布有以下四个方面特征: ①正态曲线在横轴上方,呈钟形曲线,两端与横 轴永不相交; ②正态分布以均数为中心,均数所在处最高,左 右对称; ③正态分布有两个参数,即均数与标准差; ④正态分布曲线下的面积分布有一定的规律性。
正态分布的应用
(一)估计变量值的频数分布
n
当标准差一定时,标准误与样本含量的平 方根成反比。当样本例数一定时,标准误 与标准差成正比。
t 分布
分布是一簇对称于0的单峰分布曲线。自 由度(实际上是样本含量n)越小,曲线 越扁平,随着自由度的增大,t 分布曲线 逐渐逼近标准正态曲线。当自由度为无穷 大时,则t 分布曲线与标准正态曲线完全 吻合。
频数
2 7 13 14 15 19 18 16 14 13 6 3 140
累计频数
2 9 22 36 51 70 88 104 118 131 137 140 —
频率(%)
1.43 5.00 9.29 10.00 10.71 13.57 12.86 11.43 10.00 9.29 4.28 2.14 100.00
均数的抽样误差与标准误
均数标准误(理论值)的计算公式是:
x
n
n 为样本例数, 式中 表示总体标准差, 为均数标准误的理论值 x

8.5.1分类变量资料资料的统计描述

8.5.1分类变量资料资料的统计描述
用相对数时应注意的问题
♦ 1.计算相对数时分母不宜过小
例2:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。 请问该说法是否正确?
♦ 2.分析时不能以构成比代替率
♦ 3.注意资料的可以性
用率或构成比进行比较时,必须注 意资料的可比性,即除了要比较的因素 外,其他可能影响研究结果的因素(如 时间、年龄、职业、地区、民族、风俗 习惯、经济水平等内部构成)要尽可能 的相同。
一、常用相对数
例1:甲小学有534人,乙小学为313人, 经 检查发现, 甲学校患龋齿者57人, 乙学校 患龋齿人数33人。 问那所学校发现患龋齿的强度高?
相对数:是指两个有联系的指标之比。
常用的相对数有率、构成比和相对比。
(一)率(频率指标)
(二)构成比(构成指标)
(三)相对比(比)
比 A B
♦ 4.正确计算平均率
例3 某班有男生50人,女生20人,男生英语四级 通过率为80%,女生四级通过率为100%,请问该 班四级通过率为多少?
• 答案A:90%。 • 答案B:85.7%
♦ 5.样本率或构成比的比较应做假 设检验
样本率或构成比是抽样得到的,存 在抽样误差,进行比较时不能仅凭表面数 值大小直接下结论,应做假设检验

预防医学-分类变量的统计分析PPT

预防医学-分类变量的统计分析PPT

9
某正常人的白细胞分类计数构成比
白细胞分类 中性粒细胞 淋巴细胞 单核细胞 嗜酸粒细胞 嗜碱粒细胞
合计
分类计数 140 50 5 4 1 200
构成比(%) 70.0 25.0 2.5 2.0 0.5
100.0
10
构成比的特点
各组成部分的构成比之和 为100%。


事物内部某一部分构成比发生 变化,其它部分的构成比也相
20
第三节 率的标准化法
率的标准化的概念与基本思想:
为了消除相比较组间因内部构成不同对所比 较指标的影响,采用统一的标准构成对总率进行 调整,使算得的标准化率具有可比性,得出科学 的结论。
21
甲、乙两医院的治愈率
科别
住院人数
甲医院 乙医院
内科 1500
500
外科 500 传染病科 500
1500 500
前已算得 S p 00..000388,则其95%CI为:
p 1.96Sp = 0.90.±041.916.×960.003.0=0(880.(8401.022,280,.9508.085)72)
即该新药有效率95%置信区间为84.12%~95.88%。
43
2.查表法
如果n、p不满足上述条件(n≤50),可根据二 项分布的原理估计总体率的置信区间。
计算
构成比=
事物内部某一组成部分的观察单位数 事物内部所有组成部分的观察单位总数
100%
8
2000年某医院某病的住院人数和死亡人数
病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%)

300
12
26.7
4.0

350

第十章 分类变量资料的统计分析(卡方检验)资料

第十章  分类变量资料的统计分析(卡方检验)资料

2=6.48>02.05,1 3.84,P <0.05,按 0.05
检验水准,拒绝H0,接受H1,差异有统计学意义, 认为两疗法的有效率有差别,乙药疗效优于甲药。
P
0.05
0.01
2 2.73 3.84
6.63
四格表资料的校正公式(公式10-17、18):
2
( AT
0.5)2
T
2
( ad bc n / 2)2 n
例10-11 用两种血清学方法对100例肝癌患者进行诊 断,结果见表10-9,问两种方法检测结果有无差别?
表10-9 两种方法检测肺癌的效果比较
甲法 +
合计
乙 +
50(a) 15(c)
65

32(b) 3(d)
35
合计
82 18 100
表10-9 配对四格表格式
甲法
+ 合计
乙 +
a c a+c
检验水准,拒绝H0,接受H1,差异有统计学意义, 认为两疗法的有效率有差别,乙药疗效优于甲药。
P
0.05
0.01
2 2.73 3.84
6.63
四格表专用公式(公式10-16):
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
表10-7 两种药治疗动脉硬化有效率比较
同或不等。
2

02.05,时,P≤0.05,按
0.0检5 验水准,拒绝
H0,接受H1,差异有统计学意义,可以认为…不同
或不等,谁大谁小。
二、 四格表资料的 2 检验
适用于成组设计的两个率的比较
例:10-9

分类变量的统计分析课件

分类变量的统计分析课件

k
某病死亡率
(疾病别死亡率
)=
某年因某病死亡人数 同年平均人口数
k
某年龄组死亡率 (年龄别死亡率 )=同某年年同某年年龄龄组组平死均亡人人口数数 k
某死因构成比= 因某类死因死亡人数 总死亡人数
100%
某病病死率=
观察期间因某病死亡人 同时期某病患病人数

100%
治愈率= 治愈病人数 接受治疗病人数
75.0%(90/120)。
2 值的大小反映了实际数与理论数的相差情况,若无
效假设 H0成立,则理论数和实际数相差不应该太大,较大
的 2 值出现的概率较小。故根据资料计算的 2 值越大,
就越有理由推翻无效假设 H0 。
T nRnC RC n
TRC 为第R行第C列格子的理论数 nR 为R行的合计数 nC 为第C列的合计数
A乡血吸虫病患病人数 A乡的检查人数
= 17 10000 / 万=22.97 / 万 7400
A乡的血吸虫病患病率是22.97/万。
常用相对数指标:
发病率= 某时期内某病新病例数 同时期平均人口数
k
患病率=
观察期间患某病的新旧 病例数 同时期平均人口数
k
感染率= 感染某病原体人数 受检人数
k
死亡率= 某年死亡总人数 同年平均人口数
pi
Nipi
5.0 500
0.5 50
- 1100
- 550
标化吸烟率
5.50
2.75
医科大学学生标化吸烟率 p ’ =1100/20000=5.50% 工业大学学生标化吸烟率 p ’ =550/20000=2.75%
此标化率是合理的,这才反映了真实情况。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
np 和 n(1-p)>5
p u× Sp
2. 查表法: 当n ≤50, 样本率p 接近与0或1时,该资料 服从二项分布,用查表法估计样本含量
例10-5 为了解某地乙肝表面抗原携带情况,某研究者在该
地人群中随机检测了该地200人,乙肝表面抗原阳性7 人,乙肝表面抗原携带率为3.5%,试计算标准误并估 计95%和99%可信区间.
3. 确定 P 值, 判断结果
(二)资料类型
1. 样本率与总体率的比较 (例10-6)
计算公式:
p
u
p
p (1 )
n
2. 两个样本率的1 pc)( 1 1 )
pc X 1 X 2 n1 n2
n1 n2
第三节 X2 检验 (chi-square test)
48
中西医结合组 病例数 治愈数 治愈率 (%)
20
13
65
60
27
45
20
5
25
100 45
45
例: 某病两种疗法治愈率的比较
西医组
中西医结合组
病型 病例数 原治愈率 (%) 预期治愈数 原治愈率 (%) 预期治愈数
普通型 80
60
重型 80
40
爆发型 40
20
48
65
52
32
45
36
8
25
10
标准人口构成进行计算
间接法: 标准化死亡比 (SMR), 实际死亡数与预
期死亡数的比
3. 率的标准化应注意的问题
第三节 率的标准化法 (standardization)
例: 某病两种疗法治愈率的比较
西医组 病型 病例数 治愈数 治愈率 (%)
普通型 60
36
60
重型 20
8
40
爆发型 20
4
20
合计 100 48
<<卫生学>>
计数资料的统计分析
环境与公共卫生学院预防医学系 闫洪涛
统计资料的类型
数值变量: 计量资料 分类变量: 计数资料
连续型计量资料 离散型计量资料
无序分类:
二项分类 多项分类
有序分类 : 变量之间有程度的差 别, 且排列有序. (等级变量)
变量的转换: 定量
定性
第十章 分类变量资料的统计分析
口数或标准人口构成进行计算
间接法: 标准化死亡比 (SMR), 实际死亡数与
预期死亡数的比
3. 率的标准化应注意的问题
• 由于内部构成不同,影响到要比较的总率, 需要标准化处理?
• 标准化率只用于比较,已经不代表实际 的水平。
• 各分组率有交叉,不能用标准化率比较 • 抽样得到的标准化率的比较,也应该进行
3. 确定 P 值, 判断结果 根据查Χ2 界值表, 确定P值
年级 检查人数 患病人数 患病率 构成比 相对比
一年级 442 二年级 428 三年级 405
67
15.16 32.06
68
15.89 32.53
74
18.27 35.41 1.2
合计 1275
209 16.39 100.0
二. 应用相对数时注意事项
1. 分母不宜太小 2. 率和构成比的区别 3. 样本含量不等的几个率的平均值不等于 几个率
合计 200
88
98
西医标准化治愈率 P'= 88÷200 = 44% 中西医标准化治愈率 P'= 98÷200 = 49%
率的标准化
1.基本思想: 为消除内部构成不同对指标的 影响, 采用统一的内部构成计算标准化率,
使得出的标准化率具有可比性.
2.计算方法:
直接法: 已知各年龄组的实际发病率,用标准人
基本思想
检验实际频数与理论频数的吻合程度,实 际频数与理论频数越相近, X2 值越小; 反 之,实际数与理论数相差越大, X2值越大.
计算公式:
2 A T 2
T
理论频数的计算: TRC= nRnC / n df=(行数-1)(列数-1)
例10-8 某医生用A,B两种药物治疗急性下呼吸道
感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?
假设检验.
第二节 计数资料统计推断
一. 率的抽样误差和标准误 样本率和总体率或样本率之间存在的差异,称
抽样误差.率的抽样误差用率的标准误表示.(p or Sp).
p (1 )
n
Sp p(1 P) n
( p =阳性率, 1- p=阴性率)
二. 总体率的区间估计
1. 正态近似法:
条件: n 足够大,样本率p 或1-p均不太 小时, 即
n=200 X=7, P=3.5%
Sp p(1 P) n
95%可信区间: 3.5% 1.96 Sp 99%可信区间: 3.5% 2.58 Sp
三. 两个率比较的u 检验
当np和 n(1-p) ≧5 时 样本率的分布近似正态分布— u 检验
(一) 检验步骤: 1. 建立假设, 确定检验水准α H0: H1: α =0.05 2. 选择检验方法, 计算 u 值
处理
A药 B药 合计
有效
68 52 120
无效
6 11 17
合计
74 63 137
有效率(%)
91.89 82.54 87.59
例10-8 某医生用A,B两种药物治疗急性下呼吸道
感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?
处理
A药 B药 合计
有效
无效
合计
68 (64.82) 6 (9.18) 74 52 (55.18) 11(7.82) 63
120
17
137
有效率(%)
91.89 82.54 87.59
2 A T 2
T
二. Χ2 检验的基本步骤 1. 建立检验假设,确定检验水准
H0: 1= 2 H1: 1 2
=0.05
2. 计算Χ2 值 资料类型不同,计算公式不同
第一节 统计描述 一.描述指标(相对数)
1. 率(rate) : R n K N
单位: %,‰,万分率,10万分率 2. 构成比 (constituent ratio)
单位: % 特点: 3. 相对比 (relative ratio) 常用率比
• 例10-1
某研究者2000年对某校的初中生进行了近视患病 情况调查,试计算各年级近视患病率和构成比及 三年级和一年级患病率的相对比.
的算数平均值 4. 对率或构成比进行比较时,应注意资料的可比性 5. 率的标准化 6. 两样本率进行比较时应进行假设检验
三.率的标准化
1.基本思想: 为消除内部构成不同对指标的影响, 采用统一的内部构成计算标准化率,使得出的标
准化率具有可比性.
2.计算方法: 直接法: 已知各年龄组的实际发病率,用标准人口数或
相关文档
最新文档