分类变量资料的推断 PPT课件

合集下载

预防医学(二)第十七章 分类变量资料的统计 分析

预防医学(二)第十七章 分类变量资料的统计 分析

第二节 分类变量资料的统计推断
• 一、率的抽样误差与标准误 • 由随机抽样造成的样本率和总体率的差异,以及各样本率 之间的差异称为率的抽样误差。 • 率的抽样误差可用率的标准误来表示 • 率的标准误的计算
• σp为率的标准率,π为总体率,n为样本含量
第二节 分类变量资料的统计推断
• 二、总体率的可信区间估计 • 方法:查表法、正态近似法 • 1.查表法 • 当样本含量较小(如n≤50),特别是p接近于0或1时,可根 据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。
第三节 卡方检验(X2检验)
• 一、四格表资料的X2检验 • 2.假设检验步骤 • (1)建立检验假设,确定检验水准 • H0:π1=π2,即试验组与对照组的总体有效率相等。 • H1:π1≠π2,即试验组与对照组的总体有效率不等 • α=0.05(双侧检验) • (2)计算检验统计量
• A为实际频数 • T为理论频数
第三节 卡方检验(X2检验)
• 三、行✖列表资料的X2检验 • 例:某医院用3种方案治疗急性无黄疸型病毒性肝炎 254例, 观察结果见下表,问3种疗法的有效率是否不等。
• 检验假设具体步骤: • H0:3种治疗方案的有效率相等
第三节 卡方检验(X2检验)
• 三、行✖列表资料的X2检验 • 检验假设具体步骤: • H1:3种治疗方案的有效率不全等,α=0.05
第二节 分类变量资料的统计推断
• 四、率的u检验 • 2.计算检验统计量 • (2)两样本率比较的u检验
• 其中P1和P2为两样本率,Sp1-p2为两样本率之差的标准误, P含c量为两样本合并率,Pc=(X1+X2)/(n1+n2),n1和n2分别为两样本

预防医学之分类变量的统计推断

预防医学之分类变量的统计推断
• 特点:多来源于随访性资料、分母中含有时间定义、取值有时会 超过1(时间取半年、半月)
• 常用指标有:发病率、死亡率、出生率等
应用相对数的注意事项
• 防止概念混淆;分析时不能以构成比代替 率
• 计算相对数的分母一般不宜过小 • 正确地合并估计率(平均率或合计率) • 相对数比较时要注意可比性
防止概念混淆

10
10.00

10
10.00

20Biblioteka 20.00夏20
20.00

30
30.00

30
30.00

40
40.00

40
40.00
相对数比较时的可比性
甲院
乙院
科室
出院人数 治愈人数 治愈率(%) 出院人数 治愈人数 治愈率(%)
内科 876 295 33.67
329 104 31.61
外科 305 292 95.74
• 可见这两组资料内部的构成不同(不同的科室治愈 率是不同的),可比性差,不可直接比较总治愈或 合计治愈率
率的标准化
• 采用统一的标准对内部构成不同的各组频率进行 调整,而后对比各组标准化率的方法称为率的标 准化法
• 调整后的率为标准化率,简称标化率(standard rate),或调整率(adjusted rate)
患病人数 9 13 91
102 12 227
患病率(1/万) 0.9 2.9 13.0 16.0 37.5 7.9
60岁以上年龄段为高血压的高危年龄段!
相对数
• 对分类变量汇总后,通常这些频数不能直 接比较;分类资料的统计描述与推断中通 常使用相对数,而不是绝对数

第十七章分类资料的统计推断

第十七章分类资料的统计推断

H0 :1=2,… H1 :12,… =0.05
(2)求检验统计量值
c2
a
ad bc n /
bc da
22 n
cb
d
251 7 27 60 / 22 60
32 28528
2.89 (2 1)(2 1) 1
(3) 确定P 值,作出推断结论
2 0.05,1
3.84
P>0.05….
• n ≥ 40,且Tmin ≥ 5时,用2检验基本公式和专用公式
• n≥ 40,但1≤Tmin<5时,用2检验校正公式 • n<40,或Tmin<1时,或P≈α用四格表Fisher确切概率法
校正公式:
2 c
( A T 0.5)2 T
( ad bc n)2 n
2 c
(a
b)(c
d )(a
阴性
b d
b+d
合计
a+b
c+d a+b + c+d
2
(ad bc)2 n
, 1
(a b)(c d )(a c)(b d )
为了不计算理论频数T, 可由基本公式推导出,直接由各 格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式abc
❖(3) 确定P 值,作出推断结论
查2界值表:
2 0.05,1
3.84
2 0.025,1
5.02
2 0.01,1
6.63
故P < 0.01,按=0.05的检验水准,拒绝 H0,接受H1,差别有统计学意义,可认为 女生的患病率高于男性。
二、四格表资料2检验的专用公式
组别 A组 B组

第十二章 分类变量统计推断(2)卡方检验

第十二章 分类变量统计推断(2)卡方检验

计算题3 常规培养 + - 合 计 27 1 28 8 74 82 35 75 110
乳胶 + - 合 计
配对资料且b+c<40 1.建立假设: H0: 两培养结果一致 H1: 两培养结果不一致 α=0.05 2.计算χ2值

2
( b c 1) bc
2

( 1 8 1) 1 8
T
2

( ad bc n / 2) n (a b)(c d )(a c)(b d )
2 2
例2 某医师用甲,乙两疗法治 疗脑血管梗塞,结果如下表 2,比较两种疗法的效果有 无差异。
表2 两种疗法的效果比较 疗法 甲 乙 痊愈数 25(26.57) 29(27.43) 未愈数 6(4.43) 3(4.57) 合计 31 32
2 χ 检验
卡方检验用途: 可以对两个率或构成比以及多 个率或构成比间的差异做统计 学检验
一. 四格表资料的检验
例1:某医生两种方法治疗肺癌,
出院后随访了24个月,甲疗法 治疗46例,乙疗法治疗了58例,
结果如下表1,问两种方法治疗肺
癌病人两年生存率有无差别?
表1 两种疗法的两年生存率比较 处理
能认为各总体率或总体构成比之
间总的来说有差别,但不能说明 它们彼此之间有差别或两两之间
有差别。
五.配对计数资料的卡方检验
例5 有50份咽喉涂抹标本,每份按同
样的条件分别接种于甲乙两种培
养基中,观察结核杆菌生长情况,
比较两种培养基的效果(如下表5)
表5两种培养基培养白喉杆菌的比较 乙
甲 + + 23(a) - 12(b) 合 计 35

两分类资料的统计描述与推断

两分类资料的统计描述与推断
详细描述
频数分布表包括两列,一列表示类别, 另一列表示该类别出现的频数。通过 频数分布表,可以直观地了解各类别 的数量分布情况,为后续的统计分析 提供基础数据。
比例与百分比
总结词
比例和百分比是用来描述两分类资料中各类别的相对大小。
详细描述
比例是各类别的数量与总数量的比值,而百分比则是比例乘以100。通过比例和 百分比,可以了解各类别的相对大小,进一步分析各类别的权重和影响。
详细描述
在两分类资料中,中位数通常用于描述某一类别的中间状态或中心趋势。例如,在一组 关于消费者年龄的数据中,中位数可以表示消费者的平均年龄或年龄分布的中心趋势。
算术平均数
总结词
算术平均数是所有数值的和除以数值的 个数。
VS
详细描述
在两分类资料中,算术平均数可以用于描 述某一类别的平均水平或中心趋势。例如 ,在一组关于消费者购买力的数据中,算 术平均数可以表示消费者的平均购买力水 平。
概率与概率分布
概率
描述随机事件发生的可能性大小。
概率分布
描述随机变量取值可能性的分布情况。
随机抽样与抽样分布
随机抽样
从总体中按照随机原则抽取一部分观察单位进行研究 。
抽样分布
由样本数据推导出的统计量值的分布。
统计量与参数
统计量
基于样本数据计算出的量值,用于描 述样本数据的特征。
参数
描述总体特性的量值,通常通过总体 数据计算得出。
03
CHAPTER
两分类资料的离散程度描述
异众比率
异众比率
异众比率是用于描述分类数据中非众数频数 的相对重要性。其计算公式为异众比率=非 众数频数/总频数。异众比率越大,说明非 众数频数所占比重越大,数据的离散程度越 大。

分类变量的描述性统计-医学统计学课件

分类变量的描述性统计-医学统计学课件
Байду номын сангаас
描述性统计的常用指标有哪些?
1 频数
2 百分比
统计每个类别的观察次数, 反映各类别在样本中的分 布。
计算每个类别在样本中的 所占比例,用于比较不同 类别的相对频率。
3 累计百分比
计算每个类别及其前面所 有类别的累计频率,描述 数据的积累情况。
如何绘制频数表?
频数表是一种统计表格,用于展示各类别的频数和频率。通过表格形式,可 以清晰地展示数据的分布情况,方便比较和分析。
如何绘制条形图?
条形图是一种可视化方法,用长条的长度代表各类别的频数或频率,直观地展示各类别之间的差异,便于观察 和理解数据的分布情况。
堆叠条形图
展示多个分类变量在不同分组中的频数或频率,比 较各类别在不同分组中的差异。
簇状条形图
将多个分类变量的频数或频率放在同一条形图中, 直观地比较各类别之间的差异。
分类变量的描述性统计医学统计学课件
本课件介绍分类变量的描述性统计方法,包括常用指标和可视化方法,以及 如何进行多个变量的比较和分析。通过本课件,您将更好地理解医学统计学 中的数据分析方法。
什么是分类变量?
分类变量是指变量的取值分属于有限个类别,例如血型、性别和疾病类型等。通过描述性统计方法,我们可以 对分类变量进行分析和解释。
如何使用交叉表进行分析?
交叉表是一种用于统计分析的工具,将两个或多个分类变量的取值组合在一起,展示各类别之间的频数和频率。 通过交叉表分析,可以更深入地了解分类变量之间的关系。
如何进行卡方检验?
卡方检验是一种统计方法,用于分析两个分类变量之间的关联性。通过计算 观察频数与期望频数的差异,判断两个变量之间是否存在显著的关联。
如何进行列联表分析?

两分类资料的统计描述与推断

两分类资料的统计描述与推断

计算步骤
1)选定一个共同的“标准”,将两疗法各构成合并的数据作标准,见 表7-5第②列。
2)接着分别计算两疗法各构成的期望治愈数,见表7-5第④、⑥列。 3)分别计算两种疗法的标准化治愈率。 结论:甲疗法标准化治愈率低于乙疗法,与各病情治愈率比较的结果一
致。
应用标准化法应注意的问题
(1)标准化法只适用于因比较组内部构成不同可能 影响总率比较的情况,对于其他条件不同产生的可比 性问题,标准化法不能解决。
比例基数的选择主要根据习惯用法和使 计算的结果能保留1~2位整数,以便阅 读。例如患病率通常用百分率、婴儿死 亡率用千分率、肿瘤死亡率以十万分率 表示。

如表7-1中,“0~”年龄组患者为501 人,调查人数90319人,则“0~”年 龄组患病率=(501/90319)x100% =5.55%,余仿此。可见,各年龄组患 病率的水平不受其他年龄组患病率大小 影响,各年龄组患病率相加无意义。
如表7-6资料某省中医院1995年~2005年门诊量为
平均发展速度=
=1.003=100.3%
平均增长速度=平均发展速度-1=1.0030-1= 0.0030 =3.0%。
根据平均发展速度的计算公式(7-11)推导出n年后达到的目标 计算公式为:
an=a0×(平均发展速度)n
(7-13)
第三节 二项分布和Poisson分布
例如,性别比=女性人口Байду номын сангаас÷男性人口 数;
又如,医院逐年门诊量的发展速度=后 一年门诊量/前一年门诊量
构成比
构成比(constituent ratio)又称构成 指标,说明某事物内部各组成部分在总 体中所占的比重或分布。常以百分数表 示,即通常以100%为比例基数。其计算 公式(7-1)如下:

预防医学之分类变量的统计推断

预防医学之分类变量的统计推断
❖ 该标准不可随便选择,一般选用标准的方法 有三种
直接标准化率——标准选取
❖ 选择一个有代表性的、内部构成相对稳定的 较大人群作为标准;例如全国人口、全省人 口
❖ 将要比较的两组资料合并后作为共同的标准 ❖ 将要比较的两组中任意一组作为共用标准
直接标准化率
期望生存
人数
ei=nipi
×
= 268
×
v 并非所有 含“率” 的指标都表达是发生的可能性大 小,很多情况下这些含“率”的指标是相对比
v 例如:
5岁以下儿童死亡率=某年5岁以下儿童死亡数 同年活产儿总数
孕产妇死亡率=某年孕产妇死亡数 同年活产儿总数
proportion vs. rate
某年某市高血压发病情况 某年某市畸胎发病情况
相对数比较时的可比性
构成等
3、率
v 率rate含义:反映某一时间段内,某一事件出现的机会大小(近 似于一段时间内发生某事件的平均概率)
v 计算公式:
率 = 某 一 时 间 内 发 生 某 现 象 的 个 体 数 K 同 期 可 能 发 生 该 事 件 的 总 个 体 数
K 可 以 根 据 具 体 情 况 取 % 、 000、 1万 、 110万 等 ; 时 间 通 常 取 一 年 。
2、构成比
v 构成比proportion含义:反映事物内部某个部分占总 体的比重;分子包含在分母中
v 计算公式:
构 成 比 = 某 一 组 成 部 分 个 体 数 比 例 基 数 K 同 一 事 物 内 部 各 组 成 单 位 个 体 的 总 数
K 可 以 根 据 具 体 情 况 取 % 、 000、 1万 、 110万 等 。 v 特点:无量纲、在0~1间取值、不独立性、可加性 v 常用指标有:性别构成、疾病构成、年龄构成、职业
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档