研究生 统计学讲义 第7讲 RC表资料分析.ppt

合集下载

最新研究生统计学讲义第6讲第7章分类资料统计描述与推断PPT课件

最新研究生统计学讲义第6讲第7章分类资料统计描述与推断PPT课件
研究生统计学讲义第6讲第7章 分类资料统计描述与推断
二项分布变量的标准差用相对数(率)表示时,称为
率的标准误,总体率的标准误记为σp,样本率的标准 误记为Sp,计算公式为:
p
(1)
n
Sp p(1p)/n (9.8)
二、 Poisson分布 Poisson分布(Poisson distribution)是一种重要的离散 型分布。适用条件:① 两分类的资料;② 所考察的事 件发生率π(一般用大样本率p来估计π)很小,n很大, nπ(或np)为一不大的常数;③ 事件的发生是独立的, 如各病人的患病与否与他人无关。如人群中,对某种 物质中过敏的人数,遗传缺陷、癌症等非传染性疾病 的发病例数;又如大量产品中不合格品出现的次数; 用显微镜观察片子上每一格子内的细菌数;细胞发生 某种变化或细菌死亡的数目等等,都服从或近似服从 Poisson分布。Poisson分布可视为二项分布的特例。 Poisson分布常用于研究单位容积(或面积、时间)内稀 有事件发生数的规律。
神外
291
53
0.75
23.3
18.21
合计
2126
227

100.0
10.7
表 7-1的①~③栏,表9-3第①、②列,都是将分类资料的观察结果,按照 分析的要求,分类汇总统计观察单位数(频数),列出的分类资料频数分布 表。表9-2中第②、③两栏及表9-3第②列的数据都是绝对数。绝对数说明 实际发生的绝对水平,是统计分析的基础。但仅使用绝对数,不能进行比 较分析研究
(2) 进行率的对比分析时,应注意资料有可比性。除 了被研究的因素之外,其余可能影响指标的重要因素 应控制在“齐同对比”的条件下。若两组分类资料的 诊断标准或疗效判断标准不一致,则组间缺乏可比性 ;若两组资料内部构成(如病人的性别、年龄、病程 及病情等)缺乏齐同性,则两个总率也不能直接进行 比较。如果需要直接比较总率,为了消除某一混杂因 素(如年龄,职业,病性等)对观察结果的影响,可作 率的标准化处理。

四格表卡方检验 46页PPT文档

四格表卡方检验 46页PPT文档
相对数:计数资料常用的统计指标, 又
称相对指标(Relation number)
常用相对数
率 构成比 相对比
2019年8月1日
常用相对数
1. 率 (Rate) * 频率指标,表示某现象发生的频率和强度
* 计算公式: 发生某现象的个体数
率= ———————————— × K 可能发生某现象的个体数
( K为比例基数,可为100%或1000‰……等) 如:发病率、死亡率、发生率、阳性率、患病率 、有效率等
成(%) =③/② =④/② =⑤/② =⑤/③
0~ 90319 501 145 11 45.05 5.55 1.61 0.12 2.60
30~ 63223 254 122 12 31.54 4.02 1.93 0.19 5.51
55~ 36584 214 125 15 18.25 5.85 3.42 0.41 7.94
的 2检验。
2019年8月1日
Karl Pearson (1857~1936) 英国统计学家 1901年10月与 Weldon,Galton 一起创办 Biometvika
2019年8月1日
例8-1 某医院收治376例胃脘痛患者,随机分 为两组,分别用新研制的中药胃金丹和西药治疗。 结果如表8-1,探讨两药疗效有无差别。
表8-1 两药治疗胃脘痛的疗效四格表
10
8
6
5.55
4
2
0 0~岁

患病率(0/00)
9.18
4.02
5.85
患病率
30~岁
55~岁
65~岁
2019年8月1日
三、应用相对数应注意的问题
1.分析时不能以构成比代替率

最新《统计学》精品课件07第七章 统计指数

最新《统计学》精品课件07第七章  统计指数

统计把不能直接加总的现象叫不能同度量现象
现实中存在的问题???
研究居民生活水平变动,只算名义收入变动
是不够的。以改革开放以来物价上涨幅度最快的
1994年为例,当年城镇居民人均可支配收入指数
135.6%,同年城镇居民消费价格指数为125%,由
于物价大幅上涨使城镇居民实际消费水平并未同 幅度上涨,实际生活水平只提高了8.5%。
三、统计指数的种类
研究范围
个体指数 k 总指数(狭义指数) k
数量指标指数 质量指标指数 综合指数 平均指数 平均指标指数
统 计 指 数
数量特征
表现形式
对比基期
环比指数 定基指数
第二节
综合指数
一、综合指数的概念
综合指数是用两个时期总量指标对比计算的相 对数。具体来说,凡是一个总量指标可以分解 为两个或两个以上因素时,为观察其中某个因 素的变动程度而将其中一个或一个以上的因素 固定,这种固定了同度量因素的总量指标对比 计算的相对数就叫综合指数。
二、综合指数的编制方法
编制综合指数应解决的基本问题
★ 把现象不能同度量的形态转化成何种能够 同度量的形态? ★ 如何将不能同度量形态转化成能够同度量 形态? ★ 如何消除同度量因素的影响作用? ★ 同度量因素所属时期如何选择?
综合指数编制问题的解决方法
1. 把现象不能同度量形态转化为有广泛综合
性能的价值形态。
综合指数
平均指数
问题导入 某商店经营三种商品销量和价格变动资料
商 品 甲 乙 丙 计量 销 售 量 销售价格(元) 单位 基期 q 报告期 q 基期 p 报告期 1 0 0 台 米 吨 250 1740 120 300 1860 110 180 45 720 184 42 730

研究生统计学讲义第7讲R×C表资料分析-PPT精选文档

研究生统计学讲义第7讲R×C表资料分析-PPT精选文档
例8.1 某中医院收治367例胃脘痛患者,随机分成两 组,分别用新研制的中药胃金丹和西药治疗,结果 如表10.1,探讨两种药物疗效有无差别。
表8.1 两药治疗胃脘痛的疗效四格表
组 别
胃 金 丹组 西 药 组 合 计
有 效
A11=a=271 T11=253.24 A21=c=74 T21=91.76 345(a+c)
表8.1为成组设计(即完全随机设计)的四格表,表中 的基本数据A11,A12,A21,A22分别取271,5,74,26 。本例系两样本率比较,先假设两种药物的疗效相同 ,均等于合计的有效率345/376=91.76% ;据此,胃金 丹组的有效理论数T11=276×345/376=253.24,西药组 的有效理论数T21=100×345/376=91.76;同理,合计 无效率为31/376=8.24%,T12=22.76,T22=8.24
从式(8.3)可以看出2值反映了实际数和理论数吻合的程度。 如果检验假设H0成立,则实际数与理论数之差不会很大,2值 应较小,出现大2值的概率P是很小的,按小概率事件不可能发 生原理,一般应该不会发生。若根据试验结果算出H0成立的2 值为小概率(P≤检验水准α),就怀疑H0成立,因而拒绝H0;若 P>α,则没有理由拒绝H0 。2与P值的对应关系(即分布的规律) 可查附表6,2界值表。
理论数是根据检验假设 H0 来确定的,H0 为比较 的各组处理效果相同,均等于合计的处理效果,据 此推出第 r 行第c 列位置上理论数的计算公式为:
n n n c r c r n T n rc n n n
式中 nr 表示第 r 行的行合计,nc 表示第 c 列的列合 计; n 表示总合计。
2分布具有可加性 ; 2分布常用作某些统计量分布 的近似。 例如,当处理组较多,各处理组样本含量较大时, Kruskal Wallis法的H分布可用2分布来近似。 医学 中2检验是常用的检验方法之一。

RC列联表资料的统计分析.ppt

RC列联表资料的统计分析.ppt

表 8 100 例患者的临床诊断与 CT 诊断结果
临床诊断
患者例数
CT 诊断: Ⅰ级 Ⅱ级 Ⅲ级
Ⅰ级
60
4
2
Ⅱ级
4
12
3
Ⅲ级
3
3
9
当行变量与列变量的性质相同且取值的水平数及 含义也相同时,称这样的RC表为双向有序且属 性相同的RC列联表
双向有序且属性相同的RC表
表9 甲、乙两名医生对200例棉屑沉着病可疑患者的诊断结果
双向有序且属性不同RC表的统计方法
第四个分析目的,希望考察各行上的频数分布是 否相同,此时,将此资料视为双向无序的RC列 联表资料,可根据资料具备的前提条件,选用一
般 检验或Fish2er精确检验。若P<0.05,不能
认为两有序变量之间有相关关系,而只能认为各 行上的频数分布不同
双向有序且属性相同的RC表
双向有序且属性不同的RC表
表 6 不同年龄组中患者的疗效情况
年龄
患者例数
疗效: 痊愈 显效
好转
无效
<40
5
6
3
1
40~49
8
9
8
5
50~59
6
9
8
7
60~
4
6
7
8
当RC表中的两个定性变量,即原因变量与结果 变量都是有序变量,并且它们的性质不同,这样 的列联表称为双向有序且属性不同的RC表
双向有序且属性不同的RC表
表 4 不同药物组中患者的疗效情况
药物
患者例数
类型 疗效: 痊愈
显效
好转
无效
A
5
10
8
7
B

R×C列联表资料的统计分析PPT课件

R×C列联表资料的统计分析PPT课件

二、双向无序RC表的统计分析
c2检验的计算公式
RC
2 i1 j1
2
Aij Tij Tij
v R 1C 1
二、双向无序RC表的统计分析
实例分析
专业
表10 不同专业学生的气质类型分布 例数
气质类型: 多血质 胆汁质 抑郁质
粘液质
计算机 金融 传媒
16
13
7
14
12
15
10
13
18
表 4 不同药物组中患者的疗效情况
药物
患者例数
类型 疗效: 痊愈
显效
好转
无效
A
5
10
8
7
B
4
9
10
7
C
10
12
13
5
在二维列联表中,仅结果变量的取值为有序的, 而原因变量是无序的,由此排列成的RC表称之 为结果变量为有序变量的单向有序RC表
结果变量为有序变量的单向有序RC表
表5 284例受试对象的冠状动脉造影结果
双向有序且属性不同RC表的统计方法
第四个分析目的,希望考察各行上的频数分布是 否相同,此时,将此资料视为双向无序的RC列 联表资料,可根据资料具备的前提条件,选用一
般 检验或Fish2 er精确检验。若P<0.05,不能
认为两有序变量之间有相关关系,而只能认为各 行上的频数分布不同
双向有序且属性相同的RC表
双向有序且属性不同的RC表
表 6 不同年龄组中患者的疗效情况
年龄
患者例数
疗效: 痊愈 显效
好转
无效
<40
5
6
3
1
40~49
8985来自50~5969

RC表卡方检验 卫生统计学方法 教学课件

RC表卡方检验 卫生统计学方法 教学课件

2. 四格表资料的确切概率法
双侧检验:双侧小于等于现有样
本概率的概率值累加。
单侧检验:单侧小于等于现有样
本概率的概率值累加。 根据研究目的和专业知识事先确定。
假定周边合计固定,存在一定近似。 实际情况: 总例数及行合计固定 总例数及列合计固定 行、列合计都不固定
谢谢!
超几何分布
分组 有效 试验组 20
无效 8
合计 28
有效率 (%)
71.43
对照组 2
6
8 25.00
合计 22
14
36 61.11
P(ab)(!cd)(!ac)(!bd)! a !b !c!d!n !
d 0 1 2 3 4 5 6* 7 8
P(d) 0.0 0.0 0.2 0.3 0.2 0.1 0.0 0.0 0.0 106 789 244 168 420 019 229 025 001
2 (|AT|0.5)2
T
χ2值的校正、 χ2检验的条件
χ2检验的条件:
n≥ 40且所有的T值≥ 5时,用普通的χ2检 验
n≥ 40但有1≤ T < 5时,用校正的χ2检验 n< 40或有T < 1时,改用确切概率法
χ2值的校正、 χ2检验的条件
例2
皮肤炎症
防护服种类
阳性例数
阴性例数
合计
特殊类型 31 (51.99) 68 (47.01) 99
合计
94
85
179
TRC
nRnC n
Χ2统计量的计算
2 (AT)2 T
自由度=1
2检验步骤
(1)建立检验假设和确定检验水准
(2)计算检验统计量2值
(3)确定P值和作出统计推断

(完整)R×C列联表资料的统计分析ppt

(完整)R×C列联表资料的统计分析ppt

缓慢心律
患者例数
失常种类 部位: 下壁 前壁 真后壁 心内膜下 合计
窦性过缓
8
7
2
1 18
被动心律
1
1
0
0
2
房室阻滞
6
3
1
1 11
束支阻滞
1
16
1
0 18
合计
16
27
4
2 49
双向无序RC表的统计方法 2 检验
Fisher精确概率法:有1/5以上的格子的 理论频数小于5
结果变量为有序变量的单向有序RC表
四、双向有序且属性不同RC表的统计分析
Spearman秩相关 Spearman 秩相关是一种非参数的度量
相关性的分析方法,它对数据进行秩变换, 然后计算直线相关系数
四、双向有序且属性不同RC表的统计分析
实例分析
表16 某地地方性甲状腺肿病分年龄组的疗效
年龄 疗效: 治愈
例数 显效
好转
无效
11~
35
双向有序且属性不同RC表的统计方法
第四个分析目的,希望考察各行上的频数分布是 否相同,此时,将此资料视为双向无序的RC列 联表资料,可根据资料具备的前提条件,选用一
般 检验或Fish2 er精确检验。若P<,不能认为
两有序变量之间有相关关系,而只能认为各行上 的频数分布不同
双向有序且属性相同的RC表
➢ 第一个分析目的,只关心各组结果变量取值之间的差别是 否具有统计学意义,此时,原因变量的有序性就变得无关 紧要了,可将此时的“双向有序RC列联表资料”视为 “结果变量为有序变量的单向有序RC列联表资料”,可 以选用的统计分析方法有秩和检验、Ridit分析和有序变量 的logistic回归分析
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.不同疗程的疗效比较问题
例8.6 用复方鱼腥草片合剂治疗老年性慢性支气管炎 100个病例,先后共观察两个疗程,结果第一疗程有效 率为60%;第二疗程有效率为75%。本例两疗程资料 为配对资料,这100例可有四种情况:
⑴两疗程均有效;⑵第一疗程有效但第二疗程无效; ⑶第一疗程无效而第二疗程有效;⑷第一、二疗程均 无效。如果整理成表10-5的四格表,其内容并未提供 上述四种情况的数据,无法进行配对χ2检验。
H0:左=右,H1:左≠右。 2=(a-b)2/(a+b)=(55-41)2/(55+41)=2.042

2 0.1(1)

2.71
P>0.1, 可认为内囊出血左右两侧发生率无 差别。
第三节 分层四格表的2M-N检验
例8.4 痛痹胶囊治疗骨性关节炎Ⅱ期临床实验,采用3 个中心随机双盲、双模拟、阳性药平行对照试验法, 将合格受试者以1∶1的比例分配至两组,临床试验在3 家医院同时进行,每个试验中心各等比例完成50例,4 周±3天血常规异常者清单结果如表10-8。试分析两组 药物及中心效应。
2分布的常用性质:
2分布具有可加性 ; 2分布常用作某些统计量分布 的近似。
例如,当处理组较多,各处理组样本含量较大时,
Kruskal Wallis法的H分布可用2分布来近似。 医学 中2检验是常用的检验方法之一。
第一节 一般四格表的2 检验
一、 2 检验的基本思想
2 检验的基本思想是衡量实际频数(actual frequency)和理论频数(theoretical frequency)之间的偏 离度。检验统计量的意义和算法可用基本公式来说明
理论数是根据检验假设 H0 来确定的,H0 为比较 的各组处理效果相同,均等于合计的处理效果,据 此推出第 r 行第c 列位置上理论数的计算公式为:
Trc

nr n

nc n
n

nr
nc n
式中 nr 表示第 r 行的行合计,nc 表示第 c 列的列合 计; n 表示总合计。
例8.1 某中医院收治367例胃脘痛患者,随机分成两 组,分别用新研制的中药胃金丹和西药治疗,结果 如表10.1,探讨两种药物疗效有无差别。
0.6735 ×376=253.24
西药组的有效理论数T21=100×345/376=91.76; 同 理 , 合 计 无 效 率 为 31/376=8.24% , T12=22.76, T22=8.24。
表8.1为成组设计(即完全随机设计)的四格表,表中
的基本数据A11,A12,A21,A22分别取271,5,74,26 。本例系两样本率比较,先假设两种药物的疗效相同
253.24 22.76 91.76 8.24
=56.77
按自由度df=1查附表2,2界值表,20. 05(1) =3.84, 因2>20.05(1) ,P<0.05,按α=0.05水准拒绝H0,认为 两药治愈率不同。
例8.2 某中医院将71例血栓闭塞性脉管炎Ⅲ期2~3级患
者随机分成甲、乙两组,甲组用活血温经汤,乙组用
(a b)(c d )(a c)(b d )
二、 一般四格表的 2 检验
对例8.1求解
本例H0:即两组疗效相同;H1:即两疗效不相同。
α=0.05。
2 (A T )2
T ( 271 253.24 5 22.76 74 91.76 26 8.24)
数)T12= 9×33/71=4.18,因有理论数1<T<5,n>40, 用式(10.8)计算校正2值:
2 n( ad bc n / 2)2
(a b)(c d )(a c)(b d )
71( 26 2 7 36 71/ 2)2

2.75
33 38629
2.配对四格表资料的独立性 2 检验 H0为配对的两种 属性相互独立,彼此无关。目的是推断配对的两种属 性(因素)是否有关。独立性的对立面就是相关,配对 四格表的独立性检验即行列属性的相关性检验。在配 对两法相关即不独立时,可认为差异无统计意义。在 配对两法无相关即独立时,可认为差异有统计意义。 统计量仍用四格表的 2 检验公式(见表10.3),如两种 属性有关,可进而确定关系的密切程度。
第八章 RC表资料的分析
整理分类资料时,通常将分类频数排成R行C列的 表格方式表达,称为RC列联表(R×C contingency table),简称R×C表(R×C table)。RC表资料常用 2检验。本章我们从2统计量的分布讲起,介绍多种 RC表资料的检验方法。
预备知识 2分布
表8-7是分层四格表,如使用SPSS11.5统计软件:以 分组、疗效、中心,建立数据文件L10.8.sav以后,
表8.1 两药治疗胃脘痛的疗效四格表
组别
有效
胃金 丹组
西药 组
合计
A11=a=271.76
345(a+c)
无效
A12=b=5 T12=22.76 A22=d=26 T22=8.24 31(b+d)
Trc

nr
nc n
合计
276(a+b)
100(c+d)
(4) 四格表 2 检验法不宜用于数据中有零的资料,此 时误差很大,宜改用确切概率法
第五节 McNemar和kappa检验
1.配对四格表 两分类变量配对设计时,例如,同 一对象接受两种处理,同一血样经甲乙两法化验, 或同一患者经治疗前后两次检查等,每一对象的计 数情况有四种可能:即甲(+)乙(+),甲(+)乙(-),甲(-) 乙(+),甲(-) 乙(-) 。对于这类配对设计资料排成的四 格表,称之为配对四格表,以区别不反映配对关系 的四格表。
定义 如果u1,u2,...,un是n个相互独立的标准正 态变量,则称随机变量
2 = u12 +u22 +...+un2 服从自由度为df=n的2分布(2-distribution)。
2 分布曲线偏向左边,随自由度df的不同而不同, 自由度越小越偏,自由度相当大时,2分布曲线接近 正态分布曲线。
本例若不用校正2,则2=4.06,查2界值表,得
P<0.05,可见未校正的P值偏低,将得出相反的结论
四格表2检验的注意事项 (1) 2近似计算法种类很多,式(10.3)是2检验的
基本公式,式(10.6)是由式(10.3)推导出的四格表专有 公式。由于2界值表是以正态分布为基础的连续性理
,均等于合计的有效率345/376=91.76% ;据此,胃金
丹组的有效理论数T11=276×345/376=253.24,西药组 的有效理论数T21=100×345/376=91.76;同理,合计 无效率为31/376=8.24%,T12=22.76,T22=8.24
从式(8.3)可以看出2值反映了实际数和理论数吻合的程度。 如果检验假设H0成立,则实际数与理论数之差不会很大,2值 应较小,出现大2值的概率P是很小的,按小概率事件不可能发 生原理,一般应该不会发生。若根据试验结果算出H0成立的2 值为小概率(P≤检验水准α),就怀疑H0成立,因而拒绝H0;若 P>α,则没有理由拒绝H0 。2与P值的对应关系(即分布的规律) 可查附表6,2界值表。
4.左右两侧比较的 2 检验 体内有些器官可分为左右两 部分,在自然的正常状态下,左右大多是对称的,可 是由于解剖、生理、病理等原因,某些改变在左右两 部分受累的概率并不均等。左右两侧比较可使用2检 验。如以a、b分别代表左右两侧的实际频数,则: 2 =(a-b)2/(a+b) ,df=1
例8.8 某医院神经科对近三年收治的96例内囊出血病 人的发生部位进行分析,结果发生于左侧者为55例, 右侧者4l例,试问内囊出血是否好发在左侧?
用2α(df)表示自由度为df时α水准的2界值,P(2 >2α(df)) =α表示自由度为df时,2值大于界值2α(df)的 概率为α。本书附表列出了按P(2>2α(df))=α编制的单 侧2界值表。 例如,直接查附表,得单侧2界值20.05 (5) =11.07,它表 示自由度df=5时,2值大于11.07的概率为0.05,即 P (2>11.07) =0.05 .显然,P (2<11.07) =0.95 。
376(n=a+b +c+d)
有效 率
98.19 %
74.00 %
91.76 %
胃金丹组占据部分
n1. 276 0.7340 n 376
两组合计有效率
n.1 345 0.9176 n 376
0.7340×0.9176=0.6735
假设两种药物的疗效相同,那么我们期望全部观察 值中胃金丹组的理论有效率是67.35%.总的观察数是 376,而胃金丹组的期望有效数就是.
表8-3 四格表2检验统计量的计算公式
基本公式
专有公式
校正公式 专有公式 的校正
( A T )2 T
n(ad bc)2
n≥40 ,T≥5
(a b)(c d )(a c)(b d )
( A T 0.5)2
n<40且1<T<5
T
n( ad bc n / 2)2
通塞脉1号治疗,结果如表10-4。问两药的疗效有无差
别?
表8-4 两组疗效比较
组别
有效人数 无效人数 合计
通塞脉1号
26
7
33
活血温经汤
36
2
38
合计
62
9
71
H0:即两组疗效相同;H1:即两疗效不同。α=0.05 如无统计软件,先计算理论数,本四格表最小理
相关文档
最新文档