第9章.卡方检验
医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
卫生统计学-第九章 卡方检验

11
2检验的基本思想
• 如果H0成立,则男女生感染率的差异仅是抽样误
差引起的,相差不会太大,由此而计算出来的T与 A也不会相差很大,即2值不会相差很大
• 如果两样本率相差过大,即T与A相差较大,2值
也会相差较大,相应的P值也就越小。
• 因此,由实际样本资料求得一个较小的P,而且
P≤,就有理由怀疑H0的真实性,因而拒绝H0,
18.55
66.45
(3)确定自由度和P值
四格表的自由度=1,卡方界值为3.84 卡方值>卡方界值,所以 P<0.05
(4)作出推断性的结论
按α =0.05水准,拒绝H0,接受H1,可认为该小学男女生 蛔虫感染率不同,男生的感染率高于女生.
18
四格表除了可用基本公式外,更多用四格表专用公 式计算卡方值.
假设四格的数字分别为a,b,c,d,如图,
则用下式来计算卡方值:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
23 57 a 13 72
此式不必计算理论数,比较方便,结果也更为准确.
19
某小学男女生蛔虫感染率的比较
• 实际工作常用于检验两个或多个样本率及构成比
之间差别有无统计学意义,两种属性或特征之间 是否有关系以及拟合优度检验等。
5资料的2检验 • RC表的2检验 • 配对四格表的2检验 • 精确概率法
6
§1 2检验的基本思想
例:某小学男女生蛔虫的感染率如下表,试判断男女 蛔虫感染率是否有差别?
从而作出接受H1的统计推断;如果P>,则没有
理由拒绝H0。
12
性别 男 女 合计
虫卵阳性人数 阴性人数 合计 感染率(%)
卡方检验解释

第一步:输入数据(略)
第二步:指定频数变量:weight cases—人数
第三步:crosstabs过程(略)
(三)结果解释:(P265)
1、value:检验统计量值
2、asymp.sig.2-sided:双侧近似概率
3、exact sig.2-sided:双侧精确概率
4、exact sig.1-sided:单侧精确概率
1、tables模块:即custom tables菜单
可以为多选题生成各种复杂的频数表和交叉表,并计算表中各种比例指标。
2、optimal scaling过程:
用于非线性典型相关法(OVERALS)对多选题数据进行最优尺度分析(多重对应分析)。
3、multiple response菜单:
专门为多选题数据的描述而设计,用于生成频数表和交叉表。
(2)列(columns):用于选择行*列表中的列变量
(3)层(layer):用于设置分层分析变量
(4)显示分组条形图(display clustered bar charts):可以直观反映各单元格内频数的多少。
(5)压缩表(suppress table):禁止在结果中输出行*列表
2、exact对话框(略):
用于设定针对2*2以上行*列表是否进行确切概率的计算,以及具体的计算方法。
(1)Asymptotic only:只计算近似的概率值,不计算确切概率
(2)montecarlo:采用蒙特卡罗 模拟方法计算确切概率值。
即进行10000次抽样,给出确切概率以及99%可信区间。(默认值可以更改)
(3)exact:计算出确切的概率值
如:要了解病人采用了那些非药物方法来控制高血压,问题如下:
《医学统计学》医统-第九章卡方检验

卡方值
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,编辑课横件 轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α=0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
医学统计学
第九章 2检验
公共卫生系 流行病与卫生统计学教研室
祝晓明
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
❖自由度ν愈大,χ2 值也会愈大;所以 只有考虑了自由度ν的影响,χ2 值才
能正确地反映实际频数A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两 列,ν=1,即在周边合计数固定的情况下,4个基
本数据当中只有一个可以自由取值。
编辑课件
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
2
(20 25.77)2
(24 18.23)2
(21 15.23)2
(5 10.77)2
8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
编辑课件
纵高
3.确定P 值,作出推断结论
0.5
0.4
0.3
自由度=1
医学统计学 -第09章 卡方检验

0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,
第九章 卡方检验

2
T
离散用连续近似
2 ( ad bc n / 2)2 n
(a b)(c d )(a c)(b d )
注:(1)这种校正称为连续性校正。 (2)如检验所得P值近于检验水准α时, 最 好改用四格表确切概率法。
例 9-3 将病情相似的淋巴系肿瘤患 者随机分布两组,分别做单纯化疗与复 合化疗,两组的缓解率见表9-4,问两疗 法的总体缓解率是否不同?
2分布
如果Z服从标准正态分布,那么Z2服从自 由度为1的 2 分布,其分布图见156。
如果Z1,Z2,…,Zv是v个独立的标准正
态分布随机变量,
z12
Z
2 2
Zv2
的分布
服从自由度为v的 2 分布。
1.962=3.84
例9-2 具体步骤
建立检验假设
H0:1=2 假设两药的愈合率相同 H1:12 假设两药的愈合率不同
第二节 独立样本2×2 列联
表资料的2检验
提出问题
研究目的:比较洛赛克与雷尼替丁疗效有无差 别?
能否说明洛赛克比雷尼替丁效果好?
已知
≠ P1=75.29%
P2=60.71%
推断
π1
?
π2
2 检验的基本思想
假设: 洛赛克与雷尼替丁治疗消化道溃疡的效果相同。
1 2
计算两组合计的愈合率为68.05%(即115/169) 作为 总体率的估计
3 确定P值,做出结论
查附表,
2 0.1(1)
2.71
2.64 2.71, P 0.1
按 0.05 的水准下,不能拒绝H0,即差别无 统计学意义。还不能认为两种方案的总体缓概率
第9章卡方检验

当n较小时,则可以利用校正的u检验:
| p1 p2 | (1 / n1 1 / n2 ) / 2 uc Nov 24,2009 S p1 p2
例9-3 考察某市2000年城乡居民的卫生服 务需求,以近两周病患病情况作为调查指 标。分别在城区和农村进行了抽样调查, 其中城区调查了660人,有90人近两周患病, 农村调查了640人,有140人近两周患病, 问两组人群的两周患病率是否相同?
二、正态近似法 当n较大,总体率 既不接近0也不 接近1,n和n (1-)均大于5,二 项分布近似正态分布,利用正态分 布的原理,计算检验统计量u值作假 设检验。
u
Nov 24,2009
p 0
p
p 0
0 (1 0 ) / n
例9-2 已知一般人群中慢性支气 管炎患病率为9.7% ,现调查了500 名吸烟者,其中有95人患慢性支气 管炎,试推断吸烟人群中慢性支气 管炎患病率是否比一般人群高?
Nov 24,2009
一、四格表资料的2检验
2检验的基本思想
组别 阳性数 阴性数 合计
I组
II组 合计
a
c a+c=n.1
b
d b+d=n.2
a+b=n1.
c+d=n2. a+b+c+d=n
Nov 24,2009
基本步骤
1、建立假设 H0:城乡居民的两周总体患病率相同 即1=2= H1:城乡居民的两周总体患病率不同 即1≠2, α=0.05
b
d b+d=n.2
a+b=n1.
c+d=n2. a+b+c+d=n
(ad bc) n (a b)(c d )(a c)(b d )
第9章 非参数检验

9.7多个独立样本比较秩和检验
1.多组计量资料的非参数检验
对于多组计量资料不服从正态性、方差齐性条件或 经转换后也不满足,则采用H检验法
例9-8研究白血病时,测定四组鼠脾DNA的含量,结 果如下表,分析各组DNA含量有无差别?(α=0.05)
正常脾
12.3
患自发性白血病的脾 10.8
患移植白血病的脾(甲组) 9.3
列联表(二维列联表按两个属性分类的表)分类: 1)双向无序表(检验法:Pearson卡方检验) 2)双向有序表(检验法:McNemar检验、Kappa检验) 3)单向有序表(等级资料,检验法:非参数检验)
Guiyang College of Traditional Chinese Medicine
例9-7《成都中医药大学学报》2004年第2期《益 心钦口服液治疗冠心病心率失常的疗效》一文, 调查数据如下表,判断其疗效与对照组是否相同? (α=0.05)
Guiyang College of Traditional Chinese Medicine
2.等级资料两样本比较秩和检验
医药学研究中的等级资料: 1)疗 效: 痊愈、显效、有效、无效、恶化 2)化验结果: - ++ +++ 3)体格发育: 下等、中下、中等、中上、上等 4)心功能分级:I、II、III… 5)营养水平: 差、一般、好
1959 30.5 1969 11.8
1960 24.5 1970 12.4
Guiyang College of Traditional Chinese Medicine
SPSS操作步骤
1)建立数据文件:变量名为x 2)Analyze→Nonparametric Tests→Runs,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
理论 实际 比率 比率
r:s
a:b
2 (ra sb)2
rs(a b)
捷算公式
自由度
2
(a b)2 (a b)
(当r : s
1:1时)
2-1=1
r:s:t a:b:c
2 (r s t)(sta2 rtb2 rsc 2 )
rst(a b c) (a b c)
2)数学模型的拟合:
例:青虫菌液对菜青虫防治效果试验,观察喷药后天数与死亡的菜 青虫个数的关系:
喷药后天数(t) 1 2 3 4 5 6 7 8 9 10 11
菜青虫头数(y) 28 32 40 48 57 68 81 98 191 142 116
理论值
28.6 34.1 40.7 48.6 57.9 69.1 82.4 98.4 117.3 139.9 167.0
差异性检验,其作用与t-检验、F-检验 等相似。
9.2 2 -分布
2 -分布由Helmert(1875)发表,Karl
Pearson(1898)重新发现。
2 的定义:标准正态分布中那些相互独立
的随机变量的平方和。
n
N(, 2)
n
n
_
_
( x x)2
(x x)2
2
2
0.05 0.01
[3] 2 的计算:
1)基本公式
2
(n
1)S 2
2
2-检验的初衷是检验样本方差与总体方差是否有差异。
例:某厂生产的某种细纱支数的标准差为1.2,从某日生产 的一批产品中,随机抽16缕进行支数测量,求得标准差为 2.1,设细纱支数服从正态分布,问细纱的均匀度有无显 著变化(α=0.05)?
y 23.9691.193t
y 200
150
100
50
0
0
5
10
t 15
3)理论比率模型的检验
例如在华南农大的学生中抽取100名,其中 男生60名,是否符合1:1这个理论比率模 型?
[2]独立性检验:一种列联表检验方法。通 过求取理论频数,然后由实际频数与理论
频数求取 2 值,进行两组或多组数据的
第九章 2 --检验
9.1 问题的提出
9.2 2 -分布 9.3 2-检验
9.4 适合性检验 9.5 独立性检验
9.6 Yates’ 2值的连续性校正
9.1 问题的提出
2 -检验是把统计量
2
-分布的知识运用
于离散型随机变量(次数资料)的一项分析
方法
[1]适合性检验
1)概率分布的理论拟合:如第4章章中的实际 频数配合二项分布、Poisson分布、正态分 布理论频数的拟合。
2
_
(n
1)S 2
2
, (因:
S
2
(x x)2 )
n 1
x1 x2 xn
zi
xi
, zi2
( xi )2 ,,
2
zi2
( xi )2
统计量 2的定义
_
以 x 估计
2
(n
1)S
2
2
2 2 -分布的概率密度函数和累积分布函数:
f (2)
e k 1 22
2 2
2
k 2
(
k
)
,(0
2
)
2
F ( 2 )
P( 2)
2
n 2
(
1 n
1)!
j
(
2
)
(
n 2
1)
2
e 2
d 2
2
2 -分布的形状
0.6 df 2
0.5
df 3
0.4
0.3
df 4
0.2
df 5
3-1=2
r:s: a:b: t:u c:d
2 (r s t u)(stua2 rtub2 rtuc2 rstd 2 )
rstu(a b c d) (a b c d)
[1]理论比率模型检验(外因模型)
H 0 : Oi Ei
2
(Oi Ei )2 Ei
df k 1
k : 属性的个数
例:在华南农大的学生中抽取100名,其中男生60名, 是否符合1:1这个理论比率模型?
解:H0 : Oi Ei
尽管df 1,但由于n 100,所以不用连续性校正
2
(Oi Ei )2 (60 50)2 (40 50)2 4
Ei
50
50
2 0.05
(df
1) 3.841, 2
2 0.05
,
学生不符合
Oi Ei 60 50 40 50
1:1的理论比率模型(P 0.05)
例:P138-139例9.2
常见比率模型及 2 值捷算公式
0.1
0
0
5
10
15
9.3 2 -检验
[1]原假设H0视具体情况而定 [2]临介值:(表C3,P223)
p( 2 2 )
2
f ( 2 )d 2
2
2 0.05
: 差异不显著;
2 0.05
2
2 0.01
:
差异显著;
2
2 0.01
: 差异极显著
实际值与理论值之间的偏差的判据,这时:
2
(实际值 理论值)2 理论值
k i 1
(Oi
Ei )2 Ei
当df>1时,上式的 2 值才与 2 -分布较为接近,如df=1, 与 2 -分布相去甚远,需作连续性校正,校正公式为(
yates’ correction for continuity):[n<30时,才需校正]
2 k ( Oi Ei 0.5)2
i 1
Ei
9.4 适合性检验(test of goodness of fit)
2 适合性检验的统计假设
H0 : Oi Ei , H1 : Oi Ei
2 适合性检验有两种类型:外因模型和内因
模型。外因模型的检验是没有总体参数需估计的 情况,其自由度的个数df=k-1。而内因模型至少 有一个参数未知需要估计,其自由度的个数df=k1-j,其中j为总体参数的个数。
H0 : 2 1.22
2 (n 1)S 2 (16 1) 2.12 45.9
2
1.22
2 0.05
(d
f
n
1 15)
ቤተ መጻሕፍቲ ባይዱ
24.996
2
2 0.05
,
否定H
0
,
细纱的均匀度发生了显著的变化(
p
0.05)
2)Pearson(1899)发现, 2 值可作为离散型随机变量的