简述 x2 检验的注意事项。
医学统计学名词解释及问答题

医学统计学名词解释及问答题1、总体(population ):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation ):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic ):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error ):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability ):某事件发生的可能性大小。
9、正态分布(normal distribution ):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical referenee range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(varianee ):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation ):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用b 表示。
15、标准误(standard error ):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean ):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing ):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
第五章 χ2检验

χ2的连续性矫正
由上式计算的 χ2 只是近似地服从连续型随机变 量 χ2 分布。在对次数资料迚行χ2 检验利用连续型随 机变量χ2分布计算概率时,常常偏高,特别是当自 由度为1时,偏差较大。
矫正后的χ2值记为χc2
当自由度大于1时, χ2分布与连续型随机变量
χ2分布相近似,这时,可不作连续性矫正,但要
总和
r1 r2
总和
R1= O11 + O12 R2= O21 + O22
C1= O11 + O21
C2= O12 + O22
T
给药方式与给药效果的2×2列联表 给药方式
口服 注射
有效
58 64
无效
40 31
总数
98(R1) 95(R2)
有效率
59.2% 67.4%
总数
122(C1)
71(C2)
193(T)
1.H0 :给药方式与给药效果相互独立。
HA :给药方式与给药效果有关联。
2.给出显著水平α=0.05
3.计算各个理论数 Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05 E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
本章内容
一、离散型数据 x2 统计量和 x2分布 二、拟合优度检验 三、独立性检验
拟合优度检验 (吻合度检验)
理论数可以通过一定的理论分布或某种学说 推算出。用实际观察数与理论数直接比较,从而得
出两者之间是否吻合,这一类检验称为吻合度检验。
独立性检验
分析两类因子是相互独立还是彼此相关。理论 值的推算没有什么理论或学说作依据,这时可假设 观察的各属性之间没有关联,然后证明这种无关联 的假设是否成立。这种检验称为独立性检验。
卡方检验

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
第7章 x2检验

例7-3:某实验室采用两种方法对58名可疑 红斑狼疮患者的血清抗体进行测定,问:两 方法测定结果阳性检出率是否有差别?
表7-3 两种方法的检测结果 免疫荧光法 + - 乳胶凝集法
合计
+ 11(a) 2(c) 13
- 12(b) 33(d) 45
合计 23 35
58
检测结果一致: (a)免+乳+ ,(d) 免-乳检测结果不一致:(b) 免+乳- , (c)免-乳+ 比较两种检测方法有无差异时,只需比较不一致的 结果 。
感染率 18.18 45.45 27.27
一、基本思想
1.各组合概率Pi的计算 周边合计不变的条件下,表内4个实际频数 变动的组合数共有“周边合计中最小数+1”
表7-4 两组新生儿HBV感染率的比较 组别 阳性 阴性 合计 感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计 9 24 33 27.27
公式:
b c 40
2 ( b c ) 2 x , bc b c 40
v 1
(7 7)
(| b c | 1) x , bc
2 2
v 1
(7 8)
1.建立检验的假设,确定检验水准 H0:b=c ;H1:b c =0.05 2.计算 χ2 统计量
b+c=2+12=14<40
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
2.累计概率P的计算 1)单侧检验:现有样本四格表及其以左的所 有四格表组合的累积概率为左侧概率(PL); 现有样本四格表及其以右的所有四格表组合的 累积概率为右侧概率(PR)。 H1为π1>π2,则P单侧 =PR; 若H1为π1<π2,则P单侧=PL 2.双侧检验: 计算满足Pi ≤P*条件下的各种组合之四格表 的累计概率。
X2检验——精选推荐

X2检验第七章 X2检验Chi-square testX2分布——计数资料第⼀节四格表资料的X2检验⼀、X2检验的基本思想1、X2分布(1)X2分布是⼀种连续型分布:X2分布(chi-square distribution)只有⼀个参数,即⾃由度。
当⾃由度V《2时,曲线呈L形随着V的增加,曲线逐渐趋于对称当⾃由度V—00⽆穷时,X2分布趋近正态分布(2)X2分布的⼀个基本性质是它的可加性:(X1+X2)——X2 (V1+V2)(3)X2 分布的界值:X2值愈⼤,P值愈⼩;反之,X2值愈⼩,P值愈⼤。
2、X2检验的基本思想四格表(fourfold table)资料PearsonX2——X2={Σ(A-T)2/T } V =(⾏数-1)(列数-1)A为实际频数(actual frequency)T为理论频数(theoretical frequency)——根据检验假设H0:π1=π2确定的。
T(RC)=nRnC/nT(RC)为第R⾏(row)第C列(column)的理论频数,nR为相应⾏的合计,nC为相应列的合计,n为总列数。
X2值反映了实际频数与理论频数的吻合程度。
3、X2检验的步骤H0::π1=π2,即试验组与对照组——总体有效率相等H1::π1≠π2,即——————————————不等ɑ=0.05——T值——V——P值⼆、四格表资料X2检验的专⽤公式X2=(ad-bc)2n/(a+b)(a+c)(d+b)(d+c)a,b,c,d为四格表的实际频数;(a+b)(a+c)(d+b)(d+c)是周边合计数;n为总例数,n=a+b+c+d. 四格表资料X2检验的校正公式三、X2C=(Iad-bcI-n/2)2n/(a+b)(a+c)(d+b)(d+c)(1)当n》40且所有的T》5时,⽤X2检验的基本公式或四格表资料X2检验的专有公式;(2)当n》40但有1《T《5时,⽤四格表资料X2检验的校正公式。
x2检验 医学统计学

基本思想
所谓两属性X和Y互相独立,是指属性X的概 率和属性Y的概率分布无关,否则称这两种 属性之间存在关联性。即
ij
ri cj
( nri n
)( ncj n
)
Tij
n ij
nri ncj n
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立
α=0.05
2. 计算检验统计
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理
有效例数
无效例数
合计
有效率(%)
A药 B药 合计
68(64.818)a 52(55.182)c
120 (a+c)
6(9.182)b
74 (a+b)
11(7.818)d
63 (c+d)
17 (b+d)
137 (n=a+b+c+d)
91.89 82.54 87.59
P=0.01, x2 =6.63 ▪ P=0.05时, v=1, x2 =3.84
v=2, x2 =5.99
四格表χ2检验公式
当n≥40,T≥5时
2
( ARC TRC )2 TRC
2
ad bc2 n
a ca bc db d
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
为两组疗效之间的差异有统计学意义。
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
配对四格表χ2检验
▪ 一般形式
甲属性
乙属性
x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19 24 43 44.2 化疗加放疗组34 10 44 77.3合计53 34 87 60.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
x2检验

2
A T
2
T 411.25 19.81 20.58 297.59
321 41.25
2
444 358.15
358.15
2
4.
v=(3-1)(4-1)=6, 则P<0.05,拒绝H0,认为三个地区的人群血型分布构成不同或不全相同。 查χ2界值表
服从x2分布,计算出x2值后,查表判断这么大的 x2是否为小概率事件,以判断建设检验是否成立。
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2
( / 21)
e
2 / 2
Ý ß ×·
×Ó ¶ £ 1 Ô É È ½
0.2 0.1 0.0 0 3
3.84
×Ó ¶ £ 2 Ô É È ½ ×Ó ¶ £ 3 Ô É È ½ ×Ó ¶ £ 6 Ô É È ½
P=0.05的临界值
7.81 12.59
6
9 12 ¿ ·Ö ¨½ µ
15
18
自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
计数资料的统计推断
教师:数学统计教研室
胡冬梅
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,是分类 计数资料的假设检验方法,可用于两个 或多个率间或构成比之间的比较,计数 资料的关联度分析,拟合优度检验等等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简述 x2 检验的注意事项
引言
x2 检验(Chi-Square Test)是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在相关性。
它是统计学中最常用的非参数检验之一,通常适用于已知样本的多个标称变量之间的关系推断。
在进行 x2 检验时,有一些注意事项需要被考虑。
注意事项一:样本量要求
在进行 x2 检验时,每个分类变量的样本数量应该足够大,以确保结果的有效性。
通常,每个分类变量的样本数量应不少于5。
注意事项二:数据类型
x2 检验通常适用于标称变量,即具有无序分类的变量。
因此,在进行 x2 检验之前,需要将待分析的变量进行适当的编码或转换,以确保其符合 x2 检验的前提条件。
注意事项三:独立性假设
x2 检验的基本假设是各个分类变量之间的无关性,即独立性假设。
在进行 x2 检验前,需要对该假设进行明确的说明,并确认其是否合理。
注意事项四:数据整理
在进行 x2 检验之前,需要对数据进行适当的整理和汇总。
通常,可以使用交叉制表(cross-tabulation)的方法,将不同分类变量的数据整理为一个列联表(contingency table)。
这样可以方便计算各个分类变量之间的卡方值和 p 值。
注意事项五:计算结果的解读
x2 检验的计算结果包括卡方值和 p 值。
卡方值用于衡量观察值与期望值之间的差异程度,而 p 值表示了观察到的差异在统计学上的显著性。
通常,较大的卡方值和较小的 p 值意味着分类变量之间存在显著的相关性。
注意事项六:多重比较问题
在进行多个分类变量之间的 x2 检验时,需要注意多重比较问题。
如果进行了多个检验,需要对 p 值进行校正,以控制整体的错误率。
注意事项七:样本的代表性
在进行 x2 检验时,样本的代表性非常重要。
样本应该可以代表总体,并且应该从总体中随机选择,以减少选择偏倚和非随机误差的影响。
注意事项八:结论的谨慎性
x2 检验只能判断分类变量之间是否存在相关性,不能确定因果关系。
因此,在得出结论时应保持谨慎,并考虑其他变量和因素的可能影响。
结论
x2 检验是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在相关性。
在进行 x2 检验时,需要注意样本量的要求、数据类型、独立性假设、数据整理、计算结果解读、多重比较问题、样本的代表性以及结论的谨慎性。
只有在遵守这些注意事项的前提下,才能保证 x2 检验的有效性和可靠性。