第7章 x2检验.

合集下载

第七章X2检验

第七章X2检验

第七章X2检验第七章X2检验X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。

一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。

两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。

造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。

为了区别这两种情况,应当进行X2检验。

其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。

将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。

2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。

即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。

上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。

当H0被拒绝时,就意味着接受其对立假设即备择假设H1。

此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。

一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。

3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。

计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。

用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。

后者为81.25人。

然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。

计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。

x2检验——精选推荐

x2检验——精选推荐

x2检验本章重点1.熟悉x2检验的基本思想。

2.掌握x2检验在四格表资料、行×列表资料中的应用。

3.掌握配对计数资料的x2检验。

χ2 检验是一种用途广泛的假设检验方法,本章只介绍它在分类变量资料中的应用: χ2 检验的适用范围:1.推断两个或两个以上总体率或构成比之间有无差异;2.配对计数资料差异的显著性。

检验统计量:χ2应用:计数资料第一节 四格表资料的χ2 检验目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料一、四格表资料的基本公式x2检验基本思想检验“实际数”和假设“理论数”的差异是否是由于抽样误差引起(两个样本率的差异体现在“实际数”和假设“理论数”的差异中)。

实际数,用四格表表示,称为四格表资料,分别为a 、b 、c 、d ,其他的数据是从这四个实际数推算出来的,称为理论数(表中括号内的数据)。

实际数用A 表示,理论数T 表示。

A :表示实际频数,即实际观察到的例数。

T :理论频数,即如果假设检验成立,应该观察到的例数。

TRC :第R 行C 列的理论频数nR :相应的行合计,nC :相应的列合计n 为总例数检验统计量χ2 值反映了实际频数与理论频数的吻合程度。

Χ2检验是检验实际数与理论数差异程度的指标。

A 与T 的值越接近, χ2越小,相反,实际数与理论数之间的差数越大, χ2值也就越大。

所得χ2值如果小于界值的χ2,P>0.05,即接受了原假设,可认为两组人群的治疗效果差异无统计学意义。

反之,如果所得χ2值大于查表所得χ2值,则P<0.05,即差异有统计学意义。

自由度计算公式Χ2值的大小,除了取决于A-T 的差值外,还取决于格子数的多少,格子数越多, χ2值越大,只有排除了这种影响, χ2值才能正确反映A 与T 的吻合程度,因此,在查χ2表时,要考虑自由度的大小。

22(), ()(1)A T Tχν-=∑=-行数-1列数 R C RC n n T n=计算公式:V=(行-1)(列-1) 四格表资料由2行2列组成,V=(2-1)(2-1)=1自由度即自由变动的范围,由于四格表周边的合计数已经固定,因此只要算出任一格的理论数,其余三个格子的理论数就没有自由变动的余地了,四格表的自由度V=1。

第七章 列联表资料的X2检验

第七章   列联表资料的X2检验
3对于有序的rc表资料不宜用x检验五交叉分类22表的关联分析检验2列联系数r六22配对资料的关联性分析检验注意与配对资料的四格表x检验mcnemar检验不一样是四格表资料x检验基本的公式2列联系数r七rc表资料的关联性检验检验2列联系数r检验推论结论为拒绝接受时只能认为各总体之间总的来说有差别需要对每两个总体率之间有无差别作出判断
• 3、观察结果: 四种形式 ⑴、甲+乙+ a ; ⑵、甲+乙- b; ⑶、甲-乙+ c ; ⑷、甲-乙- d。 • 4、配对资料的专用四格表 • 5、计算公式:McNemar test ⑴、专用公式:b+c>40 P107,式(7-7) ⑵、校正公式:b+c<40 P107,式(7-8) 6、注意事项:⑴、要求资料为配对的计数资 料;⑵要注意配对资料的四格表X2检验的适用 条件
对理论频数太小有以下三种处理办法: A、最好增加样本含量,以增加理论频数。 B、删去上述理论频数太小的行或列。 C、 将太小理论频数所在的行或列与性质相近 的邻行或邻列的实际频数合并。 (2)、当进行多个样本率(或构成比)比较 的X2检验,结论为拒绝检验假设H0时,只能 认为各总体率(或构成比)之间总的来说 有差异,但不能说它们彼此间有差异或某 两个间有差别,还需进一步进行两两比较。 (3)对于有序的R*C表资料不宜用X2检验
(五)、交叉分类2*2表的关联分析
1、 X2检验 2、列联系数r
(六)、2*2配对资料的关联性分析
1r检验)不一样,是四格表 资料X2检验基本的公式 2、列联系数r
(七)、R*C表资料的关联性检验
1、 X2检验 2、列联系数r
(八) 多个样本率比较的X2分割法
(四)、行×列表资料的X2检验

第7章 x2检验

第7章 x2检验

例7-3:某实验室采用两种方法对58名可疑 红斑狼疮患者的血清抗体进行测定,问:两 方法测定结果阳性检出率是否有差别?
表7-3 两种方法的检测结果 免疫荧光法 + - 乳胶凝集法
合计
+ 11(a) 2(c) 13
- 12(b) 33(d) 45
合计 23 35
58
检测结果一致: (a)免+乳+ ,(d) 免-乳检测结果不一致:(b) 免+乳- , (c)免-乳+ 比较两种检测方法有无差异时,只需比较不一致的 结果 。
感染率 18.18 45.45 27.27
一、基本思想
1.各组合概率Pi的计算 周边合计不变的条件下,表内4个实际频数 变动的组合数共有“周边合计中最小数+1”
表7-4 两组新生儿HBV感染率的比较 组别 阳性 阴性 合计 感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计 9 24 33 27.27
公式:
b c 40
2 ( b c ) 2 x , bc b c 40
v 1
(7 7)
(| b c | 1) x , bc
2 2
v 1
(7 8)
1.建立检验的假设,确定检验水准 H0:b=c ;H1:b c =0.05 2.计算 χ2 统计量
b+c=2+12=14<40
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
2.累计概率P的计算 1)单侧检验:现有样本四格表及其以左的所 有四格表组合的累积概率为左侧概率(PL); 现有样本四格表及其以右的所有四格表组合的 累积概率为右侧概率(PR)。 H1为π1>π2,则P单侧 =PR; 若H1为π1<π2,则P单侧=PL 2.双侧检验: 计算满足Pi ≤P*条件下的各种组合之四格表 的累计概率。

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。

可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19 24 43 44.2 化疗加放疗组34 10 44 77.3合计53 34 87 60.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。

这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。

T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。

第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。

SPSS简明教程X2检验和T检验

SPSS简明教程X2检验和T检验

SPSS最适用的统计学方法(X2检验和T检验)1.SPSS的启动(1)在windows[开始]→[程序]→[spss20],进入SPSS for Windows对话框,2.创建一个数据文件三个步骤:(1)选择菜单【文件】→【新建】→【数据】新建一个数据文件。

(2)单击左下角【变量视窗】标签进入变量视图界面,定义每个变量类型。

(3)单击【数据视窗】标签进入数据视窗界面,录入数据库单元格内。

3.读取外部数据当前版本的SPSS可以很容易地读取Excel数据,步骤如下:(1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件,如图2.2所示。

图2.2 Open File对话框(2)选择要打开的Excel文件,单击“打开”按钮,调出打开Excel数据源对话框,如图2.3所示。

对话框中各选项的意义如下:工作表下拉列表:选择被读取数据所在的Excel工作表。

范围输入框:用于限制被读取数据在Excel工作表中的位置。

图2.3 Open Excel Data Source对话框4.数据编辑在SPSS中,对数据进行基本编辑操作的功能集中在Edit和Data菜单中。

5.SPSS数据的保存SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。

保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。

在数据保存对话框(如图2.5所示)中根据不同要求进行SPSS数据保存。

图2.5 SPSS数据的保存5. 数据分析在SPSS中,数据整理的功能主要集中在【数据】和【分析】两个主菜单下6.语言切换:编辑(E)—选项(N)--用户界面-语言--简体中文第六章:描述性统计分析(X2检验)完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。

6.1.1界面说明界面如下所示:分析—描述统计—频率用于定义需要计算的其他描述统计量。

现将各部分解释如下:Percentile Values复选框组定义需要输出的百分位数,可计算1.四分位数(Quartiles)、2.每隔指定百分位输出当前百分位数(Cut points for equal groups)3.直接指定某个百分位数(Percentiles),如直接P2.5和P97.5o Central tendency复选框组用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。

概率论与数理统计教程第七章答案

概率论与数理统计教程第七章答案

.第七章假设检验7.1设总体J〜N(4Q2),其中参数4, /为未知,试指出下面统计假设中哪些是简洁假设,哪些是复合假设:(1) W o: // = 0, σ = 1 ;(2) W o√∕ = O, σ>l5(3) ∕70:// <3, σ = 1 ;(4) % :0< 〃 <3 ;(5)W o :// = 0.解:(1)是简洁假设,其余位复合假设7.2设配么,…,25取自正态总体息(19),其中参数〃未知,无是子样均值,如对检验问题“0 :〃 = 〃o, M :4工从)取检验的拒绝域:c = {(x1,x2,∙∙∙,x25)r∣x-χ∕0∖≥c},试打算常数c ,使检验的显著性水平为0. 05_ Q解:由于J〜N(〃,9),故J~N(",二)在打。

成立的条件下,一/3 5cP o(∖ξ-^∖≥c) = P(∖ξ-μJ^∖≥-)=2 1-Φ(y) =0.05Φ(-) = 0.975,-= 1.96,所以c=L176°3 37. 3 设子样。

,乙,…,25取自正态总体,cr:已知,对假设检验%邛=μ0, H2> /J。

,取临界域c = {(X[,w,…,4):片>9)},(1)求此检验犯第一类错误概率为α时,犯其次类错误的概率夕,并争论它们之间的关系;(2)设〃o=0∙05, σ~=0. 004, a =0.05, n=9,求"=0.65 时不犯其次类错误的概率。

解:(1)在儿成立的条件下,F~N(∕o,军),此时a = P^ξ≥c^ = P0< σo σo )所以,包二为册=4_,,由此式解出c°=窄4f+为% ∖∣n在H∣成立的条件下,W ~ N",啊 ,此时nS = %<c°) = AI。

气L =①(^^~品)二①匹%=①(2δξ^历σoA∣-σ+A)-A-------------- y∕n)。

第七章次数资料分析——2检验

第七章次数资料分析——2检验
总计
表7-3 x 2 计算表
实际观察次 数(A)
理论次数(T)
192
202.5
78
67.5
72
67.5
18
22.5
360
360
A-T
-10.5 +10.5 +4.5
-4.5
0
( A T )2 T
0.5444 1.6333
0.3 0.9
3.377
第二节 适合性检验
▲(五)查临界 x 2 值,作出统计推断 (P346)
★ χ2的连续性矫正
● 当df=1时,计算χ2 值必须进行矫正,计算公式为:
2 c
( A T 0.5)2 T
原因: χ2分布属于连续型随机变量的概率分布,在对 次数资料进行χ2检验时,计算所得的χ2值偏大,概率 偏低,因此需要矫正。
●当df>1时,可不作连续性矫正,但要求各组内的理 论次数不小于5。若某组的理论次数小于5,则应把它 与其相邻的一组或几组合并,直到理论次数大于5为 止。
▲(一)建立假设
H0:实际观察次数之比符合9:3:3:1的理论比例 HA:实际观察次数之比不符合9:3:3:1的理论比例
第二节 适合性检验
▲(二)计算公式
●本例的属性类别分类数k=4, 因此自由度df=k-1=4-1=3,可采用一般公式
x 2 ( A T )2
T
第二节 适合性检验
▲(三)计算理论数
x2检验的显著性三个判断标准
1、x2<x20.05 P>0.05
差异不显著;
2、x20.05≤x2<x20.01 0.01<P≤0.05
差异显著;*
3、x2≥x20.01 P≤0.01
差异极显著;**
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 ( A T ) 2 x T
2 2 2 2 ( 99 90 . 48 ) ( 5 13 . 52 ) ( 75 83 . 52 ) ( 21 12 . 48 ) x2 90.48 13.52 83.52 12.48 12.86
3、自由度v=(2-1)(2-1)=1 X2(0.05,1)=3.84 12.86>3.84 P<0.05 可以认为异山梨醇口服液降低颅内压的有效 率高于氢氯噻嗪+地塞米松的有效率。
T11 90.48 T21 174 90.48 83.52 T12 104 90.48 13.52 T22 26 13.52 12.48
X2检验的步骤 例7-1 1.建立假设,确定检验水准 H0:π1=π2, H1: π1 ≠ π2 π2 α=0.05 2. 计量统计量 T11 =90.48 T12=13.52 T21=83.52 T22=
(ad bc) n x (a b)(c d )(a c)(b d )
2 2
(7 4)
(99 21 5 75) 200 x 12.86 104 96174 26
2 2
2 四格表资料的X 检验**
1、T≥5,且N ≥40时,用不校正公式计算x2值。 2、1≤ T<5,且N ≥40时,用连续性校正x2检验。
例7-2 某医师欲比较胞磷胆碱与神经节苷 治疗脑血管疾病的疗效,将78例脑血管疾病 患者随机分为两组,结果见表7-2。问两种药 物治疗脑血管疾病的有效率是否相等?
表 7-2 两种药物治疗脑血管疾病有效率的比较
组别 胞磷胆碱组 神经节苷酯酶 合计
有效 46 18 64
无效 6 8 14
合计 52 23 78
第七章
2 χ 检验
某医师为比较中药和西药治疗胃炎的疗效,
随机抽取140例胃炎患者分成中药组和西药组,
结果中药组治疗80例,有效64例,西药组治
疗60例,有效35例。该医师采用成组t检验进
行假设检验,结果t=-2.848,p=0.005,差异有统
计学意义,故认为中西药治疗胃炎的疗效有差
别,中药疗效高于西药。 1.资料的类型 是否正确 2.属于何种设计 3.统计方法
第一节
2 四格表资料的x 检验
一、 x2检验的基本思想
1.x2分布 (1)x2分布是一种连续型分布: x2分布只有一个参数:自由度 自由度≤2时,曲线呈L形 随着自由度的增加,曲线 逐渐趋于对称 当自由度接近于∞时,分布 趋近于正态分布
(2)x2分布的一个基本性质是它的可加性 (3)x2分布的界值: 当自由度v确定后,x2分布曲线下右侧尾 部的面积为α时,横轴上相应的x2值。 2)x2检验的基本思想 检验实际频数和理论频数的差别是否抽样 误差所引起,X2值的大小反映了实际频数和 理论频数的吻合程度。若得到的χ2很大,说 明实际频数和理论频数的差距很大,如果超 过了设定的检验水准α所对应的X2界值,说明 实际频数和理论频数的差别由抽样误差引起 的可能性很小,接受H1, 反之接受H0。
组 别 试验组 对照组 合 计
有 效 99 a 75 c 174(a+c)
无 效 5b 21 d 26(b+d)
合 计 104 (a+ b) 96 (c+d) 200 (n)
有效率(%) 95.20 78.13 87.00
数各 是组 固样 定本 的例
四个格子的数据是表 7-1 中基 基本数据, 其余 的数据都是从 这四个数据推算得来的,这种 资料称四格表资料。
3.x2(0.05,1)=3.84 3.14<3.84 P>0.05 尚不能认为药物 治疗脑血管疾病的有效率不等
第二节
配对四格表资料的
2 χ 检验
用途 常用于比较两种检验方法或两种培养基的阳 性率是否有差别。 特点:对同一观察对象分别用两种方法处理, 观察其阳性与阴性结果。 资料整理为配对四格表形式.
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价) 要求:两样本的两分类个体数排列成四 格表资料
例7-1 某院欲比较异梨醇口服液(试验组)和氢 氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将 200例颅内压增高症患者随机分为两组,结果见表71。问两组降低颅内压的总体有效率有无差别?
表7-1 两组降低颅内压有效率的比较
3、T<1或N<40或x2检验后所得概率P接近检验
水准α,用Fisher 精确概率法。
三、四格表资料χ 2检验校正
校正基本公式
2 (| A T | 0.5) 2 T
校正专用公式
2 (| ad bc | n / 2) n 2 (a b )(c d )(a d )(b d )
表 7-1的理论数计算如下:
104 T11 90.48 200 96 T21 83.52 200 104 T12 13.52 200 96 T22 12.48 200
四格表中,因周边合计是固定的,用公 式7-3求出其中一个格子的理论频数后, 其余三个可通过行合计数和列合计数相减 求出。如
有效率(%) 88.46 69.23 82.05
1.建立假设,确定检验水准 H0:π1=π2, H1: π1 ≠ π2 π2 2.T最小=26 × 14/78=3.14, n=78
α=0.05
x2=(︱46 ×8-6 ×8︳-78/2)2/78 64 ×14 ×52 ×26=3.14 不校正: x2=4.35
2 ( A T ) x2 T v (行数- 1 )(列数- 1 )
a99 C75
b5 d21
(7 1)
( 7 - 2)
式中 A 为实际频数,即每个格子的实际发生数,T 为理论数,是根据无效假设推算出来的。
TRC
nR nc n
(7 3)
式中TRC 为第 R 行第 C 列格子的理论频数,nR 为第 R 行的合计数,nC为第 C 列的合计数,n为总例数.
相关文档
最新文档