复旦大学统计卡方检验

合集下载

卡方检验解释

卡方检验解释

(四)卡方检验的连续性校正问题
反对依据是:经连续性校正后,P值有过分 保守之嫌。此外,Fisher确切概率法建立在 四格表双边固定的假定下,而实际资料则 是单边固定的四格表,连续性校正卡方检 验的P值与Fisher确切概率法的P值没有可 比性。
• 就应用而言,无论是否经过连续性校 正,若两种检验的结果一致,无须在 此问题上纠缠。但是,当两种检验结 果相互矛盾时,如例7-2,就需要谨 慎解释结果了。
24.08, P0.05
结论与之相反。
(四)卡方检验的连续性校正问题
赞成依据是:这样做可使卡方统计量抽样 分布的连续性和平滑性得到改善,可以降 低I类错误的概率,连续性校正后的卡方检 验,其结果更接近于Fisher确切概率法。不 过,校正也不是无条件的,它只适合于自 由度为1时,样本含量较小,如n<40,或 至少有一个格子的理论频数太小,如T<5 的情形。
• 为客观起见,建议将两种结论同时报 告出来,以便他人判断。当然,如果 两种结论一致,如均为或,则只报道 非连续性检验的结果即可。
第二节、两相关样本率检验 (McNemar检验)
配对四格表资料的 2 检验
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
理论频数由下式求得:
TRC
nR nC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
检验统计量 2 值反映了实际频数与 理论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 2 值很大,即相对应的P 值很

卡方检验名词解释

卡方检验名词解释

卡方检验名词解释
卡方检验属于非参数检验,由于非参检验不存在具体参数和总体正态分布的假设,所以有时被称为自由分布检验。

参数和非参数检验最明显的区别是它们使用数据的类型。

非参检验通常将被试分类,如民主党和共和党,这些分类涉及名义量表或顺序量表,无法计算平均数和方差。

卡方检验分为拟合度的卡方检验和卡方独立性检验。

我们用几个例子来区分这两种卡方检验:
•对于可口可乐公司的两个领导品牌,大多数美国人喜欢哪一种?•公司采用了新的网页页面B,相较于旧版页面A,网民更喜欢哪一种页面?
以上两个例子属于拟合度的卡方检验,原因在于它们都是有关总体比例的问题。

我们只是将个体分类,并想知道每个类别中的总体比例。

它检验的内容仅涉及一个因素多项分类的计数资料,检验的是单一变量在多项分类中实际观察次数分布与某理论次数是否有显著差异。

拟合度的卡方检验定义:
主要使用样本数据检验总体分布形态或比例的假说。

测验决定所获得的的样本比例与虚无假设中的总体比例的拟合程度如何。

拟合度的卡方检验又叫最佳拟合度的卡方检验,为何取名“最佳拟合”?这是因为最佳拟合度的卡方检验的目的是比较数据(实际频数)与虚无假设。

确定数据如何拟合虚无假设指定的分布,因此取名“最佳拟合”。

关于拟合度的卡方检验有一些翻译上的区别,其实表达的是一个意思:
拟合度的卡方检验=卡方拟合优度检验=最佳拟合度卡方检验
以下统称:卡方拟合优度检验
卡方统计的公式:卡方卡方=χ2=Σ(fo−fe)2fe
公式中O代表observation,即实际频数;E代表Expectation,即期望频数。

卡方检验95%置信区间

卡方检验95%置信区间

卡方检验95%置信区间卡方检验是一种常见的假设检验方法,用于检验样本数据是否符合某种理论分布。

在统计学中,置信区间是一种用于衡量估计值精度的方法,在给定置信水平的条件下,估计值的真实值有多大的可能性落在置信区间内。

本文旨在介绍卡方检验的基本原理和95%置信区间的计算方法。

一、卡方检验的基本原理卡方检验是一种用于检验样本数据是否符合某种理论分布的假设检验方法。

其基本原理是将观察值与理论值进行比较,计算出卡方值,然后根据卡方分布表确定拒绝域和接受域。

如果计算出的卡方值小于临界值,则接受原假设,即认为样本数据符合理论分布;反之则拒绝原假设,即认为样本数据不符合理论分布。

卡方检验的原假设为样本数据符合某种理论分布,备择假设为样本数据不符合该理论分布。

在进行卡方检验时,需要先确定显著性水平,通常取0.05或0.01。

然后根据样本数据和理论分布计算出期望值和卡方值,再根据卡方分布表确定临界值,最后比较计算出的卡方值和临界值的大小,判断是否拒绝原假设。

二、95%置信区间的计算方法置信区间是一种用于衡量估计值精度的方法,其基本思想是在给定置信水平的条件下,估计值的真实值有多大的可能性落在置信区间内。

置信区间的计算方法因估计量的不同而异,本文以卡方检验为例介绍95%置信区间的计算方法。

95%置信区间的计算方法如下:1. 根据样本数据计算出卡方值。

2. 根据卡方分布表查找卡方分布的临界值。

3. 根据卡方分布的自由度和置信水平计算出置信区间的上下限。

具体而言,置信区间的上限为样本数据的卡方值加上卡方分布的临界值乘以卡方分布的标准差,下限为样本数据的卡方值减去卡方分布的临界值乘以卡方分布的标准差。

卡方分布的标准差可以通过卡方分布的公式计算得到。

例如,假设某个样本数据的卡方值为20,自由度为4,置信水平为95%,则根据卡方分布表可知,卡方分布的临界值为9.488。

根据卡方分布的公式可知,卡方分布的标准差为2。

因此,95%置信区间的上限为20+9.488×2=39.976,下限为20-9.488×2=0.024。

复旦大学公共卫生学院卫生综合试题四

复旦大学公共卫生学院卫生综合试题四

复旦大学公共卫生学院卫生综合试题四
绝密☆启用前
一、流行病学
(一)名解
1、疾病地方性
2、病因
3、混杂因子
4、预防接种
5、疾病监测
(二)问答题
1、病例对照研究中一般情况下为什么只能计算OR而不能计算RR?用OR估计RR的条件是什么
2、如何进行疾病家族聚集性分析
二、统计B卷
1、简述计量资料中标准差与标准误的区别与联系
2、应用相对数时应注意哪些问题
3、简述抽样误差的概念,并写出反映抽样误差大小的指标及其公式
4、写出实验设计的基本要素与基本原则,并写出常用的实验设计方法
5、写出卡方检验中各公式,并写出其用途及其应用条件
三、劳卫
1、生产性毒物对血液系统的危害有哪些?请举例说明
2、简述防暑降温的主要措施
3、化学性肺水肿有哪些临床表现
4、职业病的特点有哪些
四、环卫
(一)名解
1、酸雨
2、化学耗氧量
3、有效氯
4、等效声级
5、有效温度
(二)问答题
1、二噁英类(Dioxins)环境毒物对居民健康主要有哪些危害
2、简述减少饮用水中氯化副产物可采用的主要措施
五、营养
(一)名解
1、食物蛋白质互补作用
2、关键控制点
(二)问答题
1、说明行使食品卫生监督职责的执法主体
2、评价体内VB1、B2、B6、VC营养水平较为特异的指标分别是什么
3、简述食品中N-亚硝基化合物的来源及体内主要合成场所与条件
4、我国食品卫生标准中规定含有豆粉的婴儿代乳品哪种试验必须是阴性
5、叙述含氰甙食物中毒的特效解毒药物及机理。

卡方检验医学统计学

卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。

在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。

卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。

期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。

而实际频数则是实验中观察到的实际结果。

卡方检验的步骤如下:1.建立零假设和备择假设。

零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。

2.确定显著性水平 alpha,通常取值为0.05。

3.构建卡方检验统计量。

计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。

4.根据自由度和显著性水平,查卡方分布表得到 P 值。

5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。

卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。

卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。

举个例子,某药厂要研发一种新的药物来治疗心脏病。

为了验证该药的疗效,实验组和对照组各50 人。

在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。

卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。

除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。

卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。

其中比较明显的一点就是对样本量有一定的要求。

当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。

此外,在面对非常态分布数据时,卡方检验也会出现问题。

当数据呈现正态分布时,卡方检验的准确性最高。

然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。

卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。

卡方检验格式

卡方检验格式

卡方检验格式一、什么是卡方检验?卡方检验(chi-square test)是一种常用的假设检验方法,用于比较实际观测值与理论预期值之间的差异是否显著。

它适用于离散型的数据,通常用于比较两个或多个分类变量之间的关联性。

卡方检验可以帮助我们判断观察到的数据是否符合某种期望的分布模式,从而评估变量之间的独立性。

二、卡方检验的原理卡方检验的原理基于卡方统计量(chi-square statistic),它用于度量观测值与理论预期值之间的差异程度。

卡方统计量的计算公式如下:^2}{E_i})其中,为观测值,为理论预期值。

三、卡方检验的步骤卡方检验一般包括以下步骤:1. 设置假设在进行卡方检验前,需要明确研究者想要验证的假设。

通常会设立两个假设:零假设(H0)和备择假设(H1)。

零假设常常是指变量之间没有关联或没有差异,备择假设则是指变量之间存在关联或差异。

2. 构建列联表在进行卡方检验时,需要构建一个列联表(contingency table),用于记录观测值和理论预期值。

列联表是一个二维表格,行代表一个变量的不同类别,列代表另一个变量的不同类别。

观测值填写实际观测到的频数,理论预期值填写根据假设计算得到的期望频数。

3. 计算卡方统计量根据构建的列联表,可以计算卡方统计量。

按照公式 ^2}{E_i}) 计算每个观测值与期望值的差异平方和,并相加得到卡方统计量。

4. 确定显著性水平在进行卡方检验时,需要设定一个显著性水平(significance level)来评估卡方统计量的显著性。

常用的显著性水平有0.05和0.01两种。

更小的显著性水平表示对差异的要求更高。

5. 查表或计算临界值根据显著性水平和自由度(degree of freedom),可以查找卡方分布表得到临界值。

根据卡方统计量和临界值的比较,可以判断观测值与理论预期值之间的差异是否显著。

6. 判断结论根据卡方统计量与临界值的比较结果,可以判断零假设是否被拒绝。

遗传学_复旦大学中国大学mooc课后章节答案期末考试题库2023年

遗传学_复旦大学中国大学mooc课后章节答案期末考试题库2023年

遗传学_复旦大学中国大学mooc课后章节答案期末考试题库2023年1.关于Agouti小鼠,以下描述错误的是?答案:当ASP编码基因的调控元件发生低甲基化,可关闭基因表达,小鼠呈现黑色,并发症减少。

2.有些基因并非与其他基因协作,而是直接影响其他基因的功能,导致表型效应改变,这些基因被称为?答案:修饰基因3.相比正常二倍体,增加了一条染色体的个体(染色体组成为2n+1)称为?答案:三体4.由基因频率和基因型频率推测,以下哪个群体不属于平衡群体?答案:AA(20%); Aa(60%); aa(20%)5.乌龟的性别是由受精卵的孵化温度决定的,这种性别决定方式是属于?答案:环境性别决定6.以下关于关联分析的描述,错误的是?答案:有关联的非等位基因之间一定存在连锁关系。

7.平衡致死系是利用__________片段抑制交换,从而保证杂合状态在世代传递中不发生分离。

答案:倒位8.以下孟德尔遗传模式中,哪一种最符合“双亲表型正常,子女发病率为25%,且没有性别分布差异”这一特点?答案:常染色体隐性遗传9.常染色体上,半同胞婚配的近交系数为?答案:1/810._______指的是具有两个着丝粒的变异染色体。

答案:双着丝粒染色体11.马和驴杂交,得到的骡可育性极低。

这种现象属于?答案:受精后生殖隔离12.缺失造成的弧状结构的内部是______的染色体部分。

答案:正常13.真核生物基因的编码序列在染色体上的排列特点是?答案:不是连续排列的14.已知A与a、B与b、C与c这三对等位基因自由组合,基因型分别为AaBbCc、AabbCc的两个体进行杂交。

下列关于杂交后代的推测,正确的是?答案:表现型有8种,aaBbCc个体的比例为1/1615.在常染色体隐性遗传疾病中,野生型等位基因相对突变基因完全______,杂合子Aa表现为_____型。

答案:显性;野生16.1961年,法国分子生物学家Jacob和Monod提出了________,说明了大肠杆菌在环境因素的调控下,如何在转录水平改变结构基因的表达。

统计学卡方检验

统计学卡方检验
个体化干预
根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
76.67 2.82 123 .33 38.33 61.67
12
操作步骤
3. 确定P值和作出推断结论
• 查附表8,2界值表,得p>0.05。按 = 0.05水 准,不拒绝H0,尚不能认为使用含氟牙膏比使用 一般牙膏儿童的龋患率低。 • 对于四格表,卡方的计算公式又可进行简化,以 方便手工计算
残差可以表示某一个类别观察值和理论值的 偏离程度,但残差有正有负,相加后会彼此 抵消,总和仍然为0。为此可以将残差平方后 求和,以表示样本总的偏离无效假设的程度
8
方法原理
另一方面,残差大小是一个相对的概念,相 对于期望频数为10时,20的残差非常大;可 相对于期望频数为1000时20就很小了。因此 又将残差平方除以期望频数再求和,以标准 化观察频数与期望频数的差别。
假设检验步骤如下:
• H0:两法总体阳性检出率无差别,即B = C • H1:两法总体阳性检出率有差别,即B C
21
方法原理
根据 H0 得 b、 两格的理论数均为 Tb = Tc = (b+c)/2, c 对应的配对检验统计量为:
(b c ) 2 2 , bc
或者进行校正。
1
• 理论频数不宜太小,一般认为不宜有1/5以上格子 的理论频数小于5或有一个格子的理论频数小于1 • 不太理想的办法
与邻近行或列中的实际频数合并 删去理论频数太小的格子所对应的行或列
• 最理想的办法
增加样本含量以增大理论频数(但是可能吗) 确切概率法
29
确切概率法
分析实例
• 注意:确切概率法不属于2检验的范畴,但常作 为2检验应用上的补充。
17
配对设计两样本率比较 2检验 的χ
方法原理
例6.9 用A、B两种方法检查已确诊的乳腺癌 患者140名,A法检出91名(65%),B法检出 77名(55%),A、B两法一致的检出56名 (40%),问哪种方法阳性检出率更高?
A法 + - 合计 B法 + 56 (a) 21 (c) 77 - 35 (b) 28 (d) 63 合计 91 49 140
35
Stata计算
两个或多个率、构成比的比较
1、Pearson χ2 对两个样本率比较 tabi a b\ c d,chi2 r 其中r表示按行计算比例
在四格表周边合计不变的条件下,在相应的 总体中进行抽样,四格表中出现各种排列组 合情况的概率
• 本例即28、8、22、14保持不变的条件下,若H0 成立,计算出现各种四格表的概率
(a b)!(c d )!(a c)!(b d )! P a!b!c!d!n!
33
方法原理
表 6.10 在四格表(表 6.9)周边合计不变的条件下,1=2 时的概率分布计算 d P(d) 0 1 2 3 4 5 6
一般在 b + c < 40 时,需用确切概率法进行检验,
mcci 56 35 21 28
22
注意事项
McNemar检验只会利用非主对角线单元格上 的信息,即它只关心两者不一致的评价情况, 用于比较两个评价者间存在怎样的倾向。因 此,对于一致性较好的大样本数据, McNemar检验可能会失去实用价值。
11
38.19
chi-square
操作步骤
1. 建立检验假设和确定检验水准
• H0:使用含氟牙膏和一般牙膏儿童龋患率相等 • H1:使用含氟牙膏和一般牙膏儿童龋患率不等
2. =0.05 3.计算检验统计量2值
70 76.67 2 130 123 .332 45 38.332 55 61.67 2 2
卡方检验
内容安排
卡方检验入门 配对设计两样本率比较的χ2检验 行列表资料的分析 确切概率法
2
卡方检验入门
概 述
卡方检验是以卡方分布为基础的一种常用假 设检验方法,主要用于分类变量,它的基本 的无效假设是:
• • • • H0:行分类变量与列分类变量无关联 H1:行分类变量与列分类变量有关联 =0.05 k ( Ai Ti ) 2 2 P 统计量 ,其中Ai是样本资料的 Ti i 1 计数,Ti 是在H0 为真的情况下的理论数(期望值)。
4
卡方检验
• 在H0 为真时,实际观察数与理论数之差 Ai -Ti 应该比较接近0。所以在H0为真时,检验统计量
( Ai Ti ) 2 2 P 服从自由度为k-1的卡方分布。 Ti i 1
k
即: 2 2,拒绝H0。 P ,v 上述卡方检验由此派生了不同应用背景的各种问题 的检验,特别最常用的是两个样本率的检验等。 因为该原理的使用范围很广,但本次课程只学习 用于推断两个分类变量是否相互关联
• 这就是我们所说的卡方统计量,在1900年由英国 统计学家Pearson首次提出,其公式为:
k ( Ai Ei ) 2 ( Ai npi ) 2 2 Ei npi i 1 i 1 k
9
方法原理
从卡方的计算公式可见,当观察频数与期望 频数完全一致时,卡方值为0; 观察频数与期望频数越接近,两者之间的差 异越小,卡方值越小; 反之,观察频数与期望频数差别越大,两者 之间的差异越大,卡方值越大。 当然,卡方值的大小也和自由度有关
10
方法原理
卡方分布
• 显然,卡方值的大小不仅与A、E之差有关,还与 单元格数(自由度)有关
.12 .10
.08
概率
.06
.04
.02
0. 00 .00 4. 02 2. 01 8. 04 6. 03 12.06 16.08 20.10 24.12 28.14 32.16 36.18 10.05 14.07 18.09 22.11 26.13 30.15 34.17
例 6.13 研究某新药治疗原发性高血压的疗效, 并用常规治疗药物作为对照组, 结果见 表 6.9,问新药疗效与对照组疗效有无差别? 表 6.9 某新药治疗原发性高血压的疗效 分 组 有效 20(a) 2(c) 22 无效 8(b) 6(d) 14 合计 28 8 36 有效率() 71.43 25.00 61.11
更一般地,可将上述表格记为表 6.3 的一般形式,称之为四格表(fourfold table)。因为表 中 a、b、c 和 d 四个格子的数据是基本的,其余数据均可从这四个数据派生出来。
6
方法原理
理论频数
• 基于H0成立,两样本所在总体无差别的前提下计 算出各单元格的理论频数来 nR nC
TRC
• 例如对1万个案例进行一致性评价,9995个都是 完全一致的,在主对角线上,另有5个分布在左 下的三角区,显然,此时一致性相当的好。但如 果使用McNemar检验,此时反而会得出两种评价 有差异的结论来。
Байду номын сангаас23
行列表资料的分析
例 6.10 用某新药治疗不同类型关节炎的疗效如表 6.6,问该药治 疗不同类型关节炎的疗效是否有差别? 表 6.6 三种不同类型关节炎的临床疗效 关节炎类型 类风湿性关节炎 风湿性关节炎 骨性关节炎 合计 有效 97 37 14 148 无效 18 20 17 55 合计 115 57 31 203
14
卡方检验假设的等价性
两组儿童的龋齿率相同
• 两组发生率的比较
实际数据的频数分布和理论假设相同
• 理论分布与实际分布的检验
使用不同的牙膏并不会影响龋齿的发生(两 个分类变量间无关联)
• 两变量的相关分析
15
四格表2值的校正
英国统计学家Yates认为,2分布是一种连续 型分布,而四格表资料是分类资料,属离散 型分布,由此计算的2值的抽样分布也应当 是不连续的,当样本量较小时,两者间的差 异不可忽略,应进行连续性校正(在每个单 元格的残差中都减去0.5)
5
概 述
表 6.2 使用含氟牙膏与一般牙膏儿童的龋患率 牙膏类型 含氟牙膏 一般牙膏 合计 患龋齿人数 70(76.67) 45(38.33) 115 未患龋齿人数 130(123.33) 55(61.67) 185 调查人数 200 100 300 龋患率(%) 35.00 45.00 38.33
25
分析步骤
建立假设 • H0:三种不同类型关节炎的疗效相同 • H1:三种不同类型关节炎的疗效不全相同
求出统计量 下结论
26
几点遗留问题
是否应当进行两两比较?
• 这又是一个打嘴仗的问题,虽然有人提出用卡方 分割等方法来检验,但同样也有学者对这种做法 嗤之以鼻 • 实际上,随着统计学的发展,这个问题已被超越, 可以使用对分类数据的建模方法,如logistic模型 等对此问题加以解答
n
龋患率(%) 35.00 45.00 38.33
7
牙膏类型 含氟牙膏 一般牙膏 合计
患龋齿人数 70(76.67) 45(38.33) 115
未患龋齿人数 130(123.33) 55(61.67) 185
调查人数 200 100 300
方法原理
残差
• 设A代表某个类别的观察频数,E代表基于H0计 算出的期望频数,A与E之差被称为残差
27
几点遗留问题
如果是有序资料该怎么处理
• 传统的卡方检验是无法对次序信息加以利用的 • 单向有序:秩和检验啦 • 双向有序:实际上考察的是两变量间的关联性 (相关性),可以使用专门的关联性指标分析 • 目前对卡方检验还有一些扩展方法,如CMH卡方, 可以处理此类问题
28
几点遗留问题
行列表卡方检验的适用条件
*
7
8
0.0106 0.0789 0.2244 0.3168 0.2420 0.1019 0.0229 0.0025 0.0001
相关文档
最新文档