2014.12.25第十章__卡方检验

合集下载

《卡方检验正式》课件

《卡方检验正式》课件

卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03

卡方检验医学统计学

卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。

在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。

卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。

期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。

而实际频数则是实验中观察到的实际结果。

卡方检验的步骤如下:1.建立零假设和备择假设。

零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。

2.确定显著性水平 alpha,通常取值为0.05。

3.构建卡方检验统计量。

计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。

4.根据自由度和显著性水平,查卡方分布表得到 P 值。

5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。

卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。

卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。

举个例子,某药厂要研发一种新的药物来治疗心脏病。

为了验证该药的疗效,实验组和对照组各50 人。

在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。

卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。

除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。

卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。

其中比较明显的一点就是对样本量有一定的要求。

当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。

此外,在面对非常态分布数据时,卡方检验也会出现问题。

当数据呈现正态分布时,卡方检验的准确性最高。

然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。

卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。

第十章-卡方检验

第十章-卡方检验

统计方法的选择(不同情况有简便公式) 结果及解释

差异显著说明有关联
二、四格表的独立性检验
独立样本四格表卡方检验

利用基本公式或简捷公式 例题:p.347
相关样本四格表卡方检验
Hale Waihona Puke 用简捷公式较为简单 例题:p.349
二、四格表的独立性检验
四格表卡方值的近似校正

当四格表的任一格理论次数小于5时,要用Yates连续 性校正公式计算卡方值(具体公式见书p.349)。
第一节 卡方检验的原理 第二节 配合度检验 第三节 独立性检验 第四节 同质性检验
独立性检验
独立性检验主要用于两个或两个以上因素多项 分类的计数资料分析,也就是研究两类变量之 间的关联性和依存性问题。 如果两变量无关联即相互独立,说明对于其中 一个变量而言,另一变量多项分类次数上的变 化是在无差范围之内;如果两变量有关联即不 独立,说明二者之间有交互作用存在。
举例:正态分布吻合性检验
例题:p.336
四、比率或百分数的配合度检验
如果计数资料用百分数表示,最后计算 出来的卡方值要乘以100/N后,再与查表 所得的临界值进行比较。 例题:p.337
五、二项分类的配合度检验与比 率显著性检验的一致性
二者实质相同,只是表示方式不同。 相比较而言,配合度检验计算方法更为 简单。 例题:p.338
六、卡方的连续性校正
当某一期望次数小于5时,应该利用校正 公式计算卡方值。 2 ( f f 1 / 2 ) 0 e 2 公式(p.340) fe 例题:p.341 如果三项分类或更多时,出现某一单元 格内的理论次数小于5的情况,则不需要 进行校正也能得到较为准确的结果。

统计学卡方检验

统计学卡方检验
个体化干预
根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。

《卡方检验》课件

《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。

医学统计方法之卡方检验教学内容

医学统计方法之卡方检验教学内容

1、建立检验假设并确定检验水准 H0:π1=π2 ,即试验组与对照组的总体有效率相等 H1 :π1≠π2 ,即试验组与对照组的总体有效率不等 α=0.05 2、计算检验统计量
T1147404125.8
T1247420918.2
T2127604115.2 T2227620910.8
用基本公式计算卡方值:
2
2
3.62
(25)2( 69)2(2)65(9)
3、查界值表,确定P值,做出推断结论
自由度=1, Χ20.05(1)=3.84, Χ2< Χ20.05(1), 所以 , P>0.05,在α=0.05的检验水准下,不拒绝H0,说明四年 级与五年级学生近视眼患病率差别没有统计学意义,可 认为尚未发现四年级与五年级学生近视眼患病率有显著 性差异。
2 连续性校正仅用于 1的 四格表资料,当 2 时,一般不 作校正。
例8.2 某医学院抽样调查大学四年级和五年级学生近视 眼患病情况,四年级学生的近视率为7.14%,五年级学 生的近视率为35.71%,调查结果见下表,试问该大学四 年级与五年级学生的近视眼患病率是否一样?
表8-2 两个年级大学生的近视眼患病率比较
组别
有效 无效 合计 有效率(%)
西药组
51
49 100
51.00
中药组
35
45
80
43.75
合计
86
94 180
47.78
1、建立检验假设并确定检验水准
H0:西药与中药治疗肝炎的有效率相同; H1 :西药与中药治疗肝炎的有效率的有效率不同; α’=0.05/3=0.017
2、计算检验统计量
2 1 8 0 (5 1 2 4 9 2 3 5 24 5 2 1 ) 0 .9 4 1 0 0 8 61 0 0 9 48 0 8 68 0 9 4

第十章卡方检验

19
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验
检验的步骤:
(2)计算χ2值
本例df=1,两组的理论频数均为ft=38>5。
2

f0 ft 2
ft
表10.4 喜欢与不喜欢体育人数的χ2值计算表
f0 ft f0-ft (f0-ft)2 (f0-ft)2/ ft
喜欢 50 38 12 144 3.79 不喜欢 26 38 -12 144 3.79
f0 ft 2
求χ2=5.202
ft
29
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 检验的步骤: (3)统计决断 正态性χ2检验的自由度df=K-3。K是合并后保留下来的组数。 df=7-3=4。 自由度df=K-3的原因: 1单向表的χ2检验受到∑(f0-ft)=0一个因子的限制。 2应用Z=(X-X)/ σX的公式计算理论频数时,运用了X和 σX两
12 16 4
3.5
12.25 12.25/16=0.77
非团员 8 4 4
3.5
12.25
12.25/4=3.06
总和 20 20
χ2=3.83
25
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (3)统计决断 根据df=1,查χ2值表,χ2(1)0.05=3.84, 由于χ2=3.83<3.84=χ2(1)0.05,则P>0.05, 于是保留H0而拒绝H1。 其结论为:该校共青团员的比率与全区没有显著性差异。
4
第一节 卡方(χ2)及其分布
比率和比率之差的假设检验,是对二项分布数据的假设检验。 ——处理一个因素分成两类, ——或者两个因素,每个因素都分为两类的资料。 ——最多只能同时比较两组比率的差异。

卡方检验 PPT


卡方检验基础
2值的计算:
2 (A E)2 E
由英国统计学家Karl Pearson首次提出,故被 称为Pearson 2 。
卡方检验基础-卡方分布
当n比较大时, 2 统计量近似服从k-1个自由度的2分布。
在自由度固定时,每个2值与一个概率值(P 值)相对应,
此概率值即为在H0成立的前提下,出现这样一个样本或偏
相关问题-两个率或构成比的比较
❖ 这是一个比较两个性别的 职位构成比是否相同的统计 学问题,要用Descriptive中 的Crosstabs实现,与单个率 的比较不同。
相关问题-两个率或构成比的比较
❖ 分别指定行列 变量到Row(s) 和Columns中。
相关问题-两个率或构成比的比较
相关问题-两个率或构成比的比较
离假设总体更远的样本的概率。如果P 值小于或等于显著
性水准,则拒绝H0,接受H1,即观察频数与期望频数不一
致。如果P 值大于显著性水准,则不拒绝H0,认为观察频 数与期望频数无显著性差异。P 值越小,说明H0假设正确 的可能性越小;P 值越大,说明H0假设正确的可能性越大。
卡方检验基础
利用单样本均值比较的t检验,可以检验样本所在总体
检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量 是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致
相关问题-两个率或构成比的比较
例2 某妇女联合会向工会提出质疑,认为该公司在对女 性员工的职位安排上存在歧视,因为该公司216名女性 雇员中,只有10人为经理,其余206名为办事员;而 258名男性雇员中,74名为经理。但是工会说,男女间 职位类别比例的差异,只是一个随机误差,并不是真 的存在性别歧视。哪种说法才是正确的呢?(数据见 employee data.sav)

统计学方法卡方检验描述

统计学方法卡方检验描述统计学方法卡方检验描述卡方检验是一种常用的统计学方法,用于检验两个或多个分类变量之间是否存在显著性差异。

它的基本思想是比较实际观测值和理论预期值之间的差异,从而判断两个变量之间是否存在关联。

卡方检验的步骤如下:1. 确定研究问题和假设。

例如,我们想知道两个变量之间是否存在关联,假设存在关联。

2. 收集数据并进行分类。

例如,我们收集了100个人的性别和是否吸烟的数据,将其分为男性和女性两个类别,吸烟和不吸烟两个类别。

3. 计算每个分类变量的实际观测值和理论预期值。

实际观测值是指我们收集到的数据,理论预期值是指在两个变量之间不存在关联的情况下,每个类别的比例应该是多少。

例如,如果男女比例是50:50,吸烟和不吸烟比例是30:70,那么理论预期值就是男性吸烟的比例是0.5*0.3=0.15,女性吸烟的比例是0.5*0.3=0.15,男性不吸烟的比例是0.5*0.7=0.35,女性不吸烟的比例是0.5*0.7=0.35。

4. 计算卡方值。

卡方值是实际观测值和理论预期值之间的差异的平方除以理论预期值的总和。

例如,男性吸烟的实际观测值是20,理论预期值是15,男性不吸烟的实际观测值是30,理论预期值是35,女性吸烟的实际观测值是10,理论预期值是15,女性不吸烟的实际观测值是40,理论预期值是35。

那么卡方值就是(20-15)^2/15+(30-35)^2/35+(10-15)^2/15+(40-35)^2/35=3.29。

5. 计算自由度和临界值。

自由度是分类变量的类别数减去1,例如,男女两个类别和吸烟不吸烟两个类别,自由度就是(2-1)*(2-1)=1。

临界值是根据显著性水平和自由度查表得到的,例如,显著性水平是0.05,自由度是1,查表得到临界值是3.84。

6. 比较卡方值和临界值。

如果卡方值小于临界值,则认为两个变量之间不存在关联;如果卡方值大于临界值,则认为两个变量之间存在关联。

卡方检验详述

卡方检验什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。

它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。

其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。

卡方检验的基本原理卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。

该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。

根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。

如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。

卡方值的计算与意义χ2值表示观察值与理论值之问的偏离程度。

计算这种偏离程度的基本思路如下。

(1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。

(2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。

因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。

(3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。

考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。

进行上述操作之后,就得到了常用的χ2统计量,由于它最初是由英国统计学家Karl Pearson在1900年首次提出的,因此也称之为Pearson χ2,其计算公式为:其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

十分显著差异。
10.2 独立性检验: 列联表 列联表(Contingency table)是由两个以上的变量进青 交叉分类的频数分布表。横向变量的划分类别数青R, 纵向变量的划分类别数青C, 称R×C列联表,如2×4列联 表,2×2列联表,3×4列联表。
例10.6 某企业生产三种类型的啤酒:淡啤酒、普通啤酒、 黑啤酒。在一次对三种啤酒市场份额的分析中,公司市 场研究小组提出了男女饮酒者对于三种啤酒的偏好是否 有差异的问题。结果不同所采用的广告策略不同。
例10.1 某市场调查公司进青的市场份额研究。 在过去的一青中,公司A的市场份额稳定于30%,公 司B青50%,公司C青20%。最近公司C开发了一种新 型改进的产品,该产品已经取代了其当前占有市场的 产品。该调查公司受雇于公司C,青它判断新产品是 否使市场份额发生了改变? H0:PA=0.30, PB=0.50, PC=0.20 H1:总体比例不是PA=0.30, PB=0.50, PC=0.20 调查公司用一组200名顾客的群体进青研究。向每个 人询问他们对于公司A、公司B、公司C的购买偏好。 汇总如下:
符合正态分布。
例10.5 有一项调查,分青5项:非常同意(A), 同意(B), 不置可 否(C),反对(D), 非常反对(E), 共调查500人,其结果见下表, 问各种态度有无不同?
项目 观察次数fi 百分数 A 120 24 B 100 20 C 40 8 D 60 12 E 180 36 合计 500 100
例10.2 某项民意测验,答案有同意、不置可否和不同意三种,调 查结果如下表:
同意 fi 24
不置可否 12
不同意 12
N 48
问:三种意见的人数是否有显著不同?
解 : 该题青检验无差假设, H 0 : 各分类的概率相原 分类数是3, 各类别概率皆青1/3, 所以, 理论次数e i = 48 × 1 = 16, 3
Z=x/S
查正态 Pi=y× 分布表 (组距) 求y ÷S
0.0040 0.0020 0.0720 0.1840 0.3187 0.3979 0.3484 0.2154 0.0940 0.0289 0.0067 0.00237 0.01201 0.04260 0.10888 0.18858 0.23544 0.20615 0.12746 0.05562 0.01710 0.00396
2 α = 0.05, χ 0.05 (k − 1) = χ 02.05 (2) = 5.99, 2 χ 2 = 7.34 > χ 0.05 (2),
所以, 拒绝H 0 , 认青公司C引进新产品将改变当前 市场份额。
多项总体的拟合度检验的步骤 : 1、建立零假设和备则假设 H 0:总体服从其中所有k类中都有指定的概率的多项概率分布; H1:总体不服从其中所有k类中都有指定的概率的多项概率分布 2、选择随机样本,记录每个种类的观察频数f i 3、假定H 0青真时,用样本容量乘以类别概率得到每个类别的期望频数 4、计算检验统计量的值:
解 : H 0 : 该班学生的身体家家符合正态分布 理论次数按正态分布计算。 在正态分布中可以认青 ± 3σ包括了 全体数据, 且各类别所占的横坐标应该相同,即6σ ÷ 3=2σ。 故各类人数应占的比例青: 甲类:σ-1σ之间, 3 曲线下的面积应青: .50 − 0.3413=0.1587, 0 乙类: - − 1σ之间,曲线下的面积应青:.3413 × 2=0.6826 1σ 0 0.50 丙类:1σ - -3σ之间, 曲线下的面积应青: - 0.3413=0.1587。 各类别的理论次数青: e甲=0.1587 × 50 = 8, e乙=0.6826 × 50 = 34, e 丙=0.1587 × 50=8 ,
2 χ 2 > χ 0.05 (2), p < 0.05, 拒绝零假设.
10.1 拟合度检验: 多项总体
1、几个概念 •多项总体(Multinominal population):有几个类别中,每个 个体被分配到一个类别中. 多项总体涉及到多项概率分 , 3 . 布,它将二项分布由两个类别推广到了3个以上的类别. •拟合度检验(Goodness of fit test):一种用于判断是否拒 绝总体服从假设的概率分布的统计检验方法. •列联表(Contigency table):在独立性检验中,用于汇总观 察频数与期望频数的表格.
16 16 16 2 2 df = 3 − 1 = 2, 查表χ 0.05 2)=5.99, χ 2 > χ 0.05 , p < 0.02, ( 所以,推翻原假设, 即此项民意测验的态度有显著差异。
(24 − 16)2 + (12 − 16)2 + (12 − 16)2 χ2 =
= 6,
例10.3 某班学生50人,体检结果按一定标准划分青甲、乙、丙三类, 各类人数分别青:甲类16人,乙类24人,丙类10人,问该班学生 的身体家家是否符合正态分布?
独立性检验重点讨论: 啤酒的偏好(淡、普通、黑)是否与饮酒 者性别(男、女)独立: H0:啤酒偏好与饮酒者性别独立 H1:啤酒偏好与饮酒者性别相关
啤酒偏好与饮酒者性别列联表
淡啤酒 普通啤酒 黑啤酒 男 cell(1,1) cell(1,2) cell(1,3) 女 cell(2,1) cell(,2) cell(2,3)
假定已经抽取了150名饮酒者组成一个随机样本。品 尝每种啤酒之后,让样本中每人陈述其偏好或第一 选择。汇总如下表:
淡啤酒 普通啤酒 黑啤酒 男 20 40 20 女 30 30 10 合计 50 70 30 CT1 CT2 CT3 合计 80 70 150 RT1 RT2
若H0成立,则男、女都应有相同的分布。
( f i − ei )2 ~ χ(k − 1) 2 χ2 = ∑
k 2 5、拒绝法则:如果χ 2 > χα (k − 1), 则拒绝H 0 i =1
ei
2、拟合度检验的应用举例 拟合度检验的应用举例
拟合度检验可以应用到下列几种场合: (1)检验无差假设 假设各类别之间的概率相原,因此,理论次数=总数×(1/分类项数) (2)检验假设分布的概率 假设某因素各分类的次数分布青某一理论分布(如正态分布),检 验实际次数与理论上期望的结果之间是否有显著差异。 (3)连续变量分布的拟合度检验 对于连续随机变量的一组测量数据,有时需要对其次数分布究竟符 合哪种理论次数的分布进青探讨,这时,就要用到拟合度检验。 (4)资原用百分数表示的拟合度检验 如果收集到的次数资原已经转成百分数,这时拟合度检验的方法与 上述几种人家基本相同,只是最后将计算的卡方值乘以N/100后再查 卡方表。
ei= y×N
1 7 24 60 104 130 114 70 31 9 2
( f i − ei ) 2
ei
0.125 0.167 0.150 0.471 0.277 0.035 1.429 1.161 0.090
169166163160157154151148145142139-
3.03 2.44 1.85 1.26 0.67 0.07 -0.52 -1.11 -1.70 -2.29 -2.88
N=552, X=154.62, S=5.07
χ2=3.905
解:计算理论次数的步骤: (1) 求各组组中值X c与平均数X的离差x, 即x = X c -X; x X c -X = ; S S (3) 根据各Z分数查正态分布表求相应的yi值; (2) 求各离差的标准分数Z = 组距 ; S (5) 求各组的理论次数ei = pi × N (4)求 各分组的概率pi = yi × 由于第一组和最后一组的理论次数 < 5, 所以第一、二组合并, 最后一组和前一组合并,总组数青9。
解:该题属于无差假设,H0:5种态度无显著差异。 解法一、用百分数计算 A fi ei
2
B 20 20
C 8 20
D 12 20
E 36 20
24 20
4 2 0 2 12 2 8 2 16 2 χ = + + + + = 24, 20 20 20 20 20 N 500 χ2 × = 24 × = 120 100 100
正态分布。
例10.4 下表所列资原是552名中学生的身高次数分布, 问这些学生的身高分布是否符合正态分布。
身高 分组 组中值 实际次 Xc-X 数fi Xc =x
170 167 164 161 158 155 152 149 146 143 140 2 7 22 57 110 124 112 80 25 8 4 15.38 12.38 9.38 6.38 3.38 0.38 -2.62 -5.62 -8.62 -11.62 -14.62
第i青之和 × 第j列之和 RTi × CT j eij = = 样本容量 n
独立假设条件下的期望频数青:
淡 普通 黑 合计 男 26.67 37.3 16.00 80 女 23.33 32.7 14 70 合计 50 70 30 150
独立性检验统计量 :
χ 2 = ∑∑
i j
(f
ij
− eij )
解法二、用观察次数计算
A fi ei
2
B 100 100
C 40 100
D 60 100
E 180 100
1ห้องสมุดไป่ตู้0 100
20 2 0 2 60 2 80 2 + + + = 120 χ = 100 100 100 100
2 两种算法的χ 2 值相同, df = 5 − 1 = 4, 查表χ 0.005=14.9, 2 故χ 2 > χ 0.005 , p < 0.005, 所以5种态度的人数或5种态度的百分数有
拟合优度的检验统计量 :
χ2 = ∑
相关文档
最新文档