第十六章 卡方检验 PPT课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/8/5
( 二)自由度的确定
• 一般为资料分类或分组的数目,减去计 算理论次数时候所用统计量的个数
• (三)理论次数的计算,一般将理论概 率乘以总数
2020/8/5
二、配合度检验的应用
• (一)、检验无差假说 • (二) 、检验假设分布的概率
2020/8/5
三、连续变量分布的吻合性检验
2020/8/5
• 当自由度大于1时,直接计算的结果的 分布与连续型随机变量分布相近似,这 时,可不作连续性矫正,但要求各组内 的理论次数不小于5。若某组的理论次 数小于5,则应把它与其相邻的一组或 几组合并,直到理论次数大于5为止。
2020/8/5
第三节 独立性检验
• 主要用于两个或者两个以上因素多项分 类的计数资料的分析,研究两个变量之 间的相关性或称独立性的问题
2020/8/5
独立性检验(要点)
1. 检验列联表中的行变量与列变量之间是否独立 2. 检验的步骤为
– 提出假设
• H0:行变量与列变量独立 • H1:行变量与列变量不独立
– 计算检验的统计量
r
2
c
( fij
f )2 e ij
i 1 j 1
fe ij
fe ij
mr nc N
2020/8/5
进行决策
2020/8/5
卡方分布
• χ2分布是由正态总体随机抽样得来的 一种连续型随机变量的分布。
• 设有一平均数为μ、方差为σ的正态
总体。现从此总体中独立随机抽取n个 随机变量:x1、x2、…、xn,并求出其
标准分数:
z1
x1
2020/8/5
z2
x2
zn
xn
• 记这n个相互独立的标准分数的平方和 为 χ2,它们服从卡方分布。若用样本
2020/8/5
• 例如某一组实际观察次数为505、理论次数为 500,相差5;而另一组实际观察次数为26、 理论次数为21,相差亦为5。显然这两组实际 观察次数与理论次数的偏离程度是不同的。 因为前者是相对于理论次数500相差5,后者 是相对于理论次数21相差5。为了弥补这一不 足,可先将各差数平方除以相应的理论次数 后再相加,并记之为,即
10
876
876
0
∑(f0-fe)2/ fe 0.2283 0.2283 0.4566
2020/8/5
• 这个差异是属于抽样误差、还是比例发生了 实质性的变化?要回答这个问题, 首先需要 确定一个统计量用以表示实际观察次数与理 论次数偏离的程度;然后判断这一偏离程度 是否属于抽样误差,即进行显著性检验。为 了度量实际观察次数与理论次数偏离的程度 ,最简单的办法是求出实际观察次数与理论 次数的差数。显然不能用这两个差数之和来 表示实际观察次数与理论次数的偏离程度。 为了避免正、负抵消,可将差数平方后再相 加,即计算∑(f0-fe)2,其值越大,实际观察次 数与理论次数相差亦越大,反之则越小。但 利用∑(f0-fe)2表示实际观察次数与理论次数的 偏离程度尚有不足。
根据显著性水平和自由度(r-1)(c-1)查出临界值2 若22,拒绝H0;若2<2,接受H0
一、统计检验的一般问题与步骤
• (一)统计假设 • (二)理论次数的计算 • (三)自由度的确定
• 2、如果df>2,这时候卡方分布的平均数:

u
2 χ
=df
,方差σ2χ2
=2df
• 3、随自由度的增大,曲线由偏斜渐趋于对称
;df≥30时, 接2 2近平均数为 布。
2d的f 正1 态分
• 4、 χ2 分布是连续分布,但有些离散型分布 也近似χ2 分布。
2020/8/5
一、 检验的假设
• 1、分类相互排斥 • 2、观测值相互独立(可能会常常违背
平均数代替总体平均数μ,则随机变量
2
(xi x)2
2
2020/8/5
卡方分布的特点
几个自由度的概率分布密度曲线
2020/8/5
• χ2分布是由正态总体随机抽样得来的一种连 续型随机变量的分布。
• 1、显然, χ2 ≥0,即的取值范围是[0,+∞;
分布密度曲线是随自由度不同而改变的一组 曲线。
第十六章 卡方检验 PPT课件
数据的类型与列联分析
数据
定量数据
(数值型数据)
离散数据 连续数据
2020/8/5
定性数据 (品质数据或称次
数计数数据)
列联表分析
检验的别称
• 检验又叫列联表分析或交叉表分析 、表中的单元格内可以是计数的次数 也可以是百分比,所以又可以称为百 分比检验。
• 检验分析计数数据的时候,对计数 数据的分布形态不作任何假设,因此 视为非参数检验的一种。
) • 3、期望次数的大小 • 每一个单元格中的期望次数至少在5个
以上。如果自由度较大,简单处理方法 是每个类别的理论次数不能小于1、 20%的类别理论次数不小于5
2020/8/5
检验某个百度文库本的性别比例和理论比例是否一致
性别 男 女 合计
实际观察次数 理论次数
428
438
f0-fe -10
448
438
2020/8/5
(五) 连续性校正(不考 )
• 当df=1,其中只要有一个组的期望次数小于 5,用检验计算出来的得出的概率偏小,要 有耶茨连续性校正法校正,将实计数和理论 次数的差的绝对值减去0.5再计算
2
(fo-fe -0.5) 2 fe
因为卡方分布实际上是平滑曲线,在每个小于理论次 数的实际次数上加0.5,在大于理论次数的实际次数上减 去0.5,

2020/8/5
检验的公式
• 基本公式
2
(fo-fe)2 fe
它是实际观察次数与理论观察次数之差的平方
除以理论次数的连加和近似2分布,理论次数
越大接近越好
2020/8/5
第二节 配合度检验
• 又称拟和检验,一般是单向表的卡方检 验。
• 一、配合度检验的一般问题 • (一)统计假设 • H0: fo-fe= 0 • H1: fo-fe ≠0
2020/8/5
配合度检验和独立性检验的区别
• (一)独立性检验的次数资料是按两因子属性类别进 行归组。根据两因子属性类别数的不同而构成2×2 、2×c、r×c列联表(r为行因子的属性类别数,c为 列因子的属性类别数)。而配合度检验只按某一因子 的属性类别将如性别、表现型等次数资料归组
• (二)配合度检验按已知的属性分类理论或学说计算 理论次数。独立性检验在计算理论次数时没有现成的 理论或学说可资利用,理论次数是在两因子相互独立 的假设下进行计算。
相关文档
最新文档