3.2.1独立性检验的基本思想及其初步应用
01独立性检验的基本思想及其初步应用.doc

独立性检验的基本思想及其初步应用北京四中 李伟一、 知识讲解研究两个变量的相关关系:问题:为了解患慢性支气管炎与吸烟是否有关,进行了一次抽样调查。
共调查了339名50岁以上的人,其中吸烟者205人,不吸烟者134人. 结果是:吸烟的205人中有43人患呼吸道疾病(简称患病),162人 未患呼吸道疾病(简称未患病);不吸烟的134人中有13人患病, 121人未患病.患病 未患病 合计 吸烟43 162 205 不吸烟13 121 134 合计 56 283 339独立性检验的一般步骤: 一般地,对于两个研究对象X 和Y ,X 有两类取 值:12X X 和(如吸烟与不吸烟),Y 也有两类取值:12Y Y 和(如患呼吸 道疾病与不患呼吸道疾病),得到数据如下: 1X 2X 合计1Y11n 12n 1n + 2Y21n 22n 2n + 合计 1n + 2n + n推断“X 和Y 有关系”的步骤为:第一步,提出假设0H :两个分类变量X 和Y 没有关系;第二步,根据2×2列联表和公式计算2χ统计量;第三步,比对两个临界值,作出判断.二、典型例题例1 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。
例2 在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此资料你是否认为在恶劣气候飞行中男性比女性更容易晕机?例3 在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。
问:该种血清能否起到预防感冒的作用?例4 为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的193个病人的数据,能否作出药的效果和给药方式有关的结论?。
高中数学 第三章 统计案例 3.2 独立性检验的基本思想

1 3.2 独立性检验的基本思想及其初步应用 学习目标 重点、难点 1.能用等高条形图反映两个分类变量之间是否有关系. 2.能够根据条件列出列联表并会由公式求K2. 3.能知道独立性检验的基本思想和方法. 重点:能够根据题目所给数据列出列联表及求K2. 难点:独立性检验的基本思想和方法.
1.分类变量 变量的不同“值”表示个体所属的________,像这样的变量称为______. 2.2×2列联表 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 2×2列联表 y1 y2 总计
x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 预习交流1 下面是2×2列联表: y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 则表中a,b的值分别为( ). A.94,96 B.52,50 C.52,54 D.54,52 3.等高条形图 (1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否________,常用等高条形图展示列联表数据的________. (2)观察等高条形图发现____和______相差很大,就判断两个分类变量之间有关系. 4.独立性检验 (1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. (2)公式K2=__________________. 其中n=a+b+c+d为样本容量. 预习交流2 (1)怎样理解独立性检验的思想? (2)在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是( ). A.100个吸烟者中至少有99人患肺癌 2
B.1个人吸烟,那么这个人至少有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有
第3章-3.2独立性检验的基本思想及其初步应用

得出等高条形图如图所示:
比较图中阴影部分的高可以发现经常上网不及格的频率 明显高于经常上网及格的频率,因此可以认为经常上网与学 习成绩有关.
由k2进行独立性检验
某校高三年级在一次全年级的大型考试中,数学成 绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如 下表所示,则我们能否在犯错误的概率不超过0.001的前提下认为 数学成绩优秀与物理、化学、总分优秀有关系? 物理优秀 数学优秀 数学非优秀 228 143 化学优秀 225 156 总分优秀 267 99
K2的观测值k. (3)如果k≥k0,推断“X与Y有关系”这种推断犯错误的 概率不超过α;否则,就认为在犯错误的概率不超过α的前提 下不能推断“X与Y有关系”,或者在样本数据中没有发现足 够的证据支持结论“X与Y有关系”.
在研究某种药物对“H1N1”病毒的治疗果时,进行动物 试验,得到以下数据,对150只动物服用药物,其中132只动 物存活,18只动物死亡,对照组150只动物进行常规治疗, 其中114只动物存活,36只动物死亡. (1)根据以上数据建立一个2×2列联表; (2)试问该种药物对治疗“H1N1”病毒是否有效?
要得到两个变量之间有关或无关的精确的可信程度,需 作独立性检验的有关计算,K2越小,变量间的关系越弱,当 K2<2.706时,我们认为两个变量无关.
为了调查某生产线上质量监督员甲对产品质量好坏有无 影响,现统计数据如下:质量监督员甲在生产现场时,990 件产品中合格品有982件,次品有8件;甲不在生产现场时, 510件产品中合格品有493件,次品有17件.试分别用列联 表、独立性检验的方法分析监督员甲对产品质量好坏有无影 响?
注:该年级此次考试中数学成绩优秀的有360人,非优秀的有 880人.
独立性检验基本思想及应用

独立性检验基本思想及应用独立性检验是一种用于确定两个变量之间是否存在关联的统计方法。
其基本思想是通过比较观察到的数据与预期的数据之间的差异来推断这两个变量之间的关系。
独立性检验的应用非常广泛。
在社会科学中,独立性检验常被用于研究两个分类变量之间是否存在关联,例如性别和职业、教育水平和政治倾向等。
在医学研究中,独立性检验也可以用来检查某种治疗方法是否与疾病的发展有关,以及风险因素和某种疾病之间的关系。
此外,独立性检验还被广泛应用于市场调查、品牌定位以及质量控制等领域。
独立性检验的基本思想是建立一个零假设(H0)和一个备择假设(H1)。
零假设认为两个变量是独立的,即它们之间没有关联;备择假设则认为两个变量之间存在关联。
独立性检验的步骤可以分为以下几步:1. 收集数据:需要收集两个分类变量的数据,例如通过问卷调查或观察获得数据。
2. 建立列联表:将数据整理成列联表形式,列联表是一种用于描述两个或多个分类变量之间关系的矩阵。
表格的行表示一个变量的不同类别,列表示另一个变量的不同类别,表格中的每个单元格表示两个类别的交叉数量。
3. 计算期望频数:在独立性检验中,我们假设两个变量是独立的,因此可以基于各类别的边际总数以及样本总数来计算期望频数。
期望频数是在两个变量独立情况下,各个类别的交叉数量。
4. 计算卡方统计量:卡方统计量用于衡量观察到的数据与期望数据之间的差异程度。
计算公式为:χ2 = Σ((观察频数- 期望频数)^2 / 期望频数)。
其中,Σ表示对所有单元格进行求和。
5. 设定显著性水平:显著性水平α为决策的临界点,用于决定是否拒绝零假设。
通常,α的常见选择为0.05或0.01。
6. 判断和解释结果:根据计算出的卡方统计量与临界值进行比较,如果计算出的卡方值大于临界值,拒绝零假设,认为两个变量之间存在关联;反之,接受零假设,认为两个变量是独立的。
独立性检验的结果常常以卡方统计量和p值的形式呈现。
p值是在零假设成立的条件下,观察到的数据与期望数据之间差异的概率。
3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)

3. 独立性检验临界值表
P(K2 ≥k 0 ) k0
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想:在K2运算时,在判断变量相关时,若K2的观测值k= 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001, 哪种说法是正确的? 提示 两种说法均正确.
兴趣不浓厚的
总计
86
73
103
95
189
判断学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得 K 的观测值
解 由公式得 K 的观测值 86×103×95×94
2
189× 64×73-22×30 k189 = ×64×73-22×302 ≈38.459. 86 × 103 × 95 × 94 k= ≈38.459.
想一想:如何理解分类变量?
提示
(1)这里的“变量”和“值”都应作为“广义”的变量和值
来理解.例如:对于性别变量,其取值有“男”和“女”两 种,这里的“变量”指的是“性别”,这里的“值”指的是“男”
或“女”.因此,这里说的“变量”和“值”不一定是取具体的
数值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不 吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验
公式
n ad-bc2 a+bc+da+c b+d K2=_______________________ 其中n=___________ a+b+c+d
独立性检验的基本思想及其初步应用说课课件

二、课堂教学引入
2、研究人员记录下他们在这12个月内有无手机的情况,同时教师记 下这些学生出现的注意力不集中的问题,统计获得下列数据:
注意力不集中 有手机 无手机 总计 489 268 757 注意力集中 209 357 566 总计 698 625 1323
(1)在有手机的学生中,注意力不集中的比重为 多少? 设计意图: 在无手机的学生中,注意力不集中的比重为 多少? 通过解决实际中的问题,学生更加清楚数学的重要性。该 (2)根据网上收集到的新闻,利用上述统计结果进行推测。从这则 新闻来看,手机是否对注意力有影响?有多大的把握认为你所得的结论正 研究问题对学生而言很有实际意义,这个新闻从学生的切身实 确?
三、课程内容创新设计
5、卡方统计量公式的合理性说明
方式2 类比方差公式的结构特征
S
2
x E x
2 1
2
E … xn E
2
2
x E
i
2
n
防止正负抵消,掩盖事实的真相 防止因样本容量的不同而使方差的
值差异太大,意在取平均值
1 n
三、课程内容创新设计
5、卡方统计量公式的合理性说明
方式1 类比随机事件概率的来之不易
随机事件 :掷一枚硬币,正面向上。 在经过大量的重复试验之后,频率在常数0.5附近 摆动并趋于稳定,这时称0.5为随机事件的概率。 类比到卡方统计量公式
统计学中的结论公式都是在大量重复试验之后并结合 我们现在还不知道的统计学相关知识后得出的”因为学生对于 这个问题,一直与家长和学校有不同的想法和观点, 探讨时让具有相同看法的学生组成一组,给他们一个 “机会”证明自己的观点,有利于提高学生的积极性。
3.2独立性检验的基本思想及初步应用
解:根据题目所给数据得到如下列联表:
秃顶 不秃顶
总计
患心脏病 不患心脏病
214
175
451
597
665
772
总计 389 1048 1437
根据联表1-13中的数据,得到
K2
1437 (214597 175 451)2
16.373 6.635.
3891048 665 772
所以有99%的把握认为“秃顶患心脏病有关”。
物理优秀 物理非优秀
数学优秀
228
132
数学非优秀 143
737
合计
371
869
代入公式可得 K 2 270.1143.
合计 360 880 1240
数学优秀 数学非优秀
物理 228 143
化学 225 156
其中n a b c d
若H0成立,K 2越小,则吸烟与患肺癌越没有关系
独立性检验有关数据:
P(K2 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 ≥k0)
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
总计
患病 a c
a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
第三步:计算 K 2
n(ad bc)2
(a c)(b d)(a b)(c d)
第四步:查对临界值表,作出判断。
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
人教版高中数学选修2-3课件:3.2 独立性检验的基本思想及其初步应用(共38张PPT)
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
例如:
k0
3.841 5.024 6.635 7.879 10.828
①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;
②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;
③如果k≥6.635,就有99%的把握认为“X与Y有关系”;
≈7.8.
备课素材
附表:P(K2≥k0) k0
0.050 3.841
0.010 6.635
0.001 10.828
参照附表,得到的正确结论是 (A ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c
b+d a+b+c+d
若要推断的论述为H1:“X与Y有关系”,则可以按如下步骤判断H1成立的可能性:
预习探究
预习探究
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0
0.455 0.708 1.323 2.072 2.706
考点类析
考点一 两分类变量之间关联关系的定性分析
例1 为考察某种药物预防某种疾病的效果,进行了一 项动物试验,得到如下列联表:
服用药 未服用药
3.2独立性检验的基本思想及其初步应用
k2≥6.635
4.某班主任对全班50名学生进行了作业量多 少的调查,数据如下表: 认为作业多 玩游戏 不玩游戏 总 计 18 8 26 认为作业不多 总计 9 15 24 27 23 50
则认为喜欢玩游戏与认为作业量多少有关系的 把握大约为( B ) A. 99% B. 97.5% C. 90% D.无充分依据
2. 下面是一个
2 2
21 25 46
列联表 总计
不健康 健 康
不优秀 a 优 秀 2 总 计 b
73 27 100
则表中a,b的值分别是( c ) A. 94,96 B. 52,50 C. 52,54 D. 54,52
3. 在独立性检验中,当统计量满足 时, 我们有99%的把握认为这两个分类变量有 关系.
枣庄市第十八中学
主讲人 秦真
一、目标展示
1、了解独立性检验的基本思想、方法及其初 步应用。 2、会从列联表(只要求2×2列联表)、条形 图直观分析两个分类变量是否有关
3.会用公式判断两个分类变量在某种程度上的 相关性
问题: 数学家庞加莱每天都从一家
面包店买一块1000g 的面包,并记 录下买回的面包的实际质量。一年 后,这位数学家发现,所记录数据 的均值为950g。于是庞加莱推断这 家面包店的面包分量不足。
思想方法上: 数形结合的思想, 类比的思想
作业:教材习题3.2 1,2
当堂达标
1.在吸烟与患肺病这两个分类变量的计算中,下 列说法正确的是 ( c ) A. 若k=6.635,则有99%的把握认为吸烟与患肺病 有关,那么100名吸烟者中,有99个患肺病. B. 从独立性检验可知,有99%的把握认为吸烟与 患肺病有关时,可以说某人吸烟,那么他有99%的可 能性患肺病. C. 若从统计量中求出有95%的把握认为吸烟与患 肺病有关,是指有5%的可能性使推断出现错误. D. 以上三种说法都不对.
独立性检验的基本思想及其初步应用导学(谢成志) (1)
3.2独立性检验的基本思想及其初步应用【学习目标】通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题。
【学习过程】问题的引入:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与肺癌列联表患肺癌不患肺癌总计吸烟49 2099 2148不吸烟42 7775 7817总计91 9874 9965那么吸烟是否对患肺癌有影响?直观上来判断:在不吸烟的样本中,有_______%患肺癌;在吸烟的样本中,则有______%由此,吸烟群体和不吸烟群体患肺癌的可能性存在差异.但,这种“差异”有多大呢?能够有一个评判的标准呢?我们可以通过以下的统计分析回答这个问题。
独立性检验:1、把上表中数字用字母代替,得到如下用字母表示的列联表:吸烟与肺癌列联表不患肺癌患肺癌总计吸烟 a b a+b不吸烟 c d c+d总计a+c b+d a+b+c+d2、假设H :吸烟与患肺癌没有关系那么吸烟样本中不患肺癌的比例应该与不吸烟样本中不患肺癌的比例差不多,即: __________________________________________ 因此:bcad -越小说明吸烟与患肺癌之间的关系______.反之,则_____3、计算2K为了使不同样本变量的数据有统一的评测标准,构造一个随机变量2K = _________________________________________________________ 其中_______________=n 为样本容量.从而,若H 成立,即“吸烟与患肺癌没有关系”,则2K 应该_______,反之,2K 应该___________。
上题2K =56.632.这个值到底能告诉我们什么?能从中得到什么结论? 4、查表 P (2K >k0) 0.50 0.40 0.25 0.15 0.10 k0 0.4550.7081.3232.0722.706P (K2>k0) 0.05 0.025 0.010 0.005 0.001 k03.8415.0246.6357.87910.828上题中2K =56.632>10.828,所以001.0)828.10(2=>K P 该数据表明了在假设0H 成立的情况下,2K 的值大于10.828的概率非常小,为0.001,是一个小概率事件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
赞皇中学高二年级数学学科导学案
课型____ 主备人______ 审核人_____ 时间年__月__日
班级____ 姓名______ 小组______
3.2.1独立性检验的基本思想及其初步应用
课前预习
阅读教材P91-P95,了解相关概念,如:分类变量、列联表、独立性检验。
学习目标
(1)通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、
方法及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法。
学习重点:独立性检验的基本方法
学习难点:基本思想的领会
学习过程
一、情境引入
5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑
血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965
个人,其中吸烟者2148人,不吸烟者7817人。调查结果是:吸烟的2148人中有49人
患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”?
二、学生活动
【自主学习】
(1)将上述数据用下表(一)来表示:
不患肺癌 患肺癌 总计
不吸烟
吸烟
总计
(2)估计吸烟者与不吸烟者患肺癌的可能性差异:
在不吸烟者中患肺癌的人约占多大比例?;
在吸烟的人中患肺癌的人约占多大比例?。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大?
【合作探究】
1、观察、分析样本数据的列联表和柱形图、条形图,你能得出什么结论?
2
2、该结论能否推广到总体呢?
3、假设0H:患肺癌与吸烟没有关系。则两事件发生的概率有何关系?
不患肺癌 患肺癌 总计
不吸烟 a b a+b
吸烟 c d c+d
总计 a+c b+d a+b+c+d
试用上表(二)中字母表示两概率及其关系,并化简该式。你能得到何结论?
4、构造随机变量22()()()()()nadbcKabcdacbd(其中nabcd),结合3
中结论,若0H成立,则K2应该很(大、小)
根据表(一)中的数据,利用4中公式,计算出K2的观测值,该值说明什么?(统计
学中有明确的结论,在0H成立的情况下,P(K2≥6.635)≈0.01。)
5、结合表(二)和三维柱形图、二维条形图如何判断两个分类变量是否有关系?利
用独立性检验呢?二者谁更精确?
【当堂检测】
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772
名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方
法判断秃顶与患心脏病是否有关系?
3.2.2独立性检验的基本思想及其初步应用
学习目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K2进
行独立性检验.
学习重点:独立性检验的应用
学习过程
一.前置测评
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收
集哪些数据?。
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据
如下表:
专业
性别
非统计专业 统计专业
男 13 10
女 7 20
3
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
K2250(1320107)4.84423272030,∵K2≥3.841,
所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为。
附:临界值表(部分):
P
(K2≥k0)
0.10 0.05 0.025 0.010
k0 2.706 3.841 5.024 6.635
二.典型例题
例1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随
机抽取300名学生,得到如下列联表:
喜欢数学课程 不喜欢数学课程 总 计
男 37 85 122
女 35 143 178
总 计 72 228 300
由表中数据计算得到2K的观察值k≈4.514. 在多大程度上可以认为高中生的性别与是
否数学课程之间有关系?为什么?
例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进
行了相应的抽样调查,调查结果如表所示。根据所选择的193个病人的数据,能否作出
药的效果与给药方式有关的结论?
有效 无效 合计
口服 58 40 98
注射 64 31 95
合计 122 71 193
谈一谈:结合例1和例2你如何理解独立性检验。
4
三、巩固练习:
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列
联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
不健康 健 康 总计
不优秀 41 626 667
优 秀 37 296 333
总 计 78 922 1000