18学年高中数学第一章统计案例1.2独立检验的基本思想及其初步应用教学案新人教A版选修1_2

合集下载

高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用课件1新人教A版选修1_22017083032

高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用课件1新人教A版选修1_22017083032

笛卡儿
能否用数量来刻画“有关”程度
不吸烟但患病的人数约为 n• •
不吸烟也不患病的人数约为 n• •
怎样估计实际观测值与理论估计值的误差?
采用如下的量(称为K2 统计量)来刻画这个差异:
+
+
+
化简得
K2 = K2 =11.8634
K 2统计量
解决问题的思路
• • • • • 思路:反证法思想 (1)假设:H0:患病与吸烟无关 即 P(A)P(B)= P(AB) (2)在 H0成立的条件下进行推理 (3)如果实际观测值与由(2)推出的值 相差不大,则可以认为这些差异是由随机 误差造成的,假设H0不能被否定;否则, 假设H0不能被接受
(2)若观测值K2>6.635, 则有99%的把握认为“Ⅰ与Ⅱ有关系”;
(3)若观测值K2>2.706, 则有90%的把握认为“Ⅰ与Ⅱ有关系”;
(4)若观测值K2<2.706, 则没有充分的证据显示“Ⅰ与Ⅱ有关 系”,但也不能作出结论“H0成立
题型一 有关“相关的检验” 【例1】 某校对学生课外活动进行调查,结果整理成 下表: 试用你所学过的知识进行分析,能否在犯错误的概 率不超过 0.005 的前提下,认为“喜欢体育还是文娱 与性别有关系”?
解:提出假设
H0:药的效果与给药方式无关系。
根据列联表中的数据可以求出:
2 193 (58 31 40 64) K2 1.3896 2.706 122 71 98 95
当H0成立时,K 2 1.3896 的概率大于10%, 这个概率比较大,所以根据目前的调查数 据,不能否定假设H0,即不能作出药的效 果与给药方式有关的结论。
数据整理
患病 吸烟 37 21 未患病 183 274 合计 220 295 515

高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用1教案文新人教A版选修1

高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用1教案文新人教A版选修1

1.2独立性检验的基本思想及其初步应用(1)精美句子1、善思则能“从无字句处读书”。

读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。

读大海,读出了它气势磅礴的豪情。

读石灰,读出了它粉身碎骨不变色的清白。

2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。

幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。

幸福是“零落成泥碾作尘,只有香如故”的圣洁。

幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。

幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。

幸福是“人生自古谁无死,留取丹心照汗青”的气节。

3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。

4、成功与失败种子,如果害怕埋没,那它永远不能发芽。

鲜花,如果害怕凋谢,那它永远不能开放。

矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。

蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。

航船,如果害怕风浪,那它永远不能到达彼岸。

5、墙角的花,当你孤芳自赏时,天地便小了。

井底的蛙,当你自我欢唱时,视野便窄了。

笼中的鸟,当你安于供养时,自由便没了。

山中的石!当你背靠群峰时,意志就坚了。

水中的萍!当你随波逐流后,根基就没了。

空中的鸟!当你展翅蓝天中,宇宙就大了。

空中的雁!当你离开队伍时,危险就大了。

地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。

朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。

高中数学第一章统计案例1.2独立性检验的基本思想及初步应用教案新人教A版选修1_2

高中数学第一章统计案例1.2独立性检验的基本思想及初步应用教案新人教A版选修1_2

高中数学第一章统计案例1.2独立性检验的基本思想及初步应用教案新人教A版选修1_2独立性检验的基本思想及其初步应用【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。

2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。

3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。

【教学重点】了解独立性检验的基本思想及实施步骤。

【教学难点】K的含义。

独立性检验的基本思想;随机变量2【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。

【教学方式】多媒体辅助,合作探究式教学。

【教学过程】一、情境引入,提出问题问题1、你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?二、阅读教材,探究新知1.分类变量对于性别变量,其取值为男和女两种:这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。

生活中有很多这样的分类变量如:2.列联表为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表3—7 吸烟与患肺癌列联表单位:人列联表称为22 列联表)。

问题1、吸烟与患肺癌有关系吗?由以上列联表,我们估计①在不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比例为。

因此,直观上可以得到结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异。

还有其它方法来判断吸烟和患肺癌有关呢?3.等高条形图比较图中两个深色条的高可以发现,在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更容易引发肺癌。

三、小组讨论,合作交流问题2、你有多大程度判断吸烟与患肺癌有关?用什么方法进行检验呢?我们先假设 0H :吸烟与患肺癌没有关系。

人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》优质课教案_0

人教A版高中数学选修1-2《一章 统计案例  1.2 独立性检验的基本思想及其初步应用》优质课教案_0

《独立性检验的基本思想及其初步应用》教学设计一、学习目标:1、了解利用列联表、等高条形图来判断两个分类变量之间是否有关系;2、探究“吸烟是否与患肺癌有关系”的问题,理解独立性检验的基本思想,明确独立性检验的基本步骤;3、会对2×2列联表进行独立性检验;并能利用独立性检验的基本思想来解决实际问题。

教学重点:通过实例让学生体会独立性检验的基本思想,掌握独立性检验的一般步骤。

教学难点:独立性检验的基本思想。

二、教材分析本节课通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想和初步应用。

“独立性检验”是在考察两个分类变量之间是否有关的背景下提出的,因此教材上首先提到了分类变量的概念,并给出了考察两个分类变量之间是否相关的一种简单的思路,即借助等高条形图的方法,随后引出相对更精确地解决办法——独立性检验。

独立性检验的思想是建立在统计思想、假设检验思想(小概率事件在一次试验中几乎不可能发生)等基础之上。

虽然本节是新增内容,理论比较复杂,涉及到大学的知识,教学时间也不长(1-2课时),但由于它贴近实际生活,体现出数学应用教育价值,故地位不可小视. 该内容是学生前面学习的《必修三》中的统计知识的进一步应用,并与本册课本前一节内容《回归分析的基本思想及其初步应用》(研究两定量变量的相关性)相呼应,此外还涉及到《选修1-2》中的“反证法”思想.通过本节课的学习使文科学生认识到统计方法在决策中的作用,是高中数学知识中体现统计思想的重要内容之一,是素质教育的重要组成部分。

随着现代信息技术飞速传播和发展,人们每天都会接触到影响生活的统计信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。

三、学情分析本节课是在学习了必修三种的统计、前一节的回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。

但“反证法”学生后面才能学到,因此在教学中用“反证法原理”类比“独立性检验的原理”删去,*的前提改为学生能接受理解的生活中的例子。

高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用课件1新人教A版选修12083032

高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用课件1新人教A版选修12083032

解决问题的思路(sīlù)
• 思路:反证法思想
• (1)假设:H0:患病与吸烟无关

即 P(A)P(B)= P(AB)
• (2)在 H0成立的条件下进行推理
• (3)如果实际(shíjì)观测值与由(2)推出 的值相差不大,则可以认为这些差异是由随 机误差造成的,假设H0不能被否定;否则, 假设H0不能被接受
183
274
457
合计
220 295 515
问题:判断(pànduàn)的标准 是什么?
第五页,共22页。
吸烟与不吸烟,患病的可能性的大小(dàxiǎo)是否有差异?
频率(pínlǜ)估计 概率
患 病 未患病 合 计(n)
吸烟 不吸烟
16.82% 7.12%
83.18% 100%(220) 92.88% 100%(295)
调查结果:吸烟(xī yān)的220人中有37人患呼 吸道疾病,183人未患呼吸道疾病;不吸烟(xī yān)的295人中有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾病 (jíbìng)与吸烟有关?
第四页,共22页。
数据(shùjù)整理
吸烟 不吸烟
合计
患病
37 21 58
未患病
第十九页,共22页。
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, ∴k=a+bcn+add-ab+cc2b+d =21+237×9×6+212×9×29-212+3×66×223+29≈8.106.
与给药方式有关的结论。

2017_2018学年高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用学案含解析新人教A版

2017_2018学年高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用学案含解析新人教A版

1.2 独立性检验的基本思想及其初步应用[提出问题问题1:观察教材第10页的探究,其中的频数表叫什么?提示:列联表.问题2:由表中数据,你能说吸烟对患肺癌有影响吗?提示:能.问题3:如何用数字分析此类问题?提示:利用随机变量K2进行分析.[导入新知]1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称2×2列联表)为:3.等高条形图将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.4.K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=n ad -bc2,其中n=a+b+c+d为样本容量.a +b c+d a+c b+d5.独立性检验利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验.[化解疑难]反证法原理与独立性检验原理的比较反证法原理——在假设H0下,如果推出一个矛盾,就证明了H0不成立.独立性检验原理——在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过小概率.[提出问题]问题:利用随机变量K2进行独立性检验需要几步?提示:三步.[导入新知]独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查右表确定临界值k0.(2)利用公式K2=n ad-bc2a +b c+d a+c b+d,计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.[化解疑难]详析独立性检验(1)通过列联表或观察等高条形图判断两个分类变量之间有关系,属于直观判断,不足之处是不能给出推断“两个分类变量有关系”犯错误的概率,而独立性检验可以弥补这个不足.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.[例1] 生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.[解] 作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.[类题通法]细解等高条形图(1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色.(2)等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显即aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.[活学活用]为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:利用等高条形图判断父母吸烟对子女吸烟是否有影响.解:等高条形图如下:由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.[例2] (在全校一年级学生中进行了抽样调查,调查结果如下表所示:惯方面有差异”?[解] 将2×2列联表中的数据代入公式计算,得k=-270×30×80×20=10021≈4.762.由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.[类题通法]解决独立性检验问题的思路解决一般的独立性检验问题,首先由题目所给的2×2列联表确定a,b,c,d,n的值,然后代入随机变量K2的计算公式求出观测值k,将k与临界值k0进行对比,确定有多大的把握认为“两个分类变量有关系”.[活学活用]某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:(1)(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?解:(1)列联表如下:(2)K2=≈3.571<3.841,120×80×168×32所以不能在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关.1.独立性检验与统计的综合应用[典例] (12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表.表1:A类工人生产能力的频数分布表表2:B类工人生产能力的频数分布表(1)确定x ,y 的值;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.附:K 2=n ad -bc 2a +bc +d a +c b +d,[解题流程][规范解答](1)∵从该工厂的工人中抽取100名工人,且该工厂中有250名A 类工人,750名B 类工人,∴要从A 类工人中抽取25名,从B 类工人中抽取75名,(2分) ∴x =25-8-3-2=12,y =75-6-27-18=24.(4分) (2)根据所给的数据可以完成列联表,如下表所示:由列联表中的数据,得K2的观测值为k=-225×75×50×50=12>10.828.(10分)因此,在犯错误的概率不超过0.001的前提下,认为工人的生产能力与工人的类别有关系.(12分)[名师批注]要确定x,y的值,应先确定A类工人及B类工人中应各抽取多少人,此处易误认为x =25,y=75,从而导致解题错误分此处易犯错误有两点:①计算失误;②将公式中的数据搞错[活学活用]电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分的观众称为“体育迷”,已知“体育迷”中有10名女性.根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?附:解:由频率分布直方图可知,在抽取的100名观众中,“体育迷”有25名,“非体育迷”有75名,又已知100名观众中女性有55名,女“体育迷”有10名,所以男性有45名,男“体育迷”有15名,从而可完成2×2列联表,如下表:由2×2列联表中的数据,得K 2的观测值为k =-245×55×75×25≈3.030.因为3.030<3.841,所以没有充分的证据表明“体育迷”与性别有关.[随堂即时演练]1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A .94,96 B .52,50 C .52,54D .54,52解析:选C 由⎩⎪⎨⎪⎧a +21=73,a +2=b ,得⎩⎪⎨⎪⎧a =52,b =54.2.博士生和硕士生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表.由表中的数据,可得( )A.性别与获取学位类别有关B.性别与获取学位类别无关C.性别决定获取学位的类别D.以上说法都不正确解析:选 A 由列联表中的数据,得K2的观测值为k=-2×340 305×35×189×151≈7.34>6.635,所以在犯错误的概率不超过0.01的前提下,认为性别与获取学位类别有关.而选项C 中的表述不恰当,因为性别与获取学位类别不是因果关系,只是统计学上的一种非确定性关系,故不能用“决定”二字描述.3.独立性检验所采用的思路是:要研究A,B两类变量彼此相关,首先假设这两类变量彼此________.在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设________.答案:无关不成立4.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知,在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________(填序号).解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③5.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.能否在犯错误的概率不超过0.10的前提下推断在天气恶劣的飞机航程中男乘客比女乘客更容易晕机?解:由已知条件得出下面的2×2列联表:由公式可得K2的观测值k=n ad-bc2a +b c+d a+c b+d=-255×34×32×57≈3.689>2.706.故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.[课时达标检测]一、选择题1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是( ) A.2×2列联表 B.独立性检验C.等高条形图 D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即k越小,“X与Y有关系”的可信程度越小.故选B.3.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A和B有关系,则具体计算出的数据应该是( )A.k≥6.635 B.k<6.635C.k≥7.879 D.k<7.879解析:选C 犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A.成绩 B.视力C.智商 D.阅读量解析:选D 因为k 1=-2 16×36×32×20=52×8216×36×32×20,k 2=-2 16×36×32×20=52×112216×36×32×20,k 3=-2 16×36×32×20=52×96216×36×32×20,k 4=-2 16×36×32×20=52×408216×36×32×20,则有k4>k2>k3>k1,所以阅读量与性别关联的可能性最大.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K2=a +b c+d a+c b+d算得,观测值k=-260×50×60×50≈7.8.附表:A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A 由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.二、填空题6.下列关于K 2的说法中,正确的有________(填序号). ①K 2的值越大,两个分类变量的相关性越大; ②K 2的计算公式是K 2=n ad -bc a +bc +d a +cb +d;③若求出K 2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.解析:对于①,K 2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad -bc )应为(ad -bc )2,故②错;③④对.答案:③④7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:差别的结论________(填“能”或“不能”).解析:根据列联表中的数据,可以求得K2的观测值k=-2 68×324×196×196≈1.779.K2<2.072的概率为0.85.不能作出这两种手术对病人又发作心脏病的影响有差别的结论.答案:1.779 不能三、解答题9.巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿命的调查资料:500名贪官中有348人的寿命小于平均寿命,152人的寿命大于或等于平均寿命;590名廉洁官员中有93人的寿命小于平均寿命,497人的寿命大于或等于平均寿命.这里,平均寿命是指“当地人均寿命”.能否在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间有关系?解:据题意列2×2列联表如下:由公式得K2的观测值k=-2 500×590×441×649≈325.635.因为325.635>6.635,因此,在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间是有关系的.10.某地震观测站对地下水位的变化和发生地震的情况共进行1 700次观测,列联表如下:分的证据显示二者有关系.解:相应的等高条形图如图所示.图中两个阴影条的高分别表示水位有变化和水位无变化的样本中有震的频率.由图可看出,水位有变化样本中有震的频率与水位无变化样本中有震的频率相差不大,因此不能判断地震与水位变化有关系.根据列联表中的数据,得K2的观测值为k=×618-21 000×700×180×1 520≈1.594<2.072,所以题中数据没有充分的证据显示地下水位的变化与地震的发生有关系,但也不能认为二者无关系.。

人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》优质课教案_5

“体现高中数学相关分支教育价值的教学设计”——《独立性检验的基本思想及其初步应用》(人教A版选修1-2第一章第二节)一、教学设计1、内容和内容解析本节课主要内容是通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。

“独立性检验”是在考察两个分类变量之间是否具有相关性的背景下提出的,因此教材上首先提到了分类变量的概念,并给出了考察两个分类变量之间是否相关的一种简单的思路,即借助等高条形图的方法,随后引出相对更精确地解决办法——独立性检验。

独立性检验的思想是建立在统计思想、假设检验思想(小概率事件在一次试验中几乎不可能发生)等基础之上。

虽然本节是新增内容,理论比较复杂,教学时间也不长(1-2课时),但由于它贴近实际生活,体现出数学应用教育价值,故地位不可小视. 该内容是学生前面学习的《必修三》中的统计知识的进一步应用,并与本册课本前一节内容《回归分析的基本思想及其初步应用》(研究两普通变量的相关性)相呼应,此外还涉及到《选修1-2》中的“反证法”思想.通过本节课的学习使文科学生认识到统计方法在决策中的作用,是高中数学知识中体现统计思想的重要内容之一,是素质教育的重要组成部分。

随着现代信息技术飞速传播和发展,人们每天都会接触到影响生活的统计信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。

2、目标和目标解析①知识与技能目标通过对典型案例(吸烟和患肺癌有关吗?)的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。

②过程与方法目标通过探究“吸烟和患肺癌是否有关系”引出独立性检验的问题,借助样本数据的列联表画出等高条形图,直观判断出吸烟和患肺癌可能有关系。

这一直觉来自于观测数据,即样本。

问题是这种来自于样本的印象能够在多大程度上代表总体,这节课就是为了解决这个问题,让学生经历逐步领会独立性检验基本思想的体验过程,提高学生的数据分析能力。

人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》优质课教案_25

1.2独立性检验的基本思想及其初步应用教材分析:本节课是人教A版(选修)1—2第一章第二单元第二课时的内容.在本课之前,学生已经学习过反证法和回归分析的基本思想及初步应用。

本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。

在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。

在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。

独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。

因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。

学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。

这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。

学情分析:学生在学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。

本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。

一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。

①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。

了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。

二. 教学目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。

河北省高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用导学案无答案新人教A版选修

典例分析:
类型一:两个分类变量关系的直观分析
例1:
跟踪训练1:甲、乙两校体育达标抽样测试,其数据见下表:
两校体育达标情况抽检
达标人数
未达标人数
合计
甲校
48
62
110
乙校
52
38
90
合 计
100
100
200
若要考察体育达标情况与学校是否有关系最适宜的统计方法是( )
A.回归分析 B.独立性检验 C.相关系数D.平均值
类型三:独立性检验的应用
例3:在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超 过1%的前提下认为该种血清能起到预防感冒的作用.
未感冒
感冒
合计
使用血清
258
242
500
未使用血清
216
284
500
合计
②2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为__________ 和__________ ,其样本频数列联表(也称为2×2列联表)为下表.
Y1
Y2
总计
X1
a
b
a+b
X2
c
d
c+d
总计
a+c
b+d
a+b+c+d
4.独立性检验
(1)定义:利用随机变量K2来判断______________________的方法称为独立性检验.
判断方法是:如果k≥ k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”.按照上述规则,把“两个分类变量没有关系”错误地判断为“两个分类变量有关系”的概率为__________.

教育最新2018_2019学年高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用同步学案新人教A版选修1

§1.2独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例的分析,了解独立性检验的基本思想与方法.知识点一分类变量及2×2列联表思考某城市随机抽取一年(365天)内100天的空气质量指数API(AirPollutionIndex)的监测数据,结果统计如下:若本次抽取的样本数据有30天是在供暖季,其中有7天为重度污染,完成下面表格.梳理 (1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表.知识点二 等高条形图1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.2.如果通过计算或等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.知识点三 独立性检验1.定义:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.2.K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).其中n =a +b +c +d 为样本容量. 3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.( √) 2.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算K2的观测值k=27.63,根据这一数据进行分析,我们有理由认为打鼾与患心脏病是无关的.( ×)3.在独立性检验中,当K2≥6.635时,我们有99%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为99%,而不是两分类变量有关系的概率为99%.( √) 4.独立性检验的基本思想类似于反证法.( √)5.利用K2进行独立性检验,可对推断犯错误的概率作出估计,其估计可靠性与样本容量n 无关.( ×)6.列联表仅对两个分类变量汇总统计.( √)类型一直观分析两个分类变量的关联性例1 为调查某生产线上某质量监督员甲在不在场对产品质量的好坏有无影响,现统计数据如下:质量监督员甲在场时,990件产品中合格品有982件,次品有8件;甲不在场时,510件产品中合格品有493件,次品有17件.试分别用列联表和等高条形图对数据进行分析.考点定性分析的两类方法题点利用图形定性分析解根据题目所给数据得如下2×2列联表:由列联表看出|ad-bc|=|982×17-493×8|=12750,数较大,所以可在某种程度上认为“质量监督员甲在不在场与产品质量有关”.等高条形图如图所示.所以由等高条形图可知,在某种程度上,可认为“质量监督员甲在不在场与产品质量有关”.反思与感悟(1)利用列联表直接计算ad-bc,如果差的绝对值很大,就判断两个分类变量之间有关系.(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论.这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.跟踪训练1 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,试作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.考点定性分析的两类方法题点用图形定性分析解考前心情紧张与性格类型列联表如下:ad-bc=332×381-213×94=106470,∴|ad-bc|比较大,说明考前心情是否紧张与性格类型有关.图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向占的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情是否紧张与性格类型有关.类型二由K2进行独立性检验例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别. 考点 独立性检验及其基本思想 题点 独立性检验的方法解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据得a =39,b =157,c =29,d =167,a +b =196,c +d =196,a +c =68,b +d =324,n =392, 由公式得K 2的观测值k =392×(39×167-157×29)2196×196×68×324≈1.779.因为k ≈1.779<2.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别. 反思与感悟 (1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0,因此|ad -bc |越小,关系越弱;|ad -bc |越大,关系越强. (2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k 0.②利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值k .③如果k ≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”.跟踪训练2 某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?K2=n(ad-bc)2(a+b)(a+c)(c+d)(b+d)(其中n=a+b+c+d)考点独立性检验及其基本思想题点独立性检验的方法解(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2). 故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:由公式得K 2的观测值k =100×(15×25-15×45)260×40×30×70=2514≈1.786.又因为1.786<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,k =110×(40×30-20×20)260×50×60×50≈7.8,附表:参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 C解析 结合给定数据和附表,得选项C 正确.2.(2018·山东临沂期末)下列关于等高条形图的叙述正确的是( )A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图中可以粗略地看出两个分类变量是否有关系D .以上说法都不对 考点 定性分析的两类方法 题点 利用图形定性分析 答案 C解析 在等高条形图中仅能粗略判断两个分类变量的关系,故A 错;在等高条形图中仅能够找出频率,无法找出频数,故B 错;显然C 正确,故选C.3.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:根据列表数据,求得K 2的观测值k ≈________. 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 7.469解析 k =339×(43×121-162×13)256×283×205×134≈7.469.4.两个分类变量X ,Y ,它们的取值分别为x 1,x 2和y 1,y 2,其列联表为:若两个分类变量X ,Y 独立,则下列结论: ①ad ≈bc ;②aa +b ≈cc +d;③c +d a +b +c +d ≈b +da +b +c +d ;④c +a a +b +c +d ≈b +da +b +c +d;⑤(a +b +c +d )(ad -bc )2(a +b )(b +d )(a +c )(c +d )≈0. 其中正确的序号是________. 考点 定性分析的两类方法 题点 利用列联表定性分析 答案 ①②⑤解析 因为分类变量X ,Y 独立,所以aa +b +c +d ≈a +c a +b +c +d ×a +ba +b +c +d,化简得ad ≈bc ,故①⑤正确;②式化简得ad ≈bc ,故②正确.故填①②⑤.5.“全国文明城市”称号是最有价值的城市品牌,某市为创建第五届“全国文明城市”,开展了“创建文明城市人人有责”活动.为了了解哪些人更关注“创城”活动,随机抽取了年龄在10~70岁之间的100人进行调查,并按年龄绘制如下频数分布表.(1)求表中a,b的值,并补全频率分布直方图;(2)把年龄落在区间[10,30)和[30,70]内的人分别称为“青少年人”和“中老年人”,若“中老年人”中有35人关注“创城”活动,根据已知条件完成下面的2×2列联表,据此统计结果能否有99%的把握认为“中老年人”比“青少年人”更关注“创新”活动?附:参考公式和临界值表:K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d. 考点独立性检验及其基本思想题点独立性检验的思想解(1)由频率分布直方图知[20,30)的频率为0.3,∴a100=0.3,a=30,b=100-(15+30+35+5+5)=10.(2)依题意可知,“青少年人”共有15+30=45人,“中老年人”共有100-45=55人,完成2×2列联表如下:结合列联表的数据得K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)=100×(30×35-20×15)250×50×55×45≈9.091,∵P(K2≥6.635)=0.01,9.091>6.635,∴有99%的把握认为“中老年人”比“青少年人”更关注“创城”活动.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2的值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.一、选择题1.如图所示的是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的比例约为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例约为60%考点定性分析的两类方法题点利用图形定性分析答案 C解析由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.故选C.2.下列关于K2的说法正确的是( )A.K2在任何相互独立的问题中都可以用来检验有关系还是无关系B.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适用D.K2的观测值的计算公式为k=n(ad-bc)(a+b)(c+d)(a+c)(b+d)答案 C解析本题主要考查对K2的理解,K2是用来判断两个分类变量是否有关系的随机变量,所以A错;K2的值越大,说明我们能以更大的把握认为两个分类变量有关系,不能判断相关性的大小,所以B错;D中(ad-bc)应为(ad-bc)2.3.下面是一个2×2列联表:则表中a,b处的值分别为( )A.94,96 B.52,50C.54,52 D.52,60考点分类变量与列联表题点求列联表中的数据答案 D解析∵a+21=73,∴a=52.又b=a+8=52+8=60.故选D.4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X与Y 有关系”的可信度.如果k>3.841,那么就有把握认为“X与Y有关系”的百分比为( )A.95% B.5%C.2.5% D.97.5%答案 A解析因为k>3.841,所以有把握认为“X与Y有关系”的百分比为95%.故选A.5.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )A.99% B.97.5%C .95%D .无充分依据考点 分类变量与列联表 题点 求观测值 答案 B解析 由表中数据得K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024.所以约有97.5%的把握认为两变量之间有关系.故选B.6.通过随机询问250名不同性别的大学生在购买食物时是否看营养说明书,得到如下2×2联表:从调查的结果分析,认为性别和读营养说明书的关系为( ) A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关 D .99.9%以上认为有关 答案 D解析 根据题意,得K 2=250×(90×70-60×30)2120×130×150×100≈21.63>10.828,∴有99.9%的把握认为性别和看营养说明书有关.故选D.7.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ) A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 D解析 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.8.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )A.aa +b 与cc +d B.ac +d 与ca +bC.aa +d 与cb +cD.ab +d 与ca +c考点 定性分析的两类方法 题点 利用图形定性分析 答案 A解析 由题意,⎪⎪⎪⎪⎪⎪a a +b -c c +d =⎪⎪⎪⎪⎪⎪ac +ad -ac -bc (a +b )(c +d )=⎪⎪⎪⎪⎪⎪ad -bc (a +b )(c +d ),因为|ad -bc |的值越大,两个分类变量有关系的可能性就越大,故选A.9.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,参考下面所给附表,则下列说法正确的是( )A.列联表中c 的值为30,b 的值为35 B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系” 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C解析 ∵成绩优秀的概率为27,∴成绩优秀的学生数是105×27=30.成绩非优秀的学生数是75,∴c =20,b =45,选项A ,B 错误.又根据列联表中的数据,得到K 2的观测值k =105×(10×30-20×45)255×50×30×75≈6.109>5.024,因此有97.5%的把握认为“成绩与班级有关系”.故选C. 二、填空题10.有两个分类变量X ,Y ,其列联表如图所示,其中a,15-a 均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X ,Y 有关,则a 的值为________. 考点 分类变量与列联表 题点 求列联表中的数据 答案 8或9解析 根据公式,得K 2的观测值 k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8,9时满足题意.11.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:设H:服用此药的效果与患者的性别无关,则K2的观测值k≈________(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的可能性为________.考点分类变量与列联表题点求观测值答案 4.882 5%解析由公式计算得K2的观测值k≈4.882,∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.三、解答题12.某学校高三年级共有1000名学生,其中男生650人,女生350人,为了调查学生周末的休闲方式,用分层抽样的方法抽查了200名学生.(1)完成下面的2×2列联表:(2)在抽取的样本中,调查喜欢运动女生的运动时间,发现她们的运动时间介于30分钟到90分钟之间,下图是测量结果的频率分布直方图,若从区间段[40,50)和[60,70)的所有女生中随机抽取两名女生,求她们的运动时间在同一区间段的概率.考点分类变量与列联表题点求列联表中的数据解(1)根据分层抽样的定义,可知抽取男生130人,女生70人,(2)由频率分布直方图可知在[40,50)内的人数为2,设为m,n,在[60,70)内的人数为4,设为a,b,c,d.设“两人的运动时间在同一区间段”的事件为A.从中抽取两名女生的可能情况有:(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d),(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),两人的运动时间恰好在同一区间段的可能情况有7种.结合古典概型,得P(A)=715.13.随着“全面二孩”政策推行,我市将迎来生育高峰.今年元旦伊始,我市各医院产科就已经是一片忙碌,至今热度不减.卫生部门进行调查统计,期间发现各医院的新生儿中,不少都是“二孩”;在市中医院,共有40个狗宝宝降生,其中20个是“二孩”宝宝;市湘东医院共有30个狗宝宝降生,其中10个是“二孩”宝宝.(1)从两个医院当前出生的所有宝宝中按分层抽样方法抽取7个宝宝做健康咨询.①在市中医院出生的一孩宝宝中抽取多少个?②若从7个宝宝中抽取两个宝宝进行体检,求这两个宝宝恰出生不同医院且均属“二孩”的概率;(2)根据以上数据,能否有85%的把握认为一孩或二孩宝宝的出生与医院有关?K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)考点独立性检验及其基本思想题点独立性检验的思想解(1)①由分层抽样知在市中医院出生的宝宝有7×47=4个,其中一孩宝宝有2个.②在抽取7个宝宝中,市中医院出生的一孩宝宝2人,分别记为A1,B1,二孩宝宝2人,分别记为a1,b1,湘东医院出生的一孩宝宝2人,分别记为A2,B2,二孩宝宝1人,记为a2,从7人中抽取2人的一切可能结果所组成的基本事件为:Ω={(A1,B1),(A1,a1),(A1,b1),(A1,A2),(A1,B2),(A1,a2),(B1,a1),(B1,b1),(B 1,A 2),(B 1,B 2),(B 1,a 2),(a 1,b 1),(a 1,A 2),(a 1,B 2),(a 1,a 2),(b 1,A 2),(b 1,B 2), (b 1,a 2),(A 2,B 2),(A 2,a 2),(B 2,a 2)}.用A 表示:“两个宝宝恰出生不同医院且均属二孩”, 则A ={(a 1,a 2),(b 1,a 2)}, ∴P (A )=221,(2)2×2列联表K 2=70×(20×10-20×20)240×30×40×30=3518≈1.944<2.072,故没有85%的把握认为一孩、二孩宝宝的出生与医院有关. 四、探究与拓展14.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).考点 分类变量与列联表 题点 求列联表 答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35, 所以p =25,q =25,a =40,b =60.K 2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841.故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.15.2017年12月1日,“国际教育信息化大会”在山东青岛开幕,为了解哪些人更关注“国际教育信息化大会”,某机构随机抽取了年龄在15~75岁之间的100人进行调查,并按年龄绘制成频率分布直方图,如图所示,其分组区间为:[15,25),[25,35),[35,45),[45,55),[55,65),[65,75],把年龄落在区间[15,35)和[35,75]内的人分别称为“青少年”和“中老年”.(1)根据频率分布直方图求样本的中位数(保留两位小数)和众数;(2)根据已知条件完成下面的2×2列联表,并判断能否有99%的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”:附:参考公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 临界值表:考点独立性检验及其基本思想题点独立性检验的方法解(1)根据频率分布直方图可知样本的众数为40,因为(0.015+0.030)×10=0.45,设样本的中位数为x ,则(x -35)×0.035=0.5-0.45, 所以x =35107≈36.43,即样本的中位数约为36.43.(2)依题意可知,抽取的“青少年”共有100×(0.015+0.030)×10=45人, “中老年”共有100-45=55人. 完成的2×2列联表如下:结合列联表的数据得K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(30×35-20×15)250×50×55×45≈9.091>6.635,所以有99%的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2 独立检验的基本思想及其初步应用[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P10~P15的内容,回答下列问题.阅读教材P10“探究”的内容,思考:(1)是否吸烟、是否患肺癌是什么变量?提示:分类变量.(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?提示:不是.(3)如何研究吸烟是否对患肺癌有影响?提示:独立性检验.2.归纳总结,核心必记(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为(3)等高条形图①图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②通过直接计算或观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.(4)独立性检验(1)有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?提示:不一定.所有的推断只代表一种可能性,不代表具体情况.(3)下面是2×2列联表.y1则表中a,b提示:a=46-13=33,b=33+a=33+33=66.[课前反思](1)分类变量的定义是什么?(2)列联表的定义是什么?2×2列联表中的各个数据有什么意义?(3)什么是等高条形图,有什么作用?(4)独立性检验的内容是什么?讲一讲1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa +b 与cc +d判断二者是否有关系.[尝试解答] 2×2列联表如下:aa +b =4364=0.671 875.c c +d =2760=0.45. 显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa +b 与c c +d ⎝ ⎛⎭⎪⎫ba +b 与dc +d 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.练一练1.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:则当m取下面何值时,X与YA.8 B.9 C.14 D.19解析:选C 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.讲一讲2.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.[尝试解答] 作列联表如下:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.利用等高条形图判断两个分类变量是否相关的步骤:练一练2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:我们认为患色盲与性别是有关系的.3.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P13-例1)附:[尝试解答]根据2×2k =170× 22×38-22×88 2110×60×44×126≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.根据题意列出2×2列联表,计算K 2的观测值,如果K 2的观测值很大,说明两个分类变量有关系的可能性很大;如果K 2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.练一练3.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?附:解:根据题意,列出由公式可得K 2的观测值k =n ad -bc 2a +bc +d a +c b +d=89 24×26-31×8 255×34×32×57≈3.689>2.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.——————————————[课堂归纳·感悟提升]——————————1.本节课的重点是用2×2列联表、等高条形图分析两个分类变量间的关系以及独立性检验.2.本节课要重点掌握的规律方法(1)用2×2列联表分析两分类变量间的关系,见讲1;(2)用等高条形图分析两分类变量间的关系,见讲2;(3)独立性检验,见讲3.3.解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用K2=n ad-bc 2a+b c+d a+c b+d求出K2的观测值k;(3)如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.其中第(2)步易算错K2的值,是本节课的易错点.课下能力提升(二)[学业水平达标练]题组1 用2×2列联表分析两分类变量间的关系1.分类变量X和Y的列联表如下:dA.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:选C |ad -bc |越小,说明X 与Y 关系越弱,|ad -bc |越大,说明X 与Y 关系越强.2.假设有两个变量X 与Y ,它们的取值分别为x 1,x 2和y 1,y 2,其列联表为:( ) A .a =50,b =40,c =30,d =20 B .a =50,b =30,c =40,d =20 C .a =20,b =30,c =40,d =50 D .a =20,b =30,c =50,d =40解析:选D 当(ad -bc )2的值越大,随机变量K 2=n ad -bc 2a +bc +d a +c b +d的值越大,可知X 与Y 有关系的可能性就越大.显然选项D 中,(ad -bc )2的值最大.3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是题组2 用等高条形图分析两分类变量间的关系4.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的百分比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:选C 从图中可以分析,男生喜欢理科的可能性比女生大一些.5.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:选D 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.6.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.题组3 独立性检验7.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差 B.回归分析C.独立性检验 D.概率解析:选C 判断两个分类变量是否有关的最有效方法是进行独立性检验.8.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.9.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③10.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:k=n ad-bc 2a+b c+d a+c b+d=100 32×38-18×12 250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.[能力提升综合练]1.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是( )A.k≥6.635 B.k<6.635C.k≥7.879 D.k<7.879解析:选C 有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K2=a+b c+d a+c b+d算得,观测值k=110× 40×30-20×20 260×50×60×50≈7.8.附表:A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”解析:选A 由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A .成绩B .视力C .智商D .阅读量解析:选D 因为K 21=52× 6×22-14×10216×36×32×20=52×8216×36×32×20, K 22=52× 4×20-16×12 216×36×32×20=52×112216×36×32×20,k 23=52× 8×24-12×8 216×36×32×20=52×96216×36×32×20,K 24=52× 14×30-6×2 216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别有关联的可能性最大.4.下列关于K2的说法中,正确的有________.①K2的值越大,两个分类变量的相关性越大;②K2的计算公式是K2=n ad-bca+b c+d a+c b+d;③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.答案:③④5.某班主任对全班50名学生作了一次调查,所得数据如表:错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.解析:查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k0=6.635,本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.答案:不能6.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:解:(1)设患肝病中常饮酒的人有x人,30=15,x=6.由已知数据可求得K2=10×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=8 15 .7.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1 甲流水线样本频数分布表(505,510](1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36, 故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9,据此可估计从甲流水线任取1件产品, 该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品, 该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:因为K2的观测值k=n ad-bc 2a+b c+d a+c b+d=80× 120-360 266×14×40×40≈3.117>2.706,所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。

相关文档
最新文档