高中数学复习典型题专题训练122---独立性检验
高中数学苏教版 9.2 独立性检验 课后练习、课时练习

一、单选题1. 根据分类变量与的成对样本数据,计算得到,依据的独立性检验,结论为()A.变量与不独立B.变量与不独立,这个结论犯错误的概率超过0.01C.变量与独立D.变量与独立,这个结论犯错误的概率不超过0.012. 假设有两个分类变量和的列联表如下:注:的观测值.对于同一样本,以下数据能说明和有关系的可能性最大的一组是()A.B.C.D.3. 下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量增加一个单位时,平均增加5个单位;③线性回归直线必过;④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得,则其两个变量间有关系的可能性是.其中错误的个数是()A.1 B.2C.3 D.44. 为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是()0.025 0.010 0.005 0.0015.026.6357.879 10.828A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”C.有99.99%以上的把握认为“药物有效”D.有99.99%以上的把握认为“药物无效”5. 东江湖位于湖南省郴州市东北部的资兴市境内,被誉为“人间天上一湖水,万千景象在其中” .每年都吸引无数游客来此游玩,某调查机构在景区随机调查了10名青少年人和8名中老年人,并请他们谈谈是否有“二次游玩”的愿望,统计结果如下,则()“二次游玩”愿望情况有“二次游玩”的愿望无“二次游玩”的愿望总计年龄段青少年8 2 10 中老年 2 6 8总计10 8 18A.有95%的把握判断有“二次游玩”的愿望与年龄有关B.有95%的把握判断有“二次游玩”的愿望与年龄无关C.有99%的把握判断有“二次游玩”的愿望与年龄有关D.有99%的把握判断有“二次游玩”的愿望与年龄无关6. 在下列关于吸烟与患肺癌的列联表中,的值为( )不患肺癌患肺癌总计不吸烟7775 42 7817吸烟d总计9874 9965A.48 B.49 C.50 D.51二、多选题7. 下列命题正确的是()A.若甲、乙两组数据的相关系数分别为0.66和,则乙组数据的线性相关性更强;B.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好;C.对变量x与y的统计量来说,值越小,判断“x与y有关系”的把握性越大;D.对具有线性相关关系的变量x、y,有一组观测数据,其线性回归方程是,且,则实数的值是.8. 在检验X与Y是否有关的过程中,表示的意义是()A.有99%的把握认为X与Y没有关系B.有1%的把握认为X与Y有关系C.有99%的把握认为X与Y有关系D.在犯错误的概率不超过1%的前提下,可以认为X与Y有关系三、填空题9. 某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则的值是________.对工作满意对工作不满意男女附:,其中.10. 某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”的把握为______.11. 有甲、乙两个班级共计112人进行数学考试,按照大于等于120分为优秀,120分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班12乙班36已知在全部112人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是______.①列联表中的值为30,的值为20;②列联表中的值为20,的值为44;③根据列联表中的数据,若根据小概率值的独立性检验,能认为“成绩与班级有关系”;④根据列联表中的数据,若根据小概率值的独立性检验,不能认为“成绩与班级有关系”.12. 为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为,则________.四、解答题13. 2023年春节期间,科幻电影《流浪地球2》上映,获得较好的评价,也取得了很好的票房成绩.某平台为了解观众对该影片的评价情况(评价结果仅有“好评”“差评”),从平台所有参与评价的观众中随机抽取400人进行调查,数据如下表所示(单位:人):好评差评合计男性80 200女性90合计400(1)把列联表补充完整,试根据小概率值的独立性检验分析对该部影片的评价是否与性别有关;(2)若将频率视为概率,从抽取的400人中所有给出“好评”的观众中随机抽取3人,用随机变量X表示被抽到的女性观众的人数,求X的分布列和数学期望.参考公式:,其中.参考数据:0.10 0.05 0.025 0.010 0.005 0.0012.7063.841 5.024 6.635 7.879 10.82814. 对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽取了50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”赞成的人数如下表.月收入频数 5 10 15 10 5 5赞成人数 5 10 12 7 2 1(1)若以月收入45百元为分界点,由以上统计数据完成下面2×2列联表,并判断是否有的把握认为赞成“楼市限购政策”与月收入有关;月收入低于45百元的人数月收入不低于45百元的人数合计赞成不赞成合计(2)若从月收入在和内的被调查人群中按照分层随机抽样的方法选取6人进行追踪调查,并从中选取3人作问卷调查,求3人中至少有1人月收入在内的概率.15. 第届冬季奥运会将于年月日在北京开幕,本次冬季奥运会共设个大项,个分项,个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为,统计得到以下列联表,经过计算可得.男生女生合计了解不了解合计(1)求的值,并判断有多大的把握认为该校学生对冬季奥运会项目的了解情况与性别有关;(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取人,再从这人中抽取人进行面对面交流,“至少抽到一名女生”的概率;附表:附:.16. 宁德是福建省重点城市,它不仅有着深厚的历史积淀与丰富的民俗文化,更有着众多旅游景点,每年来宁德参观旅游的人数不胜数,其中三都澳斗姆岛与上金贝被称为两张名片.现对已游览景点的50名男游客和50名女游客进行景点比较调查,给出更喜欢三都澳斗姆岛或上金贝景点的评价,得到如下列联表:三都澳斗姆岛上金贝男游客40 10女游客30 20(1)分别估计男、女游客对两个景点喜好的概率;(2)能否有95%的把握认为男、女游客对两景点的喜好有差异?附表及公式:0.050 0.010 0.0013.841 6.635 10.828其中,.。
高考数学复习、高中数学 独立性检验附答案解析

第4节 独立性检验基础巩固题组(建议用时:40分钟)一、单项选择题1.在一次独立性检验中,其把握性超过但不超过,则的可能值为 99%99.5%2χ 参考数据:独立性检验临界值表20()≥P k χ0.10 0.05 0.025 0.010 0.005 0.0010k 2.706 3.841 5.024 6.635 7.87910.828A .5.424B .6.765C .7.897D .11.8972.独立性检验显示:在犯错误的概率不超过0.1的前提下认为性别与是否喜爱喝酒有关,那么下列说法中正确的是A .在100个男性中约有90人喜爱喝酒B .若某人喜爱喝酒,那么此人为女性的可能性为10%C .认为性别与是否喜爱喝酒有关判断出错的可能性至少为10%D .认为性別与是否喜爱喝酒有关判断正确的可能性至少为90%3.为了判定两个分类变量和是否有关系,应用独立性检验法算得的观测值为5,X Y 2χ又已知,,则下列说法正确的是 2( 3.841)0.05P χ=≥2( 6.635)0.01P χ=≥A .有以上的把握认为“和有关系” 99%X Y B .有99%以上的把握认为“和没有关系” X Y C .有95%以上的把握认为“和有关系” X Y D .有95%以上的把握认为“和没有关系”X Y 4.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问110名不同的大学生是否爱好某项运动,利用列联表,由计算可得,22⨯28.806χ≈20()P k χ≥0.15 0.10 0.05 0.025 0.010 0.005 0.0010k 2.0722.7063.8415.024 6.635 7.87910.828参照附表,得到的正确结论是A .有99.5%以上的把握认为“爱好该项运动与性别无关”B .有99.5%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.05%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.05%的前提下,认为“爱好该项运动与性别无关” 5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是20()P k ≥0.15 0.10 0.05 0.025 0.010 0.0050k 2.072 2.7063.841 5.024 6.635 7.879 A .90% B .95% C .97.5%D .99.5%6.假设两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其列联表为y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +d对于同一样本的以下各组数据,能说明X 与Y 有关的可能性最大的一组为( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =2,b =3,c =5,d =4 二、多项选择题7. 下列说法正确的是____________.(填序号) A . 对事件A 与B 的检验无关,即两个事件的相关性较小; B . 对事件A 与B 关系越密切,就越大;2χC . 的大小是判断事件A 与B 是否相关的唯一数据;2χD . 若判断两事件A 与B 有关,则A 发生B 一定发生.8. 在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,则下列说法正确的是A . 男人、女人中患色盲的频率分别为0.038,0.006;B . 男、女患色盲的概率分别为;193240260,C . 男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别有关; D . 能说明患色盲与性别是否有关. 三、填空题9.在公式中,若则22()()()()()n ad bc a b c d a c b d χ-=++++87935,,,,a b d n ====c =______________.10.博鳌亚洲论坛2018年年会于4月8日至11日在海南博鳌举行,为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在下面“性别与会俄语”的列联22⨯表中,______________.a b d ++= 会俄语 不会俄语总计 男 a b 20 女 6 d 总计185011.某高校“统计初步”课程的教师随机调查了该选修课的一些学生情况,具体数据如下表:非统计专业统计专业男 13 10 女720为了检验主修专业是否与性别有关系,根据表中的数据,得到2χ.因为,所以断定主修统计专业与性别有关250(1320107)= 4.8423272030⨯⨯-⨯≈⨯⨯⨯2 3.841≥χ系.这种判断出错的可能性为______________.20()P k χ≥0.15 0.10 0.05 0.025 0.010 0.005 0.0010k 2.0722.7063.8415.024 6.635 7.87910.82812.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中表1(语文)表2(数学)表3(英语)不及格及格总计不及格及格总计不及格及格总计男14 36 50 男10 40 50 男25 25 50 女16 34 50 女20 30 50 女 5 45 50 总计30 70 100总计30 70 100总计30 70 100A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小能力提升题组(建议用时:20分钟)13.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材支持旧教材合计具有15年以上教龄的教师122537教龄在15以下的教师102434合计224971 根据此资料,你是否认为教龄的长短与支持新的数学教材有关?14.某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如表.表1:A 类工人生产能力的频数分布表生产能力分组[110,120)[120,130)[130,140)[140,150)人数8x32表2:B 类工人生产能力的频数分布表生产能力分组[110,120)[120,130)[130,140) [140,150) 人数6y2718(1)确定x ,y 的值;(2)完成2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系? 生产能力分组 工人类别[110,130)[130,150)总计 A 类工人 B 类工人 总计附:22()()()()()n ad bc a b c d a c b d χ-=++++20()P k χ≥0.050 0.010 0.001k 03.841 6.635 10.82815.为更好地落实农民工工资保证金制度,南方某市劳动保障部门调查了2018年下半年该市100名农民工(其中技术工、非技术工各50名)的月工资,得到这100名农民工的月工资均在(百元)内,且月工资收入在(百元)内的人数为,并根据调查[2555],[4550),15结果画出如图所示的频率分布直方图:(1)求n 的值;(2)已知这100名农民工中月工资高于平均数的技术工有31名,非技术工有19名.①完成如下所示列联表22⨯技术工 非技术工总计 月工资不高于平均数 50 月工资高于平均数50 总计5050100②则能否在犯错误的概率不超过0.001的前提下认为是不是技术工与月工资是否高于平均数有关系?参考公式及数据:,其中.22()()()()()n ad bc a b c d a c b d χ-=++++n a b c d =+++20()P k χ≥0.15 0.10 0.05 0.025 0.010 0.005 0.0010k 2.0722.7063.8415.024 6.635 7.87910.828第4节 独立性检验1.B 2.D 3.C 4.B 5.C 6. D 7.A B对于A ,事件A 与B 检验无关,只是说两事件的相关性较小,故 A 对.B 是正确的.对于C ,判断A 与B 是否相关的方式很多,可以用列联表,也可以借助于概率运算,故C 错.对于D ,两事件A 与B 有关,说明两者同时发生的可能性相对来说较大,但并不是A 发生B 定发生,故D 错. 8.C D男人中患色盲的比例为≈0.079,女人中患色盲的比例,故3848060.012520≈,又38×(520-6)-6×(480-38)=16880,相差较大,说明患色盲与性别有关,故选386480520>C ,D 9.11若则故答案为11. 87935,,,,a b d n ====11c n a b d =---=10.44由于总人数为50,可得出,解得. 650a b d +++=44a b d ++=11.5%(或0.05)根据临界值表: ,223.841( 3.841)0.050≥≥,P χχ=所以断定主修统计专业与性别有关系.这种判断出错的可能性为0.05. 故答案为5%(或0.05) 12. C因为,222100(14341636)100(10302040)100(2545525)307050503070505030705050⨯⨯-⨯⨯⨯-⨯⨯⨯-⨯<<⨯⨯⨯⨯⨯⨯⨯⨯⨯所以英语成绩与性别有关联性的可能性最大,。
独立性检验-高中数学知识点讲解(含答案)

独立性检验(北京习题集)(教师版)一.选择题(共5小题)1.(2017春•东城区校级期末)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量2.(2016春•海淀区校级期末)在检验吸烟与患肺炎是否有关的一次统计中,根据22⨯列联表中数据计算得2 6.234x≈,则下列说法正确的是()A .有99%的把握认为吸烟与患肺炎有关B .有99%的把握认为吸烟与患肺炎无关C .有95%的把握认为吸烟与患肺炎有关D .有95%的把握认为吸烟与患肺炎无关3.(2015秋•昌平区期末)某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:下列叙述一定正确的是( )A .甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前B .乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前C .甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前D .乙同学的总成绩排名比丙同学的总成绩排名更靠前4.(2014•海淀区校级模拟)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( ) (参考数据:2( 6.635)0.01)P k =①若2k 的观测值满足2 6.635k ,我们有99%的把握认为吸烟与患肺病有关系. ②若2k 的观测值满足2 6.635k ,那么在100个吸烟的人中约有99人患有肺病.③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病.④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误. A .①B .①④C .②③D .①②③④5.(2014•海淀区校级模拟)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值 3.841K >时,我们()2)k0.500.455A .在错误的概率不超过0.05的前提下可认为A 与B 有关 B .在错误的概率不超过0.05的前提下可认为A 与B 无关 C .在错误的概率不超过0.01的前提下可认为A 与B 有关D .没有充分理由说明事件A 与B 有关 二.填空题(共7小题)6.(2019春•东城区期末)吃零食是中学生中普遍存在的现象.长期吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表根据下面2K 的计算结果,试回答,有 的把握认为“吃零食与性别有关”.参考数据与参考公式:222()85(140480)9826000 4.722()()()()176845402080800n ad bc K a b c d a c b d --===≈++++⨯⨯⨯0)k7.(2013•西湖区校级模拟)给出下列说法:①从匀速传递的产品生产线上每隔20分钟抽取一件产品进行某种检测,这样的抽样为系统抽样; ②若随机变量若(1,4)N ξ-,(0)P m ξ=,则1(01)2P m ξ<<=-; ③在回归直线?0.22y x =+中,当变量x 每增加1个单位时,?y 平均增加2个单位; ④在22⨯列联表中,213.079K =,则有99.9%的把握认为两个变量有关系. 附表:0)k0.050k3.841其中正确说法的序号为 (把所有正确说法的序号都写上)8.(2010春•海淀区校级期中)在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数):物理成绩好物理成绩不好合计数学成绩好622385数学成绩不好282250合计9045135根据以上数据求得2X=;所以有(填百分数)以上的把握认为数学成绩与物理成绩有关.9.(2010春•怀柔区期末)为了了解某地母亲身高x与女儿身高Y的相关关系,随机测得10对母女的身高如下表所示:母亲身()x cm159160160163159154159158159157女儿身()Y cm158159160161161155162157162156计算x与Y的相关系数0.71r≈,通过查表得r的临界值0.050.632r=,从而有的把握认为x与Y之间具有线性相关关系,因而求回归直线方程是有意义的.通过计算得到回归直线方程为ˆ34.920.78y x==+,因此,当母亲的身高为161cm时,可以估计女儿的身高大致为.10.(2009春•北京校级期末)某校为提高教学质量进行教改实验,设有试验班和对照班.经过两个月的教学试验,进行了一次检测,试验班与对照班成绩统计如下的22⨯列联表所示(单位:人),则其中m=,n=.80及80分以下80分以上合计试验班321850对照班12m50合计4456n11.(2009春•北京校级期末)若由一个2*2列联表中的数据计算得2 4.013X=,那么有把握认为两个变量有关系.附:2X临界值表:12.(2009春•房山区期中)为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集以下数据.三.解答题(共3小题)13.(2019•西城区校级模拟)已知某企业有职工5000人,其中男职工3500人,女职工1500人.该企业为了丰富职工的业余生活,决定新建职工活动中心,为此,该企业工会采用分层抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:)h ,汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运动时间:(1)求抽取的女职工的人数;(2)①根据频率分布表,求出m 、n 、p 的值,完成如图所示的频率分布直方图,并估计该企业职工每周的平均运动时间不低于4h 的概率;②若在样本数据中,有60名女职工每周的平均运动时间不低于4h ,请完成以下22⨯列联表,并判断是否有95%以上的把握认为“该企业职工毎周的平均运动时间不低于4h 与性别有关”. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.0)k14.(2019•海淀区校级三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行评分,评分的频数分布表如下: 女性用户 分值区间[50,60)[60,70)[70,80)[80,90)[90,100] 频数20 40 80 50 10男性用户 分值区间[50,60)[60,70)[70,80)[80,90)[90,100] 频数 45 75 90 60 30(Ⅰ)完成下列频率分布直方图,计算女性用户评分的平均值,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(Ⅱ)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为“评分良好用户”与性别有关? 参考附表:20()P K k 0.100.050 0.010 0.0010k2.7063.841 6.635 10.828参考公式:2()2()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++15.(2019•西城区校级模拟)近年电子商务蓬勃发展,2017年某网购平台“双11”一天的销售业绩高达1682亿元人民币,平台对每次成功交易都有针对商品和快递是否满意的评价系统.从该评价系统中选出200次成功交易,并对其评价进行统计,网购者对商品的满意率为0.70,对快递的满意率为0.60,其中对商品和快递都满意的交易为80次.(1)根据已知条件完成下面的22⨯列联表,并回答能否有99%的把握认为“网购者对商品满意与对快递满意之间有关系”?(2)为进一步提高购物者的满意度,平台按分层抽样方法从中抽取10次交易进行问卷调查,详细了解满意与否的具体原因,并在这10次交易中再随机抽取2次进行电话回访,听取购物者意见.求电话回访的2次交易至少有一次对商品和快递都满意的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++为样本容量)2)kk独立性检验(北京习题集)(教师版)参考答案与试题解析一.选择题(共5小题)1.(2017春•东城区校级期末)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量【分析】根据表中数据,利用公式,求出2K,即可得出结论.【解答】解:表2252(6221014)1:0.00916363220K⨯-⨯=≈⨯⨯⨯;表2252(4201216)2: 1.76916363220K⨯-⨯=≈⨯⨯⨯;表2252(824812)3: 1.316363220K⨯-⨯=≈⨯⨯⨯;表2252(143062)4:23.4816363220K⨯-⨯=≈⨯⨯⨯,∴阅读量与性别有关联的可能性最大,故选:D.【点评】本题考查独立性检验的应用,考查学生的计算能力,属于中档题.2.(2016春•海淀区校级期末)在检验吸烟与患肺炎是否有关的一次统计中,根据22⨯列联表中数据计算得2 6.234x≈,则下列说法正确的是()A.有99%的把握认为吸烟与患肺炎有关B.有99%的把握认为吸烟与患肺炎无关C.有95%的把握认为吸烟与患肺炎有关D.有95%的把握认为吸烟与患肺炎无关【分析】由2 6.234 3.841x≈>,对照表格,可知有95%的把握认为吸烟与患肺炎有关.【解答】解:由2 6.234 3.841x≈>,∴有95%的把握认为吸烟与患肺炎有关,故选:C.【点评】本题考查独立性检验的应用,考查学生的计算能力,属于基础题.3.(2015秋•昌平区期末)某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:下列叙述一定正确的是( )A .甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前B .乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前C .甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前D .乙同学的总成绩排名比丙同学的总成绩排名更靠前【分析】根据图示,可得甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前. 【解答】解:根据图示,可得甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前, 故选:C .【点评】本题考查利用数学知识解决实际问题,考查数形结合的数学思想,考查学生分析解决问题的能力,比较基础.4.(2014•海淀区校级模拟)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( ) (参考数据:2( 6.635)0.01)P k =①若2k 的观测值满足2 6.635k ,我们有99%的把握认为吸烟与患肺病有关系. ②若2k 的观测值满足2 6.635k ,那么在100个吸烟的人中约有99人患有肺病.③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病.④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误. A .①B .①④C .②③D .①②③④【分析】若2 6.635k >,我们有99%的把握认为吸烟与患肺病有关系,表示有1%的可能性使推断出现错误,不表示有99%的可能患有肺病,也不表示在100个吸烟的人中必有99人患有肺病,故可得结论.【解答】解:若2 6.635k >,我们有99%的把握认为吸烟与患肺病有关系,不表示有99%的可能患有肺病,故①正确.不表示在100个吸烟的人中必有99人患有肺病,故②不正确. 不表示有每个吸烟的人有99%的可能性会患肺病,故③不正确.从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误,④正确. 故选:B .【点评】本题的考点是独立性检验的应用,根据独立性检测考查两个变量是否有关系的方法进行判断,准确的理解判断方法及2k 的含义是解决本题的关键.5.(2014•海淀区校级模拟)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值 3.841K >时,我们()2)k0.500.455A .在错误的概率不超过0.05的前提下可认为A 与B 有关 B .在错误的概率不超过0.05的前提下可认为A 与B 无关 C .在错误的概率不超过0.01的前提下可认为A 与B 有关D .没有充分理由说明事件A 与B 有关【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据2( 3.841)0.05P K >=,得到我们有10.0595%-=的把握认为A 与B 有关系. 【解答】解:依据下表:2)k2 3.841K >,2( 3.841)0.05P K >=∴我们在错误的概率不超过0.05的前提下可认为A 与B 有关,故选:A .【点评】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可. 二.填空题(共7小题)6.(2019春•东城区期末)吃零食是中学生中普遍存在的现象.长期吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表根据下面2K 的计算结果,试回答,有 95% 的把握认为“吃零食与性别有关”. 参考数据与参考公式:222()85(140480)9826000 4.722)176845402080800n ad bc K b d --===≈+⨯⨯⨯0)k【分析】根据题意得出观测值的大小,对照临界值得出结论. 【解答】解:根据题意知2 4.722 3.841K ≈>, 所以有95%的把握认为“吃零食与性别有关”. 故答案为:95%.【点评】本题考查了列联表与独立性检验的应用问题,是基础题. 7.(2013•西湖区校级模拟)给出下列说法:①从匀速传递的产品生产线上每隔20分钟抽取一件产品进行某种检测,这样的抽样为系统抽样; ②若随机变量若(1,4)N ξ-,(0)P m ξ=,则1(01)2P m ξ<<=-; ③在回归直线?0.22y x =+中,当变量x 每增加1个单位时,?y 平均增加2个单位; ④在22⨯列联表中,213.079K =,则有99.9%的把握认为两个变量有关系. 附表:0)k0.050k3.841其中正确说法的序号为 ①②④ (把所有正确说法的序号都写上)【分析】对于①,从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样系统抽样;对于②,根据随机变量~(1,4)x N ,得到正态曲线的对称轴是1x =,得到(0)(2)P x P x =,根据所给的条件(0)P x m =,得到(2)P x m =,又根据概率之和是1,得到要求的结果;对;对于③在回归直线方程 ?0.22y x =+中,当解释变量x 每增加一个单位时,预报变量 ?y 平均增加0.1个单位;不对;对于④,通过所给的观测值,同临界值表中的数据进行比较,发现13.07910.828>,得到结论. 【解答】解:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件 产品进行某项指标检测,这样的抽样是系统抽样,故①正确, ②:随机变量~(1,4)x N ,∴正态曲线的对称轴是1x =,(0)(2)P x P x ∴= (0)P x m =,(02)112P x m m m ∴<<=--=-,1(01)2P m ξ∴<<=-,故③正确, ③在回归直线方程 ?0.22y x =+中,当解释变量x 每增加一个单位时, 预报变量 ?y 平均增加0.2个单位,故④不正确, 对于④,一个2*2列联表中的数据计算得213.079K =,213.07910.828K =>,∴有999%的把握说这两个变量有关系,故答案为:①②④.【点评】本题考查独立性检验,考查系统抽样方法,考查线性回归方程,考查判断两个相关变量之间的关系等,是一个综合题目,这种题考查的知识点比较多,需要认真分析.8.(2010春•海淀区校级期中)在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数):根据以上数据求得2X = 4.066 ;所以有 (填百分数)以上的把握认为数学成绩与物理成绩有关.【分析】根据表中所给的数据,利用所给的求观测值的公式,代入公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出k 值,把观测值同临界值进行比较,得到有95%的把握数学成绩与物理成绩有关. 【解答】解:提出假设0H :学生数学成绩与物理成绩之间没有关系.根据列联表可以求得22135(62222823) 4.066 3.841904585110K ⨯⨯-⨯=≈>⨯⨯⨯当0H 成立时,2( 3.841)0.05P K >=.所以我们有10.0595%-=的把握认为:学生的数学成绩与物理成绩之间有关系, 故答案为:4.066;95%【点评】本题考查独立性检验的应用,考查数据处理能力、运算求解能力和应用意识,本题解题的关键是正确运算出观测值,理解临界值对应的概率的意义,本题是一个基础题.9.(2010春•怀柔区期末)为了了解某地母亲身高x 与女儿身高Y 的相关关系,随机测得10对母女的身高如下表所示:计算x 与Y 的相关系数0.71r ≈,通过查表得r 的临界值0.050.632r =,从而有 95% 的把握认为x 与Y 之间具有线性相关关系,因而求回归直线方程是有意义的.通过计算得到回归直线方程为ˆ34.920.78yx ==+,因此,当母亲的身高为161cm 时,可以估计女儿的身高大致为 .【分析】查对临界值表,可得结论,利用回归直线方程,代入计算可估计女儿的身高.【解答】解:查对临界值表,由临界值0.050.632r =,可得有95%的把握认为x 与Y 之间具有线性相关关系,回归直线方程为ˆ34.920.78yx =+,因此,当161x cm =时,ˆ34.920.7834.920.78161161y x cm =+=+⨯= 故答案为:95%,161cm .【点评】本题考查独立性检验的应用,考查学生的计算能力,属于基础题.10.(2009春•北京校级期末)某校为提高教学质量进行教改实验,设有试验班和对照班.经过两个月的教学试验,进行了一次检测,试验班与对照班成绩统计如下的22⨯列联表所示(单位:人),则其中m = 38 ,n = .80及80分以下80分以上合计 试验班 32 1850 对照班 12 m50合计4456n【分析】根据22⨯列联表的规律对应的横行与竖行的和应该等于合计,故可求 【解答】解:由题意,1856m +=,5050n +=,38m ∴=.100n =, 故答案为38,010.【点评】利用随机变量 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法11.(2009春•北京校级期末)若由一个2*2列联表中的数据计算得2 4.013X =,那么有 95% 把握认为两个变量有关系. 附:2X 临界值表:【分析】通过所给的观测值,同临界值表中的数据进行比较,发现4.013 3.841>,得到结论有95%的把握说这两个变量有关系.【解答】解:一个2*2列联表中的数据计算得2 4.013X =, 4.013 3.841>,∴有95%的把握说这两个变量有关系,故答案为:95%【点评】本题考查独立性检验,考查判断两个变量之间有没有关系,一般题目需要自己做出观测值,再拿着观测值同临界值进行比较,得到结论,本题给出了观测值,只剩下一个比较过程.12.(2009春•房山区期中)为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集以下数据 男女生中喜欢或不喜欢足球的人数 .【分析】根据调查目的:为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集男女生中喜欢或不喜欢足球的人数,通过计算得到结果,【解答】解:为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集男女生中喜欢或不喜欢足球的人数,再得出22 列联表,最后代入随机变量的观测值公式,得出结果. 故答案为:男女生中喜欢或不喜欢足球的人数.【点评】本题考查独立性检验的应用,考查独立性检验的基本思想和应用意识, 三.解答题(共3小题)13.(2019•西城区校级模拟)已知某企业有职工5000人,其中男职工3500人,女职工1500人.该企业为了丰富职工的业余生活,决定新建职工活动中心,为此,该企业工会采用分层抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:)h ,汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运动时间:(1)求抽取的女职工的人数;(2)①根据频率分布表,求出m 、n 、p 的值,完成如图所示的频率分布直方图,并估计该企业职工每周的平均运动时间不低于4h 的概率;②若在样本数据中,有60名女职工每周的平均运动时间不低于4h,请完成以下22⨯列联表,并判断是否有95%以上的把握认为“该企业职工毎周的平均运动时间不低于4h与性别有关”.附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.2()P K k0.250.150.100.050.025 0k 1.323 2.072 2.706 3.841 5.024【分析】(1)直接由分层抽样中每层所占比例相等求得抽取的女职工的人数;(2)①由图表数据及频率和为1求得n,然后依次求p与m的值,并完成频率分布直方图;②填写22⨯列联表,再由公式求得2K,则结论可求.【解答】解:(1)抽取的女职工的人数为1500 300905000⨯=;(2)①10.050.20.150.250.30.05n=-----=,15p=,300154575901560m=-----=;直方图如图:估计该企业职工每周的平均运动时间不低于4h的概率为:30.150.250.30.050.754P =+++==; ②22⨯列联表如图:22()300(456030165) 4.762 3.841()()()()7522521090n ad bc K a b c d a c b d -⨯-⨯==≈>++++⨯⨯⨯.∴有95%以上的把握认为“该企业职工毎周的平均运动时间不低于4h 与性别有关”.【点评】本题考查独立性检验,考查由频率分布直方图求概率的估计值,考查计算能力,是中档题.14.(2019•海淀区校级三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行评分,评分的频数分布表如下:(Ⅰ)完成下列频率分布直方图,计算女性用户评分的平均值,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(Ⅱ)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为“评分良好用户”与性别有关? 参考附表:20()P K k 0.100.050 0.010 0.0010k2.7063.841 6.635 10.828参考公式:2()2()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++【分析】(Ⅰ)利用所给数据,可得频率分布直方图,并比较女性用户和男性用户评分的波动大小; (Ⅱ)求出2K ,与临界值比较,即可得出结论.【解答】解:(Ⅰ)女性用户和男性用户的频率分布表分别如下左、右图:由图可得女性用户的波动小,男性用户的波动大. ⋯(4分) (Ⅱ)22⨯列联表如下图:女性用户 男性用户 合计 “认可”手机 140 180 320 “不认可”手机60 120 180 合计200300500500(14012018060)2 5.208 2.706200300320180K ⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为性别和对手机的“认可”有关.【点评】本题考查频率分布直方图的作法及应用,考查独立检验的应用,考查频率分布直方图等基础知识,考查运算求解能力,是基础题.15.(2019•西城区校级模拟)近年电子商务蓬勃发展,2017年某网购平台“双11”一天的销售业绩高达1682亿元人民币,平台对每次成功交易都有针对商品和快递是否满意的评价系统.从该评价系统中选出200次成功交易,并对其评价进行统计,网购者对商品的满意率为0.70,对快递的满意率为0.60,其中对商品和快递都满意的交易为80次.(1)根据已知条件完成下面的22⨯列联表,并回答能否有99%的把握认为“网购者对商品满意与对快递满意之间有关系”?(2)为进一步提高购物者的满意度,平台按分层抽样方法从中抽取10次交易进行问卷调查,详细了解满意与否的具体原因,并在这10次交易中再随机抽取2次进行电话回访,听取购物者意见.求电话回访的2次交易至少有一次对商品和快递都满意的概率.附:22()n ad bcK-=(其中n a b c d=+++为样本容量)2)kk【分析】(1)由题意填写列联表,计算观测值,对照临界值得出结论;(2)根据题意,用列举法求出基本事件数,计算所求的概率值.【解答】解:(1)由题意,填写22⨯列联表,如下:计算2200(80204060)1001.59140601208063K⨯⨯-⨯==≈⨯⨯⨯,由于1.59 6.635<,所以没有99%的把握认为“网购者对商品满意与对快递满意之间有关系”;(2)根据题意,抽取的10次交易中,对商品和快递都满意的交易有4次,记为A、B、C、D,其余6次不是都满意的交易记为1、2、3、4、5、6,那么抽取2次交易一共有45种可能:AB 、AC 、AD 、1A 、2A 、3A 、4A 、5A 、6A 、BC 、BD 、1B 、2B 、⋯⋯、56, 其中2次交易对商品和快递不是都满意的有15种: 12、13、14、15、16、⋯⋯、56;所以,在抽取的2次交易中,至少一次对商品和快递都满意的概率是 45152453P -==. 【点评】本题考查了列联表与独立性检验的应用问题,也考查了列举法求古典概型的概率问题.。
高考数学一轮复习专题04 独立性检验(原卷版)

概率与统计 专题四:独立性检验一、知识储备 1.22⨯列联表设X ,Y 为两个变量,它们的取值分别为12{}x x ,和12{}y y ,,其样本频数列联表(22⨯列联表)如下:2.独立性检验利用随机变量2K (也可表示为2χ)2()()()()()n ad bc a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验. 3.独立性检验的一般步骤(1)根据样本数据列出22⨯列联表;(2)计算随机变量2K 的观测值k ,查下表确定临界值k 0:(3)如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过()20P K k ≥;否则,就认为在犯错误的概率不超过()20P K k ≥的前提下不能推断“X 与Y 有关系”.【注意】(1)通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.二、例题讲解1.(2022·榆林市第十中学高三月考(文))随着经济的发展,人们的生活水平显著提高,健康意识不断增强,健康管理理念深入人心,人们参加体育锻炼的次数与时间在逐渐增加.某校一个课外学习小组为研究居民参加体育锻炼的时长(时长不超过60分钟)是否与性别有关,对某小区居民进行调查,并随机抽取了100名居民的调查结果,其中男性有55人,根据调查结果绘制了居民日均锻炼时间的频率分布直方图如下:(1)求样本中居民日均锻炼时间的中位数;(2)将日均锻炼时间不低于40分钟的居民称为“健生达人”(健康生活达人),已知样本中“健生达人”中有10名女性,根据已知条件完成下面22⨯列联表,并据此资料判断是否有95%的把握认为“健生达人”与性别有关.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.2.(2022·江苏南京市·高三开学考试)科研小组为提高某种水果的果径,设计了一套实验方案,并在两片果园中进行对比实验.其中实验园采用实验方案,对照园未采用.实验周期结束后,分别在两片果园中各随机选取100个果实,按果径分成5组进行统计:[)21,26,[)26,31,[)31,36,[)36,41,[]41,46(单位:mm ).统计后分别制成如下的频率分布直方图,并规定果径达到36mm 及以上的为“大果”.(1)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“大果”与“采用实验方案”有关;(2)根据长期种植经验,可以认为对照园中的果径X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,5.5σ≈,请估计对照园中果径落在区间()39,50内的概率.(同一组中的数据以这组数据所在区间中点的值作代表)附:①()()()()()22n ad bc K a b c d a c b d -=++++;②若X 服从正态分布()2,N μσ,则()0.683P X μσμσ-<<+=,()220.954P X μσμσ-<<+=,()330.997P X μσμσ-<<+=.三、实战练习1.(2022·定远县育才学校高三开学考试(文))微信是腾讯公司推出的一种手机通信软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人.为了调查微信用户每天使用微信的时间,某经销化妆品的店家在一广场随机采访男性、女性用户各50名,将男性、女性平均每天使用微信的时间(单位:h )分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图估计女性平均每天使用微信的时间;(2)若每天玩微信超过4h的用户称为“微信控”,否则称为“非微信控”,判断是否有90%的把握认为“微信控”与性别有关.附表:(参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)2.(2022·河北唐山·高三开学考试)数字人民币是由央行发行的法定数字货币,它由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.截至2022年6月30日,数字人民币试点场景已超132万个,覆盖生活缴费、餐饮服务、交通出行、购物消费、政务服务等领域.为了进一步了解普通大众对数字人民币的感知以及接受情况,某机构进行了-次问卷调查,部分结果如下:(1)如果将高中及高中以下的学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表;(2)若从低学历的被调查者中,按对数字人民币的了解程度用分层抽样的方法抽取8人,然后从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率;(3)根据列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:()()()()()22n ad bcKa b c d a c b d-=++++3.(2022·广东实验中学高三月考)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格:(1)求这1000名患者的潜伏期的样本平均值x(同一组中的数据用该组区间的中点值作代表);(2)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表请将列联表补充完整,并根据列联表判断是否有95%的把捏认为潜伏期与息者年龄有关;(3)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期超过6天的人数最有可能(即概率最大)...........是多少?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.4.(2022·黑龙江高三其他模拟(文))据有关部门统计,2021年本科生的平均签约薪酬为每月4300元.2021年某高校毕业生就业指导中心为了分析本校本科毕业生的专业课成绩优秀与否与本科毕业生就业后获得薪酬的关系,随机调查了从学校毕业的200名本科毕业学进行研究.研究结果表明:在专业课成绩优秀的120名本科毕业生中有90人每月工资超过人民币4300元,另30人每月工资低于人民币4300元;在专业课成绩不优秀的80名本科毕业生中有20人每月工资超过人民币4300元,另60人每月工资低于人民币4300元. (1)试根据上述数据完成22⨯列联表;(2)能否在犯错误的概率不超过0.001的前提下认为“该高校本科毕业生的专业课成绩优秀”与“每月工资超过当年本科生的平均签约薪酬”有关系?参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.5.(2022·山东济宁一中高三开学考试)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活十分关注,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%,学校为了考察学生对寄宿生活适应是否与性别有关,构建了如下2×2列联表:(1)请将2×2列联表补充完整,并依据小概率值0.01α=的独立性检验,分析“适应寄宿生活与否”是否与性别有关;(2)从男生中以“是否适应寄宿生活”为标准采用分层抽样的方法随机抽取10人,再从这10人中随机抽取2人,若所选2名学生中的“不适应寄宿生活”人数为X,求随机变量X的分布列及数学期望.附:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.6.(2022·全国高三月考)某企业计划招聘新员工,现对应聘者关于工作的首要考虑因素进行调查﹐所得统计结果如下表所示:(1)是否有95%的把握认为应聘者关于工作的首要考虑因素与性别有关;(2)若招聘考核共设置2个环节,应聘者需要参加全部环节的考核,每个环节设置两个项目,若应聘者每通过一个项目积10分,未通过积5-分.已知甲第1环节每个项目通过的概率均为34,第2环节每个项目通过的概率均为23,各环节、各项目间相互独立.求甲经过两个环节的考核后所得积分之和的分布列和数学期望()E ξ.参考公式:()()()()22()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:7.(2022·重庆垫江第五中学校高三月考)随着垫江五中教学质量的提升学生总人数达到了历史最高点即4700人左右,但学校发展的同时也对学校学生就餐带来前所未有的挑战.因此学校领导制定出学生分时就餐(第一轮11:40,第二轮12:30).经过一段时间的运行后,学校对就餐满意度进行调查,现从学校初、高中学生中随机抽取200人作为样本,得到下表(单位:人次)(1)(2)(1)通过上表完成下列22⨯列联表,并判断能否有97.5%的把握认为“是否满意”与初、高中学生有关?(2)现从调查的学生中按表(2)分层抽样的方法抽取8人,再从这8人中任选2人,记X为这2人中为满意的人数,求X的分布列和数学期望.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.8.(2022·全国高三月考(理))梨树绝大多数品种自花授粉,结实率很低,因此果农在栽培梨树的时候,必须在果园配置授粉树,并结合适当的辅助授粉方法,以便更顺利地完成梨树的授粉受精过程,以此达到果园丰产稳产、高品质的目的.某地区将梨树蜜蜂授粉和自然授粉的花朵坐果率进行比较,统计数据如下:(1)自然授粉和蜜蜂授粉的花朵坐果数的频率分别是多少?(2)根据数据完成下列22⨯列联表,并据此判断能否有99.9%的把握认为自然授粉与蜜蜂授粉的花朵坐果率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++9.(2022·陕西西安中学高三月考(文))2019年2月4日20:00,2019年央视春晚在中央电视台综合频道等频道并机直播.人们通过手机、互联网、电视等方式,都在观看央视春晚.某调查网站从观看央视春晚的观众中随机选出200人,经统计这200人中通过传统的传媒方式电视端口观看的人数与通过新型的传媒PC 端口观看的人数之比为4:1.将这200人按年龄分组:第1组[)15,25,第2组[)25,35,第3组[)35,45,第4组[)45,55,第5组[)55,65,其中统计通过传统的传媒方式电视端口观看的观众得到的频率分布直方图如图所示.(1)求a 的值及通过传统的传媒方式电视端口观看的观众的平均年龄;(2)把年龄在第1,2,3组的观众称青少年组,年龄在第4,5组的观众称为中老年组,若选出的200人中通过新型的传媒方式PC 端口观看的中老年人有12人,请完成下面2×2列联表,则能否在犯错误的概率不超过0.1的前提下认为观看央视春晚的方式与年龄有关? 附:22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++为样本容量).10.(2022·合肥市第六中学高三开学考试(文))医学统计表明,X 疾病在老年人中发病率较高.已知某地区老年人的男女比例为3:2,为了解X疾病在该地区老年人中发病情况,按分层抽样抽取100名老人作为样本,对这100位老人是否患有X疾病进行统计,得条形图如下所示.(1)完成下列2×2列联表,并判断有没有90%的把握认为患X疾病与性别有关?(2)在这100个样本中,将未患X疾病老年人按年龄段[60,65),[65,70),[70,75),[75,80),[80,85]分成5组,得频率分布直方图如图二所示.求未患病老年人的中位数(精确到小数点后一位).附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.11.(2022·武功县普集高级中学高三开学考试(理))某校组织了全体学生参加“建党100周年”知识竞赛,从高一、高二年级各随机抽取50名学生的竞赛成绩(满分100分),统计如下表:(1)分别估计高一、高二年级竞赛成绩的平均值1x与2x(同一组中的数据以该组数据所在区间中点的值作代表);(2)学校规定竞赛成绩不低于80分的为优秀,根据所给数据,完成下面的22⨯列联表,并判断是否有90%的把握认为竞赛成绩优秀与年级有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.。
高考必备——独立性检验-独立性检验

k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.82
P( K 2 k0 )
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
例 1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系. 2.采集数据——列联表: 不患肺癌 不吸烟 吸烟 总计 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
不吸烟不患肺癌 吸烟不患肺癌 a c .即“ ” ab cd 不吸烟总数 吸烟总数
得 ad bc 0 ,所以 | ad bc | 越小,说明吸烟与患肺癌关系越弱,反之越强. (2)构造随机变量 K 2
n(ad bc) 2 (其中 n a b c d ) (a b)(c d )(a c)(b d )
2 2
0.15 2.072
0.10 2.706
0.05 3.841
0.025 5.024
0.010 6.635
0.005 7.879
0.001 10.828
,其中 n=a+b+c+d)
5.某校在规划课程设置方案的调研中, 随机抽取 160 名理科学生, 想调查男生、 女生对 “坐标系与参数方程” 与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等 式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多 25 人,根据调研情况制成如下图所示的列联表: 选择坐标系与参数方程 男生 女生 合计 160 60 选择不等式选讲 合计
高二数学独立性检验

口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
例题选讲 例2.气管炎是一种常见的呼吸道疾病,医药研究人员
对两种中草药治疗慢性气管炎的疗效进行对比,所 得数据如图所示,问:它们的疗效有无差异.
复方江剪刀草 胆黄片 合计
有效 184 91 275
无效 61 9 70
; SEO优化服务 搜索引擎排名服务
练习一 1.以下关于独立性检验的说法中,正确说法的序号
是—①——③—④——. ①独立性检验依赖于小概率原理;
②独立性检验得到的结论一定正确;
③样本不同,独立性检验的结论可能有差异;
④独立性检验不是判断两事物是否相关的唯一方法.
复习回顾 1.用χ2统计量来研究两个分类变量之间的相关关系的
方法称为—独——立—性——检—验——. 2.在2×2列联表中,计算卡方χ2统计量的公式是——.
3.一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ和Ⅱ分别有两 类取值,要推断“Ⅰ和Ⅱ有关系”可按下面的步骤进 行: ①提出假设H0:—————————; ②根据2×2列联表与χ2公式计算χ2的值; ③查对————,作出判断.
练习二 3.调查者询问72名男女大学生在购买食品时是否看
营养说明,得到如表所示的数据,从表中的数据分析 大学生的性别与看不看营养说明之间有没有关系?
男大学生 女大学生
合计
看营养说 明
28 16 44
不看营养说 明 8
20 28
合计
36 36 72
Hale Waihona Puke 练习二 4.网络对现代人的生活影响较大,尤其是青少年.为了
复习回顾
4.①若观测值χ2—≥—10.828,则有99,9%的把握认为 “Ⅰ
高中数学独立性检验精选题

独立性检验精选题26道一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,则下列说法正确的是()已知在全部105人中随机抽取1人,成绩优秀的概率为27A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++据此表,可得()A.认为机动车驾驶技术与性别有关的可靠性不足50%B.认为机动车驾驶技术与性别有关的可靠性超过50%C.认为机动车驾驶技术与性别有关的可靠性不足60%D.认为机动车驾驶技术与性别有关的可靠性超过60%6.如表是一个22⨯列联表:则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,527.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.309.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:22()()()()()n a d b cKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130B.190C.240D.25010.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b cKa b c d a c b d-=++++A.12B.11C.10D.1811.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .1814.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法.正确的是()参考公式及数据:22()6.109()()()()n a d b c K a b c d a c b d -=≈++++附表:A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 15.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()A .B .C .D .16.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”⋯⋯小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下22⨯列联表:临界值表并计算得到219.05K ≈,下列小波对地区A 天气判断不正确的是()A .夜晚下雨的概率约为12B .未出现“日落云里走”夜晚下雨的概率约为514C .有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D .出现“日落云里走”,有99.9%的把握认为夜晚会下雨 17.有关独立性检验的四个命题,其中不正确的是()A .两个变量的22⨯列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成的可能性就越大B .对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越小C .从独立性检验可知:有95%把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%可能患有心脏病D .从独立性检验可知:有99%把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%前提下认为吸烟与患肺癌有关18.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是()A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大.B .k 越大,“患胃病与生活不规律有关系”的可信程度越小.C .若计算得23.918K ≈,经查临界值表知2( 3.841)0.05P K ≈…,则在100个生活不规律的人中必有95人患胃病.D .从统计量中得知有95%的把握认为患胃病与生活不规律有关,是指有5%的可能性使得推断出现错误. 二.填空题(共3小题)19.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下22⨯列联表(部分数据缺失):表中a的值为;计算可知,在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.参考公式:22()()()()()n a d b cKa b c d a c b d-=++++,n a b c d=+++.参考数据:20.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++根据上表,有的把握认为“小动物是否被感染与服用疫苗有关”21.某学生为了研究高二年级同学的体质健康成绩与学习成绩的关系,从高二年级同学中随机抽取30人,统计其体质健康成绩和学习成绩,得到22⨯列联表如表:有 的把握认为学生的体质健康成绩高低与学习成绩高低有关. 附:22()()()()()n a d b c Ka b c d a c b d -=++++.三.解答题(共5小题)22.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)m in 绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n a d b c Ka b c d a c b d -=++++,23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)k g ,其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n a d b c K a b c d a c b d -=++++.24.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n a d b cKa b c d a c b d-=++++.25.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:22()()()()()n a d b cKa b c d a c b d-=++++.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n a d b c Ka b c d a c b d -=++++独立性检验精选题26道参考答案与试题解析一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【分析】题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于6.635,得到有99%以上的把握认为“爱好这项运动与性别有关”.【解答】解:由题意算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.7.8 6.635>,∴有0.011%=的机会错误,即有99%以上的把握认为“爱好这项运动与性别有关”故选:C.【点评】本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题有创新的地方就是给出了观测值,只要进行比较就可以,本题是一个基础题.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【分析】根据条件中所给的观测值,同题目中节选的观测值表进行检验,得到观测值对应的结果,得到结论有99%以上的把握认为“爱好该项运动与性别有关”.【解答】解:由题意知本题所给的观测值,2 2110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯7.8 6.635>,∴这个结论有0.011%=的机会说错,即有99%以上的把握认为“爱好该项运动与性别有关”故选:A.【点评】本题考查独立性检验的应用,考查对于观测值表的认识,这种题目一般运算量比较大,主要考查运算能力,本题有所创新,只要我们看出观测值对应的意义就可以,是一个基础题.3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%【分析】把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.【解答】解:2 6.705 6.635K=>,对照表格:∴有99%的把握说学生性别与支持该活动有关系,∴有1%的把握说学生性别与支持该活动没有关系,故选:C.【点评】本题考查独立性检验知识,难度不大,属于基础题.4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是() A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【分析】根据成绩优秀的概率求出成绩优秀的学生数,从而求得c和b的值;再根据公式计算相关指数2K的值,比较与临界值的大小,判断“成绩与班级有关系”的可靠性程度.【解答】解:成绩优秀的概率为27,∴成绩优秀的学生数是2105307⨯=,成绩非优秀的学生数是75,20c∴=,45b=,选项A、B错误.又根据列联表中的数据,得到2105(10302045)26.109 3.84155503075K ⨯⨯-⨯=≈>⨯⨯⨯,因此有95%的把握认为“成绩与班级有关系”, 故选:C .【点评】本题考查了独立性检验思想方法,熟练掌握列联表个数据之间的关系及相关指数2K 的计算公式是解题的关键.5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b c Ka b c d a c b d -=++++据此表,可得( )A .认为机动车驾驶技术与性别有关的可靠性不足50%B .认为机动车驾驶技术与性别有关的可靠性超过50%C .认为机动车驾驶技术与性别有关的可靠性不足60%D .认为机动车驾驶技术与性别有关的可靠性超过60% 【分析】由表中数据计算观测值,对照临界值得出结论. 【解答】解:由表中数据,计算22100(40103515)0.33670.45555457525K⨯⨯-⨯=≈<⨯⨯⨯,∴认为机动车驾驶技术与性别有关的可靠性不足50%;故选:A .【点评】本题考查独立性检验的应用,关键是理解独立性检验的思路.属中档题. 6.如表是一个22⨯列联表:则表中a ,b 的值分别为()A.94,72B.52,50C.52,74D.74,52【分析】由列联表中数据的关系求得.【解答】解:732152b a=+=+=.a=-=,22522274故选:C.【点评】本题考查了列联表的做法,属于基础题.7.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验【分析】这是一个独立性检验应用题,处理本题时要注意根据已知构建方程计算出表格中男性近视与女性近视,近视的人数,并填入表格的相应位置.根据列联表,及2K的计算公式,计算出2K的值,并代入临界值表中进行比较,不难得到答案.【解答】解:分析已知条件,易得如下表格.根据列联表可得:2K,再根据与临界值比较,检验这些中学生眼睛近视是否与性别有关,故利用独立性检验的方法最有说服力.故选:D.【点评】独立性检验,就是要把采集样本的数据,利用公式计算2K的值,比较与临界值的大小关系,来判定事件A与B是否无关的问题.具体步骤:(1)采集样本数据.(2)由公式计算的2K值.(3)统计推断,当2 3.841K>时,有95%的把握说事件A与B有关;当2 6.635K>时,有99%的把握说事件A与B有关;当2 3.841K…时,认为事件A与B是无关的.8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.30【分析】设男生可能有x人,依题意填写列联表,由2 3.841K>求出x的取值范围,从而得出正确的选项.【解答】解:设男生可能有x人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K>,由2242312()255553.841732155x x x x xxKx x x x⋅-⋅==>⋅⋅⋅,解得40.335x>,由题意知0x>,且x是5的整数倍,60∴满足题意.故选:C.【点评】本题考查列联表与独立性检验的应用问题,考查运算求解能力,是基础题.9.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:22()()()()()n a d b c K a b c d a c b d -=++++,其中na b c d=+++.参考数据:A .130B .190C .240D .250【分析】根据题意设男、女生的人数各为5x ,建立22⨯列联表,计算2K ,列不等式组求出x 的取值范围,即可确定满足条件的选项.【解答】解:依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:由表中数据,计算2210(423)10557321x x x x x x K x x x x⋅⋅-⋅==⋅⋅⋅,由题可知106.63510.82821x <<,所以139.33510227.388x <<.只有B 符合题意. 故选:B .【点评】本题考查了列联表与独立性检验应用问题,也考查了运算求解能力,是基础题. 10.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326636 3.841822x x x x x K x x x x x ⋅-⋅==>⋅⋅⋅,解得10.24x >,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,是基础题.11.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有【分析】“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患肺癌没有关系,得到结论.【解答】解: “吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立, 与多少个人患肺癌没有关系, 只有D 选项正确, 故选:D .【点评】本题考查独立性检验的应用,是一个基础题,解题的关键是正确理解有多大把握认为这件事正确,实际上是对概率的理解.12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 【分析】利用已知概率对照表,在2K 大于对应值是认为相关,在小于对应值时不认为相关. 【解答】解:27.218 6.635K ≈>,对应的20()P K k …为0.010,可得有99%以上的把握认为“学生性别与中学生追星有关”, 故选:B .【点评】本题考查了独立性检验的应用问题,考查判断相关性,是基础题目.13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( )参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326663 3.841822xx x x x x K x x x x⨯-⨯==>⨯⨯⨯,解得10.24x>,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,属于基础题.14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:。
高中数学统计独立性检验练习题

独立性检验1.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K2=6.705,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.P(K2≥k)0.1000.0500.0250.0100.001k 2.7063.8415.0246.63510.828A. 99.9%B. 99%C. 1%D. 0.1%2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A. 100个吸烟者中至少有99人患有肺癌B. 1个人吸烟,那么这人有99%的概率患有肺癌C. 在100个吸烟者中一定有患肺癌的人D. 在100个吸烟者中可能一个患肺癌的人也没有3.某中学兴趣小组为调查该校学生对学校食堂的某种食品喜爱与否是否与性别有关,随机询问了100名性别不同的学生,得到如下的2×2列联表:男生女生总计喜爱 3020 50不喜爱 20 30 50总计 50 50 100附K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥0.150.100.050.0250.010k0)k0 2.072 2.706 3.841 5.024 6.635根据以上数据,该数学兴趣小组有多大把握认为“喜爱该食品与性别有关”?()A. 99%以上B. 97.5%以上C. 95%以上D. 85%以上4.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.P(K2≥K)0.0500.0100.001K 3.841 6.63510.8285.国际奥委会将于2017年9月15日在秘鲁利马召开130次会议决定2024年第33届奥运会举办地,目前德国汉堡,美国波士顿等申办城市因市民担心赛事费用超支而相继退出,某机构为调查我国公民对申办奥运会的态度,选了某小区的100位居民调查结果统计如下:支持不支持合计年龄不大于50岁______ ______ 80年龄大于50岁10______ ______合计______ 70100(1)根据已知数据,把表格数据填写完整;(2)能否在犯错误的概率不超过5%的前提下认为不同年龄与支持申办奥运无关?(3)已知在被调查的年龄大于50岁的支持者中有5名女性,其中2位是女教师,现从这5名女性中随机抽取3人,求至多有1位教师的概率.附:K2=n(ad−bc)2,n=a+b+c+d,(a+b)(c+d)(a+c)(b+d)P(K2>k)0.1000.0500.0250.010k 2.706 3.841 5.024 6.6356.为了解某班学生喜好体育运动是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:喜好体育运动不喜好体育运动合计______男生______ 5女生10______ ______合计______ ______ 50已知按喜好体育运动与否,采用分层抽样法抽取容量为10的样本,则抽到喜好体育运动的人数为6.(1)请将上面的列联表补充完整;(2)能否在犯错概率不超过0.01的前提下认为喜好体育运动与性别有关?说明你的理由.独立性检验临界值表:P(K2≥k0)0.100.050.0250.010k0 2.7063.8415.0246.6357.某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制了频率分布直方图(如图所示),规定80分及以上者晋级成功,否则晋级失败.晋级成功晋级失败合计男16女50合计(Ⅰ)求图中a的值;(Ⅱ)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关?(Ⅲ)将频率视为概率,从本次考试的所有人员中,随机抽取4人进行约谈,记这4人中晋级失败的人数为X,求X的分布列与数学期望E(X).(参考公式:k2=n(ad−bc)2,其中n=a+b+c+d)(a+b)(c+d)(a+c)(b+d)P(K2≥k0)0.400.250.150.100.050.025k00.780 1.323 2.072 2.706 3.841 5.0248.某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”P(K2≥k0)0.100.050.0100.005k0 2.706 3.841 6.6357.879附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)9.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).P(K2≥k)0.0500.0100.001K 3.841 6.63510.828K2=n(ad−bc)2.(a+b)(c+d)(a+c)(b+d)10.通过随机询问某地100名高中学生在选择座位时是否挑同桌,得到如下2×2列联表:男生女生合计挑同桌304070不挑同桌201030总计5050100(1)从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5人中随机选取3人做深度采访,求这3名学生中至少有2名要挑同桌的概率;(2)根据以上2×2列联表,是否有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关?P(K2≥k0)0.100.050.0250.0100.0050.001k0 2.706 3.841 5.024 6.6357.87910.828,其中n=a+b+c+d.参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)11.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关,该学校对100名高一新已知在这100人中随机抽取1人抽到喜欢游泳的学生的概率为35.(1)请将上述列联表补充完整;(2)并判断是否有99.9%的把握认为喜欢游泳与性别有关?并说明你的理由;(3)已知在被调查的学生中有5名来自甲班,其中3名喜欢游泳,现从这5名学生中随机抽取2人,求恰好有1人喜欢游泳的概率.下面的临界值表仅供参考:(参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)12.某校卫生所成立了调查小组,调查“按时刷牙与不患龋齿的关系”,对该校某年级800名学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:按时刷牙且不患龋齿的学生有160 名,不按时刷牙但不患龋齿的学生有100 名,按时刷牙但患龋齿的学生有 240 名.(1)该校4名校卫生所工作人员甲、乙、丙、丁被随机分成两组,每组 2 人,一组负责数据收集,另一组负责数据处理,求工作人员甲乙分到同一组的概率.(2)是否有99.9%的把握认为该年级学生的按时刷牙与不患龋齿有关系?附:k2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)13.为使政府部门与群众的沟通日常化,某城市社区组织“网络在线问政”活动.2015年,该社区每月通过问卷形式进行一次网上问政;2016年初,社区随机抽取了60名居民,对居民上网参政议政意愿进行调查.已知上网参与问政次数与参与人数的频数分布如表:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(1)若将参与调查问卷不少于4次的居民称为“积极上网参政居民”,请你根据频数分布表,完成2×2列联表,99%3人为2男1女的概率.14. 近年来,手机已经成为人们日常生活中不可缺少的产品,手机的功能也日趋完善,已延伸到了各个领域,如拍照,聊天,阅读,缴费,购物,理财,娱乐,办公等等,手机的价格差距也很大,为分析人们购买手机的消费情况,现对某小区随机抽取了200人进行手机价格的调查,统计如下:0.025的前提下,认为人们使用手机的价格和年龄有关?(Ⅱ)如果用分层抽样的方法从样本手机价格在5000元及以上的人群中选择5人调查他的收入状况,再从这5人中选3人,求3人的年龄都在45岁及以下的概率. 附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)15. 高中生在被问及“家,朋友聚集的地方,个人空间”三个场所中“感到最幸福的场所在哪里?”这个问题时,从中国某城市的高中生中,随机抽取了55人,从美国某城市的高中生中随机抽取了45人进行答题.中国高中生答题情况是:选择家的占25、朋友聚集的地方占310、个人空间占310.美国高中生答题情况是:朋友聚集的地方占35、家占15、个人空间占15.(Ⅰ)请根据以上调查结果将下面2×2列联表补充完整;并判断能否有95%的把握认为“恋家(在家里感到最幸福)”与国别有关;4人中随机抽取2人到中国交流学习,求2人中含有在“个人空间”感到幸福的学生的概率. 附:k 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n =a +b +c +d .16.为调查了解某省属师范大学师范类毕业生参加工作后,从事的工作与教育是否有关的情况,该校随机调查了该校80位性别不同的2016年师范类毕业大学生,得到具体数据如表:(n=a+b+c+d).参考公式:k2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(3)以(2)中的频率作为概率.该校近几年毕业的2000名师范类大学生中随机选取4名,记这4名毕业生从事与教育有关的人数为X,求X的数学期望E(X).17.为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查,得到如下列联表(平均每天喝500ml以上为常喝,体重超过50kg为肥胖):.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415(Ⅰ)请将上面的列联表补充完整;(Ⅱ)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;(参考公式:K2=n(ad−bc)2,其中n=a+b+c+d)(a+b)(c+d)(a+c)(b+d)18.为了解某地区观众对大型综艺活动《中国好声音》的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众收看该节目的场数与所对应的人数表:95%的把握认为“歌迷”与性别有关?2名女性,若从“超级歌迷”中任意选取2人,求至少有1名女性观众的概率..附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)19.2017年3月27日,一则“清华大学要求从2017级学生开始,游泳达到一定标准才能毕业”的消息在体育界和教育界引起了巨大反响.游泳作为一项重要的求生技能和运动项目受到很多人的喜爱.其实,已有不少高校将游泳列为必修内容.某中学为了解2017届高三学生的性别和喜爱游泳是否有关,对100名高三学生进行了问卷调查,得到如下列联表:.已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为35(Ⅰ)请将上述列联表补充完整;(Ⅱ)判断是否有99.9%的把握认为喜欢游泳与性别有关?附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学复习典型题专题训练122
.独立性检验
1.两个变量之间的关系;
常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2.散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图.
散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.
3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.
反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.
散点图可以判断两个变量之间有没有相关关系.
4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:
统计学中有一个非常有用的统计量,它的表达式为2
2
112212211212
()n n n n n n n n n χ++++-=,用它的大小可以
用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.
2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.
独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.
2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,
≥,≥.
22⨯联表的独立性检验:
如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:
知识内容
板块五.独立性检验
状态B 状态B 合计 状态A 11n 12n 1n + 状态A
21n 22n 2n +
1n +
2n +
n
如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.
题型一 独立性检验
【例1】 对变量X 与Y 的卡方统计量2χ的值,说法正确的是( )
A .2χ越大,“X 与Y 有关系”可信程度越小;
B .2χ越小,“X 与Y 有关系”可信程度越小;
C .2χ越接近0,“X 与Y 无关”程度越小;
D .2χ越大,“X 与Y 无关”程度越大.
【例2】 若由一个22⨯列联表中的数据计算得2 4.013χ=,那么有 把握认为两个
变量有关系.
【例3】 若由一个22⨯列联表中的数据计算得24395χ=.,那么确认两个变量有关系的把握
性有( )
A .90%
B .95%
C .99%
D .99.5%
【例4】 提出统计假设0H ,计算出2χ的值,则拒绝0H 的是( )
A .27.331χ=
B .2 2.9χ=
C .20.8χ=
D .2 1.9χ=
【例5】 给出假设0H ,下列结论中不能接受0H 的是( )
A .2 2.535χ=
B .27.723χ=
C .210.321χ=
D .220.125χ=
【例6】 某高校食堂随机调查了一些学生是否因距离远近而选择食堂就餐的情况,经计算得
到2 4.932χ=.所以判定距离远近与选择食堂有关系,那么这种判断出错的可能性为多少?
典例分析
【例7】某班主任对全班50名学生进行了作业量的调查,数据如下表:
A.99% B.95% C.90% D.无充分根据
【例8】下表中给出了某周内中学生是否喝过酒的随机调查结果,若要使结论的可靠性不低于95%,根据所调查的数据,能否作出该周内中学生是否喝过酒与性别有关的结
论?
【例9】在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据
所给数据判断是否在恶劣气候飞行中,男人比女人更容易晕机.
【例10】为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否
作出药的效果与给药方式有关的结论?
【例11】考察棉花种子经过处理跟生病之间的关系得到如下表数据:
【例12】气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异(可靠性不低于99%)?
【例13】在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中
有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
⑴根据以上数据建立一个22 的联表;⑵判断性别与休闲方式是否有关系.
【例14】 (2010课标全国卷Ⅰ高考)
为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者
男
女
需要 40 30 不需要
160
270 ⑵能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? ⑶根据⑵的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:
2
2
()()()()()
n ad bc K a b c d a c b d -=
++++
【例15】 某校高三年级在一次全年级的大型考试中,数学优秀的有360人,非优秀的有880
人.数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?
物理优秀 化学优秀 总分优秀 数学优秀 228 225 267 数学非优秀
143
156
99
【例16】 (2010辽宁高考)
为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .
⑴甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;
⑵下表1和表2分别是注射药物A 和B 后的试验结果.(疱疹面积单位:2mm ) 表1:注射药物A 后皮肤疱疹面积的频数分布表
频率组距
疱疹面积
频率组距
疱疹面积
图Ⅰ注射药物A 后皮肤疱疹面积的频率分布直方图 图Ⅱ注射药物B 后皮肤疱疹面积的频率分布直方图
(ⅱ)完成下面22⨯列联表,并回答能否有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”. 表3:
附:2
K ()()()()a b c d a c b d =
++++
【例17】(2009辽宁20)
某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在
[)
29.9430.06
,的零件为优质品.从两个分厂生产的零件中个抽出500件,量其内径尺寸,的结果如下表:
⑵由于以上统计数据填下面22⨯列联表,并问是否有99%的把握认为“两个分厂生
附:
()()
22
11221221
2
1212
0.050.01
3.841
p k
n n n n n
n n n n k
χ
χ
++++
- =
6.635
≥
,。