专题3.4 二联表与独立性检验-2019年高考数学(理)
高考数学 专题 独立性检验复习课件

(2)根据列联表可以得出什么样的结论?对以后的复习有什么指 导意义?
解: (2)计算可知,午休的考生及格率为 P1=
80 4 = ,不午休的考生 180 9
65 13 的及格率为 P2= = ,则 P1>P2,因此,可以粗略判断午休与考生 200 40
考试及格有关系,并且午休的及格率高,所以在以后的复习中考生 应尽量适当午休,以保持最佳的学习状态.
即时训练1-2: 如表是一个2×2列联表:
y1 y2 总计
x1
x2 总计
a
8 b
21
25 46
73
33 110
则表中a,b处的值分别为( C ) (A)94,96 (B)52,50 (C)52,60 (D)54,52
题型二 利用等高条形图判断两个分类变量是否相关 【例2】 为了解铅中毒病人与尿棕色素为阳性是否有关系,分 别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
方法技巧 利用列联表可以较好地看出两个分类变量是否具 有关系,如本题的午休与考试及格,类似地, 我们也可以用列联 表进行粗略估计吸烟与健康,读书年限与视力等变量间的关系.
即时训练1-1:班级与成绩2×2列联表:
优秀 甲班 乙班 10 7 不优秀 35 38 总计 45 p
总计
m
n
q
表中数据m,n,p,q的值应分别为( ) (A)70,73,45,188 (B)17,73,45,90 (C)73,17,45,90 (D)17,73,45,45 解析:由表中数据可知m,n,p,q的值分别为 17,73,45,90.故选B.
2×2列联表的定义 列出两个分类变量的 频数表 ,称为列联表。假设两个分类 变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表 (也称为2×2列联表)为
新高考数学复习考点知识讲解11---列联表与独立性检验

新高考数学复习考点知识讲解列联表与独立性检验1、简单随机抽样得到了X 和Y 的抽样数据列联表2、基于小概率值α的检验规则是:当αχx ≥2时,我们就推断0H 不成立,即认为X 和Y 不独立,该推断犯错误的概率不超过α当αχx <2时,我们没有充分证据推断0H 不成立,可以认为X 和Y 独立这种利用2χ的取值推断分类变量X 和Y 是否独立的方法称为2χ独立性检验,读作“卡方独立性检验”,简称独立性检验3、应用独立性检验解决实际问题大致应包括以下几个主要环节: (1)提出零假设0H :X 和Y 相互独立,并给出在问题中的解释; (2)根据抽样数据整理出2×2列联表,计算2χ的值,并与临界值αx 比较 (3)根据检验规则得出推断结论(4)在X 和Y 不独立的情况下,根据需要,通过比较相应的频率,分析X 和Y 间的影响规律题型一 变量关系例 1 为了判断两个分类变量X 、Y 是否有关系,应用独立性检验的方法算得2K 的观测值为5,则下列说法中正确的是( ) A .有95%的把握认为“X 和Y 有关系” B .有95%的把握认为“X 和Y 没有关系” C .有99%的把握认为“X 和Y 有关系” D .有99%的把握认为“X 和Y 没有关系” 【答案】A 【分析】利用2K 的观测值与临界值进行比较得解. 【详解】因为2( 3.841)0.050P K =≥,5 3.841>,所以有95%的把握认为“X 和Y 有关系”. 故选:A若由一个22⨯列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.知识典例巩固练习()20P K k ≥ 0.500.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828A .95%B .97.5%C .99%D .99.9%【答案】A 【分析】由2 3.841K >可对照临界值表得到结果. 【详解】2 4.013 3.841K =>,∴有()10.05100%95%-⨯=的把握认为两个变量有关系. 故选:A.题型二 列联表例 2 如表是一个2×2列联表:则表中a ,b 的值分别为( )y 1 y 2 合计x 1 a21 73x 2 22 25 47合计 b 46 120A .94,72B .52,50C .52,74D .74,52【答案】C 【分析】根据表中数据简单计算即可. 【详解】a =73-21=52,b =a +22=52+22=74. 故选:C.下面是一个22⨯列联表:1y 2y总计 1x35 a 70 2x15 1530 总计 50b100其中,a b 处填的值分别为_______. 【答案】35,50. 【分析】由列联表易得结果. 【详解】由3570a +=,得35a =,15a b +=,得50b =.巩固练习故答案为:35,50.题型三 独立性检验应用例 3 2016年3月9日至15日,谷歌人工智能系统“阿尔法”迎战围棋冠军李世石,最终结果“阿尔法”以总比分4比1战胜李世石.许多人认为这场比赛是人类智慧的胜利,也有许多人持反对意见,有网友为此在某大学进行了调查,参加调查的共80位学生,调查数据的22⨯列联表如下所示: 持反对意见 赟同 总计男40 女 5总计2580(1)①请将列联表补充完整;②请根据表中数据判断,能否有的99.9%把握认为是否持反对意见与性别有关; (2)若表中持反对意见的5个女学生中,3个是大三学生,2个是大四学生.现从这5个学生中随机选2个学生进行进一步调查,求这2个学生是同一年级的概率.附参考公式及数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.40 0.25 0.10 0.010 0.005 0.001 0k7.879 1.3232.7066.6357.87910.828【答案】(1)①列联表见解析,②有99.9%的把握认为是否持反对意见与性别有关;(2)25.【分析】()1①由已知数据得出列联表;②由题可知,计算2K 的观测值013.09110.828k ≈>,可得出结论;()2记3个大三学生分别为,123,,,2A A A 个大四学生分别为12,B B 、运用列举法列出所有事件,由古典概率公式可得答案. 【详解】()1①②由题可知,2K 的观测值2080203552013.09110.828404055(25)k ⨯-⨯=≈>⨯⨯⨯所以有99.9%的把握认为是否持反对意见与性别有关.()2记3个大三学生分别为,123,,,2A A A 个大四学生分别为12,B B 、则从中抽取2个的基本事件有:1213231213112223212,,,,,,,,,A A A A A A AB A B A B A B A B A B B B ,共10个,其中抽取的2人是同一年级的基本事件有12132312,,,A A A A A A B B 共4个, 则这2个学生是同一年级的概率为42105P ==.这一年来人类与新型冠状病毒的“战争”让人们逐渐明白一个道理,人类社会组织模式的差异只是小事情,病毒在地球上存在了三四十亿年,而人类的文明史不过只有几千年而已,人类无法消灭病毒,只能与之共存,或者病毒自然消亡,在病毒面前,个体自由要服从于集体或者群体生命的价值.在传染病学中,通常把从致病刺激物侵入机体内或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期,因此我们应该注意做好良好的防护措施和隔离措施.某研究团队统计了某地区10000名患者的相关信息,得到如表表格: 潜伏期(天)(]0,2(]2,4(]4,6(]6,8(]8,10 (]10,12 (]12,14人数6001900300025001600250150(1)新冠肺炎的潜伏期受诸多因素的影响,为研究潜伏期与年龄的关系,通过分层抽样从10000名患者中抽取200人进行研究,完成下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为潜伏期与患者年龄有关?潜伏期8≤天潜伏期8>天总计 60岁以上(含60岁)150 60岁以下 30 总计200(2)依据上述数据,将频率作为概率,且每名患者的潜伏期是否超过8天相互独立.为了深入研究,该团队在这一地区抽取了20名患者,其中潜伏期不超过8天的人数最有巩固练习可能是多少?附:()()()()()22n ad bcKa b c d a c b d-=++++.【答案】(1)表格见解析,能;(2)16名.【分析】(1)由表中数据可知,求得潜伏期大于8天的人数,列出2×2列联表,利用公式求得2K的值,结合附表,即可得到结论;(2)求得该地区10000名患者中潜伏期不超过8天的人数,求得潜伏期不超过8天的概率,进而抽取的20名患者中潜伏期不超过8天的人数.【详解】(1)由表中数据可知,潜伏期大于8天的人数为16002501502004010000++⨯=人,补充完整的2×2列联表如下,所以()2220013*********.66710.8281505016040K ⨯⨯-⨯=≈>⨯⨯⨯, 故能在犯错误的概率不超过0.001的前提下认为潜伏期与患者年龄有关.(2)该地区10000名患者中潜伏期不超过8天的人数为6001900300025008000+++=名,将频率视为概率,潜伏期不超过8天的概率为80004100005=, 所以抽取的20名患者中潜伏期不超过8天的人数最有可能是420165⨯=名.1、为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得x 2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )A .0.1%B .1%C .99%D .99.9%【答案】C 【分析】由x 2=7.01>6.635,对照临界值表求解即可.巩固提升【详解】易知x2=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.故选:C2、某班主任对全班50名学生进行了作业量的评价调查,所得数据如表所示:则认为作业量的大小与学生的性别有关的犯错误的概率不超过()A.0.01 B.0.05C.0.10 D.无充分证据【答案】B【分析】计算2K,再进行判断.【详解】因为2250(181598)5.059 3.84127232624K⨯⨯-⨯=≈>⨯⨯⨯,又()2 3.8410.05P K≥=所以认为作业量的大小与学生的性别有关的犯错误的概率不超过0.05. 故选:B3、(多选)有关独立性检验的四个命题,其中正确的是()A.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大B.对分类变量X与Y的随机变量2K的观测值k来说,k越小,“X与Y有关系”的可信程度越小C.从独立性检验可知:有95%的把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%的可能患有心脏病D.从独立性检验可知:有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关【答案】ABD【分析】根据独立性检验的原理与知识,对选项中的命题判断正误即可.【详解】选项A,两个变量的2×2列联表中,对角线上数据的乘积相差越大,则2K观测值越大,两个变量有关系的可能性越大,所以选项A正确;选项B,根据2K的观测值k越小,原假设“X与Y没关系”成立的可能性越大,则“X与Y有关系”的可信度越小,所以选项B正确;选项C,从独立性检验可知:有95%的把握认为秃顶与患心脏病有关,不表示某人秃顶他有95%的可能患有心脏病,所以选项C不正确;选项D,从独立性检验可知:有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关,是独立性检验的解释,所以选项D正确.故选:ABD.4、为了判断某高中学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (x 2≥3.841)≈0.05,P (x 2≥6.635)≈0.01.根据表中数据,得到x 2=250(1320107)23272030⨯⨯-⨯⨯⨯⨯≈4.844,则认为选修文科与性别有关系出错的概率约为________.【答案】0.05 【分析】直接根据表中数据计算的x 2值与P (x 2≥3.841)≈0.05比较判断,即得结果. 【详解】因为x 2≈4.844>3.841,而P (x 2≥3.841)≈0.05,故认为选修文科与性别有关系出错的概率约为0.05. 故答案为:0.05.5、调查者通过询问72名男、女大学生在购买食品时是否看营养说明得到的数据如下表所示:大学生的性别和是否看营养说明之间___(填“有”或“没有”)关系.【答案】有【分析】由表中的数据直接计算卡方,从而可得结论【详解】解:因为22722820168)=8.4167.879 44283636χ⨯⨯-⨯≈>⨯⨯⨯(,所以有的把握认为大学生性别与购买食品时是否看营养说明之间有关,故答案为:有6、某高校《统计》课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到k=2 50(1320-107) 23272030⨯⨯⨯⨯⨯⨯=4.844>3.841,所以有_____的把握判定主修统计专业与性别有关系.附:【答案】95%【分析】根据独立性检验的基本思想,因为2K的观测值k=4.844>3.841,参考临界值表即可得出【详解】根据表格数据得2K的观测值k=250(1320-107)23272030⨯⨯⨯⨯⨯⨯≈4.844 3.841>,所以有95%的把握判定主修统计专业与性别有关系.故答案为:95%.7、某学生对其30名亲属的饮食习惯进行了一次调查,依据统计所得数据可得到如下的22⨯列联表:根据以上列联表中的数据,可得2K 的观测值k =__________,__________(填“有”或“没有”)99%的把握认为其亲属的饮食习惯与年龄有关.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:【答案】10 有 【分析】根据列联表,求得a b c d ,,,的值,利用公式,求得2K 的值,结合附表,即可得到结论. 【详解】由列联表可得20a =,10b =,12c =,4d =,可得2230(8128)10 6.63512182010K ⨯-==>⨯⨯⨯, 所以有99%的把握认为其亲属的饮食习惯与年龄有关. 故答案为:10;有.8、2017年3月27日,一则“清华大学要求从2017级学生开始,游泳达到一定标准才能毕业”的消息在体育界和教育界引起了巨大反响.游泳作为一项重要的求生技能和运动项目受到很多人的喜爱.其实,已有不少高校将游泳列为必修内容.某中学为了解2018届高三学生的性别和喜爱游泳是否有关,对100名高三学生进行了问卷调查,得到如下列联表:已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为35.(1)请将上述列联表补充完整;(2)判断是否有99.9%的把握认为喜欢游泳与性别有关.附:x2=2()()()()()n ad bca b c d a c b d-++++【答案】(1)表格见解析;(2)有. 【分析】(1)根据概率补全列联表即可;(2)计算2x,再进行判断即可.【详解】(1)因为在100人中随机抽取1人抽到喜欢游泳的学生的概率为3 5所以喜欢游泳的学生人数为3 100605⨯=.其中女生有20人,男生有40人,列联表补充如下:(2)因为22100(40302010)16.6710.82860405050x⨯⨯-⨯=≈>⨯⨯⨯所以有99.9%的把握认为喜欢游泳与性别有关.9、某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下22⨯列联表:如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是12 25.(1)求a,b,c,d的值.(2)试运用独立性检验的思想方法分析:能否有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:【答案】(1)6a =,19b =,24c =,26d =;(2)有. 【分析】(1)由抽到积极参加班级工作的学生的概率是1225,可求出c 的值,然后根据表中的数据可求出,,a b d 的值;(2)直接利用22()()()()()n ad bc K a b c d a c b d -=++++公式求解,然后根临界值表判断即可【详解】解:(1)积极参加班级工作的学生有c 人,总人数为50, 由抽到积极参加班级工作的学生的概率1125025c P ==, 解得24c =,所以6a =.所以2525619b a =-=-=,50502426d c =-=-=.(2)由列联表知,2250(181967)11.53825252426K ⨯⨯-⨯=≈⨯⨯⨯, 由11.53810.828>,可得有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系.。
2019版高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验配套课件理

x y nx y
i 1 n i i
n
x
i 1
2 i
nx
2
n n 1 1 - - 样本点的中心 其中- x =n xi , y =n yi , (- x, y )称作______________. i 1 i 1
(4)线性相关强度的检验:
(x
①r=
i 1 n i 1
i 1 n
回归直线的方法,即求回归直线,使得样本数据的点到它的距
离的平方和最小,这一方法叫做最小二乘法,则回归直线方程
^ ^x+a ^ 的系数为: y=b
n ( xi x)( yi y ) i 1 b n 2 ( x x ) i i 1 a y bx
第11讲 回归分析与独立性检验
考纲要求 1. 会作两个有关联变量的数 据的散点图,会利用散点图 认识变量间的相关关系. 2. 了解最小二乘法的思想, 能根据给出的线性回归方程 系数公式建立线性回归方程. 3. 了解下列一些常见的统计 方法,并能应用这些方法解 决一些实际问题. (1) 了解独立性检验 ( 只要求 2×2列联表)的基本思想、方 法及其简单应用. (2)了解回归的基本思想、方 法及其简单应用
2.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种 常用方法. (2)线性相关关系: 观察散点图的特征,如果散点图中点的分布从整体上看大
致在一条直线附近,我们就称这两个变量之间具有线性相关关
系,这条直线叫做回归直线. (3)回归直线的求法:
对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),…, ^xi-a ^)2 的最小值而 (xn,yn),通过求偏差的平方和 Q= ( yi-b
历年高考数学真题精选49独立性检验

6.635
8. (2012•辽宁)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机 抽取了 100名观众进行调查,其中女性有55名.如图是根据调查结果绘制的观众日均收 看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众 称为“体育迷”,已知“体育迷”中有10名女性.
非体育迷
体育迷
合计
男
女
10
55
合计
(II)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方 法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X,若每 次抽取的结果是相互独立的,求X的分布列,期望矶X)和方差D(X)
P( K\.k)
0.05
0.01
k
3.841
不超过根的工人数填入下面的列联表:
超过根
不超过根
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
n(ad - be)2 (a + b)(c + d)(a + c)(b + d)
P{K\.k)
0.050
0.010
0.001
k
3.841
6.635
2. (2018•新课标III)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任
务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成
两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据 工人完成生产任务的工作时间(单位:加几)绘制了如下茎叶图:
Cs
频率 组距
o 08 o 07 o ^6 o 05 o ^4 o 03 o 02 o 01
专题3.4 二联表与独立性检验-2018年高考数学解答题专题训练

1.近年来全国各一、二线城市打击投机购房,陆续出台了住房限购令.某市为了进一步了解已购房民众对市政府出台楼市限购令的认同情况,随机抽取了一小区住户进行调查,各户人均月收入(单位:千元)的频数分布及赞成楼市限购令的户数如下表:若将小区人均月收入不低于7.5千元的住户称为“高收入户”,人均月收入低于7.5千元的住户称为“非高收入户”(Ⅰ)求“非高收入户”在本次抽样调杳中的所占比例;(Ⅱ)现从月收入在[)1.5,3的住户中随机抽取两户,求所抽取的两户都赞成楼市限购令的概率;(Ⅲ)根据已知条件完成如图所给的22⨯列联表,并说明能否在犯错误的概率不超过0.005的前提下认为“收入的高低”与“赞成楼市限购令”有关.附:临界值表参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)45(2)23P =(3)不能 【解析】试题分析:(1)根据频数与总数的比值得“非高收入户”本次抽样调查中的所占比例,(2)人均月收入在[)1.5,3中,有5户赞成楼市限购令, l 户不赞成楼市限购令,根据枚举法确定从中随机抽取两户所有的基木事件数,再确定所抽取的两户都赞成楼市限购令包含的基本事件数,最后根据古典概型概率公式求概率,(3)根据卡方公式求2K ,与参考数据比较,确定结论. 试题解析:(Ⅰ)因为6+10+13+114505=,所以“非高收入户”本次抽样调查中的所占比例为45.事件“所抽取的两户都赞成楼市限购令”包含的基本事件有: ()12,A A , ()13,A A , ()14,A A , ()15,A A ,()23,A A , ()23,A A , ()24,A A , ()34,A A , ()35,A A , ()45,A A ,共10个,∴所抽取的两户都赞成楼市限购令的概率为102153P ==. (Ⅲ)由题意,可得如下22⨯列联表:∵()()()()()22n ad bc K a b c d a c b d -=++++()250355557.0317.87940104010⨯⨯-⨯==<⨯⨯⨯,∴不能在犯错误的概率不超过0.005的前提下认为“收入的高低”与“赞成楼市限购令”有关.2.从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如下.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[)50,150内的用户记为A 类用户,标记为低用电家庭,用电量在区间[)250,350内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?附表及公式:()()()()()22n ad bc K a b c d a c b d -=++++, n a b c d =+++.【答案】(1)0.0044x =,186(2)23,没有【解析】试题分析:(1)由矩形面积和为1,求得x ,再由每一个矩形的中点横坐标乘以矩形面积求和可得平均值;(2)①B 类用户共9人,打分超过85分的有6人,则216339C C C 即为所求; (2)根据数据完成列联表,利用()()()()()22n ad bc K a b c d a c b d -=++++,计算查表下结论即可.(2)①B 类用户共9人,打分超过85分的有6人,所以从B 类用户中任意抽取3户,恰好有2户打分超过85分的概率为2163391528C C C =. ②点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.第23届冬季奥运会于2018年2月9日至2月25日在韩国平昌举行,期间正值我市学校放寒假,寒假结束后,某校工会对全校教职工在冬季奥运会期间每天收看比赛转播的时间作了一次调查,得到如下频数分布表:(1)若将每天收看比赛转播时间不低于3小时的教职工定义为“体育达人”,否则定义为“非体育达人”,请根据频数分布表补全列联表:并判断能否有的把握认为该校教职工是否为“体育达人”与“性别”有关;(2)在全校“体育达人”中按性别分层抽样抽取6名,再从这6名“体育达人”中选取2名作冬奥会知识讲座.记其中女职工的人数为,求的分布列与数学期望.附表及公式:.【答案】(1)见解析;(2)见解析.试题解析:(1)由题意得下表:的观测值为.所以有的把握认为该校教职工是“体育达人”与“性别”有关. (2)由题意知抽取的6名“体育达人”中有4名男职工,2名女职工,所以的可能取值为0,1,2.且,,,所以的分布列为.4.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:(1)由以上统计数据填2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.参考数据:,其中n=a+b+c+d.【答案】(1) 在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异,(2)①②见解析试题解析:(1)由统计数据填2×2列联表如下,计算观测值,所以在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;(2)①抽到1人是45岁以下的概率为=,抽到1人是45岁以下且另一人是45岁以上的概率为=,故所求概率P==;②根据题意,X的可能取值是0,1,2;计算P(X=0)==,P(X=1)==,P(X=2)==,可得随机变量X的分布列为故数学期望为E(X)=0×+1×+2×=.5.为了探究某市高中理科生在高考志愿中报考“经济类”专业是否与性别有关,现从该市高三理科生中随机抽取50名学生进行调查,得到如下2×2列联表:(单位:人)(1)据此样本,判断能否在犯错误的概率不超过0.001的前提下认为理科生报考“经济类”专业与性别有关?(2)若以样本中各事件的频率作为概率估计全市总体考生的报考情况,现从该市的全体考生(人数众多)中随机抽取3人,设3人中报考“经济类”专业的人数为随机变量X,求随机变量X的概率分布列及数学期望.附:,其中n=a+b+c+d.【答案】(1) 有99%的把握认为理科生愿意报考“经济类”专业与性别有关(2)见解析【解析】试题分析:(I)计算K2,根据临界值表作出结论;(II)分别计算X=0,1,2,3时的概率得出分布列,根据分布列得出数学期望和方差.(Ⅱ)估计该市的全体考生中任一人报考“经济类”专业的概率为X的可能取值为0,1,2,3,由题意,得X~B(3,),∴随机变量X的分布列为∴随机变量X的数学期望6.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为了研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均50,60,60,70,70,80,80,90,90,100,分别加以统计,得到如图所示的频率生产件数分成5组:[)[)[)[)[]分布直方图.(1)根据“25周岁以上组”的频率分布直方图,求25周岁以上组工人日平均生产件数的中位数的估计值(四舍五入保留整数);(2)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;⨯列联表,并判断是否(3)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22900的把握认为“生产能手与工人所在年龄组有关”?有0附: ()()()()()22n ad bc a b c d a c b d χ-=++++【答案】(1)73;(2)710;(3)没有0900的把握认为“生产能手与工人所在的年龄组有关”.【解析】试题分析:(1)根据频率分布直方图可得中位数为0.50.050.3570100.35--+⨯;(2)根据频率分布直方图计算出25周岁以上3名,25周岁以下工人2名,利用列举法,根据古典概型的概率计算公式即可得结果;(3)根据题意完成列联表,计算出2χ的值即可得结果.(2)由频率分布直方图可知,日平均生产件数不足60件的工人中,25周岁以上共600.005103⨯⨯=名,设其分别为123,,m m m ;25周岁以下工人共400.005102⨯⨯=名,设其分别为12,n n .记“至少抽到一名25周岁以下工人”为事件A . 所有基本事件分别为()()()()()()()()()()12131112232122313212,,,,,,,,,,,,,,,,,,,m m m m m n m n m m m n m n m n m n n n ,共10个;事件A 包含的基本事件共7个.由于事件A 符合古典概型,则()710P A =; (3)由频率分布直方图可知,25周岁以上的“生产能手”共()600.020.051015⎡⎤⨯+⨯=⎣⎦名,25周岁以下的“生产能手”共()400.03250.0051015⎡⎤⨯+⨯=⎣⎦名,则22⨯列联表如图所示.所以()2210015251545251.7862.7066040307014χ⨯⨯-⨯==≈<⨯⨯⨯, 综上,没有90%的把握认为“生产能手与工人所在的年龄组有关”.。
独立性检验课件-高二下学期数学人教A版(2019)选择性必修第三册

X=0
(a b)(a c)
n
X=1
(c d )(a c)
n
合计 a+c
Y=1
(a b)(b d )
n
(c d )(b d )
n
b+d
合计
a+b
c+d
n
0.1
0.05
0.01
0.005
0.001
x
2.706
3.841
6.635
7.879
10.828
基于小概率值α的检验规则是 :
出现错误,出错的概率可以
控制在小概率内。
独立性检验
从假设检验的角度,科学推断两分类变量是否相关联。
Y=0
Y=1
合计
X=0 a
b
a+b
X=1 c
d
c+d
合计 a+c
b+d
a+b+c+d
独立性检验
“两分类变量无差异”,即“两分类变量独立”。
零假设H。:分类变量X和Y独立
构造统计量
令n=a+b+c+d
当 2 x 时,我们就推断H。不成立,即认为X和Y不独立,该推断犯错误的概率不超过α。
2
当 x 时,我们没有充分证据推断H。不成立,可以认为X和Y独立。
0.1
0.05
0.01
0.005
0.001
x
2.706
3.841
6.635
7.879
10.828
2
问题1:若以小概率值α=0.1为标准,若计算得 2.5 ,是否可以拒绝假设?
2019年高考风向标-高考理科数学一轮复习第十六章统计第3讲回归分析与独立性检验配套课件26页
5.已知 x 与 y 之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则 y 与 x 的 线 性 回 归 方 程 为 y = bx + a 必 过 点 _(_1_._5_,4_)__
解析: x=1.5, y =4,回归直线必过样本点中心(1.5,4).
考点 1 线性回归的应用
例 1:.某种书每册的成本费 y(元)与印刷册数 x(千册)有关, 经统计得到数据如下:
1.回归分析是对具有相关关系的两个变量进行统计分析的 一种方法,而联系这两个变量之间的关系的方程称为回归方程,
下列叙述中正确的是(D ) A.回归方程一定是直线方程 B.回归方程一定不是直线方程 C.回归方程是变量之间关系的严格刻画 D.回归方程是变量之间关系的一种近似刻画 解析:回归方程包括线性和非线性的,是对变量间相关关
30 30 32 28 根据临界值表则 P(K2≥7.879)=0.005. 则有 99.5%的把握认为课外阅读量大与作文成绩优秀有关.
分步计算,用好相关数据信息.
【互动探究】 2.抽取 1 800 人, 性别与色盲症列联表如下:
色盲
非色盲
总计
男
12
女
5
788
800
995
1 000
总计
17
1 783
x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15
检验每册书的成本费 y 与印刷册数倒数1x之间是否具有线性 相关关系?如有,求出 y 对 x 的回归方程.
解题思路:本题是非线性回归分析问题,不妨设变量 u= 1 , x
高二数学独立性检验(2019年9月)
合计 245 100 345
练习二
1.某地区随机抽取一个样本,样本中包含110名女士和 90名男士,女士中约有9%是左手利,男士中约有11% 是左手利.
①从样本中随机抽取一男一女,则这两个人都是左手 利的概率是————;
②根据题中的数据,请说明在样本代表的总体中左手 利与性别是否有关?
练习二
2.在国家实施西部开发战略之前,一新闻单位在应届 大学毕业生中随机抽取1000人进行问卷调查,结果 只有80人志愿加入国家西部建设.而国家实施西部 开发战略之后,随机抽取1200人进行问卷调查,结果 只有400人志愿加入国家西部建设.问:实施西部开 发战略的公布是否对应届大学毕业生的选择产生 了影响?
练习二
3.调查者询问72名男女大学生在购买食品时是否看 营养说明,得到如表所示的数据,从表中的数据分析 大学生的性别与看不看营养说明之间有没有关系?
男大学生 女大学生
合计
看营养说明 不看营养说明
28
8
16
20
44
28
合计 36 36 72
练习二
4.网络对现代人的生活影响较大,尤其是青少年.为了 解网络对中学生学习成绩的影响,某地区教育主管 部门从辖区初中学生中抽取1000名进行调查,发现 其中经常上网的有200人,这200人中有80人期末考 试不及格,而另外800人中有120人不及格,问:中学 生经常上网是否影响学习,为什么?
复习回顾 5.反证法原理与假设检验原理
反证法原理:在一个已知假设下,如果推出一个矛盾, 那么这样说明了这个假设不成立。
假设检验原理:在一个已知假设下,如果一个与该假设 矛盾的小概率事件发生,那么推断这个 假设不成立.
练习一 1.以下关于独立性检验的说法中,正确说法的序号
备战高考数学复习考点知识与题型讲解86---独立性检验
备战高考数学复习考点知识与题型讲解第86讲独立性检验考向预测核心素养利用2×2列联表和卡方独立性检验判断两个变量的相关关系是高考考查的热点,各种题型均会出现.数据分析、数学运算一、知识梳理1.分类变量与列联表(1)分类变量在讨论问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.(2)2×2列联表列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为y 1y2合计x1a b a+bx2c d c+d合计a+c b+d a+b+c+d2.独立性检验(1)零假设以Ω为样本空间的古典概型.设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.H:分类变量X和Y独立.通常称H0为零假设或原假设.(2)χ2公式假设我们通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).对于任何小概率值α,可以找到相应的正实数xα,使得下面关系成立:P(χ2≥xα)=α.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.概率值α越小,临界值xα越大.(3)独立性检验基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.二、教材衍化1.(人A选择性必修第三册P134练习T1改编) 为调查中学生近视情况,测得某校男生150名中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )A.回归分析 B.均值与方差C.独立性检验 D.概率答案:C2.(人A选择性必修第三册P134练习T4改编)为了判断高三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性不大于________.解析:χ2≈4.844>3.841=x0.05,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性不大于0.05.答案:0.053.(人A选择性必修第三册P132例3改编)随着国家三孩政策的放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表.由χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),得χ2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表:α根据小概率值α=0.010的独立性检验,可以得到的结论是____________.答案:生育意愿与城市级别有关一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)独立性检验是检验两个分类变量是否有关的一种统计方法.( )(2)独立性检验得到的结论一定是正确的.( )(3)独立性检验的样本不同,其结论可能不同.( )(4)若事件X,Y关系越密切,则由观测数据计算得到的χ2越小.( ) 答案:(1)√(2)×(3)√(4)×二、易错纠偏1.(列联表意义不明致误)下面是2×2列联表:y 1y2合计x1a 2173x2222547合计 b 46120则表中a,b的值分别为( )A.94,72 B.52,50C.52,74 D.74,52解析:选C.因为a+21=73,所以a=52.又a+22=b,所以b=74.2.(独立性检验理解不当致误)(2022·揭阳模拟)随机询问50名大学生调查爱好某项运动是否和性别有关.利用2×2列联表计算得χ2=8.333,则下列结论正确的是( )附:α0.0100.0050.001αA.在犯错误的概率不大于0.005的前提下认为“是否爱好该项运动与性别有关”B.在犯错误的概率不大于0.005的前提下认为“是否爱好该项运动与性别无关”C.在犯错误的概率不大于0.001的前提下,认为“是否爱好该项运动与性别有关”D.在犯错误的概率不大于0.001的前提下,认为“是否爱好该项运动与性别无关”解析:选 A.因为8.333>7.879,由附表知,在犯错误的概率不大于0.005的前提下,认为“是否爱好该项运动与性别有关”.故选A.考点一分类变量与列联表(自主练透)复习指导:掌握分类变量的含义;通过实例,理解2×2列联表的统计意义.1.(多选)根据如图所示的等高堆积条形图,下列叙述正确的是( )A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.不能判断吸烟与患肺病之间的关系解析:选ABC.从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.A,B,C都正确,D不正确.2.(2022·湖南省永州市高三适应性考试)“直播电商”已经成为当前经济发展的新增长点,某电商平台的直播间经营化妆品和服装两大类商品,2021年前三个季度,该直播间每个季度的收入都比上一季度的收入翻了一番,其前三季度的收入情况如图所示,则( )A.该直播间第三季度总收入是第一季度总收入的3倍B.该直播间第二季度化妆品收入是第三季度化妆品收入的1 3C.该直播间第一季度化妆品收入是第三季度化妆品收入的1 6D.该直播间第三季度服装收入低于前两个季度的服装收入之和解析:选B.对于选项A,因为该直播间每个季度的收入都比上一季度的收入翻了一番,所以第三季度的总收入是第一季度的2×2=4倍,故A错误;对于选项B,设第一季度的总收入为a,则第二季度、第三季度的总收入分别为2a,4a,第二季度的化妆品收入为2a×20%=0.4a,第三季度的化妆品收入为4a×30%=1.2a,所以第二季度化妆品收入是第三季度化妆品收入的0.4a1.2a=13,故B正确;对于选项C,第一季度的化妆品收入为a×10%=0.1a,所以第一季度化妆品收入是第三季度化妆品收入的0.1a1.2a=112,故C错误;对于选项D,第一、二季度服装收入和为a+2a-0.1a-0.4a=2.5a,第三季度服装收入为4a-1.2a=2.8a,故D错误.故选B.3.(2022·上海华师大二附中高二月考)假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为XY合计y1y2x1a b a+bx2c d c+d合计a+c b+d a+b+c+d对同一样本,以下数据能说明X与Y有关的可能性最大的一组为( )A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=3,b=2,c=4,d=5解析:选D.对于同一样本,|ad-bc|越小,说明X与Y相关性越弱,而|ad-bc|越大,说明X与Y相关性越强,通过计算知,对于A、B、C都有|ad-bc|=|10-12|=2;对于选项D,有|ad-bc|=|15-8|=7,显然7>2.4.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与会俄语”的2×2列联表中,a-b+d=________.性别俄语合计会俄语不会俄语男 a b 20女6 d合计1830解析:由2×2列联表的性质,可得:a=18-6=12,b=20-12=8,6+d=30-20,可得d=4,所以a-b+d=8.答案:8求解参数的方法(1)根据等高堆积条形图的高度差直接判断.(2)直接利用2×2列联表的性质,建立方程即可求参数.考点二独立性检验(多维探究)复习指导:通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验的基本思想、方法及初步应用.角度1 简单的独立性检验问题某校推广新课改,在两个程度接近的班进行试验,一班为新课改班级,二班为非课改班级,经过一个学期的教学后对期末考试进行分析评价,规定:总分超过550(或等于550分)为优秀,550以下为非优秀,得到以下列联表:优秀非优秀合计一班3513二班1725合计(1)请完成列联表;(2)依据小概率值α=0.01的独立性检验,能否认为推广新课改与总成绩是否优秀有关系?参考数据:α0.10.050.010.005xα2.7063.841 6.6357.879χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).【解】(1)优秀非优秀合计一班351348二班172542合计523890 (2)零假设为H0:推广新课改与总成绩是否优秀无关.根据列联表中的数据,得到χ2=90×(35×25-13×17)248×42×52×38≈9.663>6.635=x0.01,故根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为推广新课改与总成绩是否优秀有关系,此推断犯错误的概率不大于0.01.角度2 独立性检验与统计、概率的综合问题(2022·四川雅安5月三模改编)高铁在出行方式中越来越受欢迎,某部门利用大数据随机抽取了出行人群中的100名旅客进行调查统计,得知在40岁及以下的旅客中乘坐高铁出行的占23.(1)请完成下面的2×2列联表,并依据小概率值α=0.001 的独立性检验,分析能否认为乘坐高铁出行与年龄有关;(2)为提升服务质量,该部门从这100名旅客中按年龄采用分层随机抽样的方法选取5人参加座谈会,会后再进行抽奖活动,奖品共三份,由于年龄差异,规定40岁及以下的旅客若中奖,则每人得800元,40岁以上的旅客若中奖,则每人得1 000元,设三份奖品总金额为X 元,求X 的分布列与数学期望.参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .参考数据:【解】 (1)由已知可得,样本中40岁及以下乘坐高铁出行的有60×23=40(人).2×2列联表如下:零假设为H 0:乘坐高铁出行与年龄无关.由列联表中的数据计算可得χ2=100×(40×30-20×10)260×40×50×50≈16.667>10.828=x0.001.根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为乘坐高铁出行与年龄有关,此推断犯错误的概率不大于0.001.(2)采用分层随机抽样的方法,则从40岁及以下的人中抽取3人,从40岁以上的人中抽取2人.X的所有可能取值为2 400,2 600,2 800.P(X=2 400)=C33C02C35=110,P(X=2 600)=C23C12C35=35,P(X=2 800)=C13C22C35=310.故分布列如下:X 2 400 2 600 2 800P11035310E(X)=2 400×110+2 600×35+2 800×310=2 640.(1)在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得到结论.独立性检验的一般步骤:①根据样本数据制成2×2列联表;②根据公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算得到χ2的值;③比较χ2的值与临界值的大小关系,作统计推断.|跟踪训练|(2022·西藏拉萨那曲第二高级中学高三月考)某中学随机抽查了50名同学的每天课外阅读时间,得到如下统计表:(1)求这50名同学的平均阅读时长(用区间中点值代表每个人的阅读时长);(2)在阅读时长位于(40,50]的4人中任选2人,求甲同学被选中的概率;(3)进一步调查发现,语文成绩和每天的课外阅读时间有很大关系,每天的课外阅读时间多于半小时称为“阅读迷”,语文成绩达到120分视为优秀,根据每天的课外阅读时间和语文成绩是否优秀,制成一个2×2列联表:依据小概率值α=0.01的独立性检验,能否认为语文成绩是否优秀与课外阅读时间有关?参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). 参考数据:解:(1)设这50名同学的平均阅读时长为x-min,则x-=5×4+15×10+25×14+35×18+45×450=26.6,故这50名同学的平均阅读时长为26.6 min.(2)设这4名学生中分别为甲、乙、丙、丁,从这4名学生中任取2名学生,所有的样本点有:(甲,乙),(甲,丙),(甲,丁),(乙,丙),(乙,丁),(丙,丁),共6个,其中,事件“甲同学被选中”所包含的样本点有:(甲,乙),(甲,丙),(甲,丁),因此,所求概率为P=36=12.(3)零假设为H0:语文成绩是否优秀与课外阅读时间无关.由列联表中的数据计算得χ2=50×(20×25-2×3)222×28×23×27≈31.897>6.635=x0.01,因此,根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为语文成绩是否优秀与课外阅读时间有关,此推断犯错误的概率不大于0.01.[A 基础达标]1.下面的等高条形图可以说明的问题是( )A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:选D.由等高条形图可知“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的频率不同,所以“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握,所以选项D正确,故选D.2.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,得到“偏爱蔬菜还是肉类与性别有关”这个结论犯错误的概率大于0.001,而不大于0.01,则χ2的值可能为( ) 附表:A.3.206B.6.561C.7.879D.11.028解析:选 C.根据题意得χ2的取值范围为[6.635,10.828),因此χ2的值可能为7.879.故选C.3.(多选)假设有两个分类变量X和Y,其2×2列联表如下表所示:在犯错误的概率不超过0.05的前提下,下面哪个选项可以认为变量X,Y有关( )A.a=10 B.a=12C.a=8 D.a=9解析:选ACD.根据列联表知,aa+40与30-a60-a的差距越小,则越无法认为变量X,Y有关联,分析四个选项,B选项中,a=12时,aa+40与30-a60-a的差距最小,且不满足犯错误的概率不超过0.05的条件,而其他选项均满足.4.小波同学为了验证谚语“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表,并计算得到χ2≈19.05,下列小波对地区A 天气判断不正确的是( )附表:A.夜晚下雨的概率约为1 2B.未出现“日落云里走”夜晚下雨的概率约为5 14C.做出“‘日落云里走’是否出现与当晚是否下雨有关”这一推断犯错误的概率不大于0.001D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨解析:选D.据列联表,100天中有50天下雨,50天未下雨,因此下雨的概率约为50 100=12,A正确;同样,未出现“日落云里走”夜晚下雨的概率约为2525+45=514,B正确;因为χ2≈19.05>10.828=x0.001,所以做出“‘日落云里走’是否出现与当晚是否下雨有关”这一推断犯错误的概率不大于0.001,C正确;有关只是说可能性,不代表一定下雨,D错误.故选D.5.(多选)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算χ2≈5.059,则可以推断出( )附:A.该俱乐部的男性会员对运动场所满意的概率的估计值为2 3B.调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意C.做出“男性会员、女性会员对运动场所的评价有差异”这一推断犯错误的概率不大于0.05D.做出“男性会员、女性会员对运动场所的评价有差异”这一推断犯错误的概率不大于0.01解析:选ABC.对于选项A,该俱乐部男性会员对运动场所满意的概率的估计值为18 27=23,故A正确;对于选项B,该俱乐部女性会员对运动场所满意的概率的估计值为823,而23=4669>823=2469,故B正确;因为χ2≈5.059>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,我们认为男性会员、女性会员对运动场所的评价有差异,此推断犯错误的概率不大于0.05,故C正确,D错误.6.(多选)某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表.经计算得χ2=100×(35×28-15×22)250×50×57×43≈6.895.之后又对被研究者的身高进行了统计,得到男、女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是( )A.“爱好拳击运动与性别有关”,这个结论犯错误的概率不超过0.01B.在100个男生中,至少有一个人爱好打拳击C.男生身高的平均数为175,男生身高的标准差为16D.女生身高的平均数为164,女生身高的标准差为3解析:选AD.χ2≈6.895>6.635=x0.01,A对;显然B错;男生身高的标准差为4,C 错;显然D对,故选AD.7.(2022·赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层随机抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________.附表:解析:由列联表计算得χ2=50×(22×12-8×8)2≈5.556>3.841=x0.05,所以推断犯错误的概率不超过0.05.30×20×20×30答案:0.058.(2022·黑龙江模拟)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:性别疗效合计无效有效男性患者153550女性患者64450合计2179100设H0:服用此药的效果与患者的性别无关,则χ2≈________(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的概率不大于________.解析:由公式计算得χ2=100×(15×44-6×35)221×79×50×50≈4.882,因为χ2>3.841=x0.05根据α=0.05的独立性检验,分析服用此药的效果与患者的性别有关,判断出错的概率不大于0.05.答案:4.882 0.059.(2022·山东省济南市高二期末)为了研究某种疾病的治愈率,某医院对100名患者中的一部分患者采用了外科疗法,另一部分患者采用了化学疗法,并根据两种治疗方法的治愈情况绘制了等高堆积条形图,如下:(1)根据图表完善以下关于治疗方法和治愈情况的2×2列联表;疗法疗效合计未治愈治愈外科疗法化学疗法18合计100(2)依据小概率值α=0.05的独立性检验,分析此种疾病治愈率是否与治疗方法有关.附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).(如需计算χ2,结果精确到0.001)α0.10.050.010.0050.001xα2.7063.841 6.6357.87910.828解:(1)根据等高条形图,采用化学疗法的治愈率为30%,由列联表得化学疗法治愈的人数为18人,故采用化学疗法的人共有18÷30%=60人,采用外科疗法的有40人,其中治愈的有40×50%=20人.所以列联表如下表:疗法疗效合计未治愈治愈外科疗法202040化学疗法421860合计6238100 (2)零假设为H0:设此种疾病治愈率与治疗方法无关.则根据列联表中的数据计算χ2=100×(20×18-42×20)262×38×60×40=2 400589≈4.075>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为此种疾病治愈率与治疗方法有关,此推断犯错误的概率不大于0.05.10.(2022·福州市质量检测)某部门研究成果认为,房租支出超过月收入13的租户“幸福指数”低,房租支出不超过月收入13的租户“幸福指数”高.为了了解甲、乙两小区租户的幸福指数高低,随机抽取甲、乙两小区的租户各100户进行调查.甲小区租户的月收入以[0,3),[3,6),[6,9),[9,12),[12,15](单位:千元)分组的频率分布直方图如图所示.乙小区租户的月收入(单位:千元)的频数分布表如下:(1)设甲、乙两小区租户的月收入相互独立,记M表示事件“甲小区租户的月收入低于6千元,乙小区租户的月收入不低于6千元”,把频率视为概率,求M的概率;(2)利用频率分布直方图,求所抽取的甲小区100户租户的月收入的中位数;(3)若甲、乙两小区每户的月租费分别为2千元、1千元.请根据条件完成下面的2×2列联表,并依据小概率值α=0.001的独立性检验,分析幸福指数与租住的小区是否有关.附:临界值表参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解:(1)记A表示事件“甲小区租户的月收入低于6千元”,记B表示事件“乙小区租户的月收入不低于6千元”,甲小区租户的月收入低于6千元的频率为(0.060+0.160)×3=0.66,故P(A)的估计值为0.66;乙小区租户的月收入不低于6千元的频率为24+9+2100=0.35,故P(B)的估计值为0.35.因为甲、乙两小区租户的月收入相互独立,所以事件M的概率的估计值为P(M)=P(A)P(B)=0.66×0.35=0.231.(2)设甲小区所抽取的100户租户的月收入的中位数为t,则0.060×3+(t-3)×0.160=0.5,解得t=5.(3)零假设为H0:幸福指数与租住的小区无关.根据2×2列联表中的数据,得到χ2=200×(66×62-34×38)2100×100×104×96≈15.705>10.828=x0.001,依据小概率值α=0.001的独立性检验,我们认为H0不成立,即认为幸福指数与租住的小区有关,此推断犯错误的概率不大于0.001.[B 综合应用]11.(多选)(2022·梅州高二模拟)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若做出“是否喜欢抖音和性别有关”这一推断犯错误的概率不大于0.05,则调查人数中男生的人数可能为( )附表:附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).A.25 B.35C.45D.60解析:选CD.设男生可能有x人,依题意得女生有x人,可得2×2列联表如下:若做出“是否喜欢抖音和性别有关”这一推断犯错误的概率不大于0.05,则χ2≥3.841=x0.05,即χ2=2x·⎝⎛⎭⎪⎫45x·25x-35x·15x275x·35x·x·x=221x≥3.841,解得x≥40.330 5,由题意知x>0,且x是5的整数倍,所以45和60都满足题意.故选CD.12.(2022·青岛市统一质量检测)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解析:由题意作出2×2列联表:则χ2=105×(45×20-10×30)2 55×50×75×30≈6.109>5.024=x0.025,所以认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.025.答案:0.025[C 素养提升]13.(2020·新高考卷Ⅱ改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,并依据小概率值α=0.01的独立性检验,能否认为该市一天空气中PM2.5浓度与SO2浓度有关?附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),解:(1)根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8 =64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)根据抽查数据,可得2×2列联表:(3)零假设为H0:该市一天空气中PM2.5浓度与SO2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x0.01.依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关,此推断犯错误的概率不大于0.01.。
2019高考数学(理)(全国通用版)大一轮复习课件 第九篇 统计与统计案例(必修3、选修2-3)第3节 变量的
栏目 导引
专题一
集合、常用逻辑用语、函数与导数、不等式
对点自测
1.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由 这些样本点通过最小二乘法得到的(如图),以下结论中正确的 C 是( ) (A)x和y正相关 (B)x和y的相关系数为直线l的斜率 (C)x和y的相关系数在-1到0之间 (D)当n为偶数时,分布在l两侧的样本点的个数一定相同 解析:根据回归直线可知变量x,y负相关,且由l的斜率知相关 系数在 (-1,0)之间.故选C.
ˆ =x+2.8 (C) y ˆ =-x+2.8 (D) y
D )
解析:负相关,且过样本点的中心(0,2.8),可知为选项D中方 程.故选D.
栏目 导引
专题一
集合、常用逻辑用语、函数与导数、不等式
3.某车间为了规定工时定额 ,需要确定加工零件所花费的时间 ,为此进行了 5
②2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2}, 其样本频数列联表(称为2×2列联表)为
y1 x1 x2 总计 a c a+c
n ad bc
2
y2 b d b+d
总计 a+b c+d a+b+c+d
(2)独立性检验
2 b= d其中 aK c d a c b ( 利用随机变量 n=a+b+c+d为样本容量)
x y nx y
n i 1 n i i 2 x i nx i 1 2
,
②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),„,(xn,yn) 中, x =
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、解答题
1.学校对甲、乙两个班级的同学进行了体能测验,成绩统计如下(每班50人):
(1)成绩不低于80分记为“优秀”.请填写下面的列联表,并判断是否有的把握认为“成绩优秀”与所在教学班级有关?
(2)从两个班级的成绩在的所有学生中任选2人,其中,甲班被选出的学生数记为,求的分布列与数学期望.
赋:.
2.中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备,某高中每年招收学生1000人,开设大学先修课程已有两年,共有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有50人,这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试(满分100分),结果如下表所示:
(1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性体验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?
(2)已知今年有150名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.
①在今年参与大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率;
②某班有4名学生参加了大学先修课程的学习,设获得某高校自主招生通过的人数为,求的分布列,并求今年全校参加大学先修课程的学生获得大学自主招生通过的人数.
参考数据:
参考公式:,期中,
3.近年来随着我国在教育科研上的投入不断加大,科学技术得到迅猛发展,国内企业的国际竞争力得到大幅提升.伴随着国内市场增速放缓,国内有实力企业纷纷进行海外布局,第二轮企业出海潮到来.如在智能手机行业,国产品牌已在赶超国外巨头,某品牌手机公司一直默默拓展海外市场,在海外共设多个分支机构,需
要国内公司外派大量后、后中青年员工.该企业为了解这两个年龄层员工是否愿意被外派工作的态度,按分层抽样的方式从后和后的员工中随机调查了位,得到数据如下表:
(1)根据调查的数据,是否有以上的把握认为“是否愿意被外派与年龄有关”,并说明理由;
(2)该公司举行参观驻海外分支机构的交流体验活动,拟安排名参与调查的后、后员工参加.后员工
中有愿意被外派的人和不愿意被外派的人报名参加,从中随机选出人,记选到愿意被外派的人数为;
后员工中有愿意被外派的人和不愿意被外派的人报名参加,从中随机选出人,记选到愿意被外派的人数
为,求的概率.
参考数据:
(参考公式:,其中).
4.通过随机询问名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:
附:
(1)由以上列联表判断,能否在犯错误的概率不超过的前提下认为性别和是否看营养说明有关系呢?(2)从被询问的名不读营养说明的大学生中随机选取名学生,求抽到女生人数的分布列及数学期望.
5.共享单车已成为一种时髦的新型环保交通工具,某共享单车公司为了拓展市场,对两个品牌的共享单车在编号分别为的五个城市的用户人数(单位:十万)进行统计,得到数据如下:
(Ⅰ)若共享单车用户人数超过50万的城市称为“优城”,否则称为“非优城”,据此判断能否有85%的把握认为“优城”和共享单车品牌有关?
(Ⅱ)若不考虑其它因素,为了拓展市场,对A品牌要从这五个城市选择三个城市进行宣传,
(ⅰ)求城市2被选中的概率;
(ⅱ)求在城市2被选中的条件下城市3也被选中的概率.
6.为推动实施健康中国战略,树立国家大卫生、大健康概念,手机APP也推出了多款健康运动软件,如“微信运动”,杨老师的微信朋友圈内有600位好友参与了“微信运动”,他随机选取了40位微信好友(女20人,男20人),统计其在某一天的走路步数,其中,女性好友的走路步数数据记录如下:
男性好友走路的步数情况可分为五个类别:(说明:“”表示大于等于0,小于等于2000,下同),,,,,且,,三种类别人数比例为,将统计结果绘制如图所示的条形图,若某人一天的走路步数超过8000步被系统认定为“卫健型”,否则被系统认定为“进步型”.
若以杨老师选取的好友当天行走步数的频率分布来估计所有微信好友每日走路步数的概率分布,请估计杨老师的微信好友圈里参与“微信运动”的600名好友中,每天走路步数在5001~10000步的人数;
请根据选取的样本数据完成下面的列联表并据此判断能否有以上的把握认定“认定类型”与“性别”有关?
若按系统认定类型从选取的样本数据中在男性好友中按比例选取10人,再从中任意选取3人,记选到“卫健型”的人数为,女性好友中按比例选取5人,再从中任意选取2人,记选到“卫健型”的人数为,求事件“”的概率.。