2020 第2部分 专题3 第2讲 统计与统计案例

合集下载

2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3

2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3

§3.2 独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K 2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一 分类变量及2×2列联表思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表.y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d知识点二 等高条形图1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.2.如果通过直接计算或等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.知识点三 独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.列联表中的数据是两个分类变量的频数.( √)2.事件A与B的独立性检验无关,即两个事件互不影响.( ×)3.K2的大小是判断事件A与B是否相关的统计量.( √)类型一等高条形图的应用例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点定性分析的两类方法题点利用图形定性分析解等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.反思与感悟在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.两个比例的值相差越大,X与Y有关系成立的可能性就越大.跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?考点定性分析的两类方法题点利用图形定性分析解根据题目所给的数据得到如下2×2列联表:经常上网不经常上网总计不及格80120200及格120680800总计200800 1 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.类型二独立性检验例2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.考点独立性检验及其基本思想题点独立性检验的方法解 将2×2列联表中的数据代入公式计算,得K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(60×10-20×10)270×30×80×20=10021≈4.762. 因为4.762>3.841,所以在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.反思与感悟 (1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0,因此|ad -bc |越小,关系越弱;|ad -bc |越大,关系越强. (2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k 0.②利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值k .③如果k ≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”. 跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系. 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式得K 2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关. 类型三 独立性检验的综合应用例3 (2017·全国Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).考点独立性检验思想的应用题点分类变量与统计、概率的综合性问题解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,由P (A )=P (BC )=P (B )P (C ),则旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62,新养殖法的箱产量不低于50 kg 的频率为(0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66,则事件A 的概率估计值为P (A )=P (B )P (C )=0.62×0.66=0.409 2, ∴A 发生的概率为0.409 2.(2)根据箱产量的频率分布直方图得到列联表:则K 2=200×(62×66-38×34)2100×100×96×104≈15.705,由15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. 反思与感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例aa +b,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占的比例cc +d.两个比例的值相差越大,X 与Y 有关系成立的可能性就越大.(2)观测值法:通过2×2列联表,先计算K 2的观测值k ,然后借助k 的含义判断“两个分类变量有关系”这一结论成立的可信程度.跟踪训练3 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X ,求X 的分布列与均值. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题 解 (1)列联表补充如下:喜爱打篮球不喜爱打篮球合计 男生 22 6 28 女生 10 10 20 合计321648(2)由K 2=48×(220-60)228×20×32×16≈4.286.因为4.286>3.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关. (3)喜爱打篮球的女生人数X 的可能取值为0,1,2. 其概率分别为 P (X =0)=C 210C 220=938,P (X =1)=C 110C 110C 220=1019,P (X =2)=C 210C 220=938,故X 的分布列为X 0 1 2 P9381019938X 的均值为E (X )=0+1019+919=1.1.某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数 B .方差 C .回归分析 D .独立性检验 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 D2.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大考点独立性检验及其基本思想题点独立性检验的思想答案 B解析k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.3.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )考点定性分析的两类方法题点利用图形定性分析答案 D解析由等高条形图易知,D选项两个分类变量关系最强.4.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有考点独立性检验及其基本思想题点独立性检验的方法答案 D解析独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.总成绩好 总成绩不好 总计 数学成绩好 478 a490 数学成绩不好39924423 总计b c913(1)计算a ,b ,c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗? 考点 独立性检验及其基本思想 题点 独立性检验的方法解 (1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)计算随机变量K 2的观测值k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,因为P (K 2≥5.024)≈0.025,所以在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系. 2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K 2的值,如果K 2的值很大,说明假设不合理.K 2越大,两个分类变量有关系的可能性越大.一、选择题1.下面是一个2×2列联表:y 1 y 2总计 x 1 a21 73 x 2825 33 总计b46106则表中a ,b 的值分别为( ) A .94,96 B .52,50 C .52,60D .54,52考点 分类变量与列联表 题点 求列联表中的数据 答案 C2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得K 2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( ) A .0.1% B .1% C .99% D .99.9% 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C解析 易知K 2=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.3.在独立性检验中,两个分类变量“X 与Y 有关系”的可信度为99%,则随机变量K 2的观测值k 的取值范围是( ) A .[3.841,5.024) B .[5.024,6.635) C .[6.635,7.879) D .[7.879,10.828)考点 分类变量与列联表 题点 求观测值 答案 C4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:则随机变量K 2的观测值约为( ) A .0.600 B .0.828 C .2.712D .6.004考点 分类变量与列联表 题点 求观测值 答案 A解析 根据列联表中的数据,可得随机变量K 2的观测值k =90×(11×37-34×8)245×45×19×71≈0.600.故选A.5.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )A.a a +b 与c c +d B.a c +d 与c a +b C.aa +d 与cb +cD.ab +d 与ca +c考点 定性分析的两类方法 题点 利用图形定性分析 答案 A 解析 由题意,⎪⎪⎪⎪⎪⎪a a +b -c c +d =⎪⎪⎪⎪⎪⎪ac +ad -ac -bc (a +b )(c +d )=⎪⎪⎪⎪⎪⎪ad -bc (a +b )(c +d ),因为|ad -bc |的值越大,两个分类变量有关系的可能性就越大,故选A.6.有两个分类变量X ,Y ,其列联表如下所示,其中a,15-a 均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X ,Y 有关,则a 的值为( ) A .8 B .9 C .8或9D .6或8考点 分类变量与列联表 题点 求列联表中的数据 答案 C解析 根据公式,得K 2的观测值 k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8或9时满足题意.7.某班主任对全班50名学生进行了作业量的调查,数据如下表:则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( ) A .0.01 B .0.025 C .0.005 D .0.001 考点 独立性检验及其基本思想 题点 独立性检验的方法答案 B解析 由公式得K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024.∵P (K 2≥5.024)=0.025,∴犯错误的概率不超过0.025. 二、填空题8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________. 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 ③解析 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确. 9.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为K 2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为__________.考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 5%解析 因为K 2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.10.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35,所以q =25,p =25,a =40,b =60.K 2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841.故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关. 三、解答题11.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断. 考点 定性分析的两类方法 题点 利用图形定性分析解 建立性别与态度的2×2列联表如下:根据列联表中所给的数据,可求出男生中作肯定态度的频率为110=0.2,女生中作肯定态度的频率为2260≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.根据列联表中的数据得到K 2的观测值k =170×(22×38-22×88)2110×60×44×126≈5.622>5.024.因此,在犯错误的概率不超过0.025的前提下认为性别和态度有关系.12.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表所示:喜欢 不喜欢 合计 大于40岁 20 5 25 20岁至40岁10 20 30 合计302555(1)判断是否有99.5%的把握认为喜欢“人文景观”景点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6名市民作为一个样本,从中任选2人,求恰有1位大于40岁的市民和1位20岁至40岁的市民的概率. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得,观测值k ≈11.978>7.879,所以有99.5%以上的把握认为喜欢“人文景观”景点与年龄有关.(2)由题意知抽取的6人中大于40岁的市民有4个,20岁至40岁的市民有2个,分别记为B 1,B 2,B 3,B 4,C 1,C 2,从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,C 1),(B 1,C 2),(B 2,B 3),(B 2,B 4),(B 2,C 1),(B 2,C 2),(B 3,B 4),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),(C 1,C 2),共15个,其中恰有1位大于40岁的市民和1位20岁至40岁的市民的事件有(B 1,C 1),(B 1,C 2),(B 2,C 1),(B 2,C 2),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),共8个,所以恰有1位大于40岁的市民和1位20岁至40岁的市民的概率为815.四、探究与拓展13.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其中2×2列联表为:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组是( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =3,b =2,c =4,d =5考点 分类变量与列联表 题点 求列联表中的数据 答案 D解析 对于同一样本,|ad -bc |越小,说明x 与y 相关性越弱,而|ad -bc |越大,说明x 与y 相关性越强,通过计算知,对于A ,B ,C 都有|ad -bc |=|10-12|=2.对于选项D ,有|ad -bc |=|15-8|=7,显然7>2. 14.2017年世界第一届轮滑运动会(the first edtion of Roller Games)在南京举行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者.调查发现,男、女志愿者分别有10人和6人喜爱轮滑,其余不喜爱.得到2×2列联表如下.(1)根据2×2列联表,判断能否在犯错误的概率不超过0.10的前提下认为性别与喜爱轮滑有关? (2)从女志愿者中抽取2人参加接待工作,若其中喜爱轮滑的人数为ξ,求ξ的分布列和均值. 考点 独立性检验思想的应用题点 独立性检验与线性回归方程、均值的综合应用解 (1)假设:是否喜爱轮滑与性别无关.由已知数据可求得K 2的观测值为 k =30×(10×8-6×6)216×14×16×14≈1.157 5<2.706.因此不能在犯错误的概率不超过0.10的前提下认为喜爱轮滑与性别有关. (2)喜爱轮滑的人数ξ的可能取值为0,1,2, 则P (ξ=0)=C 06C 28C 214=2891=413,P (ξ=1)=C 16C 18C 214=4891,P (ξ=2)=C 26C 08C 214=1591.所以喜爱轮滑的人数ξ的分布列为4 13+1×4891+2×1591=67.所以喜爱轮滑的人数ξ的均值为E(ξ)=0×。

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

返回目录
(2)独立性检验(精确判断) 具体实施步骤如下: ①根据实际问题需要的可信程度确定临界值 k0; ② 根 据 观 测 数 据 计 算 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d的观测值 k,其中 n=a+b+c+ d 为样本容量;
返回目录
③查临界值表(以K2的观测值k的大小作为检验在多 大程度上可以认为“两个变量有关系”的标准),如果 k≥k0,就以(1-P(K2≥k0))×100%的把握认为“两分类 变量有关系”;否则,就认为根据样本数据没有充分的 理由说明“两分类变量有关系”.
返回目录
2.(独立性检验)有人发现,多看电视容易使人变冷 漠,下表是一个调查机构对此现象的调查结果.
冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58
总计 88 80 168
返回目录
则大约有多大的把握认为多看电视与人变冷漠有关
系( )
A.99%
B.97.5%
C.95%
D.90%
返回目录
要点三 独立性检验
定义 利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验 nad-bc2
公式 K2=_____a_+__b__c_+__d__a_+__c___b_+__d_____,其中n= ___a_+_b_+__c_+__d___
返回目录
①认真读题,取出相关数据,作出2×2列联表; 具体 ②根据2×2列联表中的数据,计算K2的观测值k; 步骤 ③通过观测值k与临界值k0比较,得出事件有关的
返回目录
P(K2≥k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635
思维导引:根据列联表直接代入K2公式可得南方学 生和北方学生的差异与是否喜欢甜品的相关程度.

第3讲(统计(1))

第3讲(统计(1))

第3讲统计(1)引子:从2020年高考全国卷Ⅱ说起:1.(2020·全国卷Ⅱ·文理科)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单配货,由于订单量大幅增加,导致订单积压,为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者A.10名 B.18名 C.24名 D.32名考点1从普查到抽样调查考法1 基本概念1.普查:普查是指一个国家或地区专门组织的一次性大规模的全面调查.普查的两个特点:所取得的资料更加全面、系统;主要调查在特定的时段社会经济现象总体的数量.2.抽样调查:从调查对象中按照一定的方法抽取一部分,进行调查或观察,获取数据,并以此对调查对象的某项指标作出推断,就是抽样调查.调查对象的全体称为,(总体)被抽取的部分称为 .(样本)考法2 概念的理解1.下列调查工作需要采用普查方式的是 BA.医院对病人的血液检查B.银行在收取储户现金时检验有没有假钞C.电视台对某节目收视率的调查D.质检部门对某批次奶粉合格率的调查2.下列问题适用抽样调查的是 . ①④⑤⑥①检测某一批次灯管使用寿命;②调查高一(1)班的男、女同学的比例;③高考体检;④了解炮弹的杀伤力;⑤测定海洋中微生物的含量;⑥了解全国的高三年级学生的体重,掌握学生的发育情况;3.为了了解参加市运动会的300名运动员的身高情况,从中抽取30名运动员进行测量,下列说法正确的是 . ②④⑤⑥①总体是300名运动员;②总体是300名运动员的身高;③个体是每一个运动员;④个体是每一个运动员的身高;⑤30名运动员的身高是样本;⑥样本容量是30.4.(2014·四川卷)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是 AA.总体B.个体C.样本的容量D.从总体中抽取的一个样本5.现从80件产品中随机抽出10件进行长度检验,下面说法正确的是 DA.80件产品是总体B.10件产品是样本C.样本容量是80D.样本容量是10考点2抽样方法考法1简单随机抽样的特点及抽样方法1.如果在抽样过程中,随机抽取一部分个体,然后对抽取的对象进行调查,并且能保证每个个体被抽到的概率,(相等)这样的抽样方法叫做简单随机抽样.2.当总体中的个数比较少时,一般采用简单随机抽样,简单随机抽样的特点是:①总体中的个体有限且N比较少;②逐个不放回的抽取;③抽取的样本数n不超过N;④整个抽样过程中,各个个体被抽到的机会相同,均为 . n N考向1抽签法1.某大学为了支援我国西部教育事业,决定从2018年应届毕业生报名的18名志愿者中,选取6人组成的志愿小组.则每个个体被抽到的可能性是 . 1 3考向2随机数表法1.(2013·江西卷)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始A.08B.07C.02D.01考法2分层抽样的特点及抽样方法考向1分层抽样的概念的理解1.将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫作分层抽样,有时也称为类型抽样. 或者称按比例抽样,整个抽样过程中,各个个体被抽到的机会相同.2.(2013·全国卷Ⅰ)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是 CA.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样3.(2008·重庆卷·文科)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是 DA .简单随机抽样法B .抽签法C .随机数表法D .分层抽样法4.(2018·全国卷Ⅲ·文科)某公司有大量客户,且不同年龄段客户对其服务的评价有较大的差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最适合的抽样方法为 .5.(2020·全国卷Ⅱ·文理科)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(,)i i x y (1i =,2,,20),其中i x 和i y 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得2060i i x ==∑,201200i i y==∑,202()80i i x x =-=∑,202()9000i i y y =-=∑,20()()800i i i x x y y =--=∑. (Ⅰ)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(Ⅱ)求样本的相关系数(精确到0.01);(Ⅲ)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一你认为更合理的抽样方法,说明理由. 分层抽样考向2用分层抽样方法抽样1.(2007·浙江卷·文科)某校有学生2000人,其中高三学生500人.为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本.则样本中高三学生的人数为 . 502.(2008·陕西卷·文科)某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为 CA .30B .25C .20D .153.(2007·陕西卷·文科)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 CA.4B.5C.6D.74.(2009·陕西卷·文科)某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为 BA.9 B.18 C.27 D.365.(2018·天津卷)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?3,2,2.6.(2019·天津卷·文科)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况. 应从老、中、青员工中分别抽取多少人?6,9,10.考法3系统抽样的特点及抽样方法考向1系统抽样的概念的理解1.将总体中的个体进行编号,根据样本数平均分组,在第一组中,按照随机抽样抽取一个样本,然后按相同的间隔(称为抽样距)抽取其他样本,这样的抽样法称为系统抽样法,有时也叫等距抽样或机械抽样.考向2 Nn为整数的系统抽样1.某班共有学生52人,学号分别为1,2,…,51,52,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号的同学在样本中,那么样本中还有一个同学的学号是 BA.10B.16C.32D.532.(2013·陕西卷·理科)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为 BA.11 B.12 C.13 D.14 3.(2019·全国卷Ⅰ·文科)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是 CA.8号学生 B.200号学生 C.616号学生 D.815号学生考向3Nn不是整数的系统抽样1.从总体容量为503的总体中,用系统抽样方法抽取容量为50的样本,首先要剔除的个数是 ,抽样距k 是 . 3,10考法4等可能性1.(2014·湖南卷)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为1p ,2p ,3p ,则 DA.123p p p =<B.231p p p =<C.132p p p =<D.123p p p ==A .11B .12C .13D .14考点3统计图表(统计图的识别与分析)考法1.扇形统计图1.(2015·陕西卷·文理科)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数 BA .167B .137C .123D .932.根据题目中所给的条件回答下列问题. (1)该班的学生共多少名? 45 (2)全班一共捐了多少册书? 405 (3)若该班所捐图书按图12-7所示的比例分,则送给山区学校的书比送给本市兄弟学校的书多多少册?1623.(2018·全国卷Ⅰ·文理科)增加了一倍,实现翻番,为更好地了解高该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:4% 6%30% 60% 养殖收入 其他收入 第三产业收入 种植收入 建设前经济收入构成比例 5% 28% 30% 37% 养殖收入 其他收入 第三产业收入 种植收入 建设后经济收入构成比例(初中部) (高中部)则下面结论中不正确的是 AA.新农村建成后,种植收入减少B.新农村建成后,其他收入增加一倍以上C.新农村建成后,养植收入增加一倍D.新农村建成后,养植收入与第三产业收入的总和超过了经济收入的一半 考法2条形统计图1.(2002·全国卷·文科)据新华社2002年3月12日电,1985年到2000年间.我国农村人均居住面积如图所示,其中,从 年到 年的五年间增长最快.考法3折线统计图1.如图是某地5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是 .考法4茎叶图1.(2009·福建卷·理科)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算的平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算正确,则数字x 应该是 . 1x =2.(2012·陕西卷·文科)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则 B A.x x <甲乙,m 甲>m 乙 B.x x <甲乙,m 甲<m 乙0 1 2 6 5 4 3温度(0c ) 12 13 14 15 16 17 24 25 26 27 14.7 17.8 21.0 24.8 1985年 1990年 1995年 2000年 面积/m 2 作品A 8 8 9 9 9 2 3 x 2 1 4C.x x >甲乙,m 甲>m 乙D.x x >甲乙,m 甲<m 乙考点4数据的数字特征考法1平均数1.(2018·江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .902.(2015·广东卷·文科)已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5S =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 . 11考法2中位数1.(2019·全国卷·理科)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 AA .中位数B .平均数C .方差D .极差2.(2017·山东卷·文科)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为 AA.3,5B.5,5C.3,7D.5,7考法3方差 是样本数据到平均数的平均距离,一般用2s 表示,通常用公式2222121()()()n s x x x x x x n ⎡⎤=-+-++-⎣⎦来计算.反映了数据的离散程度.方差越大,数据的离散程度越大,方差越小数据的离散程度越小.考法6标准差8 6 5 0 8 8 4 0 0 7 5 2 8 0 0 3 1 1 2 3 4 0 2 8 0 2 3 3 71 2 4 4 8 2 3 8 甲 乙 8 9 9 9 0 1 1甲组 乙组 5 6 7 6 2 5 x 59 1 7 y 8标准差等于方差的正的平方根,即(n s x x =++- 与方差的作用相同,描述一组数据围绕平均数的波动程度的大小,但统计量的单位与观察值的单位一致.1.(2019·江苏卷)已知一组数据6,7,8,9,10,则该组数据的方差是 .2 2.(2009·重庆卷·文科)从一堆苹果中任取5只,称得它们的质量如下(单位:克):125,124,121,123,127,则该样本标准差s = .(克)(用数字作答) 24.(2010·山东卷·文科)在某项体育比赛中一位同学被评委所打出的分数如下:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均分值为和方差分别为 BA.92,2B.92,2.8C.93,2D.93,2.85.(2013·辽宁卷·理科)为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 . 106.(2010·陕西卷·文科)如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A x 和B x ,样本标准差分别为A S 和B S ,则 BA.A x >B x ,A S >B SB.A x <B x ,A S >B SC.A x >B x ,A S <B SD.A x <B x ,A S <B S 7.(2014·陕西卷·理科)设样本数据1x ,2x ,,10x 的均值和方差分别为1和4,若i i y x a =+(a 为非零常数,1i =,2,,10)则1y ,2y ,,10y 的均值和方差分别为 AA.1a +,4B.1a +,4a +C.1,4D.1,4a +8.(2012·山东卷·文科)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是 DA.众数B.平均数C.中位数D.标准差。

2020_2021学年高中数学第3章统计案例课件新人教A版选修2_3202103171114

2020_2021学年高中数学第3章统计案例课件新人教A版选修2_3202103171114
பைடு நூலகம்
统计案例的学习中,通过案例的分析去认识统计方法的 特点(如统计推断可能犯错误,估计结果的随机性),体会统计 方法应用的广泛性.对于统计案例内容,重点了解回归分析和 独立性检验的基本思想及其初步应用,避免单纯记忆和机械套 用公式进行计算.
本章初步介绍回归分析的基本思想及应用;对独立性检 验进行初步了解和认识,懂得如何利用随机变量K2去判断两个 分类变量有没有关系.在必修课程学习统计的基础上,通过对 典型案例的讨论,了解和使用一些常见的统计方法,进一步体 会运用统计方法解决实际问题的基本思想,认识统计方法在决 策中的作用.
您好,谢谢观看!

统计与统计案例

统计与统计案例

统计与统计案例第一部分:统计的基本概念和原理统计是一门研究收集、整理、分析和解释数据的学科。

它在各个领域都有广泛的应用,包括科学研究、社会调查、市场分析等等。

统计的基本概念和原理对于理解和应用统计方法非常重要。

1.1 统计的定义统计是通过收集、整理、分析和解释数据来推断总体特征和规律的学科。

它可以帮助我们认识事物的本质和变化规律,从而进行决策和预测。

1.2 数据的类型在统计学中,数据可以分为两大类:定性数据和定量数据。

定性数据是描述事物性质、特征和类别的数据,例如性别、政治取向、产品类型等等。

定性数据常用于描述和推断总体的特征和规律。

定量数据是具有数量意义的数据,可以进行数值计算和比较。

例如身高、体重、销售额等等。

定量数据常用于测量和比较事物的数量差异和变化趋势。

1.3 统计的基本原理统计的基本原理包括随机性、规模效应和抽样误差。

•随机性指的是在统计过程中,数据的选择和变异都是有机会发生的。

通过随机抽取和处理数据,可以将个体特征和规律推广到总体上。

•规模效应指的是样本容量对统计推断的影响。

样本容量越大,假设检验的准确性也越高,结果的可靠性也就越高。

•抽样误差是由于从总体中选取有限的样本而引入的估计误差。

通过使用合适的抽样方法和增加样本容量,可以减小抽样误差。

第二部分:统计案例分析2.1 假设检验假设检验是统计推断的一种方法,用于检验关于总体参数的假设。

主要包括以下几个步骤:1.建立原假设(H0)和备择假设(H1);2.选择适当的统计检验方法;3.根据样本数据计算统计量的值;4.根据显著性水平和自由度确定拒绝域;5.比较统计量的值与拒绝域,得出结论。

假设检验的目的是通过样本数据对总体参数进行推断,判断某种差异是否具有统计学意义。

2.2 方差分析方差分析是一种用于比较多个总体均值差异的统计方法。

它主要包括单因素方差分析和多因素方差分析两种类型。

单因素方差分析用于比较一个因素(如不同治疗方法)对一个响应变量(如疾病治愈率)的影响。

2020版高考数学二轮复习第2部分专题3概率与统计第1讲概率、随机变量及其分布教案理(最新整理)

2020版高考数学二轮复习第2部分专题3概率与统计第1讲概率、随机变量及其分布教案理(最新整理)

第1讲概率、随机变量及其分布[做小题——激活思维]1.若随机变量X的分布列如表所示,E(X)=1。

6,则a-b=( )X0123P0。

1a b0。

1A.0.2C.0。

8 D.-0。

8B[由0。

1+a+b+0.1=1,得a+b=0。

8,又由E(X)=0×0.1+1×a+2×b+3×0。

1=1。

6,得a+2b=1.3,解得a=0。

3,b=0.5,则a-b=-0。

2.]2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0。

5,两个路口连续遇到红灯的概率为0。

4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )A.0。

6 B.0.7C.0.8 D.0。

9C[记“第一个路口遇到红灯"为事件A,“第二个路口遇到红灯”为事件B,则P(A)=0.5,P(AB)=0。

4,则P(B|A)=错误!=0.8,故选C。

]3.两个实习生每人加工一个零件,加工为一等品的概率分别为错误!和错误!,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A。

错误!B。

错误!C。

14D。

错误!B[设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=错误!,P(B)=错误!,所以这两个零件中恰有一个一等品的概率为P(A错误!)+P(错误!B)=P(A)P(错误!)+P(错误!)P(B)=错误!×错误!+错误!×错误!=错误!。

]4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=错误!,则P(Y≥1)=( )A.错误!B。

错误!C。

错误!D.1C[∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C错误!(1-p)2=错误!,解得p=错误!,∴P(Y≥1)=1-P(Y=0)=1-C0,4(1-p)4=1-错误!=错误!,故选C.]5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.错误![因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为错误!,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B错误!,∴D(X)=4×错误!×错误!=错误!.]6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0。

第二节 变量间的相关关系与统计案例【高考文数专题复习——统计与统计案例】

第二节  变量间的相关关系与统计案例【高考文数专题复习——统计与统计案例】

年龄(x)
23 4
5
6
患病人数(y) 22 22 17 14 10
(1)求 y 关于 x 的线性回归方程; (2)计算变量 x,y 的相关系数 r(计算结果精确到 0.01),并回答是否可以认 为该幼儿园去年春季患流感人数与年龄负相关很强.(若|r|∈[0.75,1],则 x,y 相关性很强;若|r|∈[0.3,0.75),则 x,y 相关性一般;若|r|∈[0,0.3),则 x,y 相关性较弱)
发芽率 y 和温度 x 的回归方程类型的是
()
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+bln x
解析:用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应 该是对数函数类型的,故应该选用的函数模型为 y=a+bln x. 答案:D
5.给出下列关系: ①正方形的边长与面积之间的关系; ②某化妆品的销售量与广告宣传费之间的关系; ③人的身高与视力之间的关系; ④雾天的能见度与交通事故的发生率之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________.
n
xi- x 2
i=1
i=1
^a= y -^b x .
n
(3)通过求Q= yi-bxi-a2的最小值而得到回归直线的方法,即使得样本数据 i=1 的点到回归直线的距离的平方和最小,这一方法叫做 最小二乘法 .
(4)相关系数:r=
n
xi- x yi- y
i=1
.
n
n
xi- x 2 yi- y 2
请思考 y 与 x 是否具有线性相关关系?
10
解:因为 x =159.8, y =172,x2i =265 448,

统计与统计案例PPT课件

统计与统计案例PPT课件
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体 (文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
专题七 第一讲
走向高考 ·二轮专题复习 ·新课工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
[答案] 20
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总计
30
70
100

返 首 页
·
9
·
自 主 练

附表:

整 合
P(K2≥k0)
0.10
0.05
0.025


k0
2.706
3.841
5.024
限 时
研 考
参照附表,在犯错误的概率不超过________的前提下,认为“小
集 训
题 动物是否被感染与服用疫苗有关”.




返 首 页
·
10
·



0.05 [由题意算得,
返 首

13
·




3.统计案例

整 合
(1)线性回归方程问题的两个要点:样本点的中心在回归直线上; 专

由线性回归方程求出的数值是估计值.如 T4.
限 时
研 考
(2)独立性检验的关键在于准确求出 K2 值,然后对比临界值表中
集 训

举 的数据,最后下结论.如 T5.



返 首 页
·
14
·


研 考 题 练
考 点






研 考
举题固法
集 训

举 题 固 法
返 首 页
·
15
·
自 主 练



抽样方法(5 年 2 考)








[高考解读] 全国卷对抽样方法的要求较低,很少单独命题考查. 训

举 题 固 法
返 首 页
·
16
·

1.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其

整 合
频数

=频率,此关系式的变形为频率=样本容量,样本容量×频率=频数.
题 限


(2)总体估计的方法:用样本的数字特征估计总体的数字特征. 集



(3)图表判断法:若根据统计图表比较样本数据的大小,可根据数
·

题 据的分布情况直观分析,大致判断平均数的范围,并利用数据的波动


性大小比较方差(标准差)的大小.如 T3.
主 练
服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调
考 点
查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则

合 最合适的抽样方法是________.
专 题
切入点:不同年龄段客户对其服务的评价有较大差异.
限 时

关键点:正确掌握三种抽样方法的特点及适用条件.



题 分层抽样 [因为不同年龄段的客户对公司的服务评价有较大差

点 整 合
K2=100×50×105×0×303-0×207×0 402≈4.762>3.841,
专 题

参照附表,可得:




在犯错误的概率不超过 0.05 的前提下,认为“小动物是否被感 训

举 题
染与服用疫苗有关”.]


返 首 页
·
11
·




[扣要点——查缺补漏]

整 合
1.随机抽样


简单随机抽样的特点是逐个抽取,适用于总体个数较少的情况; 限 时
研 考
系统抽样也称等距抽样,适用总体个数较多的情况,如 T1;分层抽
集 训

举 样一定要注意按比例抽取,总体由差异明显的几部分组成,如 T2.

固Байду номын сангаас

返 首 页
·
12
2.统计图表和样本数字特征
·

主 练

频数 (1)由频率分布直方图进行相关计算时,需掌握关系式:样本容量


生中被抽到的是( )


A.8 号学生

B.200 号学生
时 集
考 题
C.616 号学生
D.815 号学生

·

故所求回归方程为^y=0.3x-0.4.]
返 首

8
·

5.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性

练 考
的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取 100 只小

整 鼠进行试验,得到如下列联表:



感染
未感染
总计



服用
10
40
50




未服用
20
30
50

题 固


10

个)与加工零件所花费时间 yi(单位:小时)的数据资料,算得∑xi=80, 限
i=1

研 10
10
10

考 题
∑yi=20,∑xiyi=184,∑x2i =720,那么加工零件所花费时间 y 对零
i=1
i=1
i=1


题 件个数 x 的线性回归方程为________.


返 首 页
·
7
·


抽样的方法抽到的号码为 18,在抽到的 40 人中,编号落入区间[1,200]
题 限

的人做试卷 A,编号落入区间[201,560]的人做试卷 B,其余的人做试
时 集
考 题
卷 C,则做试卷 C 的人数为(
)



A.10
B.12
C.18
D.28


[答案] B



·
4
·



2.某校有高级教师 26 人,中级教师 104 人,其他教师若干人,

题 异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公

法 司服务的客观评价.]



·
17
·
2.(2019·全国卷Ⅰ)某学校为了解 1 000 名新生的身体素质,将

主 练
这些学生编号为 1,2,…,1 000,从这些新生中用系统抽样方法等距

点 整
抽取 100 名学生进行体质测验.若 46 号学生被抽到,则下面 4 名学

点 整
现按分层抽样的方法从该校的所有教师中抽取 56 人进行某项调查,


已知从其他教师中共抽取了 16 人,则该校共有教师人数为 (

)限


A.81 B.152 C.182 D.202




[答案] C




返 首 页
·
5
·
自 主 练


3.为了参加端午节龙舟赛,某龙舟队进行了 6 次


合 测试,测得最大速度(单位:m/s)的茎叶图如图所示,则


6 次测试的最大速度的平均数为________m/s,方差为________. 时


考 题

[答案]
33
47 3




返 首 页
·
6
·

主 练
4.一个车间为了规定工时定额,需要确定加工零件所花费的时

点 整
间,为此进行了 10 次试验,收集数据,第 i 次试验零件个数 xi(单位:

^y=0.3x-0.4 [由题意知
主 练
考 点
n=10, x =1n∑ i=n1xi=1800=8, y =1ni∑=n1yi=1200=2,

n


又∑x2i -n x 2=720-10×82=80,

i=1

n


∑xiyi-n x y =184-10×8×2=24,

i=1
集 训

举 题
由此得b^=2840=0.3,a^= y -b^ x =2-0.3×8=-0.4,
第二部分 讲练篇
专题三 概率与统计 第2讲 统计与统计案例
2
·


自 主 练 练
考 点






研 考
考点整合
集 训

举 题 固 法
返 首 页
·
3
·

[做小题——激活思维]


1.采用系统抽样的方法从 800 人中抽取 40 人参加某种测试,为

点 整
此将 800 人随机编号为 1,2,…,800,分组后在第一组采用简单随机
相关文档
最新文档