2018年高考数学总复习统计与统计案例(K12教育文档)

合集下载

2018年高中数学一轮总复习 统计案例 课件(全国理数)

2018年高中数学一轮总复习 统计案例 课件(全国理数)
___i_=_1__________, ^a=_-_y_-__^_b_-x_.
n
(3)通过求Q= yi-bxi-a2的最小值而得到回归直线的方 i=1
法,即使得样本数据的点到回归直线的距离的平方和最小,这一 方法叫做最小二乘法.
(4)相关系数: 当 r>0 时,表明两个变量_正__相__关__;当 r<0 时,表明两个 变量_负__相__关__. r 的绝对值越接近于 1,表明两个变量的线性相关性_越__强_;r 的绝对值越接近于 0,表明两个变量之间_几__乎__不__存__在__线__性__相__关__关__ _系__.通常|r|大于_0_.7_5__时,认为两个变量有很强的线性相关性.
解析:由散点图可以看出两个变量所构成的点在一条直线 附近,所以线性相关关系较强,且应为正相关,所以回归 直线方程的斜率应为正数,且从散点图观察,回归直线方 程的斜率应该比 y=x 的斜率要小一些,综上可知应选 B. 答案:B
2018
第二节 统计案例
本节主要包括 2 个知识点: 1.回归分析; 2.独立性检验.
基础联通
突破点(一) 回归分析
抓主干知识的“源”与“流”
1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另 一类是相关关系;与函数关系不同,相关关系是一种_非__确__定__性__ 关系. (2)从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为_正__相__关__,点散布在左上角到右 下角的区域内,两个变量的相关关系为负__相__关__.
关系数的比较,正确的是
()
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3

2018届高考数学第一轮知识点梳理复习教案5(第十章统计与统计案例)

2018届高考数学第一轮知识点梳理复习教案5(第十章统计与统计案例)

第十章⎪⎪⎪统计与统计案例第一节 统 计突破点(一) 随机抽样1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.4.三种抽样方法的比较本节主要包括2个知识点: 1.随机抽样; 2.用样本估计总体.1.抽签法的步骤第一步,将总体中的N个个体编号;第二步,将这N个号码写在形状、大小相同的号签上;第三步,将号签放在同一不透明的箱中,并搅拌均匀;第四步,从箱中每次抽取1个号签,连续抽取k次;第五步,将总体中与抽取的号签的编号一致的k个个体取出.2.随机数法的步骤第一步,将个体编号;第二步,在随机数表中任选一个数开始;第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.[例1](1)以下抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08C.02 D.01[解析](1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.[答案](1)D(2)D系统抽样的步骤(1)先将总体的N个个体编号;(2)确定分段间隔k(k∈N*),对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn;(3)在第1段用简单随机抽样确定第1个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.[例2] (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14(2)中央电视台为了解观众对《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.[解析] (1)由系统抽样定义可知,所分组距为84042=20,每组抽取一人,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.(2)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10个个体.所以需剔除2个个体,抽样间隔为10.[答案] (1)B (2)2 10 [易错提醒]用系统抽样法抽取样本,当Nn 不为整数时,取k =⎣⎢⎡⎦⎥⎤N n ,即先从总体中用简单随机抽样的方法剔除(N -nk )个个体,且剔除多余的个体不影响抽样的公平性.分层抽样进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.[例3] (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A .90B .100C .180D .300(2)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n =( )A .54B .90C .45D .126(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.[解析](1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得x 900=3201 600,故x=180.(2)依题意得33+5+7×n=18,解得n=90,即样本容量为90.(3)由题意知1245+15=3045+15+30+10+a+20,解得a=30.[答案](1)C(2)B(3)30[方法技巧]分层抽样的解题策略(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.(4)抽样比=样本容量总体容量=各层样本数量各层个体数量.能力练通抓应用体验的“得”与“失”1.[考点一]某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法①1,2,3, (100)②001,002, (100)③00,01,02, (99)④01,02,03, (100)其中正确的序号是()A.②③④B.③④C.②③D.①②解析:选C根据随机数法编号可知,①④编号位数不统一.2.[考点三]为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C学校中应抽取的人数为()A.10 B.12C.18 D.24解析:选A根据分层抽样的特征,从C学校中应抽取的人数为90180+270+90×60=10.3.[考点二]某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是()A.10 B.11C.12 D.16解析:选D从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.4.[考点三]某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C 三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.解析:设A、B、C三所学校高三文科学生人数分别为x,y,z,由题知x,y,z 成等差数列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分层抽样方法抽取B校学生人数为1201 500×500=40.答案:405.[考点二]为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.解析:由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.答案:57突破点(二)用样本估计总体1.频率分布直方图和茎叶图(1)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.2.样本的数字特征(1)众数、中位数、平均数标准差、方差①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. ②方差:标准差的平方s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.(3)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x +a ,方差为m 2s 2.[例1](1)(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140(2)某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.[解析](1)由频率分布直方图知200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.(2)月工资收入落在(30,35](百元)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=1-0.85=0.15,所以(30,35](百元)月工资收入段应抽出100×0.15=15(人).[答案](1)D(2)15[方法技巧]1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率.2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.茎叶图1(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一; (2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据. 2.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.[例2] 某良种培育基地正在培育一小麦新品种A ,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下.品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论.[解](1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.[方法技巧]茎叶图问题的求解策略(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况.样本的数字特征1似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况.2.若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小.考法(一)与频率分布直方图交汇命题[例3](2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图.(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.[解](1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.054×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).[方法技巧]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二) 与茎叶图交汇命题[例4] (1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x ,y 的值分别为( )A.7,8 B .5,7 (2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:8 7 7 941x91则7个剩余分数的方差为________.[解析] (1)甲组数据的中位数为17, 故y =7,乙组数据的平均数为3×10+20+(9+6+6+x +9)5=17.4,解得x =7.(2)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.[答案] (1)D (2)367[易错提醒]在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.考法(三)与优化决策问题交汇[例5]甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.38.88.88.7方差s2 3.5 3.6 2.2 5.4() A.甲B.乙C.丙D.丁[解析]由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.[答案] C[方法技巧]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.能力练通抓应用体验的“得”与“失”1.[考点一]在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为()A .0.25B .0.5C .20D .16解析:选D 设中间一组的频数为x ,依题意有x 80=14⎝ ⎛⎭⎪⎫1-x 80,解得x =16.2.[考点二]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.131415⎪⎪⎪⎪0 0 3 4 5 6 6 8 8 8 91 1 12 2 23 34 45 5 56 67 80 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A .3B .4C .5D .6解析:选B 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在20÷5=4个小组中,每组取1人,共取4人.3.[考点一]某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于( )A .0.12B .0.012C .0.18D .0.018解析:选D 依题意,0.054×10+10×x +0.01×10+0.006×10×3=1,解得 x =0.018.4.[考点三·考法(二)]如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )7 9 84 4 6 479 3A.84,4.84 B.84,1.6 C.85,1.6 D.85,4解析:选C依题意,所剩数据的平均数是80+15×(4×3+6+7)=85,所剩数据的方差是15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.5.[考点三·考法(三)]甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有________.解析:x-甲=x-乙=9,s2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲6.[考点三·考法(一)](2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.7.[考点三·考法(二)]某车间20名工人年龄数据如下表:(1)求这20(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)由题可知,这20名工人年龄的众数是30,极差是40-19=21. (2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为x =120(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为s 2=120∑20 i =1 (x i -x )2=112+6×22+7×12+5×02+10220=25220=12.6.[全国卷5年真题集中演练——明规律] 1.(2016·全国丙卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A .各月的平均最低气温都在0 ℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20 ℃的月份有5个解析:选D 由图形可得各月的平均最低气温都在0 ℃以上,A 正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B 正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C 正确;故D 错误.2.(2013·新课标全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B 和D.故选C.3.(2014·新课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.4.(2014·新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.5.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.41.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?A药解:(1)设A药观测数据的平均数为x,B药观测数据的平均数为y-.由观测结果可得x-=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y-=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x->y-,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:3. 2从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.[课时达标检测] 重点保分课时——一练小题夯双基,二练题点过高考[练基础小题——强化运算能力]1.某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为①;从10名家长中随机抽取3名参加座谈会,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是() A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法解析:选B在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=()A.660 B.720 C.780 D.800解析:选B由已知条件,抽样比为13780=160,从而35600+780+n=160,解得n=720.3.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为() A.93 B.123 C.137 D.167解析:选C初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.4.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④解析:选B∵x甲=26+28+29+31+315=29,。

【配套K12】[学习]2018版高中数学 第三章 统计案例疑难规律方法学案 苏教版选修2-3

【配套K12】[学习]2018版高中数学 第三章 统计案例疑难规律方法学案 苏教版选修2-3

第三章 统计案例1 本章知识大串烧一、独立性检验的基本思想通过分析数据与图形,得出的估计是粗略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.下面从理论上说明两个变量是否有关,请同学们从中体会其思想方法. 1.基本思想与图形的联系假设两个变量是无关的,可知如下的比应差不多,即:aa +b ≈cc +d⇒|ad -bc |=0.构造统计量χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d )(此公式如何记忆,其特点是什么?结合2×2列联表理解),显然所构造的统计量与|ad -bc |的大小具有一致性. 2.独立性检验的思想方法如果χ2的值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两个变量是有关系的(称小概率事件发生);如果χ2的值较小,此时接受假设,说明两分类变量是无关系的.其思想方法类似于数学上的反证法.3.得到χ2的值常与以下几个临界值加以比较:如果χ2>2.706,就有90%的把握认为Ⅰ和Ⅱ有关系;如果χ2>3.841,就有95%的把握认为Ⅰ和Ⅱ有关系;如果χ2>6.635,就有99%的把握认为Ⅰ和Ⅱ有关系;如果χ2>10.828,就有99.9%的把握认为Ⅰ和Ⅱ有关系;如果χ2≤2.706,就认为没有充分的证据显示Ⅰ和Ⅱ有关系. 像这种利用统计量χ2来确定在多大程度上可以认为“两个变量有关系”的方法称为两个变量的独立性检验. 二、回归分析1.线性回归方程y ^=b ^x +a ^,其中:b ^=∑ni =1(x i -x )(y i -y )∑ni =1 (x i -x )2=∑ni =1x i y i -n x y ∑n i =1x 2i -n (x )2,a ^ =y -b ^x . (注:b ^=∑ni =1x i y i -n x y∑n i =1x 2i -n (x )2主要方便计算,其中(x i ,y i )为样本数据,(x ,y )为样本点的中心)公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势. 2.样本相关系数的具体计算公式r =∑n i =1 (x i -x )(y i -y )∑ni =1(x i -x )2∑ni =1(y i -y )2=∑n i =1x i y i -n x y(∑ni =1x 2i -n (x )2)(∑n i =1y 2i -n (y )2) 公式作用:反映两个变量之间线性相关关系的强弱.当r 的绝对值接近1时,表明两个变量的线性相关性越强;当r 的绝对值接近0时,表明两个变量之间几乎不存在线性相关关系.规定当|r |>r 0.05时,认为两个变量有很强的线性相关关系.公式联系:(1)由于分子与回归方程中的斜率b ^的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r >0时,两个变量正相关;当r <0时,两个变量负相关. (2)常配合散点图判断两个随机变量是否线性相关.散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况.相关系数r 是从数上反映了两个变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据点的分布情况,准确可靠.2 回归分析题目击破1.基本概念函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.例1 下列变量之间的关系是相关关系的是________.(填序号) ①正方形的边长与面积之间的关系; ②水稻产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故发生率之间的关系.分析 两变量之间的关系有两种:函数关系和带有随机性的相关关系. 解析 ①是函数关系;②不是严格的函数关系,但是具有相关性,因而是相关关系;③既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;④降雪量与交通事故发生率之间具有相关关系. 答案 ②④点评 该例主要考查对变量相关关系概念的掌握. 2.线性回归方程设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在一条直线的附近,这条直线就叫做线性回归直线.例2 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系,试求:(1)线性回归方程y ^=a ^+b ^x ;(2)估计使用年限10年时,维修费用是多少?分析 因为y 对x 呈线性相关关系,所以可以用线性相关的方法解决问题. 解 (1)制表于是有b ^=112.3-5×4×590-5×42=1.23, a ^=y -b ^x =5-1.23×4=0.08.∴线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用约是12.38万元.点评 已知y 对x 呈线性相关关系,无需进行相关性检验,否则,应首先进行相关性检验.3.非线性回归问题分析非线性回归问题的具体做法(1)若问题中已给出经验公式,这时可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决. 下面举例说明非线性回归分析问题的解法.例3 某地区对本地的企业进行了一次抽样调查,表中是这次抽查中所得到的各企业的人均资本x (单位:万元)与人均产值y (单位:万元)的数据:(1)设y 与x 之间具有近似关系y ≈ax b(a ,b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产值(精确到0.01).解 (1)在y ≈ax b的两边取常用对数,可得lg y ≈lg a +b lg x ,设lg y =z ,lg a =A ,lg x =X ,则z ≈A +bX . 相关数据计算如下表所示.由公式(1)可得⎩⎪⎨⎪⎧A ^=-0.215 5,b ^=1.567 7,由lg a ^=-0.215 5,得a ^≈0.608 8, 即a ,b 的估计值分别为0.608 8和1.567 7.(2)由(1)知y ^=0.608 8x1.567 7.样本数据及回归曲线的图形如图所示.当x =16时,y ^=0.608 8×161.567 7≈47.01(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.3 独立性检验思想的应用在日常生活中,经常会面临一些需要推断的问题.在对这些问题作出推断时,我们不能仅凭主观臆断作出结论,需要通过试验来收集数据,并依据独立性检验思想做出合理的推断. 所谓独立性检验,就是根据采集样本的数据,利用公式计算χ2的值,比较与临界值的大小关系来判定事件X 与Y 是否有关的问题.其基本步骤如下: (1)考察需抽样调查的背景问题,确定所涉及的变量; (2)根据样本数据制作列联表;(3)计算统计量χ2,并查表分析.当χ2很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系.下面举例说明独立性检验思想在解决实际问题中的应用.例1 水果富含各种维生素,不但有益于人体健康,还可起到养颜护肤的功效.下表是一次调查所得的数据,试问:适量吃水果与皮肤好有关系吗?有多大的把握认为你的结论成立?解 假设“适量吃水果与皮肤好没有关系”,由题意可知,a =30,b =224,c =24,d =1 355,a +b =254,c +d =1 379,a +c =54,b +d =1 579,n =1 633,代入得到χ2=1 633×(30×1 355-224×24)2254×1 379×54×1 579≈68.033>10.828.∴我们有99.9%的把握认为吃水果与皮肤好有关系.点评该例中我们有较大的把握认为结论成立,但我们所说的“吃水果与皮肤好有关系”指的都是统计上的关系,不要误认为里面存在因果关系,具体到某一个适量吃水果的人,并不能说明他一定有好的皮肤.例2 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?分析首先由已知条件确定a、b、c、d、n的数值,再利用公式求出χ2的值,最后根据χ2的值分析结果.解由题目中表的数据可知,χ2=n(ad-bc)2(a+c)(a+b)(c+d)(b+d)=189×(54×63-40×32)294×95×86×103≈10.759.因为10.759>7.879,所以有99.5%的把握说员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.点评在列联表中注意事件的对应及有关值的确定,避免混乱;把计算出的χ2的值与临界值作比较,确定出“Ⅰ与Ⅱ有关系”的把握程度.例3 为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,统计结果为:患慢性气管炎共有56人,患慢性气管炎且吸烟的有43人,未患慢性气管炎但吸烟的有162人.根据调查统计结果,分析患慢性气管炎与吸烟在多大程度上有关系?解根据所给样本数据得到如下2×2列联表:由列联表可以粗略估计出:在吸烟者中,有20.98%的患慢性气管炎;在不吸烟者中,有9.70%的患慢性气管炎.两个比例的值相差较大,所以结论“患慢性气管炎与吸烟有关”成立的可能性较大.根据列联表中的数据,得到χ2=339×(43×121-13×162)256×283×205×134≈7.469>6.635.所以有99%的把握认为“患慢性气管炎与吸烟有关”.点评 对列联表的比例进行分析,可粗略地判断两个分类变量是否有关系.通过计算统计量χ2,可以比较精确地给出这种判断的可靠程度.先收集数据,然后通过一些统计方法对数据进行科学的分析,这是我们用统计方法解决实际问题的基本策略.4 巧解非线性回归问题如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想. 1.案例分析例 一个昆虫的某项指标和温度有关,现收集了7组数据如下表:试建立某项指标y 关于温度x 的回归模型,并判断你所建立的回归模型的拟合效果. 分析 根据表中的数据画出散点图,再由图设出相应的回归模型.解 画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线y =Bx 2+A 的周围.令X =x 2,则变换后的样本点应该分布在y =bX +a (b =B ,a =A )的周围. 由已知数据可得变换后的样本数据表:计算得到线性回归方程为y ^=0.199 94X +4.999 03.用x 2替换X ,得某项指标y 关于温度x 的回归方程y ^=0.199 94x 2+4.999 03. 计算得r ≈0.999 999,几乎为1,说明回归模型的拟合效果非常好.点评 本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图象相对照,选择一种跟这些样本点拟合的最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决. 2.知识拓展常见的非线性函数转换方法:(1)幂型函数y =ax m(a 为正数,x ,y 取正值)解决方案:对y =ax m 两边取常用对数,有lg y =lg a +m lg x ,令u =lg y ,v =lg x ,则原式可变为u =mv +lg a ,其中m ,lg a 为常数,该式表示u ,v 的线性函数. (2)指数型函数y =ca x (a ,c >0,且a ≠1)解决方案:对y =ca x 两边取常用对数,则有lg y =lg c +x lg a ,令u =lg y ,则原式可变为u =x lg a +lg c ,其中lg a 和lg c 为常数,该式表示u ,x 的线性函数.与幂函数不同的是x 保持不变,用y 的对数lg y 代替了y .(3)反比例函数y =k x(k >0)解决方案:令u =1x,则y =ku ,该式表示y ,u 的线性函数.(4)二次函数y =ax 2+c解决方案:令u =x 2,则原函数可变为y =au +c ,该式表示y ,u 的线性函数. (5)对数型函数y =c log a x解决方案:令x =a u ,则原函数可变为y =cu ,该式表示y ,u 的线性函数.。

2018大二轮高考总复习理数课件:自检15 统计与统计案例

2018大二轮高考总复习理数课件:自检15 统计与统计案例

若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则
其中成绩在区间[139,151]上的运动员人数是( B )
A.3
B.4
C.5
D.6
解析:35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数 据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.
2.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样 的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的 老年教师人数为( C )
A.90 C.180
类别 老年教师 中年教师 青年教师
合计
人数 900 1 800 1 600 4 300 B.100 D.300
B组 高考对接限时训练(十五)




解析:设该样本中的老年教师人数为 x,由题意及分层抽样的特点得90x0=1362000, 故 x=180.
3.(2015·湖南高考)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎 叶图如图所示.
13 0 0 3 4 5 6 6 8 8 8 9 14 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0 1 2 2 3 3 3
( A) A.3,5 C.3,7
B.5,5 D.5,7
甲组
乙组
659 25 6 17y x4 7 8
解析:甲组数据的中位数为 65,由甲、乙两组数据的中位数相等得 y=5.又甲、乙 两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78), ∴x=3.故选 A.
2.(2016·全国丙卷)某旅游城市为 向游客介绍本地的气温情况,绘制了一 年中各月平均最高气温和平均最低气 温的雷达图.图中 A 点表示十月的平均 最高气温约为 15 ℃,B 点表示四月的平 均最低气温约为 5 ℃.下面叙述不正确 的是( D )

【小初高学习】课标通用2018年高考数学一轮复习第十章统计与统计案例10.3变量间的相关关系统计案例

【小初高学习】课标通用2018年高考数学一轮复习第十章统计与统计案例10.3变量间的相关关系统计案例

§10.3 变量间的相关关系、统计案例考纲展示►1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.考点1 变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是________;与函数关系不同,________是一种非确定性关系.答案:相关关系 相关关系2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点散布在左上角到右下角的区域内,两个变量的相关关系为________.答案:正相关 负相关对回归系数的理解:解释变量;预报变量.某工厂工人月工资y (元)依劳动产值x (万元)变化的回归直线方程为y ^=900x +600,下列判断正确的是__________.①劳动产值为10 000元时,工资为500元; ②劳动产值提高10 000元时,工资提高1 500元; ③劳动产值提高10 000元时,工资提高900元; ④劳动产值为10 000元时,工资为900元. 答案:③解析:回归系数b ^的意义为:解释变量每增加1个单位,预报变量平均增加b 个单位.[典题1] (1)下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( )A BC D[答案] D[解析] 观察散点图可知,只有D 选项的散点图表示的是变量x 与y 之间具有负的线性相关关系.(2)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ [答案] D[解析] 由回归方程y ^=b ^x +a ^知,当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.[点石成金] 相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性.考点2 线性回归分析1.回归分析对具有________的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求________;(ⅲ)用回归直线方程作预报.答案:相关关系 回归直线方程 2.回归直线如果散点图中点的分布从整体上看大致在________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.答案:一条直线3.回归直线方程的求法——最小二乘法设具有线性相关关系的两个变量x ,y 的一组观察值为(x i ,y i )(i =1,2,…,n ),则回归直线方程y ^=b ^x +a ^的系数为:⎩⎪⎨⎪⎧b ^=∑i =1nx i-x y i-y ∑i =1nx i-x2= ,a ^=y -b ^x ,其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的________.答案:∑i =1nx i y i -n x y∑i =1nx 2i -n x 2中心4.相关系数当r >0时,表明两个变量________; 当r <0时,表明两个变量________.r 的绝对值越接近于1,表明两个变量的线性相关性________.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.答案:正相关 负相关 越强[教材习题改编]已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为__________.答案:y ^=1.23x +0.08解析:设回归直线方程为y ^=1.23x +a ^, 因为回归直线必过样本点的中心(x ,y ), 将点(4,5)代入回归直线方程得a ^=0.08, 所以所求方程为y ^=1.23x +0.08.变量的相关关系:散点图;回归直线过(x ,y ).某工厂经过技术改造后,生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据.0.7,那么当产量x =10吨时,估计相应的生产能耗为__________吨标准煤.答案:7.35解析:先求得x =4.5,y =3.5,由y ^=0.7x +a ^过点(x ,y ),得a ^=0.35, 所以回归直线方程是y ^=0.7x +0.35.当x =10吨时,y ^=7+0.35=7.35(吨标准煤).[典题2] (1)已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )A.3.25 C .2.2D .0[答案] B[解析] 由已知得x =2,y =4.5, 因为回归方程经过点(x ,y ), 所以a ^=4.5-0.95×2=2.6.(2)由某种设备的使用年限x i (年)与所支出的维修费y i (万元)的数据资料算得如下结果,∑i =15x 2i =90,∑i =15x i y i =112,∑i =15x i =20,∑i =15y i =25.①求所支出的维修费y 对使用年限x 的线性回归方程y ^=b ^x +a ^; ②(ⅰ)判断变量x 与y 之间是正相关还是负相关; (ⅱ)当使用年限为8年时,试估计支出的维修费是多少.附:在线性回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x ,其中x ,y 为样本平均值.[解] ①∵∑i =15x i =20,∑i =15y i =25,∴x =15∑i =15x i =4,y =15∑i =15y i =5,∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=112-5×4×590-5×42=1.2, a ^=y -b ^x =5-1.2×4=0.2.∴线性回归方程为y ^=1.2x +0.2. ②(ⅰ)由①知,b ^=1.2>0, ∴变量x 与y 之间是正相关.(ⅱ)由①知,当x =8时,y ^=9.8,即使用年限为8年时,支出维修费约是9.8万元. [点石成金] 1.正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键.2.回归直线方程y ^=b ^x +a ^必过样本点的中心(x ,y ).3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求出的回归直线方程预测该地2016年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x =0,y =3.2,b ^=--+--+2×19+4×29-5×0×3.2-2+-2+22+42-5×02=26040=6.5,a ^=y -b ^x =3.2. 由上述计算结果知,所求回归直线方程为 y ^-257=b ^(x -2 010)+a ^=6.5(x -2 010)+3.2, 即y ^=6.5×(x -2 010)+260.2.(2)利用(1)中所求回归直线方程,可预测2016年的粮食需求量为6.5×(2 016-2 010)+260.2=6.5×6+260.2=299.2(万吨).考点3 独立性检验1.分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表:K2=(其中n=________为样本容量),则利用独立性a +b a+c b+d c+d检验判断表来判断“X与Y的关系”.答案:a+b+c+d(1)[教材习题改编]为调查中学生的近视情况,测得某校150名男生中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,最有说服力的方法是________.(填序号)①回归分析;②期望与方差;③独立性检验;④概率.答案:③解析:“近视”与“性别”是两个分类变量,其是否有关,应该用独立性检验来判断.(2)[教材习题改编]在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得出“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,有下列四种说法:①100个吸烟者中至少有99人患有肺癌;②1个人吸烟,那么这人有99%的概率患有肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.其中正确说法的序号是________.答案:④对独立性检验的理解:K2的计算;对P(K2≥k0)的解释.[2017·湖南张家界模拟]某高校教“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:k=-223×27×20×30≈4.844.因为k>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.附表:解析:∵k>3.841,查临界值表,得P(K2≥3.841)=0.05,故这种判断出错的可能性为5%.[典题3] (1)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知PP(K2≥5.024)≈0.025.根据表中数据,得到K2=-223×27×20×30≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.[答案]5%[解析]由K2≈4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为5%.(2)[2017·江西九江模拟]某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到如下所示的频数分布表.数学成绩与性别是否有关;②规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.K2=.a +b c+d a+c b+d[解]①x男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,x女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.②由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:≈1.79,可得K2=60×40×30×70因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.[点石成金] 1.独立性检验的关键是正确列出2×2列联表,并计算出K2的值.2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.[2017·广西玉林、贵港联考]某市地铁即将于2015年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下;“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填写下面的2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=a +bc +d a +c b +d. 解:x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=10×40×18×32≈6.27<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.[方法技巧] 1.求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ^,常数项为a ^,这与一次函数的习惯表示不同.)2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.[易错防范] 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量K 2的观测值k 的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.真题演练集训1.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 答案:B解析:由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴ a ^=8-0.76×10=0.4,∴ 当x =15时,y ^=0.76×15+0.4=11.8(万元).2.[2016·新课标全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=b ^t +a ^中斜率和截距的最小二乘估计公式分别为b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解:(1)由折线图中数据和附注中参考数据,得t =4,∑i =17 (t i -t )2=28,∑i =17y i -y2=0.55,∑i =17 (t i -t)(y i -y )=∑i =17t i y i -t∑i =17y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1),得b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程,得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.3.[2015·新课标全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18x i .(1)根据散点图判断,y =a +bx 与y=c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+β u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -uv i -v∑i =1nu i -u2,α^=v -β^u .解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.4.[2014·新课标全国卷Ⅱ]某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解:(1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t)(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17t i -ty i -y∑i =17t i -t2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3.所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得 y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.课外拓展阅读 统计案例问题的规范答题[典例] [2013·福建卷]某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K 2=a +bc +d a +cb +d.[审题视角] 由频率分布直方图列举基本事件,结合古典概型,求概率.利用独立性检验公式计算K 2.[解] (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.05=2(人),记为B 1,B 2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以K 2=a +bc +d a +cb +d=-260×40×30×70=2514≈1.79. 因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”. [答题模板] 第1步:由分层抽样计算两组工人的数目; 第2步:由频率分布直方图计算两组不足60件的人数; 第3步:列举5人抽取2人的基本事件数; 第4步,由古典概型计算概率;第5步:统计生产能手与非生产能手,列2×2列联表; 第6步:由公式计算K 2,确定答案. 归纳总结(1)分层抽样比为100500=15,故25周岁以上有300×15=60(人),25周岁以下的200×15=40(人),然后再根据频率计算“不足60件”的人数,并设定符号.(2)列2×2列联表时,其中的数字应先由频率分布直方图算出后再列表.。

2018年高考数学文一轮复习文档:第十章 统计、统计案

2018年高考数学文一轮复习文档:第十章 统计、统计案

第1讲 随机抽样, )1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.(2)常用方法:抽签法和随机数法. 2.系统抽样(1)步骤:①先将总体的N 个个体编号;②根据样本容量n ,当Nn 是整数时,取分段间隔k =N n; ③在第1段用简单随机抽样确定第一个个体编号l (l ≤k ); ④按照一定的规则抽取样本.(2)适用范围:适用于总体中的个体数较多时. 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)适用范围:适用于总体由差异比较明显的几个部分组成时.1.辨明两个易误点(1)简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.(2)分层抽样中,易忽视每层抽取的个体的比例是相同的,即样本容量n总体个数N .2.三种抽样方法的比较1.教材习题改编 为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,这200名学生成绩的全体是( )A .总体B .个体C .从总体中抽取的一个样本D .样本的容量 C 根据随机抽样的概念可知选C.2.某学校有男、女学生各1 000名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取200名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法D 由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,因此易采用分层抽样法.3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20C 根据系统抽样的特点可知分段间隔为1 00040=25,故选C.4.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3D 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 5.教材习题改编 一支田径队有男运动员56人,女运动员若干人,用分层抽样的方法抽取容量为28的运动员时,抽取的男运动员是16人,则女运动员的人数是________.由题意得1656=28-16n ,解得n =42.42简单随机抽样(1)以下抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 B.07C.02 D.01【解析】(1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.【答案】(1)D (2)D抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.下列抽取样本的方式不属于简单随机抽样的有________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.①不是简单随机抽样.②不是简单随机抽样.因为它是有放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.①②③④系统抽样(1)某单位有840名职工,现采用系统抽样的方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间的人数为( )A .11B .12C .13D .14(2)(2017·豫晋冀高三模拟)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到编号之和为48,则抽到的最小编号为( )A .2B .3C .4D .5【解析】 (1)抽样间隔为84042=20.设在1,2,…,20中抽取号码x 0(x 0∈),在之间抽取的号码记为20k +x 0,则481≤20k +x 0≤720,k ∈N *.所以24120≤k +x 020≤36.因为x 020∈⎣⎢⎡⎦⎥⎤120,1, 所以k =24,25,26, (35)所以k 值共有35-24+1=12(个),即所求人数为12.(2)系统抽样的间隔为244=6,设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )=48,解得x =3.【答案】 (1)B (2)B系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =N n.用系统抽样法抽取样本,当Nn不为整数时,取k =⎣⎢⎡⎦⎥⎤N n ,即先从总体中用简单随机抽样的方法剔除(N -nk )个个体,且剔除多余的个体不影响抽样的公平性.1.中央电视台为了解观众对《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在这进行分组时,需剔除________个个体,抽样间隔为________.把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样的步骤如下:第一步,先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;第二步,将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10(个)个体.2 102.网络上流行一种“开心消消乐游戏” ,为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.由最小的两个编号为03,09可知,抽取人数的比例为16,即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.57分层抽样(高频考点)分层抽样是抽样方法考查的重点,也是高考命题的热点,多以选择题或填空题的形式出现,多为容易题或中档题.高考对分层抽样的考查主要有以下三个命题角度: (1)已知各层总数,确定抽样比;(2)已知各层总数,某一层的样本数,求另一层样本数或总数; (3)已知某层总数及某层的样本数,求各层样本数.(1)(2015·高考北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 B.100C.180 D.300(2)(2017·贵州省七校联考)某高中共有学生1 000名,其中高一年级共有学生380人,高二年级男生有180人.如果在全校学生中抽取1名学生,抽到高二年级女生的概率为0.19,现采用分层抽样(按年级分层)在全校抽取100人,则应在高三年级中抽取的人数为________.【解析】(1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得x 900=3201 600,故x=180.(2)因为高中共有学生1 000名,在全校学生中抽取1名学生,抽到高二年级女生的概率为0.19,所以高二年级女生有1 000×0.19=190人,则高二年级共有学生180+190=370人,所以高三年级有1 000-370-380=250人,则采用分层抽样(按年级分层)在全校抽取100人,应在高三年级中抽取的人数为2501 000×100=25.【答案】(1)C (2)25分层抽样问题的解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本数(或总体数).(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.角度一 已知各层总数,确定抽样比1.某市有A 、B 、C 三所学校,共有高三文科学生1 500人,且A 、B 、C 三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取________人.设A 、B 、C 三所学校高三文科学生人数分别为x ,y ,z ,由题知x ,y ,z 成等差数列,所以x +z =2y ,又x +y +z =1 500,所以y =500,用分层抽样方法抽取B 校学生人数为1201 500×500=40.40角度二 已知各层总数,某一层的样本数,求另一层样本数或总数2.(2017·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n =( )A .54B .90C .45D .126B 依题意得33+5+7×n =18,解得n =90,即样本容量为90.角度三 已知某层总数及某层的样本数,求各层样本数3.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a 的值为________.由题意知1245+15=30120+a ,解得a =30.30,)1.某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为①;从10名家长中随机抽取3名参加座谈会,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( )A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法B 在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C 学校中应抽取的人数为( )A.10 B.12C.18 D.24A 根据分层抽样的特征,从C学校中应抽取的人数为90180+270+90×60=10.3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是( ) A.10 B.11C.12 D.16D 因为29号、42号的号码差为13,所以3+13=16,即另外一个同学的学号是16.4.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间上的运动员人数是( )A .3B .4C .5D .6B 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间上共有20个数据,分在4个小组中,每组取一人,共取4人.5.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间的人做问卷A ,编号落入区间的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15C 由题意知应将960人分成32组,每组30人.设每组选出的人的号码为30k +9(k =0,1,…,31).由451≤30k +9≤750,解得44230≤k ≤74130,又k ∈N ,故k =15,16,…,24,共10人.6.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A 营区,从301到495在B 营区,从496到600在C 营区,则三个营区被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9B 依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此A 营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此B 营区被抽中的人数是42-25=17.结合各选项知B 正确.7.(2015·高考福建卷)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.设男生抽取x 人,则有45900=x900-400,解得x =25.258.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n =________.由已知条件,抽样比为13780=160,从而35600+780+n =160,解得n =720.7209.某学校共有教师300人,其中中级教师有192人,高级教师与初级教师的人数比为5∶4.为了解教师专业发展需求,现采用分层抽样的方法进行调查,在抽取的样本中有中级教师64人,则该样本中的高级教师人数为________.由题意可知,高级教师有(300-192)×55+4=60人,抽样比k =n N =64192=13.故该样本中高级教师的人数为60×13=20.2010.某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A ,B ,C ,D 四个单位回收的问卷数依次成等差数列,且共回收1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B 单位抽取30份,则在D 单位抽取的问卷是________份.由题意依次设在A ,B ,C ,D 四个单位回收的问卷数分别为a 1,a 2,a 3,a 4,在D 单位抽取的问卷数为n ,则有30a 2=1501 000,解得a 2=200,又a 1+a 2+a 3+a 4=1 000,即3a 2+a 4=1 000,所以a 4=400,所以n400=1501 000,解得n =60. 6011.某初级中学共有学生2 000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (1)因为x2 000=0.19,所以x =380.(2)初三年级人数为y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为482 000×500=12(名).12.从2 007名学生中选取50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从2 007名学生中剔除7名学生,剩下的2 000名学生再按系统抽样的方法抽取,则每名学生入选的概率( )A .不全相等B .均不相等C .都相等,且为502 007D .都相等,且为140C 从N 个个体中抽取M 个个体,则每个个体被抽到的概率都等于MN.13.(2017·云南省第一次统一检测)某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6位对户外运动持“喜欢”态度,有1位对户外运动持“不喜欢”态度,有3位对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的有( )A .36人B .30人C .24人D .18人A 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x 、x 、3x ,由题意得3x -x =12,x =6,所以持“喜欢”态度的有6x =36人.14.某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500C 因为a ,b ,c 成等差数列,所以2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的三分之一,即为1 200双皮靴.15.某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取( )A .36人B .60人C .24人D .30人A 根据题意可知样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.16.(2017·青岛模拟)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生.因为12=5×2+2,即第三组抽出的是第二个同学,所以每一组都应抽出第二个同学,所以第8组中抽出的号码为5×7+2=37号.3717.有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次.根据年龄将大众评委分为五组,各组的人数如下:(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委,其中从B 组抽取6人,请将其余各组抽取的人数填入下表;(2)在(1)中,若A ,B 两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委中分别任选1人,求这2人都支持1号歌手的概率.(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:(2)记从A 组抽到的3个评委为a 1,a 2,a 3,其中a 1,a 2支持1号歌手;从B 组抽到的6个评委为b 1,b 2,b 3,b 4,b 5,b 6,其中b 1,b 2支持1号歌手.从{a 1,a 2,a 3}和{b 1,b 2,b 3,b 4,b 5,b 6}中各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的有a 1b 1,a 1b 2,a 2b 1,a 2b 2,共4种,故所求概率P =418=29.。

2018高考数学(理)一轮复习课件 第十章 统计与统计案例 第2讲 课件

2018高考数学(理)一轮复习课件 第十章 统计与统计案例 第2讲 课件

(1)求直方图中 a 的值; (2)设该市有 30 万居民, 估计全市居民中月均用水量不低于 3 吨的人数,并说明理由; (3)若该市政府希望使 85%的居民每月的用水量不超过标准 x(吨),估计 x 的值,并说明理由.
【解】 (1)由频率分布直方图知,月均用水量在[0,0.5)中的 频率为 0.08×0.5=0.04, 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4), [4,4.5]中的频率分别为 0.08,0.20,0.26,0.06,0.04,0.02. 由 0.04 + 0.08 + 0.5×a + 0.20 + 0.26 + 0.5×a + 0.06 + 0.04 + 0.02=1,解得 a=0.30. (2)由(1)可知,100 位居民每人的月均用水量不低于 3 吨的频 率为 0.06+0.04+0.02=0.12. 由以上样本的频率分布, 可以估计全市 30 万居民中月均用水 量不低于 3 吨的人数为 300 000×0.12=36 000.
[典例引领] (2016· 高考四川卷)我国是世界上严重缺水的国家, 某 市政府为了鼓励居民节约用水,计划调整居民生活用水收费 方案,拟确定一个合理的月用水量标准 x(吨),一位居民的月 用水量不超过 x 的部分按平价收费,超出 x 的部分按议价收 费.为了了解居民用水情况,通过抽样,获得了某年 100 位 居民每人的月均用水量(单位: 吨 ), 将数据按照[0, 0.5), [0.5, 1),…,[4,4.5]分成 9 组,制成了如图所示的频率分布直方 图.
(2)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端
中点 的_________ ,就得到频率分布折线图. 所分组数 ②总体密度曲线: 随着样本容量的增加, 作图时____________ 组距 增加,___________ 减小,相应的频率折线图会越来越接近于

2018年高考数学(理)二轮复习 讲学案:考前专题七 概率与统计 第3讲 统计与统计案例

2018年高考数学(理)二轮复习 讲学案:考前专题七 概率与统计 第3讲 统计与统计案例

第3讲统计与统计案例1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.热点一抽样方法1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.例1 (1)(2017届日照三模)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的一个样本,若编号为42的产品在样本中,则该样本中产品的最小编号为________.答案10解析样本间隔为80÷5=16,∵42=16×2+10,∴该样本中产品的最小编号为10. (2)某高级中学高一、高二、高三年级的学生人数分别为600,700,700,为了解不同年级学生的眼睛近视情况,现用分层抽样的方法抽取了容量为100的样本,则高三年级应抽取的学生人数为________.答案35解析由题意结合抽样比可得,高三年级应抽取的学生人数为100×700600+700+700=35. 思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.跟踪演练 1 (1)(2017·葫芦岛协作体模拟)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为( )A.12 B .33 C .06 D .16 答案 C解析 被选中的红色球号码依次为17,12,33,06,所以第四个被选中的红色球号码为06,故选C.(2)(2017届江西重点中学协作体联考)高三某班有学生36人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、23号、32号学生在样本中,则样本中还有一个学生的编号为( ) A .13 B .14 C .18 D .26 答案 B解析 ∵高三某班有学生36人,用系统抽样的方法,抽取一个容量为4的样本, ∴样本组距为36÷4=9,则5+9=14, 即样本中还有一个学生的编号为14,故选B. 热点二 用样本估计总体1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例2 (1)(2017·湖南衡阳联考)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( ) A .-11 B .3C .9D .17 答案 C解析 设没记清的数为x ,若x ≤2,则这列数为x,2,2,2,4,5,10,平均数为25+x7,中位数为2,众数为2,所以2×2=25+x7+2,得x =-11;若2<x ≤4,则这列数为2,2,2,x,4,5,10,则平均数为25+x 7,中位数为x ,众数为2,所以2x =25+x7+2,得x =3;若x ≥5,则这列数为 2,2,2,4,5,x,10或2,2,2,4,5,10,x ,则平均数为25+x7,中位数为4,众数为2,所以2×4=25+x7+2,得x =17,所以-11+3+17=9.(2)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图可知,这200名学生中每周的自习时间不足22.5小时的人数是________.答案 45解析 阅读频率分布直方图可得,这200名学生中每周的自习时间不足22.5小时的人数是200×(0.02+0.07)×2.5=45.思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.跟踪演练2 (1)(2017届江西南昌二模)某人到甲、乙两市各7个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为( )A .4B .3C .2D .1 答案 B解析 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是79-76=3,故选B.(2)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n 的值为( )A .300B .200C .150D .100答案 D解析 根据频率分布直方图的面积和为1,可得[50,60)的频率为P =1-10×(0.01+0.024+0.036)=0.3,又由P =30n=0.3,解得n =100.故选D.热点三 统计案例 1.线性回归方程方程y ^=b ^x +a ^称为线性回归方程,其中b ^=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y -b ^x ,(x ,y )称为样本点的中心. 2.随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .例3 (1)(2017届山西太原三模)已知某产品的广告费用x (单位:万元)与销售额y (单位:万元)具有线性相关关系,其统计数据如下表:附:b ^=∑ni =1(x i -x )(y i -y )∑ni =1(x i -x )2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y -b ^x .由上表可得线性回归方程y ^=b ^x +a ^,据此模型预测广告费用为8万元时的销售额是( ) A .59.5万元 B .52.5万元 C .56万元 D .63.5万元 答案 A解析 由题意可得x =3+4+5+64=92, y =25+30+40+454=35,则b ^=∑4i =1x i y i -4x y ∑4i =1x 2i -4 x 2=665-4×92×3586-4×⎝ ⎛⎭⎪⎫922=7,a ^=y -b ^x =3.5,所以线性回归方程为y ^=7x +3.5,据此模型预报广告费用为8万元时的销售额是y =7×8+3.5=59.5(万元). 故选A.(2)(2017·四川成都九校联考)某学校为了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:由公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2≈7.82.附表:参照附表,以下结论正确是( )A .有99.5%以上的把握认为“爱好该项运动与性别有关”B .有99.5%以上的把握认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 答案 C解析 由题意知本题所给的观测值K 2≈7.82>6.635,∴这个结论有0.01的机会出错,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.思维升华 (1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(x ,y ),应引起关注.(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K 2即可. 跟踪演练3 (1)(2017届德州二模)某产品的广告费用x (万元)与销售额y (万元)的统计数据如表:根据上表可得线性回归方程y ^=9.4x +a ^,据此模型预测,广告费用为6万元时的销售额为( )A .65.5万元B .66.6万元C .67.7万元D .72万元 答案 A解析 x =2+3+4+54=3.5,y =26+39+49+544=42,代入线性回归方程,得42=9.4×3.5+a ^,解得a ^=9.1,所以线性回归方程为y ^=9.4x +9.1, 当x =6时,y =65.5,故选A.(2)(2017·广东湛江二模)某同学利用课余时间做了一次社交软件使用习惯调查,得到2×2列联表如下:附表:则下列结论正确的是( )A .在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关B .在犯错的概率超过0.005的前提下认为社交软件使用习惯与年龄有关C .在犯错的概率不超过0.001的前提下认为社交软件使用习惯与年龄有关D .在犯错的概率超过0.001的前提下认为社交软件使用习惯与年龄有关 答案 A解析 K 2=30×(4×2-16×8)220×10×12×18=10,由于7.879<10<10.828,可以认为在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关,故选A.真题体验1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为__________. 答案 3,5解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3. 2.(2017·山东改编)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为________.答案 166解析 ∵∑10i =1x i =225,∴x =110∑10i =1x i =22.5. ∵∑10i =1y i =1 600,∴y =110∑10i =1y i =160. 又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.∴线性回归方程为y ^=4x +70.将x =24代入上式,得y ^=4×24+70=166.3.(2016·全国Ⅲ改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下列叙述不正确的是________.①各月的平均最低气温都在0 ℃以上; ②七月的平均温差比一月的平均温差大; ③三月和十一月的平均最高气温基本相同; ④平均最高气温高于20 ℃的月份有5个. 答案 ④解析 由题意知,平均最高气温高于20 ℃的有七月,八月,故④不正确.4.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 答案 18解析 ∵样本容量总体个数=60200+400+300+100=350.∴应从丙种型号的产品中抽取350×300=18(件).押题预测1.某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了10个用户,将满意度的分数绘成茎叶图如图所示.设甲、乙两地的满意度分数的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲>x 乙,m 甲>m 乙C.x 甲>x 乙,m 甲<m 乙D.x 甲<x 乙,m 甲<m 乙押题依据 从茎叶图中提取数字的特征(如平均数、众数、中位数等)是高考命题的热点题型. 答案 B解析 甲地用户的平均满意度分数为x 甲=53+62+64+73+74+76+81+85+92+9510=75.5,乙地用户的平均满意度分数为x 乙=51+56+62+64+73+73+81+82+83+9110=71.6,所以x 甲>x 乙.中位数分别为m 甲=74+762=75,m 乙=73+732=73,所以m 甲>m 乙. 故选B.2.某校为了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘成的频率分布直方图如图所示,则这100名学生中学习时间在6至10小时之间的人数为________.押题依据 频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查考生的基本分析能力,是高考的热点. 答案 58解析 由图知,(0.04+0.12+x +0.14+0.05)×2=1,解得x =0.15,所以学习时间在6至10小时之间的频率是(0.15+0.14)×2=0.58, 所求人数为100×0.58=58.3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )押题依据 线性回归分析在生活中具有很强的应用价值,是高考的一个重要考点. 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b ^=52.5-4×3.5×3.554-4×3.52=0.7, a ^=3.5-0.7×3.5=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.A 组 专题通关1.(2017·山西实验中学模拟)一个学校高一、高二、高三的学生人数之比为2∶3∶5,若用分层抽样法抽取容量为200的样本,则应从高三学生中抽取的人数是( ) A .40 B .60 C .80 D .100 答案 D解析 由分层抽样的概念可得,应从高三学生中抽取的人数是200×52+3+5=100.故选D.2.(2017届广东省东莞市二模)已知某学校有1 680名学生,现在采用系统抽样的方法抽取84人,调查他们对学校食堂的满意程度,将1 680人按1,2,3,…,1 680随机编号,则在抽取的84人中,编号落在[61,160]内的人数为( ) A .7 B .5 C .3 D .4 答案 B解析 (160-60)×841 680=5,故选B.3.(2017·北京丰台区二模)某校高一1班、2班分别有10人和8人骑自行车上学,他们每天骑行路程(单位:千米)的茎叶图如图所示:则1班10人每天骑行路程的极差和2班8人每天骑行路程的中位数分别是( ) A .14,9.5 B .9,9 C .9,10 D .14,9答案 A解析 2班共有8个数据,中间两个数是9和10,因此中位数为9.5,只有A 符合,故选A(1班10个数据最大为22,最小为8,极差为14).4.(2017·福建泉州质检)2017年4月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中A ,B 两地选择一处进行实地考察,因此,他通过网站了解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为下图的茎叶图,记A ,B 两地综合评分数据的平均数分别为A ,B ,方差分别为s 2A ,s 2B ,若已备受好评为依据,则下述判断较合理的是( ) A .因为A >B ,s 2A >s 2B ,所以应该去A 地 B .因为A >B ,s 2A <s 2B ,所以应该去A 地C .因为A <B ,s 2A >s 2B ,所以应该去B 地 D .因为A <B ,s 2A <s 2B ,所以应该去B 地 答案 B解析 计算可得A =8623>85=B ,s 2A <s 2B (A 数据集中,B 数据分散),所以A 地好评分高,且评价稳定,故选B.5.(2017届江西上饶二模)下面四个命题中,为真命题的是( )①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③判断两个分类变量X 与Y 的相关性:若K 2越小,则说明“X 与Y 有关系”的把握程度越大; ④随机变量X ~N (0,1),则P (|X |<1)=2P (X <1)-1. A .①④ B .②④ C .①③ D .②③ 答案 A解析 ②错误,因为相关系数可以接近-1;③错误,K 2越大,有关系的把握越大.故选A. 6.(2017届湖南长郡中学、衡阳八中等十三校联考)某校高三文科班150名男生在“学生体质健康50米跑”单项测试中,成绩全部介于6秒与11秒之间.现将测试结果分成五组:第一组[6,7];第二组(7,8],…,第五组(10,11].下图是按上述分组方法得到的频率分布直方图.按国家标准,高三男生50米跑成绩小于或等于7秒认定为优秀,若已知第四组共48人,则该校文科班男生在这次测试中成绩优秀的人数是________.答案 9解析 由题设中提供的频率分布直方图可以看出,这次测试中成绩优秀的人数的频率P =1-⎝⎛⎭⎪⎫0.38+0.16+0.08+48150×1=0.06,故这次测试中成绩优秀的人数为0.06×150=9. 7.(2017届四川广志联考)某同学使用计算器求30个数据的平均数时,错将其中的一个数据105输为15,那么由此求出的平均数与实际平均数的差是________. 答案 -3解析 若将该数看做15,其他数据不变,其和记为M ,则其平均数为P 1=M +1530;若将该数看做105,其他数据不变,其和仍为M ,则其平均数为P 2=M +10530,则两次算得的平均数之差P 1-P 2=M +15-M -10530=-3.8.(2017·江西百校联盟联考)某设备的使用年数x 与所支出的维修总费用y 的统计数据如下表:根据上表可得线性回归方程为y ^=1.4x +a ^.若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用________年. 答案 8解析 因为x =2+3+4+5+65=4,y =1.5+4.5+5.5+6.5+7.55=5.1,故代入线性回归方程可得a ^=5.1-1.4×4=-0.5,所以线性回归方程为y ^=1.4x -0.5,当y=12时,解得x≈8.9.9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是________.表1表2表3表4答案阅读量解析根据数据求出K2的值,再进一步比较大小.表1中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,K 2=52×(6×22-14×10)220×32×16×36=131 440.表2中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(4×20-16×12)220×32×16×36=637360.表3中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(8×24-12×8)220×32×16×36=1310.表4中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(14×30-6×2)220×32×16×36=3 757160.∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量.10.(2017·全国Ⅱ)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg ,新养殖法的箱产量不低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)记B 表示事件“旧养殖法的箱产量低于50 kg ”,C 表示事件“新养殖法的箱产量不低于50 kg ”.由题意知,P (A )=P (BC )=P (B )P (C ). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).B 组 能力提高11.某公司有30名男职员和20名女职员,公司进行了一次全员参与的职业能力测试,现随机询问了该公司5名男职员和5名女职员在测试中的成绩(满分为30分),可知这5名男职员的测试成绩分别为16,24,18,22,20,5名女职员的测试成绩分别为18,23,23,18,23,则下列说法一定正确的是( ) A .这种抽样方法是分层抽样 B .这种抽样方法是系统抽样C .这5名男职员的测试成绩的方差大于这5名女职员的测试成绩的方差D .该测试中公司男职员的测试成绩的平均数小于女职员的测试成绩的平均数 答案 C解析 根据抽样方法的特点,可知这种抽样既不是分层抽样,也不是系统抽样,故A ,B 是错误的;由这5名男职员和5名女职员的测试成绩得不出该公司男职员和女职员的测试成绩的平均数,故D 是错误的;根据公式,可以求得这5名男职员的测试成绩的方差为s 21=8,5名女职员的测试成绩的方差为s 22=6,所以C 正确.故选C.12.(2017届四川大教育联盟三诊)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l .根据图中数据,下列对该样本描述错误的是( )A .据样本数据估计,该地区青少年身高与年龄成正相关B .所抽取数据中,5 000名青少年平均身高约为145 cmC .直线l 的斜率的值近似等于样本中青少年平均身高每年的增量D .从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l 上 答案 D解析 在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A 正确;用样本数据估计总体可得平均数大约是145 cm ,故B 正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C 正确;各取一人具有随机性,根据数据做出的点只能在直线附近,不一定在直线上,故D 错误.13.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得线性回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入线性回归方程,得14+c5=0.85×5-0.25,解得c=6.14.(2017届广东潮州二模)当今,手机已经成为人们不可或缺的交流工具,人们常常把喜欢玩手机的人冠上了名号“低头族”,手机已经严重影响了人们的生活.一媒体为调查市民对低头族的认识,从某社区的500名市民中随机抽取n名市民,按年龄情况进行统计的频率分布表和频率分布直方图如图:(1)求出表中a,b,n的值,并补全频率分布直方图;(2)媒体记者为了做好调查工作,决定从所随机抽取的市民中按年龄采用分层抽样的方法抽取20名接受采访,再从抽出的这20名中年龄在[30,40)的选取2名担任主要发言人.记这2名主要发言人年龄在[35,40)的人数为ξ,求ξ的分布列及期望.解(1)由题意及频率分布表可知,n=5÷0.05=100,所以a=100×0.35=35,b=30100=0.3. 补全频率分布直方图,如图所示.(2)设抽出的20名受访者年龄在[30,35)和[35,40)的分别有m ,n 名,由分层抽样可得20100=m 35=n 30, 解得m =7,n =6.所以年龄在[30,40)的共有13名.故ξ的可能取值为0,1,2,P (ξ=0)=C 06C 27C 213=726,P (ξ=1)=C 16C 17C 213=713, P (ξ=2)=C 26C 07C 213=526. ξ的分布列为∴E (ξ)=0×726+1×713+2×526=1213.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2018年高考数学总复习统计与统计案例(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高考数学总复习统计与统计案例(word版可编辑修改))的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高考数学总复习统计与统计案例(word版可编辑修改)的全部内容。

第三节统计与统计案例考纲解读1。

理解随机抽样的必要性和重要性。

2。

会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。

3。

了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。

4. 理解样本数据标准差的意义和作用,会计算数据标准差.5。

能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。

6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。

8。

了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

9。

了解常见的统计方法,并能应用这些方法解决一些实际问题。

(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。

(2)回归分析了解回归分析的基本思想、方法及其简单应用。

命题趋势探究1. 本节内容是高考必考内容,以选择题、填空题为主。

2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。

(1)(2)有结合趋势,考题难度中下。

3. 统计案例为新课标教材新增内容,考查考生解决实际问题的能力。

知识点精讲一、抽样方法三种抽样方式的对比,如表13—7所示。

二、样本分析(1)样本平均值:11ni i x x n ==∑.(2)样本众数:样本数据中出现次数最多的那个数据。

(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。

(4)样本方差:()2211ni i s x x n ==-∑。

众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。

三、频率分布直方图的解读 (1)频率分布直方图的绘制①由频率分布表求出每组频数n i ;②求出每组频率ii n P N=(n 为样本容量); ③列出样本频率分布表;④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1.(2)样本估计总体步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。

样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。

(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。

公式:aX b ax b +=+,s 2(aX +b )=a 2s 2(X )。

四、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。

对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y bx a =+的求法为()()()1122211n ni i i i i i n ni ii i x x y y x y nx y b x x x nx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 其中,11n i i x x n ==∑,11ni i y y n ==∑,(x ,y )称为样本点的中心.步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k >0,称两个变量正相关;k <0,称两个变量负相关.五、独立性独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。

步骤为列出22列联表(如表13-8所示),求出()()()()()22n ad bc K a b c d a c b d -=++++,并判断:表13—8A 1 A 2 合计B 1 a c a +c B 2 b d b +d 合计 a +b c +d n =a +b +c +d若K 2>10.828,有1212若10.828K 2>6。

635,有99%把握称“A 取A 1或A 2"对“B 取B 1,B 2"有关系;若6.635K 2>3.841,有95%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;若K 23。

841,没有把握称A 与B 相关。

题型归纳及思路提示 题型181 抽样方式 思路提示根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简单随机抽样或系统抽样。

当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。

例13.16(2012天津理9)某地区有小学150所,中学75所,大学25所。

现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取所学校,中学中抽取所学校。

解析:本地区共有学校150+75+25=250(所),所以从小学中应抽取1503018⨯=(所),从中250学中抽取75⨯=(所).309250变式1 (2012山东理4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2, (960)分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()。

A。

7 B。

9 C. 10 D. 15变式2 某校共有学生2000名,各年级男、女生人数如表13—9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为( )。

一年级二年级三年级女生373x y男生377370z变式3员制作了统计表格,如表13-10所示,由于不小心,表格中的A,C产品的有的有关数据被污染看不清楚,统计员记得A产品样本容量比C产品的样本容量多10,由此可得C产品数量为_______。

产品类型A B C产品数量(件)1300130产品样本数量(件)题型182思路提示对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。

在进行样本分析时,应从统计图表中获取数据。

体现在以下几个方面:(1)在频率分布直方图中,长方形面积=组距错误!=频率,即随机变量的概率;(2)对于频数、频率、样本容量,已知其二必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。

例13。

17(2013广东理17)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。

17920153013-16图(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率。

分析:阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。

(2)根据样本算出优秀工人的比例,再估计12人中优秀工人的个数。

(3)用组合数公式求出所有可能的组合的个数和符合条件“恰有1名优秀工人"的组合的个数,利用古典概型概率公式进行计算.解析:(1)由茎叶图可知,样本数据为17,19,20,21,25,30,则样本均值171920212530226x +++++==,故样本均值为22.(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为2163=,该车间12名工人中优秀工人大约有21246⨯=(名),故该车间约有4名优秀工人。

(3)记“恰有1名优秀工人”为事件A ,其包含的基本事件个数为C 14C 18=32,所有基本事件的总数为C 212=66,由古典概型概率公式,得()32166633P A ==。

所以恰有1名优秀工人的概率为1633。

变式1 (2012陕西理6)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图13-17所示),设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )。

865088400102875220233780031244831423813-17甲乙图 A 。

x 甲<x 乙,m甲>m 乙B 。

x 甲〈x 乙,m 甲〈m 乙C .x 甲〉x 乙,m 甲>m 乙D 。

x 甲>x 乙,m 甲<m 乙变式2 某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙.(1)假设n =4,在第一大块地中,种植品种甲的小块地的数目记为X ,求X 的分布列和数学期望;(2)试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm 2)如表13-11所示。

表13—11种植哪一品种?附:样本数据x 1,x 2,…,x n 的样本方差[()()()]2222121n s x x x x x x n=-+-++-,其中x 为样本平均数.例13.18某次有1000人参加的数学摸底考试,其成绩的频率分布直方图如图13-18所示,规定85分及其以上为优秀.(1)表13—12所示的是这次考试成绩的频数分布表,求正整数a ,b 的值;(2优秀的学生人数;(3)在(2)中抽取的40名学生中,要随机选取2名学生参加座谈会,记“其中成绩为优秀的人数"为X ,求X 的分布列与数学期望.解析:(1)由频率分布直方图可知,a =0。

451000=200,b =0.0251000=100。

(2)设抽取的40人中成绩为优秀的学生人数为x ,则350300100401000x ++=,解得x =30,即其中成绩为优秀的学生人数为30名。

(3)依题意,随机变量X 的可能取值为:0,1,2。

且()210240C 30C 52P X ===,()1110102C C 51C 13P X ===, ()2202C 292C 52P X ===,所以X 的分布列为:X 0 1 2P352 5132952数学期望为()350125213522E X =⨯+⨯+⨯=。

相关文档
最新文档