2019版高考数学大一轮复习第十章统计与统计案例第2节用样本估计总体学案理新人教B版
高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开
高考数学(理)一轮复习教案:第十篇 统计、统计案例第2讲 用样本估计总体

第2讲用样本估计总体【20XX年高考会这样考】1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主.2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).【复习指导】1.由于高考对统计考查的覆盖面广,几乎对所有的统计考点都有所涉及,其中频率分布直方图、均值与方差、茎叶图是核心考点,需要好好掌握.复习时,对于统计的任何环节都不能遗漏,最主要的是掌握好统计的基础知识,适度的题量练习.2.高考对频率分布直方图或茎叶图与概率相结合的题目考查日益频繁.因此,复习时要加强这方面的训练,弄清图表中有关量的含义,并从中提炼出有用的信息,为后面的概率计算打好基础.基础梳理1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.(2)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(3)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.4.样本方差与标准差设样本的元素为x1,x2,…,x n,样本的平均数为x,(1)样本方差:s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(2)样本标准差:s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].两个异同(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.双基自测1.(人教A版教材习题改编)某工厂生产滚珠,从某批产品中随机抽取8粒,量得直径分别为(单位:mm):14.7,14.6,15.1,15.0,14.8,15.1,15.0,14.9,则估计该厂生产的滚珠直径的平均数为( ).A.14.8 mm B.14.9 mmC.15.0 mm D.15.1 mm解析平均数x=18(14.7+14.6+15.1+15.0+14.8+15.1+15.0+14.9)=14.9 (mm).答案 B2.(2012·合肥月考)一个容量为100的样本,其数据的分组与各组的频数如下:A.0.13 B.0.39C.0.52 D.0.64解析由列表可知样本数据落在(10,40]上的频数为52,故其频率为0.52.答案 C3.(人教A版教材习题改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是( ).A.14 B.16 C.15 D.17解析将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为15+152=15.答案 C 4.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( ).A .30辆B .40辆C .60辆D .80辆解析 由题图可知,车速大于或等于70 km/h 的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆). 答案 B5.(2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.解析 平均数x =10+6+8+5+65=7.∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+ (6-7)2]=15×(9+1+1+4+1)=3.2. 答案 3.2考向一 频率分布直方图的绘制与应用 【例1】►某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.[审题视点] 利用各小长方形的面积和等于1求[70,80)内的频率.解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分为:x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.【训练1】(2011·湖北)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( ).A.18 B.36C.54 D.72解析样本数据落在区间[10,12)内的频率1-(0.19+0.15+0.05+0.02)×2=0.18,所以数据落在此区间的频数为200×0.18=36.答案 B考向二茎叶图的应用【例2】►如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有( ).A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关[审题视点] 去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论.解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B.答案 B由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.【训练2】在一项大西瓜品种的实验中,共收获甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如图所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)__________________________________________;(2)__________________________________________.解析从这个茎叶图可以看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除了一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳定,总体情况比乙好.答案(1)甲种大西瓜的平均重量大于乙种大西瓜(2)甲种大西瓜的产量比乙种大西瓜稳定考向三用样本的数字特征估计总体的数字特征【例3】►甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.[审题视点] (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x甲=10+13+12+14+165=13,x乙=13+14+12+12+145=13,s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s2甲>s2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【训练3】甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1.解析x甲=x乙=9环,s2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定,故填甲.答案甲规范解答19——怎样解答茎叶图与概率的综合性问题【问题研究】茎叶图是一个将数据分成主、次两部分,把主要部分当做茎、次要部分当作叶表达数据的一个图,它是一种常用的统计图.因此考题常将茎叶图作为载体来考查平均数、方差以及概率问题.【解决方案】首先对茎叶图中的数据全面分析,然后再根据茎叶图的数据解决其它问题.【示例】►(本题满分12分)(2011·北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.(1)如果X=8,求乙组同学植树棵数的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)第(1)问直接套入公式求值;第(2)问利用古典概型的知识解决.[解答示范] (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为 x =8+8+9+104=354.(2分)方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542=1116.(5分)(2)记甲组四名同学为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),(9分)用C 表示:“选出的两名同学的植树总棵数为19”这一事件,则C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P (C )=416=14.(12分)茎叶图一般记录两组的数据,它最直观、最清晰,但利用茎叶图解决概率问题时对重复出现的数据要重复记录,不能遗漏.。
高考数学一轮复习 第十章 统计、统计案例 第2讲 用样本估计总体教案 理(含解析)

第2讲用样本估计总体基础知识整合1.用样本的频率分布估计总体分布(1)作频率分布直方图的步骤①求极差(即一组数据中□01最大值与□02最小值的差).②决定□03组距与□04组数.③将数据□05分组.06频率分布表.④列□07频率分布直方图.⑤画□(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的08中点,就得频率分布折线图.□09样本容量的增加,作图时□10所分的组②总体密度曲线:随着□11组距减小,相应的频率折线图会越来越接近于一条光滑数增加,□曲线,即总体密度曲线.(3)茎叶图茎是指□12中间的一列数,叶是从茎的□13旁边生长出来的数.2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x -=□14x 1+x 2+…+x n n,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s = □15 1n [x 1-x-2+x 2-x -2+…+x n -x -2]. (5)方差:s 2=□161n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数 答案 B解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.一个样本的频率分布表如下,则下列选项中正确的是( ) A.M=80 B.m=40C.n=0.42 D.0<N<1答案C解析由已知,得M=20.02=100,所以m=100-2-4-37-15=42,n=mM=42100=0.42,N=0.02+0.04+0.37+0.15+0.42=1,故选C.3.(2019·南宁模拟)如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的极差为a,乙加工零件个数的平均数为b,则a+b=________.答案40解析由茎叶图,知甲加工零件个数的极差a=35-18=17,乙加工零件个数的平均数b=110×(10×3+20×4+30×3+17+11+2)=23,则a+b=40.4.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这批产品的平均长度为________mm.答案22.75解析根据频率分布直方图,估计这批产品的平均长度为(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)×5=22.75 mm.5.(2019·沈阳模拟)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1人入选,那么入选的最佳人选应是________.答案 甲解析 x -甲=x -乙=9环,s 2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定,故填甲. 核心考向突破考向一 频率分布直方图的应用例 1 (1)(2019·秦皇岛模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则11时至12时的销售额为( )A .8万元B .10万元C .12万元D .15万元答案 C解析 由频率分布直方图知,9时至10时的销售额的频率为0.1,故销售总额为30.1=30万元.又11时至12时的销售额的频率为0.4,故销售额为0.4×30=12万元.故选C.(2)为了解某校高三学生联考的数学成绩情况,从该校参加联考学生的数学成绩中抽取一个样本,并分成五组,绘成如图所示的频率分布直方图,已知第一组至第五组的频率之比为1∶2∶8∶6∶3,第五组的频数为6,则样本容量为________.答案40解析因为第一组至第五组的频率之比为1∶2∶8∶6∶3,所以可设第一组至第五组的频率分别为k,2k,8k,6k,3k,又频率之和为1,所以k+2k+8k+6k+3k=1,解得k=120=0.05,所以第五组的频率为3×0.05=0.15,又第五组的频数为6,所以样本容量为60.15=40.触类旁通应用频率分布直方图应注意的问题(1)频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2图中各小长方形的面积等于相应各组的频率,它直观反映了数据在各个小组的频率的大小.3要把握一个基本公式:频率=频数样本容量.即时训练 1.(2019·贵州黔东南州联考)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在[30,40)岁的有2500人,年龄在[20,30)岁的有1200人,则m 的值为( )A .0.013B .0.13C .0.012D .0.12答案 C解析 由题意得,年龄在范围[30,40)岁的频率为0.025×10=0.25,则赞成高校招生改革的市民有25000.25=10000人,因为年龄在范围[20,30)岁的有1200人,则m =12001000010=0.012.故选C. 考向二 茎叶图的应用例 2 (1)(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7答案 A解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3.故选A. (2)(2019·郑州质量预测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( ) A.甲B.乙C.甲、乙相等D.无法确定答案A解析从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.触类旁通茎叶图的绘制及应用(1)一般制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出.2估计数字特征,给定两组数据的茎叶图,“重心”下移者平均数较大,数据集中者方差较小.即时训练 2.(2019·江苏丹阳模拟)某校开展摄影比赛,9位评委为参赛作品A给出的分数如图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是( )A.1 B.2 C.3 D.4答案A解析当x≥4时,89+89+92+93+92+91+947=6407≠91.当x <4时,89+89+92+93+90+x +92+917=91,∴x =1,故选A.考向三 数字特征的应用 角度1 样本数字特征与直方图交汇例3 (2019·益阳模拟)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A .该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B .该校九年级学生1分钟仰卧起坐的次数的众数为27.5C .该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D .该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32答案 D解析 由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D 错误.角度2 样本的数字特征与茎叶图例4 对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:(1)画出茎叶图;(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、方差、极差,并判断选谁参加比赛比较合适?解 (1)画茎叶图如下(中间数为数据的十位数).(2)x -甲=27+38+30+37+35+316=33. x -乙=33+29+38+34+28+366=33. s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,甲、乙平均数相同,但乙的极差、方差相对更小,成绩更稳定,故选乙参加比赛较合适.触类旁通1众数、中位数、平均数及方差的意义,平均数与方差都是重要的数字特征,是对总体的一种简明地描述;平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.2在计算平均数、方差时可利用平均数、方差的有关结论. 即时训练 3.(2019·浙江台州中学模拟)对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为( )A .2.25,2.5B .2.25,2.02C .2,2.5D .2.5,2.25 答案 B解析 由图可知,前五组的频率依次为0.04,0.08,0.15,0.22,0.25,因此前五组的频数依次为4,8,15,22,25,根据众数的定义,众数应是出现次数最多的数,故在第五组,用组中值表示该组的值,即为2.25.由中位数的定义,应是第50个数与第51个数的算术平均数,而前四组的频数和为4+8+15+22=49,是第五组中第1个数与第二个数的算术平均数,对照选项,中位数是2.02最合理,故选B.4.(2019·襄阳模拟)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同.(1)求m ,n 的值;(2)比较甲、乙两组数据的稳定性,并说明理由.解 (1)根据茎叶图,得乙的中位数是32+342=33, 所以甲的中位数也是33,所以m =3.甲的平均数是27+33+393=33,乙的平均数是20+n +32+34+384=33,解得n =8. (2)乙组数据的稳定性强.理由如下:甲的方差s 2甲=27-332+33-332+39-3323=24,乙的方差 s 2乙=28-332+32-332+34-332+38-3324=13. s 2甲>s 2乙,所以乙组数据的稳定性强.。
高考数学一轮复习-第十章 统计与统计案例 第二节 用样本估计总体课件 理

(3)某地政府调查了工薪阶层 1 000 人的月工资收入,并根据 调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对 月工资收入的满意程度,要用分层抽样的方法从调查的 1 000 人 中抽出 100 人做电话询访,则(30,35](百元)月工资收入段应抽出 ________人.
A.逐年比较,2008 年减少二氧化硫排放量的效果最显著 B.2007 年我国治理二氧化硫排放显现成效 C.2006 年以来我国二氧化硫年排放量呈减少趋势 D.2006 年以来我国二氧化硫年排放量与年份正相关
(2)(2015·湖北高考)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间 [0.3,0.9]内,其频率分布直方图如图所示.
(2) ① 由 0.1×1.5 + 0.1×2.5 + 0.1a + 0.1×2.0 + 0.1×0.8 + 0.1×0.2=1,解得 a=3.
②区间[0.3,0.5)内的频率为 0.1×1.5+0.1×2.5=0.4,故 [0.5,0.9]内的频率为 1-0.4=0.6.
因 此 , 消 费 金 额 在 区 间 [0.5,0.9] 内 的 购 物 者 的 人 数 为 0.6×10 000=6 000.
答案:(1)A
在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个 图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶 的含义.
1.如图是 2015 年某大学自主招生面试环节中,七位评 委为某考生打出的分数的茎叶统计图,去掉一个最高分和一 个最低分后,所剩数据的平均数和众数依次为( )
通用版2019版高考数学一轮复习第十章统计与统计案例学案理

第十章统计与统计案例第一节统计本节主要包括2个知识点: 1.随机抽样; 2.用样本估计总体.突破点(一) 随机抽样[基本知识]1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.4.三种抽样方法的比较[基本能力]1.判断题(1)简单随机抽样是一种不放回抽样.( )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )(3)系统抽样在起始部分抽样时采用简单随机抽样.( )(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ) 答案:(1)√ (2)× (3)√ (4)× (5)× 2.填空题(1)利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是________.解析:总体个数为N =8,样本容量为M =4,则每一个个体被抽到的概率为P =M N =48=12.答案:12行作业检查,这种抽样方法是________. 答案:系统抽样(3)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________.解析:1 00080=x4,x =50. 答案:50解析:设应从高二年级抽取x 名学生,则x 50=310.解得x =15. 答案:15[全析考法]1.抽签法的步骤第一步,将总体中的N 个个体编号;第二步,将这N 个号码写在形状、大小相同的号签上; 第三步,将号签放在同一不透明的箱中,并搅拌均匀; 第四步,从箱中每次抽取1个号签,连续抽取k 次; 第五步,将总体中与抽取的号签的编号一致的k 个个体取出. 2.随机数法的步骤 第一步,将个体编号;第二步,在随机数表中任选一个数开始;第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.[例1] (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )C.02 D.01(2)下列抽取样本的方式不属于简单随机抽样的有________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.(2)①不是简单随机抽样.因为不满足总体的有限性.②不是简单随机抽样.因为它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.[答案] (1)D (2)①②③④系统抽样的步骤[例2] (1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20(2)将高一(九)班参加社会实践编号为1,2,3,…,48的48名学生,采用系统抽样的方法抽取一个容量为4的样本,已知5号,29号,41号学生在样本中,则样本中还有一名学生的编号是________.[解析] (1)由系统抽样的定义知,分段间隔为1 00040=25.故选C.(2)根据系统抽样的概念,所抽取的4个样本的编号应成等差数列,因为在这组数中的间距为41-29=12,所以所求的编号为5+12=17.[答案] (1)C (2)17 [易错提醒]用系统抽样法抽取样本,当Nn不为整数时,取k =⎣⎢⎡⎦⎥⎤N n ,即先从总体中用简单随机抽样的方法剔除(N -nk )个个体,且剔除多余的个体不影响抽样的公平性.分层抽样进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.[例3] (1)(2018·南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200 人、高三n 人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n =( )A .860B .720C .1 020D .1 040(2)(2017·江苏高考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为件进行检验,则应从丙种型号的产品中抽取________件.篮球组 书画组 乐器组高一 45 30 a高二151020[解析] (1)根据分层抽样方法,得1 000+1 200+n×81=30,解得n =1 040.故选D.(2)本题考查分层抽样方法及用样本估计总体.从丙种型号的产品中抽取的件数为60×300200+400+300+100=18.(3)由题意知1245+15=3045+15+30+10+a+20,解得a=30.[答案] (1)D (2)18 (3)30[方法技巧]分层抽样的解题策略(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.(4)抽样比=样本容量总体容量=各层样本数量各层个体数量.[全练题点]1.[考点一]某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法:其中正确的序号是( )A.②③④B.③④C.②③D.①②解析:选C 根据随机数法编号可知,①④编号位数不统一.2.[考点一、二、三]对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析:选D 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.A.10 B.11C.12 D.164.[考点三]某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽取55人,其中从高一年级学生中抽取20人,则从高三年级学生中抽取的人数为________.解析:设从高二年级学生中抽取x人,由题意得x360=20400,解得x=18,则从高三年级学生中抽取的人数为55-20-18=17人.答案:175.[考点二]为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60取的学生中最大的编号为________.解析:由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.答案:57突破点(二) 用样本估计总体[基本知识]1.频率分布直方图和茎叶图(1)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.2.样本的数字特征(1)众数、中位数、平均数①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = x 1-2+x 2-x-2+…+x n -x-2].②方差:标准差的平方s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x -是样本平均数.③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.(3)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.[基本能力]1.判断题(1)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( ) (2)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )(5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (6)一组数据的众数可以是一个或几个,中位数也具有相同的结论.( ) 答案:(1)√ (2)× (3)√ (4)× (5)√ (6)× 2.填空题(1)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:48(2)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:①[25,30)年龄组对应小矩形的高度为________;②据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________. 解析:设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,解得h =0.04.则志愿者年龄在[25,35)年龄组的频率为5(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:①0.04 ②440(3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是____________.数为68,最小数为12,极差为68-12=56. 20+202=20. 答案:20(5)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.答案:0.1[全析考法][例1] (2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解] (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60, 女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. [方法技巧]1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率. 2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.茎叶图(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一; (2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据. 2.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[解] (1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -.由观测结果可得x -=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x ->y -,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.[方法技巧]茎叶图问题的求解策略(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况.样本的数字特征(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小.考法(一) 与频率分布直方图交汇命题 图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5,∴直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224. [方法技巧]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二) 与茎叶图交汇命题A.7,8 B .5,7 C .8,5D .7,7(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.[解析] (1)甲组数据的中位数为17, 故y =7,乙组数据的平均数为3×10+20++6+6+x +5=17.4,解得x =7.(2)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.[答案] (1)D (2)367[易错提醒]在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.考法(三) 与优化决策问题交汇命题[例5] 甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲 乙 丙 丁 平均环数x 8.3 8.8 8.8 8.7 方差s 23.53.62.25.4A .甲B .乙C .丙D .丁[解析] 由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.[答案] C [方法技巧]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[全练题点]1.[考点二]在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:选D 设中间一组的频数为x ,依题意有x 80=14⎝ ⎛⎭⎪⎫1-x 80,解得x =16.A.3,5 B .5,5 C .3,7D .5,7解析:选A 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.3.[考点一]为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为6,则报考飞行员的学生人数是( )A .36B .40C .48D .50解析:选C 由题知,题图中从左到右的前3个小组的频率之和为1-(0.037+0.013)×5=0.75.又图中从左到右的前3个小组的频率之比为1∶2∶3,所以第1小组的频率为0.75×11+2+3=0.125,所以报考飞行员的学生人数是60.125=48.A .84,4.84B .84,1.6C .85,1.6D .85,4解析:选C 依题意,所剩数据的平均数是80+15×(4×3+6+7)=85,所剩数据的方差是15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6..解析:x -甲=x -乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.答案:甲(1)根据所给统计表和频率分布直方图中的信息求出n ,m 的值,并完成频率分布直方图; (2)由频率分布直方图,求该组数据的平均数与中位数. 解:(1)∵0.004×50=20n,∴n =100,∵20+40+m +10+5=100,∴m =25.40100×50=0.008;25100×50=0.005;10100×50=0.002;5100×50=0.001.由此完成频率分布直方图,如图:(2)由频率分布直方图得该组数据的平均数为25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95,∵[0,50)的频率为0.004×50=0.2,[50,100)的频率为0.008×50=0.4,∴中位数为50+0.5-0.20.4×50=87.5.[全国卷5年真题集中演练——明规律] A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B 标准差能反映一组数据的稳定程度.故选B. 根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:选A 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确.3.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A .各月的平均最低气温都在0 ℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D 由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;故D错误.A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.[课时达标检测][小题对点练——点点落实]对点练(一) 随机抽样A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法解析:选B 在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.某校高三年级共有学生900人,编号为1,2,3,…,900,现用系统抽样的方法抽取一A.10 B.11C.12 D.13解析:选C 系统抽样,是抽多少人就把总体分成多少组,于是抽样间隔就是用总体数A.93 B.123C.137 D.1674.高三(3)班共有学生56人,座号分别为1,2,3,…,56,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知3号、17号、45号同学在样本中,那么样本中还有一个同学的座号是( )A.30 B.31C.32 D.33解析:选B 由系统抽样的特点,得到样本中的座号形成一个以3为首项,公差为17-3=14的等差数列,则第三个座号是17+14=31.故选B.5.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号________________________________________________________________________ (下面摘取了随机数表第7行至第9行).84 42 17 53 31 57 24 55 06 88 77 04 7447 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 5071 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 0744 38 15 51 00 13 42 99 66 02 79 54A类轿车10辆,则z的值为________.解析:由题意可得50100+300+150+450+z+600=10100+300,解得z=400. 答案:400解析:系统抽样的抽取间隔为305=6,设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x )+(24+x )=75,所以x =3.答案:3对点练(二) 用样本估计总体1.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设所得分数的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -解析:选D 由图可知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5;5出现的次数最多,故m 0=5;x -=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)÷30≈5.97.于是得m 0<m e <x -.2.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( )A.32 34 32 B .33 45 35 C .34 45 32D .33 36 35解析:选B 观察茎叶图,16个数已经按大小顺序列出,从上往下数第8个数和第9个数是最中间两个数,它们是32和34,中位数是它们的平均数:33.再读茎叶图,45出现次数最多,共3次,故为众数.极差等于最大值减最小值:47-12=35.故选B.3.(2017·九江二模)已知一组数据x 1,x 2,…,x n 的方差为2,若数据ax 1+b ,ax 2+b ,…,ax n +b (a >0)的方差为8,则a 的值为( )A .1 B. 2 C .2D .4解析:选C 根据方差的性质可知,a 2×2=8,故a =2.4.(2018·湖北黄冈质检)已知数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则这(n +1)个数据中,下列说法正确的是( )A .年收入平均数可能不变,中位数可能不变,方差可能不变B .年收入平均数大大增大,中位数可能不变,方差变大C .年收入平均数大大增大,中位数可能不变,方差也不变D .年收入平均数大大增大,中位数一定变大,方差可能不变解析:选B ∵数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,x n+1为世界首富的年收入,则x n +1远大于x 1,x 2,x 3,…,x n ,故这(n +1)个数据中,年收入平均数大大增大;中位数可能不变,也可能稍微变大;由于数据的集中程度受到x n +1的影响比较大,更加离散,则方差变大.①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B ∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙, 又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.6.五一期间,某淘宝店趁势推出了“抢红包”的促销活动.已知每人有5次抢红包的机会,每次可得到1元至30元不等的红包.甲、乙二人在这5次抢红包活动中获得的红包金额的茎叶图如图所示.若甲5次获得的红包金额的均值为x 1,乙5次获得的红包金额的均值为x 2,则x 1-x 2=________.红包金额的均值x 2=1+2+5+10+305=9.6,所以x 1-x 2=13-9.6=3.4.答案:3.47.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为________;解析:(1)由频率分布直方图总面积为1,得(0.001 2+0.002 4×2+0.003 6+x +0.006 0)×50=1,解得x =0.004 4.数为100×0.7=70. 答案:(1)0.004 4 (2)708.已知x 是1,2,3,x,5,6,7这七个数据的中位数且1,2,x 2,-y 这四个数据的平均数为1,则y -1x的最小值为________.解析:由题意1+2+x 2-y =4,所以y =x 2-1.由中位数定义知,3≤x ≤5,所以y -1x=x 2-1-1x .当x ∈[3,5]时,函数y =x 2-1与y =-1x 均为增函数,所以y =x 2-1-1x在[3,5]上为增函数,所以⎝ ⎛⎭⎪⎫y -1x min =8-13=233.答案:233[大题综合练——迁移贯通]你认为选派谁参赛更合适?并说明理由. 解:根据茎叶图可知,甲的平均成绩 x-甲=79+84+85+87+87+88+93+94+96+9710=89,乙的平均成绩x-乙=75+77+85+88+89+89+95+96+97+9910=89,甲、乙的平均成绩相等.又甲成绩的方差s 2甲=110[(79-89)2+(84-89)2+(85-89)2+(87-89)2+(87-89)2+(88-89)2+(93-89)2+(94-89)2+(96-89)2+(97-89)2]=30.4,乙成绩的方差s 2乙=110[(75-89)2+(77-89)2+(85-89)2+(88-89)2+(89-89)2+(89-89)2+(95-89)2+(96-89)2+(97-89)2+(99-89)2]=60.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适.2.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A 和B 两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A 款订餐软件的50个商家的“平均送达时间”的众数及平均数; (2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B 款订餐软件“平均送达时间”不超过40分钟的商家达到75%? ②如果你要从A 和B 两款订餐软件中选择一款订餐,你会选择哪款?说明理由. 解:(1)依题意可得,使用A 款订餐软件的50个商家的“平均送达时间”的众数为55.使用A 款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(2)①使用B 款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B 款订餐软件“平均送达时间”不超过40分钟的商家达到75%.。
全国通用近年高考数学大一轮复习第十章统计与统计案例、概率第2节用样本估计总体学案文新人教A版(20

(全国通用版)2019版高考数学大一轮复习第十章统计与统计案例、概率第2节用样本估计总体学案文新人教A版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((全国通用版)2019版高考数学大一轮复习第十章统计与统计案例、概率第2节用样本估计总体学案文新人教A版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(全国通用版)2019版高考数学大一轮复习第十章统计与统计案例、概率第2节用样本估计总体学案文新人教A版的全部内容。
第2节用样本估计总体最新考纲1。
了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2。
理解样本数据标准差的意义和作用,会计算数据标准差;3。
能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4。
会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识梳理1。
频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=错误!;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示错误!,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3。
样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数。
高三数学一轮复习第十篇统计与统计案例第2节用样本估计总体理

反映了各个样本数据聚集
标准差是样本数据到平均数的一种平均 于样本平均数周围的程
标 距离,即 s= 准
度.标准差越小,表明各个 样本数据在样本平均数周
差
1 n
[( x1
x)2
( x2
x)2
...
( xn
x)2 ]
围越集中;标准差越大,表 明各个样本数据在样本平
均数的两边越分散
标准差的平方,即 方 差 s2= 1 [(x1- x )2+(x2- x )2+…+(xn- x )2]
优缺点
用茎叶图表示数据的优点是(1)所有的信息都可以从茎叶图 中得到;(2)便于记录和读取,能够展示数据的分布情况.缺 点是当样本数据较多或数据位数较多时,茎叶图就显得不太 方便
4.样本的数字特征
数字 特征 众数
中位数
定义
在一组数据中出现 次数最多的数据 将一组数据按大小 顺序依次排列,处在 最中间位置的一个 数据(或最中间两个 数据的平均数)
第2节 用样本估计总体
最新考纲 1.了解分布的意义和作用,能根据列 频率分布表,会画频率分布直方图、 频率折线图、茎叶图,体会它们各自 的特点. 2.理解样本数据标准差的意义和作 用,会计算数据标准差. 3.能从样本数据中提取基本的数字 特征(如平均数、标准差),并做出合
理的解释. 4.会用样本的频率分布估计总体分 布,会用样本的基本数字特征估计总 体的基本数字特征,理解用样本估计 总体的思想. 5.会用随机抽样的基本方法和样本 估计总体的思想解决一些简单的实 际问题.
夯基自测
1.在样本频率分布直方图中,共有 11 个小长方形,若中间一个小长方形的面 积等于其他 10 个小长方形面积和的 1 ,且样本容量为 160,则中间一组的频
2019届高考数学一轮必备考情分析学案:10.2《用样本估计总体》(含解析)

10.2用样本估计总体考情分析统计的基本思想方法就是用样本估计总体,而用样本估计总体是高考考查的重点,频率分布直方图,频率分布表,茎叶图在高考中都有考查,特别是频率分布直方图、方差(标准差)是高考的热点。
基础知识1. 作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差) (2)决定组距与组数; (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图. 2. 频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 3. 众数、中位数、平均数(1)在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.[:(3)如果有n 个数12,,n x x x ,那么12nx x x n+++叫做这n 个数的平均数.(4)利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标. 4、茎叶图的优点用茎叶图表示数据有两个突出的优点:一是在统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以在比赛时随时记录,方便记录与表示.[: 5、标准差设样本的元素为1x ,2x ,…,n x ,样本的平均数为 ,(1)样本方差222212()()()n x x x x x x s n-+-++-=(2)标准差s =注意事项1.(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.2.利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.题型一频率分布直方图的绘制与应用【例1】某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有 ( ) A.30辆B.40辆C.60辆D.80辆答案:B解析:由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).【训练1】有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( ).A.18 B.36C.54 D.72解析样本数据落在区间[10,12)内的频率1-(0.19+0.15+0.05+0.02)×2=0.18,所以数据落在此区间的频数为200×0.18=36.答案 B题型二茎叶图的应用【例2】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53答案:A解析:本题主要考查茎叶图数据的读取和数据特征的简单计算,由所给的茎叶图可知所给出的数据共有30个,其中45出现3次为众数,处于中间位置的两数为45和47,则中位数为46;极差为68-12=56.故选A.【变式2】在一项大西瓜品种的实验中,共收获甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如图所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)__________________________________________;(2)__________________________________________.解析从这个茎叶图可以看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除了一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳定,总体情况比乙好.答案(1)甲种大西瓜的平均重量大于乙种大西瓜(2)甲种大西瓜的产量比乙种大西瓜稳定题型三用样本的数字特征估计总体的数字特征【例3】甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):答案:甲解析:x甲=x乙=9环,s2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定,故填甲.【变式3】甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):[:如果甲、乙两人中只有1解析x甲=x乙=9环,s2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定,故填甲.答案 甲重难点突破【例4】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率. (注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)[解析] (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为 x =8+8+9+104=354. 方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542=1116. (2)记甲组四名同学为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是: (A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),[:用C 表示:“选出的两名同学的植树总棵数为19”这一事件,则C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P(C)=416=14.巩固提高1.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ) A.65B. 65C. 2D. 2答案:D解析:∵a +0+1+2+35=1,得a =-1,∴s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.故选D.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A. m e=m0=xB. m e=m0<xC. m e<m0<xD. m0<m e<x答案:D解析:由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e=5.5,5出现次数最多,故m0=5,x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m0<m e<x.3.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 ( )A. 40.6,1.1B. 48.8,4.4C. 81.2,44.4D. 78.8,75.6答案:A解析:记原数据依次为x1,x2,x3,…,x n,则新数据依次为2x1-80,2x2-80,2x3-80,…,2x n-80,且1+x2+…+x n-80nn =1.2,因此有x1+x2+…+x nn=1.2+802=40.6,结合各选项知正确选项为A.4.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )A.众数B.平均数C.中位数D.标准差答案:D解析:本题考查众数、平均数、中位数及标准差的概念,考查推理论证能力,容易题. 当每个样本数据加上2后,众数、平均数、中位数都会发生变化,不变的是数据的波动情况,即标准差不变.5.某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出若干名学生,并将其成绩绘制成频率分布直方图(如图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80), [80,90),[90,100],已知样本中成绩小于70分的个数是36,则样本中成绩在[60,90)内的学生人数为________.[:答案:90人解析:根据给定的频率直方图可得,小于70分的人数占有的频率为 (0.01+0.02)×10=0.3,所以样本总36 0.3=120人,则成绩在[60, 90)内的学生人数为120×(0.2+0.3+0.25)=90.体为。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2节 用样本估计总体最新考纲 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知 识 梳 理1.频率分布直方图(1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距=极差组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率. 2.茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 3.样本的数字特征(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数在频率分布直方图中,中位数左边和右边的直方图的面积相等.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] [常用结论与微点提醒]1.频率分布直方图中各小矩形的面积之和为1.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.诊 断 自 测1.思考辨析(在括号内打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中.( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×频率组距=频率. (4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.答案 (1)√ (2)× (3)√ (4)×2.(教材习题改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5, 平均数x =87+89+90+91+92+93+94+968=91.5. 答案 A3.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数解析 刻画评估这种农作物亩产量稳定程度的指标是标准差.答案 B4.(2018·烟台质检)某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A.30辆B.40辆C.60辆D.80辆解析 从频率分布直方图知,车速大于或等于70 km/h 的频率为0.02×10=0.2.由于样本容量为200,故“超速”被罚的汽车约有200×0.2=40(辆).答案 B5.(2016·江苏卷)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析 易求x =15(4.7+4.8+5.1+5.4+5.5)=5.1, ∴方差s 2=15[(-0.4)2+(-0.3)2+02+0.32+0.42]=0.1. 答案 0.1考点一 茎叶图及其应用【例1】 (1)(2017·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5B.5,5C.3,7D.5,7(2)(2018·济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( )A.2B.4C.5D.6解析 (1)由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y =5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x 5=66,解得x =3. (2)由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为8×1040=2(人). 答案 (1)A (2)A规律方法 1.茎叶图的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.【训练1】 (1)(2018·广东广雅中学联考)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m +n 的值是( )A.10B.11C.12D.13(2)(2018·沈阳模拟)空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI 大于100的天数约为________(该年为365天).解析 (1)∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m +92=88×7,∴m =3,∵乙组学生成绩的中位数是89,∴n =9,∴m +n =12.(2)该样本中AQI 大于100的频数是4,频率为25, 由此估计该地全年AQI 大于100的频率为25,估计此地该年AQI 大于100的天数约为365×25=146. 答案 (1)C (2)146考点二 频率分布直方图(易错警示)【例2】 (2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.规律方法 1.频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数. 2.例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布.易错警示 1.频率分布直方图的纵坐标是频率组距,而不是频率,切莫与条形图混淆. 2.制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.【训练2】 某校2018届高三文(1)班在一次数学测验中,全班N 名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.(1)求总人数N 和分数在120~125的人数n ;(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?解 (1)分数在110~120内的学生的频率为P 1=(0.04+0.03)×5=0.35,所以该班总人数N =140.35=40. 分数在120~125内的学生的频率为P 2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10,分数在120~125内的人数n =40×0.10=4.(2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为105+1102=107.5.设中位数为a ,∵0.01×5+0.04×5+0.05×5=0.50,∴a =110.∴众数和中位数分别是107.5,110.考点三 样本的数字特征【例3】 (1)(2018·济南一中质检)2017年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为( )A.9B.4C.3D.2(2)(2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.①求直方图中a 的值;②设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; ③估计居民月均用水量的中位数.(1)解析 由茎叶图得该组数据的平均数x =15(87+89+90+91+93)=90. ∴方差为15[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4. 答案 B(2)解 ①由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.②由①知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.③设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【训练3】(2018·北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的.①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是( )A.①②③B.②③④C.①②④D.①③④解析由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率P1=510=12,女生平均每天锻炼时间超过65分钟的概率P2=410=25,P1>P2,因此④正确.设男生、女生两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙.易求x甲=65.2,x乙=61.8,知x甲>x乙,②正确.又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s甲<s乙,③错误,因此符合茎叶图所给数据的结论是①②④.答案 C基础巩固题组(建议用时:40分钟)一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45B.50C.55D.60解析由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=150.3=50.答案 B2.重庆市2017年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是( )A.19B.20C.21.5D.23解析从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20.答案 B3.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误.答案 A4.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )A.甲B.乙C.丙D.丁解析由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好. 答案 C5.(2016·山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56B.60C.120D.140解析 由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140. 答案 D 二、填空题6.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.解析 170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2. 答案 27.(2018·宜春调研)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.解析 全体志愿者共有:20(0.24+0.16)×1=50(人),所以第三组有志愿者:0.36×1×50=18(人),∵第三组中没有疗效的有6人, ∴有疗效的有18-6=12(人). 答案 128.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.解析 依题意,x 1,x 2,x 3,…,x 10的方差s 2=64.则数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16. 答案 16 三、解答题9.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5,所以直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5, ∴月平均用电量的中位数在[220,240]中,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5. 解得a =224,即中位数为224.10.(2016·北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).能力提升题组(建议用时:20分钟)11.(2018·邯郸一中质检)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )A.2B. 2C.10D.10解析甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1.则甲地该月11时的平均气温的标准差为1×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]= 2.5答案 B12.(2018·长沙一中质检)某电子商务公司对10 000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析(1)由(1.5+2.5+a+2.0+0.8+0.2)×0.1=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.答案(1)3 (2)6 00013.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)样本数据的频率分布直方图如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。