2018年高考一轮人教版A数学文科 第9章 第3节 用样本估计总体
最新-2018届高考数学一轮复习 第9章第三节 用样本估计总体课件 文 精品

变式训练2 甲、乙两组数据如下: 甲 11.2 9.8 12.3 8.9 9.0 10.7 13.1 乙 10.3 8.9 13.0 9.7 8.6 11.2 12.3 (1)求两组数据的平均数; (2)画出茎叶图求中位数; (3)求两组数据的方差; (4)对两组数据加以比较.
(4)标准差:设样本数据是 x1,x2,…,xn, x 表 示这组数据的平均数,xi 到 x 的距离是|xi- x |(i =1,2,…,n). 于是样本中数据到平均数的“平均距离”是 s= n1(|x1- x |+|x2- x |+…+|xn- x |). 由于上式含绝对值,运算不太方便,因此,通
(6)茎叶图的特征: ①用茎叶图表示数据有两个优点:一是统计 图上没有原始数据信息的损失,所有数据信 息都可以从茎叶图中得到;二是茎叶图中的 数据可以随时记录,随时添加,方便记录与 表示. ②茎叶图只便于表示两位有效数字的数据, 而且茎叶图只方便记录两组数据,两组以上 的数据虽然能够记录,但是没有表示两组数 据那么直观、清晰.
例2 某良种培育基地正在培育一种小麦新品 种A,将其与原有的一个优良品种B进行对照 试验.两种小麦各种植了25亩,所得亩产数据 (单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400, 405,412,414,415,421,423,423,427,430,430,434,44 3,445,445,451,454
(2)中位数:样本数据中,累计频率为0.5时所 对应的样本数据(累计频率:样本数据小于某 一数值的频率叫做该数值点的累计频率)或将 数据按大小排列,位于最中间的数据.如果 数据的个数为偶数,就取最中间两个数据的 平均数作为中位数. (3)平均数:样本数据的算术平均数,即 x =n1(x1 +x2+…+xn).
人教版高中数学高考一轮复习--用样本估计总体(课件)

样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
2018年高考数学人教A版一轮复习课件:9-3用样本估计总

(2)由图可知,全市居民中月均用水量不低于3吨的人数 所占百分比为0.5×(0.12+0.08+0.04)=12%,所以全市 月均用水量不低于3吨的人数为:30×12%=3.6(万). (3)由图可知,月均用水量小于2.5吨的居民人数所占百 分比为:
0.5×(0.08+0.16+0.3+0.4+0.52)=0.73, 即73%的居民 月均用水量小于2.5吨,同理,88%的居民月均用水量小 于3吨,故2.5<x<3,假设月均用水量平均分布,则
【典例1】(2016·四川高考)我国是世界上严重缺水的
国家,某市政府为了鼓励居民节约用水,计划调整居民
生活用水收费方案,拟定一个合理的月用水量标准 x(吨),一位居民的月用水量不超过x的部分按平价收费,
超出x的部分按议价收费.为了了解居民用水情况,通过
抽样,获得了某年100位居民每人的月均用水量(单位: 吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,
【解析】由频率分布直方图可知45岁以下的教师的频
率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).
答案:48
4.(2017·天津模拟)甲、乙两人在10天中每天加工零 件的个数用茎叶图表示如图,中间一列的数字表示零件 个数的十位数,两边的数字表示零件个数的个位数,则 这10天甲、乙两人日加工零件的平均数分别为______ 和______.
第三节
用样本估计总体
【知识梳理】 1.常用统计图表 (1)频率分布表的画法:
极差 组数 极差 决定组数和组距,组距=_____; 第一步:求_____,
分组 通常对组内数值所在区间取左闭右 第二步:_____, 开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.
数学课件(新教材人教A版强基版)第九章统计与成对数据的统计分析92用样本估计总体

∵(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1, ∴a=0.025 0,众数为185+2 195=190, 设中位数为x,∵(0.001 5+0.011 0 +0.022 5)×10=, (0.001 5+0.011 0+0.022 5+0.030 0) ×10=, 则185<x<195, +0.030 0×(x-185)=,
甲 82 81 79 78 95 88 93 84 乙 92 95 80 75 83 80 90 85 (1)求两位学生预赛成绩的平均数和方差;
x 甲=18×(82+81+79+78+95+88+93+84)=85,
x 乙=18×(92+95+80+75+83+80+90+85)=85,
s2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88 -85)2+(93-85)2+(84-85)2]=,
把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179, 180,180, 则178+2 179=178.5,所以所求中位数为 178.5.
第
二 部 分
探究核心题型
题型一 样本的数字特征和百分位数的估计
√
数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经 按照由小到大的顺序排列,计算10×25%=,取第三个数,所以第25 百分位数是88.
思维升华
频率分布直方图中的数字特征 (1)众数:最高矩形的底边中点的横坐标. (2)中位数:中位数左边和右边的矩形的面积和应该相等. (3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对 应频率之积的和.
2018届高考数学一轮复习第九章算法初步、统计、统计案例课时作业60用样本估计总体(含解析)文

课时作业60 用样本估计总体一、选择题1.容量为20的样本数据,分组后的频数如下表:A.0.35 B.0.45C.0.55 D.0.65解析:求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.答案:B2.重庆市2013年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是( )A.19 B.20C.21.5 D.23解析:根据茎叶图可知,这组数据从小到大依次是8,9,12,15,18,20,20,23,23,28,31,32,处于正中间的两个数都是20,故中位数是20.答案:B3.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.3解析:由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,35]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.2.答案:C4.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:由茎叶图知m 甲=22+182=20,m 乙=27+312=29,∴m 甲<m 乙;x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716,∴x 甲<x乙.答案:B5.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9,所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错. 答案:C6.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2解析:由题意,得x =x 1+x 2+…+x 1010,s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2].因为下月起每位员工的月工资增加100元, 所以下月工资的均值为x 1++x 2++…+x 10+10=x 1+x 2+…+x 10+10×10010=x +100下月工资的方差为110[(x 1+100-x -100)2+(x 2+100-x -100)2+…+(x 10+100-x -100)2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2,故选D.答案:D 二、填空题7.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.解析:由茎叶图可知甲监测点的数据较为集中,乙监测点的数据较为分散,所以甲地的方差较小.答案:甲8.(2017·南昌一模)在一次演讲比赛中,6位评委对一名选手打分的茎叶图如图所示,若去掉一个最高分和一个最低分,得到一组数据x i (1≤i ≤4),在如图所示的程序框图中,x 是这4个数据的平均数,则输出的v 的值为________.解析:根据题意得到的数据为78,80,82,84,则x=81.该程序框图的功能是求以上数据的方差,故输出的v的值为-2+-2+-2+-2=5.4答案:5三、解答题9.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312274 296 288 302 295 228 287 217 329 283(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.10.(2016·北京卷)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(Ⅰ)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解:(Ⅰ)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(Ⅱ)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).1.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x 代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为( )A.15B.310C.35D.710解析:由茎叶图可知0≤x ≤9且x ∈N ,中位数是10+7+x 2=27+x 2,这位运动员这8场比赛的得分平均数为18(7+8+7+9+x +3+1+10×4+20×2)=18(x +115),由18(x +115)≥27+x2,得3x ≤7,即x =0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为310,故选B.答案:B2.农场种植的甲、乙两种水稻,在面积相等的两块稻田中连续6年的平均产量如下(单位:500 g),产量比较稳定的是( )C .一样D .无法确定解析:x 甲=16×(900+920+900+850+910+920)=900,x 乙=16×(890+960+950+850+860+890)=900;s 2甲=16×(202+502+102+202)≈567;s 2乙=16×(102+602+502+502+402+102)≈1 733,因为s 2甲<s 2乙,所以甲的产量波动小,所以甲种水稻的产量比较稳定.答案:A3.为组织好市运动会,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为________; (2)这800名志愿者中年龄在[25,35)内的人数为________.解析:(1)因为各个小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为15[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440. 答案:(1)0.04 (2)4404.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数; (2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解:(1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n .∵样本中产品净重小于100克的个数是36,∴36n=0.300,∴n=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.1=12,120×0.75=90,120×0.150=18,∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元).。
【优化探究】高考数学(人教A版·文科)总复习配套课件9-3 用样本估计总体

4.(2014年杭州模拟)某商贩有600千克苹果出售,有以下两个出售 方案: ①分成甲级200千克,每千克售价2.40元,乙级400千克,每千克售 价1.20元; ②分成甲级400千克,每千克售价2.00元,乙级200千克,每千克售 价1.00元. 两种出售方案的平均价格分别为 x 1和 x 2,则( A. x 1> x 2 C. x 1< x 2 B. x 1= x 2 D. x 1与 x 2的大小不确定 )
分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
[解析]
(1)由频率分布直方图可知(2a+0.04+0.03+0.02)×10=1,
解得 a=0.005. (2) 由频 率分布 直方图 估计 这 100 名学 生语文 成绩的平 均分 为 55×0.005×10 + 65×0.04×10 + 75×0.03×10 + 85×0.02×10 + 95×0.005×10=73(分 ). (3)由频率分布直方图及表中数据得: 分数段 [50,60) 5 5 x y
数为1 000-200=800.
答案:800
频率分布直方图的应用 【例1】 某校100名学生期中考试语文成绩的频率分布直方图如
图所示,其中成绩分组区间是: [50,60) , [60,70) , [70,80) , [80,90) , [90,100].
(1)求图中a的值; (2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生语文成绩某些分数段的人数 (x)与数学成绩相应
使两端增加的量相同).
(2)数据分组的组数与样本容量有关,一般样本容量越大,所分组 数应越多.当样本容量不超过100时,按照数据的多少,常分成5至12
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案

第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
高考数学一轮复习 第9章 算法初步、统计与统计案例 第3节 用样本估计总体教师用书 文 新人教A版

第三节 用样本估计总体———————————————————————————————— [考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图 (1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图931).图931横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积=组距×频率组距=频率.(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.[答案] (1)√ (2)× (3)√ (4)×2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图932所示,则这组数据的中位数和平均数分别是( )图932A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [这组数据由小到大排列为87,89,90,91,92,93,94,96. ∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.]3.(2017·南昌二模)如图933所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )图933A .50B .40C .30D .14C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]4.(2016·江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]5.(2017·山东淄博模拟)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图934,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.图9342 [170+17×(1+2+x +4+5+10+11)=175,则17×(33+x )=5,即33+x =35,解得x =2.](1)(2015·广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. (1)11[由条件知x =x 1+x 2+…+x nn=5,则所求均值x=2x 1+1+2x 2+1+…+2x n +1n=x 1+x 2+…+x n +nn=2x +1=2×5+1=11.](2)①甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1, 其平均数为x 甲=1015=23.3分方差s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1, 其平均数为x 乙=915=35.方差s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625.因为x 甲>x 乙,s 2甲<s 2乙, 所以甲组的研发水平优于乙组.6分 ②记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的概率为715.用频率估计概率,即得所求概率为P (E )=715.12分[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.[变式训练1] (2017·郑州模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图935所示的茎叶图.考虑以下结论:图935①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的序号为 ( ) A .①③ B .①④ C .②③D .②④B [甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2.∴x 甲<x 乙,s 甲>s 乙.]50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解](1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.[变式训练2] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图936所示,若两组数据的中位数相同,平均数也相同,那么m+n=________.【导学号:31222364】图93611[∵两组数据的中位数相同,∴m =2+42=3.又∵两组数据的平均数也相同, ∴27+33+393=20+n +32+34+384,∴n =8, 因此m +n =11.]☞角度1 利用分布直方图求频率、频数(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图937所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )图937A .56B .60C .120D .140D [由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.] ☞角度2 用频率分布直方图估计总体(2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图938所示的频率分布直方图.图938(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解](1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.5分(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.8分(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.10分由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.12分[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.[思想与方法]1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.[易错与防范]1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.课时分层训练(五十六) 用样本估计总体A 组 基础达标 (建议用时:30分钟)一、选择题1.重庆市2016年各月的平均气温(℃)数据的茎叶图如图939,则这组数据的中位数是( )图939A .19B .20C .21.5D .23B [由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.]2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 ( )A .134石B .169石C .338石D .1 365石B [254粒和1 543石中夹谷的百分比含量是大致相同的,可据此估计这批米内夹谷的数量.设1 534石米内夹谷x 石,则由题意知x 1 534=28254,解得x ≈169.故这批米内夹谷约为169石.]3.某班的全体学生参加英语测试,成绩的频率分布直方图如图9310,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )图9310A.45 B.50C.55 D.60B[由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=150.3=50.]4.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9311中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )图9311A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个D[对于选项A,由题图易知各月的平均最低气温都在0 ℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ℃,所以C正确;对于选项D,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D错误.]5.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8 B.15C.16 D.32C [已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.]二、填空题6.如图9312所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x +y =________.【导学号:31222365】图931210 [x 甲=75+82+84++x +90+936=85,x =6.又∵乙同学的成绩众数为84,∴y =4. ∴x +y =10.]7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图9313所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.【导学号:31222366】图931324 [底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.] 8.(2017·郑州调研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:2 [易知x 甲=90,x 乙=90.则s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4.s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.]三、解答题9.(2017·郑州调研)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图9314所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.【导学号:31222367】图9314(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.[解] (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,3分∴m =3,n =8.5分(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,8分s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,10分∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的整体水平相当,乙组更稳定一些.12分10.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:图9315(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w =3时,估计该市居民该月的人均水费.[解] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.3分所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%. 依题意,w 至少定为3.5分(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).12分B 组 能力提升 (建议用时:15分钟)1.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:【导学号:31222368】图9316则7个剩余分数的方差为( ) A.1169B.367 C .36D.677B [由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0)=367.]2.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图9317所示.图9317(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.(1)3(2)6 000[(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.]3.(2017·广州模拟)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图9318.图9318(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x =0.007 5,∴直方图中x 的值为0.007 5.4分 (2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.8分(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,故抽样比为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×15=5(户).12分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节 用样本估计总体————————————————————————————————[考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图(1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距=极差组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图9-3-1).图9-3-1横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()[解析](1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×频率组距=频率.(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.[答案](1)√(2)×(3)√(4)×2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图9-3-2所示,则这组数据的中位数和平均数分别是()图9-3-2A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [这组数据由小到大排列为87,89,90,91,92,93,94,96.∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.] 3.(2017·南昌二模)如图9-3-3所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )图9-3-3A .50B .40C .30D .14C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]4.(2016·江苏高考)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1, 所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]5.(2017·山东淄博模拟)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图9-3-4,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.图9-3-42 [170+17×(1+2+x +4+5+10+11)=175,则17×(33+x )=5,即33+x =35,解得x =2.]12n 5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(1)11 [由条件知x =x 1+x 2+…+x n n=5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n= 2(x 1+x 2+…+x n )+n n=2x +1=2×5+1=11.] (2)①甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为x 甲=1015=23.3分方差s2甲=115⎣⎢⎡⎦⎥⎤⎝⎛⎭⎪⎫1-232×10+⎝⎛⎭⎪⎫0-232×5=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为x乙=915=35.方差s2乙=115⎣⎢⎡⎦⎥⎤⎝⎛⎭⎪⎫1-352×9+⎝⎛⎭⎪⎫0-352×6=625.因为x甲>x乙,s2甲<s2乙,所以甲组的研发水平优于乙组.6分②记E={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共7个.因此事件E发生的概率为7 15.用频率估计概率,即得所求概率为P(E)=715.12分[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.[变式训练1](2017·郑州模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图9-3-5所示的茎叶图.考虑以下结论:图9-3-5①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的序号为()A.①③B.①④C.②③D.②④B[甲地5天的气温为:26,28,29,31,31,其平均数为x甲=26+28+29+31+315=29;方差为s2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s甲= 3.6.乙地5天的气温为:28,29,30,31,32,其平均数为x乙=28+29+30+31+325=30;方差为s2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s乙= 2.∴x甲<x乙,s甲>s乙.]了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解] (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.[变式训练2] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图9-3-6所示,若两组数据的中位数相同,平均数也相同,那么m +n =________.【导学号:31222364】图9-3-611 [∵两组数据的中位数相同,∴m=2+42=3.又∵两组数据的平均数也相同,∴27+33+393=20+n+32+34+384,∴n=8,因此m+n=11.]☞角度1利用分布直方图求频率、频数(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图9-3-7所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()图9-3-7A.56 B.60C.120 D.140D[由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]☞角度2用频率分布直方图估计总体(2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图9-3-8所示的频率分布直方图.图9-3-8(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解](1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.5分(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.8分(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.10分由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.12分[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.[思想与方法]1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.[易错与防范]1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.课时分层训练(五十六)用样本估计总体A组基础达标(建议用时:30分钟)一、选择题1.重庆市2016年各月的平均气温(℃)数据的茎叶图如图9-3-9,则这组数据的中位数是()图9-3-9A.19B.20C.21.5D.23B[由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.]2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1 365石B[254粒和1 543石中夹谷的百分比含量是大致相同的,可据此估计这批米内夹谷的数量.设1 534石米内夹谷x石,则由题意知x1 534=28 254,解得x≈169.故这批米内夹谷约为169石.]3.某班的全体学生参加英语测试,成绩的频率分布直方图如图9-3-10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()图9-3-10A.45 B.50C.55 D.60B[由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=150.3=50.]4.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9-3-11中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()图9-3-11A.各月的平均最低气温都在0 ℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20 ℃的月份有5个D [对于选项A ,由题图易知各月的平均最低气温都在0 ℃以上,A 正确;对于选项B ,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点的距离,所以七月的平均温差比一月的平均温差大,B 正确;对于选项C ,三月和十一月的平均最高气温均为10 ℃,所以C 正确;对于选项D ,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D 错误.]5.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32C [已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.]二、填空题6.如图9-3-12所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x +y =________.【导学号:31222365】图9-3-1210 [x 甲=75+82+84+(80+x )+90+936=85,x =6.又∵乙同学的成绩众数为84,∴y =4. ∴x +y =10.]7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图9-3-13所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.【导学号:31222366】图9-3-1324 [底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.]8.(2017·郑州调研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:2 [易知x 甲=90,x 乙=90.则s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4. s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.] 三、解答题9.(2017·郑州调研)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图9-3-14所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.【导学号:31222367】图9-3-14(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.[解] (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,3分∴m =3,n =8.5分(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,8分 s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,10分 ∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的整体水平相当,乙组更稳定一些.12分10.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:图9-3-15(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w =3时,估计该市居民该月的人均水费.[解] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.3分所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w 至少定为3.5分(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).12分B 组 能力提升 (建议用时:15分钟)1.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:【导学号:31222368】图9-3-16则7个剩余分数的方差为( ) A.1169 B.367 C .36D.677B [由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0)=367.]2.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图9-3-17所示.图9-3-17(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.(1)3(2)6 000[(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.]3.(2017·广州模拟)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图9-3-18.图9-3-18(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x=0.007 5,∴直方图中x的值为0.007 5.4分(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,则(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,解得a=224,即中位数为224.8分(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,故抽样比为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×15=5(户).12分。