2021版高考数学一轮复习第十一章统计与统计案例第2讲用样本估计总体教学案理北师大版
高三数学一轮复习 第十一章 统计、统计案例 11.2用样本估计总体课件 新人教B版

.
4.(2010·福建)若某校高一年级 8 个班参加 合唱比赛的得分如茎叶图所示,则这组 数据的中位数和平均数分别是( )
A.91.5 和 91.5 C.91 和 91.5
B.91.5 和 92 D.92 和 92
.
解析 将这组数据从小到大排列,得 87,89, 90,91,92,93,94,96. 故平均数 x =87+89+90+91+8 92+93+94+96 =91.5, 中位数为91+2 92=91.5,故选 A. 答案 A
.
5.某工厂对一批电子元件进行了抽样检测,根据抽样检测后元 件使用寿命(单位:小时)的数据绘制的频率分布直方图如图 所示,其中元件使用寿命的范围是[100,600],样本数据分组 为[100,200),[200,300),[300,400),[400,500),[500,600], 若样本元件的总数为 1 000 个,则样本中使用寿命大于或等 于 200 小时并且小于 400 小时的元件的个数是( )
第十一章 统计、统计案例
§11.2 用样本估计总体
基础知识 自主学习
要点梳理
1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种,一种 是用 样本的频率分布估计总体的分布 ,另一 种是用 样本的数字特征估计总体的数字特征. (2)在频率分布直方图中,纵轴表示频 组率 距,数据落在 各小组内的频率用 各小长方形的面积 表示.各 小长方形的面积总和等于 1.
请结合频率分布直方图提供的信息,解答下列问题:
.
(1)样本的容量是多少? (2)列出频率分布表; (3)成绩落在哪个范围内的人数最多?并求该小组的 频数、频率; (4)估计这次竞赛中,成绩不低于 60 分的学生占总人 数的百分比. 解 (1)由于各组的组距相等,所以各组的频率与各 小长方形的高成正比且各组频率的和等于 1,那么各 组的频率分别为116,136,166,146,126.设该样本容量 为 n,则6n=126,所以样本容量为 n=48.
《用样本估计总体第2课时》示范课教学设计【高中数学教案】

1.通过具体实例,学生体会样本与总体的关系,体验用样本的分布估计总体的分布.提升学生的直观想象素养.2.通过具体实例,探究“大数据”的应用,提升学生的数学运算素养.教学重点:样本的分布估计总体的分布和“大数据”的简单应用.教学难点:用样本“估计总体”,突出“用局部估计总体”的思想.PPT课件.一、整体概览问题1:阅读课本,回答下列问题:(1)本课时将要研究哪类问题?(2)本课时要研究的问题在数学中的地位是怎样的?师生活动:学生带着问题阅读课本,老师指导学生概括总结本课时的内容.预设的答案:(1)本节课要学的内容是用样本估计总体的第二课时,主要研究用样本的分部估计总体的分部。
(2)本节课之前统计的内容,可以归结为描述统计学的范畴,主要讨论的是怎样收集、整理和分析。
本课时的内容可以归结为推断统计学的范畴,主要讨论的是如何根据样本数据得到总体的信息,从而为相关的决策提供指导。
本小节的重点是帮助学生理解用样本的分布估计总体的分布,体会统计思想与确定性思维的差异。
设计意图:通过本节课内容的预习,让学生明晰下一阶段的学习目标,初步搭建学习内容的框架.引语:前面一节课,我们体会了可以用样本的数字特征估计总体的数字特征,那么,总体的分布是否也可以用样本的分布来近似刻画呢?(板书:用样本估计总体第二课时)二、探索新知问题2:通过对某中学1257名高一学生期中考试的数学成绩(具体数据参见课本85-87页)进行整理,可以得到如下数据,并由此可作出频率分布直方图和折线图,如图所示.分组频数频率[40,50)7 0.01[50,60)65 0.05[60,70)276 0.22[70,80)480 0.38[80,90)330 0.26[90,100)99 0.08师生活动:在附录的数据中抽取容量是100的样本,整理类似的表格,并制作频率分布直方图.学生分成2组,选用随机抽样的方法分别抽取容量是100的样本,分别记为样本A,样本B ,分别得到如下的频数、频率对应表,它们的频率分布直方图,借助信息技术完成相应任务.预设的答案:如果从上述问题中提到的数据中,抽取两个容量为100的样本(分别记为样本A,样本B),则可以得到如下频数、频率对应表,对应的频率分布直方图如下。
高考数学一轮复习 讲义统计教案

第十一讲 复习统计一、本讲进度《统计》复习 二、本讲主要内容1、本章内容是初中《统计初步》与高中《概率》内容的深入和扩展,对数理统计中要研究的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析,从而对总体的相应情况作出推断,作了初步的介绍。
几个基本名词:在统计中,考察对象的全体称为总体,总体中的每一个对象称为个体。
若记总体中N 个个体取值分别为x 1,x 2,…,x N ,则称)x x x (N1N 21+++=μ 为总体平均数(μ为N 个个体的算术平均数)若记])x ()x ()x [(N12N 22212μ-+μ-+μ-=σ ,则称σ2为总体方差,σ称为总体标准差。
初中《统计初步》的主要内容⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎨⎧⎩⎨⎧⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧→⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎪⎩⎪⎨⎧平均数样本平均数去估计总体样本容量等样本个体总体样本去估计总体频率分布从整体分布上描述标准差方差描述其被动大小中位数众数平均数描述集中趋势从特征数上描述描述一组数据的方法,,, 2、抽样方法的分类:按照抽取样本时总体中的每个个体被抽取的概率是否相等⎩⎨⎧不等概率抽样等概率抽样本章只研究等概率抽样 等概率抽样⎩⎨⎧不放回抽样放回抽样常用的三种抽样方法的比较:3、用样本的频率分布估计总体分布,分两种情况:(1)当总体中的个数体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图。
例如射击的环数,掷单粒骰子时出现的点数等;(2)当总体中的个体取不同值较多甚至无限时,此时需要对样本数据进行整理,其频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率。
画第二种情况频率分布图的步骤是: ①计算最大值与最小值的差; ②决定组距与组数;③决定分点,通常使分点比数据多一位小数,并且把第一小组的起点稍微减小一点; ④列出频率分布表; ⑤画出频率分布直方图频率分布将随着样本容量的增大而更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的概率密度曲线。
用样本估计总体》课时教学设计

用样本估计总体》课时教学设计本课主要介绍了用样本的频率分布来估计总体分布的方法。
首先通过讨论抽样方法和收集数据的目的来引出估计总体的两种手段:用样本的频率分布估计总体的分布和用样本的数字特征估计总体的数字特征。
然后介绍了频率分布直方图的作法,通过一个例子来说明如何采用抽样调查的方式得到本市的居民月均用水量,并用频率分布直方图来分析数据。
最后讨论了频率分布直方图的纵坐标为何取频率/组距的问题,得出结论:用矩形面积表示频率,总面积为1.本课的重点是会列频率分布表和画频率分布直方图,难点是能通过样本的频率分布估计总体的分布。
2.回顾:上节课我们研究了什么?样本数据分布的可视化方法有哪些?二、新知讲解:1.样本的数字特征1)众数:出现次数最多的数,可能有多个.2)中位数:将数据从小到大排列,位于中间的数.3)平均数:所有数据的总和除以数据的个数.2.样本数字特征的意义1)众数:反映数据的集中趋势,但容易受极端值影响.2)中位数:反映数据的集中趋势,不受极端值影响.3)平均数:反映数据的平均水平,但容易受极端值影响.3.样本数字特征对总体数字特征的估计1)众数:样本众数可以用来估计总体众数.2)中位数:样本中位数可以用来估计总体中位数.3)平均数:样本平均数可以用来估计总体平均数.4.样本数字特征的计算1)众数:出现次数最多的数.2)中位数:将数据从小到大排列,位于中间的数.3)平均数:所有数据的总和除以数据的个数.5.样本数字特征的比较1)众数、中位数、平均数的大小关系与数据的分布有关.2)当数据分布呈正态分布时,三者相等.3)当数据分布不对称时,三者大小关系为:众数<中位数<平均数.三、巩固练:1.练:计算以下数据的众数、中位数、平均数:12,15,18,20,20,25,28.2.作业:P72 3、4题,只计算数字特征.讨论:如何利用样本的频率分布直方图分析规律?下面给出一个图,试着分析。
2020年高三数学第一轮复习教案-统计-第二节 用样本估计总体

【知识必备】
知识点二 用样本的数字特征估计总体的数字特征 2.标准差和方差
平均数、方差的公式推广
(1)若数据 x1,x2,…,xn 的平均数为 x ,则 mx1+a,mx2+a,mx3
+a,…,mxn+a 的平均数是 m x +a. (2)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,
axn+b 的方差为 a2s2.
【典型例题】
【典型例题】
【典型例题】
【典型例题】
【典型例题】
【典型例题】
【典题演练】
【典题演练】
【典题演练】
【典题演练】
【作 业】
完成课时作业(五十九)
再见
第十一章 统计
第二节 用样本估计总体
【知识必备】
知识点一
用样本的频率分布估计总体分布 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.
【知识必备】
知识点一 用样本的频率分布估计总体分布
频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标. (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形 底边中点的横坐标之和. (3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
【知识必备】
知识点一 用样本的频率分布估计总体分布
3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数, 叶就是从茎的旁边生长出来的数.
n
众数通常用于描述变量的值 出现次数最多的数.但显然 它对其他数据信息的忽视使 它无法客观地反映总体特征 中位数等分样本数据所占频 率,它不受少数几个极端值 的影响,这在某些情况下是 优点,但它对极端值的不敏 感有时也会成为缺点 平均数与每一个样本数据有 关,可以反映出更多的关于 样本数据全体的信息,但平 均数受数据中的极端值的影 响较大,使平均数在估计总 体时可靠性降低
高考数学一轮复习 第十一章 统计 11.2 用样本估计总体课件 理

2021/12/8
第二页,共三十二页。
2.用样本的数字特征估计总体的数字特征
(1)众数,中位数,平均数
众数:在一组数据中,出现次数________的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或
者最中间两个数据的________)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即 x=______________.
第第十一一章章
集合统与常用逻计辑(luójí)用语
11.2 用样本估计(gūjì)总体
2021/12/8
第一页,共三十二页。
1.用样本的频率分布估计总体分布 (1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________ 估计总体的__________;另一种是用样本的________估计总体的__________. (2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用 ________________表示.各小长方形的面积总和等于________. (3) 连 接频率 分布 直方图中 各小 长方形 上端的 中点 ,就 得到频 率分 布 ________.随着样本容量的增加,作图时所分的________增加,组距减小,相 应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________, 它能够更加精细地反映出____________________________________. (4) 当 样本数 据较 少时,用 茎叶 图表示 数据的 效果 较好 ,它不 但可 以 ____________________,而且可以______________,给数据的记录和表示都带 来方便.
(3)s= s2= 1900=130,
高三数学一轮复习-第十一章-统计、统计案例第二节-用样估计总体课件

•1.10名工人某天生产同一零件,生产的件数 是 15,17,14,10,15,17,17,16,14,12 , 设 其 平 均 数 为a,中位数为b,众数为c,则有( )
•A.a>b>c
B.b>c>a
•C.c>a>b
D.c>b>a
10
解析:平均数 a=110(15+17+14+10+15+17+17+16 +14+12)=14.7.
•【方法探究】 当样本数据较少时,用茎叶 图表示数据的效果较好,它不但可以保留所有 信息,而且可以随时记录,这对数据的记录和 表示都非常方便,但当样本数据较多时,茎叶 图就显得不太方便了.因为数据较多时,枝叶 就会很长,需要占据较多的空间.
32
•提醒:当样本数据是两位有效数字,且样本 容量又不很大时,用茎叶图显得更容易、方便、 直观.
7
•3.样本的数字特征
8
•如何利用频率分布直方图估计样本的数字特征? •提示:(1)在频率分布直方图中,中位数左边和右边的直 方图的面积相等,由此可以估计中位数的值. •(2)平均数的估计值等于频率分布直方图中每个小矩形的 面积乘以小矩形底边中点的横坐标之和. •(3)众数:在频率分布直方图中,众数是最高的矩形的中 点的横坐标.
0 1 -1 0
102
-2
x′i乙2=(xi0
104
4
46
∴s 甲 2=110[(x′1 甲 2+x′2 甲 2+…+x′10 甲 2)-10 x ′甲 2] =110×(1+1+0+1+1+4+4+9+9+0-10×0) =110×30=3.0. s 乙 2=110(1+0+0+1+1+0+1+0+4+4-10×0) =1.2.
高考数学一轮复习第11章统计与统计案例2第2讲用样本估计总体教案理

第2讲 用样本估计总体1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. ②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:把a 1+a 2+…+a nn称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2] s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]3.与平均数和方差有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ; (2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1nx 2i -x -2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.( )(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( ) 答案:(1)√ (2)√ (3)× (4)√ (5)√(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月份D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A 错误.重庆市某年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()A .19B .20C .21.5D .23解析:选B.由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.(2018·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.解析:由茎叶图可知甲的平均数为19+18+20+21+23+22+20+31+31+3510=24.乙的平均数为19+17+11+21+24+22+24+30+32+3010=23.答案:24 23茎叶图[典例引领](2017·高考山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )A .3,5B .5,5C .3,7D .5,7【解析】 根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以56+62+65+74+(70+x )5=59+61+67+(60+y )+785,解得x =3.故选A .【答案】 A茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.[通关练习]1.(2018·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )A .117B .118C .118.5D .119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42, 将分数从小到大排列,中间两数为76,76,所以中位数为76, 所以此学生该门功课考试分数的极差与中位数之和为42+76=118.2.为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为( )A.100 B.160C.200 D.280解析:选B.由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.频率分布直方图(高频考点)频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下三个命题角度:(1)求样本的频率、频数;(2)求样本的数字特征;(3)与概率结合的问题.[典例引领]角度一求样本的频率、频数(2016·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56 B.60C.120 D.140【解析】由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.【答案】 D角度二 求样本的数字特征(2018·云南省11校跨区调研)为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x -和方差s 2(同一组中的数据用该组区间的中点值作代表).【解】 (1)组距d =5,由5×(0.02+0.04+0.075+a +0.015)=1得a =0.05. (2)各组中点值和相应的频率依次为x =30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,s 2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.角度三 与概率结合的问题(2018·东北四市高考模拟)某手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行打分,打分的频数分布表如下:给出结论即可);(2)根据评分的不同,运用分层抽样的方法从男性用户中抽取20名用户,再从这20名用户中满足评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数X 的分布列和数学期望.【解】 (1)女性用户和男性用户的频率分布直方图如图.由图可知女性用户评分的波动小,男性用户评分的波动大.(2)运用分层抽样的方法从男性用户中抽取20名用户,评分不低于80分的用户有6人,其中评分小于90分的有4人,从6人中任取3人,则X 的可能取值为1,2,3, P (X =1)=C 14C 22C 36=420=15,P (X =2)=C 24C 12C 36=1220=35,P (X =3)=C 34C 36=420=15.所以X 的分布列为E (X )=5+5+5=2.频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数. [提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.[通关练习]1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2018·武汉市武昌区调研考试)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x (吨),月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a 的值;(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由. 解:(1)由频率分布直方图,可得(0.08+0.16+a +0.40+0.52+a +0.12+0.08+0.04)×0.5=1, 解得a =0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85, 所以2.5≤x <3.由0.3×(x -2.5)=0.85-0.73,解得x =2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.样本数字特征的求解与应用[典例引领](1)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是( ) A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3 D .丁地:总体均值为2,总体方差为3(2)(2018·南昌模拟)若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________. (3)(2018·石家庄市教学质量检测(二))设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.【解析】 (1)根据标志,要求数据中每个个体不超过7.中位数与众数不能体现个体数据,无法确定.方差体现数据中个体的波动程度,若大于0,则无法确定.若均值为2,方差为3,假设∃x i ≥8,则s 2≥(x i -x -)210=6210>3,故假设不成立.(2)由1+2+3+4+m 5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.(3)设样本数据的平均数为x -,则y i =2x i -1的平均数为2x --1,则y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -+1)2]=4×12 017[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -)2]=4×4=16. 【答案】 (1)D (2)2 (3)16(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述. ②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)在计算平均数、方差时可利用平均数、方差的有关结论.[通关练习]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 解析:选C. x -甲=15(4+5+6+7+8)=6,x -乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.2.(2018·合肥市第二次教学质量检测)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是________.解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)25=30.8.答案:30.83.(2018·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩x -甲=68+76+79+86+88+956=82,学生乙的平均成绩x -乙=71+75+82+84+86+946=82,又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,则x -甲=x -乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.众数、中位数和平均数的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然. 易错防范(1)易忽视频率分布直方图中纵轴表示的应为频率组距.(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A .0.05 B .0.25 C .0.5D .0.7解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.(2018·广西三市第一次联考)在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )A .1B .2C .3D .4解析:选B.由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.3.(2018·岳阳模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )A .6万元B .8万元C .10万元D .12万元解析:选C.设11时到12时的销售额为x 万元,依题意有2.5x =0.100.40,解得x =10.4.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析:选A.由分组可知C ,D 一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.5.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( ) A .1 B .2 C .3D .4解析:选D.由题意这组数据的平均数为10,方差为2,可得:x +y =20,(x -10)2+(y -10)2=8,设x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8,得t 2=4,所以|x -y |=2|t |=4.6.(2018·湖南省五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是________.解析:由甲组学生成绩的平均数是88,可得70+80×3+90×3+(8+4+6+8+2+m +5)7=88,解得m =3.由乙组学生成绩的中位数是89,可得n =9,所以n -m =6. 答案:67.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为________.解析:根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.答案:68.(2018·成都市第二次诊断性检测)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1 ,那么这组数据的方差s 2可能的最大值是________.解析:由题意可设两个被污损的数据分别为10+a ,b ,(a ,b ∈Z ,0≤a ≤9),则10+a +b+9+10+11=50,即a +b =10,b =10-a ,所以s 2=15[(9-10)2+(10-10)2+(11-10)2+(10+a -10)2+(b -10)2]=15[2+a 2+(b -10)2]=25(1+a 2)≤25×(1+92)=32.8.答案:32.89.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a 、b 、c (2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=81100=0.81.(3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.10.(2017·高考北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.1.(2018·长春模拟)某销售公司为了解员工的月工资水平,从1 000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图:(1)试由此图估计该公司员工的月平均工资;(2)该公司的工资发放是以员工的营销水平为重要依据来确定的,一般认为,工资低于4 500元的员工属于学徒阶段,没有营销经验,若进行营销将会失败;高于4 500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资”“成熟员工工资”分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工若营销成功,将为公司赚得3万元,否则公司将损失1万元.试问在此次比赛中公司收入多少万元的可能性最大?解:(1)估计该公司员工的月平均工资为0.000 1×1 000×2 000+0.000 1×1 000×3 000+0.000 2×1 000×4 000+0.000 3×1 000×5 000+0.000 2×1 000×6 000+0.000 1×1 000×7 000=4 700(元). (2)抽取比为5100=120,从工资在[1 500,4 500)内的员工中抽出100×(0.1+0.1+0.2)×120=2人,设这两位员工分别为1,2;从工资在[4 500,7 500]内的员工中抽出100×(0.3+0.2+0.1)×120=3人,设这三位员工分别为A ,B ,C .从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),(A ,B ),(A ,C ),(B ,C ).两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A ,B ),(A ,C ),(B ,C ),概率为310;其中一人营销成功,一人营销失败,公司收入2万元,有以下6种不同的等可能结果:(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),概率为610=35;两人营销都失败,公司收入-2万元,即损失2万元,有1种结果:(1,2),概率为110.因为110<310<35,所以公司收入2万元的可能性最大.2.(2018·河北三市第二次联考)某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X 的分布列和均值.解:(1) x -甲 =18(7+9+11+13+13+16+23+28)=15,x -乙=18(7+8+10+15+17+19+21+23)=15,s 2甲=18[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132]=44.75,s 2乙=18[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P 1=38,P 2=12,两人失分均超过15分的概率为P 1P 2=316,X 的所有可能取值为0,1,2.依题意,X ~B (2,316),P (X =k )=C k 2(316)k (1316)2-k,k =0,1,2, 则X 的分布列为X 的均值E (X )=2×16=8.精美句子1、善思则能“从无字句处读书”。