第二节 用样本估计总体
第2节用样本估计总体

法二 (数据分布法)从茎叶图看,从小到大看,甲的每个数据都比乙对应的 数据小,所以甲的平均数较小;甲的数据在(70,80)内有3个,(80,90)内有2 个,90以上的有1个; 而乙的数据在(70,80)内有1个,(80,90)内有3个,90以上的有2个. 显然乙的数据分布较为集中,所以乙的方差较小.故选D.
第2节用样本估计总体
考纲展示 1.了解分布的意义和作用,能根据 频率分布表画频率分布直方图、 频率折线图、茎叶图,体会它们各 自的特点. 2.理解样本数据标准差的意义和 作用,会计算数据标准差. 3.能从样本数据中提取基本的数 字特征(如平均数、标准差),并做 出合理的解释.
4.会用样本的频率分布估计总体分 布,会用样本的基本数字特征估计总 体的基本数字特征,理解用样本估计 总体的思想. 5.会用随机抽样的基本方法和样本 估计总体的思想解决一些简单的实 际问题.
用茎叶图表示数据的优点是(1)所有的信息都
4.样本的数字特征
数
字 特
定义
征
特点
在一组数据中出 体现了样本数据的最大集中点,
现次数最多的数 不受极端值的影响,而且可能不
据
唯一
将一组数据按大 小顺序依次排列, 处在最中间位置 中位数不受极端值的影响,仅利
反映了各个样本数据聚集
标准差是样本数据到 于样本平均数周围的程度
(A)该校九年级学生1分钟仰卧起坐的次数的中位数为26.25 (B)该校九年级学生1分钟仰卧起坐的次数的众数为27.5 (C)该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320 (D)该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应 的数值,是26.25,故A对;众数是最高矩形的中间值27.5,故B对;1分钟仰卧 起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30 的人数为320,故C对;1分钟仰卧起坐的次数少于20的频率为0.1,所以估 计1分钟仰卧起坐的次数少于20的人数为160,故D错.故选D.
用样本估计总体课件(第2课时)课件

提高代表性的方法
随机抽样、加大样本量、分层抽 样等。
03 样本的获取方法
随机抽样
01
02
03
简单随机抽样
每个样本单位被选中的概 率相等,适合样本量小的 情况。
分层随机抽样
将总体分成若干层,再从 各层中随机抽取一定数量 的样本单位。
系统随机抽样
将总体中的样本单位按一 定顺序排列,再按照固定 的间隔进行随机抽取。
以及样本数据的准确性。
比例估计在市场调查、民意调 查等领域应用广泛。
回归估计
回归估计是另一种常用的统计推断方 法,通过建立回归模型来估计总体参 数。
在进行回归估计时,需要选择合适的 自变量、建立合适的回归模型,并对 模型进行检验和调整。
回归估计的基本思想是利用已知的自 变量和因变量之间的关系,通过回归 分析来预测因变量的值。
定义
01
非抽样误差是由于除抽样之外的其他因素引起的误差,如测量
误差、系统偏差等。
产生原因
02
由于非随机因素导致样本与总体之间存在偏差。
控制方法
03
提高测量精度、消除系统偏差等,以减少非抽样误差的影响。
误差的来源与控制
抽样误差和非抽样误差是样本估计总体过程中常见的误 差来源。
控制非抽样误差的方法包括提高测量精度、消除系统偏 差等。
经济研究应用
总结词
经济研究中,样本估计总体被广泛应用于宏观经济数据的统计和分析。
详细描述
通过收集部分企业的财务数据、生产数据等,利用样本数据来估计和预测整体经 济的运行状况,如GDP、失业率、通货膨胀率等。这种方法可以帮助政府和决策 者了解经济形势、制定经济政策,促进经济发展和社会稳定。
第二节 用样本估计总体-高考状元之路

第二节 用样本估计总体预习设计 基础备考知识梳理1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用 估计总体的分布,另一种是用 估计总体的数字特征.(2)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用 表示.各小长方 形的面积总和2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图.(2)总体密度曲线:随着 的增加,作图时 增加, 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点用茎叶图表示数据有两个突出的优点: 一是从统计图上没有 的损失,所有的 都可以从茎叶图中得到; 二是茎叶图可以在比赛时 方便记录与表示.4.标准差和方差(1)标准差是样本数据到平均数的一种(2)标准差:=s(3)方差:=2sn x (是样本数据,砚是样本容量,x 是样本平均数). 5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积 ,由此可以估计中位数的值.(2抨均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的(3)众数:在频率分布直方图中,众数是最高的矩形的中点的典题热身1.已知一个样本中的数据为..0,15.0,13.0,15.0,12.0,14.0,13.0,16.0,15.0,17.0则该样本的众数、中位数分别是( )15.0,14.0.A 14.0,15.0.B 15.0,15.0.C 145.0,15.0.D答案:D2.已知一个样本中的数据为,5,4,3,2,1那么该样本的标准差为( )1.A2.B3.C 2.D答案:B3.(2011.潍坊模拟)甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如下图所示,若甲、乙两人的平均成绩分别,乙甲、X X 则下列结论正确的是 ( );.乙甲X X A < 乙比甲成绩稳定;.乙甲X X B >甲比乙成绩稳定乙甲X X C >.乙比甲成绩稳定;.乙甲X X D <甲比乙成绩稳定答案:A4.一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为 答案:205.为了了解某地区高三学生身体发育情况,抽查了该地区100名年龄在17.5岁~18岁的男生体重(kg),得到频率分布直方图如下图所示.则样本数据落在[62.5,64.5)内的频率是 .这100名学生的体重的众数是答案:14.0 5.65课堂设计 方法备考题型一 频率分布直方图的绘制与应用【倒1】为了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1 m)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.(1)请将频率分布直方图补充完整,(3)若成绩在8.0 m 以上(含8.0 m)的为合格,试求这次铅球黼试的成绩的合格率.题型二 茎叶图的应用【例2】在某电脑杂志的一篇文章中,每个句子的字数如下:,15,25,14,27,36,19,20,24,26,15,18,27,23,17,3,28,101.17,27,24,11,22在某报纸的一篇文章中,每个句子中所含的字的个数如下:,22,13,27,41,36,12,35,27,33,41,32,19,28,24,33,39,27.22,32,46,18,23(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?题型三 用样本的数字特征估计总体的数字特征【例3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价,技法巧点(1)用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用,在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致,通过频率分布表和频率分布直方图可以对总体作出估计.(2)几种表示频率分布的方法的优点与不足:①频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便. ②频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
第九章 第二节 用样本估计总体

4.(2010·安徽高考 某市 . 安徽高考)某市 安徽高考 某市2010年4月1日~4月30日对空气污 年 月 日 月 日对空气污 染指数的监测数据如下(主要污染物为可吸入颗粒物 : 染指数的监测数据如下 主要污染物为可吸入颗粒物): 主要污染物为可吸入颗粒物 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86, 81,83,82,82,64,79,86,85,75,71,49,45.
本题条件不变, 本题条件不变,由频率分布表与频率分布直方图能否判 断本月对空气污染指数的监测的数据众数和中位数落在 哪个小组内? 哪个小组内? 解:由频率分布表及直方图可判断众数和中位数均在 [81,91]这一组内,证明该市空气质量基本良好. 这一组内,证明该市空气质量基本良好. 这一组内
[归纳领悟 归纳领悟] 归纳领悟 1.频率分布表和频率分布直方图是一组数据频率分布的两 . 种形式,前者准确,后者直观. 种形式,前者准确,后者直观. 频率 2.频率分布直方图中横坐标表示组距,纵坐标表示 .频率分布直方图中横坐标表示组距, , 组距 频率 频率=组距× . 频率=组距× 组距 3.频率分布直方图中各小长方形的面积之和为 .频率分布直方图中各小长方形的面积之和为1.
[究 疑 点] 究 1.在频率分布直方图中,中位数、众数与平均数如何确定? .在频率分布直方图中,中位数、众数与平均数如何确定? 提示:在频率分布直方图中, 提示:在频率分布直方图中,中位数左边和右边的直 方图的面积相等,由此可以估计中位数的值, 方图的面积相等,由此可以估计中位数的值,而平均 数的估计值等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和. 乘以小矩形底边中点的横坐标之和.众数是最高的矩 形的中点的横坐标. 形的中点的横坐标. 2.频率分布直方图中纵轴的含义是频率吗? .频率分布直方图中纵轴的含义是频率吗? 提示:不是.表示的是频率 组距 组距. 提示:不是.表示的是频率/组距.
高考数学第一轮知识点总复习 第二节 用样本估计总体

平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
第2节 用样本估计总体

第2节用样本估计总体考试要求 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识梳理1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是 s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].[常用结论与微点提醒]1.频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n+a 的平均数是mx -+a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.诊 断 自 测1.判断下列结论正误(在括号内打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积=组距×频率组距=频率.(4)错误.茎相同的数据,相同的数据叶要重复记录,故(4)错误. 答案 (1)√ (2)× (3)√ (4)×2.(老教材必修3P100T2(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A.4B.8C.12D.16解析 设频数为n ,则n 32=0.25,∴n =32×14=8. 答案 B3.(老教材必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数是91+922=91.5,平均数x-=87+89+90+91+92+93+94+968=91.5.答案 A4.(一题多解)(2019·全国Ⅲ卷)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8解析法一设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.法二用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.答案 C5.(一题多解)(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析法一设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.法二因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.答案 A6.(2019·江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.解析这组数据的平均数为8,故方差为s2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.答案5 3考点一频率分布直方图【例1】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90].并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60.所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 规律方法 1.频率分布直方图的性质.(1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)小长方形的高=频率组矩,所有小长方形的高的和为1组距.2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.【训练1】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100] 频数281410 6地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户和满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.考点二茎叶图及其应用【例2】(1)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的.①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是()A.①②③B.②③④C.①②④D.①③④(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________.解析(1)由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率p1=510=12,女生平均每天锻炼时间超过65分钟的概率p2=410=25,p1>p2,因此④正确.设男生、女生两组数据的平均数分别为x-男,x-女,标准差分别为s男,s女.观察茎叶图,男生数据分布偏下,女生数据分布偏上,可知x-男>x-女,②正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s男<s女,③错误,因此符合茎叶图所给数据的结论是①②④.(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人.抽到的7人的编号为3,8,13,18,23,28,33,成绩为133,138,141,143,145,148,153,平均成绩是17×(133+138+141+143+145+148+153)=143.答案(1)C(2)143规律方法 1.茎叶图的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息. 【训练2】 (1)(2020·长春质量监测)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A.95,94B.92,86C.99,86D.95,91(2)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为x -甲,x -乙,标准差分别为s 甲,s 乙,则( )A.x -甲<x -乙,s 甲>s 乙B.x -甲<x -乙,s 甲<s 乙C.x -甲>x -乙,s 甲>s 乙D.x -甲>x -乙,s 甲<s 乙解析 (1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86.故选B.(2)观察茎叶图,甲数据分布偏上,乙数据分布偏下,可知x -甲<x -乙,从数据的集中程度上看,有s 甲>s 乙.答案 (1)B (2)A考点三 样本的数字特征【例3】 (1)(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差 (2)(2020·济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2 (3)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.解析 (1)中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.(2)由题意得加入一个新的数据后平均数x -=18×(7×4+4)=4,方差s 2=18×[7×2+(4-4)2]=74<2.(3)依题意,x 1,x 2,x 3,…,x 10的方差s 2=64.则数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.答案 (1)A (2)A (3)16规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【训练3】(2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x=0.05,∴x=120.(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,∴a =953≈32,则中位数为32.(3)(ⅰ)5个年龄组成绩的平均数为x -1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6. 5个职业组成绩的平均数为x -2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).A 级 基础巩固一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45B.50C.55D.60 解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n =150.3=50.答案 B2.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数解析刻画评估这种农作物亩产量稳定程度的指标是标准差.答案 B3.(2019·合肥二模)下表是某电器销售公司2018年度各类电器营业收入占比和净利润占比统计表:A.该公司2018年度冰箱类电器销售亏损B.该公司2018年度小家电类电器营业收入和净利润相同C.该公司2018年度净利润主要由空调类电器销售提供D.剔除冰箱类电器销售数据后,该公司2018年度空调类电器销售净利润占比将会降低解析对于选项A,由统计表知冰箱类净利润占比为-0.48%,所以冰箱类电器销售亏损,所以A中判断正确;对于选项B,由统计表知,小家电类电器营业收入占比和净利润占比均为3.82%,但在总的营业收入和总的净利润未知的情况下,无法得到营业收入和净利润相同,所以选项B中判断不正确;对于选项C,由统计表知,空调类的净利润占比为95.80%,所以该电器销售公司的净利润主要由空调类电器销售提供,所以选项C中判断正确;对于选项D,剔除冰箱类销售数据后,总的净利润增加了,而空调类销售总利润没变,所以空调类电器销售净利润占比将会降低,选项D中判断正确,故选B. 答案 B4.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为()A.1B.2C.3D.4解析由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,设污染数字为x,则(30+x)+342=33,x=2,则被污染的数字为2.答案 B5.(2020·成都诊断)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.答案 C二、填空题6.(2019·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.解析 经停该站高铁列车所有车次的平均正点率的估计值为x -=10×0.97+20×0.98+10×0.9910+20+10=0.98. 答案 0.987.(2019·马鞍山质检)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________.解析 设除中间一个小矩形外的(n -1)个小矩形面积的和为p ,则中间一个小矩形面积为13p ,p +13p =1,p =34,则中间一个小矩形的面积等于13p =14,200×14=50,即该组的频数为50.答案 508.(2020·珠海摸底)气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于22 ℃”,现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8. 则肯定进入夏季的地区的序号为________.解析 由统计知识,①甲地:5个数据的中位数为24,众数为22,可知①符合题意;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27可知其不满足连续5天的日平均温度不低于22 ℃,所以不符合题意; ③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若某一天的气温低于22 ℃,此时则取21 ℃,总体方差就大于10.8.所以满足题意. 答案 ①③三、解答题9.(2020·福州一模)为了解某知名品牌两个不同型号手机M9,M10的待机时间(单位:小时),淮北某手机卖场从仓库中随机抽取M9,M10两种型号的手机各6台,在相同的条件下进行测试,统计结果如图:(1)根据茎叶图计算M9,M10两种型号手机的平均待机时间;(2)根据茎叶图判断M9,M10两种型号被测试手机待机时间方差的大小,并说明理由.解 (1)根据茎叶图中的数据,计算M9型号手机的平均待机时间为x -M9=16×(56+69+65+70+76+84)=70(小时),M10型号手机的平均待机时间为x -M10=16×(79+72+70+80+81+80)=77(小时). (2)M9手机待机时间方差大于M10手机待机时间方差.理由:M9的数据分布比较分散,波动较大;M10的数据分布比较集中,波动较小.10.在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图.若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解 学生甲的平均成绩x -甲=68+76+79+86+88+956=82, 学生乙的平均成绩x -乙=71+75+82+84+86+946=82, 又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,则x -甲=x -乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.B 级 能力提升11.(2019·大连模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,20B.200,20C.200,10D.100,10解析 由题图可知总学生数是10 000人,样本容量为10 000×2%=200人,高中生2 000×2%=40人,由乙图可知高中生近视率为50%,所以人数为40×50%=20,选B.答案 B12.(2020·郑州调研)区域经济变化影响着人口的流动,下图为过去某连续5年各省、自治区及直辖市(不含港澳台)人口增长统计图.某连续5年各省、自治区及直辖市(不含港澳台)人口增长统计图根据图中的信息,下面结论中不正确的是()A.广东人口增量最多,天津增幅最高B.黑龙江无论是增量还是增幅均居末尾C.天津、北京、重庆和上海四大直辖市增幅均超过5%D.人口增量超过200万的省、自治区或直辖市共有7个解析对于A,由图知广东5年人口增加超过400万,增量最多,天津增幅达到了19.2%,增幅最高,A正确;对于B,由图易知正确;对于C,上海的人口增幅为4.9%,未超过5%,不正确;对于D,人口增量超过200万的省或直辖市有天津、北京、重庆、广东、河北、湖南和山东,正确.综上选C.答案 C13.(2019·湘东五校联考)已知等差数列{a n}的公差为d,若a1,a2,a3,a4,a5的方差为8,则d的值为________.解析依题意,由等差数列的性质得a1,a2,a3,a4,a5的平均数为a3,则由方差公式得12+(a2-a3)2+(a3-a3)2+(a4-a3)2+(a5-a3)2]=8,所以d=5×[(a1-a3)±2.答案±214.某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率的和为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即当w=3时,该市居民该月的人均水费估计为10.5元.C级创新猜想15.(多填题)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案(1)0.04(2)440。
必修三2.2.用样本估计总体(教案)

必修三2.2.用样本估计总体(教案)必修三2.2.用样本估计总体(教案)导语:本文为必修三2.2.用样本估计总体(教案)的教学指南,旨在引导学生了解和应用样本估计总体的方法。
通过学习本课,学生将能够理解抽样和样本的基本概念,并能够运用点估计和区间估计的方法进行总体参数的估计。
为了达到良好的教学效果,本教案采用了多样的教学方法,例如引导讨论、示例演示和小组合作等。
一、教学目标:1. 理解样本与总体的概念和关系;2. 掌握点估计的方法;3. 了解区间估计的原理和应用;4. 能够进行样本估计总体的实际问题分析。
二、教学过程:1. 导入(5分钟)引导学生思考以下问题:什么是样本?什么是总体?样本和总体之间有什么关系?为什么需要用样本来估计总体?2. 点估计的方法(15分钟)a. 讲解点估计的基本原理,即通过样本数据来估计总体参数的值。
b. 示例演示:设计一个问题,如某班级数学考试成绩的平均分。
用班级中的五位同学的成绩作为样本,通过计算样本的平均分来估计全班的平均分。
c. 引导学生讨论点估计的优点和缺点。
3. 区间估计的方法(15分钟)a. 讲解区间估计的概念和原理,即通过样本数据构造一个置信区间来估计总体参数的范围。
b. 示例演示:使用同样的例子,构造一个置信水平为95%的置信区间,来估计全班的平均分。
c. 引导学生讨论区间估计的优点和缺点。
4. 实际问题分析(25分钟)a. 设计一个实际问题,例如某个城市的人均收入。
要求学生提出估计该城市人均收入的方法和步骤,并结合点估计和区间估计的方法进行分析。
b. 小组合作:分组讨论,每个小组根据实际问题设计一个解决方案,并准备向全班汇报。
c. 汇报与讨论:每个小组轮流汇报他们的解决方案,并进行讨论。
5. 总结与延伸(10分钟)a. 概括本课内容,强调样本估计总体的方法和应用。
b. 提出延伸问题,鼓励学生进一步探索样本估计总体的其他应用领域。
三、教学反思:本节课通过引导讨论、示例演示和小组合作等多种教学方法,促使学生自主思考和应用样本估计总体的方法。
28.2 用样本估计总体

编号,从中任意抽取3个班级,向这3个班级的所有学生做调查.你认为调查具
有随机性的是( D )
A.① B.②
C.③ D.④
素材来源于网络,林老师搜集编辑整理
3
3.(5分)随机抽样不具有的性质是( D ) A.抽得的样本具有随机性 B.抽得的样本具有代表性 C.抽得的样本具有广泛性 D.抽得的样本具有偏向性
2.由简单随机抽样获得样本容量较大的样本,可以用样本__平均数__、样 本__方差__估计总体__平均数__和总体__方差__.
素材来源于网络,林老师搜集编辑整理
2
简单随机抽样
1.(5分)下列抽样方法是随机抽样的是( A )
A.为了解刚生产的零件的质量情况,从每一个包装箱内抽5个加以检查
B.为了解全市学生的身高情况,以一、三中的学生为代表进行考察
C.为了解小学生的视力情况,选中六年级20名学生进行调查
D.为了解某地区的车流量,记录某一红绿灯处早上8:00至9:00的车流量
2.(5分)为了了解某中学(共有3个年级,每年级6个班)学生完成作业情况,
可采用下列方式进行调查:①向3个年级每个班级的班长做调查;②向3个年级
每个班的学习委员做调查;③向各班级每班前10名学生做调查;④将18个班级
九年级数学上册(北师版)
第二十八章 样本与总体
第二节 用样本估计总体
1.抽样调查时,为使样本具有__代表性__,不偏向总体中的某些个体,可 采用一个对每个个体都公平的方法,那就是用__抽签__的办法决定哪些个体进
入样本.这种抽样方法称为简单的随机抽样.抽样之前,我们不能预测到哪些 个体会被抽中,因此抽样结果具有__随机性__.
素材来源于网络,林老师搜集编辑整理
5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所分的组数 增
加, 组距 减小,相应的频率折线图会越来越接近于一条光滑曲线, 统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的优点 茎叶图的优点是可以 保留 原始数据,而且可以 随时 记录,这 对数据的记录和表示都能带来方便.
2.样本的数字特征 (1)众数、中位数、平均数
数字特征 定义与求法 一组数据中重复出现次数 最多 的数 把一组数据按 从小到大的 中位数 优点与缺点 众数通常用于描述变量的值出现次数最多的 数. 但显然它对其他数据信息的忽视使得无法客 观地反映总体特征 中位数等分样本数据所占频率, 它不受少数几个
3.如图是 100 位居民月均用水量的频率分布直方图,则 月均用水量为[2,2.5)范围内的居民数有________人.
答案:25
4.一个容量为 200 的样本的频率分布直方图如图所示, 则样本数据落在[5,9)内的频率和频数分别为________.
答案:0.2
40
5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶 5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎
图表示,从茎叶图的分布情况看, ________运动员的发挥更稳定 . 表示,从茎叶图的分布情况看, ________ 运动员的发挥更稳定
答案:乙
6.将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低 分, 7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后 来有 1 个数据模糊,无法辨认,在图中以 x 表示:
B.84,85
C.86,84
D.84,86
解析:选 A 由图可知,去掉一个最高分和一个最低分后, 所剩数据为 84,84,84,86,87. 84+84+84+86+87 ∴平均数为 =85,众数为 84. 5
2.若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所 示,则这组数据的中位数和平均数分别是( )
A.91.5 和 91.5
B.91.5 和 92
C.91 和 91.5 D.92 和 92
解析:选 A
将这组数据从小到大排列,得
91+92 87,89,90,91,92,93,94,96.故中位数为 =91.5. 2 87+89+90+91+92+93+94+96 - 平均数为 x = =91.5. 8
36 答案: 7
典题 1]
[典题 1]
(1)(2015· 新课标全国卷Ⅱ)根据下面给出的 2004 年
(1)(2015· 新课标全国卷Ⅱ)根据下面给出的 2004 年
3 年我国二氧化硫年排放量 (单位:万吨 柱形图,以下结论 至 2013 年我国二氧化硫年排放量 (单位:万吨)) 柱形图,以下结论
1.频率分布直方图和茎叶图 (1)作频率分布直方图的步骤 ①求极差(即一组数据中 最大值 与最小值 的差); ②决定 组距 与 组数 ; ③将数据 分组 ; ④列 频率分布表 ; ⑤画 频率分布直方图 .
(2)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端 的 中点 ,就得到频率分布折线图. ②总体密度曲线:随着样本容量的增加,作图时
)
中不正确的是 正确的是 ( )(
A.逐年比较,2008 年减少二氧化硫排放量的效果最显著 B.2007 年我国治理二氧化硫排放显现成效 C.2006 年以来我国二氧化硫年排放量呈减少趋势 D.2006 年以来我国二氧化硫年排放量与年份正相关
年度的消费情况进行统计,发现消费金额 ( 单位:万元 ) 都 [0.3,0.9]内,其频率分布直方图如图所示. ①直方图中的 a=________; [0.3,0.9] 内,其频率分布直方图如图所示.
②区间 [0.3,0.5) 内的频率为 0.1×1.5 + 0.1×2.5 = 0.4 ,故 [0.5,0.9]内的频率为 1-0.4=0.6. 因 此 , 消 费 金 额 在 区 间 [0.5,0.9] 内 的 购 物 者 的 人 数 为 0.6×10 000=6 000. (3) 月工资收入落在 (30,35]( 百元 ) 内的频率为 1 - (0.02 + 0.04+0.05+0.05+0.01)×5=1-0.85=0.15,则 0.15÷ 5=0.03, 所以各组的频率比为 0.02 ∶ 0.04 ∶ 0.05 ∶ 0.05 ∶ 0.03 ∶ 0.01 = 3 2∶4∶5∶5∶3∶1,所以(30,35](百元)月工资收入段应抽出 20 ×100=15(人).
答案:(1)D
(2)①3
②6 000
(3)15
1.绘制频率分布直方图时需注意: (1)制作好频率分布表后, 可以利用各组的频率之和是 否为 1 来检验该表是否正确; 频率 (2)频率分布直方图的纵坐标是 ,而不是频率. 组距
2. 由频率分布直方图进行相关计算时, 需掌握下列关系式: 频率 (1) ×组距=频率; 组距 频数 频数 (2) =频率,此关系式的变形为 =样本容量, 样本容量 频率 样本容量×频率=频数.
考纲要求: 1.了解分布的意义和作用,会列频率分布表,会画频率分布直 方图、频率折线图、茎叶图,理解它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(平均数、标准差),并 给出合理解释. 4.会用样本的频率分布估计总体的分布,会用样本的基本数 字特征估计总体的基本数字特征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些 简单的实际问题.
人做电话询访,则(30,35](百元)月工资收入段应抽出 ________人.
中抽出 100 _______ 人.
[听前试做]
(1)对于 A 选项,由图知从 2007 年到 2008 年二
氧化硫排放量下降得最多,故 A 正确.对于 B 选项,由图知,由 2006 年到 2007 年矩形高度明显下降, 因此 B 正确. 对于 C 选项, 由图知从 2006 年以后除 2011 年稍有上升外,其余年份都是逐年 下降的,所以 C 正确.由图知 2006 年以来我国二氧化硫年排放 量与年份负相关,故选 D. (2) ① 由 0.1×1.5 + 0.1×2.5 + 0.1a + 0.1×2.0 + 0.1×0.8 + 0.1×0.2=1,解得 a=3.
(2)标准差、方差 ①标准差:样本数据到平均数的一种平均距离,一般用 s 表 示,s= 1 -2 -2 -2 [ x 1- x +x2- x +„+xn- x ]. n
②方差:标准差的平方 s2 1 s = n [(x1 - - x )2 + (x2 - - x )2 +„+ (xn - - x )2] ,其中 xi(i =
答案:(1)A
在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个 图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶 的含义.
1.如图是 2015 年某大学自主招生面试环节中,七位评 委为某考生打出的分数的茎叶统计图, 去掉一个最高分和一 个最低分后,所剩数据的平均数和众数依次为( )
Байду номын сангаас
A.85,84
调查结果画出如图所示的频率分布直方图,为了了解工薪
(3)某地政府调查了工薪阶层 1 000 人的月工资收入,并根据 调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对
月工资收入的满意程度,要用分层抽样的方法从调查的 1
中抽出 100 人做电话询访,则(30,35](百元)月工资收入段 月工资收入的满意程度,要用分层抽样的方法从调查的 1 000 人
(3)×
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标 是众数. ( √ ) (5)× (3) × (4)
(6)√
(5)在频率分布直方图中, 众数左边和右边的小长方形的面积 和是相等的. ( × ) (2)√ 答案:(1)
(3)×
(4)√
(5)×
(6)√
(6)一组数据的方差越大,说明这组数据的波动越大. ( √ ) (5) 答案:(1)× (2)√ (3)× (4)
②在这些购物者中,消费金额在区间 [0.5,0.9]内的购物者的人数 为________ . 为________. (2)(2015· 湖北高考)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额 ( 单位:万元 ) 都在区间
②在这些购物者中,消费金额在区间 [0.5,0.9]内的购物者 ①直方图中的 a=________;
则 7 个剩余分数的方差为________.
解析:由图可知去掉的两个数是 87,99,所以 87+ 90×2+91×2+94+90+x =91×7, 解得 1 2 x =4.s = [(87 7
-91)2 +(90- 91)2×2+ (91-91)2×2+(94- 91)2×2] = 36 . 7
众数
顺序排列,处在 中间 位置的一 极端值的影响,这在某些情况下是优点,但它对 个数据(或两个数据的平均数) 如果有 n 个数据 x1,x2,„, 极端值的不敏感有时也会成为缺点 平均数与每一个样本数据有关, 可以反映出更多
平均数
但平均数受数据中 x n, 那么这 n 个数的平均数 x = 的关于样本数据全体的信息, x1+x2+„+xn n 的极端值的影响较大, 使平均数在估计总体时可 靠性降低
2
1,2,3,„,n)是样本数据 ,n 是样本容量 ,- x 是样本平均数 .
(3)平均数、方差公式的推广 若数据 x1,x2,„,xn 的平均数为- x ,方差为 s2,则 数据 mx1+a,mx2+a,„,mxn+a 的平均数为 m- x +a, 方差为 m2s2.
[自我查验] 1. 判断下列结论的正误. (正确的打“√”, 错误的打“×”) (1)在频率分布直方图中,小矩形的高表示频率. ( × ) (2)√ 答案:(1) (2)频率分布直方图中各个长方形的面积之和为 1.( √ ) (5)× 答案:(1)× (2)√ (3)× (4) (3)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从 小到大的顺序写,相同的数据可以只记一次. ( × ) (2)√ 答案:(1)