高考数学一轮复习配餐作业63用样本估计总体含解析理38

合集下载

2023年高考数学(理科)一轮复习——用样本估计总体

2023年高考数学(理科)一轮复习——用样本估计总体
第十章 算法初步、统计与统计案例
索引
考试要求
1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、 频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据 标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样 本的频率分布估计总体的频率分布,会用样本的基本数字特征估计 总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽 样的基本方法和样本估计总体的思想解决一些简单的实际问题.
B地区用户满意度评分的频率分布直方图
图②
索引
解 作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度 评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比 较集中,而A地区用户满意度评分比较分散.
索引
(2)根据用户满意度评分,将用户和满意度分为三个等级:
∴这 100 名参赛者得分的中位数为 60+0.50-.30.4×10≈63.3,故 C 错误.
索引
考点二 统计图表及应用 角度1 扇形图
例2 (2022·郑州模拟)某高中为了解学生课外知识的积累情况,随机抽取200名同 学参加课外知识测试,测试共5题道,每答对一题得20分,答错得0分.已知每 名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,
满意度评分 低于70分 70分到89分 不低于90分
满意度等级 不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”; CB表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大.

人教版高中数学高考一轮复习--用样本估计总体(课件)

人教版高中数学高考一轮复习--用样本估计总体(课件)
2.在实际问题中,总体平均数、总体方差和总体标准差都是未知的,一般用
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2

高三数学一轮复习统计统计案例用样本估计总体

高三数学一轮复习统计统计案例用样本估计总体

据分组如[1下.3表4,1:.38)
25
[1.38,1.42)
30
[1.42,1.46)
29
[1.46,1.50)
10
[1.50,1.54]
2
•(1) 列 出 频 率 分 布 表 , 并 画 出 频 率 分 布 直 方 图.
•(2)估计纤度落在[1.38,1.50)中的概率及纤度 小于1.40的概率是多少.
•3.新课标地区(如广东、宁夏、海南等省份)也 常以频率分布直方图为工具结合现实生活出一 道应用大题,属于中档题目.
•1.作频率分布直方图的步骤
•2.频率分布折线图和总体密度曲线
•(1)频率分布折线图:连接频率分布直方图中 各小长方形上端的 中点, 就 得 频 率 分 布 折 线 图.
•(2)总体密度曲线:随着样本容量 的 增 加 , 作 图 时
所分组数 增加, 组距 减 小 ,相应的频率折线
图会越来越接近于一条光滑曲线,即总体密度 曲线.
•3.样本的数字特征
•如何利用频率分布直方图估计样本的数字特征?
•提示:(1)在频率分布直方图中,中位数左边和右边的直 方图的面积相等,由此可以估计中位数的值.
•(2)平均数的估计值等于频率分布直方图中每个小矩形的 面积乘以小矩形底边中点的横坐标之和.
从左到右各小长方形面积之比为
2∶4∶17∶15∶9∶3,第二小组频本容量是多少?
•(2)若次数在110以上(含110次)为达标,试估 计该学校全体高一学生的达标率是多少?
•(3)在这次测试中,学生跳绳次数的中位数落 在哪个小组内?请说明理由.
【思路导引】
解析:由题意知 x=6,则平均数为
x =-1+0+4+ 6 6+7+14=5,

2020版高考数学(文)一轮复习用样本估计总体

2020版高考数学(文)一轮复习用样本估计总体

第二节用样本估计总体 一、基础知识批注——理解深一点1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义 (1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数一组数据的算术平均数即为这组数据的平均数,n 个数据x 1,x 2,…,x n 的平均数x =1n (x 1+x 2+…+x n ).5.样本的数字特征如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的 (1)平均数x =1n (x 1+x 2+…+x n ). (2)标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (3)方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].二、常用结论汇总——规律多一点1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m x+a.(2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b的方差为a2s2.三、基础小题强化——功底牢一点(一)判一判(对的打“√”,错的打“×”)(1)在频率分布直方图中,小矩形的高表示频率.()(2)频率分布直方图中各个长方形的面积之和为1.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(5)一组数据的方差越大,说明这组数据的波动越大.()答案:(1)×(2)√(3)×(4)√(5)√(二)选一选1.某便利店记录了100天某商品的日需求量(单位:件),整理得下表:A.16件B.16.2件C.16.6件D.16.8件解析:选D由题意可知,日平均需求量为14×0.1+15×0.2+16×0.3+18×0.2+20×0.2=16.8(件).2.(2019·长春监测)已知某班级部分同学某次测验成绩的茎叶图如图所示,则其中位数和众数分别为()A.92,94 B.92,86C.99,86 D.95,91解析:选B由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,故中位数为92,众数为86.故选B.3.样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其方差为( )A.105 B.305C. 2 D .2解析:选D 依题意得m =5×1-(0+1+2+3)=-1,则样本方差s 2=15×[(-1)2+02+12+22+(-2)2]=2,即所求的样本方差为2.(三)填一填4.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以年龄小于45岁的共有80×0.6=48(人).答案:485.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.答案:0.1考点一 茎叶图[典例] (2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7[解析] 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.[答案] A[解题技法] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.[题组训练]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为() A.1 B.2C.3 D.4解析:选B由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.2.甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x甲,x乙,则下列结论正确的是()A.x甲<x乙;乙比甲得分稳定B.x甲>x乙;甲比乙得分稳定C.x甲>x乙;乙比甲得分稳定D.x甲<x乙;甲比乙得分稳定解析:选A因为x甲=2+7+8+16+225=11,x乙=8+12+18+21+255=16.8,所以x甲<x乙且乙比甲成绩稳定.考点二频率分布直方图[典例]某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得x =0.007 5.即直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5, (0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5, ∴月平均用电量的中位数在[220,240)内.设中位数为a ,则0.45+0.012 5×(a -220)=0.5,解得a =224,即中位数为224. [变透练清]1.某校随机抽取20个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是( )解析:选A 以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项A 中的图.2.(变结论)在本例条件下,在月平均电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取________户.解析:月平均用电量在[220,240)的用户有0.012 5×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280]的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为1125+15+10+5=15.所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).答案:53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由. 解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a , 解得a =0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12= 36 000=3.6(万).[解题技法]考点三样本的数字特征考法(一)样本的数字特征与频率分布直方图交汇[典例](2019·辽宁师范大学附属中学模拟)某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是()A.该校初三学生1分钟仰卧起坐的次数的中位数为25B.该校初三学生1分钟仰卧起坐的次数的众数为24C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8[解析]第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.[答案] C[解题技法]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二)样本的数字特征与茎叶图交汇[典例]将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________.[解析] 由茎叶图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.[答案] 367[解题技法]样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三) 样本的数字特征与优化决策问题交汇[典例] (2018·周口调研)甲、乙两人在相同条件下各射击10次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力). [解] 由题图,知甲射击10次中靶环数分别为9,5,7,8,7,6,8,6,7,7. 将它们由小到大排列为5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为2,4,6,7,7,8,8,9,9,10.(1)x甲=110×(5+6×2+7×4+8×2+9)=7(环),x乙=110×(2+4+6+7×2+8×2+9×2+10)=7(环),s2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.填表如下:(2)甲乙∴甲成绩比乙稳定.②∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[题组训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 样本共30个,中位数为45+472=46;显然样本数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:( ) A .甲 B .乙 C .丙D .丁解析:选C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.3.某仪器厂从新生产的一批零件中随机抽取40个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8组,将其按从左到右的顺序分别记为第一组,第二组,……,第八组.则样本数据的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075 0+0.100 0)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.100 0×2=8,故中位数在第四组.答案:四[课时跟踪检测]A级——保大分专练1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14B.15C.16 D.17解析:选B由题意,样本中数据在[20,60)上的频数为30×0.8=24,所以估计样本在[40,60)内的数据个数为24-4-5=15.2.(2019·长春质检)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩y关于测试序号x的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好;②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升.其中正确结论的个数为()A.0 B.1C.2 D.3解析:选D①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.②由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选D.3.(2018·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是()A .15B .18C .20D .25解析:选A 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.故选A.4.2017年4月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中A ,B 两地选择一处进行实地考察.因此,他通过网站了解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记A ,B 两地综合评分数据的均值分别为x A ,x B ,方差分别为s 2A ,s 2B .若以备受好评为依据,则下述判断较合理的是( )A .因为x A >xB ,s 2A >s 2B ,所以应该去A 地B .因为x A >x B ,s 2A <s 2B ,所以应该去A 地C .因为x A <x B ,s 2A >s 2B ,所以应该去B 地D .因为x A <x B ,s 2A <s 2B ,所以应该去B 地解析:选B 因为x A =16×(72+86+87+89+92+94)≈86.67,x B =16×(74+73+88+86+95+94)=85,s 2A ≈16[(72-86.67)2+(86-86.67)2+(87-86.67)2+(89-86.67)2+(92-86.67)2+(94-86.67)2]≈50.56,s 2B =16[(74-85)2+(73-85)2+(88-85)2+(86-85)2+(95-85)2+(94-85)2]=76, 所以x A >x B ,s 2A <s 2B (A 数据集中,B 数据分散),所以A 地好评分高,且评价稳定.故选B.5.(2018·青岛三中期中)已知数据x 1,x 2,…,x n 的平均数x =5,方差s 2=4,则数据3x 1+7,3x 2+7,…,3x n +7的平均数和标准差分别为( )A .15,36B .22,6C .15,6D .22,36解析:选B ∵x 1,x 2,x 3,…,x n 的平均数为5,∴x 1+x 2+…+x n n =5,∴3x 1+3x 2+…+3x n n +7=3(x 1+x 2+…+x n )n+7=3×5+7=22. ∵x 1,x 2,x 3,…,x n 的方差为4,∴3x 1+7,3x 2+7,3x 3+7,…,3x n +7的方差是32×4=36,故数据3x 1+7,3x 2+7,…,3x n +7的平均数和标准差分别为22,6,故选B.6.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.解析:这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为89+89+90+91+915=90. 答案:907.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+ 0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60. 答案:608.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.解析:由题意知这组数据的平均数为10,方差为2,可得x +y =20,(x -10)2+(y -10)2=8,设x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8得t 2=4,所以|x -y |=2|t |=4.答案:49.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如表所示,求数学成绩在[50,90)之外的人数.(2)因为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100名学生语文成绩的平均分为73分.(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25. 所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)=10.B 级——创高分自选1.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.解:(1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,所以m =3,n =8.(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,因为x 甲=x 乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组更稳定一些.2.某大学艺术专业的400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据按[20,30),[30,40),…,[80,90]分成7组,并整理得到如图所示的频率分布直方图.(1)估计总体的众数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女学生人数相等.试估计总体中男生和女生人数的比例.解:(1)由频率分布直方图可估计总体的众数为70+802=75. (2)由频率分布直方图可知,样本中分数在区间[50,90]内的人数为(0.01+0.02+0.04+0.02)×10×100=90.因为样本中分数小于40的学生有5人,所以样本中分数在区间[40,50)内的人数为100-90-5=5.设总体中分数在区间[40,50)内的人数为x ,则5100=x 400,解得x =20, 故估计总体中分数在区间[40,50)内的人数为20.(3)由频率分布直方图可知,样本中分数不小于70的人数为(0.04+0.02)×10×100=60. 因为样本中分数不小于70的男女学生人数相等,所以样本中分数不小于70的男生人数为30.因为样本中有一半男生的分数不小于70,所以样本中男生的人数为60,女生的人数为40.由样本估计总体,得总体中男生和女生人数的比例约为3∶2.。

2020高三数学一轮复习(人教版理):用样本估计总体

2020高三数学一轮复习(人教版理):用样本估计总体

第三节用样本估计总体2019考纲考题考情1. 用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤。

① 求极差(即一组数据中最大值与最小值的差) ② 决定组距与组数。

③ 将数据分组。

④ 列频率分布表。

⑤ 画频率分布直方图。

(2)频率分布折线图和总体密度曲线。

① 频率分布折线图:连接频率分布直方图中各小长方形上端 的中点就得频率分布折线图。

② 总体密度曲线:随着样本容量的增加,作图时所分的组数 增加,组距减小,相应的频率分布折线图会越来越接近于一条光 滑曲线,即总体密度曲线。

(3 )茎叶图。

考竭姜求考廃举例 考向标签I, m 制卓井布的童史軸惟期+会列豪辜廿布褰"会卓甘 布也方*萎叶㈱•理解t-ITi# 口的特点 丄用请祥本垃锻标准瞪的煎£和杵用,盘计材歆据抹准曜 出廉札样嚴粧据中艇駁需岷的诙字将誉[如平网琵.捋曙 冲】.井的山合理帕練秤】一金用林皐的阳卡竹布估疗血体挣和.公用林4;的敕的思-鏗301沪江諒髙看・T*(求弄均1D 3DH ■全冋巻H 頻率甘布岂方閉》 201fi ・III 4; A 号•宰分阳育方图)2015 *江乐倚等* 1■沁祥字方卑》1-坤申涉4■心Ml 国 3一样車的故字特冊 核心素养:BUK 井析基础徴楡理-JICHirwniSHLJl.1 ■微知识・小题练较林回扣耳础自閹翅輕食二團攫JL茎是指中间的一列数,叶是从茎的旁边生长出来的数。

2. 用样本的数字特征估计总体的数字特征(1) 众数:一组数据中出现次数最多的数。

(2) 中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。

(3 )平均数:X = " XJ…+ Xn,反映了一组数据的平均水平。

(4) 标准差:是样本数据到平均数的一种平均距离,s =②数据ax i, ax2,…,ax n的方差为a2s2。

厂题姐戳热身-]屮题演练■提知幣■J 1 / . W EIRI Sil 1.> ----- ■一、走进教材1.(必修3P65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2 . 5)范围内的居民数有________ 。

高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案

高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案

第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。

山东高考数学一轮总复习教学案设计参考-用样本估计总体含答案解析

第2讲用样本估计总体[考纲解读] 1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,并体会它们各自的特点.(重点)2.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并作出合理的解释.3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.(难点)4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题.[考向预测]从近三年高考情况来看,本讲是高考中的一个热点.预测2021年将会考查用样本估计总体,主要体现在利用频率分布直方图或茎叶图估计总体,利用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频率分布直方图与茎叶图也可能出现于解答题中,与概率等知识综合命题.1.作频率分布直方图的步骤2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的□01中点,就得到频率分布折线图.(2)总体密度曲线:随着□02样本容量的增加,作图时所分的组数增加,□03组距减小,相应的频率折线图就会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图(1)茎叶图的概念:统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.(2)茎叶图的优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况.4.样本的数字特征 (1)众数、中位数、平均数 数字特征样本数据频率分布直方图优点与缺点众数出现次数□01最多的数据取最高的小长方形底边□02中点的横坐标 通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数将数据按大小依次排列,处在最□03中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积□04相等的分界线与x 轴交点的横坐标是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之□05和 平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.1.概念辨析(1)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(2)从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.()(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()答案(1)×(2)√(3)√(4)×2.小题热身(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.(2)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92答案 A解析由茎叶图可知,这组数据的中位数是12×(91+92)=91.5,平均数是18×(87+89+90+91+92+93+94+96)=91.5.(3)港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100 km/h ,现对大桥某路段上1000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90 km/h 的频率分别为( )A.300 0.25 B .300 0.35 C.60 0.25 D .60 0.35答案 B解析 由频率分布直方图,得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1000=300,行驶速度超过90 km/h 的频率为(0.05+0.02)×5=0.35.故选B.(4)(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 这组数据的平均数为8,故方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.题型一 样本数字特征的计算及应用1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数 B .平均数 C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.2.(2019·长沙二模)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2;其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( )A.3x -+2,3s 2+2 B .3x -,3s 2 C.3x -+2,9s 2 D .3x -+2,9s 2+2答案 C解析 根据题意,数据x 1,x 2,…x 100的平均数为x -,方差为s 2;则x -=1100(x 1+x 2+x 3+…+x 100),s 2=1100[(x 1-x -)2+(x 2-x -)2+…+(x 100-x -)2],若3x 1+2,3x 2+2,3x 3+2,…,3x 100+2的平均数为x -′,则x -′=1100[(3x 1+2)+(3x 2+2)+…+(3x 100+2)]=3x -+2,方差s ′2=1100[(3x 1+2-3x --2)2+(3x 2+2-3x --2)2+…+(3x 100+2-3x --2)2]=9s 2.3.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.答案 9解析 根据题意知,该组数据的众数是2, 则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10, 则2+x2=3,解得x =4,所以这组数据的平均数为x -=16×(1+2+2+4+5+10)=4, 方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n)-n x -2]或写成s 2=1n (x 21+x 22+…+x 2n )-x -2,即方差等于原数据平方的平均数减去平均数的平方.(3)平均数、方差的公式推广①若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .见举例说明2.②数据x 1,x 2,…,x n 的方差为s 2.a.数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;b.数据ax 1,ax 2,…,ax n 的方差为a 2s 2.见举例说明2.1.(2019·六安模拟)某样本中共有5个个体,其中4个值分别为0,1,2,3,第5个值丢失,但该样本的平均值为1,则样本方差为( )A.2B.65 C. 2 D.305答案 A解析 设第5个值为x ,则由题意,得15×(0+1+2+3+x )=1,解得x =-1,所以样本方差s 2=15×[(0-1)2+(1-1)2+(2-1)2+(3-1)2+(-1-1)2]=2.2.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.题型二 扇形图、折线图1.(2020·株洲市高三摸底)某市2019年12个月的PM2.5的平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是( )A.第一季度 B .第二季度 C.第三季度 D .第四季度答案 B解析 根据图中数据,知第一季度的数据是72.15,43.96,93.13;第二季度的数据是66.5,55.25,58.67;第三季度的数据是59.16,38.67,51.6;第四季度的数据是82.09,104.6,168.05;观察得出第二季度的数据波动性最小,所以第二季度的PM2.5的平均浓度指数方差最小.故选B.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(2019·东北三省四市教研联合体模拟)“科技引领,布局未来”,科技研发是企业发展的驱动力量.2007年至2018年,某企业连续12年累计研发投入达4100亿元.我们将研发投入与经营收入的比值记为研发投入占营收比.这12年间的研发投入(单位:十亿元)用如图中的条形图表示,研发投入占营收比用如图中的折线图表示.根据折线图和条形图,下列结论错误的是()A.2012年至2013年研发投入占营收比增量相比2017年至2018年增量大B.2013年至2014年研发投入数量相比2015年至2016年增量小C.该企业连续12年研发投入逐年增加D.该企业连续12年研发投入占营收比逐年增加答案 D解析由题图可知,该企业在2008年至2009年、2013年至2014年和2016年至2017年研发投入占营收比是下降的,所以D错误.故选D.题型三茎叶图及其应用1.(2019·郑州三模)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12.若要使该总体的标准差最小,则4x+2y的值是()0223 41x y 9920 1C.16 D.18答案 A解析因为总体的中位数为12,所以10+x+10+y2=12,即x+y=4,所以总体的平均数为110×(2+2+3+4+10+x+10+y+19+19+20+21)=11.4.要使总体的标准差最小,只要(10+x-11.4)2+(10+y-11.4)2最小.因为(10+x-11.4)2+(10+y-11.4)2≥2×10+x-11.4+10+y-11.422=0.72,当且仅当x=y=2时等号成立,所以4x+2y=12.故选A.2.某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430 ,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407 ,410,412,415,416,422,430.(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解(1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.1.茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列,写在左(右)侧;有两组数据时,写在中间;第三步:将各个数据的叶依次写在其茎的右(左)侧.茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.2.茎叶图的应用茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.1.甲、乙两位射击运动员的5次比赛成绩(单位:环)如茎叶图所示,若两位运动员平均成绩相同,则成绩较稳定(方差较小)的那位运动员成绩的方差为( )A.2 B .4 C .6 D .8答案 A解析 根据茎叶图中的数据知,甲、乙二人的平均成绩相同,即15×(87+89+90+91+93)=15×(88+89+90+91+90+x ),解得x =2,所以平均数为x -=90;根据茎叶图中的数据知甲的成绩波动性小,较为稳定(方差较小),所以甲成绩的方差为s 2=15×[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2.故选A.2.如图茎叶图记录了甲、乙两组各6名学生在一次数学测试中的成绩(单位:分).已知甲组数据的众数为124,乙组数据的平均数为甲组数据的中位数,则x ,y 的值分别为( )答案 A解析 由已知,甲组数据的众数是124,则x =4,即甲组数据的中位数为124.所以16×(116+116+125+120+y +128+134)=124,解得y =5.故选A.题型四频率分布直方图角度1求频率或频数1.党的十九大报告指出:“脱贫攻坚战取得决定性进展,六千多万贫困人口稳定脱贫,贫困发生率从百分之十点二下降到百分之四以下.”2019年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3000户家庭的2019年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为()A.900户B.600户C.300户D.150户答案 A解析由频率分布直方图得:年收入不超过6万的家庭所占频率为:(0.005+0.010)×20=0.3,∴年收入不超过6万的家庭大约为0.3×3000=900.角度2求数字特征2.某市在对两千多名出租车司机的年龄进行的调查中,从两千多名出租车司机中随机抽选100名司机,已知这100名司机的年龄都在20岁至50岁之间,且根据调查结果得出的年龄情况频率分布直方图如图所示(部分图表污损).利用这个残缺的频率分布直方图,可估计该市出租车司机年龄的中位数大约是()A.31.4岁B.32.4岁C.33.4岁D.36.4岁答案 A解析由频率分布直方图可知[20,25)的频率为0.1,[25,30)的频率为0.3,[30,35)的频率为0.35,因为0.1+0.3<0.5<0.1+0.3+0.35,所以中位数x0∈[30,35),由0.1+0.3+(x0-30)×0.07=0.5,得x0≈31.4.故选A.3.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.1.频率分布直方图的性质(1)小长方形的面积=组距×频率组距=频率.见举例说明1.(2)各小长方形的面积之和等于1.2.频率分布直方图中的众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即是众数;(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位数;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.见举例说明3.1.(2019·湘潭三模)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成如下6组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n的值是()A.800 B.900C.1200 D.1000答案 D解析由频率分布直方图的性质,得10×(0.031+0.020+0.016×2+m+0.006)=1,解得m=0.011,∵不低于140分的频率为0.011×10=0.11,∴n=1100.11=1000.2.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)频率分布直方图如图.(2)质量指标值的样本平均数为x-=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.组基础关1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14 B.15C.16 D.17答案 B解析由频数分布表可知,样本中数据在[20,40)上的频率为4+530=0.3,又因为样本数据在[20,60)上的频率为0.8,所以样本在[40,60)内的频率为0.8-0.3=0.5,数据个数为30×0.5=15.2.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:甲乙丙丁平均成绩x-86898985 方差s2 2.1 3.5 2.1 5.6A.甲B.乙C.丙D.丁答案 C解析丙平均成绩高,方差s2小(稳定),故最佳人选是丙.3.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6C.0.7 D.0.8答案 C解析解法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.解法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.4.(2019·钦州模拟)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第三组B.第四组C.第五组D.第六组答案 B解析由图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第四组,所以B正确.5.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10,B 组的6个数为15,10,12.5,10,12.5,10,所以x -A =2.5+10+5+7.5+2.5+106=6.25,x -B =15+10+12.5+10+12.5+106≈11.67.显然x -A <x -B .又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.(2019·合肥一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是( )注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.90后从事运营岗位的人数比80前从事互联网行业的人数多D.互联网行业中90后从事技术岗位的人数比80后从事技术岗位的人数多解析 对于A ,由饼状图可知互联网行业从业人员中90后占了56%,故A 正确.对于B ,由条形图可知互联网行业中从事技术岗位的人数占总人数的比例为39.6%,故B 正确.对于C ,由两图数据可计算出整个互联网行业从事运营岗位的90后占56%×17%=9.52%,大于互联网行业中的80前总人数,故C 正确.对于D ,因为80后从事技术岗位的人数所占比例不清楚,所以互联网行业中从事技术岗位的90后人数不一定比80后的人数多,故D 错误.故选D.7.(2020·重庆名校联盟调研)在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的25,且样本容量为210,则该组的频数为( )A.28 B .40 C .56 D .60答案 D解析 设该小矩形的面积为x,9个小矩形的总面积为1,则其他8个小矩形的面积和为52x ,所以x +52x =1,所以x =27,所以该组的频数为27×210=60.8.(2020·贵阳模拟)某地的中小学办学条件在政府的教育督导下,迅速得到改善.教育督导一年后,分别随机抽查了初中(用A 表示)与小学(用B 表示)各10所学校,得到相关指标的综合评价得分(百分制)的茎叶图如图所示,则从茎叶图可得出正确的信息为(80分及以上为优秀)( )①初中得分与小学得分的优秀率相同 ②初中得分与小学得分的中位数相同 ③初中得分的方差比小学得分的方差大 ④初中得分与小学得分的平均值相同A.①② B .①③ C .②④D .③④解析从茎叶图可知抽查的初中得分的优秀率为310×100%=30%,小学得分的优秀率为310×100%=30%,故①正确;初中得分的中位数为75.5,小学得分的中位数为72.5,故②不正确;从茎叶图可知初中得分比小学得分分散,所以初中得分的方差比小学得分的方差大,故③正确;初中得分的平均值为75.7,小学得分的平均值为75,故④不正确.所以正确的信息为①③,故选B.9.已知一组数据x1,x2,…,x n的方差为2,若数据ax1+b,ax2+b,…,ax n +b(a>0)的方差为8,则a的值为________.答案 2解析根据方差的性质,知a2×2=8,解得a=2.10.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为________.答案 3解析由频率分布直方图,知5×(0.01+0.02+a+0.04+0.04+0.06)=1,解得a=0.03,即使用时间在[15,20),[20,25),[25,30]三组内的学生人数之比为4∶3∶1,则从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为38×8=3.组能力关1.某校高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2 B .24,4 C .25,2 D .25,4答案 C解析 由频率分布直方图可知,组距为10,所以[50,60)的频率为0.008×10=0.08,由茎叶图可知[50,60)的人数为2,设参加本次考试的总人数为N ,则N =20.08=25,根据频率分布直方图可知[90,100]内的人数与[50,60)的人数一样,都是2.故选C.2.(2019·葫芦岛一模)一个样本容量为10的样本数据,它们组成一个公差为2的等差数列{a n },若a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A.12,13 B .13,13 C .13,12 D .12,14答案 B解析 依题意a 23=a 1a 7,∴(a 1+4)2=a 1(a 1+6×2),解得a 1=4,所以此样本的平均数为S 1010=13,中位数为a 5+a 62=13.3.(2019·马鞍山模拟)某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图1的频率分布直方图,其中体重最轻的14头仔猪的体重的茎叶图如图2,为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中a +b 的值为( )A.0.144B .0.152C .0.76D .0.076答案 B解析 由题意得2(c +d )×5=2×12100=0.24,∴a +b =1-0.245=0.152. 4.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.解 (1)根据题意可知:x -甲=15×(7+8+10+12+10+m )=10,x -乙=15×(9+n +10+11+12)=10,所以m =3,n =8.(2)s 2甲=15×[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15×[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,因为x -甲=x -乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组更稳定一些.组 素养关(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组 企业数 [-0.20,0) 2 [0,0.20) 24 [0.20,0.40) 53 [0.40,0.60) 14 [0.60,0.80)7(1)。

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。

2025高考数学一轮复习课件 随机抽样、用样本估计总体


夯实双基
1.判断下面结论是否正确(打“√”或“×”). (1)不放回简单随机抽样是从总体中逐个不放回地抽取样本.
答案 √
(2)分层随机抽样是将每层各抽取相同的个体数构成样本,分层随机抽样 为保证各个个体等可能入样,必须进行每层等可能抽样.
答案 ×
(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. 答案 ×
总体集中趋势与离散程度的估计
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中
间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:
-x
x1+x2+…+xn
=________n_______________,反映了一组数据的平均水
霸”A.√抽样表明,该校有一半学生为“阅读
B.该校只有 50 名学生不喜欢阅读 C.该校只有 50 名学生喜欢阅读 D.抽样表明,该校有 50 名学生为“阅读霸”
解析 根据频率分布直方图可列下表:
阅读时
[0,
间(分钟)
10)
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60]
A√.3
1 C.4
B.4 1
D.3
【解析】 由题意知 x1+x2+…+xm=m-x , y1+y2+…+yn=n-y , -z =(x1+x2+…+xm)m++(n y1+y2+…+yn) =m-xm+ +nn-y =mm+-xn+mn+-y n=14-x +43-y ,所以m+m n=14,m+n n=34,可得
3m=n,所以mn =13.
状元笔记
(1)简单随机抽样、分层随机抽样中,总体中每个个体入样的可能性是 相同的.

高考数学一轮复习配餐作业63用样本估计总体含解析理38

配餐作业(六十三) 用样本估计总体(时间:40分钟)一、选择题1.(2015·陕西高考)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .93B .123C .137D .167解析 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C 。

答案 C2.(2017·合肥模拟)一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图。

已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为( )A.2 B .-2 C .3D .-3解析 由题意得72+77+80+x +86+905=81⇒x =0,易知y =3,∴x -y =-3。

故选D 。

答案 D3.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.3解析 由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,45]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.2。

故选C 。

答案 C4.(2016·长沙一模)下面的茎叶图是某班学生在一次数学测试时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( ) A .15名女生成绩的平均分为78 B .17名男生成绩的平均分为77C .女生成绩和男生成绩的中位数分别为82,80D .男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析 对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A 正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B 正确;对于D ,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D 正确;对于C ,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C 错误。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

m 乙,则 ( )
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
A.-x 甲< -x 乙 , m 甲 > m 乙 B.-x 甲 < -x 乙, m 甲< m 乙
C.-x 甲> -x 乙 , m 甲 > m 乙 D.-x 甲 > -x 乙, m 甲 <m 乙
解析
由茎叶图知
m
22+ 18 甲= 2 =
(3)23 人, 63.89%
(时间: 20 分钟 ) 1. (2017·内江模拟 )某公司 10 个销售店某月销售某产品数量 (单位:台 )的茎叶图如下:
分组成 [11,20), [20,30), [30,39]时,所作的频率分布直方图是 ( )
马鸣风萧萧整理
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
xn m y1+ y2+…+
+n+ m·
m
ym =
n n+ m·
-x
+n+mm·-y
= a-x +
(1-
a)-y
,所以
n
m
n+m= a,n+ m= 1-a,又
1 0<a< 2,所以
n 1m 0< n+ m< 2< n+ m,故 n< m。故选 A 。
答案 A
3. (2016·四川检测 )某学校随机抽取部分新生调查其上学所需时间
图,现已知年龄在 [30,35)、 [35,40)、[40,45]的网民人数成递减的等差数列,则年龄在 [35,40)的
马鸣风萧萧整理
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
网民出现的频率为 ( )
A. 0.04 C. 0.2
B. 0.06 D. 0.3
解析 由题意得,年龄在 [20,25)的网民出现的频率为 0.01× 5= 0.05, [25,30)的网民出现
(单位: 分钟 ),并将所
得数据绘制成频率分布直方图 (如图 ),其中,上学所需时间的范围是 为[0,20), [20,40),[40,60), [60,80), [80,100]。则
[0,100],样本数据分组
马鸣风萧萧整理
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是
()
A. 15 名女生成绩的平均分为 78
B. 17 名男生成绩的平均分为 77
C.女生成绩和男生成绩的中位数分别为 82,80
D .男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重
1 解析 对于 A,15 名女生成绩的平均分为 × (90+ 93+ 80+80+ 82+ 82+ 83+ 83+ 85+
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组 [2,4] (4,6] (6,8] (8,10] (10,12] (12,17] (17,22] (22,27]
频率 0.1 0.15 0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为:
(精确到
0.01%)?
解析 (1)44,40,36,43,36,37,44,43,3。7
(2)-x =
44+
40+
36+
43+
36+ 9
37+
44+
43+
37 =
40。
1 s2= [(44- 40)2+ (40- 40)2+ (36- 40)2+ (43- 40)2+ (36- 40)2+ (37- 40)2+ (44- 40)2+ (43
解析 由直方图的纵坐标是频率 / 组距,排除 C 和 D ;又第一组的频率是 0.2,直方图
中第一组的纵坐标是 0.02,排除 A ,故选 B。
答案 B
2.(2016·山西大学附中模拟 )已知样本 (x1,x2,…, xn)的平均数为 -x ,样本 (y1,y2,…,
ym)的平均数为 -y (-x ≠ -y ),若样本 (x1,x2,…,xn,y1,y2,…,ym)的平均数 -z = a-x + (1- a)-y ,
A. 4 900
B. 9 200
C. 4 600
D. 9 600
解析 由样本平均数为 100,知 x+y= 200,由标准差是 10 2,知方差为 200,即 [(- 10)2 +02+ 102+ (100- x)2+ (100- y)2]÷ 5=200,故 x2+ y2= 20 800。结合 x+ y= 200,解得 xy=9 600。
17
38
26
44
35
49
9
43
18
36
27
42
36
39
(1)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在第一分段里用随机抽样法抽
到的年龄数据为 44,列出样本的年龄数据;
(2)计算 (1)中样本的பைடு நூலகம்值 -x 和方差 s2;
(3)36 名工人中年龄在 -x - s 与 -x + s 之间的有多少人?所占的百分比是多少
解析 由茎叶图可知甲监测点的数据较为集中, 乙监测点的数据较为分散, 所以甲地的
方差较小。
答案 甲
三、解答题
10. (2016·北京高考 )某市居民用水拟实行阶梯水价。每人月用水量中不超过
w 立方米
的部分按 4 元 / 立方米收费,超出 w 立方米的部分按 10 元 / 立方米收费。从该市随机调查了
15
1 70+ 71+ 73+ 75+ 66+57)=78, A 正确;对于 B,17 名男生成绩的平均分为 ×(93+93+ 96
17
+80+ 82+ 83+ 86+ 86+ 88+ 71+ 74+ 75+ 62+ 62+ 68+ 53+ 57)= 77,故 B 正确;对于 D ,
观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,
1
其中 0< a< 2,则 n, m 的大小关系为 (
)
A.n< m
B. n> m
C. n= m
D .不能确定
解析
由题意可得
-x

x1+
x2+…+ n
xn ,
-y

y1+ y2+…+ m
ym ,
-z = x1+ x2+…+
xn+ y1+ y2+…+ n+ m
ym n x1+ x2+…+
= n+m·
n
C. 137
D. 167
解析 初中部的女教师人数为 110× 70%= 77,高中部的女教师人数为 150× (1- 60%)
=60,该校女教师的人数为 77+ 60= 137,故选 C。
答案 C
2.(2017·合肥模拟 )一次数学考试后,某老师从自己所带的两个班级中各抽取
5 人,记
录他们的考试成绩,得到如图所示的茎叶图。已知甲班
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
配餐作业 (六十三 ) 用样本估计总体
(时间: 40 分钟 ) 一、选择题 1. (2015·陕西高考 )某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比 例如图所示,则该校女教师的人数为 ( )
A. 93
B. 123
马鸣风萧萧整理
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
10 000 位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元 / 立
方米, w 至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替。当
9
100 -40)2+ (37- 40)2]= 9 。
10
10 110
10 130
110 130
(3)由(2)知, s= 3 。 40- 3 = 3 , 40+ 3 = 3 , 36 名工人中年龄在 3 , 3 的有 23
人,占 63.89%。
答案 (1)见解析
(2)-x = 40
100 s2= 9
1
40
10
36
19
27
28
34
2
44
11
31
20
43
29
39
3
40
12
38
21
41
30
43
4
41
13
39
22
37
31
38
5
33
14
43
23
34
32
42
马鸣风萧萧整理
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
6
40
15
45
24
42
33
53
7
45
16
39
25
37
34
37
8
42
D 正确;对于 C,
根据女生和男生成绩数据分析可得,两组数据的中位数均为
80, C 错误。故选 C。
答案 C
5.从甲、乙两个城市分别随机抽取 16 台自动售货机,对其销售额进行统计,统计数据
用茎叶图表示 (如图所示 )。设甲、 乙两组数据的平均数分别为 -x 甲、-x 乙,中位数分别为 m 甲 、
马鸣风萧萧整理
20,m
相关文档
最新文档