高考数学专题复习:用样本估计总体

合集下载

河南省郑州市高考数学一轮复习:55 用样本估计总体

河南省郑州市高考数学一轮复习:55 用样本估计总体

河南省郑州市高考数学一轮复习:55 用样本估计总体姓名:________ 班级:________ 成绩:________一、单选题 (共12题;共24分)1. (2分) (2016高一下·大连期中) 样本a1 , a2 , a3 ,…,a10的平均数为,样本b1 , b2 , b3 ,…,b10的平均数为,那么样本a1 , b1 , a2 , b2 ,…,a10 , b10的平均数为()A . +B . ( + )C . 2( + )D . ( + )2. (2分)(2019·石家庄模拟) 甲、乙两人次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数和乙的成绩的中位数分别是()A .B .C .D .3. (2分)一组数据的茎叶图如图所示,则数据落在区间内的概率为()A . 0.2B . 0.4C . 0.5D . 0.64. (2分)从某鱼池中捕得1200条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得1000条鱼,计算其中有记号的鱼为100条,试估计鱼池中共有鱼的条数为()A . 10000B . 12000C . 1300D . 130005. (2分) (2018高一下·长春期末) 抽样统计甲、乙两位同学5次数学成绩绘制成如图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为()A .B .C .D .6. (2分)(2020·泉州模拟) 每年的台风都对泉州地区的渔业造成较大的经济损失.某保险公司为此开发了针对渔船的险种,并将投保的渔船分为I,II两类,两类渔船的比例如图所示.经统计,2019年I,II两类渔船的台风遭损率分别为15%和5%.2020年初,在修复遭损船只的基础上,对I类渔船中的20%进一步改造.保险公司预估这些经过改造的渔船2020年的台风遭损率将降为3%,而其他渔船的台风遭损率不变.假设投保的渔船不变,则下列叙述中正确的是()A . 2019年投保的渔船的台风遭损率为10%B . 2019年所有因台风遭损的投保的渔船中,I类渔船所占的比例不超过C . 预估2020年I类渔船的台风遭损率会小于II类渔船的台风遭损率的两倍D . 预估2020年经过进一步改造的渔船因台风遭损的数量少于II类渔船因台风遭损的数量7. (2分)一次考试某简答题满分5分,以0.5分为给分区间.这次考试有100人参加,该题没有得零分的人,所有人的得分按(0,1],(1,2],...(4,5]分组所得的频率分布直方图如图所示.设其众数、中位数、平均分最大的可能值分别为m0,mc,,则()A .B .C .D .8. (2分)如图所示的茎叶图记录了长郡中学的甲、乙两名同学在校级运动会的五次一千米训练成绩(单位:秒),通过茎叶图比较两人训练成绩的平均值及方差,并从中推荐一人参加运动会,①甲的成绩的平均值高于乙的成绩的平均值,推荐乙参加运动会②甲的成绩的平均值低于乙的成绩的平均值,推荐甲参加运动会③甲的成绩的方差高于乙的成绩的方差,推荐乙参加运动会④甲的成绩的方差低于乙的成绩的方差,推荐甲参加运动会,其中正确结论的编号为()A . ①③B . ②④C . ②D . ③9. (2分)为了解一批数据在各个范围内所占比例的大小,将这批数据分组,落在各个小组的个数叫做()A . 频数B . 样本容量C . 频率D . 累计频数10. (2分)从某校高三年级中随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其结果的频率分布直方图如图所示,若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为()A . 10B . 20C . 8D . 1611. (2分)(2020·安庆模拟) 改革开放40多年来,城乡居民生活从解决温饱的物质需求为主逐渐转变到更多元化的精神追求,消费结构明显优化.下图给出了1983~2017年部分年份我国农村居民人均生活消费支出与恩格尔系数(恩格尔系数是食品支出总额占个人消费支出总额的比重)统计图.对所列年份进行分析,则下列结论错误的是()A . 农村居民人均生活消费支出呈增长趋势B . 农村居民人均食品支出总额呈增长趋势C . 2011年至2015年农村居民人均生活消费支出增长最快D . 2015年到2017年农村居民人均生活消费支出增长比率大于人均食品支出总额增长比率12. (2分) (2020高一下·常熟期中) 一个样本a,3,4,5,6的平均数是b,且不等式x2-6x+c<0的解集为(a,b),则这个样本的标准差是()A . 1B .C .D . 2二、填空题 (共5题;共5分)13. (1分) (2016高一下·驻马店期末) 某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为“体育迷”.则抽取的100名观众中“体育迷”有________名.14. (1分)(2020·上海模拟) 已知样本数据的每个数据都是自然数,该样本的平均数为4,方差为5,且样本数据两两互不相同,则样本数据中的最大值是________15. (1分) (2016高一下·南市期中) 某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如图所示,则这组数据的中位数与众数分别为________.16. (1分) (2016高一下·抚顺期末) 某大学对1000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图如图所示,现规定不低于70分为合格,则合格人数是________.17. (1分) (2019高一下·郑州期末) 水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高一年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最大值是________.三、解答题 (共5题;共60分)18. (10分)某市电视台为了宣传举办问答活动,随机对该市15~65岁的人群抽样了x•46%=230人,回答问题统计结果如图表所示.组号分组回答正确的人数回答正确的人数占本组的概率第1组[15,25)50.5第2组[25,35)a0.9第3组[35,45)27x第4组[45,55)b0.36第5组[55,65)3y(Ⅰ)分别求出a,b,x,y的值;(Ⅱ)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,则第2,3,4组每组应各抽取多少人?(Ⅲ)在(Ⅱ)的前提下,电视台决定在所抽取的6人中随机抽取2人颁发幸运奖,求:所抽取的人中第2组至少有1人获得幸运奖的概率.19. (10分) (2016高一下·揭西开学考) 某校高三年级在高校自主招生期间,把学生的平时成绩按“百分制”折算并排序,选出前300名学生,并对这300名学生按成绩分组,第一组[75,80),第二组[80,85),第三组[85,90),第四组[90,95),第五组[95,100],如图为频率分布直方图的一部分,其中第五组、第一组、第四组、第二组、第三组的人数依次成等差数列.(Ⅰ)请在图中补全频率分布直方图;(Ⅱ)若B大学决定在成绩高的第4,5组中用分层抽样的方法抽取6名学生,并且分成2组,每组3人进行面试,求95分(包括95分)以上的同学被分在同一个小组的概率.20. (10分)第十三届全运会将在2017年8月在天津举行,组委会在2017年1月对参加接待服务的10名宾馆经理进行为期半月的培训,培训结束,组织了一次培训结业测试,10人考试成绩如下(满分为100分):75 84 65 90 88 95 78 85 98 82(1)以成绩的十位为茎个位为叶作出本次结业成绩的茎叶图,并计算平均成绩与成绩中位数;(2)从本次结业成绩在80分以上的人员中选3人,这3人中成绩在90分(含90分)以上的人数为,求的分布列与数学期望.21. (15分)某中学为了普及法律知识,举行了一次法律知识竞赛活动.下面的茎叶图记录了男生、女生各10名学生在该次竞赛活动中的成绩(单位:分).已知男、女生成绩的平均值相同.(1)求a的值;(2)从成绩高于86分的学生中任意抽取3名学生,求恰有2名学生是女生的概率.22. (15分)某班同学利用国庆节进行社会实践,对[20,50]岁的临汾市“低头族”(低头族电子产品而忽视人际交往的人群)人群随是因使用机抽取1000人进行了一次调查,得到如下频数分布表:(1)在答题卡上作出这些数据的频率分布直方图;(2)估计[20,50]年龄段的“低头族”的平均年龄(同一组中的数据用该组区间的中点值作代表);(3)从年龄段在[25,35)的“低头族”中采用分层抽样法抽取6人接受采访,并从6人中随机选取2人作为嘉宾代表,求选取的2名嘉宾代表中恰有1人年龄在[25,30)岁的概率.参考答案一、单选题 (共12题;共24分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、二、填空题 (共5题;共5分)13-1、14-1、15-1、16-1、17-1、三、解答题 (共5题;共60分)18-1、19-1、20-1、20-2、21-1、21-2、22-1、。

高三总复习用样本估计总体教师版

高三总复习用样本估计总体教师版
∴频率为0.52.答案:C
5.甲、乙两射击运动员进行比赛,射击相同的次数,已知两运动员射击的环数稳定在7,8,9,10环,他们的成绩频率分布条形图如下:
由乙击中8环及甲击中10环的概率与甲击中环数的平均值都正确的一组数据依次是()
A.0.350.25 8.1B.0.350.258.8
C.0.250.358.1D.0.250.358.8
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.用茎叶图刻画数据的两个优点,
(1)所有数据都可以从数据中得到;
(2)茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据较大时,茎叶图的效果就不是很好了.
甲的平均数为: ,即 。
方差为:

乙的平均数:
乙的方差为:
[探究四]综合问题
例4:对某校高一年级学生参加社区服务次数进行统计,随机抽取 名学生作为样本,得到这 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:
分组
频数
频率
10
0.25
25
2
0.05
合计
M
1
⑴求出表中 、 及图中 的值;
0.6 3.7 2.2 1.5 2.8
1.7 1.2 2.1 3.2 1.0
(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);
(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);

5.1.4用样本估计总体(原卷版)

5.1.4用样本估计总体(原卷版)
分组
频数
频率
10
24
2
合计
1
(1)写出表中 、 及图中 的值(不需过程);
(2)若该校高三年级学生有240人,试估计该校高三年级学生参加社区服务的次数在区间 上的人数;
(3)估计该校高三年级学生参加社区服务次数的中位数.(结果精确到0.01)
【变式11】4.(2023·高一课时练习)某校240名学生参加某次数学选择题测验(共10题每题1分),随机调查了20个学生的成绩如下:
A.a的值为0.005
B.估计这组数据的众数为75
C.估计这组数据的第85百分位数为86
D.估计成绩低于60分的有25人
【变式13】3.(2022·安徽·涡阳县第九中学高一期末)某县在创文明县城期间安排了“垃圾分类知识普及实践活动”.为了解市民的学习成果,该县从某社区随机抽取了160名市民作为样本进行测试,记录他们的成绩,测试卷满分为100分,将数据收集,并整理得到频率分布直方图,如图所示:
(1)求频率分布直方图中a的值;
(2)估计该100名射击爱好者的射击平均得分(求平均值时同一组数据用该组区间的中点值作代表);
(3)该俱乐部计划招募成绩位列前10%的滑雪爱好者组成集训队备战明年的滑雪俱乐部联盟赛,请根据图中信息,估计集训队入围成绩(记为k).
【变式21】3.(2023下·湖南益阳·高一统考期末)某校有高一学生1000人,其中男生 600人,女生 400人,为了解该校全体高一学生的身高信息,甲与乙分别进行了调查.
成绩
1分
2分
3分
4分
5分
6分
7分
8分
9分
10分
人数
6
0
0
2
4
2

高考数学复习13-2用样本估计总体

高考数学复习13-2用样本估计总体

[71,81)
6
6 30
[81,91)
10
10 30
[91,101)
5
5 30
[101,111)
2
2 30
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
(3)答对下述两条中的一条即可: (i)该市一个月中空气污染指数有 2 天处于优的水平,占当月 天数的115.有 26 天处于良的水平,占当月天数的1135.处于优或良的 天数共有 28 天,占当月天数的1145.说明该市空气质量基本良好. (ii)轻微污染有 2 天,占当月天数的115.污染指数在 80 以上的接 近轻微污染的天数有 15 天,加上处于轻微污染的天数,共有 17 天, 占当月天数的1370,超过 50%.说明该市空气质量有待进一步改善.
(3)在[1.38,1.42)范围内最多. 估计纤度大于 1.42 的概率为29+11000+2=0.41 或 0.29+ 0.10+0.02=0.41.
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
谢谢!
设 A 表示随机事件“所抽取的两件样品的重量之差不超过 2 克”,则 A 的基本事件有 4 种:
(108,109),(108,110),(109,110),(110,112). 故所求概率为 P(A)=145.
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
[解] 根据统计知识可知,需要计算两组数据的 x 与 s2, 然后加以比较,最后再作出判断.
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级

高考数学第一轮知识点总复习 第二节 用样本估计总体

高考数学第一轮知识点总复习 第二节   用样本估计总体

平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.

(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,

高考数学《随机抽样与用样本估计总体》真题含答案

高考数学《随机抽样与用样本估计总体》真题含答案

高考数学《随机抽样与用样本估计总体》真题含答案一、选择题1.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(x -s ,x +s)内的人数占公司人数的百分比是(其中x 是平均数,s 为标准差,结果精确到1%)( )A .14%B .25%C .56%D .67% 答案:C解析:因为x -=36+36+37+37+40+43+43+44+449=40,s 2=19 (16+16+9+9+0+9+9+16+16)=1009 ,即s =103 ,年龄在(x - -s ,x -+s)即⎝⎛⎭⎫1103,1303 内的人数为5,所以所求百分比为59≈0.56=56%,故选C . 2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140 答案:D解析:由频率分布直方图知,200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.3.[2024·九省联考]样本数据16,24,14,10,20,30,12,14,40的中位数为( ) A .14 B .16 C .18 D .20 答案:B解析:将这些数据从小到大排列可得:10,12,14,14,16,20,24,30,40,则其中位数为16.故选B.4.[2024·新课标Ⅱ卷]某农业研究部门在面积相等的100块稻田上种植一种新型水稻,根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间答案:C解析:A选项,因为6+12+18=36<50,36+30=66>50,所以100块稻田亩产量的中位数不小于1 050 kg, A错误;B选项,因为100块稻田中亩产量低于1 100 kg的稻田有66块,所占比例为66%<80%,所以B错误;C选项,100块稻田亩产量的极差的最大值小于1 200-900=300,最小值大于1 150-950=200,所以极差介于200 kg至300 kg之间,C正确;D选项,同一组中的数据都用左端点值来估计,则这100块稻田亩产量的平均值的最小值为1100×(6×900+12×950+18×1 000+30×1 050+24×1 100+10×1 150)=1 042>1 000,所以平均值不介于900 kg至1 000 kg之间,D错误.故选C.5.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A解析:设建设前经济收入为a ,则建设后经济收入为2a ,由题图可得下表:根据上表可知B 、C 、D 均正确,A 不正确,故选A .6.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差 答案:B解析:由统计图可知,讲座前这10位社区居民问卷答题的正确率分别为65%,60%,70%,60%,65%,75%,90%,85%,80%,95%.对于A 项,将这10个数据从小到大排列为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,因此这10个数据的中位数是第5个与第6个数的平均数,为70%+75%2 =72.5%>70%,A 错误.对于B 项,由统计图可知,讲座后这10位社区居民问卷答题的正确率分别为90%,85%,80%,90%,85%,85%,95%,100%,85%,100%,所以讲座后这10位社区居民问卷答题的正确率的平均数为110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,B 正确.对于C 项,讲座后这10位社区居民问卷答题的正确率的方差s 2后 =110 ×[(90%-89.5%)2+(85%-89.5%)2+…+(85%-89.5%)2+(100%-89.5%)2]=42.2510 000 ,所以标准差s 后=6.5%.讲座前这10位社区居民问卷答题的正确率的平均数为110 ×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,所以讲座前这10位社区居民问卷答题的正确率的方差为s 2前 =110×[(60%-74.5%)2+(60%-74.5%)2+…+(90%-74.5%)2+(95%-74.5%)2]=142.2510 000 ,所以标准差s 前≈11.93%.所以s 前>s 后,C 错误.对于D 项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,D 错误.故选B .7.(多选)有一组样本数据x 1,x 2,…,x n ,由这组数据得到新样本数据y 1,y 2,…,y n ,其中y i =x i +c(i =1,2,…,n),c 为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同 答案:CD解析:A :E(y)=E(x +c)=E(x)+c 且c ≠0,故平均数不相同,错误;B :若第一组中位数为x i ,则第二组的中位数为y i =x i +c ,显然不相同,错误;C :D(y)=D(x)+D(c)=D(x),故方差相同,正确.D :由极差的定义知:若第一组的极差为x max -x min ,则第二组的极差为y max -y min =(x max+c)-(x min +c)=x max -x min ,故极差相同,正确.故选CD .8.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 答案:C解析:甲的平均数是4+5+6+7+85 =6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325 =125,比较可得选项C 正确.9根据上表可得经验回归方程为y ^ =6.3x +a ^,下列说法正确的是( ) A .回归直线y ^ =6.3x +a ^必经过样本点(2,19),(6,44)B .这组数据的样本点中心(x - ,y - )未必在回归直线y ^ =6.3x +a ^上 C .回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元 D .据此模型预报广告费用为7万元时销售额约为50.9万元 答案:D解析:由表格中的数据可得x - =2+3+4+5+65 =4,y - =19+25+34+38+445=32,将点(x - ,y - )的坐标代入经验回归方程得6.3×4+a ^=32, 解得a ^=6.8,所以回归方程为y ^=6.3x +6.8.对于A 选项,当x =2时,y ^=6.3×2+6.8=19.4,A 选项错误;对于B 选项,这组数据的样本点中心(x - ,y - )必在回归直线y ^ =6.3x +a ^上,B 选项错误;对于C 选项,回归系数6.3的含义是广告费用每增加1万元,销售额约增加6.3万元,C 选项错误;对于D 选项,当x =7时,y ^=6.3×7+6.8=50.9,所以据此模型预报广告费用为7万元时销售额约为50.9万元,D 选项正确.故选D .二、填空题10.已知一组数据4,2a ,3-a ,5,6的平均数为4,则a 的值是________. 答案:2解析:由平均数公式可得4+2a +(3-a )+5+65=4,解得a =2.11.某电子商务公司对10 000名网络购物者2021年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 答案:(1)3 (2)6 000解析:(1)0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a =3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.在一容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■,■,那么这组数据的方差s 2可能的最大值是________.答案:32.8解析:设这组数据的最后两个数据为10+x ,y(x ∈N ,x ≤9) ∵9+10+11+10+x +y =10×5=50, ∴x +y =10,∴y =10-x .∴s 2=15 [1+0+1+x 2+(y -10)2]=15 (2+2x 2).∵x ≤9,∴当x =9时,s 2取得最大值32.8.[能力提升]13.[2024·重庆南开中学月考]今年入夏以来,我市天气反复,降雨频繁.如图统计了上个月前15天的气温,以及相对去年同期的气温差(今年气温-去年气温,单位:摄氏度),以下判断错误的是( )A.今年每天气温都比去年同期的气温高B.今年的气温的平均值比去年同期的气温的平均值低C.去年8~11号气温持续上升D.今年8号气温最低答案:A解析:由图可知,1号温差为负值,所以今年1号气温低于去年同期的气温,故选项A 不正确;除6,7号,今年气温略高于去年同期的气温外,其他日子,今年气温都低于去年同期的气温,所以今年的气温的平均值比去年同期的气温的平均值低,选项B正确;今年8~11号气温上升,但是气温差逐渐下降,说明去年8~11号气温持续上升,选项C正确;由图可知,今年8号气温最低,选项D正确.故选A.14.(多选)[2023·新课标Ⅰ卷]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案:BD解析:取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为223=663,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.综上,选BD.15.已知一组正数x 1,x 2,x 3的方差s 2=13 (x 21 +x 22 +x 23 -12),则数据x 1+1,x 2+1,x 3+1的平均数为________. 答案:3解析:∵s 2=13 [(x 1-x - )2+(x 2-x - )2+(x 3-x -)2]=13 ⎣⎡⎦⎤x 21 +x 22 +x 23 -2x -(x 1+x 2+x 3)+3x -2 =13 ⎣⎡⎦⎤x 21 +x 22 +x 23 -3x -2 , 又s 2=13 (x 21 +x 22 +x 23 -12), ∴3x - 2=12,∴x -=2.∴x 1+1,x 2+1,x 3+1的平均数为x 1+x 2+x 3+33=3.16.已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________.答案:50解析:设除中间一个小矩形外的(n -1)个小矩形面积的和为P ,则中间一个小矩形面积为13 P ,P +13 P =1,P =34 ,则中间一个小矩形的面积等于13 P =14 ,200×14 =50,即该组的频数为50.。

高考数学一轮总复习课件:随机抽样、用样本估计总体


6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )

备战2025年高考 文科数学考点一遍过:用样本估计总体

用样本估计总体用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.一、数字特征1.众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和2.极差、方差和标准差极差:即一组数据中最大值与最小值的差.方差:2222121[()()()]n s x x x x x x n=-+-++- .标准差:s =.注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.3.性质(1)若12,,,n x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++ 的平均数为mx a +.(2)数据12,,,n x x x 与数据1122n n x x a x x a x x a '='='=+++ ,,,的方差相等,即数据经过平移后方差不变.(3)若12,,,n x x x 的方差为s 2,那么12,,n ax b ax b ax b +++ ,的方差为22a s .二、茎叶图1.定义茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.2.表示方法(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.三、统计表1.频率分布直方图(1)画频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).(2)频率分布直方图的性质①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.②频率分布直方图与众数、中位数与平均数的关系A.最高的小长方形底边中点的横坐标即是众数;B.中位数左边和右边的小长方形的面积和是相等的;C.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.各种统计表的优点与不足优点不足频率分布表表示数据较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据考向一数字特征的应用明确数字特征的意义:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.典例1为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x ,则m ,n ,x 的大小关系为________.(用“<”连接)【答案】n <m <x【解析】由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.故n <m <x .1.若样本121,1,,1n x x x +++ 的平均数为10,其方差为2,则对于样本1222,22,,22n x x x +++ 的下列结论正确的是A .平均数为20,方差为8B .平均数为20,方差为10C .平均数为21,方差为8D .平均数为21,方差为102.已知一组数据3,5,7,x ,10的平均数为6,则这组数据的方差为A.335B.6C.285D.5考向二茎叶图的应用茎叶图中的三个关注点:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.茎叶图的优、缺点:由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.典例2为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为A.100B.160C.200D.280【答案】B【解析】由茎叶图,可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.3.第十一届全国少数民族传统体育运动会将于2019年9月8日至16日在郑州举行.如下图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法正确的是A.甲的平均数大于乙的平均数B.甲的中位数大于乙的中位数C.甲的方差大于乙的方差D.甲的极差小于乙的极差4.如图,茎叶图表示甲、乙两人在5次测验中的数学分数,其中有一个被污损,若乙的中位数恰好等于甲的平均数,则 的值为_________.考向三频率分布直方图的应用频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.典例3某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为A.600B.30C.60D.300【答案】A【解析】因为a,b,c成等差数列,所以2b=a+c,由频率分布直方图可得a+b+c=150-(0.002+0.006)=0.012,所以b=0.004.故消费金额超过150元的频率为(b+0.002)×50=0.3.故该商店这一个月来消费金额超过150元的顾客数量约为2000×0.3=600.故选A.90,100, 5.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数依次分成六组:[) [)[)[)[)[]100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是A .①②B .①③C .②③D .②④典例4为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:成绩[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]频数231415124(1)作出被抽查学生成绩的频率分布直方图;(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A 1和[90,100]组中学生B 1同时被选中的概率.【解析】(1)由题意可知,各组频率分别为0.04,0.06,0.28,0.30,0.24,0.08,所以图中各组的纵坐标分别为:0.004,0.006,0.028,0.030,0.024,0.008,则被抽查学生成绩的频率分布直方图如图所示:(2)记[40,50)组中的学生为A1,A2,[90,100]组中的学生为B1,B2,B3,B4,A1和B1同时被选中记为事件M.由题意可得,全部的基本事件为:A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,事件M包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共3个,所以学生A1和B1同时被选中的概率为P(M)=312=14.6.伴随着科技的迅速发展,国民对“5G”一词越来越熟悉,“5G”全称是第五代移动电话行动通信标准,也称第五代移动通信技术.2017年12月10日,工信部正式对外公布,已向中国电倌、中国移动、中国联通发放了5G系统中低频率使用许可.2019年2月18日上海虹桥火车站正式启动5G网络建设.为了了解某市市民对“5G”的关注情况,通过问卷调查等方式研究市民对该市300万人口进行统计分析,数据分析结果显示:约60%的市民“掌握一定5G知识(即问卷调查分数在80分以上)”,将这部分市民称为“5G爱好者”.某机构在“5G爱好者”中随机抽取了年龄在15-45岁之间的100人按照年龄分布(如图所示),其分组区间为:[15,20),[20,25),[25,30),[30,35),[35,40),[40,45].(1)求频率分布直方图中的a的值;(2)估计全市居民中35岁以上的“5G爱好者”的人数;(3)若该市政府制定政策:按照年龄从小到大,选拔45%的“5G爱好者”进行5G的专业知识深度培养,按照上述政策及频率分布直方图,估计该市“5G爱好者”的年龄上限.1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有A.0个B.1个C.2个D.3个2.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是A.A县B.B县C.A县、B县两个地区相等D.无法确定3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82)、[82,84),[84,86)、[86,88)、[88,90)、[90,92)、[92,94)、[94,96],则样本的中位数在A.第3组B.第4组C.第5组D.第6组4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为61,则模糊不清的数字为A.1B.2C.3D.45.某人为了检测自己的解题速度,记录了5次解题所花的时间(单位:分)分别为,,55,60,50x y,已知这组数据的平均数为55,方差为525,则||x y=A.1分B.2分C.3分D.4分6.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的-=茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则x yA.3B.3-C.4D.4-7.在某次高中数学竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为,,,则,,的大小关系为A.<<B.<<C.<<D.<<8.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A.100,10B.100,20C.200,10D.200,209.某地区为了解小学生的身高发育情况,从某小学随机抽取100名同学,将他们的身高(单位:厘米)数a b ,由图中可知,身高落在[110,130)范围内的学生人数是据绘制成频率分布直方图(如图).若:7A.35B.24C.46D.6510.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格率(60分及以上为及格)、平均分分别为A.75%,71B.80%,85C.85%,90D.70%,6511.某赛季甲、乙两名篮球运动员每场比赛的得分如茎叶图所示,则下列结论错误的是A.乙运动员得分的中位数是36B .甲运动员发挥的稳定性比乙运动员发挥的稳定性差C .甲运动员的平均分为27分D .乙运动员的得分有613集中在茎3上12.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:总体均值为2,总体方差为3D .丁地:中位数为2,众数为313.一个样本a ,3,5,7的平均数是b ,且a ,b 分别是数列{}()2*2n n -∈N 的第2项和第4项,则这个样本的方差是A .3B .4C .5D .614.某网店在2019年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的35,则消费金额超过4千元的人数为A .12B .15C .16D .1815.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则A .270,75x s =<B .270,75x s =>C .270,75x s ><D .270,75x s ><16.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是A .4B .5C .8D .1017.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分18.某次知识竞赛中,五个参赛小队的初始积分都是50,在答题过程中,各小队每答对一题可使本队积分增加5,每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是4,7,6,2,5,则这五个小队积分的方差为.19.某市为了增加2020届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用2019年暑假组织部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出100名学生,统计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这100名学生中参加夏令营的天数在[6,10)的人数为.20.某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为________.21.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久的历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为_____________药物单位.22.为组织好第十一届全国少数民族传统体育运动会,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为______________;(2)这800名志愿者中年龄在[25,35)内的人数为______________.23.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从报名的所有人中按男女比例采用分层抽样的方式抽取了100名,统计了他们的笔试成绩(满分100分),统计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.分数区间频数频率[50,60)80.08[60,70)b[70,80)420.42[80,90)a0.26[90,100]8合计1001.00(1)求a与b的值,并作出频率分布直方图;(2)(i)根据表中数据,估计这100名人员笔试成绩的中位数(精确到小数点后1位);(ii)分析知,这100名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为概率,在总共2000名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.分数段[50,60)[60,70)[70,80)[80,90)[90,100]男女比例1∶13∶13∶47∶63∶524.随着科技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区100名高中生某一周使用手机的时间(单位:小时),所取样本数据分组区间为[0,2)、[2,4)、[4,6)、[6,8)、[8,10)、[10,12),由此得到如图所示的频率分布直方图.(1)求的值并估计该地区高中生一周使用手机时间的平均值;(2)从使用手机时间在[6,8)、[8,10)、[10,12)、[12,14]的四组学生中,用分层抽样方法抽取13人,则每层各应抽取多少人25.某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图因事故都受到不同程度的损坏,但可见部分如下,据此解答如下问题:(1)求分数在[50,60)的频率及全班人数;(2)求分数在[80,90)的频数,并计算频率分布直方图中[80,90)间的矩形的高;(3)若规定:90分(包含90分)以上为优秀,现从分数在80分(包含80分)以上的试卷中任取两份分析学生失分情况,求在抽取的试卷中至少有一份优秀的概率.26.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦·时),将数据按[0,1),[1,2),[2,3),[3,4),[4,5),[5,6),[6,7),[7,8),[8,9)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的值;(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦·时的人数及每户居民月均用电量的中位数;(3)政府计划对月均用电量在4百千瓦·时以下的用户进行奖励,月均用电量在[0,1)内的用户奖励20元/月,月均用电量在[1,2)内的用户奖励10元/月,月均用电量在[2,4)内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.27.某数学兴趣小组有男、女生各5名,以下茎叶图记录了该小组同学在一次数学测试中的成绩(单位:分).已知男生数据的中位数为125,女生数据的平均数为126.8.(1)求,x y的值;(2)现从成绩高于125分的同学中随机抽取两名同学,求抽取的两名同学恰好为一男一女的概率.28.已知经销某种商品的电商在任何一个销售季度内,每售出1吨该商品可获利润0.5万元,未售出的商品,每1吨亏损0.3万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了130吨该商品.现以x (单位:吨,100150x ≤≤)表示下一个销售季度的市场需求量,T (单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.(1)根据频率分布直方图,估计一个销售季度内市场需求量x 的平均数与中位数的大小;(2)根据频率分布直方图估计利润T 不少于57万元的概率.1.(2017新课标全国Ⅰ文科)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.(2017山东文科)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5B.5,5C.3,7D.5,73.(2017新课标全国Ⅲ文科)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳4.(2016新课标全国Ⅲ文科)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15o C,B点表示四月的平均最低气温约为5o C.下面叙述不正确的是A.各月的平均最低气温都在0o C以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20o C的月份有5个5.(2016山东文科)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25), [25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56B.60C.120D.1406.(2019年高考江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.7.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为▲.8.(2019年高考全国Ⅱ卷文数)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)748.602≈.9.(2019年高考全国Ⅲ卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).10.(2018新课标全国Ⅰ文科)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:。

高中数学用样本估计总体


什么是简单随机抽样?什么样的总体适宜简单随机抽样?
什么是系统抽样?什么样的总体适宜 系统抽样?
什么是分层抽样?什么样的总体适宜分层抽样? 抽样是统计的第一步,接下来就要对样本进行分析
复习回顾
1
通过图、表、计算来分析样本数据,找出数据中的规律,就可以对总体作出相应的估计.
2
这种估计一般分成两种: ①是用样本的频率分布估计总体的分布. ②是用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
01
样本量越大,样本中落在每个区间内的样本数的频率越稳定于总体在相应区间内的取值的概率, 样本量越大,用样本的频率分布去估计总体的分布就越精确。
02
样本量越大,划分的区间越多,每个区间长度越短,频率折线图就越接近于一条曲线
已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9, 11,12,9,10,11,11, 那么频率为0.2范围的是( )
用一组数据的极差、方差或标准差来反映这组数据离散程度或波动情况.
标准差:s
用样本的频率分布 估计总体分布(1)
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
探究:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费。 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做哪些工作?
3
用样本去估计总体,是研究统计问题的一个基本思想.
4
初中时我们学习过样本的频率分布,包括频数、频率的概念,频率分布表和频率分布直方图的制作.

高考数学复习:用样本估计总体


3.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组 区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值.
(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分
布直方图,估计这100名学生语文成绩的平均分.
四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是
()
A.15
B.18
C.20
D.25
【解析】选A.根据频率分布直方图,得第二小组的频率是0.040×10=0.4,因为第
二小组的频数是40,所以样本容量是 40=100,又成绩在80~100分的频率是
0.4
(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.
研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平.
(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的
概率.
【解析】(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平
均数为 x甲=10=2;
15 3
方差为
s甲2 =115
[(1
A.me=m0= x C.me<m0< x
B.me=m0< x D.m0<me< x
【解析】选D.由题干图可知,30名学生的得分情况依次为:2个人得3分,3个人得4
分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10
分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现的次数最多,故 众数m0=5.平均数x= 1 ×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高考数学专题复习:用样本估计总体一、单选题1.某班50名学生在一次百米测试中,成绩全部不小于13秒且小于19秒,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别是()A.90%,35 B.90%,45C.10%,35 D.10%,452.某同学郑一粒均匀的骰子5次,记录每次骰子出现的点数,若其中至少出现了1次点数6,则这组数据不可能得出的统计结果是()A.平均数为3,中位数为2 B.中位数为3,众数为2C.平均数为2,方差为3 D.中位数为3,方差为2.83.某中学有10个学生社团,每个社团的人数分别是70,60,60,50,60,40,40,30,30,10,则这组数据的平均数,众数,中位数的和为()A.165 B.160 C.150 D.1704.四名同学各掷一枚骰子5次,分别记录每次骰子出现的点数.根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是()A.平均数为2,方差为2.4 B.中位数为3,众数为2C.平均数为3,中位数为2 D.中位数为3,方差为2.85.某市2020年各月的平均气温(℃)数据的茎叶图如下,则这组数据的中位数是()A .21B .22C .22.5D .236.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 ,x x 甲乙,则下列说法正确的是( )A . x x >甲乙,乙比甲成绩稳定,应选乙参加比赛B . x x >甲乙,甲比乙成绩稳定,应选甲参加比赛C . x x <甲乙,甲比乙成绩稳定,应选甲参加比赛D . x x <甲乙,乙比甲成绩稳定,应选乙参加比赛7.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为2s ,则( )A .242,x s ==B .24,2x s =>C .24,2x s =<D .24,2x s ><8.某校高一年级一名学生七次月考数学成绩(满分100分)分别为78,82,84,84,86,89,96,则这名学生七次月考数学成绩的第80百分位数为( ) A .82B .84C .89D .969.某校高一甲、乙两个班分别有男生24名、15名,现用比例分配的分层随机抽样方法从两班男生中抽取样本量为13的样本,对两个班男生的平均身高进行评估.已知甲班、乙班男生身高的样本平均数分别为175cm 、177.6cm ,以所抽取样本的平均身高作为两个班男生的平均身高,则两个班男生的平均身高为( )A .176cmB .176.3cmC .176.6cmD .176.9cm10.设一组样本数据12,,n x x x 的平均值为2,则数据1229,29,,29n x x x ++⋅⋅⋅+的平均值为( ) A .11B .12C .13D .1411.某同学掷骰子4次,并记录了每次骰子出现的点数,得出平均数为2,方差为12的统计结果,则下列点数中一定不出现的是( ) A .1B .2C .3D .512.某单位共有A 、B 、C 三个部门,三部门人员平均年龄分别为38岁、24岁、42岁,又已知A 和B 两部门人员平均年龄为30岁,B 和C 两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为( ) A .34岁 B .35岁C .36岁D .37岁二、填空题13.一组数6,5,4,3,3,3,2,2,2,1的80%分位数为________.14.学校进行30秒跳绳测试,某小组8名同学的跳绳个数如下面的茎叶图所示,则该组数据的方差为________.15.某企业生产甲、乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:由于表格被污损,数据a ,b 看不清,统计员只记得甲、乙两种产品检测数据的平均数和方差都相等,则ab =________.16.已知样本数据1x ,2x ,⋯,2020x 的平均数与方差分别是m 和n ,若2(1i i y x i =-+=,2,⋯,2020),且样本数据的1y ,2y ,⋯,2020y 平均数与方差分别是n 和m ,则222122020x x x ++⋯+=________.三、解答题17.高一年级期末考试成绩各分数段[)0,90,[)90,105,[)105,120,[)120,135,[]135,150的频率分布如下图.(Ⅰ)计算高一年级所有同学成绩的中位数;(Ⅱ)用各分数段的中间值代替各分数段的平均值,并且删去[)0,90,[]135,150两个分数段,试估计高一年级期末考试成绩的平均值;(Ⅲ)若高一年级有1000人,把成绩从低到高编号,用系统抽样的方法从中抽取一个容量为20的样本,其中一个个体的编号为63,请写出抽样在[)105,120之间的个体的编号.18.20名学生某次数学考试成绩(单位:分)的频率分布直方图如图.(1)求频率分布直方图中a 的值;(2)估计总体中成绩落在[)50,60中的学生人数;(3)根据频率分布直方图估计20名学生数学考试成绩的众数,中位数;19.甲、乙两位同学要参加数学竞赛,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,绘制成茎叶图如下(单位:分).(1)分别写出甲、乙两位同学6次预赛成绩的众数、中位数;(2)计算甲、乙两位同学6次预赛成绩的平均数与方差,并判断谁的成绩更稳定.20.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示.(1)确定直方图中x 的值,并求月平均用电量的众数和中位数;(2)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[)220,240内的用户中应抽取多少户?21.下表为30位学生参加语文竞赛的成绩,并由小到大排列.(1)求第一、二、三四分位数;(2)求第10百分位数;(3)求第95百分位数.22.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)①求在这些用户中,用电量在区间[100,250)内的居民数;②如果按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,那么用电量在[150,200)内的居民数应抽取多少?参考答案1.A 【分析】频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.建立相应的关系式,即可求得. 【详解】解:从频率分布直方图上可以看出1(0.060.04)0.9x =-+=,50(0.360.34)35y =⨯+=,故选:A . 2.C 【分析】对于选项ABD ,举出满足条件且出现点数为6的例子,对于选项C ,由于至少出现一个点数6,结合平均数为2,计算方差即可判断作答. 【详解】对于A ,中位数为2的5个点数是1,1,2,5,6,平均数为1125635++++=,选项A 可能出现;对于B ,中位数为3,众数为2的5个点数是2,2,3,4,6或2,2,3,5,6均符合要求,即选项B 可能出现;对于C ,因平均数为2,且至少出现了1次点数6,则方差221(62) 3.25s >-=,即方差不可能为3,选项C 不可能出现;对于D ,中位数为3的5个点数是1,2,3,3,6,平均数为1233635++++=,方差2222221[(13)(23)(33)(33)(63)] 2.85s =-+-+-+-+-=,选项D 可能出现.故选:C 3.C 【分析】将数字从小到大(或从大到小)排列,得到众数和中位数,再算出平均数,即可得到答案. 【详解】人数分别是10,30,30,40,40,50,60,60,60,70,则众数为60,中位数为4050452+=,平均数为103030404050606060704510+++++++++=,∴平均数,众数,中位数的和为:60+45+45=150. 故选:C. 4.A 【分析】选项A ,利用反证法说明一定含6,选项BCD 中依次举例说明可能含有6即可. 【详解】对于A ,若平均数为2,且出现点数6,则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6,所以A 可以判断;对于B ,当掷骰子出现的结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点6,所以B 不能判断;对于C ,当掷骰子出现的结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点6,所以C 不能判断;对于D ,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,则平均数为1(12336)35x =++++=,方差为2222221[(13)(23)(33)(33)(63)] 2.85S =-+-+-+-+-=,所以可以出现点6,所以D 不能判断. 故选:A. 5.B 【分析】由茎叶图得到数据最中间的两个数是21和23,即得解. 【详解】由茎叶图可知,数据最中间的两个数是21和23, 所以数据的中位数为21+23=222. 故选:B 6.D 【分析】根据茎叶图中的数据计算平均数得的平均数是82,乙的平均数是87,再根据茎叶图分析甲与乙的稳定性即可得答案. 【详解】由茎叶图可知,甲的平均数是727879858692826+++++=,乙的平均数是788687879193876+++++=,所以乙的平均数大于甲的平均数,即 x x <甲乙, 从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛. 故选:D. 7.C 【分析】由已知条件,根据平均数和方差的计算公式进行求解即可. 【详解】 根据题意有47448x ⨯+==, 而()22724428s ⨯+-=<.故选:C. 8.C 【分析】利用百分位数的定义分析求解即可. 【详解】解:因为780% 5.6⨯=,所以这名学生七次月考数学成绩的第80百分位数为89. 故选:C. 9.A 【分析】由题知13个的样本中,甲班男生有8人,乙班男生有5人,进而得两个班男生的平均身高为()11758177.6517613⨯+⨯=. 【详解】解:根据题意,抽出来的13个的样本中,甲班男生有241382415⨯=+人,乙班男生有151352415⨯=+人,所以根据题意得两个班男生的平均身高为()11758177.6517613⨯+⨯= 故选:A 10.C 【分析】利用平均数公式求解即可. 【详解】 因为122nx x x n+++=,所以12292929n x x x n++++++,()122913n x x x n+++=+=,故选:C. 11.D 【分析】利用方差的公式检验四个选项的正误即可得正确选项. 【详解】当有一个数是5,则()25291442-=>,所以5一定不出现;当有一个数是3时,()23211442-=<,所以3可能出现; 当有一个数是2时,()2221042-=<,所以2可能出现; 当有一个数是1时,()21211442-=<,所以1可能出现;故选:D. 12.B 【分析】设A 、B 、C 三个部门的人数分别为,,a b c ,根据已知条件列出方程组可求出34a b =,54c b =,然后再根据平均数的计算公式,即可求出该单位全体人员的平均年龄.【详解】设A 、B 、C 三个部门的人数分别为,,a b c ,由题意得382430244234a b a b b c b c+⎧=⎪⎪+⎨+⎪=⎪+⎩,所以3454a b c b ⎧=⎪⎪⎨⎪=⎪⎩, 所以该单位全体人员的平均年龄为3538244238244244353544b b b a bc a b c b b b ⨯++⨯++==++++. 故选:B13.4.5【分析】将数据按从小到大的顺序排列,第8和第9个数的平均数即可.【详解】一组数6,5,4,3,3,3,2,2,2,1按从小到大的顺序排列,可得1,2,2,2,3,3,3,4,5,6,共10个,由1080%8⨯=,所以该组数据的80%分位数为45 4.52+=, 故答案为:4.5.14.17.5【分析】先求出该组数据的平均数,再由方差公式即可求出.【详解】 由图可知,该组数据的平均数为4144454750515254488+++++++=, 所以方差为()()()()2222222217431234617.58⎡⎤⨯-+-+-+-++++=⎣⎦. 故答案为:17.5.15.72【分析】求出均值可得17a b +=,再由方差相等可得()()22881a b -+-=,解方程组即可求解.【详解】77+7.5+9+9.56+8.5+8.5+=8=55a x xb ++==甲乙,可得17a b += ①, ()()()()()22222878787.58989.5 5.5D =-+-+-+-+-=甲 ,则()()()()()2222286888.588.58 5.5D a b =-+-+-+-+-=乙,可得()()22881a b -+-= ②, 由①②可得89,98a a b b ==⎧⎧⎨⎨==⎩⎩,所以72ab = , 故答案为:72 .16.4040【分析】由样本数据的平均数、方差的性质列方程组求出1m =,1n =,从而2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=,由此能求出222122020x x x ++⋯+的值. 【详解】由题意得:2m n m n -+=⎧⎨=⎩, 解得1m =,1n =, ∴2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=, 22212202012202020202()2020x x x x x x ∴++⋯++-++⋅⋅⋅+=,2221220201220202()220204040x x x x x x ∴++⋯+=++⋅⋅⋅+=⨯=.故答案为:4040.17.(Ⅰ)110分;(Ⅱ)111.5分;(Ⅲ)413,463,513,563,613,663.【分析】(1)根据中位数的概念即可求解;(Ⅱ)结合加权平均数的计算公式即可求出结果;(Ⅲ)由系统抽样中等间隔即可求出结果.【详解】(1)由题图可知[)0,90和[)90,105分数段内的人数占总人数的40%,故中位数在[)105,120分数段内从低到高13处,则中位数为1105151103+⨯=(分). (Ⅱ)[)90,105,[)105,120,[)120,135三个分数段的中间值分别为97.5,112.5,127.5,人数比为25%:30%:20%5:6:4=,则估计高一年级期末考试成绩的平均值为97.55112.56127.54111.5564⨯+⨯+⨯=++(分). (Ⅲ)由题图可得[)0,90分数段内有150人,[)90,105分数段内有250人,[)105,120分数段内有300人,则[)105,120分数段内的编号是从401到700,由题意,两个相邻样本的编号差为10005020=,则在分数段[)105,120内抽取的个体的编号为413,463,513,563,613,663. 18.(1)0.005a =;(2)2人;(3)众数为75,中位数为5407. 【分析】(1)由频率和为1可求出a 的值;(2)先求出成绩落在[)50,60的频率,从而可求出频数;(3)由图可知众数在第3组,从而可得众数为7080752+=,由于前2组的频率和小于0.5,前3组的频率和大于0.5,所以中位数在第3组,列方程可求得结果【详解】(1)()23762101a a a a a ++++⨯=,解得0.005a =.(2)由频率分布直方图得成绩落在[)50,60中的频率为2100.1a ⨯=,∴估计总体中成绩落在[)50,60中的学生人数为:200.12⨯=人.(3)根据频率分布直方图估计20名学生数学考试成绩的众数为:7080752+=, 由于前2组的频率和10(0.010.015)0.250.5⨯+=<,前3组的频率和10(0.010.0150.035)0.60.5⨯++=>,所以中位数在第3组,设中位数为x ,则()()0.010.015100.035700.5x +⨯+-= 解得5407x =,所以中位数为540719.(1)甲同学6次预赛成绩的众数为82分,中位数为82分,乙同学6次预赛成绩的众数为85分,中位数为81.5分;(2)甲同学预赛的平均成绩82分;乙同学预赛的平均成绩81分,甲同学预赛成绩的方差为313;乙同学预赛成绩的方差为13;甲同学成绩更稳定. 【分析】(1)甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85,进而可得答案;(2)根据茎叶图,计算即可得平均数与方差,再根据数字特征的意义即可得答案.【详解】(1)由茎叶图可知,甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85;所以,甲同学6次预赛成绩的众数为82分,中位数为8282822+=(分),乙同学6次预赛成绩的众数为85分,中位数为808381.52+=(分) (2)甲同学预赛的平均成绩121223880826x --++++=+=分 乙同学预赛的平均成绩243035580816x --++++=+=分, 甲同学预赛成绩的方差为22222221131(7882)(7982)(8282)(8282)(8382)(8882)63s ⎡⎤=-+-+-+-+-+-=⎣⎦ 乙同学预赛成绩的方差为222222221(7681)(7781)(8081)(8381)(8581)(8581)136s ⎡⎤=-+-+-+-+-+-=⎣⎦ 由2221s s >,所以,甲同学成绩更稳定20.(1)0.0075x =,众数为230度,中位数224度;(2)5户.【分析】(1)由频率和为1列方程可求出x 的值,由[)220,240对应的频数最大,可求出众数,由前3组的频率和小于0.5,前4组的频率和大于0.5,所以中位数在第4组,设中位数为t 度,则0.50.45220200.25t -=+⨯; (2)利用分层抽样的比进行求解即可【详解】(1)因为()0.0020.00250.0050.00950.0110.0125201x ++++++⨯=,所以0.0075x =; 由频率分布直方图可知:[)220,240对应的频数最大,所以众数为230度;因为前三组频率之和为()0.0020.00950.011200.450.5++⨯=<,第四组频率为0.0125200.25⨯=,且0.450.250.70.5+=>,所以中位数在第四组数据中,设中位数为t 度, 所以0.50.45220202240.25t -=+⨯=. (2)因为[)220,240,[)240,260,[)260,280,[]280,300的频率之比为()()()()0.012520:0.007520:0.00520:0.0025205:3:2:1⨯⨯⨯⨯=,所以月平均用电量在[)220,240内的用户中应抽取:51155321⨯=+++户, 答:月平均用电量在[)220,240内的用户中应抽取5户.21.(1)第一四分位数为65,第二四分位数为75.5,第三四分位数为85;(2)56.5;(3)99.【分析】(1)由30×25%,30×50%,30×75%分别确定第一、二、三四分位数的位置即可; (2)由30×10%确定第10百分位数的位置; (3)由30×95%确定第95百分位数的位置 【详解】解:(1)30×25%=7.5,取第8项数据,所以第一四分位数为65,30×50%=15,取第15、16项数据的平均数,所以第二四分位数为75762+=75.5;30×75%=22.5,取第23项数据,所以第三四分位数为85.(2)30×10%=3,取第3、4项数据的平均数,所以第10百分位数为55582+=56.5. (3)30×95%=28.5,取第29项数据,所以第95百分位数为99. 22.(1)x =0.0044;(2)①70户;②3(户).【分析】(1)由频率分布直方图,列出方程,能求出直方图中x 的值.(2)①先求出用电量在[100,250)内的频率为0.7,由此能求出在这些用户中,用电量在区间[100,250)内的居民数.②用电量在[150,200)内的户数为30户,由此利用分层抽样的性质能求出用电量在[150,200)内的居民数应该抽取的户数.【详解】(1)由频率分布直方图得:(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得直方图中x=0.0044.(2)①用电量在[100,250)内的频率为:(0.0036+0.0060+0.0044)×50=0.7,∴在这些用户中,用电量在区间[100,250)内的居民数为100×0.7=70户.②用电量在[150,200)内的户数为0.0060×50×100=30(户),按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,用电量在[150,200)内的居民数应该抽取:130310⨯=(户).。

相关文档
最新文档