高三数学一轮复习 用样本估计总体巩固与练习

合集下载

2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)

2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)

2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体考试要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理1.百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.平均数、中位数和众数(1)平均数:x=1n(x1+x2+…+x n).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).3.方差和标准差(1)方差:s2=1n错误!(x i -x)2或1n错误!2i-x2.(2)标准差:s=错误!.4.总体(样本)方差和总体(样本)标准差(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体平均数为Y,则总体方差S2=1N错误!(Y i-Y)2.(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2=1N错误!i(Y i-Y)2.常用结论1.若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数为m x+a.2.数据x1,x2,…,x n与数据x1′=x1+a,x2′=x2+a,…,x n′=x n+a的方差相等,即数据经过平移后方差不变.3.若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)对一组数据来说,平均数和中位数总是非常接近.(×)(2)方差与标准差具有相同的单位.(×)(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)教材改编题1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()A.2B.4C.6D.8答案D解析根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()A.88.5B.89C.91D.89.5答案B解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.答案178.5解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,则178+1792=178.5,所以所求中位数为178.5.题型一样本的数字特征和百分位数的估计例1(1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A.92,85B.92,88C.95,88D.96,85答案B解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,计算10×25%=2.5,取第三个数,所以第25百分位数是88.延伸探究本例中,第70百分位数是多少?解10×70%=7,第70百分位数是第7项与第8项的平均数,为92+962=94.(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM 2.5)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()A .极差B .中位数C .众数D .平均数答案ABD解析根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,要发生改变;加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数为176,发生改变;众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为x ,加入数据后,平均数为12x +42113>x,发生改变.思维升华计算一组n 个数据第p 百分位数的步骤跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()A .102B .103C .109.5D .116答案C 解析这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为103+1162=109.5.(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.自1924年起,每四年举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则()A .甲社团宣传次数的众数小于乙社团宣传次数的众数B .甲社团宣传次数的极差大于乙社团宣传次数的极差C .甲社团宣传次数的平均数大于乙社团宣传次数的平均数D .甲社团宣传次数的方差大于乙社团宣传次数的方差答案ABD解析观察每天宣传次数的频数分布折线图,甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A 正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B 正确;甲社团宣传次数的平均数x 1=2+2+3+2+5+4+37=3,乙社团宣传次数的平均数x 2=2+2+3+4+3+3+47=3,C 不正确;甲社团宣传次数的方差s 21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社团宣传次数的方差s 22=17×[2×(2-3)2+3×(3-3)2+2×(4-3)2]=47,D 正确.题型二总体集中趋势的估计例2为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m 的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.解(1)由频率分布直方图知(0.01+m +0.04+0.02)×10=1,解得m =0.03;设此次竞赛活动学生成绩的中位数为x 0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x 0<90,由(x 0-80)×0.04=0.5-0.4,得x 0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由频率分布直方图及(1)知,x =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.思维升华频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2(2022·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a 的值及众数、中位数;(2)若树苗高度在185cm 及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?解(1)∵(0.0015+0.0110+0.0225+0.0300+a +0.0080+0.0020)×10=1,∴a =0.0250,众数为185+1952=190,设中位数为x ,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,则185<x<195,0.35+0.0300×(x-185)=0.5,∴x=190.故a=0.0250,众数为190,中位数为190.(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为1-0.65=0.35,所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),故不合格树苗、合格树苗应分别抽取7株和13株.题型三总体离散程度的估计例3(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解(1)由表格中的数据易得x=110×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+10.0=10.0,y=110×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y -x =10.3-10.0=0.3,而2s 21+s 2210=25(s 21+s 22)=0.0304,显然有y -x >2s 21+s 2210著提高.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x 甲=18×(82+81+79+78+95+88+93+84)=85,x 乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x 甲=x 乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.课时精练1.为做好疫情防控工作,某校坚持落实“双测温两报告”制度,以下是某宿舍6名学生某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:℃),则该组数据的第80百分位数为()A .36.7B .36.6C .36.5D .36.4答案B解析将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,因为80%×6=4.8,所以该组数据的第80百分位数为36.6.2.(2022·南京模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,则另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数、方差分别为()A .2,12B .2,1C .4,32D .4,92答案D解析因为一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,所以另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为3×2-2=4,方差为32×12=92.3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独角兽企业TOP100的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是()A .随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B .在该TOP100榜单中独角兽企业数量的中位数是3C .在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家D .2022年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%答案AD解析A 选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A 选项正确;B 选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B 选项不正确;C 选项,100×70%=70<82,故C 选项不正确;D 选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为11+10+10100×100%=31%>30%,故D 选项正确.4.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率0.250.300.200.25则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()A .众数约为2.5B .中位数约为3.83C .平均数为3.95D .第80百分位数约为5.2答案BCD解析对于A ,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为3+42=3.5,故A 错误;对于B ,设高一年级学生每周体育锻炼时长的中位数为x ,则0.25+x -34-3×0.30=0.5,解得x ≈3.83,故B 正确;对于C ,高一年级学生每周体育锻炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C 正确;对于D ,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育锻炼时长的第80百分位数约为5+0.050.25=5.2,故D 正确.5.(多选)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)()A.b的值为0.25B.候选者面试成绩的中位数约为69.4C.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人D.估计候选者的面试成绩的平均数约为69.5答案BD解析对于A,由(0.005+b+0.045+0.02+0.005)×10=1,解得b=0.025,故A错误;对于B,设候选者面试成绩的中位数为x,则(0.005+0.025)×10+(x-65)×0.045=0.5,解得x≈69.4,故B正确;对于C,成绩在区间[65,75)的频率为0.045×10=0.45,故人数为80×0.45=36,故C错误;对于D,50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5,故D正确.6.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数x<4;②平均数x<4且极差小于或等于3;③平均数x<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案B解析①举反例:0,0,0,4,11,其平均数x=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与x<4矛盾,故假设错误.则此组数据全部小于10.符合入冬指标;③举反例:1,1,1,1,11,平均数x=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.7.(2022·福州模拟)电影《长津湖》点燃了人们心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]内的有15位,则这70位观众年龄的众数的估计值为________.答案35解析由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为30+402=35.8.(2023·沧州模拟)已知某样本数据分别为1,2,3,a ,6,若样本平均数x =3,则样本方差s 2=________.答案145解析由题设,得x =1+2+3+a +65=3,可得a =3,所以s 2=15错误!(x i -x )2=145.9.(2023·南通模拟)某学校对高一某班的同学进行了身高(单位:cm)调查,将得到的数据进行适当分组后(除最后一组为闭区间外其余每组为左闭右开区间),画出如图所示的频率分布直方图.(1)求m 的值;(2)估计全班同学身高的中位数;(3)估计全班同学身高的平均数及方差(同一组中的数据用该组区间的中点值作代表).解(1)由频率分布直方图可得(m +0.010+0.010+0.015+0.040)×10=1,解得m =0.025.(2)设全班同学身高的中位数为x ,由题可知x ∈[165,175),得0.10+0.15+(x -165)×0.040=0.5,解得x =171.25,故估计全班同学身高的中位数为171.25.(3)估计全班同学身高的平均数为150×0.10+160×0.15+170×0.40+180×0.25+190×0.10=171,估计全班同学身高的方差为(150-171)2×0.10+(160-171)2×0.15+(170-171)2×0.40+(180-171)2×0.25+(190-171)2×0.10=119.10.对参加某次数学竞赛的1000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛的选手成绩?解(1)填表如下:成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数50150350350100(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差为(55-78)2×0.05+(65-78)2×0.15+(75-78)2×0.35+(85-78)2×0.35+(95-78)2×0.1=101.(3)进入复赛的选手成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上均可).11.(2022·天津模拟)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28答案D解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%;所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.12.(2022·上海模拟)若等差数列{x n }的公差为3,则x 1,x 2,x 3,…,x 9的方差为________.答案60解析由等差数列{x n }的公差为3,可知x =x 1+x 2+…+x 99=x 1+x 92×99=x 1+x 92=x 5,所以方差s 2=19[(x 1-x 5)2+(x 2-x 5)2+…+(x 9-x 5)2]=19(16d 2+9d 2+4d 2+d 2)×2=203d 2=203×9=60.13.(多选)某学校规定,若五个工作日内学校某天有超过3个人的体温测量值高于37.5℃,则需全员进行核酸检测.该校统计了五个工作日内每天体温超过37.5℃的人数,则根据这组数据的下列信息,能断定该校不需全员进行核酸检测的是()A .中位数是1,平均数是1B .中位数是1,众数是0C .中位数是2,众数是2D .平均数是2,方差是0.8答案AD 解析对于A ,因为中位数是1,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,1,c ,d ,因为平均数是1,所以a +b +1+c +d =5,若d =4,则a =b =c =0,与中位数是1矛盾,故A 正确;对于B ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,0,1,2,4,满足中位数是1,众数是0,但有一天超过3人,故B 错误;对于C ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,2,2,3,4,满足中位数是2,众数是2,但有一天超过3人,故C 错误;对于D ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,c ,d ,e ,因为平均数是2,方差是0.8,则a +b +c +d +e =10,15[(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2]=0.8,即(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2=4,则e≤4,若e=4,从方差角度来说a=b=c=d=2,不满足a+b+c+d+e=10,所以e<4,同理a,b,c,d均小于4,故D正确.14.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是()A.4B.12C.18D.20答案AC解析设丢失的数据为x,则这七个数据的平均数为31+x7,众数是3,若3<x<5,则中位数为x,此时31+x7+3=2x,解得x=4;若x≥5,则中位数为5,此时31+x7+3=2×5,解得x=18.综上所述,丢失的数据可能是4或18.。

新高考数学一轮复习考点知识专题讲解与练习 57 用样本估计总体

新高考数学一轮复习考点知识专题讲解与练习 57 用样本估计总体

新高考数学一轮复习考点知识专题讲解与练习考点知识总结57 用样本估计总体高考概览高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度考纲研读1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图,并体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据的标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差、百分位数),并做出合理的解释4.会计算分层随机抽样的样本均值与样本方差5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题一、基础小题1.一组数据90,92,99,97,96,x的众数是92,则这组数据的中位数是() A.94 B.95 C.96 D.97答案A解析数据90,92,99,97,96,x的众数是92,则x=92,所以这组数据为90,92,92,96,97,99,则这组数据的中位数是12×(92+96)=94.故选A.2.如图所示是根据某市3月1日至10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2 B.0C.1 D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.3.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积和的14,且样本量为80,则中间一组的频数为() A.0.25 B.0.5 C.20 D.16答案D解析设中间一组的频数为x,依题意有x80=14⎝⎛⎭⎪⎫1-x80,解得x=16.4.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是()A.1.78小时B.2.24小时C.3.56小时D.4.32小时答案C解析该地“上班族”每天在工作之余使用手机上网的平均时间是(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56小时.5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级人数平均分数方差甲20x-2甲乙30x-3乙其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案C解析由题意可知两个班的数学成绩平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30×[2+(x-甲-x-)2]+3020+30×[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.6.2022年4月24日下午,随着最后1例新冠肺炎重症患者治愈,武汉重症病例实现了清零,抗疫工作取得了阶段性重大胜利.某方舱医院从出院的新冠肺炎患者中随机抽取100人,将这些患者的治疗时间(都在[5,30]天内)进行统计,制作出频率分布直方图如图所示,则估计该院新冠肺炎患者治疗时间的中位数是()A.16 B.17C.18 D.19答案B解析设这100名新冠肺炎患者治疗时间的中位数是x,∵(0.01+0.05)×5=0.3<0.5,(0.01+0.05+0.1)×5=0.8>0.5,∴x∈[15,20),0.3+(x-15)×0.1=0.5,解得x=17,则该院新冠肺炎患者治疗时间的中位数是17.故选B.7.(多选)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,下列说法中正确的是()A.这七人岁数的众数变为40B.这七人岁数的平均数变为49C.这七人岁数的中位数变为60D.这七人岁数的标准差变为24答案ABC解析根据众数、平均数、中位数的概念得5年后,每人的年龄相应增加5,而标准差不变,所以这七人年龄的众数变为40;平均数变为49;中位数变为60;标准差不变,为19.故选ABC.8.(多选)为了解运动健身减肥的效果,某健身房调查了20名肥胖者,测量了他们的体重(单位:千克).健身之前他们的体重情况如三维饼图1所示,经过半年的健身后,他们的体重情况如三维饼图2所示.对比健身前后,关于这20名肥胖者,下列结论正确的是()A.他们健身后,体重在区间[90,100)内的人数不变B.他们健身后,体重在区间[100,110)内的人数减少了2个C.他们健身后,体重在区间[110,120)内的肥胖者体重都有减轻D.他们健身后,这20名肥胖者的体重的中位数位于区间[90,100)答案ACD解析题图1中体重在区间[90,100),[100,110),[110,120)内的人数分别为8,10,2;题图2中体重在区间[80,90),[90,100),[100,110)内的人数分别为6,8,6.故选ACD.二、高考小题9.(2022·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C不正确;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.10.(多选)(2022·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,x n的离散程度的是()A.样本x1,x2,…,x n的标准差B.样本x1,x2,…,x n的中位数C.样本x1,x2,…,x n的极差D.样本x1,x2,…,x n的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.11.(多选)(2022·新高考Ⅰ卷)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则() A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析由题可知x-=x1+x2+…+x nn ,y-=y1+y2+…+y nn=x1+x2+…+x nn+c=x-+c ,因为c ≠0,所以x -≠y -,A 错误;若样本数据x 1,x 2,…,x n 的中位数为x k ,因为y i =x i +c ,c ≠0,所以样本数据y 1,y 2,…,y n 的中位数为y k =x k +c ≠x k ,B 错误;设s x 表示样本数据x 1,x 2,…,x n 的标准差,s y 表示样本数据y 1,y 2,…,y n 的标准差,则样本数据y 1,y 2,…,y n 的标准差s y =1n (y 1-y -)2+(y 2-y -)2+…+(y n -y -)2=1n[(x 1+c )-(x -+c )]2+[(x 2+c )-(x -+c )]2+…+[(x n +c )-(x -+c )]2=1n (x 1-x -)2+(x 2-x -)2+…+(x n -x -)2=s x ,所以C 正确;设样本数据x 1,x 2,…,x n 中最大的为x n ,最小的为x 1,因为y i =x i +c ,所以样本数据y 1,y 2,…,y n 中最大的为y n ,最小的为y 1,极差为y n -y 1=(x n +c )-(x 1+c )=x n -x 1,所以D 正确.故选CD.12.(2022·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40 C.64 D .80答案 D解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.13.(2022·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑4i =1p i =1,则下面四种情形中,对应样本的标准差最大的一组是( ) A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.2答案 B解析 对于A ,该组数据的平均数为x -A =(1+4)×0.1+(2+3)×0.4=2.5,方差为s 2A =(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;对于B ,该组数据的平均数为x -B =(1+4)×0.4+(2+3)×0.1=2.5,方差为s 2B =(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;对于C ,该组数据的平均数为x -C=(1+4)×0.2+(2+3)×0.3=2.5,方差为s 2C =(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;对于D ,该组数据的平均数为x -D =(1+4)×0.3+(2+3)×0.2=2.5,方差为s 2D =(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.因此,B 项这一组样本数据的标准差最大.故选B.14.(2022·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.15.(2022·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 平均正点率x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.16.(2022·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案 53解析 这组数据的平均数为8,故其方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.三、模拟小题17.(2022·河北张家口第三次模拟)某中学春季运动会上,12位参加跳高半决赛同学的成绩各不相同,按成绩从高到低取前6位进入决赛,如果小明知道了自己的成绩后,则他可根据其他11位同学成绩的哪个数据判断自己能否进入决赛( )A.中位数B.平均数C.极差D.方差答案A解析12位同学参赛,按成绩从高到低取前6位进入决赛,正好一半,因此可根据中位数判断小明是否能进入决赛.故选A.18.(多选)(2022·广东省花都区高三上学期调研)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有()A.中位数为3,众数为3B.平均数为3,众数为4C.平均数为3,中位数为3D.平均数为2,方差为2.4答案BD解析对于A,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,所以A不能判断;对于B,若平均数为3,且出现点数为6,则其余4个数的和为9,而众数为4,故其余4个数的和至少为10,所以B可以判断;对于C,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C不能判断;对于D,若平均数为2,且出现点数6,则方差s2>12=3.2>2.4,所以当平均数5×(6-2)为2,方差为2.4时,一定不会出现点数6.故选BD.19.(多选)(2022·安徽蚌埠高三模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A.甲的成绩的平均数等于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,x-甲=4+5+6+7+85=6,x-乙=3×5+6+95=6,A正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C正确;甲的成绩的极差为4,乙的成绩的极差也为4,D错误.20.(多选)(2022·广东肇庆第二次统一检测)某大学生暑假到工厂参加生产劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:[90,91),[91,92),[92,93),[93,94),[94,95),[95,96],得到如图所示的频率分布直方图,则关于这100件产品,下列说法中正确的是()A.b=0.25B.长度落在区间[93,94)内的个数为35C.长度的众数一定落在区间[93,94)内D.长度的中位数一定落在区间[93,94)内答案ABD解析对于A,由频率和为1,得(0.35+b+0.15+0.1×2+0.05)×1=1,解得b=0.25,故A正确;对于B,长度落在区间[93,94)内的个数为100×0.35=35,故B正确;对于C,这100件产品长度的众数不一定落在区间[93,94)内,故C错误;对于D,由(0.1×2+0.25)×1=0.45<0.5,(0.1×2+0.25+0.35)×1=0.8>0.5,知这100件产品长度的中位数一定落在区间[93,94)内,故D正确.故选ABD.21.(多选)(2022·湖南师大附中高三第二次月考)甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层随机抽样方法从两所学校一共抽取了110名学生的数学成绩,考生成绩都分布在[70,150]内,并作出了如下频数分布统计表,规定考试成绩在[120,150]内为优秀,则下列说法正确的有()分组[70,80)[80,90)[90,100)[100,110)AB.估计甲校优秀率为25%,乙校优秀率为40% C.估计甲校和乙校众数均为120D.估计乙校的数学平均成绩比甲校高答案ABD解析对于A,甲校抽取110×12002200=60人,乙校抽取110×10002200=50人,故x=10,y=7,故A正确;对于B,估计甲校优秀率为1560=25%,乙校优秀率为2050=40%,故B正确;对于C,甲校众数的估计值为105,115,乙校众数的估计值为115,125,故C 错误;对于D,甲校平均成绩为109.5,乙校平均成绩为114.6,故D正确.22.(多选)(2022·湖南六校联考)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至13日中的某一天到达该市,并停留2天,下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为8 13C.此人在该市停留期间只有1天空气重度污染的概率为2 13D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大答案AD解析114×(86+25+57+143+220+160+40+217+160+121+158+86+79+37)=113.5,故A正确;在6月1日至13日这13天中,1日,2日,3日,7日,12日,13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率为613,故B不正确;6月1日至14日连续两天包含的样本点有13个,此人在该市停留期间只有1天空气重度污染的样本点是{4,5},{5,6},{7,8},{8,9},共4个,所以此人在该市停留期间只有1天空气重度污染的概率是413,故C不正确;由空气质量指数趋势图可以看出,从3月5日开始连续三天的空气质量指数方差最大,故D正确.故选AD.23.(2022·山东潍坊高三质检)为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为124,男员工的平均体重为70 kg ,标准差为4,女员工的平均体重为50 kg ,标准差为6.若样本中有20名男员工,则女员工的人数为________.答案 30解析 设男员工的权重为ω男,由题意可知样本的平均数x -=ω男x -男+(1-ω男)x -女=70ω-男+50(1-ω男)=20ω男+50,样本的方差s 2=ω男[s 2男+(x -男-x -)2]+(1-ω男)[s 2女+(x -女-x -)2],即ω男[42+(70-20ω男-50)2]+(1-ω男)[62+(50-20ω男-50)2]=124,解得ω男=0.4,因为样本中有20名男员工,所以样本中女员工的人数为200.4×(1-0.4)=30.一、高考大题1.(2022·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 新设备10.110.410.110.010.1旧设备 9.8 10.0 10.1 10.2 9.7 新设备10.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22.(1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x-≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)由表中的数据可得:x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3, s 21=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,s 22=110×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.(2)由(1)中的数据可得y --x -=10.3-10=0.3,2s 21+s 2210=20.036+0.0410=20.0076=0.0304,因为0.3=0.09>0.0304,所以y --x ->2s 21+s 2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.2.(2022·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解(1)由表中数据可知,甲厂加工出来的一件产品为A级品的概率的估计值为40100=0.4,乙厂加工出来的一件产品为A级品的概率的估计值为28=0.28.100(2)甲分厂加工100件产品的总利润为40×(90-25)+20×(50-25)+20×(20-25)-20×(50+25)=1500元,所以甲分厂加工100件产品的平均利润为15元/件.乙分厂加工100件产品的总利润为28×(90-20)+17×(50-20)+34×(20-20)-21×(50+20)=1000元,所以乙分厂加工100件产品的平均利润为10元/件.故厂家应选择甲分厂承接加工业务.3.(2022·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2022·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解 (1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x-2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计该家庭使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).二、模拟大题5.(2022·河南郑州一模)河阴石榴是河南省荥阳市的特产,距今已有2100多年的历史,河阴石榴籽粒大,色紫红,甜味浓,被誉为“中州名果”.河阴石榴按照果径大小可以分为四类:标准果、优质果、精品果、礼品果.某超市老板从采购的一批河阴石榴中随机抽取100 kg,根据石榴的等级分类标准得到的数据如下表所示:(1)求a(2)用样本估计总体,超市老板参考以下两种销售方案进行销售:方案1:不分类卖出,单价为20元/kg;方案2:分类卖出,分类后的水果售价如下表所示:=0.2.解(1)a=100-10-30-40=20,礼品果所占比例是20100(2)理由一:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,因为x -=20.6>20,所以从超市老板的销售利润角度考虑,采用方案2比较好.理由二:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,虽然x -=20.6>20,但20.6-20=0.6,差额不太大,从超市老板后期对石榴分类的人力资源和时间成本角度考虑,采用方案1比较好.6.(2022·湖南师大附中第一次大练习)某学校团委组织了“文明出行,爱我中华”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(单位:分)整理后,得到如图所示的频率分布直方图(其中分组区间为[40,50),[50,60),…,[90,100]).(1)求成绩在[70,80)的频率,并补全此频率分布直方图;(2)求这次考试平均分的估计值(同一组中的数据以这组数据所在区间中点的值作代表);(3)若从成绩在[40,50)和[90,100]的学生中任选两人,求他们的成绩在同一分组区间的概率.解 (1)成绩在[70,80)的频率为1-(0.005+0.015+0.020+0.030+0.005)×10=0.25.补全频率分布直方图如下:(2)依题意可得,平均分x-=(45×0.005+55×0.015+65×0.020+75×0.025+85×0.030+95×0.005)×10=72.5.故这次考试平均分的估计值为72.5.(3)成绩在[40,50)和[90,100]的人数分别是3和3,所以从成绩在[40,50)和[90,100]内的学生中任选两人,将[40,50)分数段的3人编号为A1,A2,A3,将[90,100]分数段的3人编号为B1,B2,B3,从中任取两人,则样本空间Ω={(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,B3),(A2,A3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(B1,B2),(B1,B3),(B2,B3)},共有15个样本点,这15个样本点发生的可能性是相等的.其中,在同一分数段内的事件所含样本点有(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),共6个,故所求概率P=615=25.7.(2022·河北省衡水市第一中学高三上学期第一次调研)“2022年全国城市节约用水宣传周”已于5月9日至15日举行.成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样、内容丰富的活动.进一步增强全民保护水资源,防治水污染,节约用水的意识.为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95), [95,100],得到如图所示的频率分布直方图.(1)求a的值,并估计这300名业主评分的中位数;(2)若先用比例分配的分层随机抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的这5名业主中任意选取2人做进一步访谈,求这2人中至少有1人的评分在[95,100]的频率.解(1)∵第三组的频率为1-(0.020+0.025+0.030+0.035+0.050)×5=0.200,=0.040.∴a=0.2005又第一组的频率为0.025×5=0.125,第二组的频率为0.035×5=0.175,第三组的频率为0.200,∴前三组的频率之和为0.125+0.175+0.200=0.500,∴这300名业主评分的中位数为85.(2)由频率分布直方图,知评分在[90,95)的人数与评分在[95,100]的人数的比值为3∶2,∴采用比例分配的分层随机抽样法抽取5人,评分在[90,95)的有3人,评分在[95,100]的有2人.不妨设评分在[90,95)的3人分别为A1,A2,A3,评分在[95,100]的2人分别为B1,B2,则从5人中任选2人的所有可能情况有{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10种.其中选取的2人中至少有1人的评分在[95,100]的情况有{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共7种.故这2人中至少有1人的评分在[95,100]的概率为P=710.。

高三数学一轮复习课时作业5:用样本估计总体

高三数学一轮复习课时作业5:用样本估计总体

第2讲用样本估计总体基础巩固题组(建议用时:40分钟)一、选择题1.(2014·青岛检测)如图是一容量为100的样本的质量的频率分布直方图,样本质量均在『5,20』内,其分组为『5,10),『10,15),『15,20』,则样本质量落在『15,20』内的频数为()A.10 B.20C.30 D.40解析由题意得组距为5,故样本质量在『5,10),『10,15)内的频率分别为0.3和0.5,所以样本质量在『15,20』内的频率为1-0.3-0.5=0.2,频数为100×0.2=20,故选B.答案B2.(2015·西安检测)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法中一定正确的是() A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数解析依题意,显然不能确定题中的抽样方法是属于哪种抽样,因此选项A,B均不正确;选项D,仅有5名男生,5名女生的数学成绩,而不能得出该班男生成绩的平均数小于该班女生成绩的平均数;对于C,注意到将这五个男生与女生的成绩均按由小到大排列,这五名男生的成绩相对较为分散,因此这五名男生成绩的方差大于这五名女生成绩的方差,故选C.答案C3.(2014·临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为()A.7 B.8C.9 D.10解析由茎叶图可知,甲班学生成绩的众数是85,所以x=5.乙班学生成绩的中位数是83,所以y=3,所以x+y=5+3=8.答案B4.(2015·东北三省三校联考)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是() A.平均数B.标准差C.众数D.中位数解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B 样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.答案B5.(2015·沈阳监测)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:分数段『60,65)『65,70)『70,75)『75,80)『80,85)『85,90』人数 2 3 49 5 1 A .75 B .80 C .85D .90解析 因为参加笔试的400人中择优选出100人,故每个人被择优选出的概率P =100400=14,因为随机调查24名笔试者,则估计能够参加面试的人数为24×14=6,观察表格可知,分数在『80,85)有5人,分数在『85,90)的有1人,故面试的分数线大约为80分,故选B. 答案 B 二、填空题6.(2014·甘肃诊断)如图是根据某赛季甲、乙两名篮球运动员参加11场比赛的得分情况画出的茎叶图.若甲运动员的中位数为a ,乙运动员的众数为b ,则a -b =________.解析 由茎叶图可知甲运动员的中位数为a =19,乙运动员的众数为b =11,所以a -b =8. 答案 87.样本中共有五个个体,其值分别为a ,0,1,2,3.若该样本的平均值为1,则样本方差为________.解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15『(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2』=2. 答案 28.(2015·银川检测)某企业3个分厂同时生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为________h.解析依题意,抽取的100件产品来自于第一、二、三分厂分别有25,50,25件,因此抽取的100件产品的使用寿命的平均值为1100(980×25+1 032×25+1 020×50)=1 013(h).答案 1 013三、解答题9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在『50,60』的频率及全班人数;(2)求分数在『80,90』之间的频数,并计算频率分布直方图中『80,90』间的矩形的高.解(1)分数在『50,60』的频率为0.008×10=0.08.由茎叶图知,分数在『50,60』之间的频数为2,所以全班人数为20.08=25.(2)分数在『80,90』之间的频数为25-2-7-10-2=4,频率分布直方图中『80,90』间的矩形的高为425÷10=0.016.10.(2014·北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组『4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085.课外阅读时间落在组『8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.能力提升题组(建议用时:25分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成『0,5),『5,10),…,『30,35),『35,40』时,所作的频率分布直方图是()解析由于频率分布直方图的组距为5,排除C、D,又『0,5),『5,10)两组各一人,排除B,应选A.答案A12.(2014·益阳模拟)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故D是错误的,选D.答案D13.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.解析∵小长方形的面积由小到大构成等比数列{a n},且a2=2a1,∴样本的频率构成一个等比数列,且公比为2,,∴a1+2a1+4a1+8a1=15a1=1,∴a1=115∴小长方形面积最大的一组的频数为300×8a1=160.答案16014.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解 (1)设A 药观测数据的平均数为x -A ,B 药观测数据的平均数为x -B ,则x -A =120(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.x -B =120(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则x -A >x -B ,因此A 药的疗效更好. (2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上;B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上.由上述可看出A药的疗效更好.。

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。

2025高考数学一轮复习- 用样本的数字特征估计总体-专项训练【含解析】

2025高考数学一轮复习- 用样本的数字特征估计总体-专项训练【含解析】

课时过关检测(六十五)用样本的数字特征估计总体【原卷版】1.数据1,2,3,4,5,6的60%分位数为()A .3B .3.5C .3.6D .42.若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为()A .x -和s 2B .2x -+3和4s 2C .2x -+3和s 2D .2x -+3和4s 2+12s +93.为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2019年1月至2020年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A .2019年各月的仓储指数最大值是在3月份B .2020年1月至7月的仓储指数的中位数为55C .2020年1月与4月的仓储指数的平均数为52D .2019年1月至4月的仓储指数相对于2020年1月至4月,波动性更大4.已知样本甲:x 1,x 2,x 3,…,x n 与样本乙:y 1,y 2,y 3,…,y n ,满足y i =2x 3i +1(i =1,2,…,n ),则下列叙述中一定正确的是()A .样本乙的极差等于样本甲的极差B .样本乙的众数大于样本甲的众数C .若某个x i 为样本甲的中位数,则y i 是样本乙的中位数D .若某个x i 为样本甲的平均数,则y i 是样本乙的平均数5.已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m∈N*)的大小关系为()A.n=m B.n≥mC.n<m D.n>m6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级参加人数中位数方差平均数甲55149191135乙55151110135下列结论中,正确的是()A.甲、乙两班学生成绩的平均水平相同B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C.甲班的成绩波动情况比乙班的成绩波动大D.甲班成绩的众数小于乙班成绩的众数7.(多选)某篮球爱好者在一次篮球训练中,需进行五轮投篮,每轮投篮5次.统计各轮投进球的个数,获知其前四轮投中的个数分别为2,3,4,4,则第五轮结束后,下列数字特征有可能发生的是()A.平均数为3,极差是3B.中位数是3,极差是3C.平均数为3,方差是0.8D.中位数是3,方差是0.568.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为_________.9.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:(1)估计这批小龙虾重量的第10百分位数与第90百分位数;(2)该经销商将这批小龙虾分成三个等级,如表:等级三等品二等品一等品重量/克[5,25)[25,45)[45,55]试估计这批小龙虾划为几等品比较合理?10.(多选)2020年2月8日,在韩国首尔举行的四大洲花样滑冰锦标赛双人自由滑比赛中,中国组合隋文静/韩聪以总分217.51分拿下四大洲赛冠军,这也是他们第六次获得四大洲冠军.中国另一对组合彭程/金杨以213.29分摘得银牌.花样滑冰锦标赛有9位评委进行评分,首先这9位评委给出某对选手的原始分数,评定该队选手的成绩时从9个原始评分中去掉一个最高分、一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变化的数字特征是()A.中位数B.平均数C.方差D.极差11.(多选)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A.1月至8月空气质量合格天数超过20天的月份有5个B.第二季度与第一季度相比,空气质量合格天数的比重下降了C.8月是空气质量最好的一个月D.6月的空气质量最差12.某快递网点收取快递费用的标准是重量不超过1kg的包裹收费10元,重量超过1kg 的包裹,除收费10元之外,超过1kg的部分,每超出1kg(不足1kg,按1kg计算)需要再收费5元.该公司近60天每天揽件数量的频率分布直方图如图所示(同一组数据用该区间的中点值作代表).(1)求这60天每天包裹数量的平均数和中位数;(2)该快递网点负责人从收取的每件快递的费用中抽取5元作为工作人员的工资和网点的利润,剩余的作为其他费用.已知该网点有工作人员3人,每人每天工资100元,以样本估计总体,试估计该网点每天的利润有多少元?13.记样本x 1,x 2,…,x m 的平均数为x -,样本y 1,y 2,…,y n 的平均数为y -(x -≠y -).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z -=14x -+34y -,则mn的值为()A .3B .4C .14D .1314.某校有高中生2000人,其中男女生比例约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本量为n 的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.身高(单位:cm)[145,155)[155,165)[165,175)[175,185)[185,195]频数mpq64(1)根据图表信息,求n ,q 并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?课时过关检测(六十五)用样本的数字特征估计总体【解析版】1.数据1,2,3,4,5,6的60%分位数为()A .3B .3.5C .3.6D .4解析:D由6×60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选D .2.若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为()A .x -和s 2B .2x -+3和4s 2C .2x -+3和s 2D .2x -+3和4s 2+12s +9解析:B原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2x -+3和4s 2.3.为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2019年1月至2020年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A .2019年各月的仓储指数最大值是在3月份B .2020年1月至7月的仓储指数的中位数为55C .2020年1月与4月的仓储指数的平均数为52D .2019年1月至4月的仓储指数相对于2020年1月至4月,波动性更大解析:D2019年各月的仓储指数最大值是在11月份,所以A 错误;由题图可知,2020年1月至7月的仓储指数的中位数约为53,所以B 错误;2020年1月与4月的仓储指数的平均数约为51+552=53,所以C 错误;由题图可知,2019年1月至4月的仓储指数比2020年1月至4月的仓储指数波动更大,故选D .4.已知样本甲:x 1,x 2,x 3,…,x n 与样本乙:y 1,y 2,y 3,…,y n ,满足y i =2x 3i +1(i =1,2,…,n ),则下列叙述中一定正确的是()A .样本乙的极差等于样本甲的极差B .样本乙的众数大于样本甲的众数C .若某个x i 为样本甲的中位数,则y i 是样本乙的中位数D .若某个x i 为样本甲的平均数,则y i 是样本乙的平均数解析:C ∵y i =2x 3i +1,∴y i 关于x i 单调递增,甲样本极差为x n -x 1,乙样本极差为y n-y 1=2(x 3n -x 31)=2(x n -x 1)(x 2n +x n x 1+x 21),两个数据大小关系不定,∴样本乙的极差不一定等于样本甲的极差,A 错误;样本乙的众数不一定大于样本甲的众数,B 错误;若x i 为样本甲的平均数,y i 不一定是样本乙的平均数,D 错误;若x i 为样本甲的中位数时,则y i 一定是样本乙的中位数,C 正确.5.已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为()A .n =mB .n ≥mC .n <mD .n >m解析:C 由题意得z =1n +m (nx +my )=n n +mx ,∴a =n n +m,∵0<a <12,∴0<n n +m <12,又n ,m ∈N *,∴2n <n +m ,∴n <m .故选C .6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级参加人数中位数方差平均数甲55149191135乙55151110135下列结论中,正确的是()A .甲、乙两班学生成绩的平均水平相同B .乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C .甲班的成绩波动情况比乙班的成绩波动大D .甲班成绩的众数小于乙班成绩的众数解析:ABC甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,∴A 正确;s 2甲=191>110=s 2乙,∴甲班成绩不如乙班稳定,即甲班成绩波动较大,∴C 正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,∴B 正确;由题表看不出两班学生成绩的众数,∴D 错误.7.(多选)某篮球爱好者在一次篮球训练中,需进行五轮投篮,每轮投篮5次.统计各轮投进球的个数,获知其前四轮投中的个数分别为2,3,4,4,则第五轮结束后,下列数字特征有可能发生的是()A .平均数为3,极差是3B .中位数是3,极差是3C .平均数为3,方差是0.8D .中位数是3,方差是0.56解析:BCD2+3+4+4=13,①若平均数为3,则第五轮投中的个数为2,所以极差为4-2=2,方差为15×[(2-3)2×2+(3-3)2+(4-3)2×2]=0.8,即选项A 错误,C 正确;②若中位数为3,则第五轮投中的个数为0或1或2或3,当投中的个数为0时,极差为4,平均数为2.6,方差为15×[(0-2.6)2+(2-2.6)2+(3-2.6)2+(4-2.6)2×2]=2.24;当投中的个数为1时,极差为3,平均数为2.8,方差为15×[(1-2.8)2+(2-2.8)2+(3-2.8)2+(4-2.8)2×2]=1.36;当投中的个数为2时,极差为2,方差为0.8;当投中的个数为3时,极差为2,平均数为3.2,方差为15×[(2-3.2)2+(3-3.2)2×2+(4-3.2)2×2]=0.56,即选项B 和D 均正确.故选B 、C 、D .8.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为_________.解析:∵-1,0,4,x,7,14的中位数为5,∴4+x2=5,∴x =6,∴这组数据的平均数是-1+0+4+6+7+146=5,这组数据的方差是16×(36+25+1+1+4+81)=743.答案:57439.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:(1)估计这批小龙虾重量的第10百分位数与第90百分位数;(2)该经销商将这批小龙虾分成三个等级,如表:等级三等品二等品一等品重量/克[5,25)[25,45)[45,55]试估计这批小龙虾划为几等品比较合理?解:(1)因为40×10%=4,所以第10百分位数为第4项与第5项的平均数,在[5,15)范围内约为5+152=10.因为40×90%=36,所以第90百分位数为第36项与第37项的平均数,在[35,55]范围内,约为35+552=45,所以估计这批小龙虾重量的第10百分位数为10,第90百分位数为45.(2)由(1)知,这批小龙虾重量集中在[10,45]范围内,所以划为二等品比较合理.10.(多选)2020年2月8日,在韩国首尔举行的四大洲花样滑冰锦标赛双人自由滑比赛中,中国组合隋文静/韩聪以总分217.51分拿下四大洲赛冠军,这也是他们第六次获得四大洲冠军.中国另一对组合彭程/金杨以213.29分摘得银牌.花样滑冰锦标赛有9位评委进行评分,首先这9位评委给出某对选手的原始分数,评定该队选手的成绩时从9个原始评分中去掉一个最高分、一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变化的数字特征是()A .中位数B .平均数C .方差D .极差解析:BCD因为7个有效评分是9个原始评分中去掉一个最高分、一个最低分,所以中位数不变,平均数、方差、极差可能发生变化,所以可能变化的数字特征是平均数、方差、极差,故选B 、C 、D .11.(多选)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A .1月至8月空气质量合格天数超过20天的月份有5个B .第二季度与第一季度相比,空气质量合格天数的比重下降了C .8月是空气质量最好的一个月D .6月的空气质量最差解析:ABC1月至8月空气质量合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,所以A 是正确的;第一季度合格天数的比重为22+26+1931+29+31≈0.7363,第二季度合格天数的比重为19+13+2530+31+30≈0.6264,所以第二季度与第一季度相比,空气质量合格的天数的比重下降了,所以B 是正确的;8月空气质量合格天气达到30天,是空气质量最好的一个月,所以C 是正确的;5月空气质量合格天气只有13天,5月份的空气质量最差,所以D 是错误的,故选A 、B 、C .12.某快递网点收取快递费用的标准是重量不超过1kg 的包裹收费10元,重量超过1kg 的包裹,除收费10元之外,超过1kg 的部分,每超出1kg(不足1kg ,按1kg 计算)需要再收费5元.该公司近60天每天揽件数量的频率分布直方图如图所示(同一组数据用该区间的中点值作代表).(1)求这60天每天包裹数量的平均数和中位数;(2)该快递网点负责人从收取的每件快递的费用中抽取5元作为工作人员的工资和网点的利润,剩余的作为其他费用.已知该网点有工作人员3人,每人每天工资100元,以样本估计总体,试估计该网点每天的利润有多少元?解:(1)每天包裹数量的平均数为0.1×50+0.1×150+0.5×250+0.2×350+0.1×450=260(件),因为[0,200)的频率为0.2,[200,300)的频率为0.5,中位数为200+0.5-0.20.5×100=260(件),所以该网点每天包裹的平均数和中位数都为260件.(2)由(1)可知平均每天的揽件数为260件,利润为260×5-3×100=1000(元),所以该网点平均每天的利润有1000元.13.记样本x 1,x 2,…,x m 的平均数为x -,样本y 1,y 2,…,y n 的平均数为y -(x -≠y -).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z -=14x -+34y -,则mn的值为()A .3B .4C .14D .13解析:D由题意知x 1+x 2+…+x m =m x -,y 1+y 2+…+y n =n y -,z -=(x 1+x 2+…+x m )+(y 1+y 2+…+y n )m +n =m x -+n y -m +n =m x -m +n +n y -m +n =14x -+34y -,所以m m +n =14,n m +n =34,可得3m =n ,所以m n =13.14.某校有高中生2000人,其中男女生比例约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本量为n 的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.身高(单位:cm)[145,155)[155,165)[165,175)[175,185)[185,195]频数mpq64(1)根据图表信息,求n ,q 并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?解:(1)因为身高在区间[185,195]的频率为0.008×10=0.08,频数为4,所以样本量n =40.08=50,m =0.008×10×50=4,p =0.04×10×50=20,q =50-4-20-6-4=16,所以身高在[165,175)的频率为1650=0.32,小矩形的高为0.032,所以身高在[175,185)的频率为650=0.12,小矩形的高为0.012,由此补全频率分布直方图:由频率分布直方图可知样本的身高均值为(150×0.008+160×0.04+170×0.032+180×0.012+190×0.008)×10=167.2,所以由样本估计总体可知,估计该校高中生的身高均值为167.2.(2)把男生样本记为x 1,x 2,x 3,…,x 25,其均值为x -,方差为s 2x ,把女生样本记为y 1,y 2,y 3,…,y 25,其均值为y -,方差为s 2y ,总体样本均值记为z -,方差记为s 2,所以z -=2525+25x -+2525+25y -=25×170+25×16050=165,s 2=150{25[s 2x +(x --z -)2]+25[s 2y +(y --z -)2]}=150{25[16+(170-165)2]+25[20+(160-165)2]}=43.(3)两种方案总样本均值的差为167.2-165=2.2,所以用方案二总体样本均值作为总体均值的估计不合适,原因是没有进行等比例的分层随机抽样,每个个体被抽到的可能性不同,因此代表性较差.。

2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练【含答案】

2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练【含答案】

2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练基础巩固练1.(2023连云港期中)下列一组数据的第30百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6.A.3.0B.3.2C.3.3D.4.42.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:88,85,82,92,90,92,96,92,96,98.这10名同学数学成绩的众数、中位数分别为()A.92,92B.92,96C.96,92D.92,903.(2023宿迁月考)统计某样本数据得到的频率分布直方图如图所示,已知该样本容量为300,则样本数据落在[6,14)内的频数为()A.68B.170C.204D.2404.如图,这是某市2023年国庆节假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则下列判断正确的为()A.日成交量的中位数是16B.日成交量超过日平均成交量的有2天C.10月7日认购量的增幅大于10月7日成交量的增幅D.日认购量的方差大于日成交量的方差5.(多选题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.方法1:采用简单随机抽样的方法,将零件分别编号为00,01,02,…,99,用抽签法抽取20个.方法2:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下列说法正确的是()A.无论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是15B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同C.在上述两种抽样方法中,方法2抽到的样本比方法1抽到的样本更能反映总体的特征D.在上述两种抽样方法中,方法1抽到的样本比方法2抽到的样本更能反映总体的特征6.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差7.在一次竞选中,规定一个人获胜的条件如下:(1)在竞选中得票最多;(2)得票数不低于总票数的一半.在计票时,周鹏得票的数据丢失.候选人赵明钱红孙华李丽周鹏得票数3001003060x如果周鹏获胜,那么周鹏的得票数x的最小值为.8.(2023盐城调研)已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为.9.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成[20,30),[30,40),…,[80,90]七组,并整理得到如图所示的频率分布直方图:(1)从样本中随机抽取一人,求其分数小于70的频率.(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男、女生人数相等.试估计总体中男生和女生人数的比.综合提升练10.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,并得到频率分布直方图如图:则这20名工人一天生产该产品的数量的中位数为()A.65B.64C.62.5D.6011.一组数据的平均数为a,方差为b,将这组数据的每个数都乘m(m>0)后得到一组新数据,则下列说法正确的是()A.这组新数据的平均数为aB.这组新数据的平均数为a+mC.这组新数据的方差为mbD.这组新数据的方差为m2b12.(多选题)(2023徐州质检)在第一次全市高三年级统考后,数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成了频率分布直方图.已知该班级学生的数学成绩(单位:分)全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145].按上述分组方法得到的频率分布直方图的一部分如图所示,则下列结论正确的是()A.第七组的频率为0.008B.该班级数学成绩的中位数的估计值为101C.该班级数学成绩的平均分的估计值大于95D.该班级数学成绩的方差的估计值大于2613.已知甲、乙两组数据如下表所示,其中a,b∈N*,若甲、乙两组数据的平均数相等,要使甲组数据的方差小于乙组数据的方差,则(a,b)为.(只需填一组)甲12ab10乙12471114.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组加以统计,得到如图所示的频率分布直方图.据此统计,期末数学测试成绩不少于第60百分位数的分数至少为.15.6月17日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国2030年可持续发展目标——实现全球土地退化零增长.自2004年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及众数、中位数.(2)已知树高为185cm及以上的是可以移栽的合格树苗.①求合格树苗的平均高度(结果精确到个位);②从样本中按分层抽样的方法抽取20株树苗进一步研究,不合格树苗、合格树苗分别应抽取多少株?创新应用练16.某小区毗邻一条公路,为了解交通噪声,有关部门连续25天监测噪声值(单位:分贝),得到频率分布直方图(图1),发现噪声污染严重,采取了在公路旁加装隔声板等治理措施,而后,再连续25天监测噪声值,得到频率分布直方图(图2).图1图2同一组中的数据用该组区间的中点值作代表,请解答下列问题:(1)根据上面两个频率分布直方图,估计治理后比治理前的平均噪声值降低了分贝.(2)国家“城市区域环境噪声”规定:重度污染:>65分贝;中度污染:60~65分贝;轻度污染:55~60分贝;较好:50~55分贝;好:≤50分贝.把上述两个样本数据的频率视为概率,根据图1估算出该小区噪声治理前一年内(365天)噪声中度污染及以上的天数为277,根据图2估计一年内(365天)噪声中度污染及以上的天数比治理前减少了天.(精确到1天)参考答案1.C2.A3.C4.D5.AC6.BCD7.4908 839.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从样本中随机抽取一人,其分数小于70的频率为0.4.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60 12=30,所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比为60∶40=3∶2.所以根据分层抽样原理,估计总体中男生和女生人数的比为3∶2.10.C11.D12.BCD13.(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可)14.7415.解(1)∵(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,∴a=0.0250.众数为185+1952=190.设中位数为x,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.030)×10=0.65>0.5,∴185<x<195,(0.0015+0.0110+0.0225)×10+0.030(x-185)=0.5,∴x=190.(2)∵树苗高度为185cm及以上的频率是(0.0300+0.0250+0.0080+0.0020)×10=0.65, =[190×(0.030×10)+200×(0.0250×10)+210×(0.0080×10)+220×(0.002 0×10)]÷0.65≈197(cm).(3)应抽取不合格的树苗20×0.35=7(株),合格的树苗20×0.65=13(株),故不合格树苗、合格树苗分别应抽取7株和13株.16.(1)2.56(2)138。

高三一轮复习第八章 第二节用样本估计总体

高三一轮复习第八章 第二节用样本估计总体

课时作业1.(2022·毛坦厂中学月考)一个容量为32的样本,已知某组样本的频率为0.375,则该组样本的频数为( )A.4 B.8C.12 D.16【答案】 C2.(2022·西藏拉萨中学月考)某次知识竞赛中,四个参赛小队的初始积分都是10分,在答题过程中,各小队每答对1题加0.5分,若答题过程中四个小队答对的题数分别是3道,7道,7道,3道,则四个小队积分的方差为( )A.0.5 B.0.75C.1 D.1.25【解析】 四个小队积分分别为11.5,13.5,13.5,11.5,平均数为11.5+13.5+13.5+11.54=12.5,故四个小队积分的方差为14[(11.5-12.5)2×2+(13.5-12.5)2×2]=1,故选C.【答案】 C3.(2022·龙岩质检)党的十八大以来,脱贫攻坚取得显著成绩.2013年至2016年4年间,累计脱贫5 564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3 000户家庭的2017年所的年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[800,100],则年收入不超过6万的家庭大约为( )A.900户B.600户C.300户D.150户【解析】 由频率分布直方图可得年收入不超过6万的家庭的概率为:(0.005+0.01)×20=0.3,所以年收入不超过6万的家庭大约为:3 000×0.3=900,故选A.【答案】 A4.(2022·江苏模拟)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.在这些用户中,用电量落在区间[150,250]内的户数为( )A.48 B.52C.60 D.70【解析】 由题意可知,这些用户中,用电量落在区间[150,250]内的频率为1-(0.002 4+0.003 6+0.002 4+0.001 2)×50=0.52,所以用电量落在区间[150,250]内的户数为100×0.52=52,故选D.【答案】 D5.(多选) (2022·江苏模拟)已知数据x1,x2,…,x n的平均数为,标准差为s,则( ) A.数据x21,x2,…,x2n的平均数为,标准差为s2B.数据2x1,2x2,…,2x n的平均数为,标准差为2sC.数据x1+2,x2+2,…,x n+2的平均数为x+2,方差为s2D.数据2x1-2,2x2-2,…,2x n-2的平均数为-2,方差为2s2【解析】 取x1=1,x2=3,则=2,x21=1,x2=9,=5,故,A错误;数据2x1,2x2,…,2x n的平均数为2x,标准差为2s,B正确;数据x1+2,x2+2,…,x n+2的平均数为x+2,方差为s2,C正确;数据2x1-2,2x2-2,…,2x n-2的平均数为2x-2,方差为4s2,D错误.故选BC.【答案】 BC6.(多选)(2022·石家庄五校联考)下图统计了截止到2019年年底中国电动汽车充电桩细分产品占比及保有量情况,关于这5次统计,下列说法错误的是( )A.私人类电动汽车充电桩保有量增长率最高的年份是2018年B.公共类电动汽车充电桩保有量的中位数是25.7万台C.公共类电动汽车充电桩保有量的平均数为23.12万台D.从2017年开始,我国私人类电动汽车充电桩占比均超过50%【解析】 私人类电动汽车充电桩保有量增长率最高的年份是2016年,A错误;这5次统计的公共类电动汽车充电桩保有量的中位数是21.4万台,B错误;因为4.9+14.1+21.4+30+44.7=23.02,故C项错误,D项显然正确.故选:ABC.5【答案】 ABC7.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x 和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为( )【解析】 因为每个数据都加上100,所以平均数也增加100,而离散程度应保持不变,即方差不变.【答案】 D8.(2022·宁夏长庆中学)某校为了了解全校高中学生十一小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示,估计这100名学生参加实践活动时间的中位数是( )A.7.2 B.7.16C.8.2 D.7【解析】 因为在频率分布直方图中,中位数两侧的面积相等,所以0.04×2+0.12×2+(x-6)×0.15=0.5,可解出x=7.2,故选A.【答案】 A9.(2022·泉州质检)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则( )【解析】 分别根据数据的平均数和方差的计算公式,求得x,s2的值,即可得到答案.由题意,可得=70×50+80-60+70-9050=70,设收集的48个准确数据分别记为x1,x2, (x48)则75=150[(x1-70)2+(x2-70)2+…+(x48-70)2+(60-70)2+(90-70)2]=150[(x1-70)2+(x2-70)2+…+(x48-70)2+500],s2=150[(x1-70)2+(x2-70)2+…+(x48-70)2+(80-70)2+(70-70)2]=150[(x1-70)2+(x2-70)2+…+(x48-70)2+100]<75,所以s2<75.故选A.【答案】 A10.(多选)(2022·重庆模拟)2020年12月31日,我国第一支新冠疫苗“国药集团中国生物新冠灭活疫苗”获得国家药监局批准附条件上市,保护率为79.34%,中和抗体阳转率为99.52%,该疫苗将面向全民免费.所谓疫苗的保护率,是通过把人群分成两部分,一部分称为对照组,即注射安慰剂;另一部分称为疫苗组,即注射疫苗来进行的.当从对照组和疫苗组分别获得发病率后,就可以计算出疫苗的保护率=(对照组发病率-疫苗组发病率)/对照组发病率×100%.关于注射疫苗,下列说法正确的是( )A.只要注射了新冠疫苗,就一定不会感染新冠肺炎B.新冠疫苗的高度阳转率,使得新冠肺炎重症感染的风险大大降低C.若对照组10 000人,发病100人;疫苗组2 000人,发病80人,则保护率为60% D.若某疫苗的保护率为80%,对照组发病率为50%,那么在1 000个人注射了该疫苗后,一定有1 000个人发病【解析】 显然选项A错误,对于选项B:新冠疫苗的阳转率高说明有高滴度的抗体,当感染新冠肺炎后,肺炎症状将会大大降低,进而减少重症率,所以选项B正确,对于选项C:由保护率的计算公式可得:对照组和疫苗组的发病率分别为1%,0.4%,代入可得保护率为60%,所以选项C正确,对于选项D:虽然根据公式算出样本中疫苗组的发病率为10%,但实际是否会发病是随机事件,所以选项D错误.【答案】 BC11.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.【解析】 由题意知15(a+0+1+2+3)=1,解得a=-1,所以样本方差为s2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.【答案】 212.(2022·西城一模)在一次体育水平测试中,甲、乙两校均有100名学生参加,其中:甲校男生成绩的优秀率为70%,女生成绩的优秀率为50%;乙校男生成绩的优秀率为60%,女生成绩的优秀率为40%.对于此次测试,给出下列三个结论:①甲校学生成绩的优秀率大于乙校学生成绩的优秀率;②甲、乙两校所有男生成绩的优秀率大于甲、乙两校所有女生成绩的优秀率;③甲校学生成绩的优秀率与甲、乙两校所有学生成绩的优秀率的大小关系不确定.其中,所有正确结论的序号是________.【解析】 不能确定甲乙两校的男女比例,故①不正确;因为甲乙两校的男生的优秀率均大于女生成绩的优秀率,故甲、乙两校所有男生成绩的优秀率大于甲、乙两校所有女生成绩的优秀率,故②正确;因为不能确定甲乙两校的男女比例,故不能确定甲校学生成绩的优秀率与甲、乙两校所有学生成绩的优秀率的大小关系,故③正确.【答案】 ②③13.(2022·顺德二模)为了解某市公益志愿者的年龄分布情况,有关部门通过随机抽样,得到如图的频率分布直方图.(1)求a的值,并估计该市公益志愿者年龄的平均数(同一组中的数据用该组区间的中点值作代表);(2)根据世界卫生组织确定新的年龄分段,青年是指年龄15~44岁的年轻人.据统计,该市人口约为300万人,其中公益志愿者约占总人口的40%.试根据直方图估计该市青年公益志愿者的人数.【解】 (1)∵(0.005+0.01+0.02+a+0.025+0.01)×10=1,∴a=0.03该市公益志愿者的平均年龄:=20×0.05+30×0.1+40×0.2+50×0.3+60×0.25+70×0.1=49(2)由频率分布直方图可得年龄15~44岁的频率为:(0.005+0.01+0.02×910)×10=0.33,∴估计该市青年公益志愿者的人数为:300×40%×0.33=39.6(万) 14.(2022·临沂三模)某地教育主管部门对所管辖的学校进行年终督导评估,为了解某学校师生对学校教学管理的满意度,分别从教师和不同年级的学生中随机抽取若干师生,进行评分(满分100分),绘制如下频率分布直方图,并将分数从低到高分为四个等级:满意度评分低于 60分 60分到 79分 80分到 89分 90分及 以上 满意度等级 不满意基本 满意满意 非常满意 已知满意度等级为基本满意的有136人.(1)求表中a 的值及不满意的人数;(2)从等级为不满意师生中按评分分层抽取6人了解不满意的原因,并从6人中选取2人担任整改监督员,求2人中恰有1人评分在[40,50)的概率;(3)若师生的满意指数不低于0.8,则该校可获评“教学管理先进单位”,根据你所学的统计知识,判断是否能获奖,并说明理由.(注:满意指数=满意程度的平均分100) 【解】 (1)由频率和为1,得(0.002+0.004+0.014+0.020+a +0.025)×10=1,解得a =0.035,设不满意的人数为x ,则(0.002+0.004)∶(0.014+0.020)=x ∶136, 解得x=24;(2)按评分分层抽取6人,应在评分在[40,50)的师生中抽取2人,分别记作A、B,在评分在[50,60)的师生中抽取4人,分别记为c、d、e、f,从这6人中选2人的所有基本事件为AB、Ac、Ad、Ae、Af、Bc、Bd、Be、Bf、cd、ce、cf、de、df、ef共15种,其中恰有1人评分在[40,50)包含的基本事件为Ac、Ad、Ae、Af、Bc、Bd、Be、Bf共8种,记“2人中恰有1人的评分在[40,50)”为事件A,则P(A)=8 15;(3)师生的满意指数为1100×(45×0.02+55×0.04+65×0.14+75×0.2+85×0.35+95×0.25)=0.807;师生的满意指数不低于0.8,可获评“教学管理先进单位”.。

【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)

【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)

【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)配餐作业(五十九) 用样本估计总体一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100]。

若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60解析:根据频率分布直方图,低于60分的同学所占频率为:(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50,故选B 。

答案:B2.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2解析:方法一:对平均数和方差的意义深入理解可巧解。

因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D 。

方法二:由题意知x 1+x 2+…+x n =n x ,s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],则所求均值y =1n [(x 1+100)+(x 2+100)+…+(x n +100)]=1n(n x +n×100)=x +100,而所求方差s′2=1n [(x 1+100-y )2+(x 2+100-y )2+…+(x n +100-y )2]=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2,故选D 。

答案:D3.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据北京某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的中位数较低的是()A.甲、乙相等B.甲C.乙D.无法确定解析:由茎叶图可得甲地浓度的中位数为0.066,乙地浓度的中位数为0.062,因此乙地浓度的中位数较低。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高三数学一轮复习 用样本估计总体巩固与练习1.如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,4D .85,1.6 解析:选D.由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为84×3+86+875=85,方差为15[3×(84-85)2+(86-85)2+(87-85)2]=1.6. 2.(2009组别 频数(0,10] 12(10,20] 13(20,30] 24(30,40] 15(40,50] 16(50,60] 13(60,70] 7A .0.13B .0.39C .0.52D .0.64解析:选C.由列表知样本数据落在(10,40]上的频数为52,频率为0.52.3.为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如图),那么在这100株树木中,底部周长小于110 cm 的株数是( )A .30B .60C .70D .80解析:选C.底部周长小于110 cm 的频率:10×0.01+10×0.02+10×0.04=0.7.周长小于110 cm 的株数为:100×0.7=70.4.(原创题)在样本的频率分布直方图中,共有4个小长方形,这4个小方形的面积由小到大构成等差数列{a n },已知a 2=2a 1,且样本容量为400,则小长方形面积最大的一组的频数为________.答案:1605.(2009年高考重庆卷)从一堆苹果中任取5只,称得它们的质量为(单位:克):125 124 121 123 127则该样本标准差s=________(克)(用数字作答).解析:∵x=15(125+124+121+123+127)=124,∴s2=15[(125-124)2+(124-124)2+(121-124)2+(123-124)2+(127-124)2]=4,∴s=2.答案:26.为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行(1)求出表中m,n,M,N所表示的数分别是多少?(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.解:(1)M=10.02=50,m=50-(1+4+20+15+8)=2,N=1,n=mM=250=0.04.(2)作出直角坐标系,组距为4,纵轴表示频率/组距,横轴表示身高,画出直方图如下图.(3)在153.5~157.5范围内最多,估计身高在161.5以上的概率为P =1050=0.2.练习高度(cm) [10,20) [20,30) [30,40) [40,50) [50,60)棵数 20 30 80 40 30A .0.80B .0.65C .0.40D .0.25解析:选C.由频率含义可计算其结果.由频率的定义得80÷(20+30+80+40+30)=0.40.2.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 等于( )A .21B .22C .23D .24解析:选A.个数为偶数,因此中位数22=x +232, ∴x =21.3.在2008年第29届北京奥运会上,我国代表团的金牌数雄踞榜首.如图是位居金牌榜前十二位的代表团获得的金牌数的茎叶图,则这十二个代表团获得的金牌数的平均数与中位数的差m 的值为( )A .3.5B .4C .4.5D .5解析:选B.由茎叶图中的数据可求得这十二个代表团获得的金牌数的平均数为17.5,中位数为13.5,故m=4.4.如图是甲、乙两名射击运动员各射击10次后所得到的成绩的茎叶图(茎表示成绩的整数环数,叶表示小数点后的数字),由图可知( )A.甲、乙中位数的和为18.2,乙稳定性高B.甲、乙中位数的和为17.8,甲稳定性高C.甲、乙中位数的和为18.5,甲稳定性高D.甲、乙中位数的和为18.65,乙稳定性高解析:选 A.求中位数时,必须先将这组数据从小到大或从大到小排列,数据的个数为奇数,则中位数是最中间的一个,若数据的个数为偶数,则中位数是最中间的两个数据的平均数,据此易知两人中位数和为18.2,又分析茎叶图可知乙数据分布比较集中,即乙的稳定性较高.5.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4 B.78.8,4.4C.81.2,84.4 D.78.8,75.6解析:选A.设原来的平均数为x.则x-80=1.2,∴x=81.2,方差不变.6.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b 的值分别为( )A.0.27,78 B.0.27,83C .2.7,78D .2.7,83解析:选A.组距=0.1,4.3~4.4之间的频数为100×0.1×0.1=1.4.4~4.5之间的频数为100×0.1×0.3=3.根据前4组频数成等比数列,则4.6~4.7之间的频数为1·(31)3=27.∴最大频率a =27100=0.27.根据后6组频数成等差数列,且有100-13=87(人),设公差为d ,则6×27+6×52d =87,∴d =-5,所以b =4×27+4×32×(-5)=78. 7.如图所示是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:(1)样本数据落在[5,9)内的频率是 ;(2)样本数据落在[9,13)内的频数是 .解析:该题考查频率分布直方图的意义及应用图形解题的能力.频率=频率组距×组距=0.08×4=0.32,频数=频率×样本容量=0.09×4×200=72.答案:0.32 728.(2009年高考辽宁卷)某企业3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1020 h,1032 h ,则抽取的100件产品的使用寿命的平均值为________h.解析:由于三个厂的产量比为1∶2∶1 ,所以从三个厂抽出产品比例也应为1∶2∶1.所以100件产品的使用寿命平均值为980×1+1020×2+1032×14=1013. 答案:10139.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,平均数为10.若要使该总体的方差最小,则a 、b 的取值分别是________.解析:这10个数的中位数为a +b 2=10.5. 这10个数的平均数为10.要使总体方差最小,即(a -10)2+(b -10)2最小.又∵(a -10)2+(b -10)2=(21-b -10)2+(b -10)2=(11-b )2+(b -10)2=2b 2-42b +221,∴当b =10.5时,(a -10)2+(b -10)2取得最小值.又∵a +b =21,∴a=10.5,b=10.5.答案:a=10.5,b=10.5 10人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?解:(1)众数200,中位数220,平均数x=1×2200+6×250+5×220+10×200+1×10023=300.(2)平均数受数据中的极端值的影响较大,这个平均数是从一名工资极高(是工人工资的11倍)的经理和其他四类员工的周工资计算出来的,它不能客观地反映该工厂的工资水平.11.(2009年高考安徽卷)某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434 ,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,40 7,410,412,415,416,422,430(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解:(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A 的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.12.(2009年高考宁夏、海南卷)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(1)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.生产能力分[100,110)[110,120)[120,130)[130,140)[140,150) 组人数48x 5 3生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y 3618度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).解:(1)甲、乙被抽到的概率均为110,且事件“甲工人被抽到”与事件“乙工人被抽到”相互独立,故甲、乙两工人都被抽到的概率为P=110×110=1100.(2)①由题意知A类工人中应抽查25名,B类工人中应抽查75名.故4+8+x+5+3=25,得x=5,6+y+36+18=75,得y=15.频率分布直方图如下:从直方图可以判断:B类工人中个体间的差异程度更小.②x A=425×105+825×115+525×125+525×135+325×145=123,x B=675×115+1575×125+3675×135+1875×145=133.8,x=25100×123+75100×133.8=131.1.A类工人生产能力的平均数、B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.。

相关文档
最新文档