2015届高考数学一轮总复习 10-2用样本估计总体

合集下载

高考数学一轮复习第2讲 用样本估计总体

高考数学一轮复习第2讲 用样本估计总体

第2讲用样本估计总体1.用样本的频率分布估计总体分布(1)作频率分布直方图的步骤①求极差(01最大值与02最小值的差).03组距与04组数.05分组.06频率分布表.07频率分布直方图.(2)频率分布折线图和总体密度曲线08中点,就得到频率分布折线图.09样本容量的增加,作图时10所分的组数增加,11组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图12中间的一列数,叶是从茎的13旁边生长出来的数.2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x -=14x1+x2+…+xn n ,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s = 15 错误!.(5)方差:s 2=161n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则: ①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.(2020·云川贵百校联考)某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数2358 2 则这20户家庭该月用电量的众数和中位数分别是()A.180,170 B.160,180C.160,170 D.180,160答案 A解析用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为()A.28 B.40 C.56 D.60 答案 B解析设中间一个小长方形的面积为x,其他8个长方形的面积和为52x,因此x+52x=1,所以x=27.所以中间一组的频数为140×27=40.故选B.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.5.(2020·全国卷Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01 B.0.1C.1 D.10答案 C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.6.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为 .答案50解析根据题中的频率分布直方图可知,三等品的频率为1-(0.0500+0.0625+0.0375)×5=0.25,因此该样本中三等品的件数为200×0.25=50.多角度探究突破考向一统计图表及应用角度1扇形图例1(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.角度2折线图例2(多选)(2020·海南高考调研)如图所示的折线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的折线图,则下列判断正确的是()A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了1 3B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率答案ABC解析1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安市所占比例为3287>13,故A 正确;由折线图可知,1月25日到2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B 正确;2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了213-116=97例,故C 正确;2月8日到2月10日西安市新冠肺炎累计确诊病例增加了98-8888=544,2月6日到2月8日西安市新冠肺炎累计确诊病例增加了88-7474=737,显然737>544,故D 错误.角度3 频率分布直方图例3 (1)(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36答案 B解析 根据频率分布直方图可知,直径落在区间[5.43,5.47)之间的频率为(6.25+5.00)×0.02=0.225,则直径落在区间[5.43,5.47)内零件的个数为80×0.225=18.故选B.(2)(多选)(2020·临沂模拟)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )A.成绩在[70,80]分的考生人数最多B.不及格的考生人数为1000人C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案ABC解析根据频率分布直方图得,成绩出现在[70,80]的频率最大,故A正确;不及格考生数为10×(0.010+0.015)×4000=1000,故B正确;根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C 正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生竞赛成绩的中位数为70+0.5-0.450.3×10≈71.67,故D错误.故选ABC. 常见统计图的特点(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(2020·葫芦岛模拟)书籍是人类的智慧结晶和进步阶梯,阅读是一个国家的文化根基和创造源泉.2014年以来,“全民阅读”连续6年被写入政府工作报告.某高中为了解学生假期自主阅读书籍类型,在全校范围内随机抽取了部分学生进行调查.学生选择的书籍大致分为以下四类:A历史类、B文学类、C科学类、D哲学类.根据调查的结果,将数据整理成如下的两幅不完整的统计图,其中a-b=10.根据上述信息,可知本次随机抽查的学生中选择A历史类的人数为()A.45 B.30C.25 D.22答案 B解析由题可知,样本容量为30-180.1=120,所以选择A历史类的人数为120-42-30-18=30.故选B.2.(2020·汕头二模)新型冠状病毒疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式,为比较两种生产方式的效率,选取80名工人,将他们随机分成两组,每组40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.第一种生产方式40名工人完成同一生产任务所用时间(单位:min)如表:68728577838290838984 88877691799087918692 88878176959463878571 96637485929987827569 第二种生产方式40名工人完成同一生产任务所用时间(单位:min)如扇形图所示:(1)请填写第一种生产方式完成任务所用时间的频数分布表并作出频率分布直方图:生产时间[60,70)[70,80)[80,90)[90,100]频数(2)试从扇形图中估计第二种生产方式的平均数;(3)根据频率分布图和扇形图判断哪种生产方式的效率更高?并说明理由.解(1)第一种生产方式完成任务所用时间的频数分布表如下:生产时间[60,70)[70,80)[80,90)[90,100]频数481810频率分布直方图如下:(2)从扇形图中估计第二种生产方式的平均数为65×0.25+75×0.5+85×0.2+95×0.05=75.5 min.(3)从频率分布直方图中估计第一种生产方式的平均数为65×0.1+75×0.2+85×0.45+95×0.25=83.5 min,从平均数的角度发现:用第一种生产方式的工人完成生产任务所需要的时间高于80分钟;用第二种生产方式的工人完成生产任务所需要的时间低于80分钟,因此第二种生产方式的效率更高.考向二用样本估计总体例4(1)(多选)为了了解某校高一年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校高一年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校高一年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人D.该校高一年级学生1分钟仰卧起坐的次数少于20次的约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校高一年级学生1分钟仰卧起坐的次数少于20次的约有160人.故A,B,C正确,D错误,故选ABC.(2)(2020·香坊区校级二模)2020年初新冠病毒疫情爆发,全国范围开展了“停课不停学”的线上教学活动.哈六中数学组积极研讨网上教学策略:先采取甲、乙两套方案教学,并对分别采取两套方案教学的班级的7次线上测试成绩进行统计如图所示:①请填写如表(要求写出计算过程)平均数方差甲乙②从下列三个不同的角度对这次方案选择的结果进行分析:a.从平均数和方差相结合看(分析哪种方案的成绩更好);b.从折线图上两种方案的走势看(分析哪种方案更有潜力).解①由图象可得,x-甲=17×(109+111+113+115+117+119+121)=115,x-乙=17×(121+115+109+115+113+117+115)=115,则s2甲=17×(62+42+22+02+22+42+62)=16,s2乙=17×(62+02+62+02+22+22+02)=807≈11.43,故表格第一行:115,16;第二行:115,约为11.43.②a.因为x-甲=x-乙,s2甲>s2乙,故乙方案更好.b.由折线图可知甲走势稳定上升,故甲方案更好.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n[(x21+x2+…+x2n)-n x-2],或写成s2=1n(x21+x2+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.3.某学校共有学生2000人,其中高一800人,高二、高三各600人,学校对学生在暑假期间每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x-=3小时,方差为s2=1.966,其中三个年级学生每天读书时间的平均数分别为x-1=2.7,x-2=3.1,x-3=3.3,又已知高一学生、高二学生每天读书时间的方差分别为s21=1,s2=2,则高三学生每天读书时间的方差s23= .答案 3解析由题意可得,1.966=8002000×[1+(2.7-3)2]+6002000×[2+(3.1-3)2]+6002000×[s23+(3.3-3)2],解得s23=3.4.(2020·南宁模拟)为了检测某种零件的一条生产线的生产过程,从生产线上随机抽取一批零件,根据其尺寸的数据得到如图所示的频率分布直方图.若尺寸落在区间(x--2s,x-+2s)之外,则认为该零件属于“不合格”的零件,其中x-,s分别为样本平均数和样本标准差,计算可得s≈15(同一组中的数据用该组区间的中点值作代表).(1)求样本平均数的大小;(2)若一个零件的尺寸是100 cm ,试判断该零件是否属于“不合格”的零件.解 (1)x -=35×10×0.005+45×10×0.010+55×10×0.015+65×10×0.030+75×10×0.020+85×10×0.015+95×10×0.005=66.5.(2)x -+2s =66.5+30=96.5,x --2s =66.5-30=36.5,100>96.5,∴该零件属于“不合格”的零件.一、单项选择题1.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB .x -A <x -B ,s A >s B C.x -A >x -B ,s A <s BD .x -A <x -B ,s A <s B答案 B解析 由图可得样本A 的数据都在10及以下,样本B 的数据都在10及以上,所以x -A <x -B ,样本B 的数据比样本A 的数据波动幅度小,所以s A >s B ,故选B.2.在高一期中考试中,甲、乙两个班的数学成绩统计如下表: 班级 人数 平均数 方差甲20x-甲2乙30x-乙3其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案 C解析由题意可知两个班的数学成绩的平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30[2+(x-甲-x-)2]+3020+30[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.3.(2020·河南省名校联考)如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过21%的为()A.腾讯与百度的访问量所占比例之和B.网易与搜狗的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和答案 B解析由于网易与搜狗的访问量所占比例之和为18%,不超过21%,故选B.4.(2020·安庆模拟)某单位统计了本单位的职工一天行走步数(单位:百步)得到如图所示的频率分布直方图,估计该单位职工一天行走步数的平均值为(同一组中的数据用该组区间的中点值为代表)()A.125 B.125.6C.124 D.126答案 B解析由频率分布直方图,估计该单位职工一天行走步数的平均值为x-=60×0.002×20+80×0.006×20+100×0.008×20+120×0.012×20+140×0.010×20+160×0.008×20+180×0.002×20+200×0.002×20=125.6.故选B.5.(2020·威海一模)恩格尔系数是食品支出总额占个人消费支出总额的比重,其数值越小说明生活富裕程度越高.统计改革开放40年来我国历年城镇和农村居民家庭恩格尔系数,绘制了如图的折线图.根据该折线图,下列结论错误的是()A.城镇居民家庭生活富裕程度不低于农村居民家庭B.随着改革开放的不断深入,城镇和农村居民家庭生活富裕程度越来越高C.1996年开始城镇和农村居民家庭恩格尔系数都低于50%D.随着城乡一体化进程的推进,城镇和农村居民家庭生活富裕程度差别越来越小答案 C解析由折线图可知,对于A,因为城镇的恩格尔系数较小,故城镇居民家庭生活富裕程度不低于农村居民,A正确;对于B,城镇和农村的恩格尔系数整体上都在下降,说明城镇和农村居民家庭生活富裕程度越来越高,B正确;对于C,1996~2000年我国农村居民家庭恩格尔系数高于50%,C错误;对于D,结合图形得到城镇和农村家庭恩格尔系数之间的差距越来越小,说明城镇和农村家庭生活富裕程度差别越来越小,D正确.故选C.6.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;平均最高气温高于20 ℃的月份为六月、七月、八月,只有3个,D错误.7.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图和90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案 D解析由题图易知互联网行业从业人员90后占56%,A正确;仅90后从事技术岗位的人数占总人数的0.22176,超过20%,B正确;90后从事运营岗位的人数占总人数的0.56×0.17=0.0952>0.03,C正确;90后从事技术岗位的人数占总人数的0.22176<0.41,而题中未给出80后从事互联网行业岗位分布情况,故D不一定正确.二、多项选择题8.(2020·青岛模拟)近几年,在国家大力支持和引导下,中国遥感卫星在社会生产和生活各领域的应用范围不断扩大,中国人民用遥感卫星系统研制工作取得了显著成绩,逐步形成了气象、海洋、陆地资源和科学试验等遥感卫星系统.如图是2007~2018年中国卫星导航与位置服务产业总体产值规模(万亿)及增速(%)的统计图,则下列结论中正确的是()A.2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%B.若2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,总体产值规模将达3672亿元C.2007~2018年中国卫星导航与位置服务产业总体产值规模逐年增加,但不与时间成正相关D.2007~2018年中国卫星导航与位置服务产业总体产值规模的增速中有些与时间成负相关答案ABD解析对于A,根据图中数据可知2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%,故A正确;对于B,2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,即为20%,故2019年总体产值规模为3060×(1+20%)=3672(亿元),故B正确;对于C,根据正相关的定义,散点位于从左下角到右上角区域,则两个变量具有正相关关系,故C错误;对于D,根据负相关的定义,散点位于从左上角到右下角区域,则两个变量具有负相关关系,故D 正确.故选ABD.9.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故A,B,C正确,D错误.故选ABC.10.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析由于平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体平均数是2,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题11.(2021·湖北宜昌高三月考)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):人入选,则入选的最佳人选应是 . 答案 甲解析 因为x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.12.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .答案 8.6解析 由30×60%=18,设第19个数据为x ,则7.8+x 2=8.2,解得x =8.6,即第19个数据是8.6.四、解答题13.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.14.我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a的部分按照平价收费,超过a的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整; (2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)解 (1)(2)月均用水量的最低标准应定为2.5 t .样本中月均用水量不低于2.5 t 的居民占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5 t.(3)这100位居民的月均用水量的平均数为0.5×⎝ ⎛⎭⎪⎪⎫14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10=1.875(t).。

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开

2015届高三数学湘教版一轮复习配套课件:第10章 第3节 用样本估计总体

2015届高三数学湘教版一轮复习配套课件:第10章 第3节 用样本估计总体

+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.由于 2<4,
所以乙的平均成绩较为稳定. [答案] 2
计算一定
要准啊!
数学
首页
上一页
下一页
末页
第二十五页,编辑于星期五:八点 四十七分。
第三节 用样本估计总体 结束
[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体 的平均数、标准差的近似.实际应用中,需先计算数据的平均 数,分析平均水平,再计算方差(标准差)分析稳定情况. 2.若给出图形,一方面可以由图形得到相应的样本数据, 再计算平均数、方差(标准差);另一方面,可以从图形直观分 析样本数据的分布情况,大致判断平均数的范围,并利用数据 的波动性大小比较方差(标准差)的大小.
第 2 小组的频率为 0.75×26=0.25,又其频数为 12,故样本容
量为01.225=48.
答案:48
数学
首页
上一页
下一页
末页
第十一页,编辑于星期五:八点 四十七分。
第三节 用样本估计总体 结束
1.(2014·滨州模拟)在样本的频率分布直方图中,共有 11 个小
长方形,若中间一个小长方形的面积等于其他 10 个小长方形
上一页
下一页
末页
第二十四页,编辑于星期五:八点 四十七分。
第三节 用样本估计总体 结束
[解析] 对于甲,平均成绩为-x =90,所以方差为 s2=15
×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]
=4;对于乙,平均成绩为-x =90,方差为 s2=15×[(89-90)2
C.55
D.60

人教版高中数学高考一轮复习--用样本估计总体(课件)

人教版高中数学高考一轮复习--用样本估计总体(课件)
2.在实际问题中,总体平均数、总体方差和总体标准差都是未知的,一般用
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2

2015高考数学一轮课件:第9篇 第2节 用样本估计总体

2015高考数学一轮课件:第9篇 第2节 用样本估计总体

数学(第十人页,教编A辑版于星期·五理:科十三点 五(A十H五分) 。
基础梳理
课 时 训考练点 突 破
1.(2014潍坊一模)某校从参加高二年级学业水平测试的 学生中抽出100名学生,其数学成绩的频率分布直方图如图 所 示 . 其 中 成 绩 分 组 区 间 是 [40,50) , [50,60) , [60,70) , [70,80) , [80,90) , [90,100] . 则 成 绩 在 [80,100] 上 的 人 数 为 ()
数学(第二人十二教页A,版编辑于·星理期科五:十三(点AH五十) 五分。
基础梳理
(2)频率分布直方图:
课 时 训考练点 突 破
数学(第二人十三教页A,版编辑于·星理期科五:十三(点AH五十) 五分。
基础梳理
课 时 训考练点 突 破
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占
数学(第十人五页教,A编版辑于星·期理五科:十三点(A五H十五) 分。
基础梳理
课 时 训考练点 突 破
解析:总体密度曲线是频率分布折线图在样本容量无限 大,组距无限小时一个理想曲线,是有关系的,故选项A错 误;由选项A解释知道,频率分布折线图只能无限趋近于总 体密度曲线,但不能说就是总体密度曲线,所以选项B错 误;同理选项C也错误;如果样本容量无限增大,分组的组 距无限缩小,那么频率分布折线图就会无限接近于一条光滑 的曲线,这条光滑的曲线就是总体密度曲线,故选D.
用茎叶图表示数据的优点是:(1)所有的信息都可以 从茎叶图中得到;(2)便于记录和读取,能够展示数 据的分布情况.缺点是:当样本数据较多或数据位 数较多时,茎叶图就显得不太方便
数学(第六人页,教编A辑版于星期·五理:科十三点 五(A十H五分) 。

2015高考数学一轮总复习课件:9.2 用样本估计总体

2015高考数学一轮总复习课件:9.2 用样本估计总体

2. 理解样本数据标准差的意义和作用,会计算数据标准差.
3. 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解
释.
4. 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总
体的基本数字特征,理解用样本估计总体的思想.
5. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际
4 000 又月收入在[1 000,1 500)的有 4 000 人,故样本容量 n= 0.4 =10
000. 月收入在[1 500,2 000)的频率为 0.000 4×500=0.2, 月收入在[2 000,2 500)的频率为 0.000 3×500=0.15, 月收入在[3 500,4 000]的频率为 0.000 1×500=0.05,
第四页,编辑于星期五:十二点 四十七分。
2. 频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的 中点 ,就得频率 分布折线图. (2)总体密度曲线:随着 样本容量 的增加,作图时所分的组数增加, 组距 减 小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线.
B. 平均数
C. 中位数
D. 标准差
第二十八页,编辑于星期五:十二点 四十七分。
x1+x2+…+xn
y1+y2+…+ym
(1)x=
n
,y=
m

x1+x2+…+xn+y1+y2+…+ym
z=
m+n

nx+my n
m
则 z= m+n =m+nx+m+ny.
n1 由题意知 0<m+n<2,∴n<m.
(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准 差,众数、中位数、平均数都发生改变.

2015高考数学一轮课件:10-2用样本估计总体

2015高考数学一轮课件:10-2用样本估计总体

诊突培断破养基高解础频题
第四页,编辑于星期五:十三点 七分。
2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 ①众数:在一组数据中,出现次数最多的数据叫做这组数据 的众数. ②中位数:将一组数据按大小依次排列,把处在最中间位置 的一个数据(或最中间两个数据的平均数)叫做这组数据的中位 数. ③平均数:样本数据的算术平均数,即 x =1n(x1+x2+…+ xn).在频率分布直方图中,中位数左边和右边的直方图的面 积 相等 .
诊突培断破养基高解础频题
第三页,编辑于星期五:十三点 七分。
(4)将频率分布直方图中各个相邻的矩形的上底边的 中点顺次 连结起来,就得到频率分布折线图.随着 样本容的量增加, 作图时所分的 增组加数,组距减小,相应的频率分布折线图就 会越来越接近于一条光滑的曲线,统计中称之为总体分布的密 度曲线,它能够更加精细的反映出总体在各个范围内取值的百 分比. (5)茎叶图不仅能够保留原始数据,而且能够展示数据的分布情 况.茎是指中间一列数,叶就是从茎的旁边生长出来的数,在 样本数据较少时,用茎叶图表示数据的效果较好.
的频率用各小长方形的面积 表示,各小长方形的面积总和等
于1 .
诊突培断破养基高解础频题
第二页,编辑于星期五:十三点 七分。
(3)频率分布直方图的作法步骤: ①求全距,决定组数和组距,组距=全 组距 数; ②分组,通常对组内数值所在区间取左闭右开区间,最后一组取 闭区间; ③统计频数,计算频率,列出频率分布表.画出频率分布直方 图.
诊突培断破养基高解础频题
第二十五页,编辑于星期五:十三点 七分。
s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]= 4, s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]= 0.8. (2)由s2甲>s乙2 可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动, 可知甲的成绩在不断提高,而乙的成绩则无明显提高.

高考数学一轮复习 第十章 统计 10.2 用样本估计总体 文

高考数学一轮复习 第十章 统计 10.2 用样本估计总体 文

【步步高】(江苏专用)2017版高考数学一轮复习 第十章 统计 10.2用样本估计总体 文1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体分布的密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x是样本平均数). 【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √)(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( ×)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √)(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ×)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×)1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.答案137解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.答案91.5和91.5解析∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.在“世界读书日”前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙解析 x 甲=4+7+10+9+5+6+8+6+8+810=7.1,x 乙=7+8+6+8+6+7+8+7+5+910=7.1.s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. s 2甲>s 2乙,∴乙较稳定.题型一频率分布直方图的绘制与应用例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数281410 6(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案12解析志愿者的总人数为200.16+0.24×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分. 解 ①设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分). 题型二 茎叶图的应用例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为________.(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为__________. 答案 (1)①④ (2)5,8解析 (1)甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2. ∴x 甲<x 乙,s 甲>s 乙.(2)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8. 引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好. 解 由原题可知x =5,则甲组平均分为9+12+15+24+275=17.4.而乙组平均分为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差. 解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24. 故中位数为18,众数为18.②s 2=15[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲,乙两部门评分的中位数; (2)分别估计该市的市民对甲,乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲,乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.) 题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2015·广东)某工厂36名工人的年龄数据如下表. 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 1 40 10 36 19 27 28 34 2 44 11 31 20 43 29 39 3 40 12 38 21 41 30 43 4 41 13 39 22 37 31 38 5 33 14 43 23 34 32 42 6 40 15 45 24 42 33 53 7 4516 3925 3734 378 42 17 38 26 44 35 49 9 4318 3627 4236 39(1)年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)?解 (1)44,40,36,43,36,37,44,43,37.(2)x =44+40+36+43+36+37+44+43+379=40.s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)40-103=1103,40+103=1303在⎝ ⎛⎭⎪⎫1103,1303的有23个,占63.89%.9.高考中频率分布直方图的应用典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5, 所以直方图中x 的值是0.007 5.[3分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[14分]温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均值为x 1p 1+x 2p 2+…+x n p n ;若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2. [失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为____________.答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n =150.3=50.4.在某次测量中得到的A 样本数据如下:42,43,46,52,42,50,若B 样本数据恰好是A 样本数据每个都减5后所得数据,则A ,B 两样本的数字特征对应相同的是__________. 答案 标准差解析 利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B 样本数据恰好是A 样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A 样本不相同,标准差不变.5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有________.①a 1>a 2 ②a 2>a 1 ③a 1=a 2④a 1,a 2的大小与m 的值有关 答案 ②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________________. 答案 2解析 由题意可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 8.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08. 由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解 (1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n . ∵样本中产品净重小于100克的个数是36, ∴36n=0.300,∴n =120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.100=12,120×0.750=90,120×0.150=18, ∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元). B 组 专项能力提升 (时间:30分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.答案①解析由于频率分布直方图的组距为5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 13.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6 000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3,6 000.14.若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组频数频率[-3,-2)0.10[-2,-1)8(1,2]0.50(2,3]10(3,4]合计50 1.00(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解(1)如下表所示频率分布表.分组频数频率[-3,-2)50.10[-2,-1)80.16(1,2]250.50(2,3]100.20(3,4]20.04合计50 1.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为 0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件, 依题意505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数是1 980.15.(2014·广东)某车间20名工人年龄数据如下表:年龄(岁) 19 28 29 30 31 32 40 工人数(人)1335431(1)求这20(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解 (1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21. (2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2015届高考数学一轮总复习 10-2用样本估计总体基础巩固强化一、选择题1.(2013·重庆理,4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:min).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8[答案] C[解析] 由甲组数据中位数为15,可得x =5;而乙组数据的平均数16.8=9+15+(10+y )+18+245,可解得y =8,故选C.2.(2013·西宁模拟)已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解[答案] B[解析] 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=(3d )2+(2d )2+d 2+0+d 2+(2d )2+(3d )27=4d 2=1,解得d =±12.3.已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为( )A .2B .3[解析] 设x 1,x 2,x 3,x 4的平均值为x -,则 s 2=14[(x 1-x -)2+(x 2-x -)2+(x 3-x -)2+(x 4-x -)2]=14(x 21+x 22+x 23+x 24-4x -2), ∴4x -2=16,∴x -=2,x -=-2(舍),∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4,故选C.4.(文)(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60 [答案] B[解析] 由频率分布直方图知,低于60分的同学所占频率为(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50.故选B.(理)(2013·福建理,4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480[解析]由频率分布直方图知40~60分的频率为(0.005+0.015)×10=0.2,故估计不少于60分的学生人数为600×(1-0.2)=480.5.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图.由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54C.48 D.27[答案] B[解析]前两组中的频数为100×(0.05+0.11)=16.∵后五组频数和为62,∴前三组为38.∴第三组为22.又最大频率为0.32,故最大频数为0.32×100=32.∴a=22+32=54,故选B.6.(文)(2013·六安一模)如图是2012年某校举办“激扬青春,勇担责任”演讲比赛上七位评委为某位选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的中位数和平均数分别为()A.8587 B.8486C.8485 D.8586[答案] C[解析]由茎叶图知,评委为某选手打出的分数分别不79,84,84,84,86,87,93,去掉一个最高分和一个最低分后分数分别是84,84,84,86,87,所以中位数为84,平均数为15×(84+84+84+86+87)=85.(理)(2013·山东滨州一模)如图是2013年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A.84,4.84 B .84,1.6 C .85,1.6 D .85,4[答案] C[解析] 去掉一个最高分93和一个最低分79,所剩数据的平均数x -=84+84+86+84+875=85,方差s 2=15[(84-85)2×3+(86-85)2+(87-85)2]=1.6,故选C.二、填空题7.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试.对200名学生测试所得数据作出频率分布直方图如图所示,若次数在110以上(含110次)为达标,则从图中可以看出高一学生的达标率是________.[答案] 80%[解析] 次数在110以上(含110次)的频率之和为(0.04+0.03+0.01)×10=0.8,则高一学生的达标率为0.8×100%=80%.8.(文)将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n 等于________.[答案] 60[解析] 由条件知,2+3+42+3+4+6+4+1×n =27,解得n =60.(理)容量为100的样本分为10组,若前7组频率之和为0.79,而剩下三组的频数成等比数列,且其公比不为1,则剩下的三组频数最大的一组的频率是________.[答案] 0.16或0.12[解析]后三组频数和为100(1-0.79)=21,设这三组频数依次为a、ap、ap2(a、p∈N*且p>1),由题意设得,a+ap+ap2=21,∵p>1,∴1+p+p2是21的大于3的约数,∴1+p+p2=21或1+p+p2=7,得p=4或p=2.当p=4时,频数最大值为16,频率为0.16;当p=2时,频数最大值为12,频率为0.12.9.(文)(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.[答案](1)0.0044(2)70[解析]∵50×(0.0024+0.0036+0.006+x+0.0024+0.0012)=1,∴x=0.0044.用电量在区间[100,250)内的频率为50×(0.0036+0.006+0.0044)=0.7,∴户数为100×0.7=70(户).(理)(2013·北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13s与18s之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为,那么成绩在[16,18]的学生人数是________.[答案] 54[解析] 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.三、解答题10.(2012·石家庄市二模)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a 的部分按照平价收费,超过a 的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整;(2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)[解析] (1)(2)月均用水量的最低标准应定为2.5t.样本中月均用水量不低于2.5t 的居民有20位,占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5t.(3)这100位居民的月均用水量的平均数为0.5×(14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10)=1.875(t).能力拓展提升一、选择题11.(文)某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品个数是( )A .90B .75C .60D .45 [答案] A[解析] 产品净重小于100克的频率为(0.050+0.100)×2=0.300,设样本容量为n ,则36n =0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.(理)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图所示).已知图中从左到右第一、第六小组的频率分别为0.16、0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为( )A .480B .440C .420D .400[答案] D[解析] 设第一、第二、第三小组的频率构成的等比数列公比为q ,第三、第四、第五、第六小组的频率构成的等差数列公差为d ,则由题意知即⎩⎪⎨⎪⎧0.16+0.16q +0.64q 2+6d =1,0.16q 2+3d =0.07. 消去d 得,16q 2+8q -35=0.∵q >0,∴q =54.∴第三组的频率P =0.16q 2=0.25.设男生总数为x ,则x ×25%=100,∴x =400.12.(2013·山东济南一模)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x -甲,x -乙和中位数y 甲,y 乙进行比较,下面结论正确的是( )A.x -甲>x -乙,y 甲>y 乙B.x -甲<x -乙,y 甲<y 乙 C.x -甲<x -乙,y 甲>y 乙 D.x -甲>x -乙,y 甲<y 乙 [答案] B[解析] 由茎叶图得x -甲=19+20+21+23+25+29+32+33+37+4110=28,x -乙=10+26+30+30+34+37+44+46+46+4710=35,y 甲=25+292=27,y 乙=34+372=35.5,∴x -甲<x -乙,y 甲<y 乙,故选B. 二、填空题13.(2013·福建莆田模拟)一组数据如茎叶图所示,若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.[答案] 63[解析] 这组数据的平均数x -=3+8+12+11+13+16+217=12,由题意,剔除2个数据,平均数不变,且方差最小,则这两个数的和等于24且(x i -x -)2的和最大,所以这两个数为3与21,故剔除的2个数据的积等于3×21=63.14.(文)(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.[答案] 100[解析] 由条件知,1-(0.01+0.024+0.036)×10=30n,∴n =100.(理)某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3000名学生在该次数学考试中成绩小于60分的学生数是________.[答案] 600[解析] 成绩小于60分的学生频率为:(0.002+0.006+0.012)×10=0.2 故3000名学生中成绩小于60分的学生数为:3000×0.2=600. 三、解答题15.(2013·东北三校联考)PM2.5是指悬浮在空气中的空气动力学当量直径小于或等于2.5μm 的颗粒物,也称为可入肺颗粒物,根据现行国家标准GB3095—2012,PM2.5日均值在35微克/m 3以下空气质量为一级;在35微克/m 3~75微克/m 3之间空气质量为二级;在75微克/m 3以上空气质量为超标.从某自然保护区2012年全年每天的PM2.5监测值数据中随机地抽取12天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶):(1)求空气质量为超标的数据的平均数与方差;(2)从空气质量为二级的数据中任取2个,求这2个数据的和小于100的概率;(3)以这12天的PM2.5日均值来估计2012年的空气质量情况,估计2012年(按366天计算)中大约有多少天的空气质量达到一级或二级.[解析] (1)空气质量为超标的数据有四个:77,79,84,88, 平均数为x -=77+79+84+884=82.方差为s 2=14×[(77-82)2+(79-82)2+(84-82)2+(88-82)2]=18.5.(2)空气质量为二级的数据有五个:47,50,53,57,68,任取两个有十种可能结果:{47,50},{47,53},{47,57},{47,68},{50,53},{50,57},{50,68},{53,57},{53,68},{57,68},两个数据和小于100的结果有一种:{47,50}, 记“两个数据和小于100”为事件A ,则P (A )=110,即从空气质量为二级的数据中任取2个,这2个数据和小于100的概率为110.(3)空气质量为一级或二级的数据共8个,所以空气质量为一级或二级的频率为812=23, 366×23=244,所以,2012年的366天中空气质量达到一级或二级的天数估计为244天.16.(文)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 名同学进行调查.下表是这n 名同学的日睡眠时间的频率分布表.(1)求(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a 、b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.[解析] (1)由频率分布表可得n =60.12=50.补全数据如下表频率分布直方图如下:(2)由题意知,⎩⎪⎨⎪⎧150(6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5)=6.52,6+10+a +b +4=50. 解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A , 则P (A )≈15+450=0.38答:该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.(理)某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180min 到330min 之间,按他们学习时间的长短分5个组统计得到如下频率分布表:(1)求分布表中s 、t (2)某兴趣小组为研究每天自主学习的时间与学习成绩的相关性,需要在这40名学生中按时间用分层抽样的方法抽取20名学生进行研究,问应抽取多少名第一组的学生?(3)已知第一组的学生中男、女生均为2人,在(2)的条件下抽取第一组的学生,求既有男生又有女生被抽中的概率.[解析] (1)s =840=0.2,t =1-0.1-s -0.3-0.25=0.15.(2)设应抽取x 名第一组的学生,则x 4=2040,得x =2.故应抽取2名第一组的学生.(3)在(2)的条件下应抽取2名第一组的学生. 记第一组中2名男生为a 1,a 2,2名女生为b 1,b 2,按时间用分层抽样的方法抽取2名第一组的学生共有6种等可能的结果,列举如下: a 1a 2,a 1b 1,a 1b 2,a 2b 1,a 2b 2,b 1b 2.其中既有男生又有女生被抽中的有a 1b 1,a 1b 2,a 2b 1,a 2b 2,共4种结果, 所以既有男生又有女生被抽中的概率为P =46=23.考纲要求1.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 补充说明1.编制频率分布直方图的步骤如下:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=极差组数.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称为频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.2.频率分布折线图(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图. (2)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布折线图实际上越来越接近于一条光滑曲线,这条光滑的曲线就叫总体密度曲线.3.茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.4.方差是刻画一组数据离散程度的量,它反映一组数据围绕平均数波动的大小.方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.计算方差时,要依据所给数据的特点恰当选取公式以简化计算.备选习题1.从某女子跳远运动员的多次测试中,随机抽取20次成绩作为样本,按各次的成绩(单位:cm)分成五组,第一组[490,495),第二组[495,500),第三组[500,505),第四组[505,510),第五组[510,515],相应的样本频率分布直方图如图所示.(1)样本落入第三组[500,505)的频数是多少?(2)现从第二组和第五组的所有数据中任意抽取两个,分别记为m、n,求事件“|m-n|≤5”的概率.[解析](1)由频率分布直方图可知,样本落入[500,505)的频率是1-(0.01+0.02+0.04+0.03)×5=0.5,所以,样本落入[500,505)的频数是0.5×20=10.(2)第二组中有0.02×5×20=2个数据,记为a、b;第五组中有0.03×5×20=3个数据,记为A、B、C.则{m,n}的所有可能结果为{a,b},{a,A},{a,B},{a,C},{b,A},{b,B},{b,C},{A,B},{A,C},{B,C},共10种.其中使|m-n|≤5成立的有{a,b},{A,B},{A,C},{B,C},共4种.所以事件“|m-n|≤5”的概率为P=410=25.2.(2013·烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组的对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由. [解析] (1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14, ∴此次测试的总人数为70.14=50.∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.(2)直方图中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,∴中位数位于第4组内.。

相关文档
最新文档