高三理科数学 专题五 图表、统计案例的训练与提升(试题及详细答案解析)
高三总复习数学课件 统计图表——解决问题的法宝

[高考还曾这样考] 1.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:
℃)的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1, 2,…,20)得到下面的散点图:
由此散点图,在 10 ℃至 40 ℃之间,下面四个回归方程类型中最适宜作为发芽率 y
[考题溯源与解法探究] (必修第二册第 205 页例 5)某学校要定制高一年级的校服,学生根据厂家提供的参
考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表所示. 校服规格 155 160 165 170 175 合计 频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和 众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合 理性.
[真题 2 解析] D 由频率分布直方图知,评分在区间[82,86)内的影视作品的频率 为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品数量是 400×0.2=80, 故选 D.
[点评] 解决涉及统计中的图表信息问题,关键是从统计的图表中正确提取对应 的数据信息.并加以合理转化与正确应用,从而合理地进行数据分析与数据处理.
3.(2016·全国Ⅲ卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均
最高气温和平均最低气温的雷达图.图中 A 点表示十月的平均最高气温约为 15 ℃,
B 点表示四月的平均最低气温约为 5 ℃.下面叙述不正确的是
()
A.各月的平均最低气温都在 0 ℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于 20 ℃的月份有 5 个
(完整版)高三复习高中数学统计案例习题(有详细答案)

2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
高中数学 第三章 统计案例练习 理 新人教A版选修2-3(2021年最新整理)

2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3的全部内容。
第三章 统计案例微测试1 3.1回归分析的基本思想及其初步应用(测试时间:20分钟)一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的. 1.给出下列四个命题,其中正确的一个是A .在线性回归模型中,相关指数20.80R =,说明预报变量对解释变量的贡献率是80%B .相关系数0.852r =,接近1,表明两个变量的线性相关性很差C .相关指数2R 用来刻画回归效果,2R 越小,则残差平方和越大,模型的拟合效果越好D .相关指数2R 用来刻画回归效果,2R 越大,则残差平方和越小,模型的拟合效果越好 2.下表是x 和y 之间的一组数据,则y 关于x 的回归直线方程必过A .点(2,3)B .点(3,5)C .点(2.5,4)D .点(2.5,5)3.下表是某厂14~月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0ˆ.7yx =-+ a ,则a 等于A .10.5B .5.15C .5.2D .5.254.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且ˆ 2.347 6.423yx =-; ②y 与x 负相关且ˆ 3.476 5.648y x =-+; ③y 与x 正相关且ˆ 5.4378.493yx =+; ④y 与x 正相关且ˆ 4.326 4.578y x =--。
高考数学统计与统计案例.doc

高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为()A.1%B.2%C.3%D.5%C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食品开支的30 = 1 ,30+40+100+80+ 50 101∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.]2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为()A.4B. 3C.2D.1B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.]3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频率分布直方,据此估批品的中位数()A.20B. 25C.22.5D.22.75C[ 品的中位数出在概率是 0.5 的地方 . 自左至右各小矩形面依次0.1,0.2,0.4,⋯⋯,中位数是 x,由 0.1+0.2+0.08 ·(x-20)=0.5,得 x= 22.5,故 C.]4.(2019 ·三明模 )在某次高中数学中,随机抽取 90 名考生,其分数如所示,若所得分数的平均数,众数,中位数分 a, b, c, a,b,c 的大小关系 ()A.b<a<c B.c<b<aC.c<a<b D.b<c<a2 50+ 60D [算得平均a=593,众数b=50,中位数c= 2 =55,故b<c<a, A.]5.(2019 南·充模 )如表是我国某城市在2017 年 1 月份至 10 月份各月最低温与最高温 (℃ )的数据一表.月份 1 2 3 4 5 6 7 8 9 10最高温 5 9 9 11 17 24 27 30 31 21最低温-12 - 3 1 - 2 7 17 19 23 25 10 已知城市的各月最低温与最高温具有相关关系,根据一表,下列的是 ()A.最低温与最高温正相关B.每月最高温与最低温的平均在前8 个月逐月增加C.月温差 (最高温减最低温 )的最大出在 1 月D.1 月至 4 月的月温差 (最高温减最低温 )相于 7 月至 10 月,波性更大B[ 根据意,依次分析:于 A ,知城市的各月最低温与最高温具有相关关系,由数据分析可得最低温与最高温正相关, A 正确;于B,由表中数据,每月最高温与最低温的平均依次:-3.5,3,5,4.5,12,20.5,23,26.5,28,15.5,在前 8 个月不是逐月增加, B ;于 C,由表中数据,月温差依次: 17,12,8,13,10,7,8,7,6,11;月温差的最大出在 1 月,C 正确;于 D,有 C 的,分析可得 1 月至 4 月的月温差相于 7 月至 10 月,波性更大, D 正确;故B.]6.某中学的高中女生体重y(位: kg)与身高 x(位: cm)具有性相关关系,根据本数据 (x i, y i )(i =1,2,3,⋯, n),用最小二乘法近似得到回直^方程 y=0.85x-85.71,下列中不正确的是()A.y 与 x 具有正性相关关系––B.回直本点的中心( x , y )C.若中学某高中女生身高增加 1 cm,其体重增加0.85 kgD.若中学某高中女生身高160 cm,可断定其体重必50.29 kg^D[ 因回直方程 y=0.85x-85.71 中 x 的系数 0.85>0,因此 y 与 x 具有正性相关关系,所以 A 正确;由最小二乘法及回直方程的求解––可知回直本点的中心( x , y ),所以 B 正确;由于用最小二乘法得到的回直方程是估,而不是具体,若中学某高中女生身高增加 1 cm,其体重增加0.85 kg,所以 C 正确, D 不正确. ]7.(2018 ·永州三模 )党的十九大告明确提出:在共享等域培育增点、形成新能.共享是公众将置源通社会化平台与他人共享,而得收入的象.考察共享企活度的影响,在四个不同的企各取两个部行共享比,根据四个企得到的数据画出如下四个等高条形图,最能体现共享经济对该部门的发展有显著效果的图形是()D[ 根据四个列联表中的等高条形图可知,图中 D 中共享与不共享的企业经济活跃度的差异最大,它最能体现共享经济对该部门的发展有显著效果,故选D.]8.(2019 ·州模拟惠)已知 x 与 y 之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得的线性回归方程为^ ^ ^y= b +若某同学根据上表中的x a.前两组数据 (1,0)和 (2,2)求得的直线方程为y= b′ x+a′,则以下结论正确的是()^ ^ ^ ^A.b>b′, a>a′B.b>b′, a<a′^ ^ ^ ^C.b<b′, a>a′D.b<b′, a<a′C[ 由两组数据 (1,0)和(2,2)可求得直线方程为 y=2x-2,b′=2,a′=-^ 2.而利用线性回归方程的公式与已知表格中的数据,可求得 b =5 ^ – ^– 13 5==7,a= y -b x =6-771^^×2=-3,所以 b<b′,a>a′.]9.(2019 天·津模 )某校高中共有 720 人,其中理科生 480 人,文科生 240 人,采用分抽的方法从中抽取 90 名学生参加研,抽取理科生的人数________.48060[由分抽的定得抽取理科生的人数720×90=60.]–10.已知本数据x1,x2,⋯, x n的平均数 x = 5,本数据2x1+1,2x2 +1,⋯, 2x n+1 的平均数 ________.11[ 由 x1,x2,⋯,x n的平均数 x= 5,得 2x1+1,2x2+1,⋯,2x n+1 的平–均数 2 x +1= 2× 5+ 1= 11.]11.某学校随机抽取部分新生其上学所需(位:分 ),并将所得数据制成率分布直方(如 ),其中,上学所需的范是[0,100] ,本数据分 [0,20),[20,40),[40,60), [60,80), [80,100],(1)中的 x= ________;(2)若上学所需不少于 1 小的学生可申在学校住宿,校600 名新生中估有 ________名学生可以申住宿.0.0125 72[(1) 由率分布直方知20x= 1-20×(0.025+ 0.0065+ 0.003 +0.003),解得 x=0.0125.(2)上学不少于 1 小的学生的率0.12,因此估有0.12×600=72(人)可以申住宿. ]12.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20 分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;^③在线性回归方程 y=0.2x+12 中,当解释变量x 每增加一个单位时,预报^变量 y平均增加 0.2 个单位;④对分类变量 X 与 Y 的统计量 K2来说, K2越小,“ X 与 Y 有关系”的把握程度越大.②③[①是系统抽样;对于④,统计量 K2越小,说明两个相关变量有关系的把握程度越小. ]。
高三一轮复习专题训练:统计、统计案例(最新题,14页)

2 分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问
------ 珍贵文档 ! 值得收藏! ------
------ 精品文档 ! 值得拥有! ------
题需先求出抽样比 —— 样本容量与总体容量的比, 则各层所抽取的样本容量等于该层个体总 数与抽样比的乘积 .
三、预测押题不能少
解析: 由题意知, 0.15(x+ 1)+ 0.2- 0.15 x- 0.2= 0.15. 答案: 0.15
统计与概率的交汇
统计与统计案例的主要内容是随机抽样、 样本估计总体、 变量的相关性、 回归分析和独 立性检验, 该部分内容在高考中占有一定的位置, 近两年高考中由单纯考查统计及统计案例 转化为与概率交汇命题且背景贴近生活,角度新颖,试题多为解答题,难度中档.
D. b^<b′, a^<a′
[解析 ] 由 (1,0), (2,2) 求 b′ , a′,则
2- 0 b′ = = 2,a′ = 0-2× 1=- 2.
2- 1 由上表数据求 b^, a^,
6
xiyi= 0+ 4+ 3+12+ 15+24= 58,
i=1
13 x = 3.5, y = 6 ,
6
x2i = 1+Βιβλιοθήκη 4+ 9+ 16+ 25+ 36= 91,
3n 60= 260,解得 n=13.
(2)将某班的 60 名学生编号为: 01,02,…, 60,采用系统抽样方法抽取一个容量为 5 的 样本,且随机抽得的一个号码为 04,则剩下的四个号码依次是 ________.
解析: 依据系统抽样方法的定义知,将这 60 名学生依次按编号每 12 人作为一组,即
1. (1) 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为
高三数学北师大通用,理总复习强化训练 创新题目技能练——统计统计案例

创新题目技能练——统计、统计案例A 组 专项基础训练 (时间:40分钟)一、选择题1. 从2 012名学生中选取50名学生参加数学竞赛,若采用下面的方法选取:先用简单随机抽样从2 012人中剔除12人,剩下的2 000人再按系统抽样的方法抽取50人,则在2 012人中,每人入选的概率( )A .不全相等B .均不相等C .都相等,且为251 006D .都相等,且为140答案 C解析 在各种抽样中,不管是否剔除个体,也不管抽取的先后顺序,每个个体被抽到的可能性都是相等的,这是各种抽样的一个特点,也说明了抽样的公平性.故本题包括被剔除的12人在内,每人入选的概率是相等的,都是502 012=251 006. 2. 右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的 数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中 位数是( )A .161 cmB .162 cmC .163 cmD .164 cm答案 B解析 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162(cm).3. 已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y =bx +a ,则“(x 0,y 0)满足线性回归方程y =bx +a ”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的 ( )A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件答案 B解析 x 0,y 0为这10组数据的平均值,根据公式计算线性回归方程y =bx +a 的b 以后, 再根据a =y -b x (x ,y 为样本平均值)求得a .因此(x ,y )一定满足线性回归方程,但满足线性回归方程的除了(x ,y )外,可能还有其他样本点.4. 在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .0.2C .40D .0.25答案 A解析 由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1, ∴x =0.2,故中间一组的频数为160×0.2=32,选A.5. 若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5. 二、填空题6. 某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法 看清,若记分员计算无误,则数字x 应该是________. 答案 1解析 当x ≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,则89+89+92+93+92+91+x +907=91,∴x =1.7. 甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.答案 24 23 解析 x 甲=110×(19+18+20+21+23+22+20+31+31+35)=24. x乙=110×(19+17+11+21+24+22+24+30+32+30)=23. 8. 如图所示是某公司(员工总人数300人)2012年员工年薪情况的频率分布直方图,由此可知,员工中年薪在2.4万元~2.6万元之间的共有________人.答案 72解析 由所给图形,可知员工中年薪在2.4万元~2.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,所以员工中年薪在2.4万元~2.6万元之间的共有300×0.24=72(人). 三、解答题9. 某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:x 3 4 5 6 7 8 9 y66697381899091已知:∑7i =1x 2i =280,∑i =1y 2i =45 309,∑i =1x i y i =3 487. (1)求x ,y ;(2)判断纯利润y 与每天销售件数x 之间是否线性相关,如果线性相关,求出线性回归方程.解 (1)x =17(3+4+5+6+7+8+9)=6,y =17(66+69+73+81+89+90+91)≈79.86.(2)根据已知∑7i =1x 2i =280,∑7i =1y 2i =45 309, ∑7i =1x i y i =3 487,得相关系数r =3 487-7×6×79.86(280-7×62)(45 309-7×79.862)≈0.973.所以纯利润y 与每天销售件数x 之间具有较强的线性相关关系. 利用已知数据可求得线性回归方程为y =4.75x +51.36. 10.某初级中学共有学生2 000名,各年级男、女生人数如表:(1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y ≥245,z ≥245,求初三年级中女生比男生多的概率. 解 (1)因为x2 000=0.19,所以x =380.(2)初三年级人数为y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为500×482 000=12.(3)设“初三年级中女生比男生多”的事件为A ,初三年级中女生、男生人数记为(y ,z ); 由(2),知y +z =500,且y ,z ∈N ,基本事件空间包含的基本事件有 (245,255)、(246,254)、(247,253)、…、(255,245)共11个,事件A 包含的基本事件有(251,249)、(252,248)、(253,247)、(254,246)、(255,245)共5个,所以P (A )=511.B 组 专项能力提升 (时间:25分钟)1. 某地区选出600名消防官兵参与灾区救援,将其编号为001,002,…,600.为打通生命通道,先采用系统抽样方法抽出50名为先遣部队,且随机抽得的号码为003.这600名官兵来源于不同的县市,从001到300来自A 市,从301到495来自B 市,从496到600来自C 市,则三个市被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9答案 B解析 依题意可知,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人,则分别是003、015、027、039、051、063、075、…,容易知道抽到的编号构成以3为首项,12为公差的等差数列,故被抽到的第n 名消防官兵的编号为a n =3+(n -1)×12=12n -9,由1≤12n A -9≤300,则1≤n A ≤25,因此抽取到的A 市的人数为25人. 同理可知其他两市的人数为17和8.故选B.2. 在2012年3月15日那天,南昌市物价部门对本市5家商场某商品的一天销售量及其价格进行了调查,5家商场的售价x 元和销售量y 件之间的一组数据如表所示:y =-3.2x +a ,则a 等于 ( )A .-24B .35.6C .40.5D .40答案 D解析 由题意,得x =15×(9+9.5+10+10.5+11)=10,y =15×(11+10+8+6+5)=8,且回归直线必经过点(x ,y )即点(10,8), 则有8=-3.2×10+a ^,解得a ^=40.3. 已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋进行检查,若第一组抽出的号码是11,则第六十一组抽出的号码为______. 答案 1211解析 每组袋数d =3 000150=20,由题意知抽出的这些号码是以11为首项,20为公差的等差数列,故第六十一组抽出的号码为11+60×20=1211.4. 有同学在用电子邮件时发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍与邮箱名称是否含有数字有关,于是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么认为“国籍和邮箱名称里是否含有数字有关”的把握性为________.(用百分数表示) χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )P (χ2≥k 0)0.25 0.15 0.10 0.05 0.025 0.010 k 01.3232.0722.7063.8415.0246.635解析中国人 外国人 总计 有数字 43 27 70 无数字 21 33 54 总计6460124由表中数据,得χ2=124×(43×33-27×21)270×54×64×60≈6.201,∵χ2≥5.024,∴有97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”. 5. 某校高三数学竞赛初赛后,对考生成绩进行统计(考生成绩均不低于90分,满分150分),将成绩按如下方式分成六组,第一组[90,100),第二组[100,110),……,第六组[140,150].如图所示为其频率分布直方图的一部分,第四组,第五组,第六组的人数依次成等差数列,且第六组有4人.(1)请补充完整频率分布直方图,并估计这组数据的平均数M ;(计算时可以用组中值代替各组数据的平均值)(2)现根据初赛成绩从第四组和第六组中任意选2人,记他们的成绩分别为x ,y ,若|x -y |≥10,则称此2人为“黄金帮扶组”,试求选出的2人为“黄金帮扶组”的概率. 解 (1)设第四组,第五组的频率分别为m ,n , 则2n =m +0.005×10,①m +n =1-(0.005+0.015+0.020+0.035)×10, ②由①②解得m =0.15,n =0.1, 从而得出频率分布直方图(如图所示).M =95×0.2+105×0.15+115×0.35+125×0.15+135×0.1+145×0.05=114.5. (2)依题意,知第四组人数为4×0.0150.005=12,而第六组有4人,所以第四组和第六组一共有16人,从中任选2人,一共有C 216=120(种)选法,若满足|x -y |≥10,则一定是分别从两个小组中各选1人,因此有C 112C 14=48(种)选法,所以选出的2人为“黄金帮扶组”的概率P =48120=25.。
高中数学【统计与统计案例】专题练习

高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。
高中数学 基础知识篇 1.4统计图表训练(含解析)北师大

3统计图表 4数字的特征(必修3北师版)建议用时 实际用时满分 实际得分45分钟100分一、选择题(每小题5分,共30分) 1.下列叙述中正确的是( )A.从频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的 频率D.组数是样本平均数除以组距2.如果五个数12345x x x x x ,,,,的平均数是7,那么1234511111x x x x x +++++,,,,这五个数的平均数是( )A.5 B.6 C.7 D.8 3.为了让人们感受到丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33、25、28、26、25、31,如果该班有45名同学,那么根据提供的数据估计这周全班同学各家总共丢弃塑料袋的数量约为( ) A.900 B.1080 C.1260 D.18004.一组数据的方差为3,将这组数据中的每一个数据都扩大到原来的3倍,则所得到的一组数据的方差是( )A.1 B.27 C.9 D.3 5.已知两个样本,甲:2,4,6,8,10;乙:1,3,5,7,9.样本方差分别为2s 甲,2s 乙则二者的关系是( )A. 2s 甲>2s 乙 B. 2s 甲<2s 乙 C. 2s 甲=2s 乙D.无法确定6.已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么下列样本范围的频率为0.25的是( ) A.[5.5,7.5) B.[7.5,9.5) C.[9.5,11.5) D.[11.5,13.5) 二、填空题(每小题5分,共20分)7.一个容量为n 的样本分成若干组,已知某组的频数和频率分别为36和0.25,则n = . 8.一个容量为20的样本数据,分组后,组距和频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则样本数据在区间[50,+∞)上的频率为 .9.五个数1,2,3,4,a 的平均数是3,则这五个数的标准差是 .10.某人射击十次,得环数如下:18,20,19,22,20,21,19,19,20,21,则这组数据的平均数是 ,方差是 . 三、解答题(共50分) 11.(12分)下表是60名学生的数学成绩的分组情况表: 分组 0.5~20.5 20.5~40.540.5~60.560.5~80.580.5~100.5频数 3 6 12频率0.3 (1)在表中空格内填上相应数据;(2)画出频率分布直方图. 12.(12分)2007年是某省实施新课程改革后的第一次高考,经教育部批准该省自主命题,为慎重起见,该省于2005年制定了两套高考方案,且对这两套方案在全省14个地级市分别召集专家进行研讨,并对认为合理的方案进行了投票表决,统计结果如下:第一套方案:38,25,73,64,20,55,72,41,8,67,70,66,58,24.第二套方案:36,42,6,61,21,54,12,42,5,14,19,19,45,37.用茎叶图说明哪个方案比较稳妥. 13.(13分)为了了解中学生的身高情况,对某中学同龄的若干女生身高进行测量,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右五个小组的频率分别为0.017,0.050,0.100,0.133,0.300,第三小组的频数为6.(1)参加这次测试的学生数是多少?(2)如果本次测试身高在157cm以上(包括157cm)的为良好,试估计该校女生身高良好率是多少?14.(13分)要从甲、乙、丙三位射击运动员中选拔一名参加比赛,在预选赛中,他们每人各打10发子弹,命中的环数如下:甲:10,10,9,10,9,9,9,9,9,9;乙:10,10,10,9,10,8,8,10,10,8;丙:10,9,8,10,8,9,10,9,9,9. 根据这次成绩,应该派谁去参赛?3统计图表 4数字的特征答题纸得分:一、选择题题号 1 2 3 4 5 6答案二、填空题7. 8. 9. 10.三、解答题 11. 12. 13. 14.3统计图表 4数字的特征答案一、选择题1.C 解析:从频率分布表看不出样本数据对于平均数的波动大小,故A 错. 频数是指落在各个小组内的数据的个数,故B 错.每小组的频数与样本容量之比是这个小组的频率,故C 对. 组数是样本中的最大值减去最小值得到的差除以组距,故D 错.2.D 解析:1234512345735.x x x x x x x x x x ∴++++=Q ,,,,这五个数的平均数是,∴12345111114058x x x x x +++++++++=÷=.3.C 解析:由已知抽样数据可得平均数为=28(个),所以可以估计本周全班同学各家共丢弃塑料袋的数量约为28×45=l260(个).4.B 解析:设原来这组数据的平均数为,这组新数中的每个数据都扩大到原来的3倍,则这组新数的平均数为3,原来的方差==3,现在的方差====9=9×3=27,方差扩大9倍.5.C 解析:甲的平均数=(2+4+6+8+10)÷5=6,乙的平均数=(1+3+5+7+9)÷5=5, 所以2s 甲==8,2s 乙 ==8,所以2s 甲=2s 乙.6.D 解析:本题考查了频率的计算方法:频率=频数÷总数. 二、填空题7.120 解析:∵频数和频率分别为36和0.25,∴n==144.8.0.3 解析:由已知中样本在,+∞﹚上的频数为2+4=6,故样本在,+∞﹚上的频率为.9. 解析:12343123453 5.a a a ++++÷==因为,,,,的平均数是,所以(),解得 222222111323334353102 2.55s s ⎡⎤=-+-+-+-+-=⨯==⎣⎦所以()()()()(),所以 10.19.9,1.29三、解答题 11. 解:(1)分组 0.5~20.520.5~40.5 40.5~60.560.5~80.580.5~100.5频数 3 6 12 21 18 频率0.050.100.200.350.3(2)频率分布直方图如图所示:12. 解:作茎叶图如下:从茎叶图可以看出第一套方案比较稳妥. 13.解:(1)由于60.160÷=,故参加这次测试的学生有60名; (2)良好率为10.0170.0500.1000.1330.7----=.14. 解:经计算,甲、乙、丙三人命中的总环数分别为93,93,91,所以应先淘汰丙.设甲、乙平均成绩分别为12x x ,,方差分别为2212s s ,,则129.3x x ==,222211[(109.3)(109.3)(99.3)]0.2110s =-+-++-=L , 222221[(109.3)(109.3)(89.3)]0.8110s =-+-++-=L , 虽然甲、乙总成绩相同,但因为0.210.81<即2212s s <,故甲的发挥比较稳定,所以应派甲去参赛.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
efg”3&hi a b,j k;P [ ②,∵狔=犮犲犽狓 ,∴ > l m P %,&(ln狔=ln(犮犲犽狓 )=ln犮+ln犲犽狓 =ln犮+犽狓,n狕=ln狔,& ( 狕=ln犮+犽狓,∵狕=0.3狓+4,∴ln犮=4,犽=0.3,∴犮=犲4 .o ② j
k;P[③,!"peqrOffg3>/]4 3 G H % " s
tìuv Ê w.x Í ] y H z { | },' F ~ ¬.y ,F G ï C D ï ".[ ã GHK§2019ïp9 " ` F G ï C D { uH% T , f g S T 2018 ï 50 ¹FGHïCDÞKQ56»ÂY¼ V:
5.
犱=5
2
,
5
犘=11200=112,P
[
B
,犘=
1 7
,P
[
C
,犘=0,P[ D ,犘=1360,9 B,C,D V,9: A.
^ ^ ^ 6.狓=3,狔=2,犫=44++96++186++2346--3405=
3 5
,犪=狔-犫狓=2-
3 5
×
^ 3=
1 5
,∴
t
u
v
q
w
(狓2
-1),9
:
D.
2.;<=>?@A6BCD3EFGHIJ:< K % " L M,=
K%"LN,<K%" O P Q R,= K % " O P S T,; < =
> K % " 3 U V % S W 5 犿1,犿2,X Y Z S W 5狀1,狀2 ( 犿1 >犿2,狀1<狀2.9 : C. 3.P[①,S\]4 犃 ^犅 3 _ ` ] 4 犓2 a b,c d “犃 ^ 犅
C:狀=犪+犫+犮+犱. 犘(犓2≥犽0) 05
0.005 0.001 7.879 10.828
12.(± Ê Ñ $ Y 20 Y ) bcy>d,! e f g h i j k E 1
lmn]fH¤o p ,q r s y F e G
3YZI
A.100,20
B.100,10
C.200,20
D.200,10
5.³gT´ t µ ¶ 120 e s t c · 3,C F ¸ ¹ 3 º
(5:34HF ¸ ¹ 3 º [ 3,567 H F ¸ ¹ 3 º [ 5)
H»3Y¼ V 5 V , ½ ¾ 120 e c · 3 : ¿
11.(± Ê Ñ $ Y 20 Y ) [ãG E 1 F G % % 4 H I J K E,L !
MN+HOþP¯î2018ï6Qï M100MF G %(C : R S % 、T R S % Û 50 M)H U % 4 ,. ¾ 100 M F G % U % 4 H : ¹ 3 [ 39 V 2 (ÿ ¾ 100MFG % H U % 4 X f[25,55](V 2)W)< U % 4 C D f[45,50)(V 2)W H 3 [ 15,Þ X 4 ¯ îàáY=5VH»ÂY¼ V:
A.犿1<犿2,狀1<狀2
B.犿1<犿2,狀1>狀2
C.犿1>犿2,狀1<狀2
D.犿1>犿2,狀1>狀2
3.6 ` a b : ,c d a b H e 3 I
①fg2×2 ` h 7 Y i L e Y j k l 犃 m犅 n o
Hpqr,stkl 犓2 Huvw犽 x y,a z“犃 m
犅 {pq”H|}Exy
Dy[@A2?
(ⅱ)[ ¯ & “n ] f ,] E / ”H ¤ o p E1 ,f g s t 1000 ¹ F G. eF G H ï C D ,:¾ 1000 ¹ FG: H ï C D ] A 9 12.14 2 H 3 F { |ÅI@A?
1,狓(2) 8 8.2 8.4 8.6 8.8 9
0l狔(3) 90 84 83 80 75 68
(1)B D^狔=^犫狓+^犪,C:^犫= -20,^犪=狔
-^犫狓;
(2)6Tf7H08:,0 l m 1 , 9 : ; ½ (1) :Hpq,< µ * H Q ± I 4 2/3,[ = % &-.Fy³>, µ*H1,?§[@A2? (B :³ > = 0 8 C D - Q ± ).
0.2,∴00..24×10=5,∴ s § 3 R 1 % 5 60+5=65.
9.;¨I&(©ª « ¬ ® 3 ¯ ° e 100 ±,© ª « ¬ ®
3
²
°
e 300
±
,∴
m
3
²
°
±
%
5 32×
3 4
=24.
= 、> 2 $
10.(1)
9
狓=
1 6
×
(8+8.2+8.4+8.6+8.8+9)=8.5,
J
K
Ø
Ù
狉 0.82 0.78 0.69 0.85
犿
106 115 124 103
P2àá: â ; 犃、犅 L k l { ã ä H B ( p (
H,"[
.
8.200 å æ ç è Í !
/éÓêrHrë
H»ÂY¼ V
5V ,_ r ë
Hì 3、: ¹ 3 H
íTwYZ[ 、
.
第1页
:ÒO34mÓÔ 槡6.92≈2.63,犡~犖(μ,σ2)
_ ①犘(μ-σ<犡 ≤μ+σ)=0.6827;②犘(μ-2σ <犡≤μ+2σ)=0.9545;③犘(μ-3σ<犡 ≤μ+ 3σ)=0.9973.
(1) 犿,狀 Hw; (2)¾100MFG % : U % 4 ¸ 9 W X 3 H R
狔①=犿犿>狓^犫+^,犪狀>,Î狀;Ï 6 ` 4 e Ð Ñ : ,
②B犾1 ÍÉ 犃3;
③
5
∑
(狔犻-^犫狓犻-^犪)2≥
5
∑
(狔犻-犿狓犻-狀)2;
犻=1
犻=1
④
∑5|狔犻-^犫狓犻-^犪|≥
5
∑|狔犻-犿狓犻-狀|.
犻=1
犻=1
狀
狀
^ ∑狓犻狔犻-狀狓狔 ∑(狓犻-狓)(狔犻-狔)
(Ò O Ó Ô 犫=犻=1狀
狔 1.5 4.04 7.5 12 18.01
897:34,;<= > 6 ? @ A B,C : ? @ D E
FGHI
A.狔=2狓-2
B.狔=
(1 2
狓
)
C.狔=log2狓
D.狔=
1 2
(狓2
-1)
2.J K L M , " 6 N O P H Q R S T 5 U V ,J K L 0
34HWX3YZ[ 犿1,犿2,\]^YZ[狀1,狀2 _
÷ø + H , " : # Y © ª« H Ô ª ¬ 32 ,_ ª ¬ H ñ ¶ 3 [
. =、>2$(% & $ ' 3 ( $,' 55 *.> 2 ? @ A B C D E F G H 、I H J K L M N O P .) 10.(± Ê Ñ $ Y 15 Y )
!%&[ 8 ' & ( H / ) µ * ® @ + § ,, µ* # - . ? § H , / ® P 0,- . 1 , 狓犻(2 )m 0 l 狔犻(3 )H 3 4 4 5 5 6 7 :
=犻=1 狀
,
^犪=狔-^犫狓)
∑狓犻2-狀狓2
犻=1
∑ (狓犻-狓)2
犻=1
cdÐÑHe3{
A.1 e
B.2 e
C.3 e
D.4 e
2$3
ÑÕ 1 2 3 4 5 6
Ö×
4、56$(%&$'3( $,) ( $ 5 *,' 15 *.7 2859:;<)
7.J、K、Ø、Ù Ú ¹ , " Û Ü 8 犃、犅 L k l H B ( p(ÝP2,ÞgYi bY Z . p q 3狉 mß^HW 犿 567:
S%{31 M,T R S % { 19 M,_ Å ó f Z [ \HÁ Â ] ^ Í 0.001 H _ ` 6 a [ I ] I R S%mU%4Ió¸9WX3{pq?
Ò O Ó Ô 3 4:犓2 = (犪+犫)(狀犮+(犪犱犱)-(犪犫犮+)犮2)(犫+犱),
第2页
参考答案
! 、" # $
%&'()*+,题
(满分:100分,时间:90分钟)
"#$ % &、'()*+训练与提升
!、"#$(%&$'6( $,) ( $ 5 *,' 30 *.) ($+,!-"./0$1)
1.!"#$ % & ' ( " ) * +,! , " - . / 0 1 2 34567:
狓 1.99 3 4 5.1 6.12
②>~狔=犮犲犽狓 ? @ / 0 3 4 r,[ =
D,狕=ln狔,Ck . B ( D狕=0.3狓
+4,_犮,犽 HwYZI犲40.3
③Le k l { B ( p p q,C B
D [ 狔=犪+犫狓,犫=2,狓=1,狔=3,_ 犪=1