高三数学统计习题精选精讲
(完整)高一数学必修三《统计》知识点+练习+答案,推荐文档

必修三统计知识点二、统计初步有关概念和公式:1、频数——落在各个小组的数据的个数叫~。
2、频率——每一个小组频数与数据的比值叫做这一组的~。
3、总体——所要考察对象的全体叫做~。
4、个体——每一个考察对象~。
5、样本——从总体中所抽取的一部分个体叫做总体的一个样本。
6、样本容量——样本中个体的数目叫做~。
7、众数——在一组数据中,出现次数最多的数据叫做这组数据的众数。
8、中位数——将一组数据按从小到大排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
9、总体分布——总体取值的概率分布规律通常称为~。
10、连续型总体——可以在实数区间取值的总体叫~。
11、累积频率——样本数据小于某一数值的频率,叫做~。
计算最大值与最小值的差决定组距与数据列法决定分点列表12、频率分布表试验结果频数频率表的行式分组个数累计频数频率累积频率(有时可省略)(有时可省略)横轴——实验结果纵轴频率条形图用高度表示各取值的频率适用于个体取不同值较少横轴——产品尺寸纵轴——频率/组距13、直方图用图形面积的大小表示在各个区间内取值的概率适用于个体在区间内取值横轴——产品尺寸累积频率分布图纵轴——累计频率反映一组数据的分布情况14、总体分布曲线——当样本容量无限增大、分组的组距无缩限小时、频率分布直方图就会无限趋近于一条光滑曲线,这条曲线叫总体密度曲线。
以这条曲线为图象的函数叫做总体的概率密度函数。
总体密度函数反映了总体分布,即反映总体在各个范围内取值的概率。
P(a<ξ<b)的值等于直线 x=a,x=b 与曲线、x 轴围成的图形面积。
15、累积分布曲线——当样本容量无限增大、分组的组距无缩限小时,累积频率分布图就会无限趋近于一条光滑曲线,这条曲线叫累积分布曲线。
它反映了总体的累积分布规律,即曲线上任意一点 P(a,b)纵坐标 b,表示总体取小于 a 的值的概率。
1①正态总体的概率密度函数f(x)-(x - )22 2, ∈R(其中 总体的平均数, 总体的标准差,N(μ,σ2)—正态总体,有时记作 N(μ,σ2)1)曲线在轴上方,并且关于直线 x=对称:②正态曲线的性质2)曲线在x=μ时处于最高点,由这一点向左、右两边延伸时,曲线逐渐下降:3)曲线的对称轴位置由μ确定:直线的形状由σ确定,σ越大,曲线的形状越“矮胖”反过来曲线越“高瘦”③正态曲线在几个区间上的取值:区间取值概率(μ-σ,μ+σ)68.3%(μ-2σ,μ+2σ)95.44%(μ-3σ,μ+3σ)99.7%16、质控图④小概率事件——通常指发生的概率小于5%的事件。
(完整版)高三复习高中数学统计案例习题(有详细答案)

2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
高中数学必修3复习-统计的讲义与习题(含答案及详细解答过程)

【知识点:统计】一.简单随机抽样1.总体和样本总体:在统计学中 , 把研究对象的全体叫做总体.个体:把每个研究对象叫做个体.总体容量:把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本...其中个体的个数称为样本容量....。
2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
d(抽样距离)=N(总体规模)/n(样本规模)三.分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
2020-2021学年北师大版数学必修3课后习题:习题课1 统计含解析

攀上山峰,见识险峰,你的人生中,也许你就会有苍松不惧风吹和不惧雨打的大无畏精神,也许就会有腊梅的凌寒独自开的气魄,也许就会有春天的百花争艳的画卷,也许就会有钢铁般的意志。
祝:学子考试顺利,学业有成习题课——统计课后篇巩固提升A组1.2018年的世界无烟日(5月31日)之前,某学习小组为了了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是()A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是15个吸烟的成年人D.本地区只有85个成年人不吸烟答案B2.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学,初中,高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样,初中,高中三个学段学生的视力情况有较大差异”,故应按学段分层抽样,选C.3.已知数据x1,x2,x3的中位数为k,众数为m,平均数为n,方差为p,则下列说法中,错误的是()A.数据2x1,2x2,2x3的中位数为2kB.数据2x1,2x2,2x3的众数为2mC.数据2x1,2x2,2x3的平均数为2nD.数据2x1,2x2,2x3的方差为2p4.在样本的频率分布直方图中,共有11个小长方形,若最中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则最中间一组的频数为()A.32B.0.2C.40D.0.25解析最中间一组的频率为1414+1=15,所以最中间一组的频数为160×15=32.故A正确.5.对2 000名学生进行身体健康检查,用分层抽样的办法抽取容量为200的样本,已知样本中女生比男生少6人,则该校共有男生() A.1 030人 B.970人C.97人D.103人200名学生中男生有103人,女生有97人.所以该校共有男生人数为2000×103200=1030,故选A.6.已知x,y的取值如下表所示,且线性回归方程为y=bx+132,则b等于()A.13B.12C.-13D.-12解析由题表可得。
高中数学第二章统计习题课省公开课一等奖新优质课获奖课件

.
44/45
1234
解析:(1)由题意知被抽出职员号码为2,10,18,26,34. 答案:(1)2,10,18,26,34 (2)62
45/45
探究一
探究二
探究三
规范解答
解析:(1)采取系统抽样方法从600人中抽取50人,需将这600人分 成50组,每组12人,即l=12,第k组号码为3+12(k-1).令496≤3+12(k1)≤600,且k∈Z,解得43≤k≤50,而满足43≤k≤50整数k有8个.
答案:(1)8 (2)20
16/45
5/45
5.样本数字特征
6/45
7/45
6.散点图 假如散点图中点分布从整体上看大致在一条直线附近,就称这两 个变量之间含有线性相关关系,这条直线叫做回归直线.从散点图 上看,点分布在从左下角到右上角区域内,两个变量这种相关关系 称为正相关;点分布在左上角到右下角区域内,两个变量相关关系 为负相关.
习题课 统计与回归分析
1/45
2/45
填空: 1.三种抽样方法比较
3/45
2.作频率分布直方图步骤
3.频率分布折线图 把频率分布直方图中各个长方形上边中点用线段连接起来,就得 到频率分布折线图.
4/45
4.茎叶图是统计中用来表示数据一个图,茎是指中间一列数,叶就 是从茎旁边生长出来数.对于样本数据较少,且分布较为集中一组 数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据 是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为 小数时做类似处理.对于样本数据较少,且分布较为集中两组数据, 关键是找到两组数据共有茎.
2.能够借助于统计图表,依据公式求解数据众数、中位数、平均 数和方差等.注意由样本数据预计总体时,样本方差越小,数据越稳 定,波动越小.
新版高中数学北师大版必修3习题第一章统计1.2.2.2含解析

第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。
2023年高考数学一轮复习精讲精练第31练 统计与统计模型(解析版)

第31练 统计与统计模型学校____________ 姓名____________ 班级____________一、单选题1.2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有3个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为2250人,延庆冬奥村的容量约1440人,张家口冬奥村的容量约2610人.为了解各冬奥村服务质量,现共准备了140份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( ) A .58份 B .50份C .32份D .19份【答案】C 【详解】在延庆冬奥村投放的问卷数量是144014032225014402610⨯=++份.故选:C.2.从某小区随机抽取100户居民用户进行月用电量调查,发现他们的月用电量都在50~300kw ·h 之间,适当分组(每组为左闭右开区间)后绘制成如图所示的频率分布直方图.则直方图中x 的值以及在被调查的用户中月用电量落在区间[)100,250内的户数分别为( )A .0.0046,72B .0.0046,70C .0.0042,72D .0.0042,70【答案】A 【详解】根据频率分布直方图的面积和为1,得()0.00240.00380.0060.0032501x ++++⨯=,解得0.0046x =,月用电量落在区间[)100,250内的频率为()0.00380.0060.0046500.72f =++⨯=,所以在被调查的用户中月用电量落在区间[)100,250内的户数为1000.7272⨯=户.故选:A. 3.某市有11名选手参加了田径男子100米赛的选拔比赛,前5名可以参加省举办的田径赛,如果各个选手的选拔赛成绩均不相同,选手小强已经知道了自己的成绩,为了判断自己能否参加省举办的田径赛,他还需要知道这11名选手成绩的()A.平均数B.中位数C.众数D.方差【答案】B【详解】因为11名选手成绩的中位数恰好是第6名,知道了第6名的成绩,小强就可以判断自己是否能参加省举办的田径赛了,其余数字特征不能反映名次.故选:B.4.在2022北京冬奥会单板滑雪U型场地技巧比赛中,6名评委给A选手打出了6个各不相同的原始分,经过“去掉其中一个最高分和一个最低分”处理后,得到4个有效分.则经处理后的4个有效分与6个原始分相比,一定会变小的数字特征是()A.平均数B.中位数C.众数D.方差【答案】D【详解】去掉最大值与最小值这组数的平均值大小不确定,中位数不变,众数大小不确定,根据方差的定义,去掉最高分,最低分后,剩余四个数据的波动性小于原来六个数据的波动性,故方差一定会变小.故选:D5.某地教育局为了解“双减”政策的落实情况,在辖区内高三年级在校学生中抽取100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率直方图.根据此频率直方图,下列结论中不正确的是()A.所抽取的学生中有25人在2小时至2.5小时之间完成作业B.该地高三年级学生完成作业的时间超过3小时的概率估计为35%C.估计该地高三年级学生的平均做作业的时间超过2.7小时D.估计该地高三年级有一半以上的学生做作业的时间在2小时至3小时之间【答案】D【详解】对A ,直方图中2小时至2.5小时之间的频率为()2.520.50.25-⨯=,故所抽取的学生中有1000.25⨯=25人在2小时至2.5小时之间完成作业,故A 正确;对B ,由直方图得超过3小时的频率为0.5(0.30.20.10.1)0.35⨯+++=,所以B 正确; 对C ,直方图可计算学生做作业的时间的平均数为:1.250.05 1.750.152.250.25 2.750.203.250.15⨯+⨯+⨯+⨯+⨯3.750.10 4.250.05 4.750.05+⨯+⨯+⨯ 2.75 2.7=>,所以C 正确;对D ,做作业的时间在2小时至3小时之间的频率为0.5(0.50.4)0.450.5⨯+=<,所以D 错误. 故选:D .6.某电脑公司有3名产品推销员,其工作年限与年推销金额数据如下表所示:由表中数据算出线性回归方程y bx a =+中的726b =.若第4名推销员的工作年限为6年,则估计他的年推销金额为( )A .2万元 B .3万元 C .3.3万元 D .3.5万元【答案】B 【详解】 由题意,得351063x ++==,23433y ++==, 所以718362613a y bx =-=-⨯=,即7182613y x =+. 当6x =时,718632613y =⨯+=. 故选:B .7.为了保证乘客的安全,某市要对该市出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[)20,45岁之间,根据调查结果,得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )A .31.6岁B .32.6岁C .33.6岁D .36.6岁【答案】C 【详解】设第二组矩形的高为h ,则()0.010.070.060.0251h ++++⨯=,解得0.04h =. 设中位数为a ,前2个矩形的面积之和为()0.010.0450.25+⨯=,前3个矩形的面积之和为()0.010.040.0750.6++⨯=,所以,()30,35a ∈, 所以,()0.0150.0450.07300.5a ⨯+⨯+⨯-=,得0.253033.60.07a =+≈. 故选:C .8.在一项调查中有两个变量x 和y ,如图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y 关于x 的回归方程的函数类型是( )A .y a bx =+B .y c d x=+C .2y m nx =+D .x y p qc =+()0q >【答案】B 【详解】解:散点图呈曲线,A 中函数为线性函数,不合题意,排除A 选项; 由散点图可知整体呈增长态势,且增长速度变慢,对B 选项中函数,当0d >时,函数为单调递增函数,且增长速度逐渐变慢,符合题意,故B 正确;对于C 选项,当0n >时,函数为开口向上的二次函数,增长先慢后快,不合题意,当0n <时,函数为开口向下的二次函数,增长先慢后快,不合题意,排除选项C ; 对于D 选项,函数为指数型函数,当1c >时单调递增,且越增越快,不合题意, 当01c <<时为单调递减函数,不合题意,故排除D ;故选:B9.《电信条例》规定任何单位和个人未经电信用户同意,不得向其发送商业信息.某调研小组对某社区居民持有的35部手机在某特定时间段内接收的商业信息进行统计,绘制了如下所示的茎叶图,现按照接收的商业信息由少到多对手机进行编号为1~35号,再用系统抽样方法从中依次抽取7部手机,若被抽取的第一部手机接收商业信息的条数是133,则第4部手机接收的商业信息的条数是( )A .141B .143C .145D .148【答案】B 【详解】由题,根据系统抽样方法定义,抽取的手机编号间隔为3557=,第一部手机编号为3号,故第四部手机编号为35318+⨯=号,即143, 故选:B10.在发生某公共卫生事件期间,有专业机构认为该事件在一段事件内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下: 甲地:总体平均数为3,中位数为4; 乙地:总体平均数为1,总体方差大于0; 丙地:中位数为2,众数为3; 丁地:总体平均数为2,总体方差为3.则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( ) A .甲地 B .乙地C .丙地D .丁地【答案】D 【详解】对于甲地,若连续10日的数据为0,0,0,0,4,4,4,4,4,10,则满足平均数为3,中位数为4,但不符合没有发生大规模群体感染的标志,A 错误;对于乙地,若连续10日的数据为0,0,0,0,0,0,0,0,0,10,则满足平均数为1,方差大于0,但不符合没有发生大规模群体感染的标志,B 错误;对于丙地,若连续10日的数据为0,0,1,1,2,2,3,3,3,10,则满足中位数为2,众数为3,但不符合没有发生大规模群体感染的标志,C 错误;对于丁地,若总体平均数为2,假设有一天数据为8人,则方差()22182 4.538s >⨯-=>,不可能总体方差为3,则不可能有一天数据超过7人,符合没有发生大规模群体感染的标志,D正确.故选:D.二、多选题11.某市商品房调查机构随机抽取n名市民,针对其居住的户型结构和满意度进行了调查,如图1调查的所有市民中四居室共300户,所占比例为13,二居室住户占16.如图2是用分层抽样的方法从所有调查的市民的满意度问卷中,抽取10%的调查结果绘制成的统计图,则下列说法错误的是()A.样本容量为90B.样本中三居室住户共抽取了35户C.据样本可估计对四居室满意的住户有110户D.样本中对二居室满意的有3户【答案】BC【详解】解:如图1调查的所有市民中四居室共300户,所占比例为13,二居室住户占16,∴30090013=,二居室有19001506⨯=户,三居室有450户,由图1和图2得:在A中,样本容量为:90010%90n=⨯=,故A正确;在B中,样本中三居室住户共抽取了45010%45⨯=户,故B错误;在C中,根据样本可估计对四居室满意的住户有30040%120⨯=户,故C错误;在D中,样本中对二居室满意的有15010%20%3⨯⨯=户,故D正确.故选:BC.12.某校举行“永远跟党走、唱响青春梦”歌唱比赛,在歌唱比赛中,由9名专业人士和9名观众代表各组成一个评委小组给参赛选手打分.根据两个评委小组(记为小组A、小组B)对同一名选手打分的分值绘制成折线图如图所示,则()A.小组A打分的分值的众数为47B.小组B打分的分值第80百分位数为69C.小组A是由专业人士组成的可能性较大D.小组B打分的分值的方差小于小组A打分的分值的方差【答案】AC【详解】由折线图知,小组A打分的9个分值排序为:42,45,46,47,47,47,50,50,55,小组B打分的9个分值排序为:36,55,58,62,66,68,68,70,75;对于A:小组A打分的分值的众数为47,故选项A正确;对于B:小组B打分的分值第80百分位数为980%7.2⨯=,所以应排序第8,所以小组B打分的分值第80百分位数为70,故选项B不正确;对于C:小组A打分的分值比较均匀,即对同一个选手水平对评估相对波动较小,故小组A更像是由专业人士组成,故选项C正确;对于D:小组A打分的分值的均值约47.7,小组B打分的分值均值为62,根据数据的离散程度可知小组B波动较大,方差较大,选项D不正确;故选:AC三、解答题13.网购是现代年轻人重要的购物方式,截止:2021年12月,我国网络购物用户规模达8.42亿,较2020年12月增长5968万,占网民整体的81.6%.某电商对其旗下的一家专营店近五年来每年的利润额i y(单位:万元)与时间第i t年进行了统计得如下数据:(1)依据表中给出的数据,是否可用线性回归模型拟合y 与t 的关系?请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r ≥,则线性相关程度很高,可用线性回归模型拟合)(2)试用最小二乘法求出利润y 与时间t 的回归方程,并预测当7t =时的利润额.附:()()nnii i itt y y t yntyr ---∑∑,()()()1122211ˆnnii i i i i nniii i tty y t y ntybtttnt ====---==--∑∑∑∑,ˆˆay bt =-. 参考数据:5189.5ii i t y==∑14.785≈.【答案】(1)0.98,y 与t 的线性相关程度很高,可以用线性回归模型拟合. (2)ˆ 1.450.65yt =+,10.8万元. 【解析】(1)由题表,()11234535t =⨯++++=,()1 2.6 3.1 4.5 6.88.055y =⨯++++=因为5189.5i i i t y==∑所以5514.50.980.7514.785i it y tyr -==≈≈>∑. 故y 与t 的线性相关程度很高,可以用线性回归模型拟合. (2) 515221514.5ˆ 1.45105i ii ii t y tybtt ==-===-∑∑,ˆˆ5 1.4530.65a y bt =-=-⨯=, 所以ˆ 1.450.65yt =+.当7t =时,ˆ 1.4570.6510.8y =⨯+=. 预测该专营店在7t =时的利润为10.8万元.14.2021年4月22日,一则“清华大学要求从2019级学生开始,游泳达到一定标准才能毕业”的消息在体育界和教育界引起了巨大反响.游泳作为一项重要的求生技能和运动项目受到很多人的喜爱.其实,已有不少高校将游泳列为必修内容.某中学为了解2020届高三学生的性别和喜爱游泳是否有关,对100名高三学生进行了问卷调查,得到如下列联表:已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为35.(1)请将上述列联表补充完整;(2)判断是否有99.9%的把握认为喜欢游泳与性别有关.附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)(1)因为在100人中随机抽取1人抽到喜欢游泳的学生的概率为35,所以喜欢游泳的学生人数为3100605⨯=.其中女生有20人,男生有40人,列联表补充如下:(2)因为222()100(40302010)16.66710.828()()()()60405050n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯, 所以有99.9%的把握认为喜欢游泳与性别有关.15.在某生态系统中,有甲、乙两个种群,两种群之间为竞争关系.设t 时刻甲、乙种群的数量分别为()f t ,()g t (起始时刻为0t =).由数学家Lotka 和Volterra 提出的模型是函数()f t ,()g t 满足方程()()()()f t af t bf t g t '=-,()()()()g t cg t df t g t '=-,其中a ,b ,c ,d 均为非负实数.(1)下图为没有乙种群时,一段时间内甲种群数量与时间的关系折线图.为预测甲种群的数量变化趋势,研究人员提出了两种可能的数学模型:①()f t n =;①()tf t m n =⋅,其中m ,n 均为大于1的正数.根据折线图判断,应选用哪种模型进行预测,并说明理由.(2)设0.08a c ==,20.008d b ==.①函数()()()0.08e2tF t f t g t -⎡⎤=-⎣⎦的单调性;①根据①中的结论说明:在绝大多数情况下,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝.注:在题设条件下,各种群数量均有上限值.【答案】(1)应选用模型①预测甲种群数量的变化趋势;理由见解析 (2)①()F t 为常函数;①答案见解析 【解析】(1)由折线图知,甲种群数量的增长速度随着时间的推移而加快.而增长速度大致对应种群数量对时间的导数. 如选用模型①,()f t '=,()f t '是关于时间的减函数,不符合折线图; 如选用模型①,()ln t f t mn n '=,()f t '是关于时间的增函数,符合折线图. 所以应选用模型①预测甲种群数量的变化趋势 (2)由题设知()0.08()0.004()()f t f t f t g t '=-,()0.08()0.008()()g t g t f t g t '=-.(i )0.08()e [2()()]t F t f t g t -=-,[]0.08()e0.16()0.08()2()()tF t f t g t f t g t -'''=-++-. 消去条件中的()()f t g t 得[]()0.08()2()0.08()g t g t f t f t ''-=-,所以()0F t '=.所以()F t 为常函数.(ii )由(i ),()(0)2(0)(0)F t F f g ==-,0.082()()[2(0)(0)]e tf tg t f g -=-.由于各种群数量均有上限值,不妨设甲乙种群数量的上限值分别为1M ,2M . ①若()()020g f >,()()2g t f t >. 则当2225ln 2(0)2(0)M t g f ->-时,0.081()()(2(0)(0))e 12t f t g t f g ⎡⎤=--<⎣⎦,此时可以近似认为甲种群灭绝;①若()()020g f <,()()2g t f t <. 则当1225ln 22(0)(0)M t f g >-时,0.08()2()(2(0)(0))e 1t g t f t f g =--<,此时可以近似认为乙种群灭绝;①若()()020g f =,()()2g t f t =,甲乙种群数量之比保持恒定,可能不出现灭绝的情况. 综上所述,对所有(0)2(0)g f ≠的情况,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝。
高三数学第一轮复习:统计(二)(理)知识精讲人教实验版(B)

高三数学第一轮复习:统计(二)(理)人教实验版(B )【本讲教育信息】一. 教学内容:高三复习专题:统计(二)二. 考纲要求(1)变量的相关性①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(2)统计案例:了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. ②回归分析:了解回归的基本思想、方法及其简单应用.三. 知识分析 【知识梳理】(一)变量的相关性1、变量与变量之间的关系常见的有两类:一类是确定的函数关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.2、如果一个变量的值由小变大,另一个变量的值也由小变大,这种相关称为正相关,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关。
3、在平面直角坐标系中,用描点的方法得到具有相关关系的两个变量的图形叫散点图.4、回归直线方程$y bx a =+,其中a y bx=-$。
(二)统计案例1、当23.841χ>时,有95%的把握说事件A 与B 有关; 当2 6.635χ>时,有99%的把握说事件A 与B 有关; 当2 3.841χ≤时,认为事件A 与B 是无关的。
2、$121()()()ni i i n i i x x y y b x x a y bx==⎧--⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑$$,其中1111,,n n i i i i x x y y n n ====∑∑,则直线$$y a bx =+$就成为此直线的线性回归方程,其中$,a b$分别为a ,b 的估计值。
3、相关系数()()nniii ix x y y x y nx yr ---==∑∑,用它来衡量两个变量之间的线性相关程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.抽样方法: 1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽样的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率都相等,就称这样的抽样为简单随机抽样。
抽签法和随机数表法是实施简单随机抽样的两种常用的方法。
2。
分层抽样:当已知总体由差异明显的几部分组成时,常常总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫分层抽样,其中所分成的各个部分叫做层。
二、利用样本频率估计总体分布:由于总体分布通常不易知道,我们往往用样本的频率分布估计总体分布。
一般地,样本容量越大,这种估计就越精确。
1、频率分布条形图:当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同数值及相应的频率表示,其几何表示就是相应的条形图。
2、频率分布直方图:当总体中的个体取不同数值很多时或者可以在实数区内取值时,用频率分布直方图表示相应样本的频率分布。
注:频率分布条形图和频率分布直方图不同。
频率分布直方图的纵轴(矩形的高)表示频率,而频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积。
三.期望与方差: 1.期望:123,,,n a a a a 的期望:12na a a x n+++=;2.方差:123,,,n a a a a 的方差为:2222121[()()()]n S a x a x a x n=-+-++-3.均方差:123,,,n a a a a 的均方差:⎥⎦⎤⎢⎣⎡-++-+-=)(...)()(122221x a x a x a n n s 注:对于“已知123,,,n a a a a 的期望为多少,求12,,,n a a b a a b a a b ⋅+⋅+⋅+的期望和方差分别是多少?”问题,关键是利用上述公式变形、整理得到所求的结果。
平均数、众数和中位数这里说的“三数”是指平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明.学习平均数、众数和中位数应注意以下几个问题: 一、正确理解平均数、众数和中位数的概念1.平均数 平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化.2.众数 在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势.3.中位数 中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的.二、注意区别平均数、众数和中位数三者之间的关系平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和我们要关注的问题. 三、能正确选用平均数、众数和中位数来解决实际问题由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.下面举几例说明.例1 李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期.收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:据调查,市场上今年樱桃的批发价格为每千克15元.用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为( ).A .200千克,3000元B .1900千克,28500元C .2000千克,30000元D .1850千克,27750元简析:依题意此果园平均每棵树所产樱桃的质量是1(14212717182019231922)=2010+++++++++(千克),所以100棵树所产樱桃的的质量是100202000⨯=(千克),又批发价格为每千克15元,所以2000千克的樱桃所得的总收入为20001530000⨯=(元),故应选C .例2 (陕西省)为了了解某班学生每周做家务劳动的时间,某综合实践活动小组对该班50名学生进行了调查,有关数据如下表:根据上表中的数据,回答下列问题:(1)该班学生每周做家务劳动的平均时间是多少小时? (2)这组数据的中位数、众数分别是多少? (3)请你根据(1)、(2)的结果,用一句话谈谈自己的感受. 简析:(1)该班学生每周做家务劳动的平均时间为1(0212 1.5628 2.512313 3.5443) 2.4450⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(小时),即该班学生每周做家务劳动的平均时间为2.44小时.(2)由表中的数据我们可以发现这组数据的中位数是2.5(小时),众数是3(小时).(3)只要叙述内容与上述数据有关或与做家务劳动有关,并且态度积极即可. 极差、方差、标准差极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量. 一、 极差一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,实际生活中我们经常用到极差.如一支足球队队员中的最大年龄与最小年龄的差,一个公司成员中最高收入与最低收入的差等都是极差的例子.极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大. 二、方差方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x 1、x 2、x 3、…、x n 的平均数为x ,则该组数据方差的计算公式为:])()()[(1222212x x x x x x nS n -++-+-=. 三、标准差在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差.即标准差=方差.四、极差、方差、标准差的关系方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象. 5.典型例析例1 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:(单位:cm ) 甲: 21 42 39 14 19 22 37 41 40 25 乙: 27 16 40 41 16 44 40 40 27 44(1)根据以上数据分别求甲、乙两种玉米的极差、方差和标准差.(2)哪种玉米的苗长得高些;(3)哪种玉米的苗长得齐.分析:本题既是一道和极差、方差和标准差计算有关的问题,又是利用方差解决实际问题的一道题目.要求极差,只要用数据中最大值减去最小值,求到差值即可.利用方差的计算公式可以求到方差,将方差开平方就得标准差. 解: 甲的极差: 42-14=28(cm); 乙的极差:44-16=28(cm).甲的平均值:)()(甲cm x 3025404137221914394221101=+++++++++= 乙的平均值:)(31)44274040441641401627(101cm x =+++++++++=乙 甲的方差:)(2.10410)3025()3042()3021(22222cm S =-++-+-=甲, 乙的方差:)(8.12810)3144()3116()3127(22222cm S =-++-+-=乙(2)因为甲种玉米的平均高度小于乙种玉米的平均高度,所以一种玉米的苗长的高. (3)因为22乙甲S S ≤,所以甲种玉米的苗长得整齐. 例2 市体校准备挑选一名跳高运动员参加全市中学生运动会,对跳高运动队的甲、乙两名运动员进行了8次选拔比赛.他们的成绩(单位:m )如下:甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67 乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75(1)甲、乙两名运动员的跳高平均成绩分别是多少?(2)哪位运动员的成绩更为稳定?(3)若预测,跳过1.65m 就很可能获得冠军,该校为了获得冠军,可能选哪位运动员参赛?若预测跳过1.70m 才能得冠军呢?解析:本题是一道数据分析有关的实际问题,主要考查数据的平均数、方差的计算方法及处理数据的能力.根据平均数及方差的计算公式可得(1)甲x =)67.165.170.1(81+++ =1.69(m),乙x =)75.173.160.1(81+++ =1.68(m ). (2)])69.167.1()69.165.1()69.170.1[(812222-++-+-= 甲S =0.0006(m 2),])68.175.1()68.173.1()68.160.1[(812222-++-+-= 乙S =0.0035(m 2),因为22s s <乙甲,所以甲稳定.(3)可能选甲参加,因为甲8次成绩都跳过1.65m 而乙有3次低于1.65m; 可能选乙参加,因为甲仅3次超过1.70m.例3 某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示:(I )将各组的频率填入表中;(II )根据上述统计结果,计算灯管使用寿命不足1500小时的频率;(III )该公司某办公室新安装了这种型号的灯管3支,若将上述频率作为概率,试求灯管的使用寿命不足1500小时的概率. 【解析】(I )因为基本事件总数为1000,所以根据表中给出的频数可以直接写出各组的频率(见表中红字)(II )设“任取1支灯管其使用寿命不足1500小时”的事件为A ,则表中的前4列便是关于A 的全部数据,故()P A =0.048+0.121+0.208+0.223=0.6.(III )设“3支灯管中至少有2支使用寿命不足1500小时”的事件为B ,则B 有两种情况: (1)3支的使用寿命不足1500小时,其概率为:()()3310.60.216P P A ===(2)3支中恰有两支使用寿命不足1500小时,其概率为:()22230.60.40.432P C =⨯=.于是P (B )=0.216+0.432=0.648.例4 图l 是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为1A 、2A 、…、m A (如2A 表示身高(单位:cm )在[150,155)内的学生人数).图2是统计图l 中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm (含160cm ,不含180cm )的学生人数,那么在流程图中的判断框内应填写的条件是.9.8.7.6Ai B i C i Di <<<<,【解析】图1的信息十分明确,我们重点研究图2.这是电脑操作的一种程序.根据题目给出的信息,它的功能是将“身高在160~180cm (含160cm ,不含180cm )的学生人数”筛选出来.若将该县参加2007年高考的任意1名学生的身高资料输入,不在这个范围的考生将被输出,否则将再次进行操作.第1次操作,从0,4s i ==开始,从表中可以看到,A 4表示身高在160cm 或160cm 以上的考生,显然符合选择标准,电脑将显示“是”; 第2次操作,从1,5si ==开始继续检测.如果该生的身高仅在165cm 以内,他的资料将被输出,检测结束;如果该生的身高达到或超过了165cm ,她将进入2,6si ==的第3次检测.如此继续下去,直到该生的身高超过检测范围为止.由此可以推知,当4,8s i ==时将不再检测,于是正确的答案是8i <,选B.。