《统计学》第01章在线测试
新北师大版高中数学必修三第一章《统计》测试题(有答案解析)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D 674. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是()A.这10天中有3天空气质量为一级PM日均值逐渐降低B.从6日到9日 2.5PM日均值的中位数是55C.这10天中 2.5PM日均值最高的是12月6日D.这10天中 2.55.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年第一季度总销售量为830台D.2018年月销售量最大的是6月份6.通过实验,得到一组数据如下:2,5,8,9,x,已知这组数据的平均数为6,则这组数据的方差为( )A.3.2 B.4 C.6 D.6.57.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为()A.0795 B.0780 C.0810 D.08158.某产品的广告费用x与销售额y的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9210.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .711.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .312.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________. 14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 16.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.17.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.18.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y 23.555.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 19.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.三、解答题21.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.22.为了提高生产效益,某企业引进了一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在质量指标值均在(](]15,30的产品为合格品,旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标值如频数分布表所示.质量指标值频数(]15,202(1)请分别估计新、旧设备所生产的产品的优质品率.(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高,根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高于新设备有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (3)已知每件产品的纯利润y (单位:元)与产品质量指标值t 的关系式为2,3045,1,1530,t y t <≤⎧=⎨<≤⎩若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天方可以收回设备成本.23.某湿地公园占地约44万2m ,风景优美,吸引了大批市民前来游玩、健身.当地政府为了开展全民健身活动,组织了跑步队,并给每位队员发放统一服装,吸引了越来越多的市民加入跑步队.组织者统计了跑步队成立一个月内每一天队员的人数,用x 表示跑步队成立的天数,y 表示当天跑步队的人数,给出部分数据如下表所示: 第x (天) 1 4 9 1625 y (人)4080120140160经研究发现,可以用y c d x =+作为y 关于x 的回归方程类型. (1)根据表中的数据,建立y 关于x 的回归方程; (2)请预测第36天跑步队的人数. 参考数据:yx51i ii t y =∑51i ii x y =∑521ii x=∑521ii t=∑108111920 7680 979 55其中5115i i x x ==∑,5115i i y y ==∑,i i t x =,5115i i t t ==∑.参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v a u β=+的斜率和截距的最小二乘法估计公式分别为:1221ni i i nii u v nuvunuβ==-=-∑∑,a v u β=-.24.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表: 气温()x ℃ 27 29 30 32 33 35 数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 25.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A ,B 试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a 的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:下面的临界值表仅供参考.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.706 3.841 5.0246.635 7.87910.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A .【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.5.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B 正确. 对于选项C ,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C 正确.对于选项D ,由图形得销售量最大的月份是5月份,为800台,所以D 不正确. 故选D . 【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.6.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.B解析:B 【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程9.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.510.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127; 128,128,129,129,129; 131,131,131,132,132;132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.11.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.12.A解析:A 【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=, 取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解.由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.14.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11 【分析】根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =, 则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =15.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.16.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为s = 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.17.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论18.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.19.【解析】设第二组及第五组数据对应矩形的高为a 则10×(a+0015+0025+0035+a+0005)=1解得a=0010故各组的频率依次为:010015025035010005∵前三组的累积频率为 解析:715【解析】设第二组及第五组数据对应矩形的高为a , 则10×(a+0.015+0.025+0.035+a+0.005)=1, 解得a=0.010,故各组的频率依次为:0.10,0.15,0.25,0.35,0.10,0.05, ∵前三组的累积频率为:0.10+0.15+0.25=0.50, 故这次环保知识竞赛成绩的中位数为70;成绩在[80,90)段的人数有10×0.010×40=4人,成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件,其中他们在同一分数段的基本事件有:7,故他们在同一分数段的概率为7. 15故答案为:7 15.20.6【解析】n为18+12+6=36的正约数因为18:12:6=3:2:1所以n为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6【解析】n为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n为6的倍数,因此6,12,18,24,30,36n=因为当样本容量为1n+时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n=三、解答题21.(1)0.08,150;(2)88%;(3)第四小组,理由见解析【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间.试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.考点:频率分布直方图22.(1)70%,55%;(2)列联表见解析,有95%的把握认为产品质量高与新设备有关;(3)471天方.【分析】(1)根据旧设备所生产的产品质量指标值的频率分布直方图中后3组的频率之和即为旧设备所生产的产品的优质品率,根据新设备所生产的产品质量指标值的频数分布表即可估计新设备所生产的产品的优质品率;(2)根据题目所给的数据填写22⨯列联表,计算K 的观测值2K ,对照题目中的表格,得出统计结论;(3)根据新设备所生产的产品的优质品率,分别计算1000件产品中优质品的件数和合格品的件数,得到每天的纯利润,从而计算出至少需要生产多少天方可以收回设备成本. 【详解】 解:(1)估计新设备所生产的产品的优质品率为:3025150.770%100++==,估计旧设备所生产的产品的优质品率为:()50.060.030.020.5555%⨯++==. (2)由列联表可得,()220030554570 4.8 3.84175125100100K ⨯⨯-⨯==>⨯⨯⨯, ∴有95%的把握认为产品质量高与新设备有关. (3)新设备所生产的产品的优质品率为0.7∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质品, 有1000700300-=件合格品.∴估计每台新设备一天所生产的产品的纯利润为700230011700⨯+⨯=(元). 8000001700471÷≈(天),∴估计至少需要生产471天方可以收回设备成本. 【点睛】本题考查了独立性检验的应用问题,考查了频率分布直方图,也考查了计算能力的应用问题,属于中档题.23.(1)18y =+;(2)198人. 【分析】(1)令t =,y c d t =+⋅,计算得3t =,511920i i i t y ==∑,52155i i t ==∑,30d =,把样本点的中心()3,108代入108303c =+⨯,得18c =,可得1830y t =+,所以1830y x =+;(2)将36x =代入1830y x =+中,可得结果. 【详解】(1)∵y c d x =+,令t x =,∴y c d t =+⋅,∵1234535t ++++==,108y =,511920i i i t y ==∑,52155i i t ==∑, ∴515222151920531083055535i ii i i t y t yd t t==--⨯⨯===-⨯-∑∑,把样本点的中心()3,108代入108303c =+⨯,得18c =, ∴1830y t =+,∴y 关于x 的回归方程式:1830y x =+; (2)将36x =代入1830y x =+中,得183036198y =+=, 故预测第36天跑步队的人数为198人. 【点睛】本题考查了转化化归思想,考查了利用最小二乘法求回归直线方程,考查了利用回归方程对总体进行预测,属于中档题. 24.(1)作图见解析,4310111414y x =-;(2)40. 【分析】(1)描点法得出散点图,根据所给数据及公式计算回归方程的系数,得回归方程; (2)36.6x =代入回归方程计算即得. 【详解】(1)散点图如图所示.根据销量与气温对照表知,272930323335316x +++++==,1215207836236y +++++==,则()()()()()()()()()()()12222222141128131425413421124niii nii x x y y b x x ==---⨯-+-⨯-+-⨯-+⨯+⨯+⨯==-+-+-+++-∑∑129434214==, 43101123311414a y bx =-=-⨯=-, 所以y 关于x 的线性回归方程为4310111414y x =-. (2)当36.6x =时,43101136.640.2401414y =⨯-=≈. 答:当最高气温为36.6℃时,可预测这天小卖部卖出的冷饮数量约为40. 【点睛】本题考查散点图,考查线性回归直线方程,考查学生的数据处理能力,运算求解能力,属于中档题.25.(1)0.04,81;(2)列联表见解析,有99%的把握认为优质花苗与培育方法有关 【分析】(1)利用频率和为1列方程求出a 的值,再利用直方图平均值公式计算平均值; (2)由(1)结合直方图求出有关数据,可填写列联表,计算观测值,对照临界值得出结论. 【详解】(1)因为(0.0050.0100.0250.020)101a ++++⨯=, 解得0.040a =,综合评分的平均数为,(0.005550.010650.025750.040850.02095)1081⨯+⨯+⨯+⨯+⨯⨯=(2)由(1)结合直方图可知,80分以上的频数为()1000.40.260⨯+=, 甲乙两种培育法的比列为1:3,所以,甲乙两种培育法的优质苗数分别为15、45 填写列联表如下,计算237,510.82860405050K =≈>⨯⨯⨯, 所以有99%的把握认为优质花苗与培育方法有关. 【点睛】本题考查了频率分布直方图的性质与应用问题,也考查了列联表与独立性检验问题的实际应用,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X的取值可能为0,1,2,然后计算概率得出分布列及其数学期望;(2)按照公式计算2K的值,然后由临界值表得出结果即可.【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
(好题)高中数学必修三第一章《统计》测试卷(有答案解析)(1)

一、选择题1.工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为=50+80x,下列判断不正确的是()A.劳动生产率为1000元时,工资约为130元B.工人月工资与劳动者生产率具有正相关关系C.劳动生产率提高1000元时,则工资约提高130元D.当月工资为210元时,劳动生产率约为2000元2.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.1004.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .6755.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元6.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .187.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .638.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .989.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .310.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④11.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .1512.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y c x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:则该小区已安装宽带的居民估计有______户.17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.抽样统计甲、乙两位同学5次数学成绩绘制成如下图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为__________.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.三、解答题21.为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW·h至350kW·h之间,进行适当分组后,画出频率分布直方图如图所示.(I)求a的值;(Ⅱ)求被调查用户中,用电量大于250kW·h的户数;(III)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议,并简要说明理由.22.已知某校6个学生的数学和物理成绩如下表:学生的编号i123456数学i x898779817890物理i y797577737274(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 23.“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨):一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由;(3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由.24.党的十八大以来,我国精准扶贫已经实施了六年,我国贫困人口从2012年的9899万人,减少到2018年的1660万人,2019年将努力实现减少贫困人口1000万人以上的目标,力争2020年在现行标准下,农村贫困人口全部脱贫,贫困县全部脱贫摘帽.某市为深入分析该市当前扶贫领域存在的突出问题,市扶贫办近三年来,每半年对贫困户(用y 表示,单位:万户)进行取样,统计结果如图所示,从2016年6月底到2019年6月底的共进行了七次统计,统计时间用序号t 表示,例如:2016年12月底(时间序号为2)贫困户为5.2万户.(1)求y 关于t 的线性回归方程y bx a =+,并预测到2020年12月底,该市能否实现贫困户全部脱贫;(2)为尽快打赢脱贫攻坚战,该市扶贫办在2019年6月底时,对全市贫困户随机抽取了100户贫困户,对每个家庭最主要经济收入来源进行抽样调查,统计结果如图.并决定据此选派一批农业技术人员对全市所有贫困户中,家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶,每一名农业技术人员对口帮扶贫困户90户,则该市应分别安排多少农业技术人员对家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶? 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-25.学校为了了解高三学生每天自主学习中国古典文学的时间,随机抽取了高三男生和女生各50名进行问卷调查,其中每天自主学习中国古典文学的时间超过3小时的学生称为“古文迷”,否则为“非古文迷”,调查结果如表:古文迷 非古文迷 合计 男生 26 24 50 女生 30 20 50 合计5644100(Ⅰ)根据表中数据能否判断有60%的把握认为“古文迷”与性别有关?(Ⅱ)现从调查的女生中按分层抽样的方法抽出5人进行调查,求所抽取的5人中“古文迷”和“非古文迷”的人数;(Ⅲ)现从(Ⅱ)中所抽取的5人中再随机抽取3人进行调查,记这3人中“古文迷”的人数为ξ,求随机变量ξ的分布列与数学期望.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:26.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料:已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).【参考答案】***试卷处理标记,请不要删除一、选择题1.C解析:C【解析】试题分析:根据线性回归方程=50+80x的意义,对选项中的命题进行分析、判断即可.解:根据线性回归方程为=50+80x,得;劳动生产率为1000元时,工资约为50+80×1=130元,A正确;∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B正确;劳动生产率提高1000元时,工资约提高=80元,C错误;当月工资为210元时,210=50+80x,解得x=2,此时劳动生产率约为2000元,D正确.故选C.考点:线性回归方程.2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.B解析:B 【解析】 【分析】 先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.6.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.7.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.8.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.9.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.10.C解析:C 【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可. 【详解】①设某大学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ∧=0.85x ﹣85.71,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ,正确;②关于x 的方程x 2﹣mx +1=0(m >2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确; ③设定圆C 的方程为(x ﹣a )2+(x ﹣b )2=r 2,其上定点A (x 0,y 0),设B (a +r cosθ,b +r sinθ),P (x ,y ),由12OP =(OA OB +)得0022x a rcos x y b rsin y θθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x ﹣x 0﹣a )2+(2y﹣y 0﹣b )2=r 2,即动点P 的轨迹为圆, ∴故③不正确;④由22143x y +=,得a 2=4,b 2=3,∴1c ==.则F (﹣1,0),如图:过F 作垂直于x 轴的直线,交椭圆于A (x 轴上方),则x A =﹣1, 代入椭圆方程可得32A y =. 当P 为椭圆上顶点时,P (0FP k =32OA k =-, ∴当直线FP时,直线OP 的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,. 当P 为椭圆下顶点时,P (0,∴当直线FP 时,直线OP 的斜率的取值范围是(8,32),综上,直线OP (O 为原点)的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,∪,32). 故选C 【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.11.C解析:C 【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.12.B解析:B 【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择. 详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =d 或y =p +q ln x 较适宜,故选B . 点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③ 【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可. 【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确; 空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③. 【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:①②④ 【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解. 【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确; 根据相关指数的概念,可得2R 越大说明拟合效果越好,所以③不正确;若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间负相关,且线性相关性强,所以④正确; 故答案为:①②④. 【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题 解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数. 【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户. 【点睛】 本小题主要考查用样本估计总体,考查频率的计算,属于基础题.17.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b >因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.2【解析】分析:由茎叶图的分布可知乙同学的成绩会比较稳定先求出乙同学的平均成绩利用求方差的公式即可求得方差值详解:由茎叶图中成绩的分布情况可知乙同学的最低成绩比甲高乙同学的最高成绩比甲低所以成绩分布解析:2 【解析】分析:由茎叶图的分布可知,乙同学的成绩会比较稳定.先求出乙同学的平均成绩,利用求方差的公式即可求得方差值.详解:由茎叶图中成绩的分布情况可知,乙同学的最低成绩比甲高,乙同学的最高成绩比甲低,所以成绩分布相对较为集中,所以乙同学成绩的方差小,成绩较稳定. 设乙同学的平均成绩为x ,则8889909192905x ++++==所以乙同学成绩的方差()()()()()2222221889089909090919092905s ⎡⎤=-+-+-+-+-⎣⎦()14101425=++++= 所以乙同学成绩的方差为2点睛:方差体现了数据的离散程度,茎叶图中都保留了原始数据,因此可以从茎叶图中直接观察来比较方差的大小.要熟练掌握方差的计算公式.本题主要考查了简单的概念和计算,属于简单题.20.6【解析】n 为18+12+6=36的正约数因为18:12:6=3:2:1所以n 为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6 【解析】n 为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n 为6的倍数,因此6,12,18,24,30,36n =因为当样本容量为1n +时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n =三、解答题。
(典型题)高中数学必修三第一章《统计》检测(答案解析)(1)

一、选择题1.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .332.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长3.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是( )A .24B .48C .56D .645.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差6.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.138.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .169.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A.40 B.45 C.48 D.5010.设有一个直线回归方程为2 1.5=-,则变量x增加一个单位时()y xA.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位11.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为()A.127 B.128 C.128.5 D.12912.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费i x和年销售量()1,2, (8)y i=数据作了初步处理,得到下面的散点图及一些统计量的值.i有下列5个曲线类型:①ˆˆy bxa =+;②y c x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 14.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 15.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.16.由茎叶图可知,甲组数据的众数和乙组数据的极差分别是__________.17.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.18.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.19.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,如果在第一组随机抽取的号码为6,那么在第7组中抽取的号码是_________.20.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.三、解答题21.2018年8月8日是我国第十个全民健身日,其主题是:新时代全民健身动起来.某市为了解全民健身情况,随机从某小区居民中抽取了40人,将他们的年龄分成7段:[10,20),[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.(1)试求这40人年龄的平均数的估计值;(2)(i )若从样本中年龄在[50,70)的居民中任取2人赠送健身卡,求这2人中至少有1人年龄不低于60岁的概率;(ⅱ)已知该小区年龄在[10,80]内的总人数为2000,若18岁以上(含18岁)为成年人,试估计该小区年龄不超过80岁的成年人人数.22.“城管喊你摆地摊啦!”为了释放地摊经济活力,为市民提供灵活多样化的便民服务,某地区为市民在城区设置了流动摊贩临时摆放点.小张为参与地摊创业,调查了该地区甲、乙两个行业地摊摊主5年内的年收人,制作了如下统计数据表 年份x20152016 2017 2018 2019 甲行业年收人y (万元) 7.8 8.6 10.0 11.1 12.5 乙行业年收入z (万元)6.210.68.26.613.4(1)根据表格,对比甲、乙两个行业摊主这5年的年收入情况(已知甲、乙两个行业的年收入的5个数据的方差分别为2.852,7.232),判断小张在这两个地摊行业中选择哪个创业更合适;(2)根据甲行业摊主这5年年收入的数据,求其年收入y 关于年份x 的线性回归方程,并据此估计甲行业摊主在2020年的年收入.附:回归方程y bx a =+中的斜率和截距的最小二乘估计公式分别为21122211()()n ni iii i nniii i x y nx y x x b xnxx x ====--==--∑∑∑∑,a y bx =-.23.2019年2月13日《西安市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数;(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i )你认为9个名额应该怎么分配?并说明理由;(ii )座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的22⨯列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?(精确到0.1)阅读时间不足8.5小时 阅读时间超过8.5小时 理工类专业 4060非理工类专业附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:20()P K k ≥ 0.1500.100 0.050 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82824.某学校因为今年寒假延期开学,根据教育部的停课不停学指示,该学校组织学生线上教学,高一年级在线上教学一个月后,为了了解线上教学的效果,在线上组织了学生数学学科考试,随机抽取50名学生的成绩并制成频率分布直方图如图.(1)求m 的值并估计这50名学生的平均成绩;(2)估计高一年级所有学生数学成绩在[90,100)分与[)70,100分的学生所占的百分比. 25.两台机床同时生产直径为10的零件,为了检验产品质量,质量质检员从两台机床的产品中各抽取4件进行测量,结果如下: 机床甲109.81010.2机床乙10.1109.910如果你是质量检测员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有多少的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bc K a b c d a c b d -=++++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 2.D解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.3.D解析:D 【分析】由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.B解析:B【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.5.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.8.B解析:B 【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值 【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错9.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.10.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.11.D解析:D 【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数. 详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129. 故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..12.B解析:B 【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择. 详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =d 或y =p +q ln x 较适宜,故选B . 点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.14.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x =5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112ii y==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34,所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.15.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.16.【分析】首先从茎叶图中找到出现次数最多的数从而得到甲组数据的众数找出乙组数据的最大值和最小值两者作差求得极差得到结果【详解】根据众数的定义可以断定甲组数据的众数是21;从茎叶图中可以发现其最大值为其 解析:21,43【分析】首先从茎叶图中找到出现次数最多的数,从而得到甲组数据的众数,找出乙组数据的最大值和最小值,两者作差求得极差,得到结果. 【详解】根据众数的定义,可以断定甲组数据的众数是21;从茎叶图中可以发现,其最大值为52,其最小值为9,所以极差为52943-=, 故答案为21,,43. 【点睛】该题考查的是茎叶图的应用,涉及到的知识点有一组数据的众数和极差的概念,只要明确众数是数据中出现次数最多的数,极差是最大值和最小值的差距,从而求得结果.17.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.18.【解析】设第二组及第五组数据对应矩形的高为a则10×(a+0015+0025+0035+a+0005)=1解得a=0010故各组的频率依次为:010015025035010005∵前三组的累积频率为解析:7 15【解析】设第二组及第五组数据对应矩形的高为a,则10×(a+0.015+0.025+0.035+a+0.005)=1,解得a=0.010,故各组的频率依次为:0.10,0.15,0.25,0.35,0.10,0.05,∵前三组的累积频率为:0.10+0.15+0.25=0.50,故这次环保知识竞赛成绩的中位数为70;成绩在[80,90)段的人数有10×0.010×40=4人,成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件,其中他们在同一分数段的基本事件有:7,故他们在同一分数段的概率为7. 15故答案为:7 15.19.66【解析】因为系统抽样第一组抽取的号码为6所以第k组抽取号码应该为故第7组抽取号码为66填66解析:66【解析】因为系统抽样第一组抽取的号码为6,所以第k组抽取号码应该为6+10k-11,2,10k⨯=(),,故第7组抽取号码为66,填66.20.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.三、解答题21.(1)37;(2)(ⅰ)35;(ⅱ)1760.【分析】(1)用每组数据中间点值乘以频率相加即得;(2)(i)年龄在[50,70)的人有6人,其中年龄在[50,60)的有4人,6人分别编号后用列举法写出任选2人的所有基本事件,同时得出至少有1人年龄不低于60岁的基本事件,计数后可得概率;(ⅱ)求出18岁以上的居民所占频率即可得.【详解】解:(1)平均数()150.15250.2350.3450.15550.165750.0537x=⨯+⨯+⨯+⨯+⨯++⨯=.(2)(ⅰ)样本中,年龄在[50,70)的人共有40×0.15=6人,其中年龄在[50,60)的有4人,设为a,b,c,d,年龄在[60,70)的有2人,设为x,y.则从中任选2人共有如下15个基本事件:(a,b),(a,c),(a,d),(a,x),(a,y),(b,c),(b,d),(b,x),(b,y),(c,d),(c,x),(c,y),(d,x),(d,y),(x,y).至少有1人年龄不低于60岁的共有如下9个基本事件:(a,x),(a,y),(b,x),(b,y),(c,x),(c,y),(d,x),(d,y),(x,y).记“这2人中至少有1人年龄不低于60岁”为事件A,故所求概率()93 155P A==.(ⅱ)样本中年龄在18岁以上的居民所占频率为1-(18-10)×0.015=0.88,故可以估计,该小区年龄不超过80岁的成年人人数约为2000×0.88=1760.【点睛】本题考查频率分布直方图,考查古典概型,考查频率分布直方图的应用,考查了学生的数据处理能力,运算求解能力,属于中档题.22.(1)甲行业;(2) 1.192390.23y x=-,13.57万元.【分析】(1)求出两个均值,结合方差可得;(2)根据所给公式计算出回归方程的系数得回归方程,令2020x =可得估值. 【详解】(1)根据表格,7.88.61011.112.5105y ++++==,6.210.68.2 6.613.495z ++++==,2 2.852y S =,27.232z S =,因为y z >,22y z S S <,且甲行业摊主这5年的年收入情况一直呈现递增趋势,因此小张选择甲行业创业更合适. (2)2017x =,()()()()()121()2 2.21 1.40 1.12 2.5 1.1910()niii nii x x y y b x x ==---⨯-+-⨯-+++⨯===-∑∑,10 1.1920172390.23a y bx =-=-⨯=-,所以年收入y 关于年份x 的线性回归方程为 1.192390.23y x =-. 当2020x =时, 1.1920202390.2313.57y =⨯-=, 故甲行业摊主在2020年的年收入估计值为13.57万元. 【点睛】本题考查均值与方差的应用,考查线性回归直线方程及应用.考查学生的数据处理能力,运算求解能力,属于中档题.23.(1)9, (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由见解析, (ii )有95%的把握认为学生阅读时间不足与“是否理工类专业”有关. 【分析】(1)取各区间中点值乘以频率再相加即得;(2)(i )两组差异明显,用分层抽样计算.(ii )求出两组的人数,填写列联表,计算2K 可得.【详解】(1)60.0370.180.290.35100.19110.09120.049⨯+⨯+⨯+⨯+⨯+⨯+⨯= (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配 (ii )22⨯列联表为:2K 200(40742660) 4.4 3.84166134100100⨯⨯-⨯=≈>⨯⨯⨯, 所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关. 【点睛】本题考查频率分布直方图,分层抽样,考查独立性检验.属于基础题. 24.(1)0.016m =;76.2;(2)16%;70%. 【分析】(1)由频率分布直方图的性质,求得m ,再利用频率分布直方图的平均数计算公式求得50名学生的平均成绩.(2)由频率分布直方图计算[90,100)这一组的频率即可;[70,100)计算三组的频率和即可. 【详解】(1)由频率分布直方图性质可得,(0.0040.0060.0200.0240.030)101m +++++⨯=,得0.016m =,设平均成绩为x ,0.04450.06550.2650.3750.24850.169576.2x =⨯+⨯+⨯+⨯+⨯+⨯=∴.(2)由频率分布直方图可估计在[90,100)分的学生所占总体百分比为0.016100.16⨯=即为16%,[70,100)分的学生所占的百分比(0.0300.0240.016)100.7++⨯=,即为70%.【点睛】本题主要考查频率分布直方图的性质.25.机床乙的零件质量更符合要求,运算见解析. 【详解】先考虑各自的平均数:设机床甲的平均数、方差分别为211x s 、; 机床乙的平均数、方差分别为222x s 、.1109.81010.2104x +++==,210.1109.910104x +++==∴两者平均数相同,再考虑各自的方差: 2222211[(1010)(9.810)(1010)(10.210)]0.024s =-+-+-+-=2222221[(1010)(10.110)(1010)(9.910)]0.0054s =-+-+-+-=∵2212s s >,∴机床乙的零件质量较稳定,乙更符合要求. 26.(1)概率分别为:43100,27100,21100,9100;(2)350;(3)填表见解析;有95%的把握认为锻炼的人次与该市的空气质量有关.【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的概率; (2)利用频率分布直方图估计样本平均值的方法可得得答案; (3)完善列联表,由公式计算卡方的值,从而查表即可, 【详解】解:(1)该市一天的空气质量等级为1的概率为:2162543100100++=;该市一天的空气质量等级为2的概率为:5101227100100++=;该市一天的空气质量等级为3的概率为:67821100100++=; 该市一天的空气质量等级为4的概率为:7209100100++=; (2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:1000.203000.355000.45350x =⨯+⨯+⨯=;(3)根据所给数据,可得下面的22⨯列联表,由表中数据可得:2()100(3383722) 5.820 3.841()()()()70305545n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯, 所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查了独立性检验与频率估计概率,估计平均值的求法,属于中档题.。
(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(2)

一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.2.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为()A.600 B.1225 C.1530 D.18553.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是()A.华为的全年销量最大B.苹果第二季度的销量大于第三季度的销量C.华为销量最大的是第四季度D.三星销量最小的是第四季度4.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .185.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和676.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.97.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s > 8.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.19.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元10.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元)2345销售额y (万元)25 37 44 54根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元11.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1312.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.17.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.18.某种活性细胞的存活率(%)y 与存放温度()x C ︒之间具有线性相关关系,样本数据如下表所示: 存放温度()x C ︒ 10 4 -2 -8 存活率(%)y20445680经计算得回归直线的斜率为-3.2.若存放温度为6C ︒,则这种细胞存活率的预报值为__________%.19.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.20.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 . 三、解答题21.已知某校6个学生的数学和物理成绩如下表:(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y y x y nx yb x xxnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 22.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)当20b ∧=-时,求回归直线方程y b x a ∧∧∧=+;(2)预计在今后的销售中,销量与单价服从(1)中的关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)23.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.24.全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续n 天监测空气质量指数(AQI ),数据统计如下: (1)根据所给统计表和频率分布直方图中的信息求出,n m 的值,并完成频率分布直方图;(2)在空气质量指数分别为51-100和151-200的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A “两天空气都为良”发生的概率.25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度(单位:C ︒)21 23 24 27 29 32死亡数y (单位:株)6 11 20 27 57 77经计算:611266i i x x ===∑,611336i i y y ===∑,()()61557i i i x x y y =--=∑,()62184ii x x =-=∑,()6213930i i y y =-=∑,()621ˆ236.64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(结果精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程0.2303ˆ0.06x ye =,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据.地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个,[20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.3.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.4.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.5.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75. 更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B . 【点睛】本题考查平均数与方差的概念与应用问题,是基础题.6.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.7.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础8.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X ==方差为:224 4.4, 1.1σσ==,故选B .【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可. 9.B解析:B【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程10.C解析:C【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa ,得到线性回归方程,把6x =代入即可求出答案.【详解】由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=,故答案为C.【点睛】本题考查了线性回归方程的求法与应用,属于基础题.11.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19,由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25,∴做问卷C 的人数为25﹣14+1=12,故选C .【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.12.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 二、填空题13.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差.【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题. 14.5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数求和即可【详解】由茎叶图知甲加工零件个数的中位数为乙加工零件个数的平均数为则【点睛】本题主要考查利用茎叶图求中位数和平均数解析:5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数,求和即可.【详解】 由茎叶图知,甲加工零件个数的中位数为()1212221.52a =⨯+=, 乙加工零件个数的平均数为()11917112124222430323010b =⨯+++++++++23=,则21.52344.5a b +=+=.【点睛】本题主要考查利用茎叶图求中位数和平均数.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人, 故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目. 16.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】 试题分析:由平均数及方差的定义可得10685675x ++++==; 222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==. 考点:样本数据的数字特征:平均值与方差.17.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意 解析:3【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果.详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力. 18.34【解析】分析:由题意求出代入公式求值从而得到回归直线方程代入代入即可得到答案详解:由题意设回归方程由表中数据可得:;代入回归方程可得当时可得故答案为34点睛:该题考查的是有关回归直线的有关问题在 解析:34【解析】 分析:由题意求出,x y ,代入公式求值^a ,从而得到回归直线方程,代入6x =代入即可得到答案. 详解:由题意,设回归方程 3.2ˆ,ˆyx a =-+ 由表中数据可得:1,50x y ==;代入回归方程可得ˆ53.2a=. 当6x =时,可得3.2653.234y =-⨯+=,故答案为34.点睛:该题考查的是有关回归直线的有关问题,在解题的过程中,涉及到的知识点有回归直线过均值点,即样本中心点,利用题中所给的表格中的数据,计算得出相应的量,代入式子求得对应的结果.19.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题解析:88【解析】分析:根据方差与均值的关系()()()22D x E xE x ⎡⎤=-⎣⎦ 求解即可.详解:剔除最高分和最低分后的 222()()()92168480,E x E x D x =+=+=22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 589015E x ;⨯++== 原始 22229658()8188,15x E x ∑++== 原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始 即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.20.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为 解析:45【解析】分析:先根据平均数求x 的值,再求数据的方差. 详解:由题得8+9+8109,10.5x x ++=∴= 所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n =-+-+⋅⋅⋅+-. 三、解答题21.(1)见解析;(2)129155y x =+ 【分析】(1)由题意得1号学生、2号学生为理科小能手,从而得到X 的可能取值为0,1,2,分别求出相应的概率,由此能求出X 的分布列和数学期望; (2)利用最小二乘法分别求出ˆb,ˆa ,由此能求出y 与x 的回归直线方程. 【详解】(1)由题意得1号学生、2号学生为理科小能手.X 的可能取值为:0,1,2P (X =0)242625C C ==,P (X =1)112426815C C C ==, P (X =2)2226115C C ==, X 的分布列为()0+1+2=515153E X =⨯⨯⨯ (2)84,75x y ==,61 i =∑x i y i =37828,61 i =∑x i2=42476, ∴ˆb=(61 i i i x y =-∑6xy )÷(6221 6i n x x =-∑) 2378286847542476684-⨯⨯=-⨯ 15=, ˆˆa y bx =-=75﹣15×84=2915, 回归方程为129155y x =+ 【点睛】本题考查离散型随机变量的分布列和数学期望的求法,考查回归直线方程的求法,是中档题,解题时要认真审题,注意最小二乘法的合理运用. 22.(1)20250ˆyx =-+;(2)应定为354元. 【分析】 (1)利用公式求解出,x y 的值,求解b ,代入回归方程求得a 的值,即可得到回归直线的方程;(2)设工厂获得的利润为L 元,得到关于L 的函数关系式,利用二次函数求最值即可得出答案.【详解】(1)根据表中数据,计算()188.28.48.68.898.56x =⨯+++++=,()1908483807568806y =⨯+++++=, 且20b =-, ∴()80208.5250a y bx =-=--⨯=,∴y 关于x 的线性回归方程为20250y x =-+.(2)设工厂获得的利润为L 元,则()()2352025052025020281.254L x x x x ⎛⎫=-+--+=--+ ⎪⎝⎭, 则该产品的单价应定为354元时,工厂获得的利润最大. 【点睛】本题主要考查了回归直线的方程的求解,以及利用二次函数求最值,其中解答中熟记基本计算公式,准确计算,以及认真审题,得到函数的关系式是解答的关键,着重考查了分析问题和解答问题的能力,属于中档题.23.(1)不同的样本的个数为432418C C .(2)①分布列见解析,()E ξ97=. ②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分.【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩.【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名, 18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名,∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为ξ 0 1 2 3 P435 1835 1235 135 ∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+.当96x =时,0.659633.6096y =⨯+=.可预测该同学的物理成绩为96分.【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).24.(1)答案见解析;(2)35. 【解析】【试题分析】(1)借助题设中提供的频率分布直方图,算出0-50的频率为0.004500.2⨯=,进而求出样本容量200.2100n =÷=,从而求出25m =,最后完成频率分布直方图;(2)先运用分层抽样的方法求出空气质量指数为51-100和151200-的监测天数中分别抽取4天和1天,即将空气质量指数为51-100的4天分别记为,,,a b c d ;将空气质量指数为151-200的1天记为e ,算出从中任取2天的基本事件数为10种和其中事件A “两天空气都为良”包含的基本事件数为6种,进而算得事件A “两天都为良”发生的概率是()63105P A ==: (1)由频率分布直方图可知0-50的频率为0.004500.2⨯=,所以200.2100n =÷=,从而25m =,频率分布直方图补充如下图所示.(2)在空气质量指数为51-100和151200-的监测天数中分别抽取4天和1天,在所抽取的5天中,将空气质量指数为51-100的4天分别记为,,,a b c d ;将空气质量指数为151-200的1天记为e ,从中任取2天的基本事件分别为:(),a b ,(),a c ,(),a d ,(),a e ,(),b c ,(),b d ,(),b e ,(),c d ,(),c e ,(),d e ,共10种.其中事件A “两天空气都为良”包含的基本事件为:(),a b ,(),a c ,(),a d ,(),b c ,(),b d 共6种,所以事件A “两天都为良”发生的概率是()63105P A ==. 25.(1)ˆy=6.6x −139.4;(2)(i )回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好;(ii )190. 【分析】(1)根据公式,结合已知数据,分别求得ˆˆ,ba ,则问题得解; (2)根据相关指数的计算公式,结合已知数据,求得2R ,再进行比较即可;(3)将35x =代入回归方程,即可求得结果.【详解】(Ⅰ)由题意得,()()()121557ˆ 6.6384ni i i n i i x x y y b x x ==--==≈-∑∑ ∴ˆa =33−6.6326=−139.4,∴y 关于x 的线性回归方程为:ˆy=6.6x −139.4. (Ⅱ) (i )线性回归方程ˆy=6.6x −138.6对应的相关指数为: ()()6221621ˆ236.641110.06020.93983930i i i i i i y y R y y ==-=-=-≈-=-∑∑, 因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好. (ii )由(i )知,当温度35C x ︒=时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35C 时该批紫甘薯死亡株数为190.【点睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.26.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解.【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=,所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+, 由于*n N ∈,所以当7n =时,()f n 取最大值104.9.即当他的答题数量7n =时,他的复赛成绩的期望值最大.【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.。
(好题)高中数学必修三第一章《统计》检测题(包含答案解析)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .393.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .184.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .295. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .507.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .138.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合9.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A.40 B.45 C.48 D.5010.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1811.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.3712.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费i x和年销售量()y i=数据作了初步处理,得到下面的散点图及一些统计量的值.1,2, (8)i有下列5个曲线类型:①ˆˆy bxa =+;②y c x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.14.下表记录了某公司投入广告费x 与销售额y 的统计结果,由表可得线性回归方程为^^^y b x a =+,据此方程预报当6x =时,y =__. x4 2 35 y 49263954附:参考公式:^1122211()()()n niii ii i nni i i i x x y y x y nx yb x x x nx====---==--∑∑∑∑,^^^a y b x =-15.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
(必考题)高中数学必修三第一章《统计》测试题(包含答案解析)(1)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,152.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .6753.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .184.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .635.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .986.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是A.81.2,4.4B.40.6,1.1C.48.8,4.4D.78.8,1.17.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ˆˆˆy bx a=+,其中ˆˆˆ0.76,b a y bx==-,据此估计,该社区一户收入为15万元家庭年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元8.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.139.设有一个直线回归方程为2 1.5y x=-,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位10.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为()A.127 B.128 C.128.5 D.12911.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37 12.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.17.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.18.已知一组数据为2,3,4,5,6,则这组数据的方差为______.19.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下:分组频数频率[50,60)180.30[60,70)240.40[70,80)90.15[80,90)60.10[90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.24.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i ix ==∑.25.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i i i i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆay bx =-) 26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a 的值;()2以频率作为概率,试求消费者月饼购买量在600g 1400g ~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.3.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.4.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.5.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.10.D解析:D 【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数. 详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129. 故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..11.A解析:A 【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.12.D解析:D 【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb=2317.5=4635>0, ∴ˆa =﹣0.25﹣4635•5.5<0, 故选:D .点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族解析:20 【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果. 【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05, 则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==,解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20. 【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题.14.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20. 【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000 【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数. 【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人,故答案是:5000. 【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.16.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.17.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.18.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.19.5【解析】根据频率分布直方图得;∵002×5+004×5=03<0503+008×5=07>05;∴中位数应在20∼25内设中位数为x 则03+(x−20)×008=05解得x=225;∴这批产品的中解析:5 【解析】根据频率分布直方图,得; ∵0.02×5+0.04×5=0.3<0.5, 0.3+0.08×5=0.7>0.5; ∴中位数应在20∼25内, 设中位数为x ,则 0.3+(x −20)×0.08=0.5, 解得x =22.5;∴这批产品的中位数是22.5. 故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法: ①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; ③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的.(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14i i x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的. 【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论. 22.(1) 1.60.2y x =+;(2)B 项目的收益更好. 【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好. 【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==,22222212233547585351.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯, 则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元. 因为9.89.7>,所以可预测B 项目的收益更好. 【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 23.(1)直方图见解析;(2)67分,65分. 【分析】(1)由统计表算出各频率,作出频率分布直方图;(2)取各组数据中间值乘以频率再相加可得总平均值,求出频率0.5对应的成绩(此成绩在[60,70)之间]. 【详解】(1)根据统计表,作出这些数据的频率分布直方图如图:(2)由表中数据可知,这60名参赛学生成绩的平均数550.3650.4750. 15850.1950.0567x =⨯+⨯+⨯+⨯+⨯=分.因为这60名参赛学生成绩在[50,60)的频率为0.30.5<,成绩在[50,70)的频率为0.70.5>,所以这60名.参赛学生成绩的中位数在[60,70)之间.设这60名参赛学生成绩的中位数为x ,则()0.04600.2x ⨯-=,解得65x =, 故这60名参赛学生成绩的中位数为65分. 【点睛】本题考查频率分布直方图,考查由频率分布直方图求均值和中位数.考查了学生的数据处理能力,运算求解能力,属于中档题. 24.(1)6;689;(2) 1.3 1.1y x =-,12人. 【分析】(1)由表格中的数据,利用平均数和方差的公式,即可求解;(2)由表中近五年的数据,利用公式,求得ˆˆ,ba ,求得回归直线方程,代入10x =,即可作出结论. 【详解】(1)由表格中的数据,利用平均数的计算公式,可得2354578101069++++++++=.由方差的公式,可得()()()2222168263610699s ⎡⎤=-+-++-=⎣⎦.(2)由表中近五年的数据知,7x =,8y =,95293i ii x y ==∑,925255i i x ==∑,9592255293578ˆ 1.32555495i ii i i x y xybx x==--⨯⨯===-⨯-∑∑,又a y bx =-,所以8 1.37 1.1a =-⨯=-, 故y 与x 的线性回归方程为 1.3 1.1y x =-, 当10x =时, 1.310 1.111.912y =⨯-=≈,故估计该校2020年参加“北约”“华约”考试而获得加分的学生有12人. 【点睛】本题主要考查了平均数与方差的计算,以及回归直线方程的求解及应用,其中解答中认真审题,根据公式准确计算是解答的关键,着重考查运算与求解能力.25.(1)5ˆ32yx =-(2)可靠 【分析】(1)根据所给的数据,先做出,y x 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程;(2)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【详解】 (1)由题意:111312123x ++==,253026273y ++==, ()()()()()()()()()()()()31122331322221231ˆi i i i i x x y y x x y y x x y y x x y y b x x x x x x x x ==----+--+--==-+-+--∑∑ ()()()()()()()()()22211122527131230271212262752111213121212-⨯-+-⨯-+-⨯-==-+-+-. 527123ˆˆ2ay bx =-=-⨯=-, 故回归直线方程为:ˆ532yx =-. (2)当10x =时,510322,2223122y =⨯-=-=<, 当8x =时,58317,1716122y =⨯-=-=<,所以(1)中所得的回归直线方程是可靠的. 【点睛】本题主要考查线性回归方程的求解与应用,属于中档题.求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 26.(1)a 0.001=;(2)0.62;(3)12.08吨 【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求. 【详解】()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=. ()2消费者月饼购买量在600g 1400g ~的频率为: ()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨, ∴该超市应准备12.08吨月饼恰好能满足市场需求. 【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.。
(好题)高中数学必修三第一章《统计》测试卷(含答案解析)(2)
一、选择题1.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5 B.4 C.3 D.22.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A .40B .50C .80D .1004.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.55.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .166.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )x 8 10 11 12 14 y2125m2835A .26B .27C .28D .297.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .988.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,49.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4 D .78.8,1.110.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9211.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.15.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 16.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示:现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.17.已知由样本数据集合(){}11,1,2,3,...,x y i n =,求得的回归直线方程为1.2308ˆ.0y x =+,且ˆ4x =,若去掉两个数据点 (4.1,5.7)和(3.9,4.3)后重新求得的回归直线方程l 的斜率估计值为1.2,则此回归直线l 的方程为_______. 18.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________. 19.已知由样本数据点集合(){},|1,2,3,,i ix y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。
(好题)高中数学必修三第一章《统计》测试题(有答案解析)(1)
一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277; ②5,9,100,107,121,180,195,221,265,299; ③11,41,71,101,131,161,191,221,251,281; ④31,61,91,121,151,181,211,241,271,299. 关于上述样本的下列结论中,正确的是( ) A .②④都不能为分层抽样 B .①③都可能为分层抽样 C .①④都可能为系统抽样D .②③都不能为系统抽样3.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1964.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④5.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .507.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元8.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .1609.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变10.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.15.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=16.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 17.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.18.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.19.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230zx =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了? 参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 22.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x2 3 4 5 6若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)24.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniiiii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)25.两台机床同时生产直径为10的零件,为了检验产品质量,质量质检员从两台机床的产品中各抽取4件进行测量,结果如下:如果你是质量检测员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求.26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a的值;()2以频率作为概率,试求消费者月饼购买量在600g1400g~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【分析】由题意结合所给的统计图确定选项中的说法是否正确即可.【详解】对于选项A: 2018年1~4月的业务量,3月最高,2月最低,-=,接近2000万件,所以A是正确的;差值为439724111986对于选项B: 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B是正确的;对于选项C:2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C是正确的;对于选项D,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D错误.本题选择D选项.【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.B解析:B 【分析】根据系统抽样和分层抽样的定义分别进行判断即可. 【详解】若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个; 若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.综上所述,B 选项正确. 故选:B. 【点睛】本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.3.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.4.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯, 故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题 9.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 10.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】 乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==== 因此s 1<s 2,选C.【点睛】本题考查标准差,考查基本求解能力.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112.故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数 解析:2-或6.【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可.【详解】 数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x ∴-+-+-++-=, ()()22221210121010210x x x x x x x x ∴++++-+++=, ()222212101010x x x x ∴+++-=,① ()()()()2222123102222170x x x x -+-+-++-=, ()()22212101210440170x x x x x x ∴+++-++++=, ()22212104040170x x x x ∴+++-+=,② 将②-①得24120x x --=,解得2x =-,或6x =,故答案为:2-或6.【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.15.【分析】(1)由回归方程知相关变量与成负相关(2)为假命题则同时为假命题为假命题则中至少有一假命题(3)全称命题与特称命题转换条件不变结论变相反(4)由正态曲线的对称性可解【详解】(1)由回归方程知解析:(2)【分析】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题(3)全称命题与特称命题转换条件不变,结论变相反 (4)由正态曲线的对称性可解.【详解】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,若变量x 增加一个单位,则y 平均增加4-个单位,故(1)错误(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题,所以“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件是正确的.故(2)正确 (3)全称命题与特称命题转换条件不变,结论变相反,故(3)错误(4)由正态曲线的对称性知,随机变量()22X N σ~,,若()0.32P X a <=,对称轴是2x = ,则()40.32P X a >-=,故(4)错误.故答案为; (2)【点睛】 利用正态曲线的对称性求概率是常见的正态分布应用问题.解题的关键是利用对称轴=x μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时可借助图形判断.对于正态分布2()N μσ,,由=x μ是正态曲线的对称轴知: (1)对任意的a ,有()()P X a P X a μμ<->+=;(2)()001;()P X x P X x -≥=<;(3)()()=()P a X b P X b P X a <<<≤-.16.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以 解析:①②④【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;根据相关指数的概念,可得2R 越大说明拟合效果越好,所以③不正确;若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间负相关,且线性相关性强,所以④正确;故答案为:①②④.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.17.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值.【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,故18,712,118a b a b a b ++=≤≤≤=, 49149()()18a b a b a b+=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518. 故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题. 18.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】 由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为3s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题. 19.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5【解析】19.5,15,5m y x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了.【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可.【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==, 1.2 1.5 1.6 1.6 1.8 2.5 2.5 2.6 2.729y ++++++++==, ()()()9192112ˆ0.260i ii i i x x y y b x x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=,故该县第一年养殖山羊约33.6万只.由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.【点睛】方法点睛:求线性回归方程的步骤:(1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆi i i i i x x y y b x x ==--=-∑∑,ˆa y b x =-⨯;(3)写出回归直线的方程. 22.(1)0.5 2.3y x =+;(2)6800元.【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程;(2)将9x =代入即可预测.【详解】 解:(1)由表可得:123456747++++++==x , 2.9 3.3 3.6 4.4 4.8 5.2 5.9 4.37y ++++++==, 又77211134.4,140ii i i i x y x ====∑∑, 71722217134.474 4.30.5140747i ii i i x y x y b x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.23.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.24.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可.【详解】解:(1)依题意可计算得,1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115ii i x y ==∑,1021406i i x ==∑, 1022110151ˆ0.1100i i i i i x y x y b xx ==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.25.机床乙的零件质量更符合要求,运算见解析.【详解】 先考虑各自的平均数:设机床甲的平均数、方差分别为211x s 、; 机床乙的平均数、方差分别为222x s 、. 1109.81010.2104x +++==,210.1109.910104x +++== ∴两者平均数相同,再考虑各自的方差: 2222211[(1010)(9.810)(1010)(10.210)]0.024s =-+-+-+-= 2222221[(1010)(10.110)(1010)(9.910)]0.0054s =-+-+-+-= ∵2212s s >,∴机床乙的零件质量较稳定,乙更符合要求.26.(1)a 0.001=;(2)0.62;(3)12.08吨【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求.【详解】 ()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=.()2消费者月饼购买量在600g 1400g ~的频率为:()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g ⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨,∴该超市应准备12.08吨月饼恰好能满足市场需求.【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.。
(好题)高中数学必修三第一章《统计》测试题(答案解析)(2)
一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.2.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8,,那么这组数据的方差2s 可能的最大值是()A.185B.18 C.36 D.63.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是()A.华为的全年销量最大B.苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度4.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .5.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .156.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元7.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元8.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .309.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合10.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .311.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.15.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.16.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.17.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.18.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.19.一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是__________.20.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x和销售量y之间的一组数据如表所示:月份i789101112销售单价i x(元)99.51010.5118.5销售量i y(元)111086514y x(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本).参考数据:51392i iix y==∑,521502.5iix==∑.参考公式:回归直线方程ˆˆˆy bx a=+,其中1221ˆni iiniix y nx ybx nx==-=-∑∑,ˆˆa y bx=-.22.某家庭2015-2019年的年收入和年支出情况统计如下表:(1)已知y与x具有线性相关关系,求y关于x的线性回归方程(精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2020年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2020年的年支出金额.(参考公式:回归方程ˆˆy bx a=+中斜率和截距的最小二乘估计分别为()()()1122211ˆn ni i i ii in ni ii ix x y y x y n x ybx x x n x====---⋅⋅==--⋅∑∑∑∑,ˆˆa y bx=-)23.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料: 组号 1 23 4 5 温差x (C ︒) 10 11 13 12 8 发芽数y (颗)2325302616经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i ii i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆay bx =-) 24.某地区不同身高的未成年男性的体重平均值如下表: 身高/cm6070 80 90 100 110 120 130 140 150 160 170 体重/kg 6.137.909.9012.1515.0217.5020.9226.8631.1138.8547.2555.05(1)根据散点图判断,y a bx =+与xy a b =⋅哪一个能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及下表中数据,建立y 关于x 的回归方程(表中ln i i u y =,0.66 1.93e ≈,0.22 1.02e ≈).xyu()1221ii x x =-∑()()121iii x x y y =--∑ ()()121iii x x u u =--∑11524.0532.9614200 6143.3 284参考公式:()() ()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---⋅==--∑∑∑∑,a y b x=-⋅.25.某学校因为今年寒假延期开学,根据教育部的停课不停学指示,该学校组织学生线上教学,高一年级在线上教学一个月后,为了了解线上教学的效果,在线上组织了学生数学学科考试,随机抽取50名学生的成绩并制成频率分布直方图如图.(1)求m的值并估计这50名学生的平均成绩;(2)估计高一年级所有学生数学成绩在[90,100)分与[)70,100分的学生所占的百分比.26.如表为某中学近5年被卓越大学联盟录取的学生人数.记2015年的年份序号为1,2016年的年份序号为2,…,2019年的年份序号为5.年份序号x12345录取人数y100130170200250(1)求y关于x的线性回归方程,并估计2020年该中学被卓越大学联盟录取的学生人数.(2)若在2015年和2019年被卓越大学联盟录取的学生中分层抽样7人,再从这7人中任选2人,求这2人恰好来自同一年份的概率.参考数据:521iix=∑=55,51i iix y=∑=2920.参考公式:b=1221ni iiniix y nx yx nx==--∑∑,a y bx=-【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.3.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B,C,D都错误.【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B∴,C,D都错误,故选A.【点睛】本题主要考查对销量百分比堆积图的理解.4.D解析:D【解析】【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.5.C解析:C【详解】抽取比例为1501 30000200=,1400020 200∴⨯=,抽取数量为20,故选C. 6.B解析:B【详解】试题分析:4235492639543.5,4244x y++++++====,∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a , ∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程7.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.8.C解析:C 【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x ,则1800601200x =,解得40x =, 故选C . 【点睛】本题考查了分层抽样方法的应用问题,属基础题.9.A解析:A 【分析】由题意知,两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,所以两组数据的样本中心点是(s ,t ),回归直线经过样本的中心点,得到直线l 1和l 2都过(s ,t ).∵两组数据变量x 的观测值的平均值都是s , 对变量y 的观测值的平均值都是t , ∴两组数据的样本中心点都是(s ,t ) ∵数据的样本中心点一定在线性回归直线上, ∴回归直线l 1和l 2都过点(s ,t ) ∴两条直线有公共点(s ,t ) 故选A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.10.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.11.A解析:A 【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数. 详解:∵8名女生,4名男生中选出3名学生组成课外小组, ∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112. 故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.12.A【解析】分析:先观察表中数据的规律,确定回归系数b的符号,再计算x和y,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y随当天气温x升高而减少,则0b<,排除C、D.计算1169=(504712151923273136)1111x-++++++++++=11228=(15615013212813011610489937654)111.64 1111y++++++++++=≈将x代入选项A,得1692.352147.767111.6311ˆy=-⨯+=将x代入选项B,得1692.352127.76591.6311ˆy=-⨯+=所以选项A正确.故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b符号的判断和回归直线过样本中心点(,)x y是解题关键.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题 解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数. 【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户. 【点睛】 本小题主要考查用样本估计总体,考查频率的计算,属于基础题.15.5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数求和即可【详解】由茎叶图知甲加工零件个数的中位数为乙加工零件个数的平均数为则【点睛】本题主要考查利用茎叶图求中位数和平均数解析:5 【解析】 【分析】由茎叶图直接可以求出甲的中位数和乙的平均数,求和即可. 【详解】由茎叶图知,甲加工零件个数的中位数为()1212221.52a =⨯+=, 乙加工零件个数的平均数为()11917112124222430323010b =⨯+++++++++23=,则21.52344.5a b +=+=. 【点睛】本题主要考查利用茎叶图求中位数和平均数.16.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力 解析:1320【分析】 依题意可得6512111110n⎛⎫-⨯= ⎪⎝⎭,解之即得解. 【详解】 依题意可得6512111110n⎛⎫-⨯=⎪⎝⎭,解得1320n =.故答案为1320 【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.17.2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果【详解】由题意结合方差的定义有:①而②①-②有:③注意到将其代入③式整理可得:又故故答案为2【点睛】本题主要考查方差的计算公式整体的数学解析:2 【解析】 【分析】由题意结合方差的定义整理计算即可求得最终结果. 【详解】由题意结合方差的定义有:()()()22212612x x x x x x -+-++-= ①,而()()()22212611118x x x -+-+⋅⋅⋅+-=, ②, ①-②有:()()212612666226x x x x x x x x --+++++++=-, ③,注意到1266x x x x +++=,将其代入③式整理可得:26120x x -+=,又0x ≠,故2x =.故答案为2. 【点睛】本题主要考查方差的计算公式,整体的数学思想等知识,意在考查学生的转化能力和计算求解能力.18.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【解析】 【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+ 解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果19.16【解析】根据频率直方图的含义每组小矩形的面积就是该组数据在总体中出现的频率所以该组频数为故填16解析:16 【解析】根据频率直方图的含义,每组小矩形的面积就是该组数据在总体中出现的频率,所以该组频数为400.4=16⨯,故填16.20.是不相等的正整数即可【解析】∵甲班人数为平均分为乙班人数为平均分为∴甲乙两班的数学平均分为∵∴当时∴该命题是假命题时应满足是不相等的正整数故答案为:是不相等的正整数解析:,a b 是不相等的正整数即可 【解析】∵甲班人数为m ,平均分为a ,乙班人数为()n n m ≠,平均分为b ∴甲、乙两班的数学平均分为ma nbm n++ ∵m n ≠∴当a b =时,2ma nb a bm n ++=+ ∴该命题是假命题时,应满足,a b 是不相等的正整数故答案为:,a b 是不相等的正整数三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】(1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b-⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y . 22.(1)0.780.24y x =+;(2)7.65万元. 【分析】(1)利用回归直线方程计算公式,计算出回归直线方程. (2)将9.5x =代入回归直线方程,求得预测值. 【详解】 (1)由题可得()199.61010.411105x =⨯++++=, ()17.37.588.58.785y =⨯++++=,()()()5222222110.400.41 2.32ii x x =-=-+-+++=∑,()()()()()()5110.70.40.5000.40.510.7 1.8iii x x y y =--=-⨯-+-⨯-+⨯+⨯+⨯=∑,()()()515211.845ˆ0.782.3258iii i i x x y y bx x ==--===≈-∑∑, 45ˆˆ8100.2458x ay b =-⋅=-⨯≈, 则y 关于x 的线性回归方程为0.780.24y x =+.(2)当2020年的年收入为9.5x =万元时,0.789.50.247.65y =⨯+=. 所以预测该家庭2020年的年支出金额为7.65万元.【点睛】本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,属于中档题.23.(1)5ˆ32yx =-(2)可靠 【分析】(1)根据所给的数据,先做出,y x 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程;(2)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的. 【详解】 (1)由题意:111312123x ++==,253026273y ++==, ()()()()()()()()()()()()31122331322221231ˆi i i i i x x y y x x y y x x y y x x y y b x x x x x x x x ==----+--+--==-+-+--∑∑ ()()()()()()()()()22211122527131230271212262752111213121212-⨯-+-⨯-+-⨯-==-+-+-. 527123ˆˆ2ay bx =-=-⨯=-, 故回归直线方程为:ˆ532yx =-. (2)当10x =时,510322,2223122y =⨯-=-=<, 当8x =时,58317,1716122y =⨯-=-=<,所以(1)中所得的回归直线方程是可靠的. 【点睛】本题主要考查线性回归方程的求解与应用,属于中档题.求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 24.(1)x y a b =⋅;(2) 1.93 1.02x y =⨯. 【分析】(1)根据散点图的趋势可以判断回归方程类型.(2)令ln u y =,由xy a b =⋅,得()1212ln ,ln u c x c c b c a =+==,由公式计算可得回归方程. 【详解】(1)根据散点图判断,x y a b =⋅能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型.(2)令ln u y =,由xy a b =⋅,得()1212ln ,ln u c x c c b c a =+==,()()()121112212840.0214200iii ii x x u u c x x ====--=-∑∑, 而 2.96u =,所以21 2.960.021150.66c u c x =-⋅=-⨯=,0.020.66u x =+,所以0.020.660.660.02 1.93 1.02x x x y e e e +==⨯=⨯,y 关于x 的回归方程为 1.93 1.02x y =⨯.【点睛】本题考查由散点图辨别回归方程的类型,求回归方程,属于中档题. 25.(1)0.016m =;76.2;(2)16%;70%. 【分析】(1)由频率分布直方图的性质,求得m ,再利用频率分布直方图的平均数计算公式求得50名学生的平均成绩.(2)由频率分布直方图计算[90,100)这一组的频率即可;[70,100)计算三组的频率和即可. 【详解】(1)由频率分布直方图性质可得,(0.0040.0060.0200.0240.030)101m +++++⨯=,得0.016m =,设平均成绩为x ,0.04450.06550.2650.3750.24850.169576.2x =⨯+⨯+⨯+⨯+⨯+⨯=∴.(2)由频率分布直方图可估计在[90,100)分的学生所占总体百分比为0.016100.16⨯=即为16%,[70,100)分的学生所占的百分比(0.0300.0240.016)100.7++⨯=,即为70%.【点睛】本题主要考查频率分布直方图的性质. 26.(1)3759y x =+;281;(2)1121. 【分析】(1)由题意计算平均数,代入公式求出回归系数,写出线性回归方程,再利用线性回归方程计算6x =时的值即可;(2)由分层抽样求出抽取的人数,再利用概率公式求出对应的概率即可. 【详解】(1)由表格可求()11234+5=35x =+++,()1100130170200+250=1705y =+++, 且521ii x=∑=55,51i ii x y =∑=2920,所以12221292053170375553ni ii nii x y nx yxnx b ==--⨯⨯==-⨯-=∑∑,17037359a y bx =-=-⨯=, 所以y 关于x 的线性回归方程为3759y x =+,当6x =时,37659281y =⨯+=,所以2020年该中学被卓越大学联盟录取的学生人数约为281;(2)由分层抽样可知7人中有10072100250⨯=+ 人来自2015年,有25075100250⨯=+人来自2019年,从中随机抽取两人共有21种结果,抽取的两人恰好来自同一年的有11种,所以所求概率为1121P =. 【点睛】本题主要考查线性回归方程和古典概型求概率,属于中档题.。
(好题)高中数学必修三第一章《统计》测试题(答案解析)(1)
一、选择题1.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .392.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277; ②5,9,100,107,121,180,195,221,265,299; ③11,41,71,101,131,161,191,221,251,281; ④31,61,91,121,151,181,211,241,271,299. 关于上述样本的下列结论中,正确的是( ) A .②④都不能为分层抽样 B .①③都可能为分层抽样 C .①④都可能为系统抽样D .②③都不能为系统抽样4.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x3456y 2.5 t 4 4.5A .3B .3.15C .3.5D .4.55.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006 B .041C .176D .1967.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元8.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16011.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表:根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.16.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.17.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.18.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______. 19.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y 23.555.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 20.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下: 日期 2.7 2.8 2.9 2.10 2.11 2.12 2.132.14 2.15 2.16 代号x 123 45 6 78910新增确诊人数y558 509444381 377 312 267221166 115y x y x 计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下: 日期 2.17 2.18 2.19 2.20 2.21 2.22新增确诊人数7933 45 2583418出评价.22.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,Nμσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.24.2019年2月13日《西安市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数;(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i )你认为9个名额应该怎么分配?并说明理由;(ii )座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的22⨯列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?(精确到0.1)阅读时间不足8.5小时 阅读时间超过8.5小时 理工类专业 4060非理工类专业附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:20()P K k ≥0.1500.100 0.050 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82825. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:时间周一 周二 周三 周四 周五 车流量x (万辆)50 51 54 57 58 2.5PM 的浓度y (微克/立方米) 3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)26.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】前4个数据对应的19.5x = ,0.195y = (把百分数转化为小数),而0( 4.68)0y kx ∧=-=0.0468bx -,0.19519.50.0468b ∧∴=⨯-,0.0124b ∧∴=,0(1.24 4.68)0y x ∧∴=- ,当3034322x +==, 1.2432 4.6835t =⨯-=.2.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.3.B解析:B 【分析】根据系统抽样和分层抽样的定义分别进行判断即可. 【详解】若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个; 若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.综上所述,B 选项正确. 故选:B. 【点睛】本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.4.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.B解析:B试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a , ∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程9.D解析:D 【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题11.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数解析:2-或6. 【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可. 【详解】数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x∴-+-+-++-=,()()22221210121010210x x xx x x x x ∴++++-+++=,()222212101010x x x x∴+++-=,①()()()()2222123102222170x x x x -+-+-++-=, ()()22212101210440170x x x x x x ∴+++-++++=,()22212104040170x x x x ∴+++-+=,②将②-①得24120x x --=,解得2x =-,或6x =, 故答案为:2-或6. 【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.14.8【分析】先设五个班的人数分别为样本平均数为5又因样本方差为4则代入大于且不相等的整数可得的值依次为24568即可得最大值【详解】解:设五个班的人数分别为则则所以的值依次为24568即有最大值为8故解析:8 【分析】先设五个班的人数分别为1a ,2a ,3a ,4a ,5a ,样本平均数为5,1234525a a a a a ++++=,又因样本方差为4,则()()()()()22222123455555520a a a a a -+-+-+-+-=,代入大于0且不相等的整数,可得1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即可得最大值. 【详解】解:设五个班的人数分别为1a ,2a ,3a ,4a ,5a , 则()12345155a a a a a ++++=, 15()()()()()2222212345555554a a a a a ⎡⎤-+-+-+-+-=⎣⎦, 则1234525a a a a a ++++=,()()()()()22222123455555520a a a a a -+-+-+-+-=,所以1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8, 即有最大值为8. 故答案为: 8【点睛】本题考查利用平均数公式和方差公式求样本数据中的最大值,是基础题.合理应用公式是关键.15.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值. 【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b , 且平均数为9,故18,712,118a ba b a b ++=≤≤≤=, 49149()()18a b a b a b +=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518.故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题.16.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为s = 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.17.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力 解析:1320【分析】依题意可得6512111110n⎛⎫-⨯= ⎪⎝⎭,解之即得解. 【详解】 依题意可得6512111110n⎛⎫-⨯=⎪⎝⎭,解得1320n =. 故答案为1320 【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.18.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【解析】 【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果19.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.20.240【解析】该校2000名男生中体重在的人数为解析:240 【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=.三、解答题21.(1)47.9598.7y x =-+,2月19日时新增确诊人数为零;(2)该数学探究估计的数据与实际的数据不吻合. 【分析】(1)根据数据套公式求出b a 、,写出回归方程,并估计新增确诊人数为零时的大概日期; (2)在(1)中求出的回归方程为线性的,再分析2月17日至2月22日的新增确诊人数不是线性的,所以选择模型不够理想. 【详解】解:()1设回归方程为y bx a =+, ∵ 5.5,335x y ==,()()1013955i ii x x y y =--=-∑,()210182.5ii x x =-=∑则()()()1012101395547.93982.5iii ii x x y y b x x ==---==≈--∑∑ 所以598.7a y bx =-≈所以回归方程为47.9598.7y x =-+估计在13x =即2月19日时新增确诊人数为零.()2该数学探究估计的数据与实际的数据不吻合.该同学首先通过线性相关系数进行线性相关判断,得到y 与x 有99%的把握线性相关,这只是说明选取的数据是线性的,但从整体看,不是线性的;出现这个结果的原因可能是传染病初发时的突发因素过多、湖北省外的人口众多、以及传染病机制复杂等因素决定的,说明对于传染病病例的变化趋势,选择线性模型可能不够理想. 【点睛】(1)求线性回归方程的步骤:①求出,x y ;②套公式求出b a 、;③写出回归方程y bx a =+;④利用回归方程y bx a =+进行预报;(2)可以建立多个函数模型时,要对每个模型进行分析比较,选择最优化模型. 22.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 23.(1)中位数为65;(2)分布列见解析;期望为5635;(3)50. 【分析】(1)由图中的数据可判断中位数在60分到80分之间,若设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,从而可求得中位数;(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为6人,不合格的人数为4人,则ξ的可能取值为0,1,2,3,4,求出各自的概率,从而可得ξ的分布列与数学期望;(3)由已知求出=64=18μσ,,从而可得()()6418641846820.6827P Z P Z -<≤+=<≤≈,再利用正态分布的对称性可求得结果 【详解】(1)设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,解得65x =,所以这60名参赛学生成绩的中位数为65.(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为()0.010.0220106+⨯⨯=,不合格的人数为1064-=.由题意可知ξ的可能取值为0,1,2,3,4.则()464101014C P C ξ===,()13464108121C C P C ξ===,()2246410327C C P C ξ===,()31464103435C C C P ξ===,()4441014210C P C ξ===.所以ξ的分布列为所以ξ的数学期望01234142173521035E ξ=⨯+⨯+⨯+⨯+⨯=. (3)由题意可得,()300.005500.015700.02900.012064μ=⨯+⨯+⨯+⨯⨯=,()()()222230640.150640.370640.4σ=-⨯+-⨯+-⨯()290640.2324+-⨯=,则18σ=,由Z 服从正态分布()2,Nμσ,得()()6418641846820.6827P Z P Z -<≤+=<≤≈,则()()18210.68270.158652P Z >≈-=,()460.68270.158650.84135P Z >≈+=,所以此次竞赛受到奖励的人数为600.8413550⨯≈. 【点睛】此题考查频率分布直方图、分层抽样、离散型随机变量的分布列、正态分布等知识,考查分析问题的能力和计算能力,属于中档题24.(1)9, (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由见解析, (ii )有95%的把握认为学生阅读时间不足与“是否理工类专业”有关. 【分析】(1)取各区间中点值乘以频率再相加即得;(2)(i )两组差异明显,用分层抽样计算.(ii )求出两组的人数,填写列联表,计算2K 可得.【详解】(1)60.0370.180.290.35100.19110.09120.049⨯+⨯+⨯+⨯+⨯+⨯+⨯= (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配 (ii )22⨯列联表为:2K 200(40742660) 4.4 3.84166134100100⨯⨯-⨯=≈>⨯⨯⨯, 所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关. 【点睛】本题考查频率分布直方图,分层抽样,考查独立性检验.属于基础题. 25.(1)()54,42(2)0.72 3.12y x =+(3)75.12微克/立方米 【分析】(1)求出,x y 从而得到样本点的中心; (2)利用参考公式求出()52150ii x x =-=∑,()()136ni ii x xy y =--=∑,从而得到b ,再将样本中心坐标代入求得a ,从而得到回归方程; (3)将100x =代入回方程,求出y 的值,即可得到答案. 【详解】 (1)5051545758394042444554,4255x y ++++++++====,所以样本中心坐标为()54,42. (2)因为()52116991650ii x x =-=+++=∑,()()1(4)(3)(3)(2)324336niii x x y y =--=-⋅-+-⋅-+⋅+⋅=∑,所以360.7250b ==, 3.12a =, 线性回归方程为0.72 3.12y x =+.(3)0.72100 3.1275.12y =⨯+=(微克/立方米) 此时 2.5PM 的浓度是75.12微克/立方米. 【点睛】本题考查回归直线方程的最小二乘法求解及回归方程的应用,考查数据处理能力,求解时注意运算的准确性. 26.(1)100分;(2)97. 【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩. 【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=, 由0.30.350.650.5+=>知:最低分数线在(]90,110之间, 设最低分数线为x ,且(]90,110x ∈. 由()0.35900.0150.5x +-⨯=得:100x =, 故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计学》第01章在线测试
《统计学》第01章在线测试 剩余时间: 59:52
答题须知:1、本卷满分20分。
2、答完题后,请一定要单击下面的“交卷”按钮交卷,否则无法记录本试卷的成绩。
3、在交卷之前,不要刷新本网页,否则你的答题结果将会被清空。
第一题、单项选择题(每题1分,5道题共5分)
1、某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择( )。
A、统计报表 B、重点调查
C、全面调查 D、抽样调查
2、编制时间数列时,要求动态数列的每个指标具有( )。
A、一致性 B、连续性
C、可比性 D、间隔性
3、若将加权算术平均数指数变形为综合指数,其特定的权数应为( )。
A、p0q0 B、p1q1
C、p0q0 D、p1q1
4、相关系数的取值范围是( )。
A、r=0 B、-1≤r≤0
C、0≤r≤1 D、-1≤r≤1
5、现象之间相互依存关系的程度越低,则相关系数( )。
A、越接近于0 B、越接近于-1
C、越接近于1 D、越接近于0.5
第二题、多项选择题(每题2分,5道题共10分)
1、下列属于数量指标指数的有( )。
A、劳动生产率指数
B、价格指数
C、产品成本指数
D、职工人数指数
E、商品销售量指数
2、下列各类指数中,可以编制指数体系的是( )。
A、个体指数
B、综合指数
C、用综合指数变形权数加权的平均数指数
D、平均指标指数
E、用固定权数加权的平均数指数
3、综合指数与平均数指数的区别与联系表现为( )。
A、在解决复杂总体不能直接同度量问题的思想不同
B、在计算时,综合指数先综合后对比,平均数指数先对比后综合
C、在运用资料的条件上不同;
D、在经济分析中的具体作用有所区别
E、在一定权数条件下,两类指数有变形关系
4、抽样推断包括( )
A、点估计
B、区间估计
C、双侧检验
D、单侧检验
E、定值估计
5、利用样本指标估计总体指标的优良标准是( )
A、无偏性
B、一致性
C、同质性
D、有效性
E、差异性
第三题、判断题(每题1分,5道题共5分)
1、总体单位总量和总体标志总量会随研究目的的不同而转化。
正确 错误
2、平均增长速度不是根据各个增长速度直接来求得,而是根据平均发展速度计算的。
正确 错误
3、某地区零售物价指数115.8%,则用同样多的人民币比上年少购买15.8%的商品。
正确 错误
4、在特定的权数条件下,综合指数与平均数指数间有变形关系。
正确 错误
5、回归分析和相关分析一样,所分析的两个变量都一定是随机变量。
正确 错误