上海静安区教育学院附属学校选修三第三单元《成对数据的统计分析》检测(含答案解析)

合集下载

上海长青学校选修三第三单元《成对数据的统计分析》检测(包含答案解析)

上海长青学校选修三第三单元《成对数据的统计分析》检测(包含答案解析)

一、选择题1.一组数据如下表所示:已知变量y 关于x 的回归方程为+0.5ˆbx ye =,若5x =,则预测y 的值可能为( ) A .5e B .112eC .132eD .7e2.以下说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均增加5个单位 ③线性回归方程ˆy bx a =+必过(),x y④设具有相关关系的两个变量,x y 的相关系数为r ,那么||r 越接近于0,,x y 之间的线性相关程度越高;⑤在一个22⨯列联表中,由计算得2K 的值,那么2K 的值越大,判断两个变量间有关联的把握就越大。

其中错误..的个数是( ) A .0 B .1C .2D .33.已知变量y 关于x 的回归方程为0.5ˆbx ye -=,其一组数据如下表所示:若5x =,则预测y 的值可能为( ) A .5eB .112eC .7eD .152e4.下列命题中错误的是( )A .样本数据的方差越小,则数据离散度越小B .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高C .相关系数r 满足1r ≤且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱D .相关指数越小,回归直线拟合效果越好. 5.下列说法中正确的是( )A .“a b >”是“22a b >”成立的充分不必要条件B .命题:,20x p x R ∀∈>,则00:,20xp x R ⌝∃∈<C .为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为40D .已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为^ 1.230.08y x =+.6.已知()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢数学文化的人数占男生人数的16,女生喜欢数学文化的人数占女生人数23,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人B .22人C .20人D .18人7.下列命题中正确的个数( )①“0x ∀>,2sin x x >”的否定是“00x ∃≤,002sin x x ≤”;②用相关指数2R 可以刻画回归的拟合效果,2R 值越小说明模型的拟合效果越好;③命题“若0a b >>0>>”的逆命题为真命题;④若22(1)mx m x -+30m ++≥的解集为R ,则m 1≥.A .0B .1C .2D .38.为预测某种产品的回收率y ,需要研究它和原料有效成分的含量x 之间的相关关系,现取了8组观察值.计算得8152ii x==∑,81228i i y ==∑,821478ii x ==∑,811849i i i x y ==∑,则y对x 的回归方程是( ) A .y =11.47+2.62x B .y =-11.47+2.62x C .y =2.62+11.47xD .y =11.47-2.62x9.下列有关统计知识的四个命题正确的是( )A .衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切B .在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差C .线性回归方程对应的直线ˆˆˆy bx a =+至少经过其样本数据点中的一个点D .线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位 10.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x (月份) 12 3 4 5 y (万盒)55668若x ,线性相关,线性回归方程为0.7y x a =+,则以下判断正确的是( ) A .x 增加1个单位长度,则y 一定增加0.7个单位长度 B .x 减少1个单位长度,则y 必减少0.7个单位长 C .当6x =时,y 的预测值为8.1万盒 D .线性回归直线0.7y x a =+,经过点()2,6 11.有下列说法:①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为5350y x =-+,当销售价格为10元时,销售量一定为300件;②线性回归直线y bx a =+一定过样本点中心(,)x y ;③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A .1B .2C .3D .412.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱13.下列说法中正确的是()A .若数列{}n a 为常数列,则{}n a 既是等差数列也是等比数列;B .若函数()f x 为奇函数,则(0)0f =;C .在ABC ∆中,A B >是sin sin A B >的充要条件;D .若两个变量,x y 的相关系数为r ,则r 越大,x 与y 之间的相关性越强.二、解答题14.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据.(1)请根据表中提供的数据,求出关于的线性回归方程ˆˆybx a =+; (2)预测记忆力为19的同学的判断力.(附参考公式:1221ˆni ii ni i x y nx ybx nx==-=-∑∑,ˆa y bx=-) 15.疫苗能够使人体获得对病毒的免疫力,是保护健康人群最有效的手段.新冠肺炎疫情发生以来,军事医学科学院陈薇院土领衔的团队开展应急科研攻关,研制的重组新型冠状病毒疫苗(腺病毒载体),于4月12日开始招募志愿者,进入二期临床试验.根据普遍规律,志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.科研人员要定期从接种疫苗的志愿者身上采集血液样本,检测人体中抗体含量水平(单位:miu/mL ,百万国际单位/毫升).(1)IgM 作为人体中首先快速产生的抗体,是人体抗感染免疫的“先头部队”.经采样分折,志愿者身体中IgM 含量水平()miu/mL y 与接种天数x (接种后每满24小时为一天,*x N ∈)近似满足函数关系:100.1,10,10xx x y e x -≤⎧=⎨>⎩,经研究表明,IgM 含量水平不低于0.2miu/mL 时是免疫的有效时段,试估计接种一次后IgM 含量水平有效时段可经历的时间(向下取整).(参考数据: 2.718e ≈)(2)IgG 虽然是接种后产生比较慢的抗体,却是血清和体液中含量最高的抗体,也是亲和力最强、人体内分布最广泛、具有免疫效应的抗感染“主力军”.科研人员每间隔3天检测一次(检测次数依次记为i t ,1,2,3,4,5,6,7i =)某志愿者人体中IgG 的含量水平,记作()()miu/mL 1,2,3,4,5,6,7i z i =,得到相关数据如下表:①请画出散点图,并根据散点图判断线性拟合模型与指数拟合模型·t z c d =哪种更适合拟合z 与t 的关系(不必说明理由);②研究人员发现,上述数据中存在一组异常数据应当予以剔除.试根据余下的六组数据,利用①中选择的拟合模型计算回归方程,并估计原异常数据对应的i z 值.附:回归系数与估计值均保留两位小数,由七组数据计算出的参考数据见下表,其中ln u z =.zui it z ∑ i it u ∑ln0.06 ln1.55 ln2.27 ln4.854.91 0.60 205.48 39.87-2.840.440.821.58参考公式:线性回归直线ˆˆˆya bx =+的斜率和截距的最小二乘估计分别为:2()()ˆ()ii ix x y y bx x --=-∑∑,a y bx =-16.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y /百亿元912172126r y x 留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果[]1,0.75r -∈-,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出关于x 的线性y 回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-186043.1≈. 17.近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.(1)完成下面22⨯列联表,并通过计算说明是否可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关?对商品好评 对商品非好评 合计对服务好评 对服务非好评2.072(2()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++)(2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X :①求对商品和服务全好评的次数X 的分布列(概率用组合数算式表示); ②求X 的数学期望和方差.18.每年10月中上旬是小麦的最佳种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了100颗小麦种子的发芽数,得到了如下数据: (1)请根据统计的最后三组数据,求出y 关于x 的线性回归方程y bx a =+; (2)若由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,则认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠; (3)若100颗小麦种子的发芽率为n 颗,则记为%n 的发芽率,当发芽率为%n 时,平均每亩地的收益为10n 元,某农场有土地10万亩,小麦种植期间昼夜温差大约为9C ︒,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.附:在线性回归方程y bx a =+中,1221ni ii nii x y nx yb xnx==-=-∑∑.19.忽如一夜春风来,翘首以盼的5G 时代,已然在全球“多点开花”,一个万物互联的新时代,即将呈现在我们的面前.为更好的满足消费者对流量的需求,中国电信在某地区推出六款不同价位的流量套餐,每款套餐的月资费x (单位:元)与购买人数y (单位:万人)的数据如表:对数据作初步的处理,相关统计量的值如表:其中ln i i v x =,ln i i y ω=,且绘图发现,散点(),i i v ω(6l i ≤≤)集中在一条直线附近. (1)根据所给数据,求y 关于x 的回归方程;(2)按照某项指标测定,当购买人数y 与月资费x 的比在区间,97e e ⎛⎫⎪⎝⎭内,该流量套餐受大众的欢迎程度更高,被指定为“主打套餐”,现有一家三口从这六款套餐中,购买不同的三款各自使用.记三人中使用“主打套餐”的人数为X ,求随机变量X 的分布列和期望. 附:对于一组数据()11,v ω,()22,v ω,…,()33,v ω,其回归直线bv a ω=+的斜率和截距的最小二乘估计值分别为1221ni ii nii v nv b vnvωω==-=-∑∑,a bv ω=-.20.艾滋病是一种危害性极大的传染病,由感染艾滋病病毒(HIV 病毒)引起,它把人体免疫系统中最重要的CD 4T 淋巴细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表:()1请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;()2请用相关系数说明:能用线性回归模型拟合y 与x 的关系;()3建立y 关于x 的回归方程(系数精确到0.01),预测2019年我国艾滋病病毒感染人数.参考数据:42 6.48≈;81449.6ii y==∑,812319.5i i i x y ==∑,821()46.2ii y y =-=∑,参考公式:相关系数)12211()()()ni nniii i x x y y r x x y y ===--=--∑∑∑,回归方程y bx a =+中,b()121()()ni i i n i i x x y y x x ==--=-∑∑,a y bx =-.21.某网店销售某种商品,为了解该商品的月销量y (单位:千件)与月售价x (单位:元/件)之间的关系,对近几年的月销售量i y 和月销售价()1,2,3,,10i x i =⋅⋅⋅数据进行了统计分析,得到了下面的散点图.(1)根据散点图判断,ln y c d x =+与y bx a =+哪一个更适宜作为月销量y 关于月销售价x 的回归方程类型?(给出判断即可,不需说明理由),并根据判断结果及表中数据,建立y 关于x 的回归方程;(2)利用(1)中的结果回答问题:已知该商品的月销售额为Z (单位:千元),当月销售量为何值时,商品的月销售额预报值最大?(月销售额=月销售量×当月售价) 参考公式、参考数据及说明:①对一组数据()11,v w ,()22,v w ,…,(),n n v w ,其回归直线w v αβ=+的斜率和截距的最小二乘法估计分别为()()()121niii nii w w v v v v β==--=-∑∑,w v αβ=-.②参考数据:表中ln i i u x =,101110i i u u ==∑.③计算时,所有的小数都精确到0.01,如ln 4.06 1.40≈.22.为了解某地区足球特色学校的发展状况,某调查机构得到如下统计数据:(1)根据上表数据,计算y 与x 的相关系数r ,并说明y 与x 的线性相关性强弱(已知:0.751r ≤≤,则认为y 与x 线性相关性很强;0.30.75x ≤≤,则认为y 与x 线性相关性一般,0.25r ≤,则认为y 与x 线性相关性较弱)(2)求y 与x 的线性回归方程,并预测该地区2019年足球特色学校的个数(精确到个位) 参考公式:()()niix x y y r --=∑()()2211,10, 3.6056nni i i i x x y y ==-=-=≈∑∑;()()()121,niii nii x x yy b a y bx x x ==--==--∑∑23.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表:年份 2014 20152016 2017 2018 补贴额x /亿元 9 10 12 11 8 粮食产量y /万亿2526313721(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆybx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.参考公式:()()()121ˆniii ni i x x y y bx x==--=-∑∑,ˆˆay bx =-. 24.某品牌汽车4S 店为对厂家研发的一种辅助产品进行合理定价,对该产品进行试销售,如图1.在试销售期间对100名顾客进行回访,由客户对该产品性能作出“满意”或“不满意”评价,如图2.(1)判断能否有99%的把握认为“客户购买产品对产品性能满意之间有关”? (2)请结合数据:()()6634580iii x x y y =--=∑,()()66175.5iii x x zz =--=-∑,()()663465.2i i i y y z z =--=∑,()626776840i i y y=-=∑,求y 与x 的回归方程(精确到0.1)25.这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智.某校高三学生也展开了对这次疫情的研究,一名同学在数据统计中发现,从2020年2月1日至2月7日期间,日期x 和全国累计报告确诊病例数量y (单位:万人)之间的关系如下表: 日期x1 2 3 4 5 6 7 全国累计报告确诊病例数量y (万人)1.41.72.02.42.83.13.5(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y 与x 的关系?(2)求出y 关于x 的线性回归方程y bx a =+(系数精确到0.01).并预测2月10日全国累计报告确诊病例数. 参考数据:7116.9ii y==∑,7177.5i i i x y ==∑1.88= 2.65≈.参考公式:相关系数()()niix x y y r --=∑回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:()()1niii nx x y y b =--=∑,a y bx =-.26.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆybx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】令ln z y ,求得,x z 之间的数据对照表,结合样本中心点的坐标满足回归直线方程,即可求得b ;再令5x =,即可求得预测值y .【详解】将式子两边取对数,得到ln 0.5y bx =+,令ln zy ,得到0.5z bx =+,根据已知表格数据,得到,x z 的取值对照表如下:12342.54x +++==,1346 3.54z +++==, 利用回归直线过样本中心点,即可得3.5 2.50.5b =+, 求得 1.2b =,则 1.20.5z x =+, 进而得到 1.2+0.5x y e =,将5x =代入, 解得136.52y e e ==.故选:C. 【点睛】本题考查利用样本中心点坐标满足回归直线方程求参数值,以及由回归方程进行预测值得求解,属中档题.2.C解析:C 【分析】根据用样本估计总体、线性回归方程、独立性检验的基本概念和基本性质,逐项判断,即可得到本题答案. 【详解】方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均减少5个单位,故②不正确;线性回归方程ˆy bx a =+必过样本中心点,故③正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,||r 越接近于1,相关程度越大,故④不正确;对于观察值2K 来说,2K 越大,“x 与y 有关系”的可信程度越大,故⑤正确. 故选:C 【点睛】本题主要考查用样本估计总体、线性回归方程、独立性检验的基本思想.3.D解析:D 【分析】将式子两边取对数,得到ln 0.5y bx =-,令ln zy ,得到0.5z bx =-,根据题中所给的表格,列出,x z 的取值对应的表格,求得,x z ,利用回归直线过样本中心点,列出等量关系式,求得 1.6b =,得到 1.60.5z x =-,进而得到 1.60.5x y e -=,将5x =代入,求得结果. 【详解】由0.5bx y e -=,得ln 0.5y bx =-,令ln z y ,则0.5z bx =-.2.54x ==, 3.54z ==, ∵(,)x z 满足0.5z bx =-,∴3.5 2.50.5b =⨯-, 解得 1.6b =,∴ 1.60.5z x =-,∴ 1.60.5x y e -=,当5x =时,151.650.52y e e ⨯-==,故选D. 【点睛】该题考查的是有关回归分析的问题,涉及到的知识点将对数型回归关系转化为线性回归关系,根据回归直线过样本中心点求参数,属于简单题目.4.D解析:D 【分析】运用相关系数、变量间的相关关系来进行判定 【详解】对于A ,样本数据的方差越小,则数据离散度越小正确对于B ,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高正确 对于C ,相关系数r 满足1r ≤且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱正确对于D ,相关指数越小说明残差平方和越大,则拟合效果越差,故D 错误 故选D 【点睛】本题考查对变量间的相关关系进行判定,结合残差图、相关系数来进行分析即可得到结果,较为基础5.D解析:D 【解析】对于A ,取1a =-,2b =时,不能推出22a b >,故错误;对于B ,命题:,20x p x R ∀∈>的否定为00,20xx R ∃∈≤,故错误;对于C ,为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为8004020÷=,故错误;对于D ,因为回归直线的斜率的估计值为1.23,所以回归直线方程可写成 1.23y x a =+,根据回归直线方程过样本点的中心()4,5,则0.08a =,所以回归直线方程为 1.2308ˆ.0yx =+,故正确. 故选D.6.D解析:D 【分析】设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.【详解】设男生至少有x 人,根据题意,可列出如下22⨯联表:则23111532663611822x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即36.6358x , 解得17.693x ,由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】本题考查独立性检验,属于基础题.7.C解析:C 【分析】根据含量词命题的否定可知①错误;根据相关指数的特点可知2R 越接近0,模型拟合度越低,可知②错误;根据四种命题的关系首先得到逆命题,利用不等式性质可知③正确;分别在0m =和0m ≠的情况下,根据解集为R 确定不等关系,从而解得m 范围,可知④正确. 【详解】①根据全称量词的否定可知“0x ∀>,2sin x x >”的否定是“00x ∃>,002sin x x ≤”,则①错误;②相关指数2R 越接近1,模型拟合度越高,即拟合效果越好;2R 越接近0,模型拟合度越低,即拟合效果越差,则②错误;③若“0a b >>0>>”的逆命题为:若“0>>,则0a b >>”,根据不等式性质可知其为真命题,则③正确;④当0m =时,()2213230mx m x m x -+++=-+≥,此时解集不为R ,不合题意;当0m ≠时,若()22130mx m x m -+++≥解集为R ,只需:()()241430m m m m >⎧⎪⎨+-+≤⎪⎩解得:m 1≥,则④正确.∴正确的命题为:③④本题正确选项:C 【点睛】本题考查命题真假性的判断,涉及到含量词命题的否定、四种命题的关系及真假性的判断、相关指数的应用、根据一元二次不等式解集为R 求解参数范围的知识.8.A解析:A 【解析】分析:根据公式计算ˆb≈2.62,ˆa ≈11.47,即得结果. 详解:由1221,()ˆˆˆni ii nii x y nxyba y bx xn x ==-==--∑∑,直接计算得ˆb ≈2.62,ˆa ≈11.47,所以ˆy=2.62x +11.47.选A.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .9.A解析:A 【解析】分析:利用“卡方”的意义、相关指数的意义及回归分析的适用范围,逐一分析四个答案的真假,可得答案.详解:A. 衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切,正确;B. 在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差,错误对分类变量X 与Y 的随机变量的2x 观测值来说, 2x 越大,“X 与Y 有关系”可信程度越大; 故B 错误;C. 线性回归方程对应的直线y bx a =+至少经过其样本数据点中的一个点,错误,回归直线y bx a =+可能不经过其样本数据点中的任何一个点;D. 线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位,错误,由回归方程可知变量x 每增加一个单位时,变量y 平均增加0.5个单位. 故选A.点睛:本题考查回归分析的意义以及注意的问题.是对回归分析的思想、方法小结.要结合实例进行掌握.10.C解析:C 【分析】通过线性回归方程可以进行预测而不能做出确定的判断,排除A ,B 选项;线性回归方程一定过样本中心点(,)x y ,排除D 选项;令6x =,代入方程求y ,可得C 正确. 【详解】由ˆˆ0.7yx a =+,得x 每增(减)一个单位长度,y 不一定增加(减少)0.7,而是大约增加(减少)0.7个单位长度,故选项A,B 错误;由已知表中的数据,可知12345556683,655x y +++=++++====,则回归直线必过点(3,6),故D 错误;代入回归直线ˆˆ0.7y x a =+,解得ˆ 3.9a =,即ˆ0.7 3.9y x =+,令6x =,解得ˆy=0.76 3.98.1⨯+=万盒, 故选:C 【点睛】本题考查了线性回归方程的性质,正确掌握线性回归方程的性质是解题的关键.11.B解析:B 【分析】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关时,线性相关性越强,相关系数r 越接近1-,③错误;残差图中带状区域越窄,拟合度越高,④错误;2R 越接近1,模型拟合度越高,⑤正确;由此可得结果. 【详解】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;②由最小二乘法可知,回归直线必过(),x y ,②正确;③若两个随机变量为负相关,若线性相关性越强,相关系数r 越接近1-,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数2R 越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个 本题正确选项:B 【点睛】本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.12.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.13.C解析:C 【分析】对于选项A ,B 给出反例可说明命题错误,C 由正弦定理可知命题正确,D 由相关系数的定义确定其真伪即可. 【详解】逐一考查所给的说法:A . 若0n a =,则数列{}n a 为常数列,则{}n a 是等差数列但不是等比数列,该说法错误;B . 函数()f x 1x=为奇函数,但是不满足()00f =,该说法错误; C . 由正弦定理可得在ABC ∆中,A B >是sinA sinB >的充要条件,该说法正确; D . 两个随机变量相关性越强,则相关系数r 的绝对值越接近于1,题中说法错误. 本题选择C 选项. 【点睛】本题主要考查奇函数的性质,正弦定理的应用,相关系数的含义,常数列与等差数列、等比数列的关系等知识,意在考查学生的转化能力和计算求解能力.二、解答题14.(1)ˆ0.7 2.3yx =-;(2)记忆力为19的同学的判断力约为11. 【分析】(1)根据题意及公式1221ˆni ii ni i x y nx ybx nx==-=-∑∑算出ˆb,根据公式ˆa y bx =-算出a 即可得出答案;(2)将19x =代入(1)中的回归方程计算即可. 【详解】 解:(1)由题意416283105126158i ii x y==⨯+⨯+⨯+⨯=∑,68101294x +++==,235644y +++==,4222221681012344i i x ==+++=∑,所以2158494140.73444920ˆb-⨯⨯===-⨯,ˆˆ40.79 2.3a y bx =-=-⨯=-, 故线性回归方程为ˆ0.7 2.3y x =- (2)当19x =时,解得ˆ11y= 所以由回归直线方程预测,记忆力为19的同学的判断力约为11. 【点睛】线性回归分析问题的类型及解题方法: (1)求线性回归方程:公式法:利用公式,求出回归系数ˆ,ba . 待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数ˆb. 15.(1)11天;(2)①见解析,指数拟合模型·t z c d =适合拟合z 与t 的关系;②1.55 【分析】(1)由函数的单调性可知10x ≤时,0.1y x =单调递增,10x >时,10-=xy e 单调递减,得到10x =时,y 达到峰值,再由100.2-<x e 求解不等式得答案; (2)①画出散点图,根据图像可得答案;②求出对于的ˆb与ˆa 的值,可得z 关于t 的回归方程,通过回归方程估计异常数据.。

(常考题)人教版高中数学选修三第三单元《成对数据的统计分析》测试卷(有答案解析)

(常考题)人教版高中数学选修三第三单元《成对数据的统计分析》测试卷(有答案解析)

一、选择题1.某校对学生进行心理障碍测试,得到的数据如下表:根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( ) A .焦虑 B .说谎C .懒惰D .以上都不对2.以下说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均增加5个单位 ③线性回归方程ˆy bx a =+必过(),x y④设具有相关关系的两个变量,x y 的相关系数为r ,那么||r 越接近于0,,x y 之间的线性相关程度越高;⑤在一个22⨯列联表中,由计算得2K 的值,那么2K 的值越大,判断两个变量间有关联的把握就越大。

其中错误..的个数是( ) A .0 B .1 C .2D .33.给出如下列联表2(10.828)0.001P K ≥≈,2( 6.635)0.010P K ≥≈参照公式()()()()()2n ad bc k a b c d a c b d -=++++,得到的正确结论是( )A .有99%以上的把握认为“高血压与患心脏病无关”B .有99%以上的把握认为“高血压与患心脏病有关”C .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关” 4.下列说法正确的是( )A .在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B .线性回归方程对应的直线y b x a ∧∧∧=+至少经过其样本数据点中的()11,x y ,()22,x y ,()33,x y(),n n x y 一个点C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果差 5.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为1:0.68ˆl y x a=+,计算其相关系数为1r ,相关指数为21R .经过分析确定点F 为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为2:0.68ˆl y bx=+,相关系数为2r ,相关指数为22R .以下结论中,不正确...的是A .120,0r r >>B .2212R R >C .ˆ0.12a= D .68ˆ00.b<< 6.已知下列命题:①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数r 就越接近于1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程20.5ˆyx =- 中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5;⑤在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;⑥对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说, k 越小,“X 与Y 有关系”的把握程度越大.⑦两个模型中残差平方和越小的模型拟合的效果越好. 则正确命题的个数是( )A .3B .4C .5D .67.下列有关线性回归分析的六个命题: ①线性回归直线必过样本数据的中心点(),x y ;②回归直线就是散点图中经过样本数据点最多的那条直线; ③当相关性系数0r >时,两个变量正相关;④如果两个变量的相关性越强,则相关性系数r 就越接近于1;⑤残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高; ⑥甲、乙两个模型的2R 分别约为0.88和0.80,则模型乙的拟合效果更好. 其中真命题的个数为( ) A .1个B .2个C .3个D .4个8.下列关于独立性检验的叙述:①常用等高条形图展示列联表数据的频率特征; ②独立性检验依据小概率原理;③样本不同,独立性检验的结论可能有差异;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,X 与Y 有关系的把握程度就越大.其中正确的个数为( ) A .1 B .2C .3D .49.某村庄对改村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( ) A .18a =B .19b =C .50c d +=D .2f e -=-10.已知,x y 的对应值表为:且,x y 线性相关,由于表格污损,y 的对应值看不到了,若6119.2ii y==∑,且线性回归直线方程为0.6y x a =+,则8x =时,y 的预报值为( ) A .6.1B .22.1C .12.6D .3.511.研究表明某地的山高()y km 与该山的年平均气温()xC 具有相关关系,根据所采集的数据得到线性回归方程ˆ260y x =-+,则下列说法错误..的是( ) A .年平均气温为0时该山高估计为60km B .该山高为72km 处的年平均气温估计为60CC .该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关D .该地的山高y 与该山的年平均气温x 成负相关关系 12.有下列说法:①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为5350y x =-+,当销售价格为10元时,销售量一定为300件;②线性回归直线y bx a =+一定过样本点中心(,)x y ;③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A .1B .2C .3D .413.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱二、解答题14.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x12345交易额y /百亿元9 12 17 21 26r y x 留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果[]1,0.75r -∈-,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出关于x 的线性y 回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-186043.1≈. 15.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y /百亿元912172126y x 留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:12211()()()()niii n niii i x x y y r x x y y ===--=--∑∑∑.统计学认为,对于变量,x y ,如果[]1,0.75r ∈--,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出y 关于x 的线性回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-186043.1≈. 16.某学校共有1000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样随机抽取了100名学生进行调查,月消费金额分布在450~950之间.根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示:将月消费金额不低于750元的学生称为“高消费群”.(1)求a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的中点值作代表);(2)现采用分层抽样的方式从月消费金额落在[550,650),[750,850)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高消费群”的学生人数为随机变量X ,求X 的分布列及数学期望;(3)若样本中属于“高消费群”的女生有10人,完成下列22⨯列联表,并判断是否有97.5%的把握认为该校学生属于“高消费群”与“性别”有关?属于“高消费群” 不属于“高消费群” 合计男 女 合计(参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中)n a b c d =+++2()P K k0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.82817.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y ,(单位:千元)的数据资料,算出101010102111180,20184,720ii i i i i i i i xy x y x ========∑∑∑∑,,附:线性回归方程1221ˆˆˆˆˆˆ,,ni ii nii x y nxyybx a b ay bx xnx ==-=+==--∑∑,其中,x y 为样本平均值. (1)求家庭的月储蓄y 对月收入x 的线性回归方程ˆˆˆybx a =+ ; (2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.18.西尼罗河病毒(WNV )是一种脑炎病毒,WNV 通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV 脑炎流行.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV 的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x (千克)和利巴韦林含片产量y (百盒)的统计数据如下:由相关系数可以反映两个变量相关性的强弱,,认为变量相关性很强;||[0.3,0.75]r ∈,认为变量相关性一般;||[0,0.25]r ∈,认为变量相关性较弱.(1)计算相关系数r ,并判断变量x 、y 相关性强弱;(2)根据上表中的数据,建立y 关于x 的线性回归方程ˆˆˆybx a =+;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林? 25.69≈.参考公式:相关系数()()niix x y y r --=∑ˆˆˆybx a =+中,()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-. 19.某中学研究性学习小组为了考察高中学生的作文水平与爱看课外书的关系,在本校高三年级随机调查了50名学生.调查结果表明,在爱看课外书的24人中有18人作文水平好,另6人作文水平一般;在不爱看课外书的26人中有7人作文水平好,另19人作文水平一般.(1)试根据以上数据完成以下2×2列联表,并运用独立性检验思想,指出有多大把握认为中学生的作文水平与爱看课外书有关系? 高中学生的作文水平与爱看课外书的2×2列联表爱看课外书 不爱看课外书 总计作文水平好 作文水平一般 总计(2)将其中某4名爱看课外书且作文水平好的学生分别编号为1、2、3、4,某4名爱看课外书且作文水平一般的学生也分别编号为1、2、3、4,从这两组学生中各任选1人进行学习交流,求被选取的两名学生的编号之和为2的倍数或3的倍数的概率.参考公22()()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++·参考数据:()20P k k ≥0.10 0.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.82820.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)网箱产量不低于40kg 为“理想网箱”,填写下面列联表,并根据列联表判断是否有99.9%的把握认为“理想网箱”的数目与养殖方法有关:箱产量40kg <箱产量40kg ≥合计旧养殖法 新养殖法(2)已知旧养殖法100个网箱需要成本50000元,新养殖法100个网箱需要增加成本15750元,该水产品的市场价格为x 元/()15kg x ≥,根据箱产量的频率分布直方图(说明:同一组中的数据用该组区间的中间值作代表),采用哪种养殖法,请给养殖户一个较好的建议,并说明理由. 附参考公式及参考数据:()()()()()20n ad bc k a b c d a c b d -=++++21.调查某桑场采桑员和辅助工桑毛虫皮炎发病情况结果如下表:利用22⨯列联表的独立性检验估计,“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系会犯错误的概率是多少?随机量变22()()()()()n ad bc K a b c d a c b d -=++++ (其中n a b c d =+++) 临界值表22.某种产品的广告费支出x 与销售额y (单位:万元)之间有对应数据:(1)求回归直线方程;(2)试预测广告费支出为10万元时,销售额多大?线性回归方程的系数公式为()()()1122211nni iiii i nniii i x y nx y x x y y b xnxx x ====---==--∑∑∑∑,a y bx =-.23.我市今年参加高考的考生是首次取消文理科后的新高考考生,新高考实行“321++”,成绩由语文、数学、外语统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在[)15,45称为中青年,年龄在[)45,75称为中老年),并把调查结果制成下表:(1)请根据上表完成下面22⨯列联表,并判断是否有95%的把握认为对新高考的了解与年龄(中青年、中老年)有关?附:()()()()()22n ad bc K a b c d a c b d -=++++. (2)现采用分层抽样的方法从中老年人中抽取8人,再从这8人中随机抽取2人进行深入调查,求事件A :“恰有一人年龄在[)45,55”发生的概率.24.为了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为35.(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.下面的临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a cb d -=++++,其中n a bcd =+++)25.某食品店为了了解气温对销售量的影响,随机记录了该店1月份中5天的日销售量y (单位:千克)与该地当日最低气温x (单位:°C )的数据,如下表:(1)求出y 与x 的回归方程y =b x +a ;(2)判断y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6°C ,请用所求回归方程预测该店当日的营业额.附:回归方程y =b x +a ;中,b =()1221()==--∑∑ni ii nii x y nxyxn x ,a =y ﹣bx26.某市实施二手房新政一年多以来,为了了解新政对居民的影响,房屋管理部门调查了2018年6月至2019年6月期间购买二手房情况,首先随机抽取了其中的400名购房者,并对其购房面积m (单位:平方米,60130m ≤≤)讲行了一次统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年6月至2019年6月期间当月在售二手房的均价y (单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年6月至2019年6月)(1)试估计该市市民的平均购房面积m (同一组中的数据用该组区间的中点值为代表);(2)从该市2018年6月至2019年6月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X ,求X 的分布列与数学期望;(3)根据散点图选择ˆˆya x =+ˆˆˆln y c d x =+两个模型讲行拟合,经过数据处理得到两个回归方程,分别为ˆ0.93690.0285yx =+ˆ0.95540.0306ln y x =+,并得到一些统计量的值,如表所示:ˆ0.93690.0285yx =+ ˆ0.95540.0306ln yx =+ ()()1niii x x y y =--∑0.0054590.005886()()2211nni i i i x x y y ==--∑∑ 0.006050请利用相关系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年8月份的二手房购房均价(精确到0.001).参考数据:ln 20.69≈,ln3 1.10≈,ln15 2.71≈3 1.73≈15 3.87≈,17 4.12≈参考公式:()()()()12211niii nni i i i x x y y r x x y y ===--=--∑∑∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】分别求出三种关系的观测值,比较后可得结论. 【详解】解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为123,,K K K , 由表中数据可得:()2111056025200.86330802585K ⨯⨯-⨯=≈⨯⨯⨯,()2211010702010 6.36630802090K ⨯⨯-⨯=≈⨯⨯⨯,()2311015301550 1.41030806545K ⨯⨯-⨯=≈⨯⨯⨯,因为2K 的值最大,所以说谎与性别关系最大. 故选:B. 【点睛】本题考查独立性检验的应用,考查理解能力和计算能力.2.C解析:C 【分析】根据用样本估计总体、线性回归方程、独立性检验的基本概念和基本性质,逐项判断,即可得到本题答案. 【详解】方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均减少5个单位,故②不正确;线性回归方程ˆy bx a =+必过样本中心点,故③正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,||r 越接近于1,相关程度越大,故④不正确;对于观察值2K 来说,2K 越大,“x 与y 有关系”的可信程度越大,故⑤正确. 故选:C 【点睛】本题主要考查用样本估计总体、线性回归方程、独立性检验的基本思想.3.B解析:B 【分析】根据所给的列联表,利用公式求出这组数据的观测值,把观测值同临界值进行比较,即可得到结果. 【详解】由列联表中的数据可得2K 的观测值,()22110205010307.486 6.63530805060K ⨯-⨯==≥⨯⨯⨯,根据参考数据:2 6.6350.01p K ≥=,∴有10.0199%-=的把握认为高血压与患心脏病有关,即有99%的把握认为高血压与患心脏病有关,故选B. 【点睛】本题考查独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.C解析:C 【解析】分析:首先对每个选项一一进行分析,需要明确独立性检验是检验两个分类变量是否有关系的一种统计方法,回归直线可能不过任何一个样本数据点,残差图中,残差点分布的带状区域的宽度越狭窄,其模拟精度越高,相关指数越大,拟合效果越好的结论,就可以正确选出结果.详解:对于A ,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A 错;对于B ,线性回归方程对应的直线y b x a ∧∧∧=+可能不过任何一个样本数据点,所以B 错误;对于C ,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C 正确;对于D ,回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果好,所以D 错误. 故选C.点睛:根据概率统计中变量间的相关关系,线性回归方程以及残差图与相关指数2R 的概念,对选项中的命题进行分析、判断正误即可.5.B解析:B 【分析】根据相关性的正负判断1r 和2r 的正负,根据两个模型中回归直线的拟合效果得出21R 和22R 的大小关系,将第一个模型中的样本数据中心点代入直线1l 的方程得出a 的值,由两回归直线的倾斜程度得出两回归直线的斜率大小关系. 【详解】由图可知两变量呈现正相关,故120,0r r >>,且12r r <,故2212R R <,故A 正确,B 不正确.又回归直线1:0.68ˆl y x a=+必经过样本中心点(3.5,2.5),所以2.50.68 3.5ˆ0.12a=-⨯=,C 正确. 回归直线2:0.68ˆl y bx=+必经过样本中心点(3,2),所以230.68ˆb =⨯+, 所以ˆ0.44b=,也可直接根据图象判断68ˆ00.b <<(比较两直线的倾斜程度),故D 正确.故选B . 【点睛】本题考查回归分析,考查回归直线的性质、相关系数、相关指数的特点,意在考查学生对这些知识点的理解,属于中等题.6.B解析:B 【分析】由回归直线恒过样本中心点,不一定经过每一个点,可判断①;由相关系数的绝对值趋近于1,相关性越强,可判断②;由方差的性质可判断③;由线性回归直线方程的特点可判断④;相关指数R 2的大小,可判断⑤;由的随机变量K 2的观测值k 的大小可判断⑥;残差平方和越小,模型的拟合效果越好,可判断⑦. 【详解】对于①,回归直线y b x a ∧∧∧=+恒过样本点的中心(x y ,),可以不过任一个样本点,故①错误;对于②,两个变量相关性越强,则相关系数r 的绝对值就越接近于1,故②错误; 对于③,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故③正确;对于④,在回归直线方程y ∧=2﹣0.5x 中,当解释变量x 每增加一个单位时, 预报变量y ∧平均减少0.5个单位,故④正确;对于⑤,在线性回归模型中,相关指数R 2表示解释变量x 对于预报变量y 的贡献率,R2越接近于1,表示回归效果越好,故⑤正确;对于⑥,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大,故⑥错误;对于⑦,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故⑦正确.其中正确个数为4.故选B.【点睛】本题考查命题的真假判断,主要是线性回归直线的特点和线性相关性的强弱、样本数据的特征值和模型的拟合度,考查判断能力,属于基础题.7.B解析:B【解析】分析:根据线性回归方程的几何体特征及残差,相关指数的概论,逐一分析四个选项的正误,可得结论.详解:①线性回归直线必过样本数据中心点(),x y,故①正确;②回归直线方程在散点图中可能不经过任意样本数据点,故②错误;r>时,则两个变量正相关,故③正确;③当相关性系数0④如果两个变量的相关性越强,则相关性系数r就越接近于1或1-,故④错误;⑤残差图中残差点所在的水平带状区域越窄,回归方程的预报精确度越高,故⑤错误;⑥甲、乙两个模型的2R分别约为0.88和0.80,则模型甲的拟合效果更好,故⑥错误,真命题的个数为2,故选B.点睛:本题以命题的真假判断为截体,考查了相关关系,回归分析、残差、相关指数等知识点,意在考查对基本概念掌握的熟练程度,难度不大,属于基础题.8.C解析:C【解析】分析:根据独立性检验的定义及思想,可得结论.详解:①常用等高条形图展示列联表数据的频率特征;正确;②独立性检验依据小概率原理;正确;③样本不同,独立性检验的结论可能有差异;正确;④对分类变量X与Y的随机变量2K的观测值k来说,k越大,X与Y有关系的把握程度就越大.故④错误.故选C.点睛:本题考查了独立性检验的原理,考查了推理能力,属于基础题.9.D解析:D【解析】分析:先根据列联表列方程组,解得a,b,c,d,e,f,再判断真假.详解:因为725,625,6,7,50,50a c b d a e b f c d e f +==+==+=+=+=+=, 所以18,19,50,24,26,2a b c d e f f e ==+===-= 选D.点睛:本题考查列联表有关概念,考查基本求解能力.10.A解析:A 【分析】求出,x y ,由线性回归方程必经过点(,x y )即得a ,代入8x =求解即可. 【详解】 由表格知,196x =, 6119.2ii y==∑3.2y ∴=,代入0.6y x a =+得:193.20.66a =⨯+, 1.3a ∴=,则回归方程为0.6 1.3y x =+, 当8x =时,0.68 1.3 6.1y =⨯+=, 故选:A . 【点睛】本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.11.B解析:B 【分析】由已知线性回归直线方程ˆ260yx =-+,可估计平均气温为60C 时该地的山高,即可得到答案. 【详解】线性回归直线方程为ˆ260yx =-+,当0x = 时ˆ60y =即年平均气温为0时该山高估计为60km ,故A 正确;当ˆ72y=时解得6x =-即山高为72km 处的年平均气温估计为6C -,故B 错误;该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关,故C 正确;由20-<,该地的山高y 与该山的年平均气温x 成负相关关系,故D 正确.故选B 【点睛】本题考查线性回归直线方程的应用,考查相关的意义,判断能力,属于基础题.12.B解析:B【分析】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关-,③错误;残差图中带状区域越窄,拟合度时,线性相关性越强,相关系数r越接近1越高,④错误;2R越接近1,模型拟合度越高,⑤正确;由此可得结果.【详解】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;②由最小二乘法可知,回归直线必过(),x y,②正确;-,③错误;③若两个随机变量为负相关,若线性相关性越强,相关系数r越接近1④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数2R越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确.可知正确的结论为:②⑤,共2个本题正确选项:B【点睛】本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.13.A解析:A【分析】D后,y与x的线性相关性加强,由相关系数r,相关指数2R 由散点图可知,去掉(3,10)及残差平方和与相关性的关系得出选项.【详解】∵从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,∴相关系数变大,相关指数变大,残差的平方和变小,故选A.【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.二、解答题14.(1)0.998;变量y 与x 的线性相关程度很强;(2)ˆ 4.3 4.1yx =+;29.9百亿元. 【分析】(1)直接将数据代入公式计算,即可得答案;(2)利用最小二乘法求得y 关于x 的线性回归方程为ˆ 4.3 4.1yx =+ ,再将6x =代入,即可得答案; 【详解】(1)由题意,根据表格中的数据, 可得:1(12345)35x =++++=,1(912172126)175y =++++=, 则1()()(13)(917)(53)(2617)43niii x x y y =--=--++--=∑,43.1=≈,所以()()430.99843.1niix x y y r --==≈∑ 所以变量y 与x 的线性相关程度很强. (2)由(1)可得3x =,17y =,1()()43niii x x y y =--=∑,又由2221222(13)(23)(3(3)(43)(53)1)0nii x x ==-+-+-+-+-=-∑,所以121()()43 4.30)ˆ1(niii ni i x x y y bx x ==--===-∑∑,则ˆˆ17 4.33 4.1a y bx=-=-⨯=, 可得y 关于x 的线性回归方程为ˆ 4.3 4.1y x =+ 令6x =,可得ˆ 4.36 4.129.9y=⨯+=, 即2020年该网站“双11”当天的交易额29.9百亿元. 【点睛】利用最小二乘法求回归直线方程,再利用方程进行预报值,准确计算是求解的关键.15.(1)0.998;变量y 与x 的线性相关程度很强;(2)ˆ 4.3 4.1yx =+;29.9百亿元. 【分析】(1)根据表中数据可得x 、y ,再计算出1()()niii x x y y =--∑和1()()niii x x y y =--∑,代入()()niix x y y r --=∑,得到数据与所给r 比较可得答案;(2)由(1)可得x ,y ,1()()niii x x y y =--∑,计算出21()ni i x x =-∑,代入121()()()ˆniii ni i x x y y bx x ==--=-∑∑和ˆˆay bx =-可得答案. 【详解】(1)由题意,根据表格中的数据, 可得:1(12345)35x =++++=,1(912172126)175y =++++=, 则1()()(13)(917)(53)(2617)43niii x x y y =--=--++--=∑,43.1=≈,所以()()430.99843.1niix x y y r --==≈∑, 所以变量y 与x 的线性相关程度很强. (2)由(1)可得3x =,17y =,1()()43niii x x y y =--=∑,又由2221222(13)(23)(3(3)(43)(53)1)0nii x x ==-+-+-+-+-=-∑,所以121()()43 4.30)ˆ1(niii ni i x x y y bx x ==--===-∑∑,则ˆˆ17 4.33 4.1a y bx=-=-⨯=, 可得y 关于x 的线性回归方程为ˆ 4.3 4.1y x =+, 令6x =,可得ˆ 4.36 4.129.9y=⨯+=, 即2020年该网站“双11”当天的交易额29.9百亿元. 【点睛】本题考查了变量的相关性以及回归直线方程的求解,回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果接近真实值,要求认真计算各个数值.。

上海上师初级中学选修三第三单元《成对数据的统计分析》测试卷(包含答案解析)

上海上师初级中学选修三第三单元《成对数据的统计分析》测试卷(包含答案解析)

一、选择题1.某车间加工零件的数量x 与加工时间y 的统计数据如表:该车间的负责人作出散点图,发现x ,y 是线性相关的,并求出y 关于x 的线性回归方程23517=+y bx (其中b 是常数),据此回归模型可以预测,加工20个零件所需要的加工时间约为( ) A .45分钟 B .46分钟 C .47分钟 D .48分钟 2.假设2个分类变量X 和Y 的2×2列联表如下:对于同一样本,以下数据能说明X 和Y 有关系的可能性最大的一组是( ) A .a =40,c =20 B .a =45,c =15C .a =35,c =25D .a =30,c =303.某公司在2014~2018年的收入与支出情况如下表所示:根据表中数据可得回归直线方程为0.7y x a =+,依此估计如果2019年该公司收入为8亿元时的支出为( ) A .4.502亿元 B .4.404亿元 C .4.358亿元D .4.856亿元4.下列命题中正确的个数( )①“0x ∀>,2sin x x >”的否定是“00x ∃≤,002sin x x ≤”;②用相关指数2R 可以刻画回归的拟合效果,2R 值越小说明模型的拟合效果越好;③命题“若0a b >>,则330a b >>”的逆命题为真命题;④若22(1)mx m x -+30m ++≥的解集为R ,则m 1≥.A .0B .1C .2D .35.有一散点图如图所示,在5个()x y ,数据中去掉D (3,10)后,下列说法正确的是( )A .残差平方和变小B .方差变大C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱6.某商品的销售量y (件)与销售价格x (元/件)存在线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为ˆy=-5x +150,则下列结论正确的是( )A .y 与x 具有正的线性相关关系B .若r 表示y 与x 之间的线性相关系数,则r =-5C .当销售价格为10元时,销售量为100件D .当销售价格为10元时,销售量为100件左右7.已知具有线性相关的两个变量,x y 之间的一组数据如下表所示:x0 1 2 3 4 y 2.24.34.54.86.7若,x y 满足回归方程 1.5ˆˆyx a =+,则以下为真命题的是( ) A .x 每增加1个单位长度,则y 一定增加1.5个单位长度 B .x 每增加1个单位长度,y 就减少1.5个单位长度 C .所有样本点的中心为(1,4.5) D .当8x =时,y 的预测值为13.5 8.下列关于独立性检验的叙述:①常用等高条形图展示列联表数据的频率特征; ②独立性检验依据小概率原理;③样本不同,独立性检验的结论可能有差异;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,X 与Y 有关系的把握程度就越大.其中正确的个数为( ) A .1B .2C .3D .49.下列说法正确的是( )A .若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥B .已知相关变量(),x y 满足回归方程24y x =-,若变量x 增加一个单位,则y 平均增加4个单位C .命题“若圆()()22:11C x m y m -++-=与两坐标轴都有公共点,则实数[]0,1m ∈”为真命题D .已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=10.下列说法中正确的是( )A .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1B .设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位 C .把某中学的高三年级560名学生编号:1到560,再从编号为1到10的10名学生中随机抽取1名学生,其编号为a ,然后抽取编号为10a +,20a +,30a +,…的学生,这样的抽样方法是分层抽样D .若一组数据0,a ,3,4的平均数是2,则该组数据的方差是5211.已知具有线性相关的五个样本点()10,0A ,()22,2A ,()33,2A ,()44,2A ,()56,4A ,用最小二乘法得到回归直线方程1l :y bx a =+,过点1A ,2A 的直线方程2l :y mx n =+,那么下列4个命题中,①m b >,a n >;②直线1l 过点3A ;③()()552211iiiii i y bx a y mx n ==--≥--∑∑;④5511iiiii i y bx a y mx n ==--≥--∑∑,正确命题的个数有( ) A .1个B .2个C .3个D .4个12.下列说法中错误的是( )A .先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +的学生,这样的抽样方法是系统抽样法.B .正态分布()1,9N 在区间()1,0-和()2,3上取值的概率相等C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .若一组数据123a 、、、的平均数是2,则这组数据的众数和中位数都是213.设两个变量x 和y 之间具有线性相关关系,它们的相关系数为r ,y 关于x 的回归直线方程为y kx b =+,则( )A .k 与r 的符号相同B .b 与r 的符号相同C .k 与r 的符号相反D .b 与r 的符号相反二、解答题14.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据.x6 8 10 12 y2356(1)请根据表中提供的数据,求出关于的线性回归方程ˆˆˆybx a =+; (2)预测记忆力为19的同学的判断力.(附参考公式:1221ˆni ii ni i x y nx ybx nx==-=-∑∑,ˆa y bx=-) 15.成都是全国闻名的旅游城市,有许多很有特色的旅游景区.某景区为了提升服务品质,对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,统计结果见下面的频率分布直方图:(1)估计该景区每天游客数的中位数和平均数;(2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统计出这5天的游客数(千人)分别为0.8、3.7、5.1、5.6、6.8,已知这5天的最高气温(℃)依次为8、18、22、24、28.(ⅰ)根据以上数据,求游客数y 关于当天最高气温x 的线性回归方程(系数保留一位小数);(ⅱ)根据(ⅰ)中的回归方程,估计该景区这100天中最高气温在20℃~26℃内的天数(保留整数).参考公式:由最小二乘法所得回归直线的方程是ˆˆˆybx a =+;其中,()()()1122211ˆn niii ii i nni ii i x x y y x y nx ybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 本题参考数据:()()5170iii x x y y =--=∑,()521232ii x x =-=∑.16.某学校共有1000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样随机抽取了100名学生进行调查,月消费金额分布在450~950之间.根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示:将月消费金额不低于750元的学生称为“高消费群”.(1)求a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的中点值作代表);(2)现采用分层抽样的方式从月消费金额落在[550,650),[750,850)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高消费群”的学生人数为随机变量X ,求X 的分布列及数学期望;(3)若样本中属于“高消费群”的女生有10人,完成下列22⨯列联表,并判断是否有97.5%的把握认为该校学生属于“高消费群”与“性别”有关?属于“高消费群” 不属于“高消费群” 合计男 女 合计(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中)n a b c d =+++2()P K k0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.82817.下表是某学生在4月份开始进人冲刺复习至高考前的5次大型联考数学成绩(分);(1)请画出上表数据的散点图;(2)①请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;②若在4月份开始进入冲刺复习前,该生的数学分数最好为116分,并以此作为初始分数,利用上述回归方程预测高考的数学成绩,并以预测高考成绩作为最终成绩,求该生4月份后复习提高率.(复习提高率=100%⨯净提高分卷面总分,分数取整数)附:回归直线的斜率和截距的最小二乘估计公式分别为1221ˆni ii nii x y nxybxnx ==-=-∑∑,a y bx =-.18.某中学研究性学习小组为了考察高中学生的作文水平与爱看课外书的关系,在本校高三年级随机调查了50名学生.调查结果表明,在爱看课外书的24人中有18人作文水平好,另6人作文水平一般;在不爱看课外书的26人中有7人作文水平好,另19人作文水平一般.(1)试根据以上数据完成以下2×2列联表,并运用独立性检验思想,指出有多大把握认为中学生的作文水平与爱看课外书有关系? 高中学生的作文水平与爱看课外书的2×2列联表爱看课外书 不爱看课外书 总计作文水平好 作文水平一般 总计(2)将其中某4名爱看课外书且作文水平好的学生分别编号为1、2、3、4,某4名爱看课外书且作文水平一般的学生也分别编号为1、2、3、4,从这两组学生中各任选1人进行学习交流,求被选取的两名学生的编号之和为2的倍数或3的倍数的概率.参考公22()()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++·参考数据:()20P k k ≥0.10 0.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.82819.某网红直播平台为确定下一季度的广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如下表: 月份1 2 3 4 5 6 广告投入量/万元 2 4 6 8 10 12 收益/万元14.2120.3131.831.1837.8344.67用两种模型①,②y ae =分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:xy61i ii x y =∑612ii x=∑7301464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由. (2)残差绝对值大于2的数据被认为是异常数据,需要剔除: (i)剔除的异常数据是哪一组?(ii)剔除异常数据后,求出(1)中所选模型的回归方程; (iii)广告投入量18x =时,(ii)中所得模型收益的预报值是多少?附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计分别为:()()()1122211ˆn niii ii i nni ii i x x y y x y nxybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 20.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:(2)用最小二乘法计算利润额y 对销售额x 的线性回归方程; (3)当销售额为4千万元时,估计利润额的大小.(参考公式:1221ˆni ii nii x y nxybxnx ==-=-∑∑,ˆˆay bx =-) 21.某中学为研究学生的身体素质与体育锻炼时间的关系,对该校100名高三学生平均每天体育锻炼时间进行调查,其中女生为55人,如表:(平均每天锻炼的时间单位:分钟)将学生日均体育锻炼时间在[40,60]的学生评价为“锻炼达标”.(1)若女生锻炼达标人数为10人,通过计算判断,是否能在犯错误的概率不超过0.025的前提下认为“锻炼达标”与性别有关?(2)在(1)的条件下“锻炼达标”的学生中,按男女用分层抽样方法抽出15人,进行体育锻炼体会交流,求这15人中,男生、女生各有多少人? 参考公式:22()()()()()()a b c d ad bc K a b c d a c b d +++-=++++临界值表:22.某手机企业为确定下一年度投入某种产品的研发费用,统计了近10年投入的年研发费用x 千万元与年销售量y 千万件的数据,得到散点图1,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关统计量的值如图2:(1)利用散点图判断y bx a =+和dy c x =⋅()0,0c d >>哪一个更适合作为年研发费用x 和年销售量y 的回归类型(不必说明理由),并根据数据,求出y 与x 的回归方程;(2)已知企业年利润z 千万元与,x y 的关系式为27z y x e=-(其中e 为自然对数的底数),根据(1)的结果,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?23.为调查喜欢冲浪运动与性别是否相关,随机对100名大学生进行调查并制成下表:喜欢冲浪运动人数 不喜欢冲浪运动人数 总计女生人数 ab+a b男生人数 cd+c d总计a c +b d + +++a bc d(1)当20a =,50c =,10d =时,判断能否有99.9%的把握认为喜欢冲浪运动与性别有关?(2)当50c =,10d =时,已知a 的值越大则2K 的值越小,若有99.9%的把握认为喜欢冲浪运动与性别有关,求a 的最大值.参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥ 0.100 0.050 0.010 0.001 0k2.7063.8416.63510.828225741167129⨯>⨯⨯,225681067228⨯<⨯⨯.24.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.2()p K k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.828选物理 选历史总计男生 女生 总计25.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命.为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人. (1)完成下面的2×2列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X ,若每次抽检的结果都相互独立,求X 的分布列和数学期望E (X ).参考公式与数据:()()()()22()n ad bc K a b c d a c b d -=++++,其中n =a +b +c +d .26.据不完全统计,某厂的生产原料耗费x (单位:百万元)与销售额y (单位:百万元)如下:x2 4 6 8 y 30405070变量x 、y 为线性相关关系. (1)求线性回归方程必过的点; (2)求线性回归方程;(3)若实际销售额要求不少于54百万元,则原材料耗费至少要多少百万元.1122211()()()ˆnniii ii i nni i i i x x y y x y nxybx x x nx ====---==--∑∑∑∑,ˆˆay bx =-【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】求出样本数据的中心坐标(,)x y ,代入回归直线方程,求出ˆb,得到回归直线方程,然后求解加工20个零件所需要的加工时间,得到答案. 【详解】由题意,根据表中的数据,可得1(911141516)135x =++++=, 1(3032364042)365y =++++=,即样本中心点为(13,36),将样本中心点为(13,36)代入回归方程,可得235361317b =⨯+,解得2917b =, 所以回归方程为292351717y x =+,当20x 时,292358152047.9848171717y =⨯+=≈≈(分钟). 故选:D. 【点睛】本题主要考查了线性回归方程的求法及应用,其中解答中熟记回归直线方程经过样本中心点是解答的关键,着重考查推理与运算能力.2.B解析:B 【分析】根据题意b ,d 一定时,a ,c 相差越大,10a a +与30cc +相差就越大,2K 的观测值k 就越大,由此能说明X 和Y 有关系的可能性越大. 【详解】2K 的观测值()()()()()2n ad bc a b a b k n a b c d a c b d a c b d a b c d -⎛⎫⎛⎫==-- ⎪⎪++++++++⎝⎭⎝⎭,根据2×2列联表和独立性检验的相关知识,当b ,d 一定时,a ,c 相差越大,10aa +与30cc +相差就越大,2K 就越大,即X 和Y 有关系的可能性越大,选项B 中30a c -=与其它选项相比相差最大. 故选:B【点睛】本题主要考查独立性检验的相关知识,解题的关键是准确理解独立性检验.3.D解析:D 【分析】先求 3.92x =,2y =,根据0.7a y x =-,求解0.744a =-,将8x =代入回归直线方程为0.7y x a =+,求解即可. 【详解】 2.2 2.4 3.8 5.2 6.03.925x ++++==,0.2 1.5 2.0 2.5 3.825y ++++==0.720.7 3.920.744a y x =-=-⨯=-即0.70.744y x =-令8x =,则0.780.744 4.856y =⨯-= 故选:D 【点睛】本题考查回归分析,样本中心点(),x y 满足回归直线方程,是解决本题的关键.属于中档题.解析:C 【分析】根据含量词命题的否定可知①错误;根据相关指数的特点可知2R 越接近0,模型拟合度越低,可知②错误;根据四种命题的关系首先得到逆命题,利用不等式性质可知③正确;分别在0m =和0m ≠的情况下,根据解集为R 确定不等关系,从而解得m 范围,可知④正确. 【详解】①根据全称量词的否定可知“0x ∀>,2sin x x >”的否定是“00x ∃>,002sin x x ≤”,则①错误;②相关指数2R 越接近1,模型拟合度越高,即拟合效果越好;2R 越接近0,模型拟合度越低,即拟合效果越差,则②错误;③若“0a b >>0>>”的逆命题为:若“0>>,则0a b >>”,根据不等式性质可知其为真命题,则③正确;④当0m =时,()2213230mx m x m x -+++=-+≥,此时解集不为R ,不合题意;当0m ≠时,若()22130mx m x m -+++≥解集为R ,只需:()()241430m m m m >⎧⎪⎨+-+≤⎪⎩解得:m 1≥,则④正确.∴正确的命题为:③④本题正确选项:C 【点睛】本题考查命题真假性的判断,涉及到含量词命题的否定、四种命题的关系及真假性的判断、相关指数的应用、根据一元二次不等式解集为R 求解参数范围的知识.5.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,且为正相关, 所以r 变大,2R 变大,残差平方和变小, 故选A. 【点睛】该题考查的是有关线性相关性强弱的问题,涉及到的知识点有相关系数,相关指数,以及残差平方和与相关性的关系,属于简单题目.解析:D 【分析】对选项逐个分析,A 是负相关,B 中1r ≤,C 和D 中销售量为100件左右. 【详解】由回归方程ˆy=-5x +150可知y 与x 具有负的线性相关关系,故A 错误;y 与x 之间的线性相关系数1r ≤,故B 错误;当销售价格为10元时,销售量为510150100-⨯+=件左右,故C 错误,D 正确. 【点睛】本题考查了线性回归方程知识,考查了线性相关系数,属于基础题.7.D解析:D 【分析】利用回归直线过样本点中心可求回归方程,根据该方程可得正确的选项. 【详解】由 1.5y x a =+,得x 每增一个单位长度,y 不一定增加1.5,而是大约增加1.5个单位长度,故选项,A B 错误; 由已知表格中的数据,可知0123425x ++++==,2.2 4.3 4.5 4.8 6.74.55y ++++==,回归直线必过样本的中心点()2,4.5,故C 错误; 又4.5 1.52 1.5ˆˆaa =⨯+⇒=,∴回归方程为 1.5 1.5y x =+, 当8x =时,y 的预测值为1.58 1.513.5⨯+=,故D 正确, 故选:D. 【点睛】本题考查线性回归方程的性质及应用,注意回归直线过(),x y ,本题属于基础题.8.C解析:C 【解析】分析:根据独立性检验的定义及思想,可得结论.详解:①常用等高条形图展示列联表数据的频率特征;正确; ②独立性检验依据小概率原理;正确;③样本不同,独立性检验的结论可能有差异;正确;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越大,X 与Y 有关系的把握程度就越大.故④错误. 故选C.点睛:本题考查了独立性检验的原理,考查了推理能力,属于基础题.9.C解析:C 【解析】若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∈,210x x -+≥;已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均减少4个单位;命题“若圆()()22:11C x m y m -++-=与两坐标轴都有公共点,则101,11m m m ⎧≤⎪∴≤≤⎨-≤⎪⎩为真命题; 已知随机变量()22X N ,σ~,若()0.32P X a <=,则()40.32P X a >-=;所以选C.10.D解析:D 【分析】线性相关性越强,r 的值越接近于1;ˆ35yx =-,斜率的意义;系统抽样和分层抽样的区别;方差的计算. 【详解】对于A ,若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,故A 错误;对于B ,设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减少5个单位,故B 错误;对于C ,抽样方法是系统抽样,故C 错误; 对于C ,0,a ,3,4的平均数是2,可得1a =, 方差222215[(02)(12)(32)(42)]42-+-+-+-= ,故D 正确. 故选:D 【点睛】本题考查了线性相关系数,回归方程,系统抽样和分层抽样,方差等基本知识;考查了理解辨析、数据分析能力和数学运算技能,属于容易题.11.B解析:B 【分析】先求出1l 为0.60.2y x =+,直线2l 的方程为y x =,再逐一分析判断每一个命题真假得解. 【详解】由题意可得:0234635x ++++==,0222425y ++++==,则()()()1210.6niii nii x x y y b x x ==--==-∑∑,0.2a y bx =-=,所以线性回归方程1l 为0.60.2y x =+, 直线2l 的方程为:y x =,故0.6b =,0.2a =,1m =,0n =,说法①正确;30.60.22⨯+=,则直线1l 过3A ,说法②正确;()5210.8i i i y bx a =--=∑,()5219i i n y mx n =--=∑,说法③错误;511.6iii y bx a =--=∑,515iii y mx n =--=∑,说法④错误;综上可得正确命题的个数有2个. 故选:B. 【点睛】本题主要考查最小二乘法求线性回归方程,考查和式的计算,意在考查学生对这些知识的理解掌握水平.12.C解析:C 【分析】对于A ,根据系统抽样的定义可判断;对于B ,根据正态分布的对称性可判断在两个区间上的概率;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,可进行判断;对于D ,根据一组数据123a 、、、的平均数是2,得2a =,求得该组数据的众数和中位数,可判断D. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A 正确;对于B ,正态分布()19N ,的曲线关于1x =对称,区间()10-,和()23,与对称轴距离相等,所以在两个区间上的概率相等,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,C 错误; 对于D ,一组数据123a 、、、的平均数是2,2a ∴=;所以该组数据的众数和中位数均为2,D 正确..【点睛】本小题考查系统抽样,线性回归,线性相关,平均数,中位数与众数等基础知识,意在考查学生分析问题,及解决问题的能力和运算求解能力.13.A解析:A 【分析】根据相关系数知相关系数的性质:r 1≤,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.r 为正,表示正相关,回归直线方程上升,选出正确结果. 【详解】相关系数r 为正,表示正相关,回归直线方程上升, r 为负,表示负相关,回归直线方程下降,k ∴与r 的符号相同. 故选A . 【点睛】本题考查用相关系数来衡量两个变量之间相关关系的方法,当相关系数为正时,表示两个变量正相关,当相关系数大于0.75时,表示两个变量有很强的线性相关关系.二、解答题14.(1)ˆ0.7 2.3yx =-;(2)记忆力为19的同学的判断力约为11. 【分析】(1)根据题意及公式1221ˆni ii nii x y nx ybxnx==-=-∑∑算出ˆb,根据公式ˆa y bx =-算出a 即可得出答案;(2)将19x =代入(1)中的回归方程计算即可. 【详解】 解:(1)由题意416283105126158i ii x y==⨯+⨯+⨯+⨯=∑,68101294x +++==,235644y +++==,4222221681012344i i x ==+++=∑,所以2158494140.73444920ˆb-⨯⨯===-⨯,ˆˆ40.79 2.3a y bx =-=-⨯=-, 故线性回归方程为ˆ0.7 2.3y x =- (2)当19x =时,解得ˆ11y= 所以由回归直线方程预测,记忆力为19的同学的判断力约为11. 【点睛】线性回归分析问题的类型及解题方法: (1)求线性回归方程:公式法:利用公式,求出回归系数ˆ,ba . 待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数ˆb. 15.(1)3750人,3820人;(2)(ⅰ)ˆ0.3 1.6yx =-;(ⅱ)26天. 【分析】(1)直接利用频率分布直方图求中位数和平均数;(2)(ⅰ)利用最小二乘法求y 关于当天最高气温x 的线性回归方程;(ⅱ)先求出最高气温在20℃~26℃内的频率,再求估计该景区这100天中最高气温在20℃~26℃内的天数.. 【详解】(1)左边三个矩形的面积之和为0.32,左边四个矩形的面积之和大于0.5,故中位数在第四个矩形中, 所以中位数为:0.1831 3.750.24+⨯=. 平均数为:0.50.07 1.50.09 2.50.16 3.50.24 4.50.18⨯+⨯+⨯+⨯+⨯5.50.146.50.077.50.05 3.82+⨯+⨯+⨯=,所以,该景区这一百天中每天游客数的中位数约为3750人,平均数约为3820人. (2)(ⅰ)20x =, 4.4y =,70ˆ0.3232b =≈,ˆˆ 4.40.320 1.6a y bx =-=-⨯=-, ˆ0.3 1.6yx ∴=-. (ⅱ)当最高气温在20℃~26℃内时,当20x时,ˆ0.320 1.6=4.4y=⨯-; 当26x =时,ˆ0.326 1.6=6.2y=⨯-; 根据ˆ0.3 1.6yx =-得游客数在4.4~6.2内, 直方图中这个范围内方块的面积为:()()5 4.40.180.14 6.260.070.262-⨯++-⨯=, 天数为0.26210026⨯≈,所以,这100天中最高气温在20℃~26℃内的天数约为26天. 【点睛】关键点睛:解答本题的关键是通过频率分布直方图求出最高气温在20℃~26℃内的频率,再求频数得解.16.(1)0.0035a =,平均数为670元;(2)分布列答案见解析,数学期望:910;(3)22⨯列联表答案见解析,有97.5%的把握认为该校学生属于“高消费群”与性别有关. 【分析】(1)由频率分布直方图中频率和为1可求得a ,每组数据用该组区间的中点值乘以频率相加得均值;(2)由频率分布直方图知从[550,650)中抽取7人,从[750,850)中抽取3人,随机变量X 的所有可能取值有0,1,2,3,求出各概率得分布列,然后由期望公式得期望; (3)样本中男生40人,女生60人属于“高消费群”的25人,其中女生10人,由频率分布直方图求出高消费群人数,可得高消费群中男生人数,从而可填写列联表,并计算出2K 后可得结论. 【详解】(1)由题意知100(0.00150.00250.00150.001)1a ⨯++++=,解得0.0035a =, 样本平均数为5000.156000.357000.258000.159000.10670x =⨯+⨯+⨯+⨯+⨯=元. (2)由题意,从[550,650)中抽取7人,从[750,850)中抽取3人, 随机变量X 的所有可能取值有0,1,2,3.337310()(0k kC C P X k k C -===,1,2,3)所以随机变量X 的分布列为:随机变量X 的数学期望()2312012012010E X =+⨯+⨯=. (3)由题可知,样本中男生40人,女生60人,属于“高消费群”的25人,其中女生10人;得出以下22⨯列联表:2()100(10251550)505.024()()()()257540609n ad bc K a b c d a c b d -⨯-⨯===≈++++⨯⨯⨯,所以有97.5%的把握认为该校学生属于“高消费群”与性别有关. 【点睛】本题考查频率分布直方图,考查分层抽样,随机变量的概率分布列和数学期望,考查独立性检验.旨在考查学生的数据处理能力,运算求解能力. 17.(1)(2) ① 5.7111.9y x =+②20% 【分析】(1)把所给的5对数据写成对应的点的坐标,在坐标系中描出来,得到散点图;(2)根据所给的这组数据求出利用最小二乘法所需要的几个数据,代入求系数ˆb的公式,求得结果,再把样本中心点代入,求出ˆa的值,得到线性回归方程;根据上一问所求的线性回归方程,把6x =代入线性回归方程146y ≈ (分),净提高分为14611630-= (分),即可估计该生4月份后复习提高率. 【详解】 (1)散点图如图:(2)①由题得, 1234535x ++++==,y =1171271251341425++++ 129=,511992i i i x y ==∑ 52155i i x ==∑,2255345x =⨯=,553xy =⨯⨯ 1291935=, 所以199219355545ˆb-=- 575.710==,129 5.7311ˆ1.9a =-⨯=,故y 关于x 的线性回归方程为 5.7111.9y x =+. ②由上述回归方程可得高考应该是第六次考试,故6x =, 则 5.76111.9y =⨯+ 146.1146=≈ (分), 故净提高分为14611630-= (分), 所以该生的复习提高率为30100%20%150⨯=. 【点睛】求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,a b;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.18.(1)列联表见解析;有99.9%的把握认为中学生的作文水平与爱看课外书有关系;(2)58. 【分析】(1)先根据题意完成列联表,再计算2K ,进而根据独立性检验的思想即可得答案. (2)先写出所有的基本事件总数,再写出两名学生的编号之和为2的倍数或3的倍数的基本事件,进而根据古典概型计算即可得答案. 【详解】解:(1)根据题意得列联表如下:爱看课外书 不爱看课外书 总计 作文水平好18725所以()2250181967()15011.5310.828()()()()2525242613n ad bc K a b c d a c b d ⨯⨯-⨯-===≈>++++⨯⨯⨯由表知,()210.8280.001P K ≥≈所以有99.9%的把握认为中学生的作文水平与爱看课外书有关系. (2)设两名学生的编号之和为2的倍数或3的倍数的事件为A , 根据题意得,选取的学生编号的所有可能有:()()()()1,1,1,2,1,3,1,4,()()()()2,1,2,2,2,3,2,4,()()()()3,1,3,2,3,3,3,4,()()()()4,1,4,2,4,3,4,4,共16种可能结果,其中两名学生的编号之和为2的倍数或3的倍数的有:()()()1,1,1,2,1,3,()()()2,1,2,2,2,4,()()3,1,3,3,()()4,2,4,4共10种可能结果,故()105168P A ==, 【点睛】本题考查独立性检验的思想,古典概型,考查运算能力,是中档题.19.(1)模型①,理由见解析;(2)(i)是3月份的数据; (ii)ˆ38.04yx =+; (iii)62.04万元. 【分析】(1)根据残差图中体现出的残差点分布,结合其均匀程度以及带状区域的宽窄,即可分析比较;(2)(i)根据题意,结合残差图,即可求得3月份的数据异常,应该剔除;(ii)根据已知数据和3月份的数据,结合ˆb和ˆa 的计算公式,即可求得结果; (iii)令18x =,代入(ii)中所求回归直线方程,即可求得结果. 【详解】(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中, 且模型①的带状区域比模型②的带状区域窄, 所以模型①的拟合精度高,回归方程的预报精度高. (2)(i)剔除异常数据是3月份的数据,即()6,31.8; (ii)剔除异常数据,即3月份的数据后,得()17667.25x =⨯⨯-=,()130631.829.645y =⨯⨯-=511464.24631.81273.44i ii x y==-⨯=∑,。

上海市西初级中学选修三第三单元《成对数据的统计分析》检测题(答案解析)

上海市西初级中学选修三第三单元《成对数据的统计分析》检测题(答案解析)

一、选择题1.一组数据如下表所示:已知变量y 关于x 的回归方程为+0.5ˆbx ye =,若5x =,则预测y 的值可能为( ) A .5eB .112eC .132eD .7e2.已知具有线性相关的变量x ,y ,设其样本点为(),(1,2,,6)i i i P x y i =,回归直线方程为2y x a =+,若126(12,18)OP OP OP +++=(O 为坐标原点),则a =( )A .-1B .-6C .1D .63.某车间加工零件的数量x 与加工时间y 的统计数据如表:该车间的负责人作出散点图,发现x ,y 是线性相关的,并求出y 关于x 的线性回归方程23517=+y bx (其中b 是常数),据此回归模型可以预测,加工20个零件所需要的加工时间约为( ) A .45分钟 B .46分钟 C .47分钟 D .48分钟 4.下列说法:①对于独立性检验,2χ的值越大,说明两事件相关程度越大;②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y a bx =+中,2b =,1x =,3y =,则1a =;④通过回归直线y bx a =+及回归系数b ,可以精确反映变量的取值和变化趋势,其中正确的个数是( ) A .1B .2C .3D .45.下列命题不正确的是( )A .研究两个变量相关关系时,相关系数r 为负数,说明两个变量线性负相关B .研究两个变量相关关系时,相关指数R 2越大,说明回归方程拟合效果越好.C .命题“∀x ∈R ,cos x ≤1”的否定命题为“∃x 0∈R ,cos x 0>1”D .实数a ,b ,a >b 成立的一个充分不必要条件是a 3>b 3 6.已知变量x 与变量y 之间具有相关关系,并测得如下一组数据:则变量x 与y 之间的线性回归直线方程可能为A .ˆy =0.7x –2.3B .ˆy =–0.7x+10.3C .ˆy =–10.3x+0.7D .ˆy=10.3x –0.7 7.为了研究某班学生的数学成绩x (分)和物理成绩y (分)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101750ii x==∑,101800i i y ==∑,ˆ 1.2b=,该班某学生的物理成绩为86,据此估计其数学成绩约为( ) A .81B .80C .93D .948.研究表明某地的山高()y km 与该山的年平均气温()xC 具有相关关系,根据所采集的数据得到线性回归方程ˆ260y x =-+,则下列说法错误..的是( ) A .年平均气温为0时该山高估计为60km B .该山高为72km 处的年平均气温估计为60CC .该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关D .该地的山高y 与该山的年平均气温x 成负相关关系 9.已知x ,y 之间的一组数据:则与的线性回归方程必过点( )A .(20,16)B .(16,20)C .(4,5)D .(5,4)10.以下四个命题中: ①函数关系是一种确定性关系;②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法; ③独立性检验中的统计假设就是假设相关事件A 、B 相互独立; ④某项测量结果ξ服从正态分布()21,N σ,且(5)0.81P ξ≤=,则(31)0.31P ξ-≤<=.以上命题中,真命题的个数为( ) A .1个B .2个C .3个D .4个11.下列说法中正确的是()A .若数列{}n a 为常数列,则{}n a 既是等差数列也是等比数列;B .若函数()f x 为奇函数,则(0)0f =;C .在ABC ∆中,A B >是sin sin A B >的充要条件;D .若两个变量,x y 的相关系数为r ,则r 越大,x 与y 之间的相关性越强. 12.下列说法中错误的是( )A .先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +的学生,这样的抽样方法是系统抽样法.B .正态分布()1,9N 在区间()1,0-和()2,3上取值的概率相等C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .若一组数据123a 、、、的平均数是2,则这组数据的众数和中位数都是2 13.下面给出四种说法:①设a 、b 、c 分别表示数据15、17、14、10、15、17、17、16、14、12的平均数、中位数、众数,则a b c <<;②在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好;③绘制频率分布直方图时,各小长方形的面积等于相应各组的组距; ④设随机变量ξ服从正态分布2(4,2)N ,则142()P ξ>=. 其中不正确的是( ). A .①B .②C .③D .④二、解答题14.冬天的北方室外温度极低,若轻薄保暖的石墨烯发热膜能用在衣服上,可爱的医务工作者行动会更方便.石墨烯发热膜的制作:从石墨中分离出石墨烯,制成石墨烯发热膜.从石墨分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现有A 材料、B 材料供选择,研究人员对附着在A 、B 材料上再结晶各做了50次试验,得到如下等高条形图.(1)由上面等高条形图,填写22⨯列联表,判断是否有99%的把握认为试验成功与材料有关?(2)研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及UV 胶层;②石墨烯层;③表面封装层.每个环节生产合格的概率均为23,且各生产环节相互独立.已知生产1吨的石墨烯发热膜的固定成本为1万元,若生产不合格还需进行修复,且生产1吨石塑烯发热膜的每个环节修复费用均为1000元.如何定价,才能实现每生产1吨石墨烯发热膜获利可达1万元以上的目标?附:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.100 0.050 0.010 0.005 0.001 k2.7063.8416.6357.87910.82815.新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.日期代码x12345678累计确诊人数y .481631517197122为了分析该国累计感染人数的变化趋势,小王同学分别用两个模型:①2ˆy bx a=+,②ˆy dx c=+对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差ˆˆi i ie y y=-):经过计算得()()81728i iix x y y=--=∑,()82142iix x=-=∑,()()816868i iiz z y y=--=∑,()8213570iiz z=-=∑,其中2i iz x=,8118iiz z==∑.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()81821ˆi iiiix x y ybx x==--=-∑∑,ˆˆa y bx=-16.下表是某学生在4月份开始进人冲刺复习至高考前的5次大型联考数学成绩(分);(1)请画出上表数据的散点图;(2)①请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;②若在4月份开始进入冲刺复习前,该生的数学分数最好为116分,并以此作为初始分数,利用上述回归方程预测高考的数学成绩,并以预测高考成绩作为最终成绩,求该生4月份后复习提高率.(复习提高率=100%⨯净提高分卷面总分,分数取整数)附:回归直线的斜率和截距的最小二乘估计公式分别为1221ˆni ii nii x y nxybxnx ==-=-∑∑,a y bx =-.17.艾滋病是一种危害性极大的传染病,由感染艾滋病病毒(HIV 病毒)引起,它把人体免疫系统中最重要的CD 4T 淋巴细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表: 年份 2011 2012 2013 2014 2015 2016 2017 2018 年份代码x 12345678感染者人数(y 单位:万人)34.3 38.3 43.3 53.8 57.7 65.4 71.8 85()1请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;()2请用相关系数说明:能用线性回归模型拟合y 与x 的关系;()3建立y 关于x 的回归方程(系数精确到0.01),预测2019年我国艾滋病病毒感染人数.参考数据:42 6.48≈;81449.6ii y==∑,812319.5i i i x y ==∑,821()46.2ii y y =-=∑,参考公式:相关系数)12211()()()ni nniii i x x y y r x x y y ===--=--∑∑∑,回归方程y bx a =+中,b()121()()ni i i n i i x x y y x x ==--=-∑∑,a y bx =-.18.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)网箱产量不低于40kg 为“理想网箱”,填写下面列联表,并根据列联表判断是否有99.9%的把握认为“理想网箱”的数目与养殖方法有关:箱产量40kg <箱产量40kg ≥合计旧养殖法 新养殖法 合计(2)已知旧养殖法100个网箱需要成本50000元,新养殖法100个网箱需要增加成本15750元,该水产品的市场价格为x 元/()15kg x ≥,根据箱产量的频率分布直方图(说明:同一组中的数据用该组区间的中间值作代表),采用哪种养殖法,请给养殖户一个较好的建议,并说明理由. 附参考公式及参考数据:()20P K k ≥0.050 0.010 0.001()()()()()20n ad bc k a b c d a c b d -=++++19.某种产品的广告费用支出x 与销售额y 之间有如下的对应数据:(1)画出散点图; (2)求回归直线方程;(3)据此估计广告费用为10时,销售收入y 的值.用最小二乘法求线性回归方程系数公式 1221112()()()ni ii niniii nii i x x y y b x x y nxyxn x x--∧=-==-=-==----∑∑∑∑,ˆ=-a y bx .线性回归方程ˆˆˆy bx a =+.20.近期,某学校举行了一次体育知识竞赛,并对竞赛成绩进行分组:成绩不低于80分的学生为甲组,成绩低于80分的学生为乙组.为了分析竞赛成绩与性别是否有关,现随机抽取了60名学生的成绩进行分析,数据如下图所示的22⨯列联表.(1)将22⨯列联表补充完整,判断是否有90%的把握认为学生按成绩分组与性别有关? (2)如果用分层抽样的方法从甲组和乙组中抽取6人,再从这6人中随机抽取2人,求至少有1人在甲组的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.参考数据及公式:()2P K k≥0.1000.0500.0100.0050.001 k 2.706 3.841 6.6357.87910.82821.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费i x和年销售量i y(1,28=i)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w()821iix x=-∑()821iiw w=-∑()()81i iix x y y=--∑()()81i iiw w y y=--∑46.6563 6.8289.8 1.6 1.469108.8表中=iiw x,8118==∑i iw w(1)根据散点图判断,y a bx=+与y c d x=+哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?给出判断即可,不必说明理由(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为0.2z y x=-根据(2)的结果回答下列问题:①年宣传费49x=时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据()()()1122,,,,,,n nu v u v u v⋯,其回归线v uαβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆβ==∑--=∑-ni i ini iu u v vu u,ˆˆv uαβ=-.22. 2.5PM的值表示空气中某种颗粒物的浓度,通常用来代表空气的污染情况,这个值越高,空气污染越严重,下表是某城市开展“绿色出行,健康生活”活动,居民每天采用“绿色出行”的人数与 2.5PM值的一组数据:2.5PM 的值y9070 50 40 30 20 “绿色出行”的人数x (单位:万人)124689(1)已知“绿色出行”的人数x 和 2.5PM 值y 有线性相关性,求y 关于x 的线性回归方程;(计算结果保留两位小数)(2)若某日“绿色出行”的人数为10万人,请预测该市 2.5PM 的值.(计算结果保留一位小数) 参考公式:1221ˆˆ,ni ii nii x y nx yba y bxxnx ==-⋅==--∑∑ 23.某品牌汽车4S 店为对厂家研发的一种辅助产品进行合理定价,对该产品进行试销售,如图1.在试销售期间对100名顾客进行回访,由客户对该产品性能作出“满意”或“不满意”评价,如图2.(1)判断能否有99%的把握认为“客户购买产品对产品性能满意之间有关”? (2)请结合数据:()()6634580iii x x y y =--=∑,()()66175.5iii x x zz =--=-∑,()()663465.2iii y y zz =--=∑,()626776840i i y y=-=∑,求y 与x 的回归方程(精确到0.1)24.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料: 使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆybx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?25.通过市场调查,得到某产品的资金投入x (万元)与获得的利润y (万元)的数据,如下表所示:(1)画出数据对应的散点图(2)根据上表提供的数据,用最小二乘法求线性回归直线方程ˆˆˆybx a =+; (3)现投入资金10(万元),求估计获得的利润为多少万元.26.某品牌新款夏装即将上市,为了对新款夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据:(1)分别以三家连锁店的平均售价与平均销量为散点,如A 店对应的散点为(83,83),求出售价与销量的回归直线方程y bx a =+;(2)在大量投入市场后,销量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该新夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)附:121()()()niii ni i x x y y b x x ==--=-∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】令ln z y ,求得,x z 之间的数据对照表,结合样本中心点的坐标满足回归直线方程,即可求得b ;再令5x =,即可求得预测值y .【详解】将式子两边取对数,得到ln 0.5y bx =+,令ln zy ,得到0.5z bx =+,根据已知表格数据,得到,x z 的取值对照表如下:12342.54x +++==,1346 3.54z +++==, 利用回归直线过样本中心点,即可得3.5 2.50.5b =+, 求得 1.2b =,则 1.20.5z x =+, 进而得到 1.2+0.5x y e =,将5x =代入, 解得136.52y e e ==.故选:C. 【点睛】本题考查利用样本中心点坐标满足回归直线方程求参数值,以及由回归方程进行预测值得求解,属中档题.2.A解析:A 【分析】根据向量相等的坐标表示,由此即可计算平均数 ,x y ,得到样本点的中心的坐标(),x y ,代入回归直线方程求出结果. 【详解】因为样本点为(),(1,2,,6)i i i P x y i =且126(12,18)OP OP OP +++=,所以1261261218x x x y y y ++⋯+=⎧⎨++⋯+=⎩所以()123456112266x x x x x x x =+++++== , ()126118366y y y y =++⋯+==; 又回归直线方程为2y x a =+过(),x y , ∴322a =⨯+,解得1a =-, 故选:A . 【点睛】本题主要考查了线性回归方程必过样本中心、向量相等的坐标表示等基础知识,属于基础题.3.D【分析】求出样本数据的中心坐标(,)x y ,代入回归直线方程,求出ˆb,得到回归直线方程,然后求解加工20个零件所需要的加工时间,得到答案. 【详解】由题意,根据表中的数据,可得1(911141516)135x =++++=, 1(3032364042)365y =++++=,即样本中心点为(13,36),将样本中心点为(13,36)代入回归方程,可得235361317b =⨯+,解得2917b =, 所以回归方程为292351717y x =+, 当20x时,292358152047.9848171717y =⨯+=≈≈(分钟). 故选:D. 【点睛】本题主要考查了线性回归方程的求法及应用,其中解答中熟记回归直线方程经过样本中心点是解答的关键,着重考查推理与运算能力.4.C解析:C 【分析】根据独立性检验、非线性回归方程以及回归直线方程相关知识进行判断. 【详解】对于命题①,根据独立性检验的性质知,两个分类变量2χ越大,说明两个分类变量相关程度越大,命题①正确;对于命题②,由kxy ce =,两边取自然对数,可得ln ln y c kx =+,令ln z y =,得ln z kx c =+,0.34z x =+,所以ln 40.3c k =⎧⎨=⎩,则40.3c e k ⎧=⎨=⎩,命题②正确;对于命题③,回归直线方程y a bx =+中,3211a y bx =-=-⨯=,命题③正确; 对于命题④,通过回归直线y bx a =+及回归系数b ,可估计和预测变量的取值和变化趋势,命题④错误.故选C. 【点睛】本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.5.D【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.6.B解析:B 【解析】根据表中数据,得14x =(6+5+10+12)=334,14y =(6+5+3+2)=4,且变量y 随变量x 的增大而减小,是负相关,所以,验证334x =时,ˆy=–0.7×334+10.3≈4,即回归直线ˆy =–0.7x +10.3过样本中心点(x ,y ).故选B .7.B解析:B 【分析】计算75x =,80y =,故ˆ10a y bx =-=-,代入数据计算得到答案. 【详解】1017510ii x x===∑,1018010ii yy ===∑,故ˆ10a y bx =-=-,即ˆ 1.210yx =-, 当86y =时,86 1.210x =-,解得80x =.故选:B . 【点睛】本题考查了线性回归方程,意在考查学生的计算能力和应用能力.8.B解析:B 【分析】由已知线性回归直线方程ˆ260yx =-+,可估计平均气温为60C 时该地的山高,即可得到答案. 【详解】线性回归直线方程为ˆ260yx =-+,当0x = 时ˆ60y =即年平均气温为0时该山高估计为60km ,故A 正确;当ˆ72y=时解得6x =-即山高为72km 处的年平均气温估计为6C -,故B 错误;该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关,故C 正确;由20-<,该地的山高y 与该山的年平均气温x 成负相关关系,故D 正确.故选B 【点睛】本题考查线性回归直线方程的应用,考查相关的意义,判断能力,属于基础题.9.D解析:D 【解析】本题考查线性回归方程的性质. 由线性回归方程必过点,可知线性回归方程ˆybx a =+必过点(5,4)选D . 10.D解析:D 【分析】对四个命题一个一个进行判断. 【详解】①函数关系是一种确定性关系,所以①是正确的;②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法, 所以②是正确的;③独立性检验中的统计假设就是假设相关事件A 、B 相互独立,所以③是正确的; ④某项测量结果ξ服从正态分布()21,N σ,由正态分布定义可知它的图像是关于1x =对称,因为(5)0.81P ξ≤=,则(5)(3)10.810.19P P ξξ>=<-=-=, 所以()11(31)(35)120.190.3122P P ξξ-≤<=-≤≤=-⨯=,所以④是正确的; 故选:D 【点睛】本题考查了对相关关系概念的理解、正态分布的对称性,属于一般题.11.C解析:C 【分析】对于选项A ,B 给出反例可说明命题错误,C 由正弦定理可知命题正确,D 由相关系数的定义确定其真伪即可. 【详解】逐一考查所给的说法:A . 若0n a =,则数列{}n a 为常数列,则{}n a 是等差数列但不是等比数列,该说法错误;B . 函数()f x 1x=为奇函数,但是不满足()00f =,该说法错误; C . 由正弦定理可得在ABC ∆中,A B >是sinA sinB >的充要条件,该说法正确; D . 两个随机变量相关性越强,则相关系数r 的绝对值越接近于1,题中说法错误. 本题选择C 选项. 【点睛】本题主要考查奇函数的性质,正弦定理的应用,相关系数的含义,常数列与等差数列、等比数列的关系等知识,意在考查学生的转化能力和计算求解能力.12.C解析:C 【分析】对于A ,根据系统抽样的定义可判断;对于B ,根据正态分布的对称性可判断在两个区间上的概率;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,可进行判断;对于D ,根据一组数据123a 、、、的平均数是2,得2a =,求得该组数据的众数和中位数,可判断D. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A 正确;对于B ,正态分布()19N ,的曲线关于1x =对称,区间()10-,和()23,与对称轴距离相等,所以在两个区间上的概率相等,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,C 错误; 对于D ,一组数据123a 、、、的平均数是2,2a ∴=;所以该组数据的众数和中位数均为2,D 正确.. 【点睛】本小题考查系统抽样,线性回归,线性相关,平均数,中位数与众数等基础知识,意在考查学生分析问题,及解决问题的能力和运算求解能力.13.C解析:C 【分析】对于A ,根据数据求出的平均数,众数和中位数即可判断; 对于B ,相关指数R 2越接近1,表示回归的效果越好; 对于C ,根据频率分布直方图判定;对于D ,设随机变量ξ服从正态分布N (4,22),利用对称性可得结论; 【详解】解:①将数据按从小到大的顺序排列为:10、12、14、14、15、15、16、17、17、17,中位数:()1515215b =+÷=;()101214141515161717171014.7a =+++++++++÷=;这组数据的平均数是14.7.因为此组数据中出现次数最多的数是17, 所以17c =是此组数据的众数; 则a b c <<;②2R 越接近于1,表示回归的效果越好,正确;③根据频率分布直方图的意义,因为小矩形的面积之和等于1,频率之和也为1, 所以有各小长方形的面积等于相应各组的频率;故③错; ④∵随机变量ξ服从正态分布()24,2N ,∴正态曲线的对称轴是4x =, ∴1(4)2P ξ>=.故④正确. 故选C :. 【点睛】本题主要考查命题的真假判断,涉及统计的基础知识:频率分布直方图和线性回归及分类变量X ,Y 的关系,属于基础题.二、解答题14.(1)列联表见解析;有99%的把握认为试验成功与材料有关;(2)2.1万元/吨. 【分析】(1)根据所给等高条形图,得到22⨯的列联表,利用公式,求得2K 的观测值,比较即可得到结论;(2)设修复费用为X 万元.得出X 可得0,0.1,0.2,0.3,求得相应的概率,得到X 的分布列,利用公式求得数学期望. 【详解】(1)根据所给等高条形图,得到22⨯的列联表:2K 的观测值()10045205301250507525K ⨯⨯-⨯==⨯⨯⨯,由于12 6.635>,故有99%的把握认为试验成功与材料有关.(2)生产1吨的石墨烯发热膜,所需的修复费用为X 万元.易知X 可得0,0.1,0.2,0.3.()3280327P X ⎛⎫=== ⎪⎝⎭,()21321120.13327P X C ⎛⎫==⨯= ⎪⎝⎭, ()2231260.23327P X C ⎛⎫==⨯= ⎪⎝⎭,()2110.3327P X ⎛⎫===⎪⎝⎭, 则X的分布列为:(分布列也可以不列)修复费用的期望:()100.10.20.30.127272727E X =⨯+⨯+⨯+⨯=. 所以石墨烯发热膜的定价至少为0.111 2.1++=万元/吨,才能实现预期的利润目标. 【点睛】求随机变量X 的期望与方差的方法及步骤: 理解随机变量X 的意义,写出X 可能的全部值; 求X 取每个值对应的概率,写出随机变量的分布列; 由期望和方差的计算公式,求得数学期望()(),E X D X ;若随机变量X 的分布列为特殊分布列(如:两点分布、二项分布、超几何分布),可利用特殊分布列的期望和方差的公式求解.15.(1)选择模型①,理由见解析;(2)2ˆ 1.92 1.04yx =+;(3)157人. 【分析】(1)根据残差图,估计值和真实值越接近,拟合效果越好,即可得解;(2)令2z x =,分别计算,z y 的平均数,根据公式求得,b a ,即可求出模型①对应点回归方程;(3)将9x =代入回归方程,即可得解. 【详解】(1)选择模型①.理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好(2)由(1),知y 关于x 的回归方程为2ˆybx a =+,令2 z x =,则ˆy bz a =+. 由所给数据得:1(1491625364964)25.58z =+++++++=, 1(481631517197122)508y =+++++++= ()()()818216868ˆ 1.923570iii ii z z y y bz z ==--==≈-∑∑.ˆˆ50 1.9225.5 1.04ay bz=-≈-⨯=, ∴y 关于x 的回归方程为2ˆ 1.92 1.04yx =+ (3)将9x =代入上式,得2ˆ 1.929 1.04156.56157y=⨯+=≈(人) 所以预测该地区第9天新型冠状病毒感染确诊的累计人数为157人. 【点睛】方法点睛:本题考查残差图的应用,考查回归直线的求法和应用,考查了学生的计算能力,求解线性回归直线的具体步骤为: 由已知数据求出平均数,x y ;由公式()()()121ˆniii nii x x y y bx x ==--=-∑∑计算出ˆb的值; 将ˆb代入ˆˆa y bx =-求出ˆa ; 得出方程ˆˆˆybx a =+. 16.(1)(2) ① 5.7111.9y x =+②20% 【分析】(1)把所给的5对数据写成对应的点的坐标,在坐标系中描出来,得到散点图;(2)根据所给的这组数据求出利用最小二乘法所需要的几个数据,代入求系数ˆb的公式,求得结果,再把样本中心点代入,求出ˆa的值,得到线性回归方程;根据上一问所求的线性回归方程,把6x =代入线性回归方程146y ≈ (分),净提高分为14611630-= (分),即可估计该生4月份后复习提高率. 【详解】 (1)散点图如图:(2)①由题得, 1234535x ++++==,y =1171271251341425++++ 129=,511992iii x y==∑ 52155i i x ==∑,2255345x =⨯=,553xy =⨯⨯ 1291935=,所以199219355545ˆb-=- 575.710==,129 5.7311ˆ1.9a =-⨯=,故y 关于x 的线性回归方程为 5.7111.9y x =+. ②由上述回归方程可得高考应该是第六次考试,故6x =, 则 5.76111.9y =⨯+ 146.1146=≈ (分), 故净提高分为14611630-= (分), 所以该生的复习提高率为30100%20%150⨯=. 【点睛】求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,a b;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.17.(1)见解析;(2)见解析;(3)预测2019年我国艾滋病感染累积人数为87.93万人 【分析】(1)由所给的数据绘制折线图即可;(2)由题意计算相关系数来说明变量之间的相关关系即可;(3)首先求得回归方程,然后利用回归方程的预测作用进行预测即可. 【详解】解:(1)我国艾滋病病毒感染人数的折线图如图所示()92,56.22x y ==,()1188()8296.3i i i i i i x x y y x y xy ==∴∑--=∑-=,112288()()4246.2299.376i i i i x x y y ==∑-∑-==,2211()0.99()()n nn i i i i x x y y r x x y y ==∑--∴=≈∑-∑-.故具有强线性相关关系.()()121()296.337.05()42n i i i n i i x x y y b x x ==∑--==≈∑-,56.27.05 4.524.48a y b x =-=-⨯≈, 7.0524.48y x ∴=+.当9x =时,7.05924.4887.93y =⨯+=.故预测2019年我国艾滋病感染累积人数为87.93万人. 【点睛】本题主要考查线性回归方程的求解与预测作用,相关系数的计算与含义等知识,意在考查学生的转化能力和计算求解能力.18.(1)列联表见解析;有99.9%的把握认为“理想网箱”的数目与养殖方法有关;(2)当市场价格大于30元/kg 时,采用新养殖法;等于30元/kg 时,两种方法均可;小于30元/kg 时,采用旧养殖法. 【分析】(1)根据频率分布直方图计算出列联表对应的数据,从而补全列联表;根据公式计算得022.65010.828k =>,从而得到结论;(2)利用频率分布直方图求得新旧两种养殖法的平均数,从而得到两种养殖法获利的函数模型,通过不同市场价格时,两种方法获利的大小来确定养殖法. 【详解】(1)由频率分布直方图可知:箱产量40kg <的数量:旧养殖法:()0.0120.0140.024510025++⨯⨯=;新养殖法:0.00451002⨯⨯=箱产量40kg ≥的数量:旧养殖法:1002575-=;新养殖法:100298-=可填写列联表如下:则:0200982575222.65010.82827173100100k ⨯-⨯==⨯⨯⨯>∴有99.9%的把握认为“理想网箱”的数目与养殖方法有关 (2)由频率分布直方图可得:旧养殖法100个网箱产量的平均数:(127.50.01232.50.01437.50.02442.50.03447.50.0452.50.032x =⨯+⨯+⨯+⨯+⨯+⨯+。

新人教版高中数学选修三第三单元《成对数据的统计分析》测试题(有答案解析)

新人教版高中数学选修三第三单元《成对数据的统计分析》测试题(有答案解析)
A.-1B.-6C.1D.6
4.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如表(单位:万元):
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由上表可得回归方程为 ,又已知生产该商品的成本(不含广告费)为 (单位:万元),据此模型预测最大的纯利润为( )
(1)完成 列联表,并回答能否有 的把握认为“对冰球是否有兴趣与性别有关”?
有兴趣
没兴趣
合计

55

合计
(2)已知在被调查的女生中有5名数学系的学生,其中3名对冰球有兴趣,现在从这5名学生中随机抽取3人,求至少有2人对冰球有兴趣的概率.
附表:
0.150
0.100
0.050
0.025
0.010
2.072
④对分类变量 与 的随机变量K2的观测值k来说,k越小,判断“ 与 有关系”的把握越大.其中真命题的序号为( )
A.①④B.②④C.①③D.②③
9.在一组样本数据 , ,…, ( , , … 不全相等)的散点图中,若所有样本点 都在直线 上,则这组样本数据的样本相关系数为()
A.-3B.0C.-1D.1
④不能在犯错误的概率不超过 的前提下认为药物有效
A. B. C. D.
第II卷(非选择题)
请点击修改第II卷的文字说明
参考答案
13.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:
根据图中的信息,下列结论中不正确的是()
A.样本中的男生数量多于女生数量B.样本中喜欢手机支付的数量多于现金支付的数量

(易错题)高中数学选修三第三单元《成对数据的统计分析》检测题(包含答案解析)

(易错题)高中数学选修三第三单元《成对数据的统计分析》检测题(包含答案解析)

一、选择题1.已知变量,x y 之间满足线性相关关系ˆ 1.31yx =-,且,x y 之间的相关数据如下表所示:则实数m =( ) A .0.8B .0.6C .1.6D .1.82.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归直线方程为,下列说法正确的是( )A .回归直线 6.3y x a =+ 必经过样本点()2,19、()6,44 B .这组数据的样本中心点(),x y 未必在回归直线 6.3y x a =+上C .回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元D .据此模型预报广告费用为7万元时销售额为50.9万元3.变量y 与x 的回归模型中,它们对应的相关系数r 的值如下,其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型44.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58kg 、64kg 、58kg 、60kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量y 的回归方程为y bx a =+,其中0.5b =,据此模型预测他的孙子的体重约为( )A .58kgB .61kgC .65kgD .68kg5.某同学用收集到的6组数据对(,)(1,2,3,4,5,6)i i x y i =制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线1l 的方程:11y b x a =+,相关系数为1r ,相关指数为21R ;经过残差分析确定点E 为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线2l 的方程:22y b x a =+,相关系数为2r ,相关指数为22R .则以下结论中,不正确的是( )A .10r >,20r >B .10b >,20b >C .12b b >D .2212R R >6.某公司在2014~2018年的收入与支出情况如下表所示:收入x (亿元) 2.2 2.4 3.8 5.2 6.0 支出y (亿元)0.21.52.02.53.8根据表中数据可得回归直线方程为0.7y x a =+,依此估计如果2019年该公司收入为8亿元时的支出为( ) A .4.502亿元 B .4.404亿元 C .4.358亿元D .4.856亿元7.下列有关命题的说法错误的是( )A .已知12,F F 是椭圆22421x y +=的两个焦点,过点1F 的直线与椭圆交于A ,B 两点,则2ABF ∆的周长为2B .若“p q ∨”为假命题,则p 与q 均为假命题C .若命题00:,ln 1p x R x ∃∈<,则命题:,ln 1p x R x ⌝∀∈≥D .两个随机变量的线性相关性越强,相关系数的绝对值越接近于08.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元) 广告费x 2 3 4 5 6 销售额y2941505971由上表可得回归方程为( )A .118.2万元B .111.2万元C .108.8万元D .101.2万元9.已知变量x 与变量y 之间具有相关关系,并测得如下一组数据:则变量x 与y 之间的线性回归直线方程可能为A .ˆy =0.7x –2.3B .ˆy =–0.7x+10.3C .ˆy =–10.3x+0.7D .ˆy=10.3x –0.7 10.对于分类变量X 与Y 的随机变量2K 的观测值k ,下列说法正确的是 A .k 越大,“X 与Y 有关系”的可信程度越小 B .k 越小,“X 与Y 有关系”的可信程度越小 C .k 越接近于0,“X 与Y 没有关系”的可信程度越小 D .k 越大,“X 与Y 没有关系”的可信程度越大 11.下列说法正确的是( )A .若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥B .已知相关变量(),x y 满足回归方程24y x =-,若变量x 增加一个单位,则y 平均增加4个单位C .命题“若圆()()22:11C x m y m -++-=与两坐标轴都有公共点,则实数[]0,1m ∈”为真命题D .已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=12.下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的个数是( ) A .1个B .2个C .3个D .4个13.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是()A.样本中的男生数量多于女生数量B.样本中喜欢手机支付的数量多于现金支付的数量C.样本中多数男生喜欢手机支付D.样本中多数女生喜欢现金支付二、解答题14.某工厂A,B两条生产线生产同款产品,若产品按照一、二、三等级分类,则每件可分别获利10元、8元、6元,现从A,B生产线的产品中各随机抽取100件进行检测,结果统计如下图:(1)根据已知数据,列出产品等级与生产线的列联表,并判断是否有99%的把握认为一等级产品与生产线有关?(2)分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产线的获利更稳定?附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.0500.0100.001k 3.841 6.635 10.82815.某学校共有1000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样随机抽取了100名学生进行调查,月消费金额分布在450~950之间.根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示:将月消费金额不低于750元的学生称为“高消费群”.(1)求a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的中点值作代表);(2)现采用分层抽样的方式从月消费金额落在[550,650),[750,850)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高消费群”的学生人数为随机变量X ,求X 的分布列及数学期望;(3)若样本中属于“高消费群”的女生有10人,完成下列22⨯列联表,并判断是否有97.5%的把握认为该校学生属于“高消费群”与“性别”有关?属于“高消费群” 不属于“高消费群” 合计男 女 合计(参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中)n a b c d =+++2()P K k0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.82816.电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).附:()()()()()22n ad bcKa b c d a c b d-=++++.P(K2≥k)0.050.01k 3.841 6.63517.某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2018级的1000名学生进行调查,收集到相关数据如下:(1)根据以上提供的信息,完成22⨯列联表,并完善等高条形图;选物理不选物理总计数学成绩优秀数学成绩不优秀260总计6001000(2)能否在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关?附:22()()()()()n ad bcKa b c d a c b d-=++++临界值表:()2P K k0.100.050.0100.0050.001 0k 2.706 3.841 6.6357.87910.82818.忽如一夜春风来,翘首以盼的5G时代,已然在全球“多点开花”,一个万物互联的新时代,即将呈现在我们的面前.为更好的满足消费者对流量的需求,中国电信在某地区推出六款不同价位的流量套餐,每款套餐的月资费x(单位:元)与购买人数y(单位:万人)的数据如表:套餐A B C D E F月资费x(元)384858687888购买人数y(万人)16.818.820.722.424.025.5对数据作初步的处理,相关统计量的值如表:其中ln i i v x =,ln i i y ω=,且绘图发现,散点(),i i v ω(6l i ≤≤)集中在一条直线附近. (1)根据所给数据,求y 关于x 的回归方程;(2)按照某项指标测定,当购买人数y 与月资费x 的比在区间,97e e ⎛⎫⎪⎝⎭内,该流量套餐受大众的欢迎程度更高,被指定为“主打套餐”,现有一家三口从这六款套餐中,购买不同的三款各自使用.记三人中使用“主打套餐”的人数为X ,求随机变量X 的分布列和期望. 附:对于一组数据()11,v ω,()22,v ω,…,()33,v ω,其回归直线bv a ω=+的斜率和截距的最小二乘估计值分别为1221ni ii nii v nv b vnvωω==-=-∑∑,a bv ω=-.19.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据1求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (附:42186i i x ==∑,4166.5i i i x y ==∑,()()()1122211nniii ii i nniii i x x yy x ynxy b x x xnx ====---==--∑∑∑∑,ˆˆay bx =-,其中x ,y 为样本平均值)20.某食品店为了了解气温对销售量的影响,随机记录了该店1月份中5天的日销售量y (单位:千克)与该地当日最低气温x (单位:°C)的数据,如下表:(1)求出y 与x 的回归方程y =b x +a ;(2)判断y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6°C ,请用所求回归方程预测该店当日的营业额.附:回归方程y=b x +a;中,b=()122 1() ==--∑∑ni iiniix y nxyx n x,a=y﹣bx21.为了解某地区足球特色学校的发展状况,某调查机构得到如下统计数据:年份x20142015201620172018足球特色学校y(百个)0.300.60 1.00 1.40 1.70(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(已知:0.751r≤≤,则认为y与x线性相关性很强;0.30.75x≤≤,则认为y与x线性相关性一般,0.25r≤,则认为y与x线性相关性较弱)(2)求y与x的线性回归方程,并预测该地区2019年足球特色学校的个数(精确到个位)参考公式:()()()()12211ni iin ni ii ix x y yrx x y y===--=--∑∑∑()()2211,10, 1.3,13 3.6056n ni ii ix x y y==-=-=≈∑∑;()()()121,ni iiniix x y yb a y bxx x==--==--∑∑22.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费i x和年销售量i y(1,28=i)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw()821ii x x =-∑()821ii w w =-∑()()81iii x x yy =--∑()()81iii w w yy =--∑46.6563 6.8 289.8 1.6 1.469 108.8表中=i i w x ,8118==∑i i w w (1)根据散点图判断,y a bx =+与y c d x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?给出判断即可,不必说明理由(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x 、y 的关系为0.2z y x =-根据(2)的结果回答下列问题:①年宣传费49x =时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆβ==∑--=∑-n i i i ni i u u v v u u ,ˆˆv u αβ=-. 23.某品牌汽车4S 店为对厂家研发的一种辅助产品进行合理定价,对该产品进行试销售,如图1.在试销售期间对100名顾客进行回访,由客户对该产品性能作出“满意”或“不满意”评价,如图2.(1)判断能否有99%的把握认为“客户购买产品对产品性能满意之间有关”? (2)请结合数据:()()6634580iii x x y y =--=∑,()()66175.5iii x x zz =--=-∑,()()663465.2iii y y zz =--=∑,()626776840i i y y=-=∑,求y 与x 的回归方程(精确到0.1)24.某车间为了规定工时额定,需要确定加工零件所花费的时间,为此作了6次试验,得到数据如下: 零件数x /个 10 20 30 40 50 60 加工时间y /min 647077829097(1)试对上述变量x 与y 的关系进行相关性检验,如果x 与y 具有线性相关关系,求出y 对x 的回归直线方程;(2)根据(1)的结论,你认为每小时加工零件的数量额定为多少(四舍五入为整数)比较合理?附:相关性检验的临界值表()()nniii ix x y y x y nx yr---==∑∑()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,y a bx =+42.0≈27.5≈25.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆybx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?26.某地实施乡村振兴战略,对农副产品进行深加工以提高产品附加值,已知某农产品成本为每件3元,加工后的试营销期间,对该产品的价格与销售量统计得到如下数据:(1)求销量y (件)关于单价x (元)的线性回归方程ˆˆˆybx a =+; (2)根据销量y 关于单价x 的线性回归方程,要使加工后收益P 最大,应将单价定为多少元?(产品收益=销售收入-成本).参考公式:ˆb=()121()()ni i i ni i x x y y x x ==---∑∑=1221ni i i n i i x y nxy x nx ==--∑∑,ˆˆay bx =-【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】分析:由题意结合线性回归方程的性质整理计算即可求得最终结果. 详解:由题意可得:12345 2.542x +++===,0.1 3.14 1.844m m y +++==+, 线性回归方程过样本中心点,则:1.8 1.3 2.514m+=⨯-, 解得: 1.8m =. 本题选择D 选项.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.2.D解析:D 【分析】根据回归方程的含义与性质判断ABC ,根据最小二乘法求出回归方程可判断D. 【详解】回归直线 6.3y x a =+ ,不一定经过任何一个样本点,故 A 错;由最小二乘法可知,这组数据的样本中心点(),x y 一定在回归直线 6.3y x a =+上,故B 错;回归系数6.3的含义是广告费用每增加1万元,预测销售额增加6.3万元,故C 错;1(23456)45x =++++=,1(1925343844)253y =++++=,将()4,32代入 6.3y x a =+可得 6.8a =,则回归方程为 6.3 6.8y x =+,7x =时, 6.37 6.850.9y =⨯+=,故D 正确.故选:D. 【点睛】本题主要考查回归方程的含义与性质,考查根据最小二乘法求出回归方程以及利用回归方程估计总体,属于基础题.3.C解析:C 【分析】根据相关系数的性质,r 的绝对值最大,则其拟合效果最好,进行判断即可. 【详解】线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小,∵模型3的相关系数r 最大,∴模拟效果最好, 故选C . 【点睛】本题主要考查线性回归系数的性质,在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.4.B解析:B 【分析】由已知得出数据,()58,58,()64,62,()58,60,根据回归直线过样本中心点,可求得(),x y ,计算求得a ,代入62x =,即可得出结果.【详解】由已知,体重是隔代遗传,且呈线性相关,得出数据,()58,58,()64,62,()58,60, 所以()(),=60,60x y ,代入y bx a =+,其中0.5b =,求得=30a , 即0.530y x =+.62x =时, 0.56230y =⨯+=61.故选:B 【点睛】本题主要考查线性回归方程的相关计算,考查学生分析问题的能力,属于中档题.5.D解析:D 【解析】分析:利用回归方程的性质,利用相关系数和相关指数分析解答.详解:从图形中可以看出,两个变量是正相关,所以选项A 是正确的;从图形中可以看出,回归直线的纵截距是正数,所以选项B 和C 是正确的;因为22121()1()nii n i i y y R y y ∧==-=--∑∑其中iy y ∧-=真实值-预报值=残差,2R 值越大,说明残差的平方和越小,也就是说模型的拟合效果越好.所以选项D 是错误的.故答案为D. 点睛:(1)本题主要考查回归方程的性质,考查相关系数和相关指数,意在考查学生对这些基础知识的掌握水平和分析推理能力.(2)相关系数:()()niix x y y r --=∑0r >,表示两个变量正相关;0r <,表示两个变量负相关;r 的绝对值越接近1,表明两个变量的线性相关性越强.r 的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,r 的绝对值大于0.75时,表明两个变量的线性相关性很强.6.D解析:D 【分析】先求 3.92x =,2y =,根据0.7a y x =-,求解0.744a =-,将8x =代入回归直线方程为0.7y x a =+,求解即可. 【详解】 2.2 2.4 3.8 5.2 6.03.925x ++++==,0.2 1.5 2.0 2.5 3.825y ++++==0.720.7 3.920.744a y x =-=-⨯=-即0.70.744y x =-令8x =,则0.780.744 4.856y =⨯-= 故选:D 【点睛】本题考查回归分析,样本中心点(),x y 满足回归直线方程,是解决本题的关键.属于中档题.7.D解析:D 【分析】由椭圆定义,复合命题的真假,命题的否定,相关系数的概念进行判断. 【详解】椭圆22421x y +=的标准方程是2211142x y +=,21,22a a ==,2ABF∆的周长为44a ==A 正确; 若“p q ∨”为假命题,则,p q 都是假命题,,p q 只要有一个为真,则p q ∨为真,B 正确; 命题00:,ln 1p x R x ∃∈<,则命题:,ln 1p x R x ⌝∀∈≥,C 正确; 两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,D 错. 故选:D . 【点睛】本题考查命题的真假判断,解题关键是掌握相关概念,如椭圆标准方程中长轴长的确定,复合命题的真值表,含有一个题词的命题的否定,相关系数与相关性的判断.8.B解析:B 【解析】分析:平均数公式可求出x 与y 的值,从而可得样本中心点的坐标,代入回归方程求出a ,再将10x =代入回归方程得出结论. 详解:由表格中数据可得,4,50x y ==,50410.2ˆa∴=⨯+,解得9.2a =, ∴回归方程为10.2.2ˆ9yx =+, ∴当10x =时,10.2109.21ˆ11.2y=⨯+=, 即预测广告费为10万元时销售额约为111.2,故选B.点睛:本题考查了线性回归方程的性质与数值估计,属于基础题. 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.9.B解析:B 【解析】根据表中数据,得14x =(6+5+10+12)=334,14y =(6+5+3+2)=4,且变量y 随变量x 的增大而减小,是负相关,所以,验证334x =时,ˆy=–0.7×334+10.3≈4,即回归直线ˆy =–0.7x +10.3过样本中心点(x ,y ).故选B .10.B解析:B 【解析】选B K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.因此,A 、C 、D 都不正确.11.C解析:C 【解析】若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∈,210x x -+≥;已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均减少4个单位;命题“若圆()()22:11C x m y m -++-=与两坐标轴都有公共点,则101,11m m m ⎧≤⎪∴≤≤⎨-≤⎪⎩为真命题; 已知随机变量()22X N ,σ~,若()0.32P X a <=,则()40.32P X a >-=;所以选C.12.C解析:C 【解析】对于①,在回归分析模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,正确,因为相关指数2R 越大,则残差平方和越小,模型的拟合效果越好,①正确.对于②两个变量相关性越强,则相关系数的绝对值就越接近于1;对于③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;正确;对于④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.错误,因为在对分类变量X 与Y 进行独立性检验时,随机变量2K 的观测值k 越大,则“X 与Y 相关”可信程度越大,故④错误; 故选C13.D解析:D 【详解】由右边条形图知,男生女生喜欢手机支付的比例都高于现金支付的比例,所以男生女生都喜欢手机支付,故C 对,D 错,由左边条形图知,男生女生手机支付都比现金支付比例相同,B 对,结合两个条形图可知,样本中的男生数量多于女生数量,A 对,故选D.二、解答题14.(1)列联表见解析,没有99%的把握认为一等级的产品与生产线有关;(2)1.6;2.36;A 生产线的获利更稳定. 【分析】(1)由题中数据完成列联表,求出卡方值,和6.635比较即可判断; (2)根据方差公式求出方差即可判断. 【详解】(1)根据已知数据可建立列联表如下:2()200(20653580)()()()()55145100100n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯2001500150018005.6436.63555145100100319⨯⨯==≈<⨯⨯⨯所以没有99%的把握认为一等级的产品与生产线有关 (2)A 生产线随机抽取的100件产品获利的平均数为:11(1020860620)8100x =⨯⨯+⨯+⨯=(元) 获利方差为222211(108)20(88)60(68)20 1.6100s ⎡⎤=⨯-⨯+-⨯+-⨯=⎣⎦ B 生产线随机抽取的100件产品获利的平均数为:21(1035840625)8.2100x =⨯⨯+⨯+⨯=(元) 获利方差为222221(108.2)35(88.2)40(68.2)25 2.36100s ⎡⎤=⨯-⨯+-⨯+-⨯=⎣⎦ 所以2212s s <,则A 生产线的获利更稳定.【点睛】本题考查独立性检验和利用方差判断数据的稳定性,在计算的时候,注意数据的正确性以及计算公式的熟悉性.15.(1)0.0035a =,平均数为670元;(2)分布列答案见解析,数学期望:910;(3)22⨯列联表答案见解析,有97.5%的把握认为该校学生属于“高消费群”与性别有关. 【分析】(1)由频率分布直方图中频率和为1可求得a ,每组数据用该组区间的中点值乘以频率相加得均值;(2)由频率分布直方图知从[550,650)中抽取7人,从[750,850)中抽取3人,随机变量X 的所有可能取值有0,1,2,3,求出各概率得分布列,然后由期望公式得期望; (3)样本中男生40人,女生60人属于“高消费群”的25人,其中女生10人,由频率分布直方图求出高消费群人数,可得高消费群中男生人数,从而可填写列联表,并计算出2K 后可得结论. 【详解】(1)由题意知100(0.00150.00250.00150.001)1a ⨯++++=,解得0.0035a =, 样本平均数为5000.156000.357000.258000.159000.10670x =⨯+⨯+⨯+⨯+⨯=元. (2)由题意,从[550,650)中抽取7人,从[750,850)中抽取3人, 随机变量X 的所有可能取值有0,1,2,3.337310()(0k kC C P X k k C -===,1,2,3)所以随机变量X 的分布列为:随机变量X 的数学期望()2312012012010E X =+⨯+⨯=. (3)由题可知,样本中男生40人,女生60人,属于“高消费群”的25人,其中女生10人;得出以下22⨯列联表:2()100(10251550)505.024()()()()257540609n ad bc K a b c d a c b d -⨯-⨯===≈++++⨯⨯⨯,所以有97.5%的把握认为该校学生属于“高消费群”与性别有关. 【点睛】本题考查频率分布直方图,考查分层抽样,随机变量的概率分布列和数学期望,考查独立性检验.旨在考查学生的数据处理能力,运算求解能力. 16.(1)无关;(2) 34,916. 【详解】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而可得列联表如下:非体育迷体育迷合计男301545女451055合计7525100.因为3.030<3.841,所以我们没有充分理由认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率.由题意知X~B(3,),从而X的分布列为X0123PE(X)=np=4=.D(X)=np(1-p)=1617.(1)填表见解析,作图见解析(2)能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关【分析】(1)由题意计算出各组人数后即可完成列联表,进而可补全等高条形图;(2)代入公式计算出2K,与3.841比较即可得出结论.【详解】(1)根据题意填写列联表如下,选物理不选物理总计数学成绩优秀420320740数学成绩不优秀18080260总计6004001000(2)计算222()1000(42080180320)()()()()600400740260n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯12.474 3.841≈>,所以能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关. 【点睛】本题考查了独立性检验的应用,考查了计算能力,属于中档题. 18.(1)12y ex =;(2)分布列见解析,32.【分析】(1)设回归直线方程为bv a ω=+,由61 4.16i i v v ==∑,611 3.056i i ωω===∑,则12b =,1a bv ω=-=,变量ω交于v 的回归方程为112v ω=+,由ln i i v x =,ln i i y ω=,求出y 关于x 的回归方程.(2)由1212,97y ex e e e x x x ⎛⎫==∈ ⎪⎝⎭,得C 、D 、E 为“主打套餐”,则三人中使用“主打套餐”的人数X 服从超几何分布,X 的可能取值为0,1,2,3,由此能求出X 的分布列和()E X . 【详解】解:(1)∵散点(),i i v ω(6l i ≤≤)集中在一条直线附近).设回归直线方程为bv a ω=+,由61 4.16i i v v ==∑,611 3.056i i ωω===∑,则122175.36 4.1 3.051101.46 4.1 4.12n i ii n i i v nv b v nvωω==--⨯⨯===-⨯⨯-∑∑, 13.05 4.112a bv ω=-=-⨯=, ∴变量ω交于v 的回归方程为112v ω=+, ∵ln i i v x =,ln i i y ω=,∴1ln ln 12y x =+,∴12y ex =, 综上,y 关于x 的回归方程为12y ex =.(2)由1212,97y ex e e e x x x ⎛⎫==∈ ⎪⎝⎭, 解得4981x <<,∴58x =,68,78,∴C 、D 、E 为“主打套餐”,则三人中使用“主打套餐”的人数X 服从超几何分布,X 的可能取值为0,1,2,3,()33361020C P X C ===, ()1233369120C C P X C ===, ()2133369220C C P X C ===, ()33361320C P X C ===, ∴X 的分布列为:()0123202020202E X =⨯+⨯+⨯+⨯=. 【点睛】 本题考查回归直线方程的求法及应用,考查离散型随机变量的分布列、概率的求法,考查超几何分布等基础知识,考查推理论证能力与运算求解能力,属于中档题.19.(1)0.70.35y x =+;(2)19.65.【分析】(1)由表中数据和参考公式即求线性回归方程;(2)根据(1)中的线性回归方程进行预测,即得答案.【详解】(1)由表中数据可得3456 2.534 4.54.5, 3.544x y ++++++====. 1222441466.54 4.5 3.50.7864 4.5ˆ4ii i ii b x y xy xx ==--⨯⨯∴===-⨯-∑∑, ˆˆ 3.50.7 4.50.35ay bx =-=-⨯=. 所以线性回归方程为0.70.35y x =+.(2)由(1)知线性回归方程为0.70.35y x =+.把100x =代入,得0.71000.3570.35y =⨯+=,所以生产100吨甲产品的生产能耗比技改前降低9070.3519.65-=吨标准煤.【点睛】本题考查线性回归方程及其应用,属于中档题.20.(1)0.5612.92y x =-+;(2)y 与x 之间是负相关;可预测该店当日的销售量为9.56(千克)【分析】(1)计算平均数和回归系数,即可写出回归方程;(2)由ˆ0b<知y 与x 之间是负相关,利用回归方程计算6x =时ˆy 的值即可. 【详解】解:(1)由已知5n =,则25891135755x ++++===, 121088745955y ++++===, 1()2125108898117287n i i i x y ==⨯+⨯+⨯+⨯+⨯=∑,1()28757928n i ii x y nxy =-=-⨯⨯=-∑, 2222221258911295n i i x==++++=∑ 2221()2955750nii x n x =-=-⨯=∑, ∴1221()280.5650()n i ii n i i x y nx y b xn x ==--===--∑∑, ˆ9(0.56)712.92a y bx=-=--⨯=;∴所求的回归方程是ˆ0.5612.92yx =-+; (2)由ˆ0.560b=-<,知y 与x 之间是负相关; 将6x =代入回归方程,计算ˆ0.56612.929.56y=-⨯+=, 可预测该店当日的销售量为9.56(千克).【点睛】本题考查了线性回归方程的求法与应用问题,属于中档题.21.(1) 3.63.6056r =;y 与x 的线性相关性很强;(2)线性回归方程y =0.36x -724.76,预测A 地区2019年特色学校208个【分析】(1)求出,x y ,代入公式计算即可;(2)根据公式求出回归方程,根据回归方程计算预测结果.【详解】解:(1)2016521120.30.61 1.4 1.72016,155x y ⨯--++++++====, ()()3.60.753.6056n iix x y y r --===>∑ 所以y 与x 线性相关很强;(2)5151()()(2)(0.7)(1)(0.4)10.420.70.3641014()i ii ii x x y y b x x ==---⨯-+-⨯-+⨯+⨯===++++-∑∑, 120160.36724.76a y bx =-=-⨯=-,y 关于x 的线性回归方程y =0.36x -724.76,当x =2019时,y =2.08,即A地区2019年特色学校208个.【点睛】本题考查相关系数的计算以及回归方程的计算,考查学生对公式的运用,是中档题. 22.(1)y c =+适宜;(2)ˆ100.6y =+3)①576.6,,6.32;②46.24x =【分析】(1)由图中散点的大致形状,可以判断y c =+y 关于年宣传费x 的回归方程类型;(2)令w =y 关于w 的线性回归方程,进而可得到y 关于x 的回归方程. (3)①由(2),可求出49x =时,年销售量y 的预报值,再结合年利润0.2z y x =-,计算即可;②根据(2)的结果,可求得年利润z的预报值ˆ20.12z x =-+,求出最值即可.【详解】(1)由图中散点的大致形状,可以判断y c =+y 关于年宣传费x 的回归方程类型.(2)令w =y 关于w 的线性回归方程, 由于()()()81821108.8ˆ681.6i i i i i w w y y d w w ==--===-∑∑,ˆˆ56368 6.8100.6c y dw =-=-⨯=, 所以y 关于w 的线性回归方程为ˆ100.668yw =+, 因此y 关于x的回归方程为ˆ100.6y=+ (3)①由(2)知,当49x =时,年销售量y的预报值ˆ 100.6576.6=+=y, 年利润z 的预报值ˆ576.60.24966.32z=⨯-=. ②根据(2)的结果可知,年利润z 的预报值ˆ0.2(100.620.12zx x =+-=-+,13.6 6.82==时,即当46.24x =时,ˆz 取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.【点睛】 本题考查回归方程及其应用,考查利用二次函数求最值,考查学生的计算求解能力,属于中档题.23.(1)有;(2)15.10.12x y e-=【分析】(1)代入公式求得2K 后,与6.635进行比较即可得解;(2)由散点图可知,z 与x 的线性相关性较强,设z bx a =+,代入公式求得b 、a 后,即可得15.10.1z x =-,由2ln z y =即可得解.【详解】 (1)()22100353015201009.091 6.6355050554511K ⨯⨯-⨯==≈>⨯⨯⨯, 所以有99%的把握认为“客户购买产品与对产品性能满意之间有关”.(2)由散点图可知,z 与x 的线性相关性较强,设z bx a =+.由题设()()() 61621175.50.11750i iiiix x z zbx x==---==≈-∑∑,所以11.550.13515.1a z bx=-=+⨯=,所以15.10.1z bx a x=+=-,又2lnz y=,所以y关于x的回归方程为15.10.12xy e-=.【点睛】本题考查了独立性检验和非线性回归方程的求解,考查了计算能力,属于中档题. 24.(1)答案见解析.(2)96【分析】(1)根据表中所给数据,计算出||r,即可求得答案.(2)每小时加工零件的数量,即60x=,将60x=代入ˆ0.65757y x=+,即可求得答案.【详解】(1)由表中数据得:6117950i iix y==∑,6219100iix==∑,62139158iiy==∑,35,80x y==∴0.05221795063580||0.997910063539158680r r⨯-⨯⨯==>-⨯-⨯从而有95%的把握认为x与y之间具有线性相关关系,∴此求回归直线方程是有意义的.计算得:ˆˆ0.657,57b a==∴ˆ0.65757y x=+(2)每小时加工零件的数量,即60x=将60x=代入ˆ0.65757y x=+ˆ96.42y=故每小时加工零件的数量额定为96比较合理【点睛】本题考查回归直线方程以及应用,考查基本分析与求解能力,属基本题.25.(1)散点图见解析(2)1.23,0.08(3)12.38【分析】。

新人教版高中数学选修三第三单元《成对数据的统计分析》测试(有答案解析)(5)

新人教版高中数学选修三第三单元《成对数据的统计分析》测试(有答案解析)(5)

一、选择题1.已知变量x ,y 之间具有较强的线性相关性,测得它们的四组数据如表所示: x 1234y85 910 25 110现已求得变量x ,y 之间的回归方程为2y ax =+,请根据给出的条件,预测9x =时,y 的值约为( ) A .45-B .52-C .45D .522.某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)附表:20()P K k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.828则下列选项正确的是( )A .有99.5%的把握认为使用智能手机对学习有影响B .有99.5%的把握认为使用智能手机对学习无影响C .有99.9%的把握认为使用智能手机对学习有影响D .有99.9%的把握认为使用智能手机对学习无影响3.对两个变量y 和x 进行回归分析,得到一组样本数据1122(,),(,),(,)n n x y x y x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本点的中心(),x yB .残差平方和越小的模型,拟合的效果越好C .用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好D .若变量y 和x 之间的相关系数为0.9462r =-,则变量y 和x 之间具有线性相关关系4.已知x 、y 的取值如下表: x 0 1 3 4 y2.24.34.86.7从散点图可以看出y 与x 线性相关,且回归方程0.95y x a =+,则当5x =时,估计y 的值为( ) A .7.1B .7.35C .7.95D .8.65.某公司在2014~2018年的收入与支出情况如下表所示:收入x (亿元) 2.2 2.4 3.8 5.2 6.0 支出y (亿元)0.21.52.02.53.8根据表中数据可得回归直线方程为0.7y x a =+,依此估计如果2019年该公司收入为8亿元时的支出为( ) A .4.502亿元 B .4.404亿元 C .4.358亿元D .4.856亿元6.下列有关命题的说法错误的是( )A .已知12,F F 是椭圆22421x y +=的两个焦点,过点1F 的直线与椭圆交于A ,B 两点,则2ABF ∆的周长为22B .若“p q ∨”为假命题,则p 与q 均为假命题C .若命题00:,ln 1p x R x ∃∈<,则命题:,ln 1p x R x ⌝∀∈≥D .两个随机变量的线性相关性越强,相关系数的绝对值越接近于07.有一散点图如图所示,在5个()x y ,数据中去掉D (3,10)后,下列说法正确的是( )A .残差平方和变小B .方差变大C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱8.从某大学中随机选取8名女大学生,其身高x (单位:cm )与体重y (单位:kg )数据如下表:若已知y 与x 的线性回归方程为ˆ0.8585.71yx =-,那么选取的女大学生身高为175cm 时,相应的残差为( ) A .0.96-B .0. 96C .63. 04D . 4.04-9.小明同学在做一项市场调查时的如下样本数据:他由此样本得到回归直线的方程为 2.115.5y x =-+,则下列说法正确的是( ) A .变量x 与y 线性正相关 B .x 的值为2时,y 的值为11.3 C .6a =D .变量x 与y 之间是函数关系10.下列说法正确的是( )A .若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥B .已知相关变量(),x y 满足回归方程24y x =-,若变量x 增加一个单位,则y 平均增加4个单位C .命题“若圆()()22:11C x m y m -++-=与两坐标轴都有公共点,则实数[]0,1m ∈”为真命题D .已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=11.陕西关中的秦腔表演朴实,粗犷,细腻,深刻,再有电子布景的独有特效,深得观众喜爱.戏曲相关部门特意进行了“喜爱看秦腔”调查,发现年龄段与爱看秦腔的人数比存在较好的线性相关关系,年龄在[]40,44,[]45,49,[]50,54,[]55,59的爱看人数比分别是0.10,0.18,0.20,0.30.现用各年龄段的中间值代表年龄段,如42代表[]40,44.由此求得爱看人数比y 关于年龄段x 的线性回归方程为0.4188y kx =-.那么,年龄在[]60,64的爱看人数比为( ) A .0.42B .0.39C .0.37D .0.3512.上饶市婺源县被誉为“茶乡”,婺源茶业千年不衰,新时代更是方兴未艾,其中由农业部监制的婺源大山顶特供茶“擂鼓峰茶尤为出名,为了解每壶“擂鼓峰”茶中所放茶叶量x 克与食客的满意率y 的关系,抽样得一组数据如下表:y(%)30m507060根据表中的全部数据,用最小二乘法得出y与的线性回归方程为ˆ,则表中m的值为()A.39.5 B.40 C.43.5 D.4513.有一散点图如图所示,在5个(,)x y数据中去掉(3,10)D后,下列说法正确的是()A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量y的相关性变弱二、解答题14.某地区2012年至2018年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2012201320142015201620172018年份代号t1234567人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9y(2)利用(1)中的回归方程,分析2012年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121ˆni iiniit t y ybt t==--=-∑∑,ˆˆa y bt=-.15.某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i位学生的成绩为(i ix y,) (i=1,2,3...20),其中i ixy,分别为第i位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):(1)根据统计学知识,当相关系数|r|≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:20202022111()()485.()678.()476iiii i i i x x y y x x y y ===--=-=-=∑∑∑参考公式:相关系数12211()().()()niii n niii i x x y y r x x x y ===--=--∑∑∑(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X 表示这2名学生两科赋分的和,求X 的分布列和数学期望.16.2018年至2020年,第六届全国文明城市创建工作即将开始.在2017年9月7日召开的攀枝花市创文工作推进会上,攀枝花市委明确提出“力保新一轮提名城市资格、确保2020年创建成功”的目标.为了确保创文工作,今年初市交警大队在辖区开展“机动车不礼让行人整治行动” .下表是我市一主干路口监控设备抓拍的5个月内 “驾驶员不礼让斑马线”行为统计数据: (1)请利用所给数据求违章人数与月份之间的回归直线方程ˆˆybx a =+; (2)预测该路口7月份不“礼让斑马线”违章驾驶员的人数;(3)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查“驾驶员不礼让斑马线”行为与驾龄的关系,得到如下22⨯列联表:能否据此判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关?参考公式:1221ˆni i i n i i x y nxy bx nx==-=-∑∑,ˆˆay bx =- 17.每年10月中上旬是小麦的最佳种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了100颗小麦种子的发芽数,得到了如下数据:(1)请根据统计的最后三组数据,求出y 关于x 的线性回归方程y bx a =+; (2)若由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,则认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠; (3)若100颗小麦种子的发芽率为n 颗,则记为%n 的发芽率,当发芽率为%n 时,平均每亩地的收益为10n 元,某农场有土地10万亩,小麦种植期间昼夜温差大约为9C ︒,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.附:在线性回归方程y bx a =+中,1221ni ii nii x y nx yb xnx==-=-∑∑.18.某电脑公司有5名产品推销员,其工作年限与年推销金额的数据如表:(1)求年推销金额y 关于工作年限x 的线性回归方程; (2)判断变量x 与y 之间是正相关还是负相关;(3)若第6名推销员的工作年限是11年,试估计他的年推销金额.参考公式:线性回归方程y bx a =+中,a y bx =-,其中,x y 为样本平均数,1221ni ii nii x ynx y b xnx==-=-∑∑)19.调查某桑场采桑员和辅助工桑毛虫皮炎发病情况结果如下表:利用22⨯列联表的独立性检验估计,“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系会犯错误的概率是多少?随机量变22()()()()()n ad bc K a b c d a c b d -=++++ (其中n a b c d =+++) 临界值表20.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费对年销售量(单位:t )的影响.该公司对近5年的年宣传费和年销售量数据进行了研究,发现年宣传费x (万元)和年销售量y (单位:t )具有线性相关关系,并对数据作了初步处理,得到下面的一些统计量的值.(2)已知这种产品的年利润z 与x ,y 的关系为20.05 1.85z y x =--,根据(1)中的结果回答下列问题:①当年宣传费为10万元时,年销售量及年利润的预报值是多少?②估算该公司应该投入多少宣传费,才能使得年利润与年宣传费的比值最大.附:问归方程ˆˆˆybx a =+中的斜率和截距的最小二乘估计公式分别为()()()1111112221111ˆnni i n ni i x ynx yx x yybx nxx x ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:11188.5S i x y==∑,21190S i x ==∑.21.这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智.某校高三学生也展开了对这次疫情的研究,一名同学在数据统计中发现,从2020年2月1日至2月7日期间,日期x 和全国累计报告确诊病例数量y (单位:万人)之间的关系如下表:(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y 与x 的关系?(2)求出y 关于x 的线性回归方程y bx a =+(系数精确到0.01).并预测2月10日全国累计报告确诊病例数. 参考数据:7116.9ii y==∑,7177.5i i i x y ==∑ 1.88= 2.65≈.参考公式:相关系数()()niix x y y r --=∑回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:()()1niii nx x y y b =--=∑,a y bx=-.22.某班主任对全班50名学生学习积极性和对待工作的态度进行了调查,统计数据如下所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:有多大把握认为学生的学习积极性与对班级工作的态度有关系?并说明理由. 本题参考数据:23.为调查喜欢冲浪运动与性别是否相关,随机对100名大学生进行调查并制成下表:(1)当20a =,50c =,10d =时,判断能否有99.9%的把握认为喜欢冲浪运动与性别有关?(2)当50c =,10d =时,已知a 的值越大则2K 的值越小,若有99.9%的把握认为喜欢冲浪运动与性别有关,求a 的最大值.参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.225741167129⨯>⨯⨯,225681067228⨯<⨯⨯.24.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.25.某书店销售刚刚上市的某高二数学单元测试卷,按事先拟定的价格进行5天试销,每种单价试销1天,得到如下数据:(1)求试销5天的销量的方差和y 关于 x 的回归直线方程;附: 1122211()(ˆˆ,(ˆ))nniii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑. (2)预计以后的销售中,销量与单价服从上题中的回归直线方程,已知每册单元测试卷的成本是10元,为了获得最大利润,该单元测试卷的单价应定为多少元?26.高一学年结束后,要对某班的50名学生进行文理分班,为了解数学对学生选择文理科是否有影响,有人对该班的分科情况做了如下的数据统计:(Ⅰ)根据数据关系,完成22⨯列联表;(Ⅱ)通过计算判断能否在犯错误的概率不超过2.5%的前提下认为数学对学生选择文理科有影响.附:22()()()()()n ad bc K a b c d a c b d -=++++参考答案【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由已知求得x ,y ,代入2y ax =+求得a 值,则线性回归方程可求,取9x =求得y 值即可. 【详解】12342.54x +++==,1892130.7545105104y ⎛⎫=+++== ⎪⎝⎭,0.7520.52.5a -∴==-,则线性回归方程为0.52y x =-+, 取9x =,得50.5922y =-⨯+=-. 故选:B . 【点睛】本题考查线性回归方程,明确线性回归方程恒过样本点的中心是关键,是基础题.2.A解析:A 【解析】分析:根据列联表中数据利用公式求得2K ,与邻界值比较,即可得到结论. 详解:根据卡方公式求得()223081281020101218K -==⨯⨯⨯,27.89710.828K <<,∴该研究小组有99.5%的把握认为中学生使用智能手机对学生有影响,故选A.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.3.C解析:C 【解析】分析:根据回归方程性质、残差平方和含义、相关指数含义以及相关系数的含义进行判断.详解:因为回归方程ˆˆˆybx a =+必过样本点的中心(),x y ,所以A 对, 因为残差平方和越小拟合的效果越好,所以B 对, 因为相关指数2R 越大拟合效果越好,所以C 错, 因为相关系数绝对值越接近1越具有线性相关,所以D 对, 因此选C.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .4.B解析:B 【分析】计算2x =, 4.5y =,代入回归方程计算得到 2.6a =,再计算得到答案. 【详解】013424x +++==, 2.2 4.3 4.8 6.74.54y +++==,故4.50.952a =⨯+,解得2.6a =.当5x =,0.955 2.67.35y =⨯+=. 故选:B 【点睛】本题考查了回归方程的应用,意在考查学生的计算能力.5.D解析:D 【分析】先求 3.92x =,2y =,根据0.7a y x =-,求解0.744a =-,将8x =代入回归直线方程为0.7y x a =+,求解即可. 【详解】2.2 2.43.8 5.2 6.03.925x ++++==,0.2 1.5 2.0 2.5 3.825y ++++==0.720.7 3.920.744a y x =-=-⨯=-即0.70.744y x =-令8x =,则0.780.744 4.856y =⨯-= 故选:D 【点睛】本题考查回归分析,样本中心点(),x y 满足回归直线方程,是解决本题的关键.属于中档题.6.D解析:D 【分析】由椭圆定义,复合命题的真假,命题的否定,相关系数的概念进行判断. 【详解】椭圆22421x y +=的标准方程是2211142x y +=,21,2a a ==,2ABF ∆的周长为442a =⨯=A 正确; 若“p q ∨”为假命题,则,p q 都是假命题,,p q 只要有一个为真,则p q ∨为真,B 正确; 命题00:,ln 1p x R x ∃∈<,则命题:,ln 1p x R x ⌝∀∈≥,C 正确; 两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,D 错. 故选:D . 【点睛】本题考查命题的真假判断,解题关键是掌握相关概念,如椭圆标准方程中长轴长的确定,复合命题的真值表,含有一个题词的命题的否定,相关系数与相关性的判断.7.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,且为正相关, 所以r 变大,2R 变大,残差平方和变小, 故选A. 【点睛】该题考查的是有关线性相关性强弱的问题,涉及到的知识点有相关系数,相关指数,以及残差平方和与相关性的关系,属于简单题目.8.B解析:B 【分析】将175代入线性回归方程计算理论值,实际数值减去理论数值得到答案. 【详解】已知y 与x 的线性回归方程为ˆ0.8585.71yx =- 当175x =时:63.04y = 相应的残差为:6463.040.96-= 故答案选B 【点睛】本题考查了残差的计算,意在考查学生的计算能力.9.C解析:C 【分析】计算样本中线点,根据线性回归方程恒过样本中心点,列出方程,求解即可得到结论. 【详解】由题意,136********,444a a x y +++++++====, 因为y 关于x 的线性回归方程为: 2.115.ˆ5yx =-+, 所以得到14 2.1515.54a+=-⨯+,解得6a =, 根据题意可得变量x 与y 线性负相关,所以A 错, x 的值为2时,y 的值大约为11.3,所以B 错,变量x 与y 之间是相关关系,所以D 错,只有C 是正确的,故选C. 【点睛】该题考查的是有关线性回归的问题,涉及到的知识点有回归直线恒过样本中心点,两个变量之间的正负相关的判断,属于简单题目.10.C解析:C 【解析】若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∈,210x x -+≥;已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均减少4个单位;命题“若圆()()22:11C x m y m -++-=与两坐标轴都有公共点,则101,11m m m ⎧≤⎪∴≤≤⎨-≤⎪⎩为真命题;已知随机变量()22X N ,σ~,若()0.32P X a <=,则()40.32P X a >-=;所以选C.11.D解析:D 【分析】根据题意,可列出y 关于x 的表格,求出,x y ,代入0.4188y kx =-,求出k ,即可求解 【详解】由题,对数据进行处理,得出如下表格: 求得49.5x =,0.195y =,因样本中心(,x y 过线性回归方程,将(,x y 代入0.4188y kx =-,得0.0124k =,即0.01240.4188y x =-,年龄在[]60,64对应的x 为62,将62x =代入0.01240.4188y x =-得:0.0124620.41880.35y =⨯-=,对应的爱看人数比为:0.35 故选:D 【点睛】本题考查线性回归方程的应用,样本中心(),x y 过线性回归方程是一个重要特征,属于中档题12.B解析:B 【分析】由表中数据计算求得,x y ,根据回归直线经过样本中心点,求出m 的值. 【详解】由表中数据,计算可得2456855x ++++==,3050706021055m my +++++==,因为回归直线方程ˆ 6.517.5yx =+过样本中心点, 所以有210 6.5517.55m+=⨯+,解得40m =, 故选:B. 【点睛】关键点点睛:该题考查的是有关回归直线的问题,正确解题关键是掌握回归直线过样本中心点.13.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.二、解答题14.(1)ˆ0.5 2.3yt =+;(2)6.8千元. 【分析】(1)利用最小二乘法求y 关于t 的线性回归方程;(2)由(1)知0.50b =>得解,将2020年的年份代号9t =代入ˆ0.5 2.3yt =+即得解. 【详解】 (1)由题知()1123456747t =++++++=; ()12.93.3 3.64.4 4.85.2 5.9 4.37y =++++++=; ()()71ii i tty y =--∑()()()()()()3 1.42110.700.110.520.930.16=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯14=;()721941014928i i tt =-=++++++=∑;()()()7172114ˆ0.528ii i i i tty y bt t ==--===-∑∑; ˆ 4.30.54 2.3ay bt =-=-⨯=; 所以y 关于t 的线性回归方程ˆ0.5 2.3yt =+.(2)由(1)知0.50b =>,故2012年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元,将2020年的年份代号9t =代入ˆ0.5 2.3yt =+,可得ˆ 6.8y =, 故该地区2020年农村居民家庭人均纯收入6.8千元. 【点睛】方法点睛:求回归直线方程,一般利用最小二乘法,先求出ˆˆ,,,x y ab ,即得线性回归方程. 15.(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,95. 【分析】(1)代入公式计算,解得0.8r >即可得解;(2)由超几何分布概率公式计算出(0)P X =、(1)P X =、(2)P X =、(3)P X =、(4)P X =,进而可得分布列,再由数学期望的公式即可得数学期望.【详解】(1)由题意,20()()ii xx y y r --==∑6260.87.515>==>=⨯=, 所以“数学学期综合成绩”与“物理学期综合成绩”高度相关; (2) 由题意得:X 的可能取值为0,1,2,3,4.,根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以9222036(0)190C P X C ===,49112203619(1)0C C P X C ===,2112204791609(29)C C C P X C +===,114722023810(9)C C P X C ===,27220(4)21190C P X C ===,所以X 的分布列为:所以190190190()012341901901905E X =⨯+⨯+⨯+⨯+⨯==. 【点睛】关键点点睛:解决本题的关键是对r 的值合理放缩及超几何分布的应用.16.(1)ˆ8.5125.5yx =-+;(2)66人;(3)能判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关. 【分析】(1)利用所给数据求回归直线方程的相关数据,根据代入公式即可得违章人数y 与月份x之间的回归直线方程ˆˆˆybx a =+; (2)代入7x =即可判断7月份不“礼让斑马线”违章驾驶员的人数;(3)求出2k ,即可判断判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关. 【详解】解:(1)由表中数据知:3,100x y ==∴122114151500ˆ8.55545ni ii nii x ynx ybxnx ==--===---∑∑,ˆ125.ˆ5a y bx =-=, ∴所求回归直线方程为ˆ8.5125.5yx =-+. (2)由(1)知,令7x =,则ˆ8.57125.566y=-⨯+=人. (3)由表中数据得2250(221288)505.556 5.024*********K ⨯⨯-⨯==≈>⨯⨯⨯,根据统计有97.5%的把握认为“礼让斑马线”行为与驾龄有关. 【点睛】本题考查回归直线方程的应用,独立检验的应用,是基本知识的考查.17.(1)5572ˆyx =+(2)见解析(3)7950万元 【分析】(1)先进行数据处理:每个温差值减去12,每个发芽数减去86,得到新的数据表格,求出11ˆ,,,ˆy bx a ,的值,最后求出y 关于x 的线性回归方程y bx a =+; (2)根据线回归方程,分别计算当8x =时,当10x =时,它们的估计值,然后判断(1)中得到的线性回归方程是否可靠;(3)当9x =时,根据线性回归方程计算出ˆy的值,然后计算出发芽率以及收益. 【详解】数据处理12x -;86y -. (1)此时:10x =,11y =,11302ˆb ==+-⨯,11ˆˆ1012a yb x =-⋅=-⨯=, ∴586(12)2ˆ1yx -=-+,∴5572ˆyx =+. (2)当8x =时:ˆ77y=,797722-=≤符合, 当10x =时:ˆ82y=,828112-=≤符合, 前两组数据均符合题意,该回归直线方程可靠.(3)当9x =时,ˆ79.5y=. 发芽率79.5%79.5%100n ==,∴79.5n =. 收益:79.51010⨯⨯(万亩)7950=(万元). 种植小麦收益为7950万元. 【点睛】本题考查了求线性回归方程,以及用数据检验线性回归方程是否可靠,考查了应用线性回归方程估计收益问题,考查了数学应用能力.18.(1)0.50.4y x =+;(2)正相关;(3)5.9万元. 【分析】(1)首先求出x ,y 的平均数,利用最小二乘法做出b 的值,再利用样本中心点满足线性回归方程和前面做出的横标和纵标的平均值,求出a 的值,写出线性回归方程. (2)根据0.50b =>,即可得出结论;(3)第6名推销员的工作年限为11年,即当11x =时,把自变量的值代入线性回归方程,得到y 的预报值,即估计出第6名推销员的年推销金额为5.9万元. 【详解】(1)由题意知:6x =, 3.4y =于是:211256 3.40.520056b -⨯⨯==-⨯, 3.40.560.4a =-⨯=,故:所求回归方程为0.50.4y x =+;(2)由于变量y 的值随着x 的值增加而增加(0.50)b =>,故变量x 与y 之间是正相关 (3)将11x =带入回归方程可以估计他的年推销金额为0.5110.4 5.9y =⨯+=万元. 【点睛】本题考查回归分析的初步应用,考查利用最小二乘法求线性回归方程,是一个综合题目. 19.有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【分析】本题先求合计的4个值,再根据公式计算随机变量,接着比较数值大小,判断即可. 【详解】1112212218,12,5,78n n n n ====,所以121230,83,23,90,113n n n n n ++++=====. 所以()21122122121212n n n n n n n n n χ++++-=2113(1878512)39.6 6.63530832390⨯⨯-⨯=≈>⨯⨯⨯.所以有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【点睛】本题考查独立性检验,是基础题20.(1)ˆ0.850.6yx =+;(2)①年销售量为9.1,年利润的预报值为2.25;②5万元 【分析】(1)利用回归直线方程计算公式,计算出回归直线方程.(2)①先求得年利润z 关于x 的表达式,然后将10x =分别代入回归直线方程和年利润的函数表达式,由此求得年销售量及年利润的预报值②求得年利润与年宣传费的比值w 的表达式,利用基本不等式求得5x =时,年利润与年宣传费的比值最大. 【详解】 (1)由题意2453645x ++++==, 2.5 4.543645y ++++==,21222188.554ˆ0.859054ni ii nii x y nx ybxnx ==--⨯∴===-⨯-∑∑, ˆˆ40.8540.6ay bx =-=-⨯=, 0.80.ˆ56yx ∴=+. (2)①由(1)得220.05 1.850.050.85 1.25z y x x x =+--=--,当10x =时,0.85100.ˆ69.1y∴=⨯+=,20.05100.8510 1.25 2.25z =-⨯⨯-=+. 即当年宣传费为10万元时,年销售量为9.1,年利润的预报值为2.25. ②令年利润与年宣传费的比值为w ,则()1.250.050.850w x x x=--+>,1.25 1.250.050.850.050.85w x x x x ⎛⎫=--+=-++≤- ⎪⎝⎭0.850.35=. 当且仅当 1.250.05x x=即5x =时取最大值.故该公司应该投入5万元宣传费,才能使得年利润与年宣传费的比值最大. 【点睛】本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,考查利用基本不等式求最值,属于中档题.21.(1)可以用线性回归模型拟合y 与x 的关系;(2)0.351y x =+,预测2月10日全国累计报告确诊病例数约有4.5万人. 【分析】(1)根据已知数据,利用公式求得()()9.9080.995.3 1.88niix x y y r --===⨯∑,再根据r 的值越大说明它们的线性相关性越高来判断.(2)由(1)的相关数据,求得()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,写出回归方程,然后将10x =代入回归方程求解. 【详解】(1)由已知数据得,4x =,16.92.4147y ==, 所以()()1177.574 2.4149.908nniii ii i xx y y x y nxy==--=-=-⨯⨯=∑∑,5.3===,所以()()9.9080.995.3 1.88niix x y y r --===⨯∑.因为y 与x 的相关近似为0.99,说明它们的线性相关性相当高,从而可以用线性回归模型拟合y 与x 的关系.(2)由(1)得,()()()1219.9080.35428niii nii x x y y b x x ==--===-∑∑, 2.4140.35440.998a y bx =-=-⨯=,所以,y 关于x 的回归方程为:0.351y x =+,2月10日,即10x =代入回归方程得:0.35101 4.5y =⨯+=. 所以预测2月10日全国累计报告确诊病例数约有4.5万人. 【点睛】本题主要考查线性回归分析和回归方程的求解及应用,还考查了运算求解的能力,属于中档题.22.(1)1225;1950(2)有99.9%的把握认为学习积极性与对待班级工作的态度有关,理由见解析 【分析】(1)根据给数据,代入古典概型的概率计算公式即可;(2)计算出2K 的值,对照表中数据,即可得出结论. 【详解】解:(1)抽到积极参加班级工作的学生的概率为24125025= 抽到不太主动参加班级工作且学习积极性一般的学生的概率是1950(2)()22501819675030030030011.5252524262525242626K ⨯⨯-⨯⨯⨯===≈⨯⨯⨯⨯⨯⨯ 因11.510.828>,()210.8280.001P K ≥=因此我们有99.9%的把握认为学习积极性与对待班级工作的态度有关. 【点睛】本题考查了古典概率的计算以及独立性检验的应用,考查了计算能力,属于中档题. 23.(1)有99.9%的把握说明是否喜欢冲浪运动与性别相关;(2)21. 【分析】(1)根据公式求出22100(20102050)8001210.8284060703063k ⨯⨯-⨯==>>⨯⨯⨯,即可判定;(2)a 的值越大则2K 的值越小,由(1)知:当20a =时有99.9%把握说明是否喜欢冲浪运动与性别相关,依次检验21a =,22a =是否满足即可得解. 【详解】解:(1)由题知20b =,所以22100(20102050)8001210.8284060703063k ⨯⨯-⨯==>>⨯⨯⨯,所以有99.9%的把握说明是否喜欢冲浪运动与性别相关;(2)由(1)知:当20a =时有99.9%把握说明是否喜欢冲浪运动与性别相关若21a =,则2225741110.82867129k ⨯=>>⨯⨯,有99.9%的把握说明是否喜欢冲浪运动与性别相关若22a =,则2225681010.82867228k ⨯=<<⨯⨯,没有99.9%的把握说明是否喜欢冲浪运动与性别相关由题知:a 的值越大则2K 的值越小,所以当22a ≥时均没有99.9%的把握说明是否喜欢冲浪运动与性别相关所以a 的最大值等于21 【点睛】此题考查独立性检验问题,关键在于根据公式准确计算2K 的值,准确辨析,此类问题容易在最后下结论出现错误.24.列联表见解析,有99.9%的把握说选科与性别有关. 【分析】选物理的男生38人,则女士12人,选历史的男生14人,则女士36人,即可完成22⨯列联表,做出假设0H :选科与性别没有关系,再由表中数据计算2K 的观测值,可得观测值。

新人教版高中数学选修三第三单元《成对数据的统计分析》测试(答案解析)(4)

新人教版高中数学选修三第三单元《成对数据的统计分析》测试(答案解析)(4)

一、选择题1.有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++优秀 非优秀 总计甲班 10 b 乙班c30()2P K k ≥0.050 0.010 0.001 k3.8416.63510.828已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为20, b 的值为45C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 2.以下说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均增加5个单位 ③线性回归方程ˆy bx a =+必过(),x y④设具有相关关系的两个变量,x y 的相关系数为r ,那么||r 越接近于0,,x y 之间的线性相关程度越高;⑤在一个22⨯列联表中,由计算得2K 的值,那么2K 的值越大,判断两个变量间有关联的把握就越大。

其中错误..的个数是( ) A .0 B .1C .2D .33.某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)附表:则下列选项正确的是( )A .有99.5%的把握认为使用智能手机对学习有影响B .有99.5%的把握认为使用智能手机对学习无影响C .有99.9%的把握认为使用智能手机对学习有影响D .有99.9%的把握认为使用智能手机对学习无影响4.下列命题中正确的个数( )①“0x ∀>,2sin x x >”的否定是“00x ∃≤,002sin x x ≤”;②用相关指数2R 可以刻画回归的拟合效果,2R 值越小说明模型的拟合效果越好;③命题“若0a b >>0>>”的逆命题为真命题;④若22(1)mx m x -+30m ++≥的解集为R ,则m 1≥.A .0B .1C .2D .35.从某大学中随机选取8名女大学生,其身高x (单位:cm )与体重y (单位:kg )数据如下表:若已知y 与x 的线性回归方程为ˆ0.8585.71yx =-,那么选取的女大学生身高为175cm 时,相应的残差为( ) A .0.96-B .0. 96C .63. 04D . 4.04-6.在下列命题中,下列选项正确的是( )A .在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.B .两个变量相关性越强,则相关系数r 就越接近于1.C .在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.D .若,a b 是两个相等的非零实数,则()()a b a b i -++是纯虚数. 7.下列说法中正确的是 ( )①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱;②回归直线y bx a =+一定经过样本点的中心(),x y ;③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A .①②B .③④C .①④D .②③8.已知回归方程21y x =-,则该方程在样本(3,4)处的残差为( ) A .-1B .1C .2D .59.已知变量x 与变量y 之间具有相关关系,并测得如下一组数据:则变量x 与y 之间的线性回归直线方程可能为A .ˆy =0.7x –2.3B .ˆy =–0.7x+10.3C .ˆy =–10.3x+0.7D .ˆy=10.3x –0.7 10.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若,线性相关,线性回归方程为0.7y x a =+,则以下判断正确的是( ) A .x 增加1个单位长度,则y 一定增加0.7个单位长度 B .x 减少1个单位长度,则y 必减少0.7个单位长 C .当6x =时,y 的预测值为8.1万盒 D .线性回归直线0.7y x a =+,经过点()2,611.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:()()()()()1122334455,,,,,,,,,x y x y x y x y x y ,据收集到的数据可知12345100x x x x x ++++=,由最小二乘法求得回归直线方程为ˆ0.6754.8yx =+,则12345y y y y y ++++的值为( )A .68.2B .341C .355D .366.212.下列四个命题:①在回归模型中,预报变量y 的值不能由解释变量x 唯一确定;②若变量x ,y 满足关系0.11y x =-+,且变量y 与z 正相关,则x 与z 也正相关;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④以模型kx y ce=去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则4c e =,0.3k =.其中真命题的个数为( )A .1个B .2个C .3个D .4个13.下列说法中错误的是( )A .先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +的学生,这样的抽样方法是系统抽样法.B .正态分布()1,9N 在区间()1,0-和()2,3上取值的概率相等C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .若一组数据123a 、、、的平均数是2,则这组数据的众数和中位数都是2二、解答题14.近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.(1)完成下面22⨯列联表,并通过计算说明是否可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关?2.072(2()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++)(2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X :①求对商品和服务全好评的次数X 的分布列(概率用组合数算式表示); ②求X 的数学期望和方差.15.为初步了解学生家长对艺术素质评价的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:(1)将学生家长对艺术素质评价的了解程度分为“比较了解”(得分不低于60分)和“不太了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99.9%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.附:()()()()2n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.16.“每天锻炼一小时,健康工作五十年,幸福生活一辈子.”一科研单位为了解员工爱好运动是否与性别有关,从单位随机抽取30名员工进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到爱好运动的员工的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有把握认为爱好运动与性别有关? (2)若从这30人中的女性员工中随机抽取2人参加一活动,记爱好运动的人数为X ,求X 的分布列、数学期望.17.双十一购物狂欢节,是指每年11月11日的网络促销日,源于淘宝商城(天猫)2009年11月11日举办的网络促销活动,已成为中国电子商务行业的年度盛事.某生产商为了了解其生产的产品在不同电商平台的销售情况,统计了A B 、两个电商平台各十个网络销售店铺的销售数据:(1)作出A B 、两个电商平台销售数据的茎叶图,根据茎叶图判断哪个电商平台的销售更好,并说明理由;(2)填写下面关于店铺个数的22⨯列联表,并根据列联表判断是否有95%的把握认为销售量与电商平台有关;(3)生产商要从这20个网络销售店铺销售量前五名的店铺中,随机抽取三个店铺进行销售返利,则其中恰好有两个店铺的销售量在95以上的概率是多少?附:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.18.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据1求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(附:42186i i x ==∑,4166.5i i i x y ==∑,()()()1122211nniii ii i nniii i x x yy x ynxy b x x xnx ====---==--∑∑∑∑,ˆˆay bx =-,其中x ,y 为样本平均值)19.某中学为研究学生的身体素质与体育锻炼时间的关系,对该校100名高三学生平均每天体育锻炼时间进行调查,其中女生为55人,如表:(平均每天锻炼的时间单位:分钟)将学生日均体育锻炼时间在[40,60]的学生评价为“锻炼达标”.(1)若女生锻炼达标人数为10人,通过计算判断,是否能在犯错误的概率不超过0.025的前提下认为“锻炼达标”与性别有关?(2)在(1)的条件下“锻炼达标”的学生中,按男女用分层抽样方法抽出15人,进行体育锻炼体会交流,求这15人中,男生、女生各有多少人? 参考公式:22()()()()()()a b c d ad bc K a b c d a c b d +++-=++++临界值表:20.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表:(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆybx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.参考公式:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-.21.某班主任对全班50名学生学习积极性和对待工作的态度进行了调查,统计数据如下所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:有多大把握认为学生的学习积极性与对班级工作的态度有关系?并说明理由. 本题参考数据:22.假设关于某设备的使用年限x (年)和所支出的维修费用y 万元有如下的统计资料:(1)画出散点图并判断是否线性相关; (2)如果线性相关,求线性回归方程; (3)估计使用年限为10年时,维修费用是多少?附注:①参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计分别为()()()1122211ˆˆˆ,n niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑; ②参考数据:55552111120,25,90,112.3ii ii i i i i i xy x x y ========∑∑∑∑23.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++为样本容量.2()p K k≥0.150.100.050.0250.0100.0050.001k 2.072 2.706 3.841 5.024 6.6357.87910.828选物理选历史总计男生女生总计24.如图是某公司一种产品的日销售量y(单位:百件)关于日最高气温x(单位:C︒)的散点图.数据:x1315192021 y2628301836(1)请剔除一组数据,使得剩余数据的线性相关性最强,并用剩余数据求日销售量y关于日最高气温x的线性回归方程y bx a=+;(2)根据现行《重庆市防暑降温措施管理办法》.若气温超过36度,职工可享受高温补贴.已知某日该产品的销售量为53.1,请用(1)中求出的线性回归方程判断该公司员工当天是否可享受高温补贴?附:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-.25.通过市场调查,得到某产品的资金投入x (万元)与获得的利润y (万元)的数据,如下表所示: 资金投入x 2 3 4 5 6利润y23569(1)画出数据对应的散点图(2)根据上表提供的数据,用最小二乘法求线性回归直线方程ˆˆˆybx a =+; (3)现投入资金10(万元),求估计获得的利润为多少万元.26.某市实施二手房新政一年多以来,为了了解新政对居民的影响,房屋管理部门调查了2018年6月至2019年6月期间购买二手房情况,首先随机抽取了其中的400名购房者,并对其购房面积m (单位:平方米,60130m ≤≤)讲行了一次统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年6月至2019年6月期间当月在售二手房的均价y (单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年6月至2019年6月)(1)试估计该市市民的平均购房面积m (同一组中的数据用该组区间的中点值为代表);(2)从该市2018年6月至2019年6月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X ,求X 的分布列与数学期望;(3)根据散点图选择ˆˆya x =+ˆˆˆln y c d x =+两个模型讲行拟合,经过数据处理得到两个回归方程,分别为ˆ0.93690.0285yx =+ˆ0.95540.0306ln y x =+,并得到一些统计量的值,如表所示:ˆ0.93690.0285yx =+ ˆ0.95540.0306ln yx =+请利用相关系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年8月份的二手房购房均价(精确到0.001).参考数据:ln 20.69≈,ln3 1.10≈,ln15 2.71≈ 1.73≈ 3.87≈,4.12≈参考公式:()()niix x y y r --=∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】由成绩优秀的概率,可求的成绩优秀的人数,进而求出非优秀人数,得到,b c 的值,计算K 的观测值2K ,对照题目中的表格,即可得到统计的结论.【详解】由题意,在全部的105人中随机抽取1人,成绩优秀的概率为27,所以成绩又由的人数为2105=307⨯人,非优秀的人数为1053075-=人, 所以301020,753045c b =-==-=,则K 的观测值()22105103020453366.110 3.8413075505555K ⨯⨯-⨯==≈>⨯⨯⨯,若按95%的可靠性要求,能认为“成绩与班级有关系”. 故选:C. 【点睛】本题主要考查了独立性检验的应用问题,同时考查了运算与求解能力,属于基础题.2.C解析:C 【分析】根据用样本估计总体、线性回归方程、独立性检验的基本概念和基本性质,逐项判断,即可得到本题答案. 【详解】方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均减少5个单位,故②不正确;线性回归方程ˆy bx a =+必过样本中心点,故③正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,||r 越接近于1,相关程度越大,故④不正确;对于观察值2K 来说,2K 越大,“x 与y 有关系”的可信程度越大,故⑤正确. 故选:C 【点睛】本题主要考查用样本估计总体、线性回归方程、独立性检验的基本思想.3.A解析:A 【解析】分析:根据列联表中数据利用公式求得2K ,与邻界值比较,即可得到结论. 详解:根据卡方公式求得()223081281020101218K -==⨯⨯⨯,27.89710.828K <<,∴该研究小组有99.5%的把握认为中学生使用智能手机对学生有影响,故选A.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.C解析:C 【分析】根据含量词命题的否定可知①错误;根据相关指数的特点可知2R 越接近0,模型拟合度越低,可知②错误;根据四种命题的关系首先得到逆命题,利用不等式性质可知③正确;分别在0m =和0m ≠的情况下,根据解集为R 确定不等关系,从而解得m 范围,可知④正确. 【详解】①根据全称量词的否定可知“0x ∀>,2sin x x >”的否定是“00x ∃>,002sin x x ≤”,则①错误;②相关指数2R 越接近1,模型拟合度越高,即拟合效果越好;2R 越接近0,模型拟合度越低,即拟合效果越差,则②错误;③若“0a b >>0>>”的逆命题为:若“0>>,则0a b >>”,根据不等式性质可知其为真命题,则③正确;④当0m =时,()2213230mx m x m x -+++=-+≥,此时解集不为R ,不合题意;当0m ≠时,若()22130mx m x m -+++≥解集为R ,只需:()()241430m m m m >⎧⎪⎨+-+≤⎪⎩解得:m 1≥,则④正确.∴正确的命题为:③④本题正确选项:C 【点睛】本题考查命题真假性的判断,涉及到含量词命题的否定、四种命题的关系及真假性的判断、相关指数的应用、根据一元二次不等式解集为R 求解参数范围的知识.5.B解析:B 【分析】将175代入线性回归方程计算理论值,实际数值减去理论数值得到答案. 【详解】已知y 与x 的线性回归方程为ˆ0.8585.71yx =- 当175x =时:63.04y = 相应的残差为:6463.040.96-= 故答案选B 【点睛】本题考查了残差的计算,意在考查学生的计算能力.6.D解析:D 【分析】根据回归方程的定义判断A ;根据相关系数的定义判断B ;根据残差图的性质判断C ;根据纯虚数的定义判断D . 【详解】在回归直线0.585y x =-中,变量200x =时,得到15只是变量y 的一个预测值,故A 不正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,故B 不正确;在残差图中,残差点比较均匀落在水平的带状区域中,带状区域的宽度越小,拟合效果越好,故C 不正确;若,a b 是两个相等的非零实数,则()()2a b a b i ai -++=,且20a ≠,符合纯虚数的定义,D 正确,故选D. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.D解析:D 【分析】运用相关系数、回归直线方程等知识对各个选项逐一进行分析即可 【详解】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,相关性越强,故错误②回归直线y bx a =+一定经过样本点的中心()x y ,,故正确③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度,故正确 ④相关指数2R 用来刻画回归的效果,2R 越大,说明模型的拟合效果越好,故错误 综上,说法正确的是②③ 故选D 【点睛】本题主要考查的是命题真假的判断,运用相关知识来进行判断,属于基础题8.A解析:A 【解析】分析:利用回归方程,计算3x =时,ˆy 的值,进而可求方程在样本()3,4处的残差. 详解:当3x =时,235ˆ1y=⨯-=, ∴方程在样本()3,4处的残差是451,-=- 故选A.点睛:本题考查线性回归方程的运用,考查学生的计算能力,属于基础题.9.B解析:B 【解析】根据表中数据,得14x =(6+5+10+12)=334,14y =(6+5+3+2)=4,且变量y 随变量x 的增大而减小,是负相关,所以,验证334x =时,ˆy=–0.7×334+10.3≈4,即回归直线ˆy =–0.7x +10.3过样本中心点(x ,y ).故选B .10.C解析:C 【分析】通过线性回归方程可以进行预测而不能做出确定的判断,排除A ,B 选项;线性回归方程一定过样本中心点(,)x y ,排除D 选项;令6x =,代入方程求y ,可得C 正确. 【详解】由ˆˆ0.7yx a =+,得x 每增(减)一个单位长度,y 不一定增加(减少)0.7,而是大约增加(减少)0.7个单位长度,故选项A,B 错误;由已知表中的数据,可知12345556683,655x y +++=++++====,则回归直线必过点(3,6),故D 错误;代入回归直线ˆˆ0.7y x a =+,解得ˆ 3.9a =,即ˆ0.7 3.9y x =+,令6x =,解得ˆy=0.76 3.98.1⨯+=万盒, 故选:C 【点睛】本题考查了线性回归方程的性质,正确掌握线性回归方程的性质是解题的关键.11.B解析:B 【分析】计算20x =,则0.6754.868.2y x =+=,计算得到答案. 【详解】12345100x x x x x ++++=,故20x =,则0.6754.868.2y x =+=,故123455341y y y y y y =+=+++. 故选:B. 【点睛】本题考查了回归方程的中心点,意在考查学生的计算能力和应用能力.12.C解析:C 【分析】直接利用回归直线的方程的应用,相关的变量关系的应用,残差图的应用分析结果. 【详解】 下列四个命题:①在回归模型中,预报变量y 的值不能由解释变量x 唯一确定;根据回归模型中的变量关系,正确.②若变量x ,y 满足关系0.11y x =-+,且变量y 与z 正相关,则x 与z 也正相关;应该是负相关.故错误.③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;即越接近于回归直线的距离越小,故正确.④以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则4c e =,0.3k =.故正确. 故选:C . 【点睛】此题考查回归分析和相关概念辨析,涉及非线性回归模型的处理方法以及对残差图的理解认识.13.C解析:C 【分析】对于A ,根据系统抽样的定义可判断;对于B ,根据正态分布的对称性可判断在两个区间上的概率;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,可进行判断;对于D ,根据一组数据123a 、、、的平均数是2,得2a =,求得该组数据的众数和中位数,可判断D. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A 正确;对于B ,正态分布()19N ,的曲线关于1x =对称,区间()10-,和()23,与对称轴距离相等,所以在两个区间上的概率相等,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,C 错误; 对于D ,一组数据123a 、、、的平均数是2,2a ∴=;所以该组数据的众数和中位数均为2,D 正确.. 【点睛】本小题考查系统抽样,线性回归,线性相关,平均数,中位数与众数等基础知识,意在考查学生分析问题,及解决问题的能力和运算求解能力.二、解答题14.(1)列联表见解析,可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关;(2)①分布列见解析;②()2E X =,() 1.2D X =. 【分析】(1)根据题中数据即可完善列联表,计算出卡方值,和10.828比较,即可判断; (2)①可得X 的取值可以是0,1,2,3,4,5,且()5,0.4X B ,计算出X 取不同值的概率,即可得出分布列; ②利用期望和方差公式即可求出. 【详解】(1)由题可得22⨯列联表如下:所以2200(80104070)11.11110.8281505012080K ⨯⨯-⨯=≈>⨯⨯⨯,所以可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关; (2)①每次购物时,对商品和服务全好评的概率为800.4200=,且X 的取值可以是0,1,2,3,4,5,()5,0.4XB则()500.6P X ==,()14510.40.6P X C ==⨯⨯,()223520.40.6P X C ==⨯⨯,()332530.40.6P X C ==⨯⨯,()44540.40.6P X C ==⨯⨯,()550.4P X ==,则分布列如下:②5,0.4XB ,()50.42E X ∴=⨯=,()50.40.6 1.2D X =⨯⨯=.【点睛】关键点睛:本题考查分布列的求解,解题的关键是判断出变量服从二项分布,知道二项分布的概率求法以及期望方差公式.15.(1)有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)分布列见解析,21()10E X = 【分析】(1)完成列联表,求出211.2910.828X ≈>,从而有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)推导出7~3,10X B ⎛⎫⎪⎝⎭,由此能求出X 的概率分布和数学期望. 【详解】解:(1)由题意得到列联表如下:211.29()()()()30704258K a b c d a c b d ==≈++++⨯⨯⨯.11.2910.828>,∴有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关.(2)由题意得该校1名学生家长“比较了解”的概率为70710010=,且7~(3,)10X B ,033327(0)()101000P X C ===,12373189(1)()()10101000P X C ===, 22373441(2)()()10101000P X C ===,3337343(3)()101000P X C ===,X ∴的分布列为:()0123100010001000100010E X =⨯+⨯+⨯+⨯=. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. 16.(1)没有把握认为爱好运动与性别有关;(2)67. 【分析】(1)由30人中随机抽取1人抽到爱好运动的员工的概率是815,故爱好运动的员工共有16人,即可补充完整,再根据独立性检验的临界值表,即可判断;(2)利用排列组合求出X 各个取值的概率,求出分布列,代入期望公式,即可得解. 【详解】(1)由30人中随机抽取1人抽到爱好运动的员工的概率是815, 故爱好运动的员工共有16人,由表中男爱好运动的员工为10人, 可得女爱好运动的员工有6人, 故列联表补充如下:230(10866) 1.158 3.84116141614k ⨯⨯-⨯=≈<⨯⨯⨯,所以没有把握认为爱好运动与性别有关; (2)X 的可能取值为0,1,2.282144(0)13C P X C ===,118621448(1)91C C P X C ===,2621415(2)=91C P X C ==,所以X 的分布列为: 448156()0121391917E X =⨯+⨯+⨯=. 【点睛】本题考查了独立性检验和超几何分布,考查了离散型随机变量概率和期望的计算,有一定的计算量,是常规题,属于中档题.17.(1)茎叶图见解析,B 电商平台的销售更好,理由见解析(2)22⨯列联表答案见解析,没有95%的把握认为销售量与电商平台有关. (3)0.6 【分析】(1)由已知数据作出茎叶图,由茎叶图可知,A 电商、B 电商平台销售量的中位数及平均数,可得B 电商平台的销售更好;(2)由题中数据,可将22⨯列联表补充完整,数据代入公式可得2 3.333 3.841K ≈<,故没有95%的把握认为销售量与电商平台有关;(3)由已知数据,从销售量前五名的店铺选取三个店铺共有10种情况,其中恰好有两个店铺的销售量在95以上的情况有6种,由古典概型求概率可得. 【详解】(1)由已知数据作出茎叶图如下:9 4 0 6 09531 0 7 6 7218 0 3 794667由茎叶图可知:B 电商平台的销售更好,理由如下:①由茎叶图可知,A 电商平台销售量的中位数为72,B 电商平台销售量的中位数为85,因此B 电商平台的销售更好.②由茎叶图可求得A 电商平台销售量的平均数为72.4,B 电商平台销售量的平均数为84.6,因此B 电商平台的销售更好. (2)由题中数据,可得22⨯列联表如下:220(848)3203.333 3.841812101096K ⨯-∴==≈<⨯⨯⨯,∴没有95%的把握认为销售量与电商平台有关.(3)由已知数据,销售量前五名的店铺,销售量分别为97,96,96,94,87. 设对应的店铺分别为12312,,,,a a a b b .从其中选取三个店铺共有10种情况,如下:()123,,a a a ,()121,,a a b ,()122,,a a b ,()311,,a a b ,()312,,a a b ,()112,,a b b ,()321,,a a b ,()322,,a a b ,()112,,a b b ()312,,a b b .其中恰好有两个店铺的销售量在95以上的情况有6种:()121,,a a b ,()122,,a a b ,()311,,a a b ,()312,,a a b ,()321,,a a b ,()322,,a a b .∴其中恰好有两个店铺的销售量在95以上的概率60.610P ==. 【点睛】本题为统计与概率综合问题,考查茎叶图、列联表、相关性分析、古典概型求概率等知识的应用,考查数据分析能力,属于中等题. 18.(1)0.70.35y x =+;(2)19.65. 【分析】(1)由表中数据和参考公式即求线性回归方程; (2)根据(1)中的线性回归方程进行预测,即得答案. 【详解】。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、选择题1.有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++优秀 非优秀 总计甲班 10 b 乙班c30()2P K k ≥0.050 0.010 0.001 k3.8416.63510.828已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为20, b 的值为45C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 2.某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)附表:20()P K k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.828则下列选项正确的是( )A .有99.5%的把握认为使用智能手机对学习有影响B .有99.5%的把握认为使用智能手机对学习无影响C .有99.9%的把握认为使用智能手机对学习有影响D .有99.9%的把握认为使用智能手机对学习无影响 3.下列说法正确的是( )A .在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B .线性回归方程对应的直线y b x a ∧∧∧=+至少经过其样本数据点中的()11,x y ,()22,x y ,()33,x y(),n n x y 一个点C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果差 4.下列说法中正确的是( )A .“a b >”是“22a b >”成立的充分不必要条件B .命题:,20x p x R ∀∈>,则00:,20xp x R ⌝∃∈<C .为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为40D .已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为^ 1.230.08y x =+.5.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如表(单位:万元):由上表可得回归方程为10.2y x a =+,又已知生产该商品的成本(不含广告费)为2325x x+(单位:万元),据此模型预测最大的纯利润为( ) A .30.15万元B .21.00万元C .19.00万元D .10.50万元6.已知x 、y 的取值如下表:从散点图可以看出y 与x 线性相关,且回归方程0.95y x a =+,则当5x =时,估计y 的值为( )A .7.1B .7.35C .7.95D .8.67.下列说法中正确的个数是( )①相关系数r 用来衡量两个变量之间线性关系的强弱,||r 越接近于1,相关性越弱; ②回归直线^^^y b x a =+过样本点中心(,)x y ;③相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好. A .0B .1C .2D .38.①线性回归方程对应的直线ˆˆˆy bx a =+至少经过其样本数据点1122(,),(,)(,)n n x y x y x y 中的一个点;②若两个变量的线性相关性越强,则相关系数的绝对值越接近于1;③在某项测量中,测量结果ξ服从正态分布2(1,)N σ(0)σ>,若ξ位于区域(0,1)内的概率为0.4,则ξ位于区域(0,2)内的概率为0.8;④对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大.其中真命题的序号为( ) A .①④B .②④C .①③D .②③9.已知变量x 与变量y 之间具有相关关系,并测得如下一组数据:则变量x 与y 之间的线性回归直线方程可能为A .ˆy =0.7x –2.3B .ˆy =–0.7x+10.3C .ˆy =–10.3x+0.7D .ˆy=10.3x –0.7 10.下列说法中正确的是( )A .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1B .设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位 C .把某中学的高三年级560名学生编号:1到560,再从编号为1到10的10名学生中随机抽取1名学生,其编号为a ,然后抽取编号为10a +,20a +,30a +,…的学生,这样的抽样方法是分层抽样D .若一组数据0,a ,3,4的平均数是2,则该组数据的方差是5211.已知,x y 的对应值表为:且,x y 线性相关,由于表格污损,y 的对应值看不到了,若6119.2ii y==∑,且线性回归直线方程为0.6y x a =+,则8x =时,y 的预报值为( ) A .6.1B .22.1C .12.6D .3.512.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是( ) A .样本中的男生数量多于女生数量 B .样本中喜欢手机支付的数量多于现金支付的数量C .样本中多数男生喜欢手机支付D .样本中多数女生喜欢现金支付13.下列说法中错误的是( )A .先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +的学生,这样的抽样方法是系统抽样法.B .正态分布()1,9N 在区间()1,0-和()2,3上取值的概率相等C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .若一组数据123a 、、、的平均数是2,则这组数据的众数和中位数都是2二、解答题14.某地区2012年至2018年农村居民家庭纯收入y (单位:千元)的数据如下表:年份 2012 2013 2014 2015 2016 2017 2018 年份代号t 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9y (2)利用(1)中的回归方程,分析2012年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121ˆnii i nii tty y btt==--=-∑∑,ˆˆay bt =-. 15.为初步了解学生家长对艺术素质评价的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:(1)将学生家长对艺术素质评价的了解程度分为“比较了解”(得分不低于60分)和“不太了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99.9%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.附:()()()()()2n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.16.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y ,(单位:千元)的数据资料,算出101010102111180,20184,720ii i i i i i i i xy x y x ========∑∑∑∑,,附:线性回归方程1221ˆˆˆˆˆˆ,,ni ii nii x y nxyybx a b ay bx xnx ==-=+==--∑∑,其中,x y 为样本平均值. (1)求家庭的月储蓄y 对月收入x 的线性回归方程ˆˆˆybx a =+ ; (2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.17.某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x (单位:千万元)对年销售量y (单位:千万件)的影响,统计了近10年投入的年研发费用i x 与年销售量()1210i y i =⋯,,的数据,得到散点图如图所示.(1)利用散点图判断y a bx =+和·d y c x =(其中c d ,均为大于0的常数)哪一个更适合作为年销售量y 和年研发费用x 的回归方程类型(只要给出判断即可,不必说明理由) (2)对数据作出如下处理,令,i i i i u lnx v lny ==,得到相关统计量的值如下表:根据第(1)问的判断结果及表中数据,求y 关于x 的回归方程;101i i v =∑101ii u=∑()()101iii u u v v =--∑()1021ii u u =-∑15 15 28.25 56.5(3)已知企业年利润z (单位:千万元)与x y ,的关系为349182z ey x =--(其中271828e ≈.),根据第(2)问的结果判断,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?附:对于一组数据()()()1122,,,n n u v u v u v ⋯,,,,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为()()()121niii nii u u v v u u β==--=-∑∑,ˆav u β=- 18.某电脑公司有5名产品推销员,其工作年限与年推销金额的数据如表: 推销员编号 1 2 3 4 5 工作年限x 年 3 5 6 7 9 推销金额y 万元23345(1)求年推销金额y 关于工作年限x 的线性回归方程;(2)判断变量x 与y 之间是正相关还是负相关;(3)若第6名推销员的工作年限是11年,试估计他的年推销金额.参考公式:线性回归方程y bx a =+中,a y bx =-,其中,x y 为样本平均数,1221ni ii nii x ynx y b xnx==-=-∑∑)19.某种产品的广告费支出x 与销售额y (单位:万元)之间有对应数据:(1)求回归直线方程;(2)试预测广告费支出为10万元时,销售额多大?线性回归方程的系数公式为()()()1122211nni iiii i nniii i x y nx y x x y y b xnxx x ====---==--∑∑∑∑,a y bx =-.20.交通部门调查在高速公路上的平均车速情况,随机抽查了60名家庭轿车驾驶员,统计其中有40名男性驾驶员,其中平均车速超过90/km h 的有30人,不超过90/km h 的有10人;在其余20名女性驾驶员中,平均车速超过90/km h 的有5人,不超过90/km h 的有15人.(1)完成下面的22⨯列联表,并据此判断是否有99.9%的把握认为,家庭轿车平均车速超过90/km h 与驾驶员的性别有关;(2)根据这些样本数据来估计总体,随机调查3辆家庭轿车,记这3辆车中,驾驶员为女性且平均车速不超过90/km h 的人数为ξ,假定抽取的结果相互独立,求ξ的分布列和数学期望.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++临界值表:21.某中学为研究学生的身体素质与体育锻炼时间的关系,对该校100名高三学生平均每天体育锻炼时间进行调查,其中女生为55人,如表:(平均每天锻炼的时间单位:分钟)将学生日均体育锻炼时间在[40,60]的学生评价为“锻炼达标”.(1)若女生锻炼达标人数为10人,通过计算判断,是否能在犯错误的概率不超过0.025的前提下认为“锻炼达标”与性别有关?(2)在(1)的条件下“锻炼达标”的学生中,按男女用分层抽样方法抽出15人,进行体育锻炼体会交流,求这15人中,男生、女生各有多少人? 参考公式:22()()()()()()a b c d ad bc K a b c d a c b d +++-=++++临界值表:22.随着我国经济的发展,居民收入逐年增长.某地区2014年至2018年农村居民家庭人均纯收入y (单位:千元)的数据如下表:人均纯收入y5 47 8 10(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2014年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测2019年该地区农村居民家庭人均纯收入为多少?附:回归直线的斜率和截距的最小二乘估计公式分别为()()()121niii nii tty y b tt==--=-∑∑,a y bt =-.23.某手机企业为确定下一年度投入某种产品的研发费用,统计了近10年投入的年研发费用x 千万元与年销售量y 千万件的数据,得到散点图1,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关统计量的值如图2:(1)利用散点图判断y bx a =+和dy c x =⋅()0,0c d >>哪一个更适合作为年研发费用x 和年销售量y 的回归类型(不必说明理由),并根据数据,求出y 与x 的回归方程;(2)已知企业年利润z 千万元与,x y 的关系式为27z y x e=-(其中e 为自然对数的底数),根据(1)的结果,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?24.假设关于某设备的使用年限x (年)和所支出的维修费用y 万元有如下的统计资料: x 2 3 4 5 6 y2.23.85.56.57.0(1)画出散点图并判断是否线性相关; (2)如果线性相关,求线性回归方程; (3)估计使用年限为10年时,维修费用是多少?附注:①参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计分别为()()()1122211ˆˆˆ,n niii ii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑; ②参考数据:55552111120,25,90,112.3ii ii i i i i i xy x x y ========∑∑∑∑25.某书店销售刚刚上市的某高二数学单元测试卷,按事先拟定的价格进行5天试销,每种单价试销1天,得到如下数据: 单价x /元 18 19 20 21 22 销量y /册6156504845(1)求试销5天的销量的方差和y 关于 x 的回归直线方程;附: 1122211()(ˆˆ,(ˆ))nniii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑. (2)预计以后的销售中,销量与单价服从上题中的回归直线方程,已知每册单元测试卷的成本是10元,为了获得最大利润,该单元测试卷的单价应定为多少元?26.某市实施二手房新政一年多以来,为了了解新政对居民的影响,房屋管理部门调查了2018年6月至2019年6月期间购买二手房情况,首先随机抽取了其中的400名购房者,并对其购房面积m (单位:平方米,60130m ≤≤)讲行了一次统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年6月至2019年6月期间当月在售二手房的均价y (单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年6月至2019年6月)(1)试估计该市市民的平均购房面积m (同一组中的数据用该组区间的中点值为代表);(2)从该市2018年6月至2019年6月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X ,求X 的分布列与数学期望;(3)根据散点图选择ˆˆya =+ˆˆˆln y c d x =+两个模型讲行拟合,经过数据处理得到两个回归方程,分别为ˆ0.9369y=+ˆ0.95540.0306ln y x =+,并得到一些统计量的值,如表所示:请利用相关系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年8月份的二手房购房均价(精确到0.001).参考数据:ln 20.69≈,ln3 1.10≈,ln15 2.71≈ 1.73≈ 3.87≈,4.12≈参考公式:()()niix x y y r --=∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】由成绩优秀的概率,可求的成绩优秀的人数,进而求出非优秀人数,得到,b c 的值,计算K 的观测值2K ,对照题目中的表格,即可得到统计的结论.【详解】由题意,在全部的105人中随机抽取1人,成绩优秀的概率为27,所以成绩又由的人数为2105=307⨯人,非优秀的人数为1053075-=人, 所以301020,753045c b =-==-=,则K 的观测值()22105103020453366.110 3.8413075505555K ⨯⨯-⨯==≈>⨯⨯⨯,若按95%的可靠性要求,能认为“成绩与班级有关系”. 故选:C. 【点睛】本题主要考查了独立性检验的应用问题,同时考查了运算与求解能力,属于基础题.2.A解析:A 【解析】分析:根据列联表中数据利用公式求得2K ,与邻界值比较,即可得到结论. 详解:根据卡方公式求得()223081281020101218K -==⨯⨯⨯,27.89710.828K <<,∴该研究小组有99.5%的把握认为中学生使用智能手机对学生有影响,故选A.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.3.C解析:C 【解析】分析:首先对每个选项一一进行分析,需要明确独立性检验是检验两个分类变量是否有关系的一种统计方法,回归直线可能不过任何一个样本数据点,残差图中,残差点分布的带状区域的宽度越狭窄,其模拟精度越高,相关指数越大,拟合效果越好的结论,就可以正确选出结果.详解:对于A ,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A 错;对于B ,线性回归方程对应的直线y b x a ∧∧∧=+可能不过任何一个样本数据点,所以B 错误;对于C ,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C 正确;对于D ,回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果好,所以D 错误. 故选C.点睛:根据概率统计中变量间的相关关系,线性回归方程以及残差图与相关指数2R 的概念,对选项中的命题进行分析、判断正误即可.4.D【解析】对于A ,取1a =-,2b =时,不能推出22a b >,故错误;对于B ,命题:,20x p x R ∀∈>的否定为00,20xx R ∃∈≤,故错误;对于C ,为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为8004020÷=,故错误;对于D ,因为回归直线的斜率的估计值为1.23,所以回归直线方程可写成 1.23y x a =+,根据回归直线方程过样本点的中心()4,5,则0.08a =,所以回归直线方程为 1.2308ˆ.0yx =+,故正确. 故选D.5.C解析:C 【分析】首先计算ˆa,然后根据条件写出纯利润的函数()22321410.29.29.2555x x x x x x ⎛⎫++-+=-++ ⎪⎝⎭,再求其最大值.【详解】2345645x ++++==,2941505971505y ++++==,ˆ5010.24a∴=⨯+,解得:ˆ9.2a =, ∴回归方程为ˆ10.29.2y x =+, 纯利润为()()2223214110.29.29.27195555x x x x x x x ⎛⎫++-+=-++=--+ ⎪⎝⎭,当且仅当7x =时,纯利润取得最大值19. 故选:C 【点睛】本题考查回归直线方程,数学建模,二次函数求最值,重点考查理解题意,并能抽象概括出函数,属于基础题型.6.B解析:B 【分析】计算2x =, 4.5y =,代入回归方程计算得到 2.6a =,再计算得到答案. 【详解】013424x +++==, 2.2 4.3 4.8 6.74.54y +++==,故4.50.952a =⨯+,解得2.6a =.当5x =,0.955 2.67.35y =⨯+=. 故选:B本题考查了回归方程的应用,意在考查学生的计算能力.7.C解析:C 【分析】根据相关系数的特征判断①;根据线性回归方程的特征判断②;根据相关指数的特征判断③. 【详解】①线性相关关系r 是衡量两个变量之间线性关系强弱的量,r 越接近于1,这两个变量线性相关关系越强,r 越接近于0,线性相关关系越弱,故①错误; ②回归直线y bx a =+过样本点中心(),x y ,故②正确;③用相关指数2R 来刻画回归的效果,2R 越大,说明模型的拟合效果越好;2R 越小,说明模型的拟合效果越不好,故③正确. 综上,说法中正确的个数是2.故选C. 【点睛】本题主要考查回归分析,熟记相关系数、回归方程以及相关指数的特征即可得出结果,属于基础题型.8.D解析:D 【解析】对于①,因为线性回归方程是由最小二乘法计算出来的,所以它不一定经过其样本数据点,一定经过(,)x y ,故错误;对于②,根据随机变量的相关系数知,两个随机变量相关性越强,则相关系数的绝对值越接近于1,故正确;对于③,变量ξ服从正态分布()21,N σ,则(02)2(01)0.8P P ξξ<<=<<=,故正确;对于④,随机变量2K 的观测值越大,判断“X 与Y 有关系”的把握越大,故错误. 故选D.点睛:在回归分析中易误认为样本数据必在回归直线上,实质上回归直线方程必过(,)x y 点,可能所有的样本数据点都不在直线上.9.B解析:B 【解析】根据表中数据,得14x =(6+5+10+12)=334,14y =(6+5+3+2)=4,且变量y 随变量x 的增大而减小,是负相关,所以,验证334x =时,ˆy=–0.7×334+10.3≈4,即回归直线ˆy =–0.7x +10.3过样本中心点(x ,y ).故选B .10.D解析:D 【分析】线性相关性越强,r 的值越接近于1;ˆ35yx =-,斜率的意义;系统抽样和分层抽样的区别;方差的计算. 【详解】对于A ,若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,故A 错误;对于B ,设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减少5个单位,故B 错误;对于C ,抽样方法是系统抽样,故C 错误; 对于C ,0,a ,3,4的平均数是2,可得1a =, 方差222215[(02)(12)(32)(42)]42-+-+-+-= ,故D 正确. 故选:D 【点睛】本题考查了线性相关系数,回归方程,系统抽样和分层抽样,方差等基本知识;考查了理解辨析、数据分析能力和数学运算技能,属于容易题.11.A解析:A 【分析】求出,x y ,由线性回归方程必经过点(,x y )即得a ,代入8x =求解即可. 【详解】 由表格知,196x =, 6119.2ii y==∑3.2y ∴=,代入0.6y x a =+得:193.20.66a =⨯+, 1.3a ∴=,则回归方程为0.6 1.3y x =+, 当8x =时,0.68 1.3 6.1y =⨯+=, 故选:A . 【点睛】本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.12.D解析:D 【详解】由右边条形图知,男生女生喜欢手机支付的比例都高于现金支付的比例,所以男生女生都喜欢手机支付,故C 对,D 错,由左边条形图知,男生女生手机支付都比现金支付比例相同,B 对,结合两个条形图可知,样本中的男生数量多于女生数量,A 对,故选D.13.C解析:C 【分析】对于A ,根据系统抽样的定义可判断;对于B ,根据正态分布的对称性可判断在两个区间上的概率;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,可进行判断;对于D ,根据一组数据123a 、、、的平均数是2,得2a =,求得该组数据的众数和中位数,可判断D. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A 正确;对于B ,正态分布()19N ,的曲线关于1x =对称,区间()10-,和()23,与对称轴距离相等,所以在两个区间上的概率相等,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,C 错误; 对于D ,一组数据123a 、、、的平均数是2,2a ∴=;所以该组数据的众数和中位数均为2,D 正确.. 【点睛】本小题考查系统抽样,线性回归,线性相关,平均数,中位数与众数等基础知识,意在考查学生分析问题,及解决问题的能力和运算求解能力.二、解答题14.(1)ˆ0.5 2.3yt =+;(2)6.8千元. 【分析】(1)利用最小二乘法求y 关于t 的线性回归方程;(2)由(1)知0.50b =>得解,将2020年的年份代号9t =代入ˆ0.5 2.3yt =+即得解. 【详解】 (1)由题知()1123456747t =++++++=; ()12.93.3 3.64.4 4.85.2 5.9 4.37y =++++++=; ()()71ii i tty y =--∑()()()()()()3 1.42110.700.110.520.930.16=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯14=;()721941014928i i t t =-=++++++=∑;()()()7172114ˆ0.528ii i i i tty y bt t ==--===-∑∑; ˆ 4.30.54 2.3ay bt =-=-⨯=; 所以y 关于t 的线性回归方程ˆ0.5 2.3yt =+. (2)由(1)知0.50b =>,故2012年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元,将2020年的年份代号9t =代入ˆ0.5 2.3yt =+,可得ˆ 6.8y =, 故该地区2020年农村居民家庭人均纯收入6.8千元. 【点睛】方法点睛:求回归直线方程,一般利用最小二乘法,先求出ˆˆ,,,x y ab ,即得线性回归方程. 15.(1)有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)分布列见解析,21()10E X = 【分析】(1)完成列联表,求出211.2910.828X ≈>,从而有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)推导出7~3,10X B ⎛⎫⎪⎝⎭,由此能求出X 的概率分布和数学期望. 【详解】解:(1)由题意得到列联表如下:2()100(2537335)11.29()()()()30704258n ad bc K a b c d a c b d -⨯-⨯==≈++++⨯⨯⨯.11.2910.828>,∴有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关.(2)由题意得该校1名学生家长“比较了解”的概率为70710010=,且7~(3,)10X B ,033327(0)()101000P X C ===,12373189(1)()()10101000P X C ===, 22373441(2)()()10101000P X C ===, 3337343(3)()101000P X C ===,X ∴的分布列为:()0123100010001000100010E X =⨯+⨯+⨯+⨯=. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. 16.(1)0.30.4y x =-;(2)1.7 【分析】(1)根据数据,利用最小二乘法,即可求得y 对月收入x 的线性回归方程回归方程ˆˆyb =x ˆa +; (2)将x =7代入即可预测该家庭的月储蓄. 【详解】(1)由题意知,10101110,80,20ii i i n xy =====∑∑ ,80208,21010x y ∴==== ∴21082160,1064640n x y n x ⋅⋅=⨯⨯=⋅=⨯=1010211184,720i i ii i x y x ====∑∑ 由1221184160ˆ0.3720640ni ii nii x y nxybxnx ==--===--∑∑.ˆˆ20.380.4ay bx =-=-⨯=- 故所求回归方程为0.30.4y x =- (2)将7x =代入回归方程可以预测该家庭的月储蓄为0.370.4 1.7y =⨯-=(千元). 【点睛】本题考查线性回归方程的应用,考查最小二乘法求线性回归方程,考查转化思想,属于中档题.17.(1) 选择dy c x =⋅更合适;(2)y =. (3) 要使年利润取最大值,预计下一年应投入4千万元的研发费用 【分析】(1)根据散点图分布,可知更符合指数型模型,可得结果;(2)对dy c x =⋅两边取倒数,得到ln v c du =+,采用最小二乘法可求得d 和ln c ,从而得到结果;(3)由(2)可得()92z x x =,利用导数可判断出()z x 单调性,可知当4x =时,()z x 取最大值,从而得到结果. 【详解】(1)由散点图知,选择d y c x =⋅更合适(2)对dy c x =⋅两边取对数,得ln ln ln y c d x =+,即:ln v c du =+由表中数据得32u v ==28.25156.52d ∴== 令ln c m =,则31332224m v du =-=-⨯=,即34c e = ∴年销售y 和年研发费用x 的回归方程为:y =(3)由(2)知,()92z x x =,则()92z x =' 令()0z x '=,得4x =当()0,4x ∈时,()0z x '>;当()4,x ∈+∞时,()0z x '<()z x ∴在()0,4上单调递增;在()4,+∞上单调递减∴当4x =千万元时,年利润z 取得最大值,且最大值为:()418z =千万元 1.8=亿元 ∴要使年利润取最大值,预计下一年应投入4千万元的研发费用【点睛】本题考查统计中的数据的相关性的问题,涉及到非线性回归模型方程的求解、利用导数求解函数的最值的问题;解题关键是能够将非线性回归模型转化为线性回归模型,从而利用最小二乘法求得回归模型.18.(1)0.50.4y x =+;(2)正相关;(3)5.9万元. 【分析】(1)首先求出x ,y 的平均数,利用最小二乘法做出b 的值,再利用样本中心点满足线性回归方程和前面做出的横标和纵标的平均值,求出a 的值,写出线性回归方程. (2)根据0.50b =>,即可得出结论;(3)第6名推销员的工作年限为11年,即当11x =时,把自变量的值代入线性回归方程,得到y 的预报值,即估计出第6名推销员的年推销金额为5.9万元. 【详解】(1)由题意知:6x =, 3.4y =于是:211256 3.40.520056b -⨯⨯==-⨯, 3.40.560.4a =-⨯=, 故:所求回归方程为0.50.4y x =+;(2)由于变量y 的值随着x 的值增加而增加(0.50)b =>,故变量x 与y 之间是正相关 (3)将11x =带入回归方程可以估计他的年推销金额为0.5110.4 5.9y =⨯+=万元. 【点睛】本题考查回归分析的初步应用,考查利用最小二乘法求线性回归方程,是一个综合题目. 19.(1) 6.517.5y x =+;(2)82.5万元. 【分析】(1)由已知数据求得b ,a ,得回归方程; (2)根据(1)求得回归方程,代入可得答案. 【详解】解:(1)由表格知5x =,50y =. ∴()()()()()()()()()()()()()()2222253050454050556050+65505085705062855545b --+--+----+--=-+-++-- 6.5=,∴50 6.5517.5a =-⨯= ∴ 6.517.5y x =+(2)由(1)得 6.51017.582.5y =⨯+=. 【点睛】本题考查求回归方程,并由回归方程进行估计,属于中档题.20.(1)填表见解析;有99.9%的把握认为,平均车速超过90/km h 与性别有关(2)详见解析 【分析】(1)根据题目所给数据填写22⨯列联表,计算出2K 的值,由此判断出有99.9%的把握认为,平均车速超过90/km h 与性别有关.(2)利用二项分布的知识计算出分布列和数学期望. 【详解】 (1)因为260(3015510)61613.71402035257K ⨯⨯-⨯⨯==≈⨯⨯⨯,13.7110.828>,所以有99.9%的把握认为,平均车速超过90/km h 与性别有关.(2)ξ服从153,60B ⎛⎫⎪⎝⎭,即13,4B ⎛⎫ ⎪⎝⎭,3033127(0)4464P C ξ⎛⎫⎛⎫===⎪ ⎪⎝⎭⎝⎭ 21133127(1)4464P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ 1223319(2)4464P C ξ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭ 0333311(3)4464P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭. 所以ξ的分布列如下ξ的期望()0123646464644E ξ=⨯+⨯+⨯+⨯= 【点睛】本小题主要考查22⨯列联表独立性检验,考查二项分布分布列和数学期望,属于中档题. 21.(1)能;(2)男生应抽10人,女生应抽5人. 【分析】(1)直接由题意列出列联表,求得2K 的值,结合临界值表得结论;(2)在30名达标学生中,男生20人,女生10人,通过分层抽样即可得出男女生人数. 【详解】解:(1)由题意知,女生不达标的人数为45,达标的人数为10人,男生不达标的人数为25人,达标的为20人 ,则可列出22⨯联表:。

相关文档
最新文档