高中数学人教a版高二选修2-3_第三章_统计案例_3.1学业分层测评_word版有答案
高二数学 人教A版选修2-3习题 第3章 统计案例3.1 Word版含答案

选修2-3 第三章 3.1一、选择题1.已知变量x 与y 正相关,且由观测数据算得样本平均数x -=3,y -=3.5,则由该观测数据算得线性回归方程可能为( )A .y ^=0.4x +2.3B .y ^=2x -2.4C .y ^=-2x +9.5D .y ^=-0.3x +4.4 [答案] A[解析] 因为变量x 和y 正相关,所以回归直线的斜率为正,排除C 、D ;又将点(3,3.5)代入选项A 和B 的方程中检验排除B ,所以选A .2.由变量x 与y 相对应的一组数据(1,y 1)、(5,y 2)、(7,y 3)、(13,y 4)、(19,y 5)得到的线性回归方程为y ^=2x +45,则y -=( )A .135B .90C .67D .63 [答案] D[解析] ∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,故选D . 3.观测两个相关变量,得到如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1 y-0.9-2-3.1-3.9-5.154.12.92.10.9A .y ^=0.5x -1B .y ^=xC .y ^=2x +0.3 D .y ^=x +1[答案] B[解析] 因为x -=0,y -=-0.9-2-3.1-3.9-5.1+5+4.1+2.9+2.1+0.910=0,根据回归直线方程必经过样本中心点(x -,y -)可知,回归直线方程过点(0,0),所以选B .4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83cmB .身高在145.83cm 以上C .身高在145.83cm 左右D .身高在145.83cm 以下[答案] C[解析] 将x 的值代入回归方程y ^=7.19x +73.93时,得到的y ^值是年龄为x 时,身高的估计值,故选C .5.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:( ) A .68 B .66 C .72 D .70[答案] A[解析] ∵x -=14(18+13+10-1)=10,y -=14(24+34+38+64)=40,∴40=-2×10+a ,∴a =60, 当x =-4时,y =-2×(-4)+60=68.6.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不.正确..的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg [答案] D[解析] 本题考查线性回归方程.D 项中身高为170cm 时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系. 二、填空题7.下列五个命题,正确命题的序号为____________.①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.[答案] ③④⑤[解析] 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.8.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg).由散点图初步判定其具有线性相关关系,则由此得到的回归方程的斜率是________.施化肥量x 15202530354045水稻产量y 330345365405445450455 [答案] 4.75[解析]列表如下,i 1234567x i15202530354045y i330345365405445450455x i y i49506900912512150155751800020475x=30,y≈399.3,∑i=17x2i=7000,∑i=17x i y i=87175则b^≈87175-7×30×399.37000-7×302≈4.75.回归方程的斜率即回归系数b^.9.以下是某地区的降雨量与年平均气温的一组数据:年平均气温(℃)12.5112.8412.8413.6913.3312.7413.05 年降雨量(mm)542507813574701432464或“不具有”)[答案]不具有[解析]画出散点图,观察可知,降雨量与年平均气温没有相关关系.三、解答题10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如下图所示:(2)x =15∑5i =1x i =109,l xx =∑5 i =1 (x i -x )2=1570,y =23.2,l xy =∑5i =1 (x i -x )(y i -y )=308. 设所求回归直线方程为y ^=b ^x +a ^,则b ^=l xy l xx =3081570≈0.1962,a ^=y -b ^x =1.8166.故所求回归直线方程为y ^=0.1962x +1.8166. (3)据(2),当x =150m 2时,销售价格的估计值为 y ^=0.1962×150+1.8166=31.2466(万元).一、选择题1.下列说法正确的有几个( )(1)回归直线过样本点的中心(x -,y -);(2)线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )中的一个点;(3)在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; (4)在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. A .1 B .2 C .3 D .4[答案] B[解析] 由回归分析的概念知①④正确,②③错误.2.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1[答案] C[解析] ∵变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5), ∴X =10+11.3+11.8+12.5+135=11.72,Y =1+2+3+4+55=3,∑i =15(x i -x )(y i -y )=(10-11.72)×(1-3)+(11.3-11.72)×(2-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(4-3)+(13-11.72)×(5-3)=7.2,∑i =15(x i -x)2∑i =15(y i -y )2=19.172,∴这组数据的相关系数是r 1=7.219.172=0.3755, 变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),U =15(10+11.3+11.8+12.5+13)=11.72,V =5+4+3+2+15=3,∑i =15(U i -U )(V i -V )=(10-11.72)×(5-3)+(11.3-11.72)×(4-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(2-3)+(13-11.72)×(1-3)=-7.2,∑i =15(U i -U)2·∑i =15 (V i -V )2=19.172.∴这组数据的相关系数是r 2=-0.3755,∴第一组数据的相关系数大于零,第二组数据的相关系数小于零,故选C . 二、填空题3.已知两个变量x 和y 之间有线性相关性,5次试验的观测数据如下表:那么变量y 关于x [答案] y ^=0.575x -14.9[解析] 根据公式计算可得b ^=0.575,a ^=-14.9,所以回归直线方程是y ^=0.575x -14.9.4.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:由表中数据算出线性回归方程y =bx +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =________.(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为________.[答案] (1)40 (2)14件 [解析] (1)由y =38,得m =40. (2)由a =y -b x 得a =58, 故y ^=-2x +58, 当x =22时,y ^=14,故三月中旬的销售量约为14件. 三、解答题5.(2015·随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中,b ^=∑i =1nt i y i -n t y∑i =1nt 2i -n t2,a ^=y -b ^t .[解析] (1)列表计算如下5 5 10 2550 ∑153655120这里n =5,t =1n ∑i =1n t i =155=3,y =1n ∑i =1n y i =365=7.2.又l nt =∑i =1nt i -n t2=55-5×32=10,l ny =∑i =1nt i y i-n t y =120-5×3×7.2=12.从而b ^=l ny l nt =1210=1.2,a ^=y -b ^ t =7.2-1.2×3=3.6.故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).6.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =b ^x +a ^;(3)已知该 厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[解析] (1)由题设所给数据,可得散点图如图:(2)由对照数据,计算得∑i =14x 2i =86,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数b ^=∑i =14x i y i -4x y∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^ x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,知降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).。
人教A版高中数学选修2-3作业:第3章 统计案例3.1

第三章 3.1(建议用时:40分钟)1.有下列说法:①线性回归分析就是由样本点去寻找一条直线,贴近这些样本点的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归方程y ^=b ^x +a ^及其回归系数b ^,可以估计和预测变量的取值和变化趋势; ④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.其中正确的命题个数是( ) A .1 B .2 C .3D .4C 解析 ①反映的是最小二乘法思想,故正确;②反映的是画散点图的作用,故正确;③反映的是回归模型y =bx +a +e ,其中e 为随机误差,故也正确;④在求回归方程之前必须进行相关性检验,以体现两个变量的关系,故不正确.2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( ) A .0 B .1 C .2D .3D 解析 对于①,选用的模型是否合适与残差点的分布有关,均匀的分布在水平的带状区域时,说明模型比较合适,故①正确;对于②③,R 2值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好,故②③正确.故选D 项.3.根据表中样本数据得到的回归方程为y ^=b ^x +a ^,则( )x 3 4 5 6 7 8 y 4.02.5-0.50.5-2.0-3.0A .a >0,b >0B .a >0,b <0C .a ^<0,b ^>0D .a ^<0,b ^<0B 解析 作出散点图如图所示.观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,截距a ^>0.故选B 项.4.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 之间的回归直线方程为( )A .y ^=x +1 B .y ^=x +2 C .y ^=2x +1D .y ^=x -1A 解析 x =52,y =72,将⎝⎛⎭⎫52,72代入四个回归直线方程检验,仅A 项适合.故选A 项.5.甲、乙、丙、丁4位同学各自对A ,B 两变量作回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2,如表所示.甲 乙 丙 丁散点图残差平方和115106124103A .甲B .乙C .丙D .丁D 解析 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2表达式中i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁同学的精确度高些.故选D 项.6.为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1,l 2.已知两人所得的试验数据中,变量x 和y 的数据的平均值都相等,且分别都是s ,t ,那么下列说法正确的是( )A .直线l 1和l 2一定有公共点(s ,t )B .直线l 1和l 2相交,但交点不一定是(s ,t )C .必有l 1∥l 2D .l 1与l 2必定重合A 解析 线性回归直线方程为y ^=b ^x +a ^.而a ^=y -b ^ x ,即a ^=t -b ^s ,t =b ^s +a ^.所以(s ,t )在回归直线上.所以直线l 1和l 2一定有公共点(s ,t ).故选A 项.二、填空题7.给定x 与y 的一组样本数据,求得相关系数r =-0.690,则下列说法正确的是________(填序号).①y 与x 的线性相关性很强; ②y 与x 的相关性很强; ③y 与x 正相关; ④y 与x 负相关.解析 因为r <0,所以y 与x 负相关,又|r |∈[0.75,1]才表示y 与x 具有很强的线性相关性,所以④正确.答案 ④8.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表所示,根据表中数据可得回归方程y ^=b ^x +a ^中的b ^=10.6,据此模型预报广告费用为10万元时销售额为________万元.解析 由表中数据得x =3.5,y =43,由于直线y =b x +a 过点(x ,y ),且b ^=10.6,解得a ^=5.9,从而线性回归方程为y ^=10.6x +5.9,于是当x =10时,计算得y ^=111.9.答案 111.99.已知关于变量x ,y 的一组数据如表所示.对于表中数据,现给出如下拟合直线:①y =x +1;②y =2x -1;③y =85x -25;④y =32x .根据最小二乘法的思想得到拟合程度最好的直线是____________(填序号).解析 列表得:故s 1s 2=(3-3)2+(4-5)2+(6-7)2+(8-9)2+(9-11)2=7, s 3=⎝⎛⎭⎫3-1452+⎝⎛⎭⎫4-2252+(6-6)2+⎝⎛⎭⎫8-3852+⎝⎛⎭⎫9-4652=25, s 4=(3-3)2+⎝⎛⎭⎫4-922+(6-6)2+⎝⎛⎭⎫8-1522+(9-9)2=12, 由s 3最小知直线③是拟合程度最好的直线. 答案 ③ 三、解答题10.某地区2012年至2018年农村居民家庭人均纯收入y (单位:万元)的数据如表所示.(2)利用(1)中的回归方程,分析2012年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.解析 (1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑7i =1 (t i -t )2=9+4+1+0+1+4+9=28,∑7 i =1 (t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑7 i =1 (t i -t )(y i -y )∑7i =1 (t i -t )2=1428=0.5. a ^=y -b ^t =4.3-0.5×4=2.3, 所以所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2012年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5万元.将2020年的年份代号t =9,代入(1)中的回归方程, 得y ^=0.5×9+2.3=6.8,故预测该地区2020年农村居民家庭人均纯收入为6.8万元. 11.某百货公司1~6月份的销售量x 与利润y 的统计数据如表所示.月份 1 2 3 4 5 6 销售量x /万件 10 11 13 12 8 6 利润y /万元222529261612(1)根据2~5月份的数据,画出散点图,求出y 关于x 的线性回归方程y =b ^x +a ^; (2)若由线性回归方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的线性回归方程是理想的,试问所得线性回归方程是否理想?解析 (1)根据表中2~5月份的数据作出散点图,如图所示.计算得x =11,y =24,∑i =25x i y i =11×25+13×29+12×26+8×16=1 092,∑i =25x 2i =112+132+122+82=498. 则b ^=∑i =25x i y i -4x y∑i =25x 2i -4x2=1 092-4×11×24498-4×112=187, a ^=y -b ^x =24-187×11=-307.故y 关于x 的线性回归方程为y ^=187x -307.(2)当x =10时,y ^=187×10-307=1507,此时1507-22<2;当x =6时,y ^=187×6-307=787,此时⎪⎪⎪⎪787-12<2. 故所得的线性回归方程是理想的.12.在一次抽样调查中测得样本的5个样本点,数据如表所示.(1)作出散点图;(2)根据散点图判断y =kx +b 与y =kx +b 哪一个更适合y 与x 的回归方程;(3)根据下面表格中的数据,建立y 与x 的回归方程.令t =1x,b ^=∑i=1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解析 (1)直接依据表中数据绘点,如图所示.(2)根据散点图判断,y =kx+b 更适合y 与x 的回归方程.(3)由表可得b ^=∑i =1nt i y i -n t ·y∑i =1nt 2i -n t2=94.25-5×1.55×7.221.31-5×1.552=4.13,a ^=y -b ^t =7.2-4.13×1.55=0.8,所以y 与t 的线性回归方程为y ^=4.13t +0.8,y 与x 的回归方程为y ^=4.13x +0.8.四、选做题13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如表所示.零件的个数x /个 2 3 4 5 加工的时间y /小时2.5344.5(1)择了2个不同模型,模型①:y ^=b ^x +a ^,模型②:y ^=c ^x +d ^,求a ^,b ^,c ^,d ^(精确到0.1);(2)比较两个不同的模型的相关指数R 21,R 22,指出哪种模型的拟合效果更好,并说明理由.附:令z =x ,则∑i =14z i y i =26.8;z =1.8,2≈1.4,3≈1.7,5≈2.2;R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2.解析 (1)散点图如图.模型①:由表中的数据得∑i =14x i y i =52.5,x =14∑i =14x i =3.5,y =14∑i =14y i =3.5,∑i =14x 2i =54,所以b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=52.5-4×3.5×3.554-4×3.52≈0.7,a ^=y -b ^x =3.5-0.7×3.5≈1.1, 所以 y ^=0.7x +1.1.模型②:c ^=∑i =1ny i z i -n y z∑i =1nz 2i -n z2=26.8-4×3.5×1.82+3+5+4-4×1.82≈1.5, d ^=y -c ^z =3.5-1.5×1.8=0.8,所以y ^=1.5x +0.8. (2)模型①:R 21=1-[(2.5-2×0.7-1.1)2+(3-3×0.7-1.1)2+(4-4×0.7-1.1)2+(4.5-5×0.7-1.1)2]×[(2.5-3.5)2+(3-3.5)2+(4-3.5)2+(4.5-3.5)2]-1=0.976.模型②:R 22=1-[(2.5-1.4×1.5-0.8)2+(3-1.7×1.5-0.8)2+(4-2×1.5-0.8)2+(4.5-2.2×1.5-0.8)2]×[(2.5-3.5)2+(3-3.5)2+(4-3.5)2+(4.5-3.5)2]-1=0.807.又R 21>R 22,所以模型①的拟合效果更好.由Ruize收集整理。
人教A版数学高二选修2-3检测第三章统计案例能力深化提升

能力深化提升类型一线性回归分析【典例1】一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数10 20 30 40 50 60 70 80 90 100x(个)加工时间62 72 75 81 85 95 103 108 112 127y(min)(1)画出散点图,并初步判断是否线性相关.(2)若线性相关,求回归直线方程.(3)求出相关指数.(4)作出残差图.(5)进行残差分析.【解析】(1)画散点图如图所示,由图可知,x,y线性相关.(2)x与y的关系可以用线性回归模型来拟合,不妨设回归模型为=x+.将数据代入相应公式可得数据表:序号零件个数x i (个) 加工时间y i (min)x i y i1 10 62 620 1002 20 72 1 440 4003 30 75 2 250 9004 40 81 3 240 1 6005 50 85 4 250 2 5006 60 95 5 700 3 6007 70 103 7 210 4 9008 80 108 8 640 6 4009 90 112 10 080 8 10010 100 127 12 700 10 000∑550 920 56 130 38 500所以=55,=92,所以===≈0.670,=-=92-×55=≈55.133,所以回归直线方程为=0.670x+55.133.(3)利用所求回归方程求出下列数据.y61.833 68.533 75.233 81.933 88.633iy i-y0.167 3.467 -0.233 -0.933 -3.633iy i--30 -20 -17 -11 -7y95.333 102.033 108.733 115.433 122.133iy i-y-0.333 0.967 -0.733 -3.433 4.867iy i- 3 11 16 20 35所以R2=1-≈0.983.(4)因为y=y i-i y,利用上表中数据作出残差图,如图所示.i(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好.由残差图也可观察到,第2、5、9、10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.【方法总结】解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的回归方程解决问题.【巩固训练】从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得x i=80,y i=20,x i y i=184,=720.(1)求家庭的月储蓄y对月收入x的线性回归方程=x+.(2)判断变量x与y之间是正相关还是负相关.(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程=x+中,=,=-,其中,为样本平均值.【解析】(1)由题意知n=10,=x i==8,=y i==2,又-n=720-10×82=80,x i y i-n=184-10×8×2=24,由此得===0.3,=-=2-0.3×8=-0.4,故所求回归方程为=0.3x-0.4.(2)由于变量y的值随x的值增加而增加(=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).类型二独立性检验【典例2】(1)某保键药品推销商为推销其药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对防治A疾病是否有效?(2)在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主,六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.①根据以上数据建立一个2×2列联表;②判断人的饮食习惯是否与年龄有关.【解析】(1)将问题中的数据写成2×2列联表如下表:患病不患病总计使用 5 100 105不使用18 400 418总计23 500 523将上述数据代入公式K2=中,计算可得k≈0.04145,而0.04145<2.706,所以没有充分的证据表明该药品对防治A疾病有效.(2)①2×2列联表如下:主食蔬菜主食肉类总计六十岁以下21 33 54六十岁以上43 27 70总计64 60 124②根据列联表,可得K2的观测值k=≈6.201>5.024.故在犯错误的概率不超过0.025的前提下认为“人的饮食习惯与年龄有关”.【方法总结】独立性检验问题的基本步骤(1)找相关数据,作列联表.(2)求统计量K2.(3)判断可能性,注意与临界值作比较,得出与事件有关的确信度. 【巩固训练】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别男女是否需要志愿者需要40 30不需要160 270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为=14%.(2)由表中数据,得K2的观测值为k=≈9.967.因为9.967>6.635,所以在犯错误的概率不超过0.01的前提下,即有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.。
高二年级下学期新课标A版高中数学选修2-3 第三章统计案例

就判断两个分类变量之间有关系.
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
绘制等高条形图时,列联表的行对应的是高度,两行的数 据不相等,但对应的条形图的高度是相同的;两列的数据对应 不同的颜色.
数学 选修2-3
第三章 统计案例
独立性检验
自主学习 新知突破
合作探究 课堂互动
第三章 统计案例
[思路点拨]
自主学习 新知突破
合作探究 课堂互动
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
(1)相应的等高条形图如图:
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
(2)图中两个深色条的高分别表示司机血液中有酒精和无酒 精样本中对事故负有责任的频率,从图中可以看出,司机血液 中有酒精样本中对事故负有责任的频率明显高于司机血液中无 酒精样本中对事故负有责任的频率.由此可以认为司机血液中 含有酒精与对事故负有责任有关系.
解析: 其等高条形图如图所示.
由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种 程度上有关系.
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
利用随机变量K2判断分类变量间的关系
用水的调查表:
干净水 不干净水
合计
下表是某地区的一种传染病与饮
得病 52 94 146
不得病 466 218 684
数学 选修2-3
第三章 统计案例
附:
自主学习 新知突破
合作探究 课堂互动
P(K2≥k0) 0.025 0.010 0.005
高中数学人教A版选修2-3课件第三章统计案例

^
(2)现有第二个线性模型:y=7x+17,且 R 2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说
明理由.
专题归纳
高考体验
^
^
解:(1)依题意设 y 与 x 的线性回归方程为=6.5x+.
2+4+5+6+8
=
=5,
=
^
5
30+40+60+50+70
来粗略地判断两个变量的相关性.
2
(-)
(2)通过公式 K2=
(+)(+)(+)(+)
表作比较,最后得出结论.
先计算观测值k,再与临界值
专题归纳
高考体验
跟踪训练 2某学生对其亲属30人的饮食习惯进行了一次调查,并
用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于
愿意
不愿意
男生
20
10
女生
10
20
性别
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,
其中男生抽取多少人?
专题归纳
高考体验
(2)你能否在犯错误的概率不超过0.01的前提下认为该校高中生
是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(K2≥k0) 0.15
k0
0.10
0.05
5
=50,
^
∵=6.5x+经过(, ),
^
^
∴50=6.5×5+,∴=17.5,
^
∴y 与 x 的线性回归方程为=6.5x+17.5.
人教版数学高二A版选修2-3单元测试第三章统计案例

第三章过关检测(时间90分钟,满分100分)知识点分布表知识点题号散点图1,11线性回归方程2,3,11回归方程的截距、斜率4,8非线性回归7残差平方和9独立性检验6,12回归分析5,10一、选择题(每小题4分,共40分)1.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( )2.已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点( )x0.10.20.30.5y 2.11 2.85 4.0810.15A.(0.1,2.11)B.(0.2,2.85)C.(0.3,4.08)D.(0.275,4.797 5)3.两个变量满足如下关系:x510152025y103105110111114则两个变量线性相关程度( )A.很强B.很弱C.无相关性D.不确定4.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为y =7.19x +73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定在145.83 cmB.身高在145.83 cm 以上C.身高在145.83 cm 左右D.身高在145.83 cm 以下5.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程的截距和斜率的最小二乘法估计公式分别为_______和∑∑==---=ni ini i ix xy y x xb121)())((ˆ.( )A.a =y -bxB.x by a ˆ-= C.bx y a -=ˆ D.x b y a ˆˆ-= 6.(2009山东潍坊一模)下列关于等高条形图说法正确的是( ) A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 7.身高与体重有关系,可以用分析的方法来判断( )A.残差B.回归C.等高条形图D.独立性检验 8.下列关于K 2的说法中正确的是( )A.K 2在任何相互独立问题中都可以用于检验有关还是无关B.K 2的值越大,两个事件的相关性就越大C.K 2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K 2的观测值k 的计算公式为))()()(()(d b c a d c b a bc ad n k ++++-=9.设在海拔x m 处的大气压强是y Pa,y 与x 之间的关系为kxce y =,其中c 、k 为常量,如果某游客从大气压为1.01×105 Pa 的海平面地区,到了海拔为2 400 m,大气压为0.90×105 Pa 的一个高原地区,则k 与c 的取值分别是( )A.⎩⎨⎧⨯-=⨯=-5510805.41001.1k cB.⎩⎨⎧⨯-=⨯=-54105.31024.2k cC.⎩⎨⎧⨯=⨯=-54103.2106.3k cD.⎩⎨⎧⨯-=⨯=-54103.2107.2k c10.为了探究色盲是否与性别有关,在调查的500名男性中有39名色盲患者,在500名女性中有6名患有色盲,那么你认为色盲与性别有关的把握为( ) A.0 B.95% C.99% D.都不正确 二、填空题(每小题4分,共16分)11.对于一组数据的两个函数模型,其残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选_______.12.(2009广东中山一模)许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为6.48.0ˆ+=x y.斜率的估计值为0.8说明________________________________________________.13.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =a +bx i +e i (i =1,2,…,n),若e i 恒为0,则R 2为______.14.下列说法:①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的预报值是预报变量的精确值,其中正确的是_______.三、解答题(共44分)15.(10分)某地区的人口普查表明,该地区共有男性15 729 245人,其中3 497个是聋哑人,共有女性16 799 031人,其中3 072个是聋哑人,判断该地区性别与是否为聋哑人之间是否有关系.16.(10分)假设关于某设备的使用年限x 和所支出的维修费用y(万元),有如下的统计资料:(1)y 与x 间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时,维修费用是多少? 17.(12分)下表所示是一组试验数据:y 64 138 205 285 360(1)作出散点图,并猜测y 与x 之间的关系; (2)利用所得的模型预报x =10时y 的值.18.(12分)弹簧长度y(cm)随所挂物体质量x(g)不同而变化的情况如下: 物体质量x 5 10 15 20 25 30 弹簧长度y7.258.128.959.9010.9611.80(1)画出散点图;(2)求y 对x 的回归直线方程;(3)预测所挂物体质量为27 g 时的弹簧长度(精确到0.01 cm).参考答案1解析:题图A 中的点不成线性排列,故两个变量不适合线性回归模型.故选A. 答案:A2 解析:回归直线一定过点),(y x ,通过表格中的数据计算出x 和y ,易知选D. 答案:D3 解析:画出散点图如下:由散点图知线性相关性很强. 答案:A4解析:将x =10代入得y =145.83,但这种预测不一定准确,应该在这个值的左右.故选C. 答案:C5解析:由回归方程系数公式可得. 答案:D6解析:由等高条形图的特点及性质进行判断. 答案:C7解析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,显然,身高和体重具有相关关系. 答案:B8 解析:独立性检验的实质就是利用随机变量K 2来判断“两个分类变量有关系”. 答案:C9解析:将⎩⎨⎧⨯==51001.1,0y x 和⎩⎨⎧⨯==51090.0,4002y x 分别代入kxe c y •=,⎩⎨⎧⨯-=⨯=-,10805.4,1001.155k c 故选A. 答案:A10解析:根据题意可知相关数据的列联表如下:利用公式,可计算得随机变量k 的值约为25.34>6.635,所以色盲与性别有关的把握为99%,故选C. 答案:C11解析:残差平方和越小,函数模型对数据拟合效果越好,反之残差平方和越大,说明函数模型对数据拟合程度效果越差. 答案:第一种12答案:美国一个地区的成年人受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右13解析:若e i 恒为0,则残差平方和0)ˆ(1212==-∑∑==ni i ni i ie yy, 而101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 答案:114解析:①回归方程只适用于我们所研究的样本总体,故①错误.④回归方程得到的预报值可能是取值的平均值,故④错误. 答案:②③ 15解:作列联表:聋哑人 不是聋哑人 总计 男 3 497 15 725 748 15 729 245 女 3 072 16 795 959 16 799 031 总计6 56932 521 70732 528 276828.1063.627075213256960317991624572915)748725150723959795164973(276528322≥≈⨯⨯⨯⨯-⨯⨯=k ,所以有99%的把握认为性别与是否为聋哑人有关. 16 解:(1)作散点图,如图:由散点图可知,y 与x 呈线性相关关系, ,5,4==y x ∑==51290i ix,∑==513.112i i i y x ,所以23.1103.1245905453.112ˆ2==⨯-⨯⨯-=b, 08.0423.15ˆˆ=⨯-=-=x b y a. 所以线性回归方程为yˆ=1.23x +0.08. (2)当x =10年时,yˆ=1.23×10+0.08=12.3+0.08=12.38(万元), 即估计使用10年时,维护费用是12.38万元.17 解:(1)散点图如图所示,从散点图可以看出y 与x 不具有线性相关关系.根据已有知识发现样本点分布在函数a xby +=的图象的周围,其中a,b 为待定参数.设y y xx ='=',1,由已知数据制成下表:序号i x i ′ y i ′ x i ′2 y i ′2 x i ′y i ′ 1 2 64 4 4 096 128 2 4 138 16 19 044 552 3 6 205 36 42 025 1 230 4 8 285 64 81 225 2 280 5 10 360 100 129 600 3 600 ∑301 052220275 9907 7904.210,6='='y x , 故∑=='-'5122405i i x x ,∑=='-'51222.649545i iy y ,计算知b =36.95,a =210.4-36.95×6=-11.3, 所以y′=-11.3+36.95x′. 所求y 对x 的回归曲线方程为3.1195.36-=xy . (2)当x =10时,605.73.111095.36-=-=y . 18 解:(1)散点图如图:(2)采用列表的方法计算aˆ与回归系数b ˆ.50.998.566,5.171056≈⨯==⨯=y x , 183.05.176275250.95.1767.0771ˆ2≈⨯-⨯⨯-=b , 30.65.17183.050.9ˆ≈⨯-=a, y 对x 的回归直线方程为yˆ=6.30+0.183x. (3)当质量为27 g 时,有yˆ=6.30+0.183×27≈11.24 cm. 所以当挂物体的质量为27 kg 时,弹簧的长度大约为11.24 cm.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
高中数学人教A版选修2-3:阶段质量检测(三) 统计案例 Word版含解析
阶段质量检测(三) 统计案例(时间120分钟 满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .可以小于0 B .大于0 C .能等于0D .只能小于0解析:选A ∵b ^=0时,则r =0,这时不具有线性相关关系,但b ^可以大于0也可以小于0.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )A .线性函数模型B .二次函数模型C .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .y ^=x +1B . y ^=x +2 C .y ^=2x +1 D .y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程.5.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度 解析:选C 由等高条形图的特点及性质进行判断.6.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,由57-54.55=2.45,故选B .7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关()A.0.001 B.0.01C.0.05 D.没有理由解析:选A K2=100×(50×25-10×15)265×35×60×40≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:选A l1与l2都过样本中心(x,y).11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:对于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9解析:选B 对于同一样本|ad -bc |越小,说明X 与Y 之间的关系越弱,|ad -bc |越大, 故检验知选B .12.两个分类变量X 和Y, 值域分别为{x 1,x 2}和{y 1,y 2}, 其样本频数分别是a =10, b =21, c +d =35. 若X 与Y 有关系的可信程度不小于97.5%, 则c 等于( )A .3B .4C .5D .6解析:选A 列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]31×35×(10+c )(56-c )≥5.024. 把选项A, B, C, D 代入验证可知选A .二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上) 13.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要________h .解析:当x =600时,y ^=0.01×600+0.5=6.5. 答案:6.514.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故R 2=1. 答案:115.下列是关于出生男婴与女婴调查的列联表那么A =______,B =______,C ______,D =________,E =________. 解析:∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82, ∵A +35=D ,∴A =47,∵45+A =B ,∴B =92. 答案:47 92 88 82 5316.已知x ,y 之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎫4-1032+⎝⎛⎭⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫3-722+(4-4)2+⎝⎛⎭⎫5-922=12.因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)试说明在这三种心理障碍中哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得K 21=110×(5×60-25×20)230×80×25×85≈0.863,K 22=110×(10×70-20×10)230×80×20×90≈6.366,K 23=110×(15×30-15×50)230×80×65×45≈1.410.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:(1)画出散点图,并判断是否线性相关; (2)求y 与x 之间的回归方程. 解:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系.(2)将数据代入公式,可得b ^≈23.253,a ^≈102.151. 故y 与x 之间的线性回归方程是y ^=23.253x +102.151.19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):(1)求m ,n ;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100×(35×30-15×20)250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下K 2=200×(50×40-60×50)2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X 的分布列为X 的数学期望为E (X )=30×0.5+20×0.3+15×0.2=24,X 的方差为D (X )=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y 的分布列为Y 的数学期望为E (Y )=30×0.6+20×0.1+15×0.3=24.5,Y 的方差为D (Y )=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25. 由上述结果可以看出D (X )<D (Y ),即甲工艺波动小,虽然E (X )<E (Y ),但相差不大,所以以后选择甲工艺.21.(本小题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:附:K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.(2)随机变量K2的观测值k=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1);②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)范围内的人数.(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:①请画出上表数据的散点图;②请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^(附参考数据:129≈11.4).解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为C 120×C 180C 2100=3299. (2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2×0.3+(4.5-3)2×0.17+(5.5-3)2×0.03]12= 1.29≈1.1,②由于μ=3,σ=1.1当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),故数理学习能力等级分数在(1.9,4.1)范围中的概率为0.682 6.数理习能力等级分数在(1.9,4.1)范围中的学生的人数约为10 000×0.682 6=6 826人.(3)①数据的散点图如图:②设线性回归方程为y ^=b ^x +a ^,则b ^=∑i =15x i y i -5x y ∑i =15x 2i -5x2=1.1,a ^=y -b ^x =-0.4.故回归直线方程为y ^=1.1x -0.4.第11页共11页。
高中数学人教A版选修2-3 第三章 统计案例 3.1学业分层测评 Word版含答案
学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.为了研究变量x 和y 的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l 1和l 2,已知两人计算过程中x -,y -分别相同,则下列说法正确的是( )A .l 1与l 2一定平行B .l 1与l 2重合C .l 1与l 2相交于点(x -,y -)D .无法判断l 1和l 2是否相交【解析】 回归直线一定过样本点的中心(x -,y -),故C 正确. 【答案】 C2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:甲 乙 丙 丁 R 20.980.780.500.85A .甲B .乙C .丙D .丁【解析】 相关指数R 2越大,表示回归模型的拟合效果越好. 【答案】 A3.对变量x ,y 进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )【解析】用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.【答案】 A4.对于指数曲线y=a e bx,令U=ln y,c=ln a,经过非线性化回归分析后,可转化的形式为()A.U=c+bx B.U=b+cxC.y=c+bx D.y=b+cx【解析】由y=a e bx得ln y=ln(a e bx),∴ln y=ln a+ln e bx,∴ln y=ln a+bx,∴U=c+bx.故选A.【答案】 A5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:父亲身高x(cm)174176176176178儿子身高y(cm)175175176177177 则y对xA.y^=x-1B.y^=x+1C.y^=88+12x D.y^=176【解析】设y对x的线性回归方程为y^=b^x+a^,因为b^=-2×(-1)+0×(-1)+0×0+0×1+2×1(-2)2+22=12,a^=176-12×176=88,所以y对x的线性回归方程为y^=12x+88.【答案】 C二、填空题6.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R2与残差平方和Q(a^,b^)如下表:则能体现A.【解析】丁同学所求得的相关指数R2最大,残差平方和Q(a^,b^)最小.此时A,B两变量线性相关性更强.【答案】丁7.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:【解析】可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为3240=45,而乙回归方程的数据准确率为4060=23.显然甲的准确率高些,因此甲回归方程好些.【答案】甲8.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过________亿元. 【导学号:97270060】【解析】∵x=10时,y=0.8×10+2+e=10+e,∵|e|≤0.5,∴y≤10.5.【答案】10.5三、解答题9.某服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:x 3456789y 66697381899091(1)(2)画出散点图;(3)求纯获利y与每天销售件数x之间的回归方程.【解】(1)x-=6,y-≈79.86,样本点的中心为(6,79.86).(2)散点图如下:(3)因为b^=∑i=17(x i-x-)(y i-y-)∑i=17(x i-x-)2≈4.75,a^=y--b^x-≈51.36,所以y^=4.75x+51.36.10.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天12345 6繁殖个数y 612254995190(1)(2)求y与x之间的回归方程.【解】(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y=c1e c2x的周围,于是令z=ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25由计算器算得,z=0.69x+1.112,则有y=e0.69x+1.112.[能力提升]1.(2016·青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如表:考试次数x 123 4所减分数y 4.543 2.5显然所减分数y则其线性回归方程为()A.y=0.7x+5.25 B.y=-0.6x+5.25C.y=-0.7x+6.25 D.y=-0.7x+5.25【解析】由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.考试次数的平均数为x=14(1+2+3+4)=2.5,所减分数的平均数为y=14(4.5+4+3+2.5)=3.5,即直线应该过点(2.5,3.5),代入验证可知直线y =-0.7x +5.25成立,故选D. 【答案】 D2.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:若x 与y .【解析】 ∑i =1n x i y i =6×2+8×3+10×5+12×6=158,x -=6+8+10+124=9,y -=2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344,b ^=158-4×9×4344-4×92=1420=0.7,a ^=y --b ^x -=4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3. 【答案】 y ^=0.7x -2.33.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:由表中数据算出线性回归方程y =b x +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =__________.(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__________件.【解析】 (1)由y =38,得m =40. (2)由a^=y -b ^ x ,得a ^=58, 故y ^=-2x +58, 当x =22时,y ^=14,故三月中旬的销售量约为14件. 【答案】 (1)40 (2)144.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图3-1-2xyw∑i =18(x i -x )2∑i =18(w i -w )2 ∑i =18(x i -x )(y i -y ) ∑i =18(w i -w )(y i -y ) 46.65636.8289.81.61 469108.8表中w i =x i ,w ]=18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,α^=v -β^ u . 【解】 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d^=∑i =18(w i -w )(y i -y )∑i =18(w i -w )2=108.81.6=68,c ^=y -d^ w =563-68×6.8=100.6, 所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
人教版数学高二A版选修2-3本章测评第三章统计案例3
本章知识结构本章测试1下列两个变量之间的关系哪个不是函数关系( ) A.角度和它的余弦值 B.正方形边长和面积C.正n边形的边数和顶点角度之和D.人的年龄和身高思路解析:函数关系就是两个变量之间有确定性的关系.A 、B 、C 都是函数关系,我们甚至可以写出它们的函数表达式为f(θ)=cosθ,g(a)=a 2,h(n)=nπ-2π.D 不是函数关系,对于年龄确定的人群,仍可以有不同身高的人. 答案:D2某工厂某产品产量(千件)与单位成本x(元)满足回归直线方程y=77.36-1.82x,则以下说法中正确的是( )A.产量每增加1 000件,单位成本下降1.82元B.产量每减少1 000件,单位成本下降1.82元C.产量每增加1 000件,单位成本上升1.82元D.产量每减少1 000件,单位成本上升1.82元思路解析:在回归直线方程a x by ˆˆ++=中,b ˆ=-1.82是斜率的估计值,说明产量每增加1 000件,单位成本下降1.82元.答案:A3下列有关线性回归的说法,不正确的是( )A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线方程最能代表观测值x,y之间的关系D.任何一组观测值都能得到具有代表意义的回归直线方程 思路解析:D 中并非任何一组观测值都能得到具有代表意义的回归直线方程,只是说总体上大多数观测值符合,也可能有个别的观测值差距较大. 答案:D4实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )A.y=x+1B.y=x+2C.y=2x+1D.y=x-1思路解析:由题意发现,(x,y)的四组值均满足y=x+1,故y=x+1即为回归直线方程,不必利用公式计算. 答案:A5对于回归分析,下列说法错误的是( )A.在回归分析中,变量间的关系若是确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r 2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r ∈(-1,1)思路解析:由定义可知,相关系数|r|≤1,故D 错误. 答案:D6为了研究男子的年龄与吸烟的关系,抽查了100个男人,按年龄超过和不超过40岁,吸则有____________的把握确定吸烟量与年龄有关( ) A.99.9% B.99%C.95%D.没有理由 思路解析:利用题中列联表,代入公式计算K 2=40603565)15102550(1002⨯⨯⨯⨯-⨯⨯≈22.16>10.828,所以我们有99.9%的把握确定吸烟量与年龄有关. 答案:A7分析两个分类变量之间是否有关系的常用方法有______________;独立性检验的基本思想类似于______________.思路解析:根据课本概念填空. 答案:频率比较法、图形分析法(三维柱形图、二维条形图、频率分布图)、独立性检验 反证法.8对于回归直线方程=4.75x+257,当x=28时,y的估计值是______________. 思路解析:将x的值代入回归直线方程得估计值y=4.75×28+257=390. 答案:390则“X 与Y 之间有关系”的概率是______________.思路解析:求“X 与Y 之间有关系”的概率也就是求有多大把握认为“X 与Y 之间有关系”.由题意可求得K 2=)1015)(405)(1040)(155()1540105)(1040155(2++++⨯-⨯+++≈18.8>10.828.即P(K 2≥10.828)≈0.001.所以“X 与Y 之间有关系”的概率是0.999. 答案:0.999其中,a,15-a均为大于5的整数,则a取何值时,有90%的把握认为“X 与Y 之间有关系”?思路解析:要有90%的把握认为“X 与Y 之间有关系”,需要检验随机变量K 2的值大于2.706.故求得K 2后解不等式即可.解:要有90%的把握认为“X 与Y 之间有关系”,需要检验随机变量K 2的值大于2.706. 则K 2=9060)607(1350154520)]15)(20()30([6522⨯-=⨯⨯⨯---+a a a a a >2.706解之可得,a>13.36或a<3.78,而原题知a>5且15-a>5,a ∈Z ,即a=6,7,8,9.故不存在这样的整数a使X 与Y 之间有90%的把握认为它们之间有关系.若已知二者相关,求出回归直线方程.思路解析:求回归直线方程,就是由公式计算bˆ与a ˆ的值. 解:由题意得,x =44.50,y =7.37,设回归直线方程为a x by ˆˆ++=,则 bˆ=2121xn xxy n yx ni ini ii --∑∑==≈0.175,aˆ=-0.43.故所求的回归直线方程为y ˆ=0.715x-0.43.思路解析:这是一个实际应用的回归分析问题,其实就是找出回归方程,通过回归方程来分析产品产量与单位成本的关系.解:设回归直线方程为a x by ˆˆ++=,则 ∑∑=======61612,79,716426,27621i i i i i y x x y x =1 481,所以代入公式,2)27(679712761481ˆ⨯-⨯⨯-=b≈-1.818, 27)818.1(71ˆ⨯--=a≈77.36, 故回归直线方程为yˆ=77.36-1.82x ;故回归系数b的意义可知:产量每增加1 000件,产品的单位成本就降低1.82元.13炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程.(3)预报当钢水含碳量为160个0.01%时,应冶炼多少分钟? 思路解析:(1)判定两个变量是否具有线性相关关系,可通过计算相关系数与临界值关系; (2)设回归直线方程,依公式代入相关量计算可得;(3)把x=160代入回归直线方程求解可得.于是r=)10)(10(102101221012101y y x x yx yx i i i i i ii---∑∑∑===≈0.990 6,查表得显著性水平0.05与n-2的相关系数临界值r 0.05=0.632,∴r>r 0.05,所以y与x具有线性相关关系.(2)设所求的回归直线方程为a x by ˆˆ++=,b ˆ=210121011010xx yx yx i i i ii --∑∑==≈1.267,aˆ≈-30.51. 即所求的回归直线方程为yˆ=1 267x-30.51.(3)当x=160时,yˆ=1.267×160-30.51≈172 (min),即大约冶炼172 min. 14研究某特殊药物有无副作用(比如服用后恶心),给50个患者服用此药,给另外50个试问此药物有无恶心的副作用?思路解析:根据列联表中的数据代入公式求得K 2的值,与临界值进行比较判断得出相应结论.解:由题意,问题可以归纳为独立检验假设H 1:服该药物(A )与恶心(B )独立.为了检验假设,计算统计量K 2=81195050)3544615(1002⨯⨯⨯⨯-⨯⨯≈7.86>6.635.故拒绝H 1,即不能认为药物无恶心副作用,也可以说,我们有99%的把握说,该药物与副作用(恶心)有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学业分层测评
(建议用时:45分钟)
[学业达标]
一、选择题
1.为了研究变量x 和y 的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l 1和l 2,已知两人计算过程中x -,y -分别相同,则下列说法正确的是( )
A .l 1与l 2一定平行
B .l 1与l 2重合
C .l 1与l 2相交于点(x -,y -)
D .无法判断l 1和l 2是否相交
【解析】 回归直线一定过样本点的中心(x -,y -),故C 正确. 【答案】 C
2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:
A .甲
B .乙
C .丙
D .丁
【解析】 相关指数R 2越大,表示回归模型的拟合效果越好. 【答案】 A
3.对变量x ,y 进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
【解析】 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
【答案】 A
4.对于指数曲线y =a e bx ,令U =ln y ,c =ln a ,经过非线性化回归分析后,可转化的形式为( )
A .U =c +bx
B .U =b +cx
C .y =c +bx
D .y =b +cx
【解析】 由y =a e bx 得ln y =ln(a e bx ),∴ln y =ln a + ln e bx ,
∴ln y =ln a +bx ,∴U =c +bx .故选A. 【答案】 A
5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:
则y 对x A.y ^=x -1 B.y ^=x +1 C.y ^=88+12x D.y ^=176
【解析】 设y 对x 的线性回归方程为y ^=b ^x +a ^, 因为b
^=-2×(-1)+0×(-1)+0×0+0×1+2×1(-2)2+22
=12,a ^=176-1
2×176=88,所以y 对x 的线性回归方程为y ^=1
2x +88.
【答案】 C 二、填空题
6.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R 2与残差平方和Q (a
^,b ^)如下表:
则能体现A ,B
【解析】丁同学所求得的相关指数R2最大,残差平方和Q(a
^,b^)最小.此时A,B两变量线性相关性更强.
【答案】丁
7.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:
【解析】可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归
方程的数据准确率为32
40=
4
5,而乙回归方程的数据准确率为
40
60=
2
3.显然甲的准确率高些,因此
甲回归方程好些.
【答案】甲
8.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b =0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过________亿元. 【导学号:97270060】
【解析】∵x=10时,y=0.8×10+2+e=10+e,
∵|e|≤0.5,∴y≤10.5.
【答案】10.5
三、解答题
9.某服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:
(1)
(2)画出散点图;
(3)求纯获利y与每天销售件数x之间的回归方程.
【解】(1)x-=6,y-≈79.86,样本点的中心为(6,79.86).
(2)散点图如下:
(3)因为b
^=
∑i =1
7
(x i -x -)(y i -y -)∑i =1
7 (x i -x -
)2≈4.75,a ^=y --b ^x -
≈51.36,
所以y ^=4.75x +51.36.
10.为了研究某种细菌随时间x 变化繁殖个数y 的变化,收集数据如下:
(1) (2)求y 与x 之间的回归方程. 【解】 (1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的周围,于是令
z =ln y ,则
由计算器算得,z ^=0.69x +1.112,则有y =e 0.69x +1.112.
[能力提升]
1.(2016·青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如表:
显然所减分数y 则其线性回归方程为( ) A .y =0.7x +5.25
B .y =-0.6x +5.25
C .y =-0.7x +6.25
D .y =-0.7x +5.25
【解析】 由题意可知,所减分数y 与模拟考试次数x 之间为负相关,所以排除A.
考试次数的平均数为x =1
4(1+2+3+4)=2.5, 所减分数的平均数为y =1
4(4.5+4+3+2.5)=3.5,
即直线应该过点(2.5,3.5),代入验证可知直线y =-0.7x +5.25成立,故选D. 【答案】 D
2.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:
若x 与y .
【解析】 ∑i =1
n x i y i =6×2+8×3+10×5+12×6=158,x -
=6+8+10+124
=9,
y -=2+3+5+64
=4,
∑i =1
n
x 2i =62+82+102+122
=344, b ^=158-4×9×4344-4×92=1420=0.7,
a ^=y --
b ^x -=4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3. 【答案】 y ^=0.7x -2.3
3.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:
由表中数据算出线性回归方程y =b x +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =__________.
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__________件.
【解析】 (1)由y =38,得m =40.
(2)由a
^=y -b ^ x ,得a ^=58, 故y ^=-2x +58, 当x =22时,y ^=14,
故三月中旬的销售量约为14件. 【答案】 (1)40 (2)14
4.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
图3-1-2
表中w i =x i ,w ]=18∑i =1
8
w i .
(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;
(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?
附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距
的最小二乘估计分别为β
^=
∑i =1
n
(u i -u )(v i -v )
∑i =1n
(u i -u )2
,α
^=v -β^ u . 【解】 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.
(2)令w =x ,先建立y 关于w 的线性回归方程.
由于d
^=∑i =1
8
(w i -w )(y i -y )
∑i =1
8
(w i -w )2
=108.8
1.6=68,
c ^=y -d
^ w =563-68×6.8=100.6, 所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,
年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^
=0.2(100.6+68x )-x =-x +13.6x +20.12.
所以当x =13.6
2=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。