高三数学总复习 课时提升作业(五十八) 第九章 第五节 相关性、最小二乘估计、回归分析与独立性检验 文
高考数学一轮复习 第9章 算法初步、统计与统计案例 第4节 相关性、最小二乘估计与统计案例教师用书

第四节相关性、最小二乘估计与统计案例 [考纲传真] 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及其简单应用.1.相关性(1)线性相关若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.(2)非线性相关若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的.(3)不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2.最小二乘估计(1)最小二乘法如果有n个点(x1,y1),(x2,y2),…,(x n,y n)可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2.使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的线性回归方程,其中a,b是待定参数.3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,(x ,y )称为样本点的中心.(3)相关系数r①r =∑i =1nx i y i -n x y∑i =1nx 2i -n x2∑i =1ny 2i -n y 2;②当r >0时,称两个变量正相关. 当r <0时,称两个变量负相关. 当r =0时,称两个变量线性不相关. 4.独立性检验 若一个2×2列联表为:BAB 1 B 2 总计A 1 a b a +b A 2c d c +d 总计a +cb +dn =a +b +c +d则它们的独立性检验公式为:χ2=n ad -bc 2a +bc +d a +cb +d.(1)当χ2≤2.706时,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联.1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( ) (2)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( )(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.( )(4)若事件A,B关系越密切,则由观测数据计算得到的χ2的值越小.( )[答案] (1)√(2)×(3)×(4)×2.(2017·某某一模)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4A[因为变量x和y正相关,排除选项C,D.又样本中心(3,3.5)在回归直线上,排除B,选项A满足.]3.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )图941A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关D[对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.]4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是 ( )A .有99%的人认为该电视栏目优秀B .有99%的人认为该电视栏目是否优秀与改革有关系C .有99%的把握认为该电视栏目是否优秀与改革有关系D .没有理由认为该电视栏目是否优秀与改革有关系D [只有χ2>6.635才能有99%的把握认为“该电视栏目是否优秀与改革有关系”,而即使χ2>6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关,故只有D 正确.]5.(教材改编)若8名学生的身高和体重数据如下表:编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157170 175 165 155 170 体重/kg48575464614359第3名学生的体重漏填,但线性回归方程是y ^=0.849x -85.712,则第3名学生的体重估计为________kg.50 [设第3名学生的体重为a ,则18(48+57+a +54+64+61+43+59)=0.849×18(165+165+157+170+175+165+155+170)-85.712. 解得a ≈50.]相关关系的判断(1)(2015·某某高考)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关(2)x 和y 的散点图如图942所示,则下列说法中所有正确命题的序号为________.图942①x,y是负相关关系;②在该相关关系中,若用y=c1e c2x拟合时的相关系数的平方为r21,用y=bx+a拟合时的相关系数的平方为r22,则r21>r22;③x,y之间不能建立线性回归方程.(1)C(2)①②[(1)因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,则z=by+a=-0.1bx+b+a,故x与z负相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1e c2x拟合比用y=bx+a拟合效果要好,则r21>r22,故②正确;x,y 之间可以建立线性回归方程,但拟合效果不好,故③错误.][规律方法] 1.利用散点图判断两个变量是否有相关关系是比较直观简便的方法.若所有点看上去都在一条直线附近波动,则称变量间是线性相关的.2.判断两个变量正相关还是负相关,有三种方法:(1)利用散点图.(2)利用相关系数r的符号.当r>0时,正相关;r<0时,负相关.(3)在已知两变量线性相关时,也可以利用回归方程y=a+bx.当b>0时,两变量是正相关,当b<0时,两变量是负相关.[变式训练1] 某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:x 10151720252832y 1 1.3 1.82 2.6 2.7 3.3判断y与x之间是否具有相关关系.[解]散点图如下:由散点图可以看出各点在一条直线附近且利润随销售总额的增加而增大,它们之间不仅具有相关关系,而且呈正相关.线性回归方程及应用(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.图943注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 t i -ty i -y∑ni =1t i -t2∑n i =1y i -y2,回归方程y =a +bt中斜率和截距的最小二乘估计公式分别为b =∑ni =1t i -ty i -y∑ni =1t i -t2,a =y --b t .[解] (1)由折线图中的数据和附注中的参考数据得t =4,∑7i =1(t i -t )2=28,∑7i =1y i -y2=0.55,2分∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,所以r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系. 5分(2)由y =9.327≈1.331及(1)得b =∑7i =1t i -ty i -y∑7i =1t i -t2=2.8928≈0.103. 8分 a =y -b t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y =0.92+0.10t . 10分将2016年对应的t =9代入回归方程得y =0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 12分[规律方法] 1.在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数r 进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.(1)正确运用计算b ,a 的公式和准确的计算,是求线性回归方程的关键.(2)回归直线y =bx +a 必过样本点的中心(x ,y ).[变式训练2] (2014·全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:年 份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b =∑ni =1t i -t-y i -y-∑ni =1t i -t-2,a =y --b t -.[解] (1)由所给数据计算得t -=17(1+2+3+4+5+6+7)=4,y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑7i =1 (t i -t -)2=9+4+1+0+1+4+9=28,3分∑7i =1(t i -t -)(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b =∑7i =1t i -t-y i -y-∑7i =1t i -t-2=1428=0,5, a =y --b t -=4.3-0.5×4=2.3, 所求回归方程为y =0.5t +2.3. 6分(2)由(1)知,b =0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 9分将2015年的年份代号t =9代入(1)中的回归方程,得y =0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 12分独立性检验(2017·某某调研)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图944所示),其中样本数据的分组区间为:[0,2),[2,4),[4,6),[6,8),[8,10),[10,12).估计该校学生每周平均体育运动时间超过4小时的概率;图944(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P (χ2≥x 0) 0.10 0.05 0.010 0.005x 02.7063.841 6.635 7.879附:χ2=n ad -bc 2a +bc +d a +cb +d.[解] (1)利用分层抽样,300×4 50015 000=90,所以应收集90位女生的样本数据. 4分(2)由频率分布直方图得1-2×(0.025+0.100)=0.75.所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. 8分(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时. 10分又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生 女生 总计 每周平均体育运动时间不超过4小时 45 30 75 每周平均体育运动时间超过4小时165 60 225 总计21090300将2×2列联表中的数据代入公式计算,得χ2的值 χ2=300×45×60-165×30275×225×210×90=10021≈4.762>3.841. 所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 12分 [规律方法] 1.在2×2列联表中,如果两个变量没有关系,则应满足ad -bc ≈0.|ad -bc |越小,说明两个变量之间关系越弱;|ad -bc |越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表; (2)根据公式χ2=n ad -bc 2a +ba +cb +dc +d计算χ2的值;(3)比较χ2与临界值的大小关系,作统计推断.[变式训练3] (2017·某某联考)某市地铁即将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下;月收入(单位:百元) [15,25) [25,35) [35,45) [45,55) [55,65) [65,75) 赞成定价者人数 1 2 3 5 3 4 认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.月收入不低于55百元的人数月收入低于55百元的人数 总计 认为价格偏高者 赞成定价者 总计附:χ2=n ad -bc 2a +bc +d a +c a +d.P (χ2≥x 0)0.05 0.01 x 03.8416.635[解] (1)“赞成定价者”的月平均收入为x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元). 5分(2)根据条件可得2×2列联表如下:月收入不低于55百元的人数月收入低于55百元的人数总计 认为价格偏高者 3 29 32 赞成定价者 7 11 18 总计104050χ2=50×3×11-7×29210×40×18×32≈6.27<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”. 12分[思想与方法]word1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.根据χ2的值可以判断两个分类变量有关的可信程度.[易错与防X]1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量χ2的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.。
2022年秋高考数学一轮总复习课时提升作业第九章算法初步统

2022年秋高考数学一轮总复习课时提升作业第九章算法初步统温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
课时提升作业六十三相关性、最小二乘估计、回归分析与独立性检验(20分钟45分)一、选择题(每小题5分,共15分)1.(2022·太原模拟)下表是降耗技术改造后生产甲产品过程中记录的产量某(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于某的线性回归方程y=0.7某+0.35,那么表中m的值为()A.4B.3.5C.3D.4.5【解析】选C.依题意得=某(3+4+5+6)=4.5,=(2.5+m+4+4.5)=(11+m),由于线性回归方程必经过点,于是有=0.7某4.5+0.35,解得m=3.2.(2022·渭南模拟)某城市对机动车单双号限行进行了调查,在参加调查的2548名有车人中有1560名持反对意见,2452名无车人中有1200名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否有关系时,用什么方法最有说服力()A.平均数与方差B.回归直线方程C.独立性检验D.概率【解析】选C.在参加调查的2548名有车人中有1560名持反对意见,2452名无车人中有1200名持反对意见,可得:χ2==76.256>6.635,故有99%的把握认为“拥有车辆”与“反对机动车单双号限行”有关系.故利用独立性检验的方法最有说服力.3.设某大学的女生体重y(单位:kg)与身高某(单位:cm)具有线性相关关系,根据一组样本数据(某i,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y=0.85某-85.71,则下列结论中不正确的是世纪金榜导学号99972833()A.y与某具有正的线性相关关系B.回归直线过点(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg【解析】选D.由线性回归方程为y=0.85某-85.71知y随某的增大而增大,所以y与某具有正的线性相关关系,由最小二乘法建立的线性回归方程的过程知y=b某+a=b某+-b,所以回归直线过点(,),利用线性回归方程可以预测估计但不能作断定,所以D不正确.二、填空题(每小题5分,共10分)4.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如表:为了判断统计专业是否与性别有关系,根据表中的数据,χ2=≈4.844>3.841,所以判定统计专业与性别有关系,那么这种判断的把握为________.【解析】因为χ2≈4.844>3.841,所以作出“统计专业与性别有关系”的判断的把握为95%.答案:95%5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得线性回归方程为y=0.67某+54.9.现发现表中有一个数据看不清,请你推断出该数据的值为________.世纪金榜导学号99972834【解析】由已知可计算求出=30,而线性回归方程必过点(,),则=0.67某30+54.9=75,设模糊数字为a,则=75,计算得a=68.答案:68三、解答题(每小题10分,共20分)6.一台机器由于使用时间较长,但还可以用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果.世纪金榜导学号99972835(1)画出散点图.(2)如果y与某有线性相关关系,求线性回归方程.(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内【解析】(1)画出散点图,如图.(2)=12.5,=8.25,某iyi=438,=660,所以b==≈0.7286,a=-b≈8.25-0.7286某12.5=-0.8575.所以线性回归方程为y=0.7286某-0.8575.(3)要使y≤10,则0.7286某-0.8575≤10,某≤14.9018.所以机器的转速应控制在14.9018rad/及以下.7.(2022·赣州模拟)目前我国很多城市出现了雾霾天气,已经给广大人民的健康带来影响,其中汽车尾气排放是造成雾霾天气的重要因素之一,很多城市提倡绿色出行方式,实施机动车尾号限行.某市为了解民众对“车辆限行”的态度,随机调查了50人,并将调查结果制成如表:世纪金榜导学号99972836(1)若从年龄在15,25)、25,35)的被调查者中各随机选取2人进行跟踪调查,记选中的4人中不赞成“车辆限行”的人数记为某,求某的分布列和期望.(2)把年龄在15,45)称为中青年,年龄在45,75]称为中老年,请根据上表完成2某2列联表,并说明民众对“车辆限行”的态度与年龄是否有关联.【解析】(1)某的取值为0,1,2,3,P(某=0)=·=,P(某=1)=·+·=,P(某=2)=·+·=,P(某=3)=·=.某的分布列为E某=0某+1某+2某+3某=1.2.(2)2某2列联表如图所示χ2=≈0.0145<2.706,说明民众对“车辆限行”的态度与年龄没有关联.(20分钟40分)1.(5分)已知数组(某1,y1),(某2,y2),…,(某10,y10)满足线性回归方程y=b某+a,则“(某0,y0)满足线性回归方程y=b某+a”是“某0=,y0=”的()A.充分不必要条件B.必要不充分条件C.充要条件D.既不充分也不必要条件【解析】选B.某0,y0为这10组数据的平均值,根据公式计算线性回归方程y=b某+a的b以后,再根据a=-b(,为样本平均值)求得a.因此(,)一定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点.【加固训练】对具有线性相关关系的变量某,y有一组观测数据(某i,yi)(i=1,2,…,8),其线性回归方程是y=某+a,且某1+某2+某3+…+某8=2(y1+y2+y3+…+y8)=6,则实数a的值是()A.B.C.D.【解析】选B.依题意可知样本中心点为,则=某+a,解得a=.2.(5分)(2022·上饶模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:。
高三数学一轮复习 相关性小二乘估计随堂检测 文 试题

2021?金版新学案?高三数学一轮复习相关性最小二乘估计随堂检测文北师大版(本栏目内容,学生用书中以活页形式单独装订成册!)一、选择题(每一小题6分,一共36分)1.以下关系中,是相关关系的为( )①学生的学习态度与学习成绩之间的关系;②老师的执教程度与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.①② B.①③C.②③ D.②④【解析】学生的学习成绩与学生的学习态度和老师的执教程度是相关的,与学生的身高和家庭经济条件不相关.【答案】 A2.以下命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线y=bx+a及回归系数b,可以估计和预测变量的取值和变化趋势.其中正确的命题是( )A.①② B.①③C.②③ D.①②③【解析】利用最小二乘法求回归直线就是求样本数据的点到直线的间隔的平方和最小值.利用回归直线,可以进展预测.而从散点图的分布可以判断是否线性相关.【答案】 D3.回归方程y =1.5x -15,那么( ) x -15 B .15是回归系数aC .1.5是回归系数aD .x =10时,y =0【解析】 由a =y -b x 得y =b x +a ,即为A. 【答案】 A4.以下表达中:( )①变量间关系有函数关系,还有相关关系; ②回归函数即用函数关系近似地描绘互相关系;③∑i =1nx i =x 1+x 2+…+x n ;④线性回归方程y =bx +a 中,b =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x)2,a =y -b x ;⑤线性回归方程一定可以近似地表示所有相关关系.其中正确的有( ) A .①②③ B.①②③④⑤ C .①②③④ D.③④⑤【解析】 ①②③④显然正确,线性回归方程不一定可以近似地表示所有相关关系,如它不可表示非线性的相关关系,因此,⑤错误,所以选C.【答案】 C5.某考察团对全国10大城进展职工人均工资程度x(千元)与居民人均消费程度y(千元)统计调查,y 与x 具有相关关系,回归方程为y =0.66x +1.562,假设某城居民人均消费程度为7.675千元,估计该城人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%【解析】 将y =7.675代入回归方程,可计算得x≈9.26,所以该城人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.【答案】 A6.三点(3,10),(7,20),(11,24)的线性回归方程为( )【解析】 方法一:设回归直线方程为y =bx +a ,那么 b =x 1y 1+x 2y 2+x 3y 3-3x y x 12+x 22+x 32-3x 2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a =y -b x =18-1.75×7=5.75. 故y =1.75x +5.75,应选B.方法二:将点代入选项用代入法检验可排除A 、C 、D. 【答案】 B二、填空题(每一小题6分,一共18分)7.如下图,有5组(x ,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.【解析】 因为A 、B 、C 、E 四点分布在一条直线附近且贴近某一直线,D 点离得远. 【答案】 D8.下表是某地的年降雨量与年平均气温,判断两者是否是相关关系________.(填“是〞或者“否〞)年平均气温(℃)年降雨量(mm) 748 542 507 813 547 701 432 【解析】由于散点图中各点并不在一条直线的附近,所以它们不具有相关关系.【答案】否9.回归方程y=4.4x+838.19,那么可估计x与y增长速度之比约为________.【解析】Δy=y2-y1=4.4(x2-x1),∴x2-x1y2-y1=14.4=1044≈0.227.三、解答题(一共46分)10.(15分)鲁洁棉业公司的科研人员在7块并排、形状大小一样的试验田上对某棉花新品种进展施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).施化肥量x 15 20 25 30 35 40 45棉花产量y 330 345 365 405 445 450 455(1)画出散点图;(2)判断是否具有相关关系.【解析】(1)散点图如下图,(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.11.(15分)变量x,y线性相关,x与y有以下对应数据:x 1 2 3 4求y 对x 【解析】 x =1+2+3+44=52,y =12+32+2+34=74,∑i =14x i 2=12+22+32+42=30,∑i =14x i y i =1×12+2×32+3×2+4×3=432,∴b=∑i =14x i y i -4xy∑i =14x i 2-4x2=432-4×52×7430-4×254=45,a =y -b x =74-45×52=-14.∴y=45x -14.12.(16分)某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进展调查,其结果如下:(1)画出散点图;(2)假如变量x 与y 之间具有线性相关关系,求出回归直线方程; (3)测算人均收入为280元时,人均生活费支出应为多少元? 【解析】 (1)散点图如下图:(2) =637.4,=490.4,∴y=0.70 761x+39.369 39.(3)把x=280代入,得y≈元励志赠言经典语录精选句;挥动**,放飞梦想。
高考数学一轮总复习之相关性、最小二乘估计与统计案例 精品优选公开课件

抓住3个考点
突破3个考向
揭秘3年高考
考点自测
1.下列两个变量之间的关系是相关关系的是
( ).
A.正方体的棱长与体积 B.单位面积的产量为常数时,土地面积与总产量 C.日照时间与水稻的亩产量 D.电压一定时,电流与电阻 解析 A,B,D中两个变量间的关系都是确定的,所以是 函数关系;C中的两个变量间是相关关系,对于日照时间 一定的水稻,仍可以有不同的亩产量,故选C. 答案 C
抓住3个考点
突破3个考向
揭秘3年高考
①当χ2≤2.706时,没有充分的证据判定变量A,B有关联, 可以认为变量A,B是没有关联的; ②当χ2>2.706时,有90%的把握判定变量A,B有关联; ③当χ2>3.841时,有95%的把握判定变量A,B有关联; ④当χ2>6.635时,有99%的把握判定变量A,B有关联.
计值为y=0.196 2×150+1.816 6=31.246 6(万元).
抓住3个考点
突破3个考向
揭秘3年高考
考向三 独立性检验的基本思想及应用
【例3】►在调查男女乘客是否晕机的事件中,已知男乘客晕 机为28人,不晕机的也是28人,而女乘客晕机为28人, 不晕机的为56人. (1)根据以上数据建立一个2×2的列联表; (2)能否有95%的把握认为晕机与性别有关系?
抓住3个考点
突破3个考向
揭秘3年高考
[审题视点] (1)列2×2列联表;(2)代入公式求χ2的值进行判 断.
解 (1)2×2列联表如下:
晕机 不晕机 合计
男乘客
28
28
56
女乘客
28
56
84
合计
56
84
140
(2)χ2=140×5(6×288×4×565-6×288×4 28)2=395≈3.889>3.841. 所以有 95%的把握认为晕机与性别有关系.
高三数学相关性及最小二乘估计PPT精品课件

2.在分析两个变量的相关关系时,可根据样本数据散点图确定 两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线 方程.
3.求线性回归方程y=bx+a的关键是求回归系数a,b其中回归 系数b可借助于计算器
完成,因为 a= y -b x ,即 y =b x +a,所以点( x , y )一定 满足线性回归方程,即回归直线一定过点( x , y ).
示 3.在高考题中本部分的命题主要是以选择、填空题
1.散点图 在考虑两个量的关系时,为了对变量之间的关系有一个大致的了 解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一 个图,通常称这样的图为变量之间的 散点图 . 2.线性相关 (1)从散点图上看,如果变量之间存在某种关系,这些点有一个集 中的大致趋势通常可以用一条光滑的曲线来近似,这样近似的过程称 为 曲线拟合 . (2)若两个变量x和y的散点图中所有点看上去都在 一条直线 附近 波动,则称变量间是 线性相关 的.此时,我们可以用 一条直线 近 拟.
2.随着我国经济的快速发展,城乡居民的生活水平不断提高, 为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门 随机调查10个家庭,得数据如下:
家庭编 号 1 2 3 4 5 6 7 8 9 10
xi(收入) 千元
0.8
1.1
1.3
1.5
1.5
1.8
2.0
2.2
2.4
2.8
yi(支出) 千元
(3)若所有点看上去都在某条曲线(不是直线)附近波动,则 称此相关为非线性相关的.
(4)如果所有的点的散点图中没有显示任何关系,则称变量 间是 不相关 的.
3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 距离的
高考数学总复习课时提升作业9.4相关性、最小二乘估计、回归分析与独立性检验

高考数学总复习课时提升作业9.4相关性、最小二乘估计、回归分析与独立性检验一、选择题(每小题5分,共25分)1.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件大约需要的时间为( )A.6.5hB.5.5hC.3.5hD.0.5h【解析】选A.将x=600代入线性回归方程即得A.2.下列关于χ2的说法中正确的是( )A.χ2在任何相互独立问题中都可以用来检验有关还是无关B.χ2的值越大,两个事件的相关性就越大C.χ2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.χ2的计算公式为χ2=【解析】选C.χ2值是用来判断两个分类变量是否有关系的一个随机变量,并不是适用于任何独立问题的相关性检验.3.某卫生机构对366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,则有的把握认为糖尿病患者与遗传有关系. ( )A.0.1%B.0.5%C.99%D.95%【解析】选D.可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计阳性家族史16 93 109阴性家族史17 240 257总计33 333 366根据列联表中的数据,得χ2=≈6.067>3.841.故有95%的把握认为糖尿病患者与遗传有关系.4.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:杂质高杂质低旧设备37 121新设备22 202根据以上数据,则( )A.含杂质的高低与设备是否改造有关B.含杂质的高低与设备是否改造无关C.设备是否改造不能决定含杂质的高低D.以上答案都不对【解析】选A.由已知数据得到如下2×2列联表:杂质高杂质低总计旧设备37 121 158新设备22 202 224总计59 323 382由公式得χ2=≈13.11,由于13.11>6.635,故有99%的把握认为含杂质的高低与设备是否改造有关. 5.某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数据如下表所示:日期10月1日10月2日10月3日10月4日10月5日价格x(元) 9 9.5 10 10.5 11销售量11 10 8 6 5y(万件)已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:=-3.2x+,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格约为( ) A.14.2元 B.10.8元C.14.8元D.10.2元【解析】选D.依题意=10,=8.因为线性回归直线必过样本点的中心(,),所以8=-3.2×10+,解得=40.所以回归直线方程为=-3.2x+40.令y=7.36,则7.36=-3.2x+40,解得x=10.2.所以该产品的价格约为10.2元.二、填空题(每小题5分,共15分)6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.【解析】χ2≈3.918>3.841,而P(χ2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.答案:①7.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为y=1.197x-3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为cm.【解析】根据线性回归方程y=1.197x-3.660,将x=50代入得y=56.19,则肱骨长度的估计值为56.19cm.答案:56.198.(2015·咸阳模拟)某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:由上表,可得线性回归方程y=bx+a中的b=-4,据此模型预计零售价定为15元时,每天的销售量为.【解析】=17.5,=39,因为b=-4,=b+a,所以a=39+4×17.5=109,所以线性回归方程为y=-4x+109,所以当x=15时,y=-4×15+109=49(件).答案:49三、解答题(每小题10分,共20分)9.(2015·重庆模拟)假设关于某市的房屋面积x(平方米)与购房费用y(万元),有如下的统计数据:x(平方米) 80 90 100 110y(万元) 42 46 53 59(1)用最小二乘法求出y关于x的线性回归方程y=bx+a.(假设已知y对x呈线性相关)(2)若在该市购买120平方米的房屋,估计购房费用是多少?【解析】(1)=95,=50,代入公式求得b=0.58,a=-5.1.所以线性回归方程为y=0.58x-5.1.(2)将x=120代入线性回归方程得y=64.5(万元).所以购买120平方米的房屋时,估计购房费用是64.5万元.【加固训练】假定小麦基本苗数x(千棵)与成熟期有效穗数y(千棵)之间存在相关关系,今测得5组数据如下:x(千棵) 15.0 25.8 30.0 36.6 44.4y(千棵) 39.4 42.9 42.9 43.1 49.2(1)以x为解释变量,y为预报变量,作出散点图.(2)求y与x之间的线性回归方程.【解析】(1)散点图如图所示:(2)由散点图可以看出x与y之间具有线性相关关系,设线性回归方程为y=bx+a. 计算可得b≈0.291,a≈34.664.故所求线性回归方程为y=0.291x+34.664.10.(2015·宜春模拟)“开门大吉”是某电视台推出的游戏益智节目.选手面对1-4号4扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参加比赛的选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表:判断是否有90%的把握认为猜对歌曲名称与年龄有关?说明你的理由.(2)现计划在这次场外调查中按年龄段选取6名选手,并抽取3名幸运奖项,求至少有一人年龄在20~30岁之间的概率.【解析】(1)2×2列联表如下正确错误合计20~30(岁) 10 30 4030~40(岁) 10 70 80合计20 100 120根据列联表所给的数据可得χ2==3,因为3>2.706,所以有90%的把握认为猜对歌曲名称与年龄有关.(2)按照分层抽样方法可知:20~30(岁)抽取:6×=2(人);30~40(岁)抽取:6×=4(人),在上述抽取的6名选手中,年龄在20~30(岁)有2人,年龄在30~40(岁)有4人. 年龄在20~30(岁)记为(A,B);年龄在30~40(岁)记为(a,b,c,d),则从6名选手中任取3名的所有情况为:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b,c),(B,b,d),(B,c,d),(a,b,c),(a,b,d),(a,c,d),(b,c,d)共20种情况.其中至少有一人年龄在20~30情况有:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b,c),(B,b,d),(B,c,d),共16种情况.记至少有一人年龄在20~30岁为事件C,则P(C)==.所以至少有一人年龄在20~30岁之间的概率为.(20分钟40分)1.(5分)(2013·福建高考改编)已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得线性回归方程为y=bx+a,若某同学根据上表中的前两组数据和求得的直线方程为y′=b′x+a′,则以下结论正确的是( ) A.b>b′,a>a′ B.b>b′,a<a′C.b<b′,a>a′D.b<b′,a<a′【解题提示】审题时,要注意“直线方程”和“回归方程”的区别.【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b′>b,a>a′.2.(5分)(2015·吉林模拟)某社区医院为了了解社区老人与儿童每月感冒的人数y(人)与月平均气温x(℃)之间的关系,随机统计了某4个月的月患病(感冒)人数与当月平均气温,其数据如下表:月平均气温x(℃) 17 13 8 2月患病y(人) 24 33 40 55由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温约为6℃,据此估计该社区下个月老年人与儿童患病人数约为( )A.38B.40C.46D.58【解析】选C.由表格得(,)为(10,38),因为y=bx+a中的b=-2,所以38=10×(-2)+a,解得:a=58,所以y=-2x+58,当x=6时,y=-2×6+58=46.故选C.【加固训练】某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为y=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产1 000吨钢中,约有吨钢是废品.【解析】因为176.5=105.492+42.569x,所以x≈1.668,即成本控制在176.5元/吨时,废品率约为1.668%.所以生产1 000吨钢中,约有1 000×1.668%=16.68(吨)钢是废品.答案:16.683.(5分)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,判断该学校15至16周岁的男生的身高和体重之间有关系的把握为.【解析】由表可得a+b=5,c+d=15,a+c=7,b+d=13,ad=48,bc=3,n=20,所以χ2==≈5.934,由于5.934>3.841,所以有95%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.答案:95%4.(12分)(2015·大庆模拟)2014年春晚过后,为了研究演员上春晚次数与受关注度的关系,某网站对其中一位经常上春晚的演员上春晚次数与受关注度进行了统计,得到如下数据:上春晚次数x(单位:次) 2 4 6 8 10粉丝数量y(单位:万人) 10 20 40 80 100(1)若该演员的粉丝数量y与上春晚次数x满足线性回归方程,试求回归方程y=bx+a,并就此分析,该演员上春晚12次时的粉丝数.(2)若用(i=1,2,3,4,5)表示统计数据时粉丝的“即时均值”(精确到整数),①求这5次统计数据时粉丝的“即时均值”的方差;②从“即时均值”中任选3组,求这三组数据之和不超过20的概率.【解析】(1)由题意可知,x i y i=1 980,=220,=(2+4+6+8+10)=6,=(10+20+40+80+100)=50,所以b==12,所以a=-b=50-12×6=-22,所以y=12x-22.当x=12时,y=12×12-22=122.即该演员上春晚12次时的粉丝数约为122万人.(2)经计算可知,这五组数据对应的“即时均值”分别为:5,5,7,10,10.①这五组“即时均值”的平均数为:7.4,则方差为:s2=[2(5-7.4)2+(7-7.4)2+2(10-7.4)2]=5.04.②这五组“即时均值”可以记为A1,A2,B,C1,C2.从“即时均值”中任选3组,选法共有(A1,A2,B),(A1,A2,C1),(A1,A2,C2),(A1,B,C1),(A2,B,C1),(A2,B,C2),(A1,B,C2),(A1,C1,C2) ,(A2,C1,C2),(B,C1,C2)共10种情况,其中和不超过20的情况有(A1,A2,B),(A1,A2,C1),(A1,A2,C2)共3种情况.故所求概率为:P=.5.(13分)(能力挑战题)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学生成绩全部介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18],求事件“|m-n|>2”的概率.(2)根据有关规定,成绩小于16秒为达标,如果男女生使用相同的达标标准,则男女生达标情况如附表:性别男女总计是否达标达标a=24 b=____ ____不达标c=____ d=12 ____总计____ ____ n=50根据表中数据,能否有99%的把握认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?【解析】(1)成绩在[13,14)的人数有:50×0.04=2人,设为a,b,成绩在[17,18]的人数有:50×0.06=3人,设为A,B,C,m,n∈[13,14)时有ab一种情况.m,n∈[17,18]时有AB,AC,BC三种情况.m,n分别在[13,14)和[17,18]时有aA,aB,aC,bA,bB,bC六种情况.A B Ca aA aB aCb bA bB bC基本事件总数为10,事件“|m-n|>2”由6个基本事件组成.所以P(|m-n|>2)==.(2)依据题意得相关的2×2列联表如下:性别男女总计是否达标达标a=24 b=6 30不达标c=8 d=12 20总计32 18 n=50 χ2=≈8.333>6.635,故有99%的把握认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.。
高中数学相关性最小二乘估计总结练习含答案解析

§7相关性§8最小二乘估计1.变量之间的两种关系(1)函数关系:函数关系是一种①的关系.例如,圆的面积S=πr2,面积S与半径r之间就是一种确定性的关系,对于自变量r的每一个确定的值,都有唯一的确定的S的值与之对应.(2)相关关系:变量之间有一定的联系,但不能完全用②来表示.如人的体重与身高的关系,一般来说,身高越高体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.在现实生活中,相关关系到处存在,从某种意义上说,函数关系可以看作是一种理想的关系模型.研究和学习相关关系,不仅使我们能够处理更为广泛的数学问题,还可以使我们对函数关系的认识再上升到一个新的高度.2.线性回归方程(1)散点图用横坐标表示一个变量,纵坐标表示另一个变量,建立平面直角坐标系,将给出的数据所表示的点在坐标系内标出,这样的图就称为③.从散点图可以看出,给出的点是否集中在一条直线附近.(2)最小二乘法如果有几个样本点(x1,y1),(x2,y2),…,(xn,yn),可以用表达式[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2来刻画这些点与直线y=a+bx的接近程度,使此式达到最小值的直线y=a+bx就是所要求的直线,这种方法称为最小二乘法.(3)线性相关关系能用直线方程近似表示的相关关系叫作④.如果在散点图中,各点集中在一条直线附近,则称这两个变量具有线性相关关系.(4)线性回归方程、回归直线一般地,设x与y是具有相关关系的两个变量,且相应的n组观测值的n个点(xi ,yi)(i=1,2,…,n)大致分布在一条直线的附近,求在整体上与这n个点最接近的一条直线.设所求直线的方程为y=bx+a,其中a,b是待定的参数,则{b=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2=∑i=1nx i y i-nx y∑i=1nx i2-nx2, a=y-bx,其中x=1n ∑i=1nxi,y=1n∑i=1nyi.这时我们将所得到的直线方程叫作线性回归方程,相应的直线叫作回归直线.注意:(i)在求出这种具有两个变量的回归直线后,就可以根据其部分观测值获得对这两个变量之间的整体关系的了解;(ii)线性相关关系主要研究两个变量之间的关系;(iii)由不具有线性相关关系的数据求出的线性回归方程是毫无意义的.一、判断变量间的相关性1.(2013湖北,4,5分,★★☆)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①②B.②③C.③④D.①④思路点拨本题主要考查线性回归的有关概念,注意题目中选择的是不正确的.二、线性回归方程的应用2.(2014重庆,3,5分,★★☆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x+2.3 B.y ^=2x-2.4C.y ^=-2x+9.5 D.y ^=-0.3x+4.4思路点拨 线性回归方程一定过点(x ,y ),验证各选项,由正相关,可得答案. 3.(2012湖南,5,5分,★☆☆)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x-85.71,则下列结论中不正确的是( ) A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg思路点拨 本题主要考查两个变量间的相关性、最小二乘法及正相关、负相关的概念.4.(2013福建,11,5分,★★☆)已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y 0 2 1 3 3 4假设根据上表数据所得线性回归直线方程为y ^=b ^x+a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( ) A.b ^>b',a ^>a' B.b ^>b',a ^<a' C.b ^<b',a ^>a' D.b ^<b',a ^<a'5.(2012福建,18,12分,★★☆)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价x(元) 8 8.2 8.4 8.6 8.8 9 销量y(件)908483 807568(1)求回归直线方程y ^=bx+a,其中b=-20,a=y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)思路点拨利用待定系数法求得回归直线方程,列关于利润的方程求解,即得结论.基础巩固训练1.下列两个变量之间的关系不是函数关系的是( )A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和内角和D.人的年龄和身高2.变量y与x之间的回归方程( )A.表示y与x之间的函数关系B.表示y与x之间的不确定关系C.反映y与x之间的真实关系D.反映y与x之间的真实关系达到最大限度的吻合3.对变量x,y,有观测数据(xi ,yi)(i=1,2,…,10),得散点图(1);对变量u,v,有观测数据(ui ,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )A.变量x与y线性相关,u与v非线性相关B.变量x与y非线性相关,u与v线性相关C.变量x与y线性相关,u与v线性相关D.变量x与y非线性相关,u与v非线性相关4.若用水量x与某种产品的产量y的线性回归方程是y=2x+1 250,若用水量为50 kg,预计该种产品的产量是( )A.1 350 kgB.大于1 350 kgC.小于1 350 kgD.以上都不对5.已知x与y具有线性相关关系,它们之间的一组数据如下表:x 0 1 2 3y 1 2 4 6则y与x的回归直线y=bx+a必过点( )A.(2,3)B.(1.5,2)C.(1.5,3.25)D.(2,3.25)6.画出下表中对应数据的散点图.根据散点图判断两个变量是否具有相关关系.A 26 18 13 10 4 -1B 20 24 34 38 50 64能力提升训练7.若在一次试验中,测得(x,y)的四组数值分别是(1,3),(2,3.8),(3,5.2),(4,6),则y 与x 之间的回归直线方程是( ) A.y=x+1.9 B.y=1.04x+1.9 C.y=0.95x+1.04D.y=1.05x-0.98.“回归”一词是在研究子女身高与父母身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归方程y=a+bx 中,b( ) A.在(-1,0)内 B.等于0 C.在(0,1)内D.在[1,+∞)内9.某个服装店经营某种服装,在某周内每天获得的纯利y(元)与该周每天销售这种服装件数x(件)的数据如下表所示: x 3 4 5 6 7 8 9 y66697381899091已知∑i=17x i 2=280,∑i=17y i 2=45 309,∑i=17x i y i =3 487.(1)求x ,y ; (2)画出散点图;(3)求每天获得的纯利y(元)与每天销售件数x(件)之间的线性回归方程.10.一机器可以按不同的速度运转,其生产物件有一些会有缺陷,每小时生产有缺陷物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺陷物件个数,现得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).(1)假定y与x之间有线性相关关系,求y与x之间的回归直线方程;(2)若实际生产中所容许的每小时最多生产的有缺陷物件个数为10,则机器的速度不得超过多少转/秒?(精确到1)11.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量与冶炼时间的关系.已测得炉料熔化完毕时,钢水含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:x(0.01%) 104 180 190 177 147 134 150 191 204 121 y(min) 100 200 210 185 155 135 170 205 235 125(1)作出散点图,你能从散点图中发现钢水含碳量与冶炼时间的一般规律吗?(2)求线性回归方程;(3)预测当钢水含碳量为160时,冶炼时间应为多长较合适?知识清单①确定性 ②函数 ③散点图 ④线性相关关系链接高考1.D 由回归直线方程y ^=^x+a ^,知当b ^>0时,y 与x 正相关;当b ^<0时,y 与x 负相关.∴①④一定错误.故选D.2.A 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 3.D ∵0.85>0, ∴y 与x 正相关, ∴A 正确;∵线性回归方程经过样本点的中心(x ,y ), ∴B 正确;∵Δy=f(x+1)-f(x)=0.85(x+1)-85.71-(0.85x-85.71)=0.85, ∴C 正确.故选D.4.C x =216=72,y =136,代入公式求得b ^=58-6×72×13691-6×(72)2=57,a ^=y -b ^x =136-57×72=-13, 而b'=2,a'=-2,∴b ^<b',a ^>a',故选C. 5.解析 (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5, y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80,所以a=y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x+250. (2)设工厂获得的利润为L 元, 依题意得L=x(-20x+250)-4(-20x+250) =-20x 2+330x-1 000 =-20(x -334)2+361.25.当且仅当x=334=8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.基础过关基础巩固训练1.D D 是相关关系,非函数关系.2.D3.C 由题中两个散点图可以判断,变量x 与y 线性相关,u 与v 线性相关,故选C.4.A 预测值为y=2×50+1 250=1 350(kg).5.C x =0+1+2+34=1.5,y =1+2+4+64=3.25.回归直线必过点(x ,y ),即(1.5,3.25). 6.解析 散点图如图所示.从图中可以看出各点都在一条直线附近,因此两个变量具有相关关系. 能力提升训练 7.B x =1+2+3+44=2.5,y =3+3.8+5.2+64=4.5,将(2.5,4.5)代入选项验证得B 正确.8.C 因为子代的平均身高向中心回归,所以b∈(0,1). 9.解析 (1)x =3+4+5+6+7+8+97=6.y =66+69+73+81+89+90+917=5597≈79.86.(2)散点图如下:(3)由(2)中散点图知,y 与x 有线性相关关系.设线性回归方程为y=bx+a,∵∑i=17x i 2=280,∑i=17x i y i =3 487,x =6,y =5597, ∴b=3 487-7×6×5597280-7×36=13328=4.75,a=5597-6×4.75≈51.36.∴线性回归方程为y=4.75x+51.36. 10.(1)设回归直线方程为y=bx+a, 则x =8+12+14+164=12.5,y =5+8+9+114=8.25,x 2=156.25,x ·y =103.125,∑i=14x i y i =5×8+12×8+14×9+16×11=438, ∑i=14x i 2=82+122+142+162=660.∴b=∑i=14x i y i -4x ·y ∑i=14x i 2-4x 2=438-4×103.125660-4×156.25=438-412.5660-625≈0.728 6,a=y -b x =8.25-0.7286×12.5=-0.857 5.∴y 与x 之间的回归直线方程为y=0.728 6x-0.857 5.(2)要使y≤10,即0.728 6x-0.857 5≤10,所以x≤14.901 9,所以机器的速度不得超过15转/秒.11.解析 (1)以x 轴表示钢水含碳量,y 轴表示冶炼时间,可作散点图如图所示.从图中可以看出,各点分布在一条直线附近,即它们线性相关. (2)列出下表,并用科学计算器进行计算: i 1 2 3 4 5 x i 104 180 190 177 147 y i100200210185155x i y i 10 400 36 000 39 900 32 745 22 785 i 6 7 8 9 10 x i 134 150 191 204 121 y i 135 170 205 235 125 x i y i18 09025 50039 15547 94015 125x =159.8,y =172, ∑i=110x i 2=265 448,∑i=110x i y i =287 640.设所求的线性回归方程为y=bx+a.b=∑i=110x i y i -10x ·y ∑i=110x i2-10x 2≈1.267,a=y -b x =-30.466 6.∴线性回归方程为y=1.267x-30.466 6.(3)当x=160时,y=1.267×160-30.466 6=172.253 4. 即预测当钢水含碳量为160时,冶炼172.253 4 min 较合适.。
高考数学总复习 9.3相关性、最小二乘法提高分课时作业(含模拟题) 新人教A版

【题组设计】2014届高考数学(人教版)总复习“提高分”课时作业 9.3相关性、最小二乘法(含2013年模拟题)【考点排查表】1.对变量x、y有观测数据(x i,y i)(i=1,2,…,10),得散点图1;对变量u、v有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【解析】夹在带状区域内的点,总体呈上升趋势的属于正相关;反之,总体呈下降趋势的属于负相关.【答案】 C2.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( )A.k越大,“X与Y有关系”可信程度越小B.k越小,“X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大【解析】k越大,说明“X与Y有关系”成立的可信程度越大,反之越小.【答案】 B3.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y ^=b ^x +a ^中的b ^≈-2,预测当气温为-5 ℃时,热茶销售量为( )杯(已知回归系数b ^=Σni =1x i y i -n x y Σni =1x 2i -n x 2,a ^=y -b ^x ).( ) A .50 B .60 C .70D .80【解析】 根据表格中的数据可求得x =14×(18+13+10-1)=10, y =14×(24+34+38+64)=40(杯).∴a =y -b x =40-(-2)×10=60,∴y ^=-2x +60,当x =-5时,y ^=-2×(-5)+60=70(杯).【答案】 C4.(2012·河北衡水中学高三调考)某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示:的把握认为学生的数学成绩与物理成绩之间有关系( )A .99.9%B .99%C .97.5%D .95%【解析】 (1)表格为(2)提出假设H 0:学生的数学成绩与物理成绩之间没有关系. 根据上述列联表求得k =-26×14×7×13≈8.802.当H 0成立时,K 2(x 2)>6.635的概率约为0.01,而这里8.802>6.635, 所以我们有99%的把握认为:学生的数学成绩与物理成绩之间有关系. 【答案】 B5.(2012·东北三校二模)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( )A .0B .1C .2D .3本题可以参考独立性检验临界值表:是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2=13.079>10.828,故有99%的把握确认这两个变量有关系,④正确.故选B.【答案】 B6.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有【解析】 统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生. 【答案】 D 二、填空题7.(2011·广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这56号打6小时篮球的投篮命中率为________.【解析】 小李这5天的平均投篮命中率y =0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b ^=0.01,a ^=0.47,故回归直线方程为y ^=0.47+0.01x ,将x =6代入得6号打6小时篮球的投篮命中率约为0.53.【答案】 0.5,0.538.某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:家庭年平均收入与年平均支出有________线性相关关系.【解析】 居民家庭的年平均收入按从小到大排依次为:11.5、12.1、13、13.3、15,由中位数定义知年平均收入的中位数是13.画出散点图,由图可知家庭年平均收入与年平均支出有正的线性相关关系.【答案】 13 正9.(2012·嘉兴联考)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2根据表中数据,得到K 2=-223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________.【解析】 由K 2=4.844>3.841.故认为选修文科与性别有关系出错的可能性约为5%.【答案】 5% 三、解答题10.已知x 、y 之间的一组数据如下表:(1)从x 、y (2)针对表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试利用“最小二乘法”判断哪条直线拟合程度更好.【解】 (1)从x 、y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对,故所求概率为P =925,所以使x +y ≥10的概率为925.(2)用y =13x +1作为拟合直线时,y 的实际值与所得的y 值的差的平方和为s 1=1-432+(2-2)2+(3-3)2+4-1032+5-1132=73.用y =12x +12作为拟合直线时,y 的实际值与所得的y 值的差的平方和为s 2=(1-1)2+(2-2)2+3-722+(4-4)2+5-922=12.因为s 1>s 2,故直线y =12x +12的拟合程度更好.11.(2013·佛山模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知从全部105人中随机抽取1人为优秀的概率为7.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.附 K 2=n ad -bc 2a +bc +d a +cb +d【解】 (1)(2)k =-255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ),则所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A 包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P (A )=836=29.12.(2013·扬州模拟)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.(1)(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.【解】 (1)x =100+-12-17+17-8+8+127=100;y =100+-6-9+8-4+4+1+67=100;∴s 2数学=9947=142.∴s 2物理=2507.从而s 2数学>s 2物理,∴物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,根据回归系数公式得到b ^=Σ7i =1x i y i -7x yΣ7i =1x 2i -7x2=497994=0.5, a ^=y -b ^x =100-0.5×100=50.∴回归方程为y ^=0.5x +50.当y =115时,x =130,即该生物理成绩达到115分时,他的数学成绩大约为130分. 四、选做题13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查对临界值表知P (K 2≥3.841)≈0.05.p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的命题序号都填上) ①p ∧綈q ;②綈p ∧q ;③(綈p ∧綈q )∧(r ∨s );④(p ∨綈r )∧(綈q ∨s ). 【解析】 由题意,得K 2≈3.918,P (K 2≥3.841)≈0.05,所以只有p 正确,即有95%的把握认为“这种血清能起到预防感冒的作用”,由真值表知①、④为真命题.【答案】 ①④。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时提升作业(五十八) 第九章第五节相关性、最小二乘估计、回归分析与独
立性检验
一、选择题
1.下面是2×2列联表:
则表中a,b的值分别为( )
(A)94,72 (B)52,50 (C)52,74 (D)74,52
2.对于给定的两个变量的统计数据,下列说法正确的是( )
(A)都可以分析出两个变量的关系
(B)都可以用一条直线近似地表示两者的关系
(C)都可以作出散点图
(D)都可以用确定的表达式表示两者的关系
3.(2013·铜陵模拟)相关系数是度量( )
(A)两个变量之间线性关系的强度
(B)散点图是否显示有意义的模型
(C)两个变量之间是否存在因果关系
(D)两个变量之间是否存在关系
4.遗传学研究发现,子女的身高与父母的身高相关,且子女的身高向人类的平均身高靠近,这种现象称为“回归”.现用x(单位:米)表示父母的身高,y(单位:米)表示子女的身高,则在下列描述子女身高与父母身高关系的回归直线中,拟合比较好的是( )
5.(2013·新余模拟)若回归方程中的回归系数b=0,则相关系数为( )
(A)r=1 (B)r=-1
(C)r=0 (D)无法确定
6.(2013·安庆模拟)某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数据如表所示:
已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:y=a-3.2x,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格约为
( ) (A)14.2元(B)10.8元
(C)14.8元(D)10.2元
二、填空题
7.(2013·芜湖模拟)许多因素都会影响贫穷,教育也是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为y=0.8x+4.6,斜率的估计值等于0.8说明_____________________,成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)之间的相关系数(填“大于0”或“小于0”).
8.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否有99%的把握认为该种血清(填“能”或“不能”)起到预防
感冒的作用.
9.(能力挑战题)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
小李这5天的平均投篮命中率为;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为.
三、解答题
10.(2013·合肥模拟)某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据
(1)请画出上表数据的散点图.
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a.
(3)试根据(2)求出的线性回归方程,预测记忆力为9的同学的判断力.
答案解析
1.【解析】选C.∵a+21=73,∴a=52,又a+22=b,
∴b=74.
2.【解析】选C.给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或函数关系,故选C.
3.【解析】选A.相关系数是度量两个变量之间线性关系强弱程度的.
4.【思路点拨】描述子女身高与父母身高关系的回归直线中,拟合效果越好,则两条直线的倾斜角越接近,我们逐一分析四个图形,寻找四个答案中直线的倾斜角最接近的图象,即为答案.
【解析】选B.回归直线拟合效果越好,则两条直线的倾斜角越接近,我们逐一分析四个图形,直线的倾斜角最接近的图象为B,故选B.
5.【解析】选C.因为回归系数b的计算公式与相关系数r的计算公式中分子相同,故b=0时有r=0.
6.【解析】选D.依题意=10,=8.因为线性回归直线必过样本中心点(,),所以8=-3.2×10+a,解得a=40.所以回归直线方程为y=40-3.2x.令y=
7.36,则7.36=-3.2x+40,解得x=10.2.所以该产品的价格约为10.2元.
7.【解析】由回归方程知a=4.6,b=0.8,再由x,y表示的实际意义可知0.8的含义,相关系数r>0.
答案:一个地区受9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右大于0
8.【思路点拨】在使用该种血清的人中,有=48.4%的人患过感冒;在没有使用该种血清的人中,有
=56.8%的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人患感冒的可能性存在差异.
【解析】由列联表中的数据,
求得χ2=≈7.075.
∵7.075>6.635,因此有99%的把握认为该种血清能起到预防感冒的作用.
答案:能
【方法技巧】两个分类变量是否有关的直观判断
在列联表中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比重,和满足条件X=x2的个体中具有Y=y1的个体所占的比重,若两个分类变量无关,则两个比重应差别不大,即≈,因此两个比重
和相差越大,两个分类变量有关的可能性就越大.
9.【解析】平均命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5,而=3,
(x i-)(y i-)=(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.1,
(x i-)2=(-2)2+(-1)2+02+12+22=10,于是b=0.01,a=-b=0.47,∴y=0.47+0.01x,令x=6,得y=0.53. 答案:0.5 0.53
10.【解析】(1)如图:
(2)x i y i=6×2+8×3+10×5+12×6=158;
==9,==4,
=62+82+102+122=344,
b===0.7,
a=-b=4-0.7×9=-2.3,
故线性回归方程为y=0.7x-2.3.
(3)由回归直线方程预测,记忆力为9的同学的判断力约为4.。