高中数学第三章统计案例3-1回归分析的基本思想及其初步应用优化练习新人教A版选修2_3
高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修

i=1 5
xiyi-5 x y
i=1
由b^=
≈0.29,a^= y -b^ x =43.5-0.29×30.36≈34.70.
5
x2i -5 x 2
i=1
故所求的线性回归方程为^y=34.70+0.29x.
当 x=56.7 时,^y=34.70+0.29×56.7=51.143. 估计成熟期有效穗为51.143.
解
5
(yi- y )2=50.18,∴R2=1-580.4.138≈0.832.
i=1
所以解释变量小麦基本苗数对有效穗约贡献了83.2%.残差变量贡献了 约1-83.2%=16.8%.
反思与感悟 解析答案
跟踪训练2 关于x与y有如下数据:
x2 4 5 6 8 y 30 40 60 50 70
有如下的两个线性模型:(1)^y=6.5x+17.5;(2)^y=7x+17.试比较哪一个 拟合效果更好.
合适等.
返回
解析答案
类型二 线性回归分析 例2 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组 数据如下:
x 15.0 25.8 30.0 36.6 44.4 y 39.4 42.9 42.9 43.1 49.2
(1)以x为解释变量,y为预报变量,作出散点图; 解 散点图如右.
解析答案
(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;
解析答案
类型三 非线性回归分析 例3 下表为收集到的一组数据:
x 21 23 25 27 29 32 35 (1)作出x与yy的散7点图,1并1猜测2x与1y之间24的关系6;6 115 325
解 作出散点图如图,从散点图可以看出x与y不具有线性相关关系, 根据已有知识可以发现样本点分布在某一条指
高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修2_3

n
越好
【微思考】 1.有时散点图的各点并不集中在一条直线的附近,仍然 可以按照求回归直线方程的步骤求回归直线,显然这样 的回归直线没有实际意义.用残差能否判断建立的回归
模型是否合理?
提示:残差能对x,y的线性相关性进行检验.残差可以发 现原始数据中的可疑数据,如果残差点比较均匀地落在 水平的带状区域中说明选用的模型较为合适.
其中a,b可以由最小二乘法估计 , ,就是a,b的估计值.
a b
主题2
模型拟合效果的衡量
1.线性回归模型是函数关系吗? 提示:不是.回归模型是刻画一组数据的整体趋势,回归 模型中的y由x和随机误差e共同确定,即x只能解释部分
y的变化,因此它不是函数关系.
2.一个模型建立的好坏一般如何来衡量呢? 提示:可以用yiyi
D.人的年龄和身高
【解析】选D.函数关系是两变量之间有确定性的关系, 选项A,B,C都是函数关系,而人的年龄和身高不具备确 定性关系,不是函数关系.
2.线性回归方程 A.(0,0) C.(0,
y
y a bx
必过定点
(
)
B.(
x
,0) )
x,y
)
D.(
【解析】选D.因为
,所以
y a bx
于自变量(边长)的每一个确定的值,都有唯一确定的周 长与之相对应.
(2)相关关系:当自变量取值一定时,因变量的取值带有 一定的_______的两个变量之间的关系.相关关系是一 随机性 种_________关系. 非确定性 回归分析:对具有相关关系的两个变量进行统计分析的
一种常用方法.
2.回归直线方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,
2021学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用习题新人教A版选修2_3

第三章 3.1 回归分析的根本思想及其初步应用A 级 根底稳固一、选择题1.(2021·深圳一模)其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一局部不同年份的该酒品,并测定了其芳香度(如表).年份x 0 1 4 5 6 8 芳香度y由最小二乘法得到回归方程y ^x +1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为( A )[解析] 由表中数据:x =16(0+1+4+5+6+8)=4,回归方程y ^x +1.13,∴y ^=1.03×4+1.13=5.26,∴y =16(1.3+1.8+5.6+?+7.4+9.3)=5.26,解得:?=6.1. 应选A .2.由变量x 与y 相对应的一组数据(1,y 1)、(5,y 2)、(7,y 3)、(13,y 4)、(19,y 5)得到的线性回归方程为y ^=2x +45,那么y -=( D )A .135B .90C .67D .63[解析] ∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,应选D . 3.观测两个相关变量,得到如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1 y-25A .y ^x -1 B .y ^=x C .y ^=2x +0.3 D .y ^=x +1[解析] 因为x -=0, y -=,10)=0,根据回归直线方程必经过样本中心点(x -,y -)可知,回归直线方程过点(0,0),所以选B .4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y ^x +73.93,用这个模型预测这个孩子10岁时的身高,那么正确的表达是( C )A .身高一定是B .身高在以上C .身高在左右D .身高在以下[解析] 将x 的值代入回归方程y ^x +73.93时,得到的y ^值是年龄为x 时,身高的估计值,应选C .5.(2021·西宁模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进展了5次试验,得到5组数据(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4)(x 5,y 5).根据收集到的数据可知x =20,由最小二乘法求得回归直线方程为y ^x +48,那么5i =1y i =( D )A .60B .120C .150D .300[解析] 由题意,x =20,回归直线方程为y ^x +48,∴y ^=0.6×20+48=60.那么 i =15y i =60×5=300.应选D .6.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^x -85.71,那么以下结论中不正确的选项是.......( D ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x -,y -)C .假设该大学某女生身高增加1cm ,那么其体重约增加gD .假设该大学某女生身高为170cm ,那么可断定其体重必为 [解析] 此题考察线性回归方程.D 项中身高为170cm 时,体重“约为〞58.79,而不是“确定〞,回归方程只能作出“估计〞,而非确定“线性〞关系.二、填空题7.以下五个命题,正确命题的序号为__③④⑤__. ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进展研究.[解析] 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.8.(2021·兰州模拟)变量 x ,y 具有线性相关关系,它们之间的一组数据如下表所示,假设y 关于 x 的线性回归方程为y ^x -1,那么m =____.x 1 2 3 4 ym4[解析] 由题意,x =2.5,代入线性回归方程为y ^x -1,可得y =2.25, ∴0.1+1.8+m +4=4×2.25, ∴m =3.1. 故答案为3.1.9.以下是某地区的降雨量与年平均气温的一组数据: 年平均气温(℃)年降雨量(mm) 542507813574701432464根据这组数据可以推断,该地区的降雨量与年平均气温__不具有__相关关系.(填“具有〞或“不具有〞)[解析] 画出散点图,观察可知,降雨量与年平均气温没有相关关系.三、解答题10.为了迎接2021年俄罗斯世界杯,某协会组织了一次“迎2021世界杯,手工制作助威旗〞活动,将俄罗斯世界杯的标志以手工刺绣的方式刺绣到红色的三角形的旗子上面,来为世界杯加油.在10次制作中测得的数据如下: 助威旗数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间Y (小时)626875818995102108115122试问:(1)x 与Y 是否具有线性相关关系?(2)如果x 与Y 具有线性相关关系,求出Y 对x 的回归直线方程,并根据回归直线方程,预测加工2021个助威旗需多少天(准确到1)?注:每天工作8小时.(参考数据:x =55,y =91.7,∑i =110x 2i =38500,∑i =110y 2i =87 777,∑i =110x i y i =55950,38500-10×552-8250,38500-10×552≈91,错误!≈61)[解析] (1)作散点图如下图从图中可以看出,各点都散布在一条直线附近,即它们线性相关. (2)由所给数据求得b =∑i =110x i y i -10xy∑i =110x 2i -10x 2=,38500-10×552)∴a =y -b x =91.7-0.668×55∴Y 对x 的回归直线方程为 y ^x当x =2021时,y ^=54.96+0.668×2021=1397.64(小时)又1397.64÷8=174.705(天)∴加工2021个助威旗所需时间约为175天.B 级 素养提升1.(2021·保定一模)具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i =1,2,…,8),回归直线方程为y ^=12x +a ,假设OA 1→+OA 2→+…+OA 8→=(6,2),(O 为原点),那么a =( B )A .18B .-18C .14D .-14[解析] 计算x =18×(x 1+x 2+…+x 8)=68=34,y =18×(y 1+y 2+…+y 8)=28=14;回归直线方程为y ^=12x +a ,∴14=12×34+a , 解得a =-18.应选B .2.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,那么( C )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1[解析] ∵变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),∴X =10+11.3+11.8+12.5+135=11.72,Y =1+2+3+4+55=3,i =15(x i -x)(y i -y )=(10-11.72)×(1-3)+(11.3-11.72)×(2-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(4-3)+(13-11.72)×(5-3)=7.2,∑i =15 x i -x2∑i =15 y i -y2=19.172,∴这组数据的相关系数是r 1=,19.172)=0.3755,变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),U =15(10+11.3+11.8+12.5+13)=11.72, V =5+4+3+2+15=3,∑i =15(U i -U)(V i -V )=(10-11.72)×(5-3)+(11.3-11.72)×(4-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(2-3)+(13-11.72)×(1-3)=-7.2,∑i =15U i -U2·∑i =15V i -V2=19.172.∴这组数据的相关系数是r 2=-0.3755,∴第一组数据的相关系数大于零,第二组数据的相关系数小于零,应选C . 二、填空题3.(2021·张店区校级模拟)在一组样本数据(x 1,y 1),(x 2,y 2),…(x 6,y 6)的散点图中,假设所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-1附近波动.经计算∑i =16x i =11,∑i =16y i =13,∑i =16x 2i =21,那么实数b 的值为__1921__.[解析] 根据题意,把对应点的坐标代入曲线y =bx 2-1,y 1=bx 11-1,y 2=bx 22-1,…y 6=bx 26-1,∴y 1+y 2+…+y 6=b (x 21+x 22+…+x 26)-6, ∴13=b ×21-6,∴b =1921,故答案为1921.4.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间 二月上旬二月中旬二月下旬 三月上旬 旬平均气温x (℃)381217旬销售量y (件) 55 m 33 24由表中数据算出线性回归方程y ^=bx +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =__40__;(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__14件__.[解析] (1)由y =38,得m =40. (2)由a =y -b x 得a =58, 故y ^=-2x +58, 当x =22时,y ^=14,故三月中旬的销售量约为14件. 三、解答题5.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)22(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如以下图所示:(2)x =15∑5 i =1x i =109,l xx =∑5i =1 (x i -x )2=1570, y =23.2,l xy =∑5i =1 (x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,那么b ^=l xy l xx =3081570≈0.1962,a ^=y -b ^x =1.8166.故所求回归直线方程为y ^x +1.8166.(3)据(2),当x =150m 2时,销售价格的估计值为y ^=0.1962×150+1.8166=31.2466(万元).6.(2021·全国卷Ⅱ理,18)以下图是某地区2000年至2021年环境根底设施投资额y (单位:亿元)的折线图.为了预测该地区2021年的环境根底设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2021年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^t ;根据2021年至2021年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^t .(1)分别利用这两个模型,求该地区2021年的环境根底设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解析] (1)利用模型①,可得该地区2021年的环境根底设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2021年的环境根底设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(i)从折线图可以看出,2000年至2021年的数据对应的点没有随机散布在直线yt 上下,这说明利用2000年至2021年的数据建立的线性模型①不能很好地描述环境根底设施投资额的变化趋势.2021年相对2021年的环境根底设施投资额有明显增加,2021年至2021年的数据对应的点位于一条直线的附近,这说明从2021年开场环境根底设施投资额的变化规律呈线性增长趋势,利用2021年至2021年的数据建立的线性模型y ^t 可以较好地描述2021年以后的环境根底设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2021年的环境根底设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比拟合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分)C 级 能力拔高炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:x /0.01% 104 180 190 177 147 134 150 191 204 121 y /min100200210185155135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗? (2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?[解析] (1)x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图.从图中可以看出,各点分布在一条直线附近,所以它们线性相关. (2)列出下表,并用科学计算器进展计算:i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10 40036 00039 90032 74522 78518 09025 50039 15547 94015 125x =159.8,y =172,∑i =110x 2i=265 448,∑i =110y 2i=312 350,∑i =110x i y i =287 640设所求的回归直线方程为=x +,=∑i =110x i y i -10x·y∑i =110x 2i -10x 2≈1.267,=y -x ≈-30.47,即所求的回归直线方程为=1.267x -30.47.(3)当x =160时,=1.267×160-30.47≈172(min ),即大约冶炼172 min .。
高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版选修2-3(2021年整理)

2018-2019版高中数学第三章统计案例3.1 回归分析的基本思想及其初步应用学案新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018-2019版高中数学第三章统计案例3.1 回归分析的基本思想及其初步应用学案新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018-2019版高中数学第三章统计案例3.1 回归分析的基本思想及其初步应用学案新人教A版选修2-3的全部内容。
§3。
1 回归分析的基本思想及其初步应用学习目标 1.了解随机误差、残差、残差图的概念。
2.会通过分析残差判断线性回归模型的拟合效果.3。
掌握建立线性回归模型的步骤.知识点一线性回归模型思考某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万23345元请问如何表示推销金额y与工作年限x之间的相关关系?y关于x的线性回归方程是什么?答案画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示变量之间的相关关系.设所求的线性回归方程为错误!=错误!x+错误!,则错误!=错误!=错误!=0。
5,错误!=错误!-错误!错误!=0.4.所以年推销金额y关于工作年限x的线性回归方程为错误!=0。
5x+0.4.梳理(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),回归直线y=bx+a 的斜率和截距的最小二乘估计公式分别为错误!=错误!=错误!,错误!=错误!-错误!错误!,其中(x,错误!)称为样本点的中心.(4)线性回归模型y=bx+a+e,其中a和b是模型的未知参数,e称为随机误差,自变量x称为解释变量,因变量y称为预报变量.知识点二线性回归分析具有相关关系的两个变量的线性回归方程为错误!=错误!x+错误!.思考1 预报变量错误!与真实值y一样吗?答案不一定.思考2 预报值错误!与真实值y之间误差大了好还是小了好?答案越小越好.梳理(1)残差平方和法①错误!i=y i-错误!i=y i-错误!x i-错误!(i=1,2,…,n)称为相应于点(x i,y i)的残差.②残差平方和错误!(y i-错误!i)2越小,模型的拟合效果越好.(2)残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(3)利用相关指数R2刻画回归效果其计算公式为:R2=1-错误!,其几何意义:R2越接近于1,表示回归的效果越好.知识点三建立回归模型的基本步骤1.确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.2.画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).3.由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程).4.按一定规则(如最小二乘法)估计回归方程中的参数.5.得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.1.求线性回归方程前可以不进行相关性检验.(×)2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.(√)3.利用线性回归方程求出的值是准确值.( ×)类型一求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=错误!x +错误!; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.错误!考点 线性回归方程 题点 求线性回归方程 解 (1)如图:(2)错误!i y i =6×2+8×3+10×5+12×6=158,错误!=错误!=9, 错误!=错误!=4,错误!错误!=62+82+102+122=344, 错误!=错误!=错误!=0。
2019_2020学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修2_3

【解析】(1)散点图如图所示,从图中可以看出这些点大致 分布在一条直线附近,因此两个变量线性相关.
(2)∵ x =14×(35+40+45+50)=42.5, y =14×(56+41+28+11)=34,
4
xi yi=35×56+40×41+45×28+50×11=5 410,
i=1
4
x2i =352+402+452+502=7 350,
【解析】根据收集的数据,作散点图(如图),根据已有的
函数知识,可以发现样本点分布在某一条指数函数曲线y= c1ec2x 的周围,其中c1和c2是待定的参数,令z=ln y,则z=ln y =c2x+ln c1,即变换后的样本点应该分布在直线z=bx+a(a= ln c1,b=c2)的周围.
由y与x的数据表可得到变换后的z与x的数据表,
1n
n xi
其中 x =_______i=_1________,
y=
1n
______n_i_=_1y_i ______,
_____(_x_,__y__) _____称为样本点的中心,回归直线过样本点的中
心.
2.随机误差 线性回归模型 y=bx+a+e 中,a,b 为模型的未知参数, e 是 y 与 bx+a 之间的误差,通常 e 为随机变量,称为_随__机__误__差_, 它的均值 E(e)=____0____,方差 D(e)=σ2>0,这样线性回归模
线性回归分析
【例1】 某商场经营一批进价是30元/台的小商品,在市场 试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之 间有如下关系:
x
35
40
45
50
y
56
Hale Waihona Puke 412811(1)画出散点图,并判断y与x是否具有线性相关关系; (2)求日销售量y对销售单价x的线性回归方程; (3)设经营此商品的日销售利润为P元,根据(1)写出P关于x 的函数关系式,并预测当销售单价x为多少元时,才能获得最 大日销售利润. 【解题探究】作出散点图,根据散点图观察是否具有线性 相关关系.
2019_2020学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用习题新人教A版选修2_3

第三章 3.1 回归分析的基本思想及其初步应用 A级 基础巩固 一、选择题 1.(2018·深圳一模)其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表). 年份x 0 1 4 5 6 8 芳香度y 1.3 1.8 5.6 7.4 9.3
由最小二乘法得到回归方程y^=1.03x+1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为( A ) A.6.1 B.6.28 C.6.5 D.6.8
[解析] 由表中数据:x=16(0+1+4+5+6+8)=4, 回归方程y^=1.03x+1.13, ∴y^=1.03×4+1.13=5.26, ∴y=16(1.3+1.8+5.6+?+7.4+9.3)=5.26, 解得:?=6.1. 故选A. 2.由变量x与y相对应的一组数据(1,y1)、(5,y2)、(7,y3)、(13,y4)、(19,y5)
得到的线性回归方程为y^=2x+45,则y-=( D ) A.135 B.90 C.67 D.63
[解析] ∵x-=15(1+5+7+13+19)=9,y-=2x-+45, ∴y-=2×9+45=63,故选D. 3.观测两个相关变量,得到如下数据: x -1 -2 -3 -4 -5 5 4 3 2 1
y -0.9 -2 -3.1 -3.9 -5.1 5 4.1 2.9 2.1 0.9
则两变量之间的线性回归方程为( B ) A.y^=0.5x-1 B.y^=x C.y^=2x+0.3 D.y^=x+1 [解析] 因为x-=0, y-=-0.9-2-3.1-3.9-5.1+5+4.1+2.9+2.1+0.910=0,根据回归直线方程必经
过样本中心点(x-,y-)可知,回归直线方程过点(0,0),所以选B. 4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型
高中数学第三章统计案例回归分析的基本思想及其初步应用学案新人教A版选修_1

3.1回归分析的基本思想及其初步应用第2课时 残差分析【学习目标】1.了解残差平方和、相关指数2R 的概念;2.了解回归分析的基本步骤;3.会用残差平方和与相关指数对回归模型拟合度进行评判; 【重点难点】重点:了解残差平方和、相关指数2R 的概念,会用残差平方和与相关指数对回归模型拟合度进行评判。
难点:了解回归分析的基本步骤, 【学习过程】 一.课前预习阅读课本P 82—86,记下困惑处并完成下列问题1、`线性回归模型,e )b a e a bx y 中为模型的未知参数和(++=是y (真实值)与a bx +之间的误差。
通常e 是随机变量,称为。
2.残差对于样本点11(,)x y ,22(,)x y ,…,(,)n n x y ,它们的随机误差i i i e y bx a =--,1i =,2,…,n ,其估计值为i e =i i y bx a =--,i e 称为相应于点(,)i i x y 的.温馨提示:正确理解随机误差:随机误差是客观存在的,主要原因是:(1)所用的函数不恰当引起误差;(2)除了两个变量之间的影响之外,还会受到其他因素的影响;(3)由于观测方面的原因出现的误差. 3.残差图及相关指数(1)残差图:我们可以利用图形来分析残差特征,作图时纵坐标为,横坐标可以选为,或解释变量或预报变量等,这样作出的图形称为.(2)相关指数:计算公式是2R =,其中残差平方和为,总偏差平方和为.2R 越大说明残差平方和越小,也就是说模型的拟合效果越好,2R 表示解释变量对于预报变量变化的,2R越接近于,表示回归的效果越好.温馨提示:相关指数的计算公式中,分子是残差平方和,分母是总偏差平方和,计算时不要弄错,同时要清楚2R的大小与拟合效果的关系.二.课堂学习与研讨类型1 线性回归分析【典例1】为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(2)求相关指数2R,并判断模型的拟合效果;(3)进行残差分析.(6212275iix==∑,611076.2i yix y==∑)【归纳升华】一般地,求出回归直线方程后,通常可以计算处残差的平方和以及相关指数2R 的值来对回归模型的好坏作出评判,由2R的计算公式知,残差平方和越小,2R就越大,拟合效果就越好;残差平方和越大,2R就越小,拟合效果就越差..假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下表的统计资料:试求:(1)线性回归方程y bx a=+的回归系数a、b;(2)求残差平方和;(3)求相关指数2R类型2线性回归模型拟合的效果 例2、关于x 与y 有如下数据:为了对x 、y 两个变量进行统计分析,现有以下两种线性模型:5.175.6ˆ+=x y, 177ˆ+=x y,试比较哪一个模型拟合的效果更好。
高中数学第3章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修2-3

阶
段
段
1
3
3.1 回归分析的基本思想及其初步应用
学阶 段业 分Fra bibliotek层2测
评
1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用. 2.会求回归直线方程,并用回归直线方程进行预报.(重点) 3.了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系.(难 点)
[ 基础·初探]
教材整理 1 回归直线方程 阅读教材 P80~P82 探究上面倒数第一行,完成下列问题. 1.回归分析
作残差图如图所示:
由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比 较合适.
非线性回归分析
[探究共研型]
探究 1 如果两个相关变量 x,y 满足回归方程 y=c1x2+c2,那么 x,y 具有 线性相关关系吗?如何把它化归为线性回归方程问题?
【提示】 x,y 不具有线性相关关系,但是若令 z=x2,则 y=c1x2+c2 可变 换为 y=c1z+c2,即化归为线性回归方程问题.
回归分析是对具有___相__关__关__系_____的两个变量进行统计分析的一种常用方
法.
教材整理 2 线性回归分析
阅读教材 P82 探究~P89,完成下列问题. 1.线性回归模型 (1)表达式Ey=e_=_b_x_+_0___a_,+__De__e,=_σ_2__.
(2)基本概念:
①a 和 b 为模型的未知参数. ②e 是 y 与 bx+a 之间的误差.通常 e 为随机变量,称为__随__机__误__差___. ③x 称为__解__释__变__量__,y 称为___预__报__变__量____.
(2016·临沂高二检测)下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 回归分析的基本思想及其初步应用
[课时作业]
[A 组 基础巩固]
1.下列各关系中是相关关系的是 ( )
①路程与时间、速度的关系;②加速度与力的关系;③产品成本与产量的关系;④圆周长与圆面积的关系;⑤广告费支出与销售额的关系.
A .①②④
B .①③⑤
C .③⑤
D .③④⑤
解析:①②④都是确定的函数关系.
答案:C
2.下列关于残差的叙述正确的是( )
A .残差就是随机误差
B .残差就是方差
C .残差都是正数
D .残差可用来判断模型拟合的效果
解析:由残差的相关知识可知D 正确.
答案:D
3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那
么下列说法中不正确的是( )
A .直线y ^=b ^x +a ^必经过点(x -,y -)
B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点
C .直线y ^=b ^x +a ^的斜率为1
n i =∑x i y i -n x - y -1n
i =∑
x 2i -n x 2 D .直线y ^=b ^x +a ^的纵截距为y -b ^x
解析:由用最小二乘法求回归直线方程的公式可知,A ,C ,D 都正确,B 不正确,回归直线可以不经过样本数据中的任何一个点.故应选B.
答案:B
4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )
A.y ^=0.4x +2.3
B.y ^=2x -2.4
C.y ^=-2x +9.5
D.y ^=-0.3x +4.4
解析:由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A.
答案:A
5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel
软件计算得y ^=0.577x -0.448(x 为人的年龄,y (单位:%)为人体脂肪含量).对年龄为37
岁的人来说,下面说法正确的是( )
A .年龄为37岁的人体内脂肪含量都为20.90%
B .年龄为37岁的人体内脂肪含量为21.01%
C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D .年龄为37岁的大部分的人体内脂肪含量为31.50%
解析:当x =37时,y ^=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人
群中的大部分人的体内脂肪含量为20.90%.
答案:C
6.如图是x 和y 的样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.
解析:经计算,去掉D (3, 10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.
答案:D (3,10)
7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示
年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=
0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:由题意知[0.254(x +1)+0.321]-[0.254x +0.321]=0.254.
答案:0.254
8.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:。