线性回归方程高考题讲解
高考数学一轮复习(共节).线性回归方程及应用

18、统计18.4 线性回归方程及应用【知识网络】1.能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
2.了解线性回归的方法;了解用最小二乘法研究两个变量的线性相关问题的思想方法;会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式)。
【典型例题】[例1](1)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值为s与t,那么下列说法正确的是()A.直线l1和l2一定有公共点(s,t) B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2D.直线l1和l2必定重合(2)工人工资(元)依劳动生产率(千元)变化的回归方程为ˆy=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,工资提高80元C.劳动生产率提高1000元时,工资提高130元D.当月工资250元时,劳动生产率为2000元(3)下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究。
其中正确的命题为()A.①③④B。
②④⑤C。
③④⑤D。
②③⑤(4)一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y (小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________。
(5)上题中,若该公司预计下周签发新保单1000张,则需要加班的时间是。
[例2]其中x(血球体积,mm),y(血红球数,百万).①画出上表的散点图;②求出回归直线并且画出图形。
线性回归方程高考题讲解

线性回归方程高考题讲解线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
高考数学一轮复习专题05 回归直线方程(解析版)

概率与统计 专题五:回归直线方程一、知识储备 1.两个变量线性相关(1)散点图:将样本中n 个数据点(,)i i x y (i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据11(,)x y ,22(,)x y ,33(,)xy (,)n n x y .②设所求回归方程为y bx a =+,其中,a b 是待定参数. ③由最小二乘法得1122211()(),()nnii i ii i nniii i xx y y x ynx yb a y bx xx xnx ====---===---∑∑∑∑其中,b 是回归方程的斜率,a 是截距. 二、例题讲解1.(2022·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自2021年1月1日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前5周每周普及宣传的人数与时间的数据,得到下表:(1)若可用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程; (2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.参考公式及数据:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆa y bx=-,()()51430i ii x x y y =--=∑.【答案】(1)4341y x =+;(2)预测该宣传小分队第7周普及宣传《民法典》的人数为342. 【分析】(1)求出x 、y 的值,将表格中的数据代入最小二乘法公式,求出b 、a 的值,可得出y 关于x 的线性回归方程;(2)将7x =代入回归直线方程,可得出结果. 【详解】(1)由题意得()11234535x =++++=,()1901201702102601705y =++++=, ()()()()()()52222221132333435310i i x x=-=-+-+-+-+-=∑,所以()()()51521430ˆ4310iii i i x x y y bx x==--===-∑∑,所以ˆ17043341a y bx=-=-⨯=, 所以线性回归方程为4341y x =+;(2)由(1)知4341y x =+,令7x =,解得43741342y =⨯+=, 故预测该宣传小分队第7周普及宣传《民法典》的人数为342.2.(2022·合肥市第六中学高三模拟预测(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了A 树木,某农科所为了研究A 树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵A 树木,调查得到A 树木根部半径x (单位:米)与A 树木高度y (单位:米)的相关数据如表所示:(1)求y 关于x 的线性回归方程;(2)对(1)中得到的回归方程进行残差分析,若某A 树木的残差为零则认为该树木“长势标准”,在此片树木中随机抽取1棵A 树木,估计这棵树木“长势标准”的概率.参考公式:回归直线方程为y bx a =+,其中()()()1122211n ni iiii i b nnixii i x y nxy x x y y xnx x ==-==---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ 20.9y x =+;(2)12【分析】(1)由最小二乘法先求样本点中心(),x y ,再代入公式求ˆ2b=,即可得到答案; (2)先计算6棵A 树木中残差为零的有3棵,占比为3162=,即可得到答案;【详解】(1)由1(0.10.20.30.40.50.6)0.356x =⨯+++++=,1(1.1 1.3 1.6 1.5 2.0 2.1) 1.66y =⨯+++++=,610.1 1.10.2 1.30.3 1.60.4 1.50.5 2.00.6 2.1 3.71i ii x y==⨯+⨯+⨯+⨯+⨯+⨯=∑,6222222210.10.20.30.40.50.60.91ii x==+++++=∑,有62261216 3.7160.35 1.6ˆ20.9160.356i ii ii x yxybxx ==--⨯⨯===-⨯-∑∑,ˆˆ 1.6020.350.9ay bx =-=-⨯=, 故y 关于x 的回归方程为:ˆ 20.9yx =+. (2)当0.1x =时,ˆ20.10.9 1.1y=⨯+=,残差为1.1 1.10-=, 当0.2x =时,ˆ20.20.9 1.3y=⨯+=,残差为1.3 1.30-=, 当0.3x =时,ˆ20.30.9 1.5y=⨯+=,残差为1.6 1.50.1-=, 当0.4x =时,ˆ20.40.9 1.7y=⨯+=,残差为1.5 1.70.2-=-, 当0.5x =时,ˆ20.50.9 1.9y=⨯+=,残差为2.0 1.90.1-=, 当0.6x =时,ˆ20.60.9 2.1y=⨯+=,残差为2.1 2.10-=, 由这6棵A 树木中残差为零的有3棵,占比为3162=,∴这棵树木“长势标准”的概率为12.1.(2022·湖南师大附中高三月考)今年五月,某医院健康管理中心为了调查成年人体内某种自身免疫力指标,从在本院体检的人群中随机抽取了100人,按其免疫力指标分成如下五组:(10,20],(20,30],(30,40],(40,50],(50,60],其频率分布直方图如图1所示.今年六月,某医药研究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y与疫苗注射量x个单位具有相关关系,样本数据的散点图如图2所示.(1)健管中心从自身免疫力指标在(40,60]内的样本中随机抽取3人调查其饮食习惯,记X表示这3人中免疫力指标在(40,50]内的人数,求X的分布列和数学期望;(2)由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以健管中心抽取的100人作为普通人群的样本,据此估计疫苗注射量不应超过多少个单位.附:对于一组样本数据()()()1122,,,,,,n nx y x y x y⋅⋅⋅,其回归直线ˆy bx a=+的斜率和截距的最小二乘估计值分别为()()()1122211,nniii ii i nniii i x x yy x ynxyb a y bx x x xnx====---===---∑∑∑∑. 【答案】(1)分布列见解析,125;(2)疫苗注射量不应超过80个单位. 【分析】(1)根据频率分布直方图分别求出自身免疫力指标在(40,50]内和在(50,60]内的人数,写出X 的可能取值,求出对应概率,即可写出分布列,再根据期望公式即可求得数学期望;(2)根据最小二乘法求得回归方程,然后求出免疫力指标的平均值,根据题意列出不等式,从而可得答案. 【详解】解:(1)由直方图知,自身免疫力指标在(40,50]内的人数为0.008101008⨯⨯=,在(50,60]内的人数为0.002101002⨯⨯=,则X 的可能取值为1,2,3.其中122130828282233101010177(1),(2),(3)151515C C C C C C P X P X P X C C C =========.所以X 的分布列为()177121231515155E X =⨯+⨯+⨯=. (2)由散点图知,5组样本数据(,)x y 分别为(10,30),(30,50),(50,60),(70,70),(90,90),且x 与y 具有线性相关关系. 因为50,60x y ==,则22222210303050506070709090550607103050709055010b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,760502510a =-⨯=,所以回归直线方程为ˆ0.725yx =+. 由直方图知,免疫力指标的平均值为26402482152535455527100100100100100⨯+⨯+⨯+⨯+⨯=. 由27381ˆy≤⨯=,得0.72581x +≤,解得80x ≤. 据此估计,疫苗注射量不应超过80个单位.2.(2022·安徽师范大学附属中学(理))根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)的一个样本,5天内每天新接种疫苗的情况,如下统计表:(1)建立y 关于x 的线性回归方程;(2)假设全村共计2000名居民(均未接种过疫苗),用样本估计总体来预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:1221ˆi ii nii x ynxybxnx π==-=-∑∑,ˆˆay bx =-. 【答案】(1)222955y x =+;(2)7. 【分析】(1)根据公式求线性回归方程即可; (2)根据线性回归方程可设222955n a n ,求出67,S S ,与200080%1600⨯=比较即可求解. 【详解】 (1)1234535x ++++==,1015192328195y ++++==,则51522222222110305792140531922ˆ12345535i ii ii x y nxybxnx ==-++++-⨯⨯===++++-⨯-∑∑,222919355ˆa =-⨯=,故y 关于x 的线性回归方程222955y x =+. (2)设222955na n ,数列{}n a 的前n 项和为n S ,易知数列{}n a 是等差数列, 则()12222922291155558225n n n a a S n n n n⎛⎫+++ ⎪+⎝⎭=⋅=⋅=+, 因为6127.2S ,7163.8S , 所以6101272S =,7101638S =200080%1600⨯=(人),所以预测该村80%居民接种新冠疫苗需要7天.3.(2022·九龙坡·重庆市育才中学高三月考)随着城市规模的扩大和人们生活水平的日益提高,某市近年机动车保有量逐年递增.根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数据情况为:其中1,2,3,i =,时间变量i x 对应的机动车纯增数据为i y ,且通过数据分析得到时间变量x 与对应的机动车纯增数量y (单位:万辆)具有线性相关关系.(1)求机动车纯增数量y (单位:万辆)关于时间变量x 的回归方程,并预测2025~2030年间该市机动车纯增数量的值;附:回归直线方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n ni iiii i nniii i x y nx y x x y y b xnxx x ====-⋅--==--∑∑∑∑;a y bx =-.(2)该市交通管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了200名市民,将他们的意见和是否拥有私家车情况进行了统计,得到如下的22⨯列联表: 根据上面的列联表判断,能否有95%的把握认为“对限行的意见与是否拥有私家车”有关. 附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】(1) 5.7 5.1y x =-,2025~2030年间,机动车纯增数量的值约为34.8万辆;(2)没有95%的把握认为“对限行的意见与是否拥有私家车有关”. 【分析】(1)根据最小二乘法求得线性回归方程,再求估计值即可; (2)根据列联表求得卡方观测值,再对照表即可得解. 【详解】 (1)由所以3x =,12y =,51132639415527237i ii x y=⨯+⨯+⨯+=⨯+⨯=∑.()12222222212375312575.755451234553ni ii ni i x y nx yb x nx==-⋅-⨯⨯====-++++-⨯-∑∑. 因为y bx a =+过点(),x y ,所以 5.7y x a =+,5.1a =-,所以 5.7 5.1y x =-.2025~2030年时,7x =,所以 5.77 5.134.8y =⨯-=, 所以2025~2030年间,机动车纯增数量的值约为34.8万辆. (2)根据列联表,由()()()()()22n ad bc K a b c d a c b d -=++++得观测值为()2220025 3.12510085251575100160084K ⨯⨯-⨯⨯=⨯⨯==,3.125 3.841<,所以没有95%的把握认为“对限行的意见与是否拥有私家车有关”.4.(2022·贵州贵阳·高三月考(理))据贵州省气候中心报,2022年6月上旬,我省降水量在15.2-170.3mm之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm ,其余均在50mmm 以上,局地超过100mm.若我省某地区2022年端午节前后3天,每一天下雨的概率均为50%.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数x (x ∈N ,且09x ≤≤)表示是否下雨:当[]()0,x k k Z ∈∈时表示该地区下雨,当[]1,9x k ∈+时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下: 332 714 740 945 593 468 491 272 073 445 992 772 951 431 169 332 435 027 898 719(1)求出k 的值,使得该地区每一天下雨的概率均为50%;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2016年到2021年该地区端午节当天降雨量(单位:mm )如表:经研究表明:从2016年到2021年,该地区端午节有降雨的年份的降雨量y 与年份t 具有线性相关关系,求回归直线方程y bt a =+.并预测该地区2022年端午节有降雨的话,降雨量约为多少?参考公式:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-.【答案】(1)4, 25;(2)814955y t =-+,935mm .【分析】(1)由于该地区每一天下雨的概率均为50%,所以150%10k +=,从而可求出k 的值,在所给的20组数据中找出有两天小于等于k 的数,从而利用古典概型的概率公式可求出概率,(2)直接利用所给的数据和公式求出回归直线方程。
专题01 线性回归方程(解析版)

【解析】解: x 0 1 2 3 3 , y m 3 5.5 7 m 15.5 ,
4
2
4
4
这组数据的样本中心点是 ( 3 , m 15.5) , 24
关于 y 与 x 的线性回归方程 yˆ 2.1x 0.85 ,
m 15.5 2.1 3 0.85 ,解得 m 0.5 ,
x (次数 / 分
20
30
40
50
60
钟)
y( C)
25
27.5
29
32.5
36
A. 33 C
B. 34 C
C. 35 C
【解析】解:由题意,得 x 20 30 40 50 60 40 , 5
y 25 27.5 29 32.5 36 30 , 5
则 k y 0.25x 30 0.25 40 20 ;
故答案为:10.
例 7.已知一组数据点:
x
x1
x2
x8
y
y1
y2
y8
8
用最小二乘法得到其线性回归方程为 yˆ 2x 4 ,若数据 x1 , x2 , , x8 的平均数为 1,则 yi i 1
16 .
3
原创精品资源学科网独家享有版权,侵权必究!
【解析】解:由题意, x 1 ,设样本点的中心为 (1, y) , 又线性回归方程为 yˆ 2x 4 ,则 y 2 1 4 2 ,
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用 Y (单位:万元)的分布列为:
Y
30
20
70
120
P
0.3
0.4
0.2
0.1
E(Y ) 30 0.3 20 0.4 70 0.2 120 0.1 25 (万元)
线性回归方程高考的题目讲解

线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
线性回归方程的求法

高考统计部分的两个重要公式 具体如何应用第一公式:线性回归方程为ˆˆˆybx a =+的求法: (1) 先求变量x 的平均值,即1231()n x x x x x n=+++⋅⋅⋅+ (2) 求变量y 的平均值,即1231()n y y y y y n=+++⋅⋅⋅+ (3) 求变量x 的系数ˆb,有两个方法 法1 121()()ˆ()niii nii x x y y bx x ==--=-∑∑(题目给出不用记忆)[]112222212()()()()...()()()()...()n n n x x y y x x y y x x y y x x x x x x --+--++--=⎡⎤-+-++-⎣⎦(需理解并会代入数据)法2 1221ˆni ii nii x y n x ybxn x==-⋅⋅=-⋅∑∑(题目给出不用记忆)[]1122222212...,...n n n x y x y x y n x y x x x n x++-⋅⋅=⎡⎤+++-⋅⎣⎦(这个公式需要自己记忆,稍微简单些)(4) 求常数ˆa,既ˆˆa y bx =- 最后写出写出回归方程ˆˆˆybx a =+。
可以改写为:ˆˆy bx a =- 例.已知,x y 之间的一组数据:求y 与x 的回归方程:解:(1)先求变量x 的平均值,即(0123) 1.54x =+++= (2)求变量y 的平均值,即1(1357)44y =+++=(3)求变量x 的系数ˆb,有两个方法 []11223344222212342222()()()()()()()()ˆ1()()()()(0 1.5)(14)(1 1.5)(34)(2 1.5)(54)(3 1.5)(74)57(0 1.5)(1 1.5)(2 1.5)(3 1.5)x x y y x x y y x x y y x x y y bx x x x x x x x --+--+--+--=⎡⎤-+-+-+-⎣⎦--+--+--+--==⎡⎤-+-+-+-⎣⎦法法2 ˆb =[][]112222222222212...011325374 1.5457...01234 1.5n n n x y x y x y nx y x x x nx++-⋅⨯+⨯+⨯+⨯-⨯⨯==⎡⎤⎡⎤+++-+++-⨯⎣⎦⎣⎦ (4) 求常数ˆa,既525ˆˆ4 1.577a y bx =-=-⨯= 最后写出写出回归方程525ˆˆˆ77ybx a x =+=+第二公式:独立性检验两个分类变量的独立性检验:注意:数据a 具有两个属性1x ,1y 。
2023届高考数学复习 第47讲 数据分析 —— 一元线性回归模型及其应用(共34张PPT)

3,b∧=01.01=0.01,a∧= y -b∧ x =0.5-0.03=0.47.所以经验回归方程为∧y=0.01x+0.47,则
当 x=6 时,y=0.53.所以预测小李该月 6 号打 6h 篮球的投篮命中率为 0.53.
知识聚焦
1. 一元线性回归模型:EY=eb=x+0,a+Dee,=σ2 称为 Y 关于 x 的一元线性回归模型.其
y)如下表所示:
x
3
4
5
6
y
2.5
3
4
m
根据表中数据,得出 y 关于 x 的经验回归方程为∧y=0.7x+a∧,据此计算出样本(4,3)
处的残差为-0.15,则表中 m 的值为( B )
A. 3.3
B. 4.5
C. 5
D. 5.5
【解析】 由题意可知,在样本(4,3)处的残差为-0.15,则∧y=3.15,即 3.15=0.7x +a∧,解得a∧=0.35,即∧y=0.7x+0.35,又 x =3+4+4 5+6=4.5,且经验回归方程过样本 中心点( x , y ),则 y =0.7×4.5+0.35=3.5,则 y =2.5+34+4+m=3.5,解得 m=4.5.
残差分析
(2021·佛山二模)H 市某企业坚持以市场需求为导向,合理配置生产资源,不
断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量 x(单位:吨)与
相应的生产总成本 y(单位:万元)的五组对照数据.
产量 x(件)
1
2
3
4
5
生产总成本 y(万元)
3
7
8
10
12
(1) 根据上述数据,若用最小二乘法进行线性模拟,试求 y 关于 x 的经验回归方程∧y
高考数学知识点精讲多元线性回归与逐步回归

高考数学知识点精讲多元线性回归与逐步回归高考数学知识点精讲:多元线性回归与逐步回归在高考数学中,统计学的知识占有重要的一席之地,其中多元线性回归与逐步回归更是常常出现在考题中。
对于这两个概念,理解它们的原理、应用以及相关的计算方法是十分关键的。
首先,我们来聊聊什么是多元线性回归。
简单来说,多元线性回归就是研究一个因变量与多个自变量之间线性关系的一种统计方法。
比如说,我们想要研究一个学生的高考成绩(因变量)与他平时的作业完成情况、课堂参与度、课后复习时间等多个因素(自变量)之间的关系,这时候就可以用到多元线性回归。
多元线性回归的数学模型可以表示为:Y =β₀+β₁X₁+β₂X₂+… +βₚXₚ +ε 。
其中,Y 是因变量,X₁,X₂,…,Xₚ 是自变量,β₀是截距,β₁,β₂,…,βₚ 是回归系数,ε 是随机误差。
那怎么来确定这些回归系数呢?这就需要用到最小二乘法。
最小二乘法的基本思想就是要使得观测值与预测值之间的误差平方和达到最小。
通过一系列复杂的数学计算,我们可以得到回归系数的估计值。
接下来,我们再看看逐步回归。
逐步回归是一种在多元线性回归基础上发展起来的方法。
在实际问题中,并不是所有的自变量都对因变量有显著的影响。
逐步回归的目的就是从众多的自变量中筛选出对因变量有显著影响的自变量,建立一个“最优”的回归方程。
逐步回归的过程大致可以分为三步。
第一步是前进法,就是先将对因变量影响最大的自变量选入回归方程;第二步是后退法,就是将已经选入方程的自变量中,对因变量影响不显著的自变量剔除出去;第三步是双向筛选法,就是结合前进法和后退法,不断地选入和剔除自变量,直到得到最优的回归方程。
在实际应用中,多元线性回归和逐步回归都有广泛的用途。
比如说,在经济领域,可以用来预测股票价格、分析市场需求等;在医学领域,可以用来研究疾病的危险因素、评估治疗效果等;在工程领域,可以用来优化生产过程、提高产品质量等。
为了更好地理解和应用多元线性回归与逐步回归,我们来通过一个具体的例子看看。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 应的生产能耗 (吨标准煤)的几组对照数据:
3
4
5
6
2.5
3
4
4.5
( 1)请画出上表数据的散点图;
(吨)与相
(2)请根据上表提供的数据,用最小二乘法求出 关于 的线性回归方程;
(3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.试根据( 2)求出的 线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤 ?
(2)求出 y 关于 x 的线性回归方程
,并在坐标系中画出回归直线;
(3)试预测加工 10 个零件需要多少时间?
(注:
(参考数值:
)
2、假设关于某设备的使用年限 x 和所支出的维修费用 y( 万元 ) 统计数据如下 :
使用年限 x 2
3
4
5
6
维修费用 y 2.2 3.8 5.5 6.5 7.0
若有数据知 y 对 x 呈线性相关关系 . 求:
(1) 填出下图表并求出线性回归方程 =bx+a 的回归系数 , ;
序号 x
1
2
2
3
3
4
4
5
5
6
∑
y
xy
x2
2.2
3.8
5.5
6.5
7.0
(2) 估计使用 10 年时 , 维修费用是多少 .
3、某车间为了规定工时定额, 需要确定加工零件所花费的时间, 为此作了四实试验, 得到的数据如下:
零件的个数 x(个) 2
3
4
5
加工的时间 y(小时) 2.5
3
4
4.5
( 1)在给定的坐标系中画出表中数据的散点图;