线性回归方程(提高)
高中数学线性回归方程线性回归方程公式详解

高中数学线性回归方程线性回归方程公式详解
线性回归方程是一种用于拟合一组数据的最常见的数学模型,它可以用来预测一个因变量(例如销售额)和一个或多个自变量(例如广告费用)之间的关系。
下面是线性回归方程的公式详解:
假设有n个数据点,每个数据点包含一个因变量y和k个自变量x1,x2,...,xk。
线性回归方程可以表示为:
y = β0 + β1*x1 + β2*x2 + ... + βk*xk + ε
其中,β0, β1, β2, ..., βk是模型的系数,ε是误差项,用来表示实际数据和模型预测之间的差异。
系数β0表示当所有自变量均为0时的截距,而β1, β2, ..., βk 则表示每个自变量对因变量的影响。
当系数为正时,自变量增加时因变量也会增加;而当系数为负时,自变量增加时因变量会减少。
通常,我们使用最小二乘法来估计模型的系数。
最小二乘法就是通过最小化所有数据点与模型预测之间的距离来找到最优的系数。
具体来说,我们可以使用以下公式来计算系数:
β = (X'X)-1 X'y
其中,X是一个n×(k+1)的矩阵,第一列全为1,其余的列为自变量x1,x2,...,xk。
y是一个n×1的向量,每一行对应一个因
变量。
X'表示X的转置,-1表示X的逆矩阵,而β则是一个(k+1)×1的向量,包含所有系数。
当拟合出线性回归方程后,我们可以使用它来预测新的数据点的因变量。
具体来说,我们可以将自变量代入方程中,计算出相应的因变量值。
如果模型的系数是可靠的,我们可以相信这些预测结果是比较准确的。
线性回归方程公式推导

线性回归方程公式推导从现代经济学研究看,线性回归是一种多变量经济分析方法,它能够用来研究变量之间的关系,以便确定哪些变量具有影响性。
线性回归模型是描述一个响应变量和一组predictor变量之间关系的线性关系模型。
线性回归模型有多种形式,其中最常见的是最小二乘法,即OLS,其核心思想是通过最小化以下损失函数来确定回归系数:S=1/n (yi-i)其中,yi是实际值,i是预测值,n是数据样本的个数。
有了线性回归模型,就可以推导出公式,即OLS回归方程。
它表述的意思是,假设回归系数β的值是已知的,即满足公式:β=(XX)^-1XY其中,X指的是一个有m个变量的矩阵,Y指的是一个有n个观测值的矩阵,X指的是X矩阵的转置矩阵,(XX)^-1指的是求XX的逆矩阵,XY指的是X和Y的点乘积。
由此,OLS回归模型就可以用变量yi=b1x1i+b2x2i+…+bpxpi+εi来表示,其中b1, b2,, bp分别是变量x1i, x2i,, xpi的回归系数,εi是误差项,它以期望值为零的正态分布的形式出现,表示随机噪声。
一般来说,OLS即可用来估计参数的可能性,但是,由于它们常常受到多重共线性的影响,因此需要检验其可靠性。
OLS的优点是可以提供一种最优的参数估计法,它能够有效地提高参数估计的准确性。
此外,OLS进行变量检验时,也可以有效地识别出具有影响性的变量。
不过,OLS也有其缺点,尤其是当数据存在某些问题时,可能会导致OLS的估计结果出现偏差。
主要问题包括多重共线性、异方差性和异常值。
对于这些问题,最好的解决方法是对数据进行相关性分析,从而将偏差减少到最小。
综上所述,OLS回归方程公式能够有效地描述变量之间的关系,检验其可靠性,以便确定哪些变量具有影响性。
为了确保其准确性,应当有效地处理多重共线性等问题,从而使得OLS具有更强的适用性。
线性回归方程公式_数学公式

线性回归方程公式_数学公式线性回归方程公式线性回归方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。
线性回归方程公式求法:第一:用所给样本求出两个相关变量的(算术)平均值:x_=(x1+x2+x3+...+xn)/ny_=(y1+y2+y3+...+yn)/n第二:分别计算分子和分母:(两个公式任选其一)分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_分母=(x1^2+x2^2+x3^2+...+xn^2)-n__x_^2第三:计算b:b=分子/分母用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零。
其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差。
先求x,y的平均值X,Y再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)后把x,y的平均数X,Y代入a=Y-bX求出a并代入总的公式y=bx+a得到线性回归方程(X为xi的平均数,Y为yi的平均数)线性回归方程的应用线性回归方程是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。
这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。
线性回归有很多实际用途。
分为以下两大类:如果目标是预测或者映射,线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。
当完成这样一个模型以后,对于一个新增的X值,在没有给定与它相配对的y的情况下,可以用这个拟合过的模型预测出一个y值。
给定一个变量y和一些变量X1,...,Xp,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的Xj,并识别出哪些Xj的子集包含了关于y的冗余信息。
线性回归方程.附答案docx

线性回归方程一、考点、热点回顾一、相关关系:1、⎩⎨⎧<=1||1||r r 不确定关系:相关关系确定关系:函数关系2、相关系数:∑∑∑===-⋅---=ni ini ini iiy y x x y y x x r 12121)()())((,其中:(1)⎩⎨⎧<>负相关正相关00r r ;(2)相关性很弱;相关性很强;3.0||75.0||<>r r3、散点图:初步判断两个变量的相关关系。
二、线性回归方程:1、回归方程:a x b yˆˆˆ+= 其中2121121)())((ˆxn x yx n yx x x y yx x bn i i ni ii n i i ni ii--=---=∑∑∑∑====,x b y aˆˆ-=(代入样本点的中心) 2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差。
(2)残差图呈带状分布在横轴附近,越窄模型拟合精度越高。
(3)残差平方和∑=-ni i iyy12)ˆ(越小,模型拟合精度越高。
3、相关指数:∑∑==---=n i ini i iy yyyR 12122)()ˆ(1(1)其中:∑=-ni i iyy12)ˆ(为残差平方和;∑=-ni i y y 12)(为总偏差平方和。
(2))1,0(2∈R ,越大模型拟合精度越高。
二、典型例题+拓展训练典型例题1:在一组样本数据),,,2)(,(),,(),,(212211不全相等n n n x x x n y x y x y x ≥的散点图中,若所有样本点),2,1)(,(n i y x i i =都在直线121+-=x y 上,则样本相关系数为( ) 21.21.1.1.--D C B A典型例题2:设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据)2,1)(,(n i y x i i =,用最小二乘法建立的回归方程为71.8585.0ˆ-=x y ,则不正确的是( )A.y 与x 具有正的线性相关关系;B.回归直线过样本点的中心),(y xC.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg扩展2.一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?典型例题3.为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.52211521()155110.8451000()i i i ii y y R yy ==-=-=-=-∑∑,221R =-521521()18010.821000()ii i ii yy y y ==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.扩展1.下列说法正确的是( )(1)残差平方和越小,相关指数2R 越小,模型拟合效果越差; (2)残差平方和越大,相关指数2R 越大,模型拟合效果越好; (3)残差平方和越小,相关指数2R 越大,模型拟合效果越好; (4)残差平方和越大,相关指数2R 越小,模型拟合效果越差;A.(1)(2)B.(3)(4)C.(1)(4)D.(2)(3)扩展2.关于某设备的使用年限x (年)和所支出的维修费用y (万元)有下表所示的资料:若由资料知,y 对x 呈线性相关关系,求:(1)线性回归方程a x b yˆˆˆ+=中的回归系数b a ˆ,ˆ; (2)残差平方和与相关指数2R ,作出残差图,并对该回归模型的拟合精度作出适当判断; (3)使用年限为10年时,维修费用大约是多少?三、典型例题4.非线性回归模型:某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费和年销售量(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值。
线性回归计算方法及公式PPT课件

(y = ax + b)
解释
其中(y)是因变量,(a)是斜率,(x)是自变量,(b)是截距。
实例二:多元线性回归分析
总结词
多个自变量的线性关系
详细描述
多元线性回归分析研究因变量与多个自变量之间的线性关 系。通过引入多个自变量,可以更全面地描述因变量的变 化规律。
公式
(y = a_1x_1 + a_2x_2 + ... + a_nx_n + b)
加权最小二乘法的公式
加权最小二乘法的公式是:(ŷ=β₀+β₁x₁+β₂x₂+...+βₙxₙ)其中,(w_i)是加权因 子,用于对不同观测值赋予不同的权重。
加权最小二乘法适用于数据存在异方差性的情况,通过给不同观测值赋予不同的 权重,能够更好地拟合数据。
主成分回归的公式
主成分回归的公式是:(ŷ=β₀+β₁z₁+β₂z₂+...+βₙzₙ)其中, (z_i)是主成分得分,通过对原始自变量进行线性变换得到。
误差项独立同分布
误差项被假设是相互独立的,并且具有相 同的分布(通常是正态分布)。
误差项无系统偏差
自变量无多重共线性
误差项被假设没有系统偏差,即它们不随 着自变量或因变量的值而变化。
自变量之间被假设没有多重共线性,即它 们是独立的或相关性很低。
02
线性回归模型
模型建立
确定因变量和自变量
首先需要确定研究的因变量和自变量, 以便建立线性回归模型。
以提供更稳定和准确的估 计。
(y = (X^T X + lambda I)^{1}X^T y)
其中(y)是因变量,(X)是自变量 矩阵,(lambda)是正则化参数
线性回归方程

水稻产量:320 330 360 410 460 470 480
(1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什么关系 吗?水稻产量会一直随施化肥量的增加而增长吗? 分析 判断变量间是否是线性相关,一种常用的简便可行的方
法就是作散点图.
解 (1)散点图如下:
(2)从图中可以发现,当施化肥量由小到大变化时,水稻产量 由小变大,图中的数据点大致分布在一条直线的附近,因此施 化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一 定范围内随着化肥施用量的增加而增长.
nxy ,a y bx
xi nx2
来计算回归系数,有时常制表对应出xiyi,xi2,以便于求和.
举一反三
3. 某中学期中考试后,对成绩进行分析,从某班中选出5名学
生的总成绩和外语成绩如下表:
学生 学科 1 2 3 4 5
总成 绩(x) 482 外语 成绩 (y)
383
421
364
含量x之间的相关关系,现取8对观测值,计算
得
x
i 1
8
i
52 ,
y
i 1
8
i
228
,
x
i 1
8
2
i
478 ,
x y
回归线性方程公式

回归线性方程公式
回归线性方程是统计学中反映数据之间关系的重要统计模型,它
具有表达力强,数值运算简单的特性。
它是利用建立数据之间关系的
拟合性模型,以数学的方式描述一个数量和另一个数据之间的联系,
从而找到一个具有可预测作用的测量模型。
线性回归方程可以用一个
函数来描述离散点或一组数据点之间的联系,通过线性拟合法来确定
线性回归方程。
回归线性方程的一般形式为:y = ax + b,其中ax+b是系数,y
是自变量(x)的应变量,a是斜率,b是常数项。
基于已有的观测值
来求解系数时,需要使用最小二乘法来解决,系数的最优解为使得误
差平方和最小的可行解。
例如,已知一组观测数据的x和y的坐标,
假设存在一个未知的函数,其输入是x,输出是y,则经过多次观测,
可以找到该函数的表达式为y=ax+b,其中a与b是待求参数。
回归线性方程不仅可以用于反映数据之间的相关性,还可以运用
在统计学中,用来分析两个变量之间的关系,并进行预测。
回归线性
方程是统计学家根据已有数据提出一种对数据进行统计推断的先进方式。
它不但提供了一个简单易用的方法来把数据和理论结合,而且也
可以智能地逃避直接的、实证的假设。
回归线性方程是统计学的重要工具,它利用模型来表达数据之间
的关系,从而帮助提高对现实情况的预测能力。
它是一种强大、易用
的统计分析方式,能够有效地帮助人们分析数据,并作出正确地预测,以更好地利用数据资源。
典型例题:线性回归方程

认识线性回归方程一、线性回归方程设X与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫做回归直线.例1.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由资料知y对x呈线性相关关系,试求:(1)线性回归方程y = a+bxi(2)估计使用年限10年时,维修费用是多少?分析:因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题.解:(1)制表于是有& = • =].23,。
=亍一庚= 5 — 1.23x4 = 0.08.90-5x42・•・线性回归方程为y = 1.23X+0.08 ;(2)当x = 10时,『 = 1.23x10+0.08 = 12.38 (万元),即估计使用10年时1 / 3维修费用约是12.38万元.评注:已知y对x呈线性相关关系,无须进行相关性检验,否则应首先进行相关性检验.二、回归分析通过对有关数据的分析,作出散点图,并利用散点图直观地认识两个变量的 相关关系,也可以用相关系数r 来确定两个变量的线性相关关系.例2. —个车间为了规定工时定额,需要确定加工零件所花费的时间,为此 进行了 10次试验,测得的数据如下:零件数X (个) 10 2030 40 5060708090100加工时间y (分)62 68 75 81 89 95 102 108 115 122(1) y 与X 是否具有线性相关关系?(2) 如果y 与x 具有线性相关关系,求回归直线方程.分析:先求出r 的值,I"的值越接近于1,表明两个变量的线性相关关系越 强.解:(1)列岀下表,并用科学计算器进行计算.■11 2 3 4 5 6 7 8 9 10 xi10 20 30 40 50 60 70 80 90 100 开626875818995102108115122620 1360 2250 3240 4450 5700 71408640 10350 12200 10x = 55, y = 91.7,r-l10= 38500,=87777,/-I10工尤必=55950r-l55950-10x55x91.77(38500 -10 x 552)(87777 -10 x 91.72)•••0.9998>0・632,「.y 与x 具有线性相关关系;(2)设所求的回归直线方程为y 从,« 0.9998 o工心-10厂/-Ia = y-bx = 9\.7-0.668x55 a54.96 ,•••所求的回归直线方程为,y = 0.668x+54.96 •评注:这类问题的解决方法一般分为两步,第一步分析两个变量是否有线性 相关关系,第二步求回归直线方程.那么山上表可知 d55950-10x55x91.738500-I0x552~* 0.668,10D )l-10xy)0 _ jOx /-I。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归方程(提高)学习目标1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;3.知道回归直线、回归直线方程、线性回归分析的意义;4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;要点梳理要点一、变量之间的相关关系变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。
1.函数关系函数关系是一种确定性关系,如y=kx+b,变量取的每一个值,都有唯一确定的值和它相对应。
2.相关关系变量间确定存在关系,但又不具备函数关系所要求的确定性相关关系分为两种:正相关和负相关要点诠释:对相关关系的理解应当注意以下几点:(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.3.散点图将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。
通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。
如:家庭年收入越高,年饮食支出越高。
反映在散点图上它们散布在从左下角到右上角的区域,按表中所列数据制作散点图如图A 0 5 10 15 20 25 30 35B 541.67602.66 670.09 704.99 806.71 908.59 975.42 1034.75(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。
在散点图中,对应数据的位置为从左上角到右下角的C 5 8 16 18 28 30 35D 64 56 50 42 37 32 21(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。
例如,学生的身高与学生的学习成绩没有相关关系。
要点诠释:利用散点图可以大致判断两个变量之间有无相关关系。
要点三、线性回归方程1. 回归直线方程(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
求出的回归直线方程简称回归方程。
2.回归直线方程的求法设与个观测点()最接近的直线方程为,其中a、b 是待定系数.则.于是得到各个偏差.显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和.表示n个点与相应直线在整体上的接近程度.记.上述式子展开后,是一个关于a、b的二次多项式,应用配方法,可求出使Q为最小值时的a、b的值.即,,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。
要点诠释:1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.典型例题类型一:变量间的相关关系与函数关系1.下列两个变量之间的关系中,不是函数关系的是()A.角度和它的余弦值 B.正方形的边长和面积C.正n边形的边数和其内角度数之和 D.人的年龄和身高【答案】D【解析】函数关系是一种确定的关系。
而相关关系是非确定性关系。
选项A、B、C都是函数关系,可以写出它们的函数表达式:,,,选项D不是函数关系,在相同年龄的人群中,仍可以有不同身高的人,故选D.【总结升华】本题考查非数据型两个变量的相关性判断.要根据两个变量之间是否具有确定性关系及因素关系进行判断.【变式1】下列图形中具有相关关系的两个变量是()【答案】C【解析】A、B中显然任给一个x都有唯一确定的y值和它对应,是函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。
【变式2】下列关系是相关关系的是________(填序号).①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系.【答案】①③④2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气温的对比表。
气温x/℃26 18 13 10 4 -1杯数y 20 24 34 39 50 64请画出散点图,并判断它们是否有相关关系。
【解析】散点图如下图:从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,所以气温和杯数成负相关。
【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。
【变式1】下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?年平均气温(℃)12.51 12.74 12.74 13.69 13.33 12.84 13.05年降雨量(mm)748 542 507 813 574 701 432 【解析】以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如下图所示。
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。
【总结升华】用回归直线进行拟合两变量关系的一般步骤为:①作出散点图,判断各点是否散布在一条直线附近。
②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。
类型二:回归直线方程的求解3.在钢铁中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据:碳含量/%0.10 0.30 0.40 0.55 0.70 0.80 0.95 20℃时电阻/μΩ15 18 19 2122.6 23.826(1)画出散点图;(2)求回归方程.【解析】由散点图知能用回归直线拟合样本数据,然后,利用表中的数据,可以得到,计算公式中所需的数据,代入易得,.(1)作出散点图如下图所示.(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据可求得,,,.则,.所以回归方程为.【总结升华】求线性回归直线方程的步骤为:第一步:列表;第二步:计算;第三步:代入公式计算的值;第四步:写出直线方程.【变式1】某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元)49 26 39 54根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元【答案】选B【解析】,回归方程为,当时,=65.5,故选B.【变式2】观察两相关变量得如下数据:x -1-2-3-4-55 3 4 2 1y -9-7-5-3-11 5 3 7 9求两变量间的回归方程.【答案】【解析】列表:i 1 2 3 4 5 6 7 8 9 10 x i-1-2 -3 -4 -5 5 3 4 2 1y i-9-7 -5 -3 -1 1 5 3 7 9 x i y i9 14 15 12 5 5 15 12 14 9 计算得:,。
,。
∴。
∴所求回归直线方程为。
类型三:利用回归直线对总体进行估计4.给出了随机抽取的10位男性的收缩血压.年龄x(岁)收缩压y(毫米汞柱)年龄x(岁)收缩压y(毫米汞柱)37 110 50 14635 117 49 14841 125 54 15043 130 60 15442 138 65 160(1)画出散点图;(2)求出收缩压与年龄之间的回归直线;(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少?(4)就(3)所得预测结果,比较其预测的精确性。
【解析】(1)散点图为:(2)收缩压与年龄之间的回归直线列表:序号x y x2xy1 37 110 1369 40702 35 117 1225 40953 41 125 1681 51254 43 130 **** ****5 42 138 **** ****6 50 146 2500 73007 49 148 2401 72528 54 150 **** ****9 60 154 3600 924010 65 160 4225 10400求和476 1378 23530 66968所以y对x的回归直线方程为:(3)根据所求的回归直线方程可以预测20岁的收缩压为45岁的收缩压为:毫米汞柱(4)预测20岁的结果时,20是外推的,所以不是很精确;而45是内插值,所以精确性比20的预测结果要好。
【总结升华】只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.【变式1】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x(cm)174 176 176 176 178儿子身高y(cm)175 175 176 177 177则y对x的线性回归方程为().【答案】C【变式2】下表是某地搜集到的新房屋的销售价格y,(单位:万元)和房屋的面积x(单位:m。