高考数学复习点拨:例析线性回归直线方程的求法

例析线性回归直线方程的求法

山东 杨道叶

一、求回归直线方程的步骤: 第一步:列表i

x ,i

y ,i i

x y ;

第二步:计算x ,y ,21

n i

i x =∑,21

n i

i y =∑,1

n

i i

i x y =∑;

第三步:代入公式计算b ,a 的值; 第四步:写出直线方程。 二、范例剖析

例1 测地某地10对父子身高(单位:英寸)如下:

如果x 与y 之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高。

分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归直线方程。为了使计算更加有条理,我们通过制

作表格来先计算出1

n

i i x =∑,1n

i i y =∑,2

1n

i

i x =∑,21n

i

i y =∑和1n

i i i x y =∑;再计算出11n

i i x x n ==∑,

2

1

1n i i y y n ==∑,再利用公式12

21

n

i i

i n

i

i x y nx y

b x

nx

==-=

-∑∑和a y bx =-来计算回归系数,最后写

出回归直线方程y bx a =+。

解析:先将两个变量的数字在表中计算出来,如下表所示:

由上表可得

66866.8

10

x ==,

670.167.01

10

y ==,10

21

44794

i

i x

==∑,

10

2144941.93i

i y

==∑,10

1

44842.4i i i x y ==∑。

代入公式得2

44842.41066.867.010.4646447941066.8b -⨯⨯=≈-⨯,

67.010.464666.835.975a =-⨯≈,

故所求回归直线方程为0.464635.945y x =+。 当78x =时,0.46467835.97572.2138y =⨯+=,

所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸。

评注:注意回归直线方程中一次项系数为b ,常数项为a ,这与一次函数的习惯表示不同。

例2 有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度

而变化。下面是实验的步骤:

128

149

1611

(1)作出散点图;

(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;

(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?

分析:散点图形象地反映了各对数据的密切程度,通常在尚未判断两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认具有线性相关关系后,再求其回归直线方程。

解析:(1)散点图如下图所示:

(2)易求得12.5

y=,b=0。7286,a=-0.8571,

x=,8.25

∴所求回归直线方程为0.72860.8571

=-。

y x

(3)依题意,要使10

y≤,只要0。7286x-0.8571≤10,解得x≤14。9013,即机床的运转速度不能超过14。9013转/秒.

评注:利用最小二乘法求线性回归直线方程有着广泛的应用,请同学们联系实际,熟练掌握.

三、知能展示

1.为了研究三月下旬的平均气温(x)与四月二十号前棉花害虫化蛹高峰日(y)的关系,某地区观察了1996年至2001年的情况,得到下面的数据:

据气象预测,该地区在2002年三月下旬平均气温为027C,试估计2002年四月化蛹高峰日为哪天。

2.某地区第一年到第六年的用电量y与年次x的统计数据如下表:

用电单位:亿度

(1)y与x是否具有线性相关关系?

(2)如果y与x具有线性相关关系,求回归直线方程。

答案:

1.提示:估计该地区2002年4月12日或13日为化蛹高峰日。2.(1)线性相关;(2) 1.049.66

=+

y x

线性回归方程[高考数学总复习][高中数学课时训]

线性回归方程 1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①② 2.为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好相等,都为s ,变量y 的观测数据的平均值也恰好相等,都为t ,那么下列说法中正确的是 (填序号). ①直线l 1,l 2有交点(s ,t ) ②直线l 1,l 2相交,但是交点未必是(s ,t ) ③直线l 1,l 2由于斜率相等,所以必定平行 ④直线l 1,l 2必定重合 答案 ① 3.下列有关线性回归的说法,正确的是 (填序号). ①相关关系的两个变量不一定是因果关系 ②散点图能直观地反映数据的相关程度 ③回归直线最能代表线性相关的两个变量之间的关系 ④任一组数据都有回归直线方程 答案 ①②③ 4.下列命题: ①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归直线y ?=b ?x +a ?及回归系数b ?,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 . 答案 ①②③ 5.已知回归方程为y ?=0.50x -0.81,则x =25时,y ?的估计值为 . 答案 11.69 例1 下面是水稻产量与施化肥量的一组观测数据: 施化肥量 15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (1)将上述数据制成散点图; (2) 你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而 基础自测

【2019最新】高中数学第1章统计案例1-2回归分析课堂导学案

【2019最新】高中数学第1章统计案例1-2回归分析课堂导学案 课堂导学 三点剖析 各个击破 一、求线性回归方程 (2)预测水深为1.95 m 时水的流速是多少? 解:(1)散点图如下图所示. 列表计算a ?与回归系数b ?. 于是75.1148x =?= ,9775.182.158 y =?=, ∑x i 2 =24.92,∑y i 2 =31.511 6,∑x i y i =27.993, ∴2 75 .1892.249775 .175.18993.27??-??-=b ≈0.733, x ?-y ?b a ==1.977 5-0.733×1.75=0.694 8, ∴y 对x 的回归直线方程为x ???b a y +==0.694 8+0.733x . (2)在本题中回归系数b ?=0.733的意思是:在此灌溉渠道中,水深每增加0.1 m 水的流

速平均增加0.733 m/s, a ?=0.694 8,可以解释为水的流速中不受水深影响的部分,把x =1.95 代入得到y ?=0.694 8+0.733×1.95≈2.12 m/s,计算结果表明:当水深为1.95 m 可以预报渠水的流速约为2.12 m/s. 类题演练 1 关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获得了一组数据: (1)作散点图; (2)求y 与x 之间的回归线方程; (3)给出37岁人的脂肪含量的预测值. 解:(1)略 (2)设方程为y ?=b x +a,则由计算器算得a=-0.448,b=0.577, 所以y ?=0.577x -0.448. (3)当x =37时, y ?=0.577×37-0.448=20.90. 变式提升 从某大学中随机选取8名女大学生,其身高和体重的数据如下表所示: 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172 c m 的女大学生的体重. 解:作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x ,体重为因变量y ,作散点图如右图所示. ∑∑====n i i n i i y n y x n x 1 11,1 ∑∑==---=n i i n i i i x x y y x x b 1 2 1 )() )((?≈0.849,x b y a ??==-85.712.

高中数学例题:回归直线方程的求解

高中数学例题:回归直线方程的求解 例3.在钢铁中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据: (1)画出散点图; (2)求回归方程. 【解析】由散点图知能用回归直线拟合样本数据,然后,利用表中的数据,可以得到b ,a 计算公式中所需的数据,代入易得b ,a . (1)作出散点图如下图所示. (2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据可求得 711 3.800.54377i i x x ===≈∑,711145.4 20.7777 i i y y ===≈∑,7 2 1 2.595i i x ==∑, 7 1 85.61i i i x y ==∑. 则7 17 2 2 21 785.6170.54320.77 12.552.59570.543 7i i i i i x y x y b x x ==--??= = ≈-?-∑∑, 20.7712.550.54313.96a y bx =-=-?≈.

所以回归方程为12.5513.96y x =+. 【总结升华】 求线性回归直线方程的步骤为: 第一步:列表i i i i x y x y ,,; 第二步:计算2 11 n n i i i i i x y x x y ==∑∑,, ,   ; 第三步:代入公式计算b a ,的值; 第四步:写出直线方程. 举一反三: 【变式1】 某产品的广告费用x 与销售额y 的统计数据如下表: 根据上表可得回归方程中的为9.4,据此模型预报广告 费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 【答案】选B 【解析】423549263954 3.5,4244 x y ++++++= === 429.4 3.59.1a y bx ∴=-=-?=,∴回归方程为9.49.1y x =+, ∴当6x =时,9.469.1y =?+=65.5,故选B . 【变式2】 观察两相关变量得如下数据: 求两变量间的回归方程. ??y bx a =+b

线性回归方程的求法

高考统计部分的两个重要公式的具体如何应用 第一公式:线性回归方程为???y bx a =+的求法: (1) 先求变量x 的平均值,既1231()n x x x x x n = +++???+ (2) 求变量y 的平均值,既1231()n y y y y y n =+++???+ (3) 求变量x 的系数?b ,有两个方法 法112 1()()?()n i i i n i i x x y y b x x ==--=-∑∑(题目给出不用记忆)[]112222212()()()()...()()()()...()n n n x x y y x x y y x x y y x x x x x x --+--++--=??-+-++-?? (需理解并会代入数据) 法21 2 1()()?()n i i i n i i x x y y b x x ==--=-∑∑(题目给出不用记忆) []1122222212...,...n n n x y x y x y nx y x x x nx ++-?=??+++-??(这个公式需要自己记忆,稍微简单些) (4) 求常数?a ,既??a y bx =- 最后写出写出回归方程???y bx a =+。可以改写为:??y bx a =-(?y y 与不做区分) 例.已知,x y 之间的一组数据: 求y 与x 的回归方程: 解:(1)先求变量x 的平均值,既1(0123) 1.54x = +++= (2)求变量y 的平均值,既1(1357)44 y =+++= (3)求变量x 的系数?b ,有两个方法

法1?b = []11223344222212342222()()()()()()()()()()()()(0 1.5)(14)(1 1.5)(34)(2 1.5)(54)(3 1.5)(74)57(0 1.5)(1 1.5)(2 1.5)(3 1.5)x x y y x x y y x x y y x x y y x x x x x x x x --+--+--+--=??-+-+-+-??--+--+--+--==??-+-+-+-?? 法2?b =[][]11222222222212...011325374 1.5457 ...0123n n n x y x y x y nx y x x x nx ++-??+?+?+?-??==????+++-+++???? (4)求常数?a ,既525??4 1.577a y bx =-=-?= 最后写出写出回归方程525???77 y bx a x =+=+ 第二公式:独立性检验 两个分类变量的独立性检验: 注意:数据a 具有两个属性1x ,1y 。数 据b 具有两个属性1x ,2y 。数据c 具有两个属性2x ,2y 数据d 具有两个属性2x ,2y 而且列出表格是最重要。解题步骤如下 第一步:提出假设检验问题 (一般假设两个变量不相关) 第二步:列出上述表格 第三步:计算检验的指标 2 2 ()()()()()n ad bc K a b c d a c b d -=++++ 第四步:查表得出结论 例如你计算出2K =9大于表格中7.879,则查表可得结论:两个变量之间不相关概率为0.005,或者可以肯定的说两个变量相关的概率为0.995.或095.50 例如你计算出2K =6大于表格中5.024,则查表可得结论:两个变量之间不相关概率为0.025,或者可以肯定的说两个变量相关的概率为0.995.或097.50 上述结论都是概率性总结。切记事实结论。只是大概行描述。具体发生情况要和实际联系!! !!

高中数学知识点:线性回归方程

高中数学知识点:线性回归方程 1.回归直线方程 (1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。求出的回归直线方程简称回归方程。 2.回归直线方程的求法 设与n 个观测点(,i i x y )()1,2,,i n =⋅⋅⋅最接近的直线方程为,y bx a =+,其中a 、b 是待定系数. 则,(1,2,,)i i y bx a i n =+= .于是得到各个偏差 (),(1,2,,)i i i i y y y bx a i n -=-+=. 显见,偏差i i y y -的符号有正有负,若将它们相加会造成相互抵 消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和. 2222211)()()(a bx y a bx y a bx y Q n n --++--+--= 表示n 个点与相应直线在整体上的接近程度. 记21()n i i i Q y bx a ==--∑. 上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即 1122211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑, ∑==n i i x n x 11,∑==n i i y n y 11

相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。 要点诠释: 1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程. 2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性. 3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误. 4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.

线性回归方程公式_数学公式

线性回归方程公式_数学公式 线性回归方程公式 线性回归方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。 线性回归方程公式求法: 第一:用所给样本求出两个相关变量的(算术)平均值: x_=(x1+x2+x3+...+xn)/n y_=(y1+y2+y3+...+yn)/n 第二:分别计算分子和分母:(两个公式任选其一) 分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_ 分母=(x1^2+x2^2+x3^2+...+xn^2)-n__x_^2 第三:计算b:b=分子/分母 用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零。 其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差。 先求x,y的平均值X,Y 再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)

后把x,y的平均数X,Y代入a=Y-bX 求出a并代入总的公式y=bx+a得到线性回归方程 (X为xi的平均数,Y为yi的平均数) 线性回归方程的应用 线性回归方程是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。 线性回归有很多实际用途。分为以下两大类: 如果目标是预测或者映射,线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。当完成这样一个模型以后,对于一个新增的X值,在没有给定与它相配对的y的情况下,可以用这个拟合过的模型预测出一个y值。 给定一个变量y和一些变量X1,...,Xp,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的Xj,并识别出哪些Xj的子集包含了关于y的冗余信息。 如何快速提高高三数学成绩 1.要制定适合自己的学习方案 给自己制定一个目标是很重要的,因为高中数学成绩不好更要通过制定一个好的方案来提高,合理的利用时间,要知道高中的课程是很紧张的,一定要把能用上的所有时间充分的利用起来,稳稳的打好基础在进行下一步的学习,不能求快要求问,要知道欲速则不达的道理。 2.复习是提高成绩的一方面

高考数学复习点拨 例析线性回归直线方程的求法

高考数学复习点拨 例析线性回归直线方程的求法 一、求回归直线方程的步骤: 第一步:列表i x ,i y ,i i x y ; 第二步:计算x ,y ,21 n i i x =∑,21 n i i y =∑,1 n i i i x y =∑; 第三步:代入公式计算b ,a 的值; 第四步:写出直线方程。 二、范例剖析 例1 测地某地10对父子身高(单位:英寸)如下: 如果x 与y 之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高。 分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归直线方程。为了使计算更加有条理,我们通过制作表格来先计算出 1 n i i x =∑,1n i i y =∑,2 1n i i x =∑,21n i i y =∑和1n i i i x y =∑;再计算出11n i i x x n ==∑,2 11n i i y y n ==∑,再利用公式12 21 n i i i n i i x y nx y b x nx ==-= -∑∑和a y bx =-来计算回归系数,最后写出回归直线方程 y bx a =+。 解析:先将两个变量的数字在表中计算出来,如下表所示:

由上表可得66866.810x ==,670.1 67.0110 y ==, 10 2 1 44794i i x ==∑, 10 21 44941.93i i y ==∑,10 1 44842.4i i i x y ==∑。 代入公式得2 44842.41066.867.01 0.4646447941066.8 b -⨯⨯= ≈-⨯, 67.010.464666.835.975a =-⨯≈, 故所求回归直线方程为0.464635.945y x =+。 当78x =时,0.46467835.97572.2138y =⨯+=, 所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸。 评注:注意回归直线方程中一次项系数为b ,常数项为a ,这与一次函数的习惯表示不同。 例 2 有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化。下面是实验的步骤:

用最小二乘法求线性回归方程

最小二乘法主要用来求解两个具有线性相关关系的变量的回归方程,该方法适用于求解与线性回归方程相关的问题,如求解回归直线方程,并应用其分析预报变量的取值等.破解此类问题的关键点如下: ①析数据,分析相关数据,求得相关系数 r ,或利用散点图判断两变量之间是否存在线性相关关系,若呈非线性相关关系,则需要通过变量的变换转化构造线性相关关系. ②建模型.根据题意确定两个变量,结合数据分析的结果建立回归模型. ③求参数.利用回归直线 y=bx+a 的斜率和截距的最小二乘估计公式,求出 b ,a,的值.从而确定线性回归方程. ④求估值.将已知的解释变量的值代入线性回归方程 y=bx+a 中,即可求得 y 的预测值. 注意:回归直线方程的求解与应用中要注意两个方面:一是求解回归直线方程时,利用样本点的中心( x,y)必在回归直线上求解相关参数的值;二是回归直线方程的应用,利用回归直线方程求出的数值应是一个估计值,不是真实值. 经典例题: 下图是某地区 2000 年至 2016 年环境基础设施投资额(单位:亿元)的折线图.

为了预测该地区 2018 年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据 2000 年至 2016 年的数据(时间变量的值依次为 1,2.,⋯⋯ 17 )建立模型①: y=-30.4+13.5t ;根据 2010 年至 2016 年的数据(时间变量的值依次为)建立模型②: y=99+17.5t . ( 1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 思路分析:( 1)两个回归直线方程中无参数,所以分别求自变量为 2018 时所对应的函数值,就得结果,( 2)根据折线图知 2000 到 2009 ,与 2010 到 2016 是两个有明显区别的直线,且 2010 到 2016 的增幅明显高于 2000 到 2009 ,也高于模型 1 的增幅,因此所以用模型 2 更能较好得到 2018 的预测. 解析:( 1)利用模型①,该地区 2018 年的环境基础设施投资额的预测值为 = –30.4+13.5 ×19=226.1 (亿元). 利用模型②,该地区 2018 年的环境基础设施投资额的预测值为 =99+17.5 ×9=256.5 (亿元)(2)利用模型②得到的预测值更可靠.理由如下: ( i)从折线图可以看出, 2000 年至 2016 年的数据对应的点没有随机散布在直线y= –30.4+13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势. 2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010 年至 2016 年的数据建立的线性模型 =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠. ( ii)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型①得到的预测值 226.1 亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. 以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可得分.

高考数学一轮复习专题05 回归直线方程(解析版)

概率与统计 专题五:回归直线方程 一、知识储备 1.两个变量线性相关 (1)散点图:将样本中n 个数据点(,)i i x y (i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关 ①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)回归方程的推导过程: ①假设已经得到两个具有线性相关关系的变量的一组数据11(,)x y ,22(,)x y ,33(,)x y (,)n n x y . ②设所求回归方程为y bx a =+,其中,a b 是待定参数. ③由最小二乘法得 1 12 2 2 1 1 ()() ,()n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx ====---= = =---∑∑∑∑ 其中,b 是回归方程的斜率,a 是截距. 二、例题讲解 1.(2022·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自2021年1月1日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前5周每周普及宣传的人数与时间的数据,得到下表: (1)若可用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程; (2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.

高考数学复习点拨 例谈直线回归方程的求解方法 试题

例谈直线回归方程的求解方法 在求具有线性相关关系的两个变量之间的回归方程时,由于所给两个变量的数据较多并且量大,致使运算量大且繁杂,常常使我们望而生“畏〞,望而生“烦〞.那么,如何尽快的求出回归直线方程呢?下面,结合一个实例谈谈回归直线方程的求解方法,以供参考. 例:测得某地10对父子身高〔单位:英寸〕如下: 父亲身高(x) 60 62 64 65 66 67 68 70 72 74 儿子身高〔y 〕63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70 假如x 与y 之间具有线性相关关系,求回归直线方程;假如父亲的身高为78英寸,试估计儿子的身高. 分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法〞来求回归方程.用“最小二乘法〞求回归直线方程的关键在于正确地利用回归方程中系数公式 12 21 n i i i n i i x y nx y b x nx ==-= -∑∑,a y bx =-求出系数a b ,,这样回归方程也就建立起来了. 为了使计算更加有条理,我们通过制作表格来先计算出2 21 1 1 1 n n n n i i i i i i i i x y x y ====∑∑∑∑,,,;再计算 出11n i i y y n ==∑,11n i i x x n ==∑;最后利用公式22 1n xx i i L x nx ==-∑,221 n yy i i L y ny ==-∑, 1 n xy i i i L x y nx y ==-∑,列式计算,再利用公式计算xy xx L b L = ;最后写出回归直线方程:y bx a =+. 解法:先将两个变量的数字在表中计算出来,如下表所示:

新高考数学复习考点知识专题讲解与练习67---线性回归分析与统计案例

新高考数学复习考点知识专题讲解与练习 专题67 线性回归分析与统计案例 一、单项选择题 1.甲、乙、丙、丁四位同学各自对A ,B 两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m , 如下表:则哪位同学的试验结果体现A ,B 两变量有更强的线性相关性( ) A .甲 B .乙C .丙 D .丁 2.某工厂某产品产量x(千件)与单位成本y(元)满足回归直线方程y ^ =77.36-1.82x ,则以下说法中正确的是( ) A .当产量为1千件时,单位成本为75.54元 B .当产量为2千件时,单位成本为73.72元 C .产量每增加1 000件,单位成本约下降1.82元 D .产量每减少1 000件,单位成本约下降1.82元 3.(2021·郑州质 检)某研究机构对儿童记忆能力x 和识图能力y 进行统计分析,得到如下数据:由表中数据,求得线性回归方程为y ^=45x +a ^.若某儿童的记忆能力为12,则他的识图能力约为( ) A .9.2 B .9.5C .9.8 D .10 4.(2021·济宁邹城市模 拟)2020年初,新型冠状病毒(COVID -19)引起的肺炎疫情暴发以来,各地医疗机构 采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,

每周治愈的患者人数如下表所示: 可得y关于x的二次回归方程为y ^ =6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为( ) A.5 B.4C.1 D.0 5.(2021·长春质 检)某学校为了采取治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表: 则认为“是否同意限定区域停车与家长的性别有关”的把握约为( ) A.0.1% B.0.5%C.99.5% D.99.9% 附:K2= n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d. 6.(2021·衡水中学模 拟)某公司某型号无人机以其小巧轻便、高效机 动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如下表所示. 根据表中的数据用最小二乘法求得y关于x的线性回归方程为y ^ =6.5x+t,则可以预测2022年该型号无人机的销量大约为( ) A.50万件B.54.5万件C.55万件D.58万件

高中数学必修三线性回归方程

统计第三讲:变量间的相关关系 —————————————————————————————————————————————— 一、两个变量的线性相关 1、线性回归方程:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,回归直线对应的方程叫做回归直线方程(简称回归方程)。 2、回归方程求法:设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数. 经数学上的推导,,a b 的值由下列公式给出:1 1222 11 ()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧ ---⎪ ⎪==⎪⎨--⎪⎪ =-⎪⎩∑∑∑∑. 其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+. 上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. 3、回归方程应用:利用回归方程,我们可以进行预测并对总体进行估计. —————————————————————————————————————————————— 二、相关关系的强弱 1、相关系数:若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤ ≤,则变量x 与y 的相关系数 ()() n i i x x y y r --= ∑,即n i i x y nx y r -= ∑, 2、通常用r 来衡量x 与y 之间的线性关系的强弱 (1)r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关 (2)||r 越接近于1,x 与y 的相关程度越大;当||1r =时,所以数据点都在一条直线上. (3)||r 越接近于0,二者的相关程度越小 ——————————————————————————————————————————————

苏教版 高考数学 一轮复习 讲义---第10章 学案56 线性回归方程

学案56 线性回归方程 导学目标: 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 自主梳理 1.相关关系:两个变量之间的关系可能是________关系(如:函数关系),或__________关系.当自变量取值一定时,因变量也确定,则为确定性关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系. 2.散点图:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图. 3.回归直线 (1)定义:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有________________,这条直线叫做回归直线. (2)最小二乘法:通过求Q =∑n i = 1 (y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和______,这一方法叫做最小二乘法. (3)线性回归方程 方程y ^ =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数. 错误!. 自我检测 1.下列有关线性回归的说法,正确的序号是________. ①相关关系的两个变量不一定是因果关系; ②散点图能直观地反映数据的相关程度; ③回归直线最能代表线性相关的两个变量之间的关系; ④任一组数据都有线性回归方程. 2.下列关系: ①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其截面直径与高度之间的关系;⑤学生的身高与其学号之间的关系,其中有相关关系的是________(填序号). 3.(2010·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据: 由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^ = -0.7x +a ,则a =________. 4.如图所示,有5组(x ,y )数据,去掉________组数据后,剩下的4组数据的线性相关性最大. 5.(2010·金陵中学三模)已知三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,则其线性回归方程是________________.

高中数学复习概率统计题型归纳与讲解01 线性回归方程

高中数学复习概率统计题型归纳与讲解 专题1线性回归方程 例1.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x (每分钟鸣叫的次数)与气温y (单位:C)︒存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y 关于x 的线性回归方程ˆˆ0.25y x =+,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为() A .33C ︒ B .34 C ︒C .35C ︒ D .35.5C ︒ 【解析】解:由题意,得2030405060 405 x ++++==, 2527.52932.536 305 y ++++= =, 则0.25300.254020y x =-=-⨯=; 当56x =时,ˆ34y =. 故选:B . 例2.已知下列说法: ①对于线性回归方程ˆ35y x =-,变量x 增加一个单位时,ˆy 平均增加5个单位; ②在线性回归模型中,相关指数2R 越接近于1,则模型回归效果越好; ③两个随机变量的线性相关性越强,则相关系数就越接近1; ④互斥事件不一定是对立事件,对立事件一定是互斥事件; ⑤演绎推理是从特殊到一般的推理,它的一般模式是“三段论”.

其中说法错误的个数为() A .1B .2C .3D .4 【解析】解:①对于线性回归方程ˆ35y x =-,变量x 增加一个单位时,ˆy 平均减少5个单位,故①不正确; ②在线性回归模型中,相关指数2R 越接近于1,则模型回归效果越好,故②正确; ③两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1,故③不正确; ④互斥事件不一定是对立事件,对立事件一定是互斥事件,所以④正确; ⑤演绎推理是从一般到特殊的推理,它的一般模式是“三段论”.所以⑤不正确; 故选:C . 例3.变量x ,y 之间的一组相关数据如表所示:若x ,y 之间的线性回归方程为ˆˆ12.28y bx =+,则ˆb 的值为() A .0.92- B .0.94- C .0.96- D .0.98- 【解析】解:4567 5.54 x +++==,8.27.8 6.6 5.4 74 y +++= =, 则样本点的中心的坐标为(5.5,7), 代入ˆˆ12.28y bx =+,得ˆ7 5.512.28b =+, 则ˆ0.96b =-. 故选:C . 例4.我国5G 技术研发试验在20162018-年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段实施.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐

新高考数学复习基础知识专题讲义22 回归方程和2×2联表(解析版)

新高考数学复习基础知识专题讲义 知识点22 回归方程和2×2联表 知识理解 一.线性关系 1.变量间的相关关系 (1)常见的两变量之间的关系有两类: 一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关. 2.两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程: 是两个具有线性相关关系的变量的一组数据 的回归方程,其中是待定参数. 的计算公式. 注意:回归方程必过样本中心(x,y),这也是做小题的依据和检验所求回归方程是否正确。 (3)相关系数: 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间 几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. 二.独立性检验 y bx a =+1122()()()n n x y x y x y ,,,,,,a b 、 a b 、1 1 22211 ()()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x n x a y bx ====⎧ ---⎪ ⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑

(1)2×2列联表 设X ,Y 为两个变量,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)如下: (2)独立性检验 利用随机变量K 2 (也可表示为χ2 )的观测值22 n(ad bc)K (a b)(c d)(a c)(b d) -=++++(其中n =a +b +c +d 为 样本容量)来判断“两个变量有关系”的方法称为独立性检验. 考向一 一次线性关系 【例1-1】(2021·山东高三专题练习)某工厂的每月各项开支x 与毛利润y (单位:万元)之间有如下关系,y 与x 的线性回归方程 6.5y x a =+,则a =( ) A .17.5 B .17 C .15 D .15.5 【答案】A 【解析】由题意,根据表中的数据,可得2456855x ++++= =,3040605070 505 y ++++==, 即样本中心为(5,50),代入y 与x 的线性回归方程为 6.5y x a =+,解得17.5a =.故选:A . 【例1-2】(2021·全国高三专题练习)西尼罗河病毒(WNV )是一种脑炎病毒,WNV 通常是由鸟类携 考向分析

2020年高考数学一轮复习专题6.5相关系数及回归方程练习(含解析)

6.5 相关系数及回归方程 两个变量间的相关关系: ①有关概念:相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.如果一个变量的值由小变大时另一个变量的值由小变大,这种相关称为正相关;如果一个变量的值由小变大时另一个变量的值由大变小,这种相关称为负相关;如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系. ②回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数. 的计算公式. 考向一 样本中心 【例1-1】某种产品的广告费支出与销售额之间有如下对应数据(单位:百万元),根据下表求出关 于的线性回归方程为,则表中的值为( ) A. B. C. D. y bx a =+1122()()()n n x y x y x y ,, ,,,,a b 、a b 、1 1 2221 1 ()()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x n x a y bx ====⎧ ---⎪ ⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑x y y x 6.5175ˆ.y x =+a 505456.564

【答案】B 【解析】根据规律知道回归直线一定过样本中心,故得到,将坐标代入方程 得到的值为.故答案为:B. 【例1-2】已知表中数据y 与x 有较好的线性关系,通过计算得到y 关于x 的线性回归方程为ˆˆ1.05y x a =+,则相应于下列各点的残差中绝对值最小的是( ) A .(2,4) B .(4,6) C .(8,10) D .(10,12.5) 【答案】D 【解析】 ˆˆˆ6,8.3,8.3 1.056,2, 1.052x y a a y x ==∴=⨯+∴=∴=+, 相应于点(2,4),(4,6),(8,10),(10,12.5)的残差分别为0.1,0.2,0.4,0---,故选D. 【举一反三】 1.“关注夕阳、爱老敬老”—某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x 年(2013年是第一年)与捐赠的现金y (万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程 .ˆ035y mx =+,则预测2019 年捐赠的现金大约是( ) A .5万元 B . 5.2万元 C .5.25万元 D .5.5万元 【答案】C 5,196x y a ==+6.5175ˆ.y x =+a 54

相关文档
最新文档