第三章1.3可线性化的回归分析

第三章1.3可线性化的回归分析
第三章1.3可线性化的回归分析

1.3 可线性化的回归分析

[学习目标]

1.进一步体会回归分析的基本思想.

2.通过非线性回归分析,判断几种不同模型的拟合程度.

[知识链接]

1.有些变量间的关系并不是线性相关,怎样确定回归模型?

答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之间的关系,这时可以根据已有函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.

2.如果两个变量呈现非线性相关关系,怎样求出回归方程?

答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.

[预习导引]

1.非线性回归分析

对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.

2.非线性回归方程

曲线方程曲线图形公式变换变换后的线性函数

y=ax b

c=ln a

v=ln x

u=ln y

u=c+bv

y=a e bx

c=ln a

u=ln y

u=c+bx

y=a e

b

x

c=ln a

v=

1

x

u=ln y

u=c+bv

y=a+b

ln x

v=ln x u=y

u=a+bv

要点一线性回归分析

例1 某产品的广告费用x与销售额y的统计数据如下表:

广告费用x(万元)423 5

销售额y(万元)49263954

(1)由数据易知y与x具有线性相关关系,若b=9.4,求线性回归方程y=a+bx;

(2)据此模型预报广告费用为4万元时的销售额.

解(1)x-=

4+2+3+5

4

=3.5,y-=

49+26+39+54

4

=42,

∴a=y--b x-=42-9.4×3.5=9.1

∴回归直线方程为y=9.1+9.4x.

(2)当x=4时,y=9.1+9.4×4=46.7,

故广告费用为6万元时销售额为46.7万元.

跟踪演练1 为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2006年2011年的情况,得到了下面的数据:

(1)对变量x,y进行相关性检验;

(2)据气象预测,该地区在2012年3月下旬平均气温为27 ℃,试估计2012年4月化蛹高峰日为哪天.

解制表.

(1)r=

∑6

i=1

x i y i-6x-y-

(∑6

i=1

x2i-6x-2)(∑6

i=1

y2i-6y-2)

≈-0.949 8.

由|r|>0.75,可知变量y和x存在很强的线性相关关系.

(2)b=1 222.6-6×29.13×7.5

5 130.92-6×29.132

≈-2.3,a=y--bx-≈74.5.所以,线性回归方程为

y=74.5-2.3x.当x=27时,y=74.5-2.3×27=12.4.据此,可估计该地区2012年4月12日或13日为化蛹高峰日.

要点二可线性化的回归分析

例2 在一化学反应过程中,化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组观测数据列于表中:

催化剂的量x/g1518212427303336 化学物质的反应速度y(g·min-

1)

6830277020565350 解根据收集的数据,作散点图(如图),根据已有的函数知识,可以发现样本点分布在某一条指数函数曲数y=c1e c2x的周围,其中c1和c2是待定的参数.令z=ln y,则z=ln y=ln c1+c2x,

即变换后的样本点应该分布在直线z=a+bx(a=ln c1,b=c2)的周围.

由y与x的数据表可得到变换后的z与x的数据表:

x 1518212427303336

z 1.792 2.079 3.401 3.296 4.248 5.323 4.174 5.858

作出z与x的散点图(如图).

由散点图可观察到,变换后的样本点分布在一条直线的附近,所以可用线性回归方程来拟合.

由z与x的数据表,可得线性回归方程:

z=0.848+0.81x,

所以y与x之间的非线性回归方程为

y=e-0.848+0.81x.

规律方法可线性化的回归分析问题,画出已知数据的散点图,选择跟散点拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.

跟踪演练2 电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=A e bt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:

t/s012345678910

U/V10075554030201510105 5

试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)

解对U=A e bt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,则y=a+bx,得y与x的数据如下表:

x 012345678910

y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6

根据表中数据作出散点图,如下图所示,从图中可以看出,y与x具有较强的线性相关关系,由表中数据求得x-=5,y-≈3.045,进而可以求得b≈-0.313,a=y--bx-=4.61,所以y对x的线性回归方程为y=4.61-0.313x.

由y=ln U,得U=e y,U=e4.61-0.313x=e4.16·e-0.313x,因此电压U对时间t的回归方程为U=e4.61·e-0.313x.

要点三非线性回归模型的综合应用

例3 某地区不同身高的未成年男性的体重平均值如下表:

身高

60708090100110

x/cm

体重y/kg 6.137.909.9912.1515.0217.50

身高

120130140150160170

x/cm

体重y/kg20.9226.8631.1138.8547.2555.05

试建立y与x之间的回归方程.

解根据题干表中数据画出散点图如图所示.

由图看出,样本点分布在某条指数函数曲线y=c1e c2x的周围,于是令z=ln y. x 60708090100110120130140150160170

z

1.8

1

2.0

7

2.3

2.5

2.7

1

2.8

6

3.0

4

3.2

9

3.4

4

3.6

6

3.8

6

4.0

1 画出散点图如图所示.

由表中数据可得z与x之间的线性回归方程:z=0.693+0.020x,则有y=e0.693+0.020x.

规律方法根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c1e c2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.

跟踪演练3 对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:

甲y=0.1x+1,

乙y=-0.05x2+0.35x+0.7,

丙y=-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.

解甲模型,当x=1时,y=1.1;当x=2时,y=1.2;

当x =3时,y =1.3;当x =4时,y =1.4. 乙模型,当x =1时,y =1;当x =2时,y =1.2; 当x =3时,y =1.3;当x =4时,y =1.3. 丙模型,当x =1时,y =1;当x =2时,y =1.2; 当x =3时,y =1.3;当x =4时,y =1.35.

观察4组数据并对照知,丙的数学模型更接近于客观实际.

1.在一次试验中,当变量x 的取值分别为1,12,13,1

4时,变量y 的值分别为2,

3,4,5,则y 与1

x

的回归方程为( )

A .y =1x +1

B .y =2

x

+3

C .y =2x +1

D .y =x -1 答案 A

解析 由数据可得,四个点都在曲线y =1

x

+1上.

2.某种产品的广告费支出与销售额(单位:百万元)之间有如下对应数据:

广告费 2 4 5 6 8 销售额

30

40

60

50

70

则广告费与销售额间的相关系数为( ) A .0.819 B .0.919 C .0.923 D .0.95 答案 B

3.根据统计资料,我国能源生产发展迅速.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:

年份1996200120062011

产量12.916.119.322.3

根据有关专家预测,到2020年我国能源生产总量将达到27.6亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种( )

A.y=ax+b(a≠0) B.y=ax2+bx+c(a≠0)

C.y=a x(a>0且a≠1) D.y=log a x(a>0且a≠1)

答案 A

4.某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是__________.

x/万元24568

y/万元3040605070

答案(6,50)

一、基础达标

1.下表提供了某厂节能降耗技术改造后生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据.根据表中提供的数据,求出y关于x的线性回归方程是y=0.7x+0.35,那么表中t的值是( )

x 345 6

y 2.5t 4 4.5

A.4.5 B .4 C .3 D .3.15

答案 C

2.下列数据x ,y 符合哪一种函数模型 ( )

x 1 2 3 4 5

6 7 8

9

10 y

2

2.69 3

3.38 3.6 3.8

4

4.08 4.2

4.3

A.y =2+1

3x

B .y =2e x

C .y =2e 1

x

D .y =2+ln x

答案 D

解析 取x =1,2,…,10分别代入各解析式判断. 3.指数曲线y =a e bx 的图像为

( )

答案 B

解析 ∵y =a e bx ,∴a >0时y >0,排除A 、C ,且x ∈R ,排除D ,选B. 4.为研究广告费用x 与销售额y 之间的关系,有人抽取了5家餐厅,得到的数据如下表:

广告费用x /千

元 1.0 4.0 6.0 10.0 14.0

销售额y /千元

19.0 44.0 40.0 52.0 53.0

在同一坐标系中画散点图,直线L:y=24+2.5x,曲线C:y=60x

2+x

,如图所示.更

能表现这组数据之间的关系的是( )

A.直线L

B.曲线C

C.直线L和曲线C都一样

D.无法确定

答案 B

5.已知线性回归方程的斜率的估计值是0.5,样本点的中心为(4.5,5),则线性回归方程是__________.

答案y=2.75+0.5x

解析在回归方程中,已知b=0.5,则a=y--b·x-=2.75.

6.对于回归方程y=257+4.75x,当x=28时,y的估计值是__________.

答案390

解析当x=28时,y=257+4.75×28=390,∴y的估计值为390.

7.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数读数结果如下.

尿汞含量(x i)246810

消光系数(y i)64138205285360

(1)画出对应数据的散点图;

(2)求线性回归方程;

(3)根据(2)的结果,估计当x i为12 mg/L时的消光系数y i.

解(1)

(2)y=-11.3+36.95x.

(3)当x i=12时代入y=-11.3+36.95x,得y i=432.

二、能力提升

8.观察下图中的4个散点图,适合用线性回归模型拟合其中两个变量的是( )

A.①②B.①③C.②③D.③④

答案 B

解析在研究两个变量之间的关系时,可以根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.这种方法既直观又方便,因而对解决相关性检验问题比较常用.

9.下表是某厂1~4月份用水量(单位:百吨)的一组数据,

由某散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y=-0.7x+a,则a=__________.

答案 5.25

解析x-=2.5,y-=3.5,b=-0.7,

∴a=3.5+0.7×2.5=5.25.

10.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(x-,y-)为坐标原点的坐标系下的散点图中,大多数的点都落在第__________象限.

答案二、四

解析∵r<0时b<0,

∴大多数点落在第二、四象限.

11.在一次抽样调查中测得样本的5个样本点,数值如下表:

试建立y与x之间的回归方程.

解根据散点图可知y与x近似地呈反比例函数关系,设y=k

x,令

t=

1

x,则

y=kt,原数据变为

t 4 2 1 0.5 0.25 y

16

12

5

2

1

由散点图也可以看出y 与t 呈近似的线性相关关系.列表如下:

序号 t i y i t i y i t 2i y 2i 1 4 16 64 16 256 2 2 12 24 4 144 3 1 5 5 1 25 4 0.5 2 1 0.25 4 5

0.25

1

0.25

0.062 5 1

7.75 36 94.25 21.312 5

430

∴t -

=1.55,y -

=7.2.

b =

∑5i =1t i y i

-5t - y -

∑5

i =1t 2

i

-5(t -

)2

≈4.134 4.

a =y -

-b t -

≈0.8.∴y =0.8+4.134t .

∴y 与x 的回归方程是y =0.8+4.134

x

.

12.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.

气温/℃ 26 18 13 10 4 -1 杯数

20

24

34

38

50

64

画出散点图并判断热茶销售量与气温之间是否具有线性相关关系. 解 画出散点图如图所示.

x -

=1

6

(26+18+13+10+4-1)≈11.7,

y -

=1

6

(20+24+34+38+50+64)≈38.3,

∑6

i =1x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1 910, ∑6

i =1x 2i

=262+182+132+102+42+(-1)2=1 286,

∑6i =1

y 2i =202+242+342+382+502+642=10 172, 由r =

∑h i =1x i y i -nx - y -

∑n i =1x 2

i

-nx -

2

∑n i =1y 2

i

-ny -

2

可得r≈0.97.

由于r的值较大,所以x与y具有很强的线性相关关系.

三、探究与创新

13.某地区不同身高的未成年男性的体重平均值如下表:

身高

60708090100110

x/cm

体重y/kg 6.137.909.9912.1515.0217.50

身高

120130140150160170

x/cm

体重y/kg20.9226.8631.1138.8547.2555.05

(1)试建立y与x之间的回归方程;

(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm,体重为82 kg的在校男生体重是否正常?

解(1)根据表中的数据画出散点图(如图所示).

由图可看出,样本点分布在某条指数函数曲线y=c1e c2x的周围,于是令z=ln y,得下表:

X 60708090100110120130140150160170

Z

1.8

1

2.0

7

2.3

2.5

2.7

1

2.8

6

3.0

4

3.2

9

3.4

4

3.6

6

3.8

6

4.0

1 作出散点图如图所示.

由表中数据可得z与x之间的线性回归方程为

z=0.693+0.020x,则有y=e0.693+0.020x.

(2)当x=175时,预测平均体重为

y=e0.693+0.020×175≈66.22,

由于66.22×1.2≈79.47<82,

所以这个男生偏胖.

计量经济学 第三章、经典单方程计量经济学模型:多元线性回归模型

计量经济学第三章、经典单方程计量经济学模型:多元线性回归模型

第三章、经典单方程计量经济学模型:多元线性 回归模型 一、内容提要 本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。 本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。 本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注

意各回归参数的具体经济含义。 本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的2χ分布为检验统计量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。 二、典型例题分析 例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为 . 10+ 36 + = - .0 .0 medu fedu sibs edu210 131 .0 094

可线性化的回归分析

1.2可线性化的回归分析学案备注【学习目标】 1.能直观的判断两个变量是否满足线性相关 2.用非线性的函数关系来描述不好用线性关系刻画的两个 变量之间的关系 【重点、难点】用非线性的函数关系来描述不好用线性关系 刻画的两个变量之间的关系 【自主学习】 1.若两个变量不呈现线性关系,不能直接利用线性回归方程 建立两个变量的相关关系,那我们应如何建立两个变量的 关系?例如bx y=怎么化成线性相关问题解决?(阅读教 ae 材第9页到13页) 2. 在具体问题中,我们首先应该作出原始数据) x , (y 的,从中看出数据的大致规律,再 根据这个规律选择适当的函数进行拟合。 3. 对于非线性回归模型一般可转化为模 型从而得到相应的回归方程。 4.几种能转化为线性回归模型的非线性回归模型 (1)幂函数曲线x ab y=,作变换____________,得线性函数__________________ (2)指数曲线bx ae y=,作变换______________,得线性函数_______________

(3)倒指数曲线x b ae y =,作变换______________得线性函数 ________________ (4)对数曲线x b a y ln +=,作变换_______________得线性函数_____________ 【例题分析】 例1.(1)有5组(x,y )数据(1,3),(2,4),(4,5),(3,10),(10,12),去掉一组______数据后,剩下的四组数据的线性相关系数最大。 (2)已知幂函数曲线b ax y =做线性变换后得到的回归方程为v u 4.02+=,则a=_______,b=__________ 例2.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下: 天数 x /天 1 2 3 4 5 繁殖个数y /个 6 12 25 49 95 (1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)试求出预报变量对解释变量的回归方程.(答案:所求 非线性回归方程为0.69 1.112?y =e x +.) 小结:利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.

第五章 回归分析

第五章回归分析 §1.回归分析的数学模型 1.1.线性统计模型 1.线性回归方程 从一个简单的例子谈起。个人的消费水平Y与他的收入水平X间的关系,大体上可以描述:收入水平高,一般消费水平也高。但Y 和X绝不是简单的线性关系,这从常识便能判别;而且也不是一种确定的数学关系,两个收入水平完全一样的个人,他们的消费水平可能有很大的差异。比较合理的看法是:个人的消费水平Y是一个随机变量,从平均的意义上看,应与收入水平成正比。因此,我们可以给出以下模型: Y = b0 + b1X +ε (1) 其中b0,b1是待定常数,ε是随机变量,且有E(ε)=0,这样就能保证 E(Y) = b0 + b1X (2) 即从平均意义上Y和X线性相关。等式(2)称为变量Y对于变量X的线性回归方程。一般情况下,一个随机变量Y与变量X1,X2,…,X p有关系

Y = b0 + b1X1 + b2X2 + … + b p X p +ε (3) 随机变量ε的期望E(ε)=0,即有: E(Y) = b0+ b1X1 + b2X2+ … + b p X p (4) 从平均意义上,Y与X1,X2,…,X p呈线性关系。(4)式称为变量Y对于变量X1,X2,…,X p的线性回归方程,p=1时,称方程是一元的;p≥2时,称方程是多元的;b0,b1,…,b p称为回归系数。 2.统计模型的假设 设变量Y与X1,X2,…,X p之间有关系(3),对(X1,X2,…,X p,Y)做n 次观察,得到一个容量为n的样本:(x i1,x i2, …,x i p,y i)i=1,2,…,n,按(4)式给出的关系,这些样本观察值应有: y1= b0+ b1x11+ b2x12 + … + b p x1p+ε1 y2= b0+ b1x21+ b2x22 + … + b p x2p+ε2 (5) ………………………………… y n= b0+ b1x n1+ b2x n2 + … + b p x n p+εn 其中的εi, i=1,2,…,n是随机误差,出于数学上推导的需要,假设:1)E(εi)=0,i=1,2,…,n.即观察结果没有系统误差; 2)Var(εi)=σ2,i=1,2,…,n.这个性质叫做方差齐性;

第三章 一元线性回归模型

第三章 一元线性回归模型 一、预备知识 (一)相关概念 对于一个双变量总体),(i i x y ,若由基础理论,变量x 和变量y 之间存在因果关系,或x 的变异可用来解释y 的变异。为检验两变量间因果关系是否存在、度量自变量x 对因变量y 影响的强弱与显著性以及利用解释变量x 去预测因变量 y ,引入一元回归分析这一工具。 将给定i x 条件下i y 的均值 i i i x x y E 10)|(ββ+= (3.1) 定义为总体回归函数(Population Regression Function,PRF )。定义 )|(i i i x y E y -为误差项(error term ),记为i μ,即)|(i i i i x y E y -=μ,这样i i i i x y E y μ+=)|(,或 i i i x y μββ++=10 (3.2) (3.2)式称为总体回归模型或者随机总体回归函数。其中,x 称为解释变量(explanatory variable )或自变量(independent variable );y 称为被解释变量(explained variable )或因变量(dependent variable );误差项μ解释了因变量的变动中不能完全被自变量所解释的部分。误差项的构成包括以下四个部分: (1)未纳入模型变量的影响 (2)数据的测量误差 (3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间可能是非线性关系 (4)纯随机和不可预料的事件。 在总体回归模型(3.2)中参数10,ββ是未知的,i μ是不可观察的,统计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本 n i y x i i ,,2,1),,( =,对(3.1)式进行估计,若10,),|(ββi i x y E 的估计量分别记为^ 1^ 0^ ,,ββi y ,则定义3.3式为样本回归函数 i i x y ^ 1^ 0^ ββ+= (n i ,,2,1 =) (3.3) 注意,样本回归函数随着样本的不同而不同,也就是说^ 1^ 0,ββ是随机变量,它们的随机性是由于i y 的随机性(同一个i x 可能对应不同的i y )与x 的变异共同引起的。定义^ i i y y -为残差项(residual term ),记为i e ,即^ i i i y y e -=,这样 i i i e y y +=^ ,或 i i i e x y ++=^ 1^0ββ (n i ,,2,1 =) (3.4)

2018年陕西省高三数学第1章《统计案例》导学案:1.1.3可线性化的回归分析习题

1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用; 2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法. 3. 了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 一、基础过关 3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为() A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx 4.下列说法错误的是() A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系 B.把非线性回归化为线性回归为我们解决问题提供一种方法 C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系 D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决 5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元

二、能力提升 7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2, 3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70. 下列哪个方程可以较恰当的拟合() A.y=0.771 1x+26.528 B.y=36.958ln x-74.604 C.y=1.177 8x1.014 5 D.y=20.924e0.019 3x 8.已知x,y之间的一组数据如下表: 则y与x之间的线性回归方程y=bx+a必过点________. 9.已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为________. 10.在一次抽样调查中测得样本的5个样本点,数值如下表: 如何建立y与x 11.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示: 求y关于x的回归方程.(保留三位有效数字)

第三章1.3可线性化的回归分析

1.3 可线性化的回归分析 [学习目标] 1.进一步体会回归分析的基本思想. 2.通过非线性回归分析,判断几种不同模型的拟合程度. [知识链接] 1.有些变量间的关系并不是线性相关,怎样确定回归模型? 答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之间的关系,这时可以根据已有函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型. 2.如果两个变量呈现非线性相关关系,怎样求出回归方程? 答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程. [预习导引] 1.非线性回归分析 对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型. 2.非线性回归方程 曲线方程曲线图形公式变换变换后的线性函数

y=ax b c=ln a v=ln x u=ln y u=c+bv y=a e bx c=ln a u=ln y u=c+bx y=a e b x c=ln a v= 1 x u=ln y u=c+bv y=a+b ln x v=ln x u=y u=a+bv 要点一线性回归分析 例1 某产品的广告费用x与销售额y的统计数据如下表: 广告费用x(万元)423 5 销售额y(万元)49263954 (1)由数据易知y与x具有线性相关关系,若b=9.4,求线性回归方程y=a+bx; (2)据此模型预报广告费用为4万元时的销售额. 解(1)x-= 4+2+3+5 4 =3.5,y-= 49+26+39+54 4 =42, ∴a=y--b x-=42-9.4×3.5=9.1

统计学习题集第五章相关与回归分析(0)

所属章节: 第五章相关分析与回归分析 1■在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变量数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为()。 答案: 负相关。干扰项: 正相关。干扰项: 完全相关。干扰项: 非线性相关。 提示与解答: 本题的正确答案为: 负相关。 2■在线性相关中,若两个变量的变动方向相同,一个变量的数值增加,另一个变量数值随之增加,或一个变量的数值减少,另一个变量的数值随之减少,则称为()。 答案: 正相关。干扰项: 负相关。干扰项: 完全相关。干扰项: 非线性相关。 提示与解答:

本题的正确答案为: 正相关。 3■下面的xx中哪一个是错误的()。 答案: 相关系数不会取负值。干扰项: 相关系数是度量两个变量之间线性关系强度的统计量。干扰项: 相关系数是一个随机变量。干扰项: 相关系数的绝对值不会大于1。 提示与解答: 本题的正确答案为: 相关系数不会取负值。 4■下面的xx中哪一个是错误的()。 答案: 回归分析中回归系数的显著性检验的原假设是: 所检验的回归系数的真值不为0。 干扰项: 相关系数显著性检验的原假设是: 总体中两个变量不存在相关关系。 干扰项: 回归分析中回归系数的显著性检验的原假设是:

所检验的回归系数的真值为0。 干扰项: 回归分析中多元线性回归方程的整体显著性检验的原假设是: 自变量前的偏回归系数的真值同时为0。 提示与解答: 本题的正确答案为: 回归分析中回归系数的显著性检验的原假设是: 所检验的回归系数的真值不为0。 5■根据你的判断,下面的相关系数值哪一个是错误的()。 答案: 1.25。干扰项:-0.86。干扰项: 0.78。干扰项:0。 提示与解答: 本题的正确答案为: 1.25。 6■下面关于相关系数的陈述中哪一个是错误的()。 答案: 数值越大说明两个变量之间的关系越强,数值越小说明两个变量之间的关系越弱。 干扰项:

第三章回归分析原理

第三章 回归分析原理 3·1、一元线性回归数学模型 按理说,在研究某一经济现象时,应该尽量考虑到与其有关各种有影响的因素或变量。但作为理论的科学研究来说,创造性地简化是其的基本要求,从西方经济学的基本理论中,我们可以看到在一般的理论分析中,至多只包含二、三个 变量的数量关系的分析或模型。 这里所讨论的一元线性回归数学模型,是数学模型的最简单形式。当然要注意的是,这里模型讨论是在真正回归意义上来进行的,也可称之为概率意义上的线性模型。 在非确定性意义上,或概率意义上讨论问题,首先要注意一个最基本的概念或思路问题,这就是总体和样本的概念。 我们的信念是任何事物在总体上总是存在客观规律的,虽然我们无论如何也不可能观察或得到总体,严格说来,总体是无限的。而另一方面,我们只可能观察或得到的是样本,显然样本肯定是总体的一部分,但又是有限的。 实际上概率论和数理统计的基本思想和目的,就是希望通过样本所反映出来的信息来揭示总体的规律性,这种想法或思路显然存在重大的问题。但另一方面,我们也必须承认,为了寻找总体的规律或客观规律,只能通过样本来进行,因为我们只可能得到样本。 在前面我们已经知道,用回归的方法和思路处理非确定性问题或散点图,实际上存在一些问题,亦即只有在某些情况下,回归的方法才是有效的。因此,在建立真正回归意义上建立其有效方法时,必须作出相应的假设条件。 基本假设条件: (1)假设概率函数)|(i i X Y P 或随机变量i Y 的分布对于所有i X 值,具有相同的方差2σ ,且2σ 是一个常数,亦即)(i Y Var =)(i Var μ=2σ。 (2)假设i Y 的期望值)(i Y E 位于同一条直线上,即其回归直线为 )(i Y E =i X βα+ 等价于 0)(=i E μ 这个假设是最核心的假设,它实际上表明)(i Y E 与i X 之间是确定性的关系。 (3)假设随机变量i Y 是完全独立的,亦即。j i u u Cov Y Y Cov j i j i ≠==,0),(),(

(新)高中数学第三章统计案例1_3可线性化的回归分析知识导航北师大版选修2-3

1.3可线性化的回归分析 自主整理 1.在具体问题中,我们首先应该作出原始数据(x,y)的________________,从_____________中看出数据的大致规律,再根据这个规律选择适当的参数进行拟合. 2.对于非线性回归模型一般可转化为_________________,从而得到相应的回归方程. 高手笔记 1.幂函数曲线y=ax b .作变换μ=lny,v=lnx c=lna,得线性函数μ=c+bv. 2.指数曲线y=ae bx .作变换μ=lny,c=lna,得线性函数μ=c+bx. 3.倒指数曲线y=ae bx .作变换μ=lny,c=lna,v= x 1 ,得线性函数μ=c+bv. 4.对数函数y=a+blnx.作变换v=lnx ,得线性函数y=a+bv. 名师解惑 如何根据原始数据求拟合函数? 剖析:(1)可先由原始数据作散点图. (2)对于一些函数模型的图形要熟悉. 如:①幂函数y=ax b 型的图象为: ②指数曲线y=ae bx (3)倒指数曲线y=ae bx (4)对数曲线y=a+blnx (3)由散点图找出拟合函数的类型. (4)将非线性函数转化为线性函数.

(5)求出回归方程. 讲练互动 【例1】某地今年上半年患某种传染病人数y 与月份x 之间满足函数关系模型为y=ae bx ,确定这个函数解析式. 分析:函数模型为指数型函数,可转化为线性函数,从而求出. 解:设μ=lny,c=lna ,则μ=c+bx. ∑=6 1 i xi =21,∑=6 1 i i μ =25.359 5, ∑=6 1 i xi 2 =91,∑=6 1 i i μ 2 =107.334, ∑=6 1 i i i x μ =90.341 3,x =3.5, μ=4.226 58, b= 2 2 6 1 26 1 1 5 .369122658.45.363413.9066?-??-= --∑∑==i i i i x x x x μ μ =558412 .1=0.09, c=μ-b x =4.226 58-0.09×3.5=3.911 58, ∴μ=3.911 58+0.09x. ∴y=e 3.911 58·e 0.09x . 绿色通道:基础模型为指数型,可两边取对数转化为线性函数关系,求出回归方程.. 变式训练 1.某工厂今年第一季度生产某种产品的数量分别是1万件、1.2万件、1.3 万件、1.37万件, 为了估测以后每个月的产量,可用函数y=ae bx 来模拟该产品的月产量y 与月份x 的关系,求模拟函数. ∑=4 1i i x =10, ∑=4 1 i i μ =0.759 5, ∑=4 1 i i x 2 =30, ∑=4 1 i i μ 2 =0.201 2, ∑=4 1 i i x μi =2.411,x =2.5,μ=0.189 9,

第三章一元线性回归分析

第三章 一元线性回归 一元线性回归分析的对象是两个变量的单向因果关系,模型的核心是两变量线性函数,分析方法是回归分析。一元线性回归是经典计量经济分析的基础。 第一节 一元线性回归模型 一、变量间的统计关系 社会经济现象之间的相互联系和制约是社会经济的普遍规律。在一定的条件下,一些因素推动或制约另外一些与之联系的因素发生变化。这种状况表明在经济现象的内部和外部联系中存在着一定的因果关系,人们往往利用这种因果关系来制定有关的经济政策,以指导、控制社会经济活动的发展。而认识和掌握客观经济规律就要探求经济现象间经济变量的变化规律。 互有联系的经济变量之间的紧密程度各不相同,一种极端的情况是一个变量能完全决 定另一个变量的变化。比如:工业企业的原材料消耗金额用y 表示,生产量用1x 表示,单位产量消耗用2x 表示,原材料价格用3x 表示,则有:123y x x x =。这里,y 与123,,x x x ,是一种确定的函数关系。 然而,现实世界中,还有不少情况是两个变量之间有着密切的联系,但它们并没有密切到由一个可以完全确定另一个的程度。 例如:某种高档费品的销售量与城镇居民的收入;粮食产量与施肥量之间的关系;储蓄额与居民的收入密切相关。 从图示上可以大致看出这两种关系的区别:一种是对应点完全落到一条函数曲线上;另一种是并不完全落在曲线上,而有的点在曲线上,有的点在曲线的两边。对于后者这种不能用精确的函数关系来描述的关系正是计量经济学研究的重要内容。 二、一元线性回归模型 1.模型的建立 一个例子,见教材66页: 总体回归模型:01i i i Y X ββε=++ 理解:(1)误差的随机性使得Y 和X 之间呈现一种随机的因果关系;(2)Y i 的取值由两部分组成,一类是系统内影响,一类是系统外影响。 样本回归直线:01i i Y X ββ=+ 样本回归模型:01i i i Y X e ββ=++ 2.模型的假设 (1) 误差项i ε的数学期望无论I 取什么值都是零。 (2) 误差项i ε的方差为常数2 σ (3) 误差项i ε对于I 的取值不同,不相关。 (4) 解释变量X 是确定性的变量,而非随机变量。 (5) 误差项i ε服从正态分布。

应用回归分析第三版·何晓群-第三章所有习题答案

应用回归分析第三章习题 3.1 y x =β 基本假定: (1) 诸1234n x ,x x ,x x ……非随机变量,rank (x )=p+1,X 为满秩矩阵 (2) 误差项()()200i i j E ,i j cov ,,i j ?ε=? ?δ=?εε=??≠?? (3)()2 0i i j ~N ,,?εδ??εε??诸相互独立 3.2 ()10111 ?X X X X |rank(X X )p rank(X )p n p -'β'≠'=+≥+≥+存在,必须使存在。即|则必有故 3.3 ()()()() ()22 11 122 12 22211111111 n n n i i ii i i i n ii i n i i E e D e h n h n p ?E E e n p n p n p =====??==-δ ????? =-δ=--δ ??? ??∴δ ==--δ=δ ? ----??∑∑∑∑∑ 3.4 并不能这样武断地下结论。2 R 与回归方程中的自变量数目以及样本量n 有关,当样本量n 与自变量个数接近时,2 R 易接近1,其中隐含着一些虚假成分。因此,并不能仅凭很大的2 R 就模型的优劣程度。 3.5 首先,对回归方程的显著性进行整体上的检验——F 检验 001230p H :β=β=β=β==β=……

接受原假设:在显著水平α下,表示随机变量y 与诸x 之间的关系由线性模型表示不合适 拒绝原假设:认为在显著性水平α下,y 与诸x 之间有显著的线性关系 第二,对单个自变量的回归系数进行显著性检验。 00i H :β= 接受原假设:认为i β=0,自变量i x 对y 的线性效果并不显著 3.6 原始数据由于自变量的单位往往不同,会给分析带来一定的困难;又由于设计的数据量较大,可能会以为舍入误差而使得计算结果并不理想。中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。 3.7 11 22 011122201122p p p p p p p ?????y x x x ??????y y (x x )(x x )(x x )????y x x )x x )x x )y =β +β+β++β-=β+β-+β-++β--ββ=-+-++-=对最小二乘法求得一般回归方程: ……对方程进行如下运算: …… ……*j j ?+β=……即 3.8 121321233132212312212331 312311232332 13 231313********* 111 r r r r r r r r r r r r r r r r r r r r r ?? ?= ? ????==-?= =-?= =-即证

应用回归分析第三版·何晓群-第三章所有习题答案

应用回归分析第三章习题 3.1 基本假定: (1) rank (x )=p+1,X 为满秩矩阵 (2 (3 3.2 3.3 3.4 n 有关,当样本量n 1,其中隐含着一些虚假成分。因此,就模型的优劣程度。 3.5 首先,对回归方程的显著性进行整体上的检验——F 检验

接受原假设:在显著水平α下,表示随机变量 y与诸x之间的关系由线性模型表示不合适 拒绝原假设:认为在显著性水平α下,y与诸x之间有显著的线性关系 第二,对单个自变量的回归系数进行显著性检验。 y的线性效果并不显著 3.6 原始数据由于自变量的单位往往不同,会给分析带来一定的困难;又由于设计的数据量较大,可能会以为舍入误差而使得计算结果并不理想。中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。 3.7 3.8

3.9 由上两式可知,j个因素的重要程度, 3.10 【没整出来……】 3.11 (1)计算可知,y与x1 x2 x3 的相关关系是:

则相关关系矩阵如下: (3)拟合优度检验

决定系数R2=0.708 R=0.898较大所以认为拟合度较高 (4)对回归方正作整体显著性检验 ANOVA b Model Sum of Squares df Mean Square F Sig. 1Regression13655.37034551.7908.283.015a Residual3297.1306549.522 Total16952.5009

ANOVA b Model Sum of Squares df Mean Square F Sig. 1Regression13655.37034551.7908.283.015a Residual3297.1306549.522 Total16952.5009 a. Predictors: (Constant), 居民非商品支出x3, 工业总产值x1, 农业总产值x2 b. Dependent Variable: 货运总量y F=8.283 取α=0.05时 P=0.015<0.05所以认为回归方程在整体上拟合的好 (5)对每个回归系数作显著性检验 α=0.05时,x3并未通过显著性检验

第三章-K元线性回归模型

第三章 K 元线性回归模型 一、填空题 1. 对于模型i ik k i i i u X X X Y +++++=ββββΛ22110,i=1,2,…,n ,一般经验认为,满足模型估计的基本要求的样本容量为_ _ 2. 对于总体线性回归模型i i i i i u X X X Y ++++=3322110ββββ,运用最小二乘法欲得到参数估计量,所要求的最小样本容量n 应满足 或至少_________。 3. 多元线性计量经济学模型的矩阵形式 ,对应的样本线性回归模型的矩阵形式 ,模型的最小二乘参数估计量 及其方差估计量 。 4. 总平方和可以分解为 回归平方和 和 残差平方和 ,可决系数为 。 5. 多元回归方程中每个解释变量的系数β(偏回归系数),指解释变量变化一个单位引起的被解释变量平均变化 β 个单位。 6. 线性模型的含义,就变量而言,指的是回归模型变量的 ;就参数而言,指的是回归模型中参数的 。通常线性回归模型指的是 。 二、问答题 1. 什么是多元回归模型?它与一元、二元回归模型有何区别? 2. 极大似然法(maximum likehood )的原理是什么? 3. 什么是拟合优度(R 2)检验?有什么作用? 指对样本回归直线与样本观测值之间的拟合程度的检验。 4. 可决系数R 2低的可能的原因是什么? 5. 多元回归的判断系数R 2具有什么性质?运用R 2时应注意什么问题? 6. 多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有 效性的过程中,哪些基本假设起了作用? 7. 说明区间估计的含义。 三、实践题 1.下表给出三变量模型的回归结果: 方差来源 平方和(SS ) 自由度(d.f.) 均方差(MSS) 回归平方和(ESS) 65965 3 21988.33 残差平方和(RSS) 77 11 7 总平方和(TSS) 66042 14 4717.48

第三章 多元线性回归模型(Stata)

一、邹式检验(突变点检验、稳定性检验) 1.突变点检验 1985—2002年中国家用汽车拥有量(t y ,万辆)与城镇居民家庭人均可支配收入(t x ,元),数据见表6.1。 表6.1 中国家用汽车拥有量(t y )与城镇居民家庭人均可支配收入(t x )数据 年份 t y (万辆) t x (元) 年份 t y (万辆) t x (元) 1985 28.49 739.1 1994 205.42 3496.2 1986 34.71 899.6 1995 249.96 4283 1987 42.29 1002.2 1996 289.67 4838.9 1988 60.42 1181.4 1997 358.36 5160.3 1989 73.12 1375.7 1998 423.65 5425.1 1990 81.62 1510.2 1999 533.88 5854 1991 96.04 1700.6 2000 625.33 6280 1992 118.2 2026.6 2001 770.78 6859.6 1993 155.77 2577.4 2002 968.98 7702.8 下图是关于t y 和t x 的散点图: 从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破

4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。 H0:两个字样本(1985—1995年,1996—2002年)相对应的模型回归参数相等H1:备择假设是两个子样本对应的回归参数不等。 在1985—2002年样本范围内做回归。 在回归结果中作如下步骤(邹氏检验): 1、Chow 模型稳定性检验(lrtest) 用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化 * 估计前阶段模型 * 估计后阶段模型

第三章 多元线性回归模型

第一章多元线性回归模型 前一章讲的简单线性回归模型,主要讨论的是一个应变量和一个解释变量之间的线性关系。而在实际的经济问题中,一个经济变量往往同多个经济变量相联系。比如,我们前面一直在举的例子:说消费支出与收入有关,而在实际生活中,消费支出同时又会与家庭的财富总量有关,还可能会与所处的年龄段、性别、所受教育程度等因素有关。所以,我们有必要将一个解释变量的情况推广到多个解释变量。利用多元回归方法进行分析/ 第一节多元线性回归模型及古典假定 一、多元线性回归模型 1、多元线性回归模型的一般形式: 总体回归方程:E(Y│X1,X2,…Xk)=β0+β1X1+β2X2+β3X3+…+βkXk Y=β0+β1X1+β2X2+β3X3+…+βkXk+μ 样本回归方程:Y=β0+β1X1+β2X2+β3X3+…+βkXk Y=β0+β1X1+β2X2+β3X3+…+βkXk+e 2、回归系数的经济意义: 简单线性回归中的回归系数的经济意义:如 Y=50.78+0.86X 系数代表每增加一元收入,消费支出要增加0.86元 多元线性回归中的回归系数的经济意义:由于多个解释变量会同时对应变量的变动发挥作用,因此,如果我们要考察其中某个解释变量对应变量的影响,就必须使其他解释变量保持不变来进行分析.所以,模型中的单个回归系数βj就表示当控制其他解释变量不变的条件下,第j个解释变量的单位变动对应变量均值的影响. 多元线性回归模型中这样的回归系数,称为偏回归系数。 与简单线性回归分析一样,多元线性回归分析要解决的主要问题仍是:根据观测样本估计模型中的各个参数;对估计的参数及回归方程进行统计检验;利用回归模型进行预测和经济分析。 二、模型的古典假定 在回归分析中,为了使所作出的估计具有较好的统计性质,我们对模型中的随机扰动项和解释变量作出一些假定。 多元线性回归模型的假定条件有: 假定1:零均值假定: 即假定随机扰动项彻底均值为零E(μi)= 0 假定2:同方差假定: μi 的方差为某个相同的常数Var(μi)=σ2 假定3:无自相关假定: 随机扰动项μi的逐次值互不相关 Cov(μi , μj )=0 (i≠j) 假定4:随机扰动项μi与解释变量Xi 不相关。 Cov(μi ,Xi )=0 假定5:正态性假定,即假定μi服从均值为零、方差为σ2的正态分布u~ N (0, σ2) 假定6:无多重共线性假定:即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。(这是多元线性回归模型与简单线性回归模型基本假定的区别) 多元线性回归模型参数所采用的最小二乘法估计思路以及估计的性质都与简单线性回归模型参数的估计是类似的,由于采用了矩阵,计算过程比较复杂,我们就省略了,因为实际操作过程中,这部分可以由软件代劳了。 第二节多元线性回归模型的检验 一、拟合优度检验 在简单线性回归模型中,我们用可决系数r2来衡量估计模型对观测值的拟合程度。在多元线性回归模型中,我们也需要讨论所估计的模型对观测值的拟合程度。 1、多重可决系数 R2=ESS/TSS=1—RSS/TSS 大小意义 在应用过程中,人们发现R2的大小对于解释变量的数目容易作出灵敏的反映。也就是说,随着模型中解释变量的增多,多重可决系数的值往往会变大,从而增加模型的解释功能。这给人们一个错觉:要使模型拟合得好,就必须增加解释变量。

第三章 1.3可线性化的回归分析

1.3可线性化的回归分析 [学习目标] 1.进一步体会回归分析的基本思想. 2.通过非线性回归分析,判断几种不同模型的拟合程度. [知识链接] 1.有些变量间的关系并不是线性相关,怎样确定回归模型? 答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之间的关系,这时可以根据已有函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型. 2.如果两个变量呈现非线性相关关系,怎样求出回归方程? 答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程. [预习导引] 1.非线性回归分析 对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型. 2.非线性回归方程

要点一 线性回归分析 例1 某产品的广告费用x 与销售额y 的统计数据如下表: (1)由数据易知y 与x 具有线性相关关系,若b =9.4,求线性回归方程y =a +bx ; (2)据此模型预报广告费用为4万元时的销售额. 解 (1)x -=4+2+3+54=3.5,y - =49+26+39+54 4 =42, ∴a =y - -b x - =42-9.4×3.5=9.1 ∴回归直线方程为y =9.1+9.4x . (2)当x =4时,y =9.1+9.4×4=46.7, 故广告费用为6万元时销售额为46.7万元. 跟踪演练1 为了研究3月下旬的平均气温(x )与4月20日前棉花害虫化蛹高峰日(y )的关系,某地区观察了2006年2011年的情况,得到了下面的数据: (1)对变量x ,y 进行相关性检验; (2)据气象预测,该地区在2012年3月下旬平均气温为27 ℃,试估计2012年4月化蛹高峰日为哪天.

应用回归分析第三章课后习题整理

应用回归分析第三章课 后习题整理 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

3.1=??????? ??yn y y 21 ? ?111 12111xn x x 22212xn x x ???????xnp p x p x 21 ??????? ??p βββ 10 +? ?????? ??n εεε 21即y=x β+ε 基本假定 (1)解释变量x1,x2...,xp 是确定性变量,不是随机变量,且要求rank(X)=p+1

1 )())1((11)1(11)1(11)(11]))(()([11)(11)(11)11()(21)(1 2221112112 1 12 1 2 22222 +===?+-?--=---=---=--=+--=--=--=--=++=-=∑∑∑∑∑∑∑∑∑========∧=∧ p h H tr p n p n h p n h p n e D p n e E e D p n e E p n e E p n SSE p n E E en e e y y SSE n n n n n n n n n τττττττττττττττττττττσσσσσ注 3.4不能断定这个方程一定很理想,因为样本决定系数与回归方程中自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较多,使样本量与自变量的个数接近时,2R 易接近1,其中隐藏一些虚假成分。 3.5当接受H 0时,认定在给定的显着性水平α下,自变量 x1,x2, xp 对因变量y 无显着影响,于是通过x1,x2, xp 去推断y 也就无多大意义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描述,而误用了线性模型,使得自变量对因变量无显着影响;另一方面可能是在考虑自变量时,把影响因变量y 的自变量漏掉了,可以重新考虑建模问题。 当拒绝H 0时,我们也不能过于相信这个检验,认为这个回归模型已经完美了,当拒绝H 0时,我们只能认为这个模型在一定程度上说明了自变量x1,x2, xp 与自变量y 的线性关系,这时仍不能排除排除我们漏掉了一些重要的自变量。 3.6中心化经验回归方程的常数项为0,回归方程只包含p 个参数估计值p ∧ ∧ ∧ βββ ,,21比一般的经验回归方程减少了一个未知参数,在变

可线性化的回归分析(作业)

第 页 共 页 §3 可线性化的回归分析 1.散点图在回归分析过程中的作用是( ) A.查找个体个数 B.比较个体数据大小关系 C.探究个体分类 D.粗略判断变量是否线性相关 2.指数曲线bx ae y =作线性变换后得到的回归方程为x u 6.01-=,则函数a bx x y ++=2的单调增区间为( ) ),0.(+∞A ),103.(+∞B ),2 1 .(+∞C ),1.(+∞D 3.已知线性回归方程801.05.0-=x y ,则当25=x 时,y 的估计值是 4.已知两个变量y x ,的关系可以近似地用函数bx ax y =来表示,通过变换后得到一个线性函数.利用最小二乘法得到的线性回归方程为x u 5.02+=,则y x ,的近似函数关系式为 5.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 检验每册书的成本费y 与印刷册数的倒数1 x 之间是否具有线性相关关系,如有,求出y 对x 的回 归方程。 6.一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程,并预测当温度为C ?37时红铃虫的产卵数. 温度C x ?/ 21 23 25 27 29 32 35 产卵数/y 个 7 11 21 24 66 115 325 7.在彩色显像中,根据以往的经验,知道染料光学密度y 与析出银的光学密度x 之间有如下函数关系:)0(<=b ae y x b . 我们通过11次试验得到如下数据: x 0.05 0.06 0.07 0.10 0.14 0.20 0.25 0.31 0.38 0.43 0.47 y 0.10 0.14 0.23 0.37 0.59 0.79 1.00 1.12 1.19 1.25 1.29 试通过拟合,确定函数的参数,并预测当析出银的光学密度为0.50时形成染料的光学密度. 教师评价: 高高二二理理科科数数学学 选选修修22——33《统计案例》 编号:2G10SX0029 编写:朱月卿 审核:管育华 编写时间:2012年3月 _____ 班___________ 作 业 50 100 150 200 250 300 350 0 3 6 9 12 15 18 21 24 27 30 33 36 39

相关文档
最新文档