计量经济学讲义-6--第四章 检验(补充)

计量经济学讲义-6--第四章 检验(补充)
计量经济学讲义-6--第四章 检验(补充)

第四章 检验

9.1 检验问题

9.1.1 一个例题

9.1.2 有关检验的两种错误

第一类错误(type one error ) : 第二类错误 (type two error) : 9.1.3 假设检验的手续

第一步:建立原假设和备择假设; 第二步:构筑检验统计量;

第三步:根据有意水准,查出临界值; 第四步: 比较第二步和第三步的结果。 9.1.4 两种错误之间的关系

9.2 比率检验

比率检验问题基于样本比率n

x

p

=?进行检验。 9.2.1 比率检验

例题: 一种新药,它的宣传广告上说具有80%的病人用过以后会有效果。现在让150人试用,结果109人觉得有效果。这个广告宣传的正确与否?

已知:样本指标 150,150

109

==

=n n x p 总体指标 %80=π

两侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。

%80:0===πn x p H ;%80:1≠=n

x

p H .

第二步:构筑检验统计量。

知道总体的期望和方差,可以直接使用正态分布。

25.2)

1(%

80-=--=

n

p z ππ

这个检验统计量在原假设成立的情况下,应该服从

()??? ?

?-n N p πππ1,~。

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的z ,得到96.1=z

第四步: 比较第二步和第三步的结果。

25.2)

1(%

80-=--=

n

p z ππ<-1.96

=====> 我们无法接受原假设。

9.2.2 比率差的检验

目的:检验两个母体具有某种特性的比例是否相等,它们的均值是否相等,或者属于同一母体。

一般来说,两个样本之间会有一定的差距,我们关心的是这个差距是由总体不同而带来的,还是由抽样过程中产生的误差所致?

一般,假设样本1:11,?n p

;样本2:22,?n p 。在21,n n 很大的时候,()

221,~??σμN p p -,其中,21p p -=μ,1p 为总体1的期望,2p 为总体2的期望;()()2

22111211n p p n p p -+

-=

σ。 例题:想检验性别问题对《物权法》的支持程度。现在抽取1200名男性人

大代表,发现有432名支持《物权法》;抽取900名女性人大代表,发现有276名支持。请问支持率与性别有关系吗?

已知:样本指标 900

276?,2001432?==女男p p

A . 两侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。

210:p p H = ; 211:p p H ≠ 。

第二步:构筑检验统计量。

没有总体的期望和方差,本应该使用t 分布,但样本数很大,所以还是使用正态分布。

在210:p p H =正确的基础上,())1

1(

12

12n n p p +-=σ,其中,900

1200276

4322121++=

++=

n n x x p 。 ()()56.211121

212

2

11=?

???

??-----=n n p p p p n x n x z

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。

查书后面的标准正态分布,得到96.1=z 第四步: 比较第二步和第三步的结果。 56.2〉1.96

=====> 我们无法接受原假设。

9.3 平均值的检验

平均值检验问题是基于样本均值x 的分布而进行的检验。如果总体服从于正态分布的话,样本的均值就服从于正态分布;如果总体不服从于正态分布的话,在样本数很大的情况下,样本的均值也渐进地服从于正态分布。

9.3.1 根据正规分布进行平均值的检验

条件:总体方差是已知的,或者虽然不知道总体方差,但是样本数很大。

???

? ?

?n

N x 2

,~σμ 情况A 总体方差知道。

例题:一家工厂生产直径为1厘米的轴承,按标准偏差为0.03厘米进行管理。一天,从产品中抽取10个产品作样品,测定的结果是:样本平均直径为0.978厘米。可不可以认为产品质量上出现异常?

已知: 总体指标 cm SD cm 03.0,1==μ ; 样本指标 cm x 978.0=

两侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。

μ=x H :

0 ; μ≠x H :

1 。

第二步:构筑检验统计量。

在0H 正确的基础上, 32.22

-=-=

n

x z σ

μ

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。

查书后面的标准正态分布,得到96.1=αz 第四步: 比较第二步和第三步的结果。

-2.32 < -1.96

=====> 我们无法接受原假设。

说明产品质量上出现了异常。

情况B 总体方差未知,但是样本很大。

例题:有位教育学家认为现在大学生的平均智能指数(I.Q.)最高为110。随机抽选150名大学生,测得他们平均智能指数为111.2,标准偏差为7.2。从这次抽样调查的结果,你如何评价那位教育学家的主张。

已知: 总体指标 110=μ ;

样本指标 2.7,2.111==SD x 两侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。 μ=x H :

0 ; μ≠x H :

1 。

第二步:构筑检验统计量。

没有总体的期望和方差,本应该使用t 分布,但样本数很大,所以还是使用正态分布。

在0H 正确的基础上, 04.2=-=

SD

x z μ

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。

查书后面的标准正态分布,得到96.1=αz 第四步: 比较第二步和第三步的结果。 2.04 〉 1.96

=====> 我们无法接受原假设。

那位教育学家的主张有些偏差。

9.3.2 根据t-分布进行平均值的检验

假设总体服从()

2,σμN 。如果总体的方差2σ是未知的,我们可以用2?σ

来替代2σ。具体检验统计量为n

x t 2

μ-=

例题: 假设一种小汽车每行走12公里需要消耗1升汽油。抽选10辆小汽

车,测定的结果:平均每走11.8 公里需要耗油1升,每升油行走里程的标准偏差为0.3 公里。请分析一下。

条件:总体方差是已知的,或者虽然不知道总体方差,但是样本数很大。

???

? ?

?n

N x 2

,~σμ 已知: 总体指标 km 12=μ ;

样本指标 km SD km x 3.0,8.11==

两侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。 μ=x H :

0 ; μ≠x H :

1 。

第二步:构筑检验统计量。

在0H 正确的基础上, 108.2-=-=

SD

x t μ

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的t 分布,得到()96.1102

=αt

第四步: 比较第二步和第三步的结果。 -2.108 < -1.96

=====> 我们无法接受原假设。

说明每升油可以走12公里这一说法不能接受。

单侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。 μ=x H :

0 ; μ

1 。

第二步:构筑检验统计量。

在0H 正确的基础上, 108.2-=-=

SD

x t μ

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的t 分布,得到()833.110-=αt

第四步: 比较第二步和第三步的结果。 -2.108 < -1.833

=====> 我们无法接受原假设。

说明每升油可以走12公里这一说法不能接受。

9.3.3 平均值差的检验

检验目的:两个母体间的平均值是否有差异。

假设两个母体的期望和方差分别为:2

22211,;,σμσμ 。

相应的样本的均值分别为:21,x x ;样本数分别为:21,n n 。 如果两个样本间不相关,则有()

221,~σμN x x -,其中,21μμμ-=,

2

2

2

1

2

12

n n σσσ+

=

。如果22

2

1,σσ为未知的话,则有2

2

21

212

???n n σ

σσ

+

= 。

例题:一种食品流水线。有一周生产200个产品,平均重量为530克,标准偏差为6克;第二周又生产了180个产品,平均重量为529克,标准偏差为5克。请问这条流水线稳定吗?

两侧检验(two-tailed testing )方法 第一步:建立原假设和备择假设。

210:

μμ=H ; 211:μμ≠H 。

第二步:构筑检验统计量。 在0H 正确的基础上, ()

77.1??2

2

2

1

2

12121=+

---=

n n x x z σ

σ

μμ

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的标准正态分布,得到96.1=z 第四步: 比较第二步和第三步的结果。 1.77 < 1.96

=====> 我们无法拒绝原假设。 这条流水线还比较稳定。

9.4 方差的检验 ---- 2χ分布的应用

检验目的: 检验总体的方差是否与某一具体值相等。 如果总体是正态分布,()

2,~σμN X ,且2,σμ知道的话,则

()()n x n

t t 21

2

2

2

~χσμχ∑

=-= ;

如果总体是正态分布,()

2,~σμN X ,但是2,σμ不知道的话,则

()()()1~?12

2

21

2

2

2

--=-=∑

=n n x x n

t t χσ

σσχ 。 例题: 一条酸奶包装流水线,按方差为3的标准进行管理。对这条流水

线进行改造后, 随机抽取20个产品作样品,测得样本的方差为4.85。请问是不是因为进行改造,而使该包装流水线产品质量变得更加布稳定。

已知: 总体指标 32=σ ;

样本指标 20,85.4?2==n σ

这里用单侧检验方法

第一步:建立原假设和备择假设。 220?:

σσ

=H ; 221?:σσ

>H 。

第二步:构筑检验统计量。

在0H 正确的基础上, ()7.30?12

22

=-=

σσ

χ

n

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的2χ分布表,得到()1.30192

=αχ

第四步: 比较第二步和第三步的结果。 30.7 〉 30.1

=====> 我们无法接受原假设。

改进后的流水线不如以前稳定。

9.5 适合度的检验

检验目的: 根据经验观察到的分布与指定的分布是否一致。 例如,参加考试学生的成绩是否服从正态分布。

经验分布和假设中的分布都是以度数分布表的形式来表示的,具体用i

f 和*i f 表示。如果假设是正确的话,()

()1~2122-???

?????-=∑=**m f f

f m

i i i i χχ。

显然,如果两个分布的差异比较大的话,分子就比较大。

例题: 北京地区轿车的市场份额分别为:A 公司 35%; B 公司 30%; C 公司 20% ; 其他公司 15%。调查一个停车场,得到A 公司

的车110台,B 公司生产的车为123台,C 公司生产的车为95台,其他公司生产的车为52台。请问市场份额对吗?

根据例题。我们可以得到下面表格

A B C others f 110 123 95 52 f-sample 133 114 76 57

第一步:建立原假设和备择假设。

:0H 调查结果的分布与原来掌握的情况一致 ;

:1H 调查结果的分布与原来掌握的情况不一致。

第二步:构筑检验统计量。

在0H 正确的基础上, ()

88.9122=???

?????-=∑=**m

i i i i f f

f χ

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。

查书后面的2χ分布表,得到()81.73802

=αχ

第四步: 比较第二步和第三步的结果。 9.88 〉 7.81

=====> 我们无法接受原假设。

9.6 分割表 (contingency table )的检验

检验目标: 两个分类基准是否物关系。

一般,根据标准A 把全体分成r 类,根据标准B 把全体分成s 类.

分 割 表

如果标准A,B 无关系的话, ()()()j i j i B P A P B A P = . 具体,

()()()n

f n f B P A P B A P n

f j

i j i j i ij ..?

=

==* . ()

()()()11~22

2-?--=∑∑

*

*r s f f f

i

j

ij ij ij

χχ

说明: 共有s r ?个,由于n f i

j

ij =∑∑,于是自由度为1-rs .同时需要

从ij f 计算*ij f ,也就是说需要计算出r 个()i A P 和s 个()j B P ,但是由于

()()1;1.2.1...2.1=+++==+++=

∑∑n f n f n f B P n f n f n f A P s j

j r i

i , 所以自由度应为()()()1121--=-+--s r s r rs

例题: 检验报纸的发行与地区有关系吗?

报纸发行量与地区关系

A 报纸 B报纸 C报纸 小计 东北地区 75 80 145 300 华北地区 105 110 85 300 华东地区 120 85 95 300 小计 300 275 325 900

B1 B2 … Bj … Bs 小计

A1 f11 f12 f1j f1s f1.

A2 f21 f22 … f2j … f2s f2. A3 f31 f32 … f3j … f3s f3. … … Ai fi1 fi2 … fij … fis fi. … … Ar fr1 fr2 … frj … frs fr. 小计 f.1 f.2 … f.j … f.s f..=n

第一步:建立原假设和备择假设。 :

0H 报纸的发行量与地区无关 ; :

1H 报纸的发行量与地区有关 。

第二步:构筑检验统计量。

100900300

3001..111

=?==*n f f f ,

7.919002753002..112=?==

*

n f f f ,

3.108900325

3003..113=?==

*n f f f ,

100900300

3001..221=?==

*n f f f ,

7.91900275

3002..222=?==

*n f f f ,

3.108900325

3003..223=?==

*n f f f ,

100900300

3001..331=?==

*n f f f ,

7.91900275

3002..332=?==

*n f f f ,

3.108900

325

3003..333=?==

*n f f f , ()

∑∑

*

*-=i

j

ij ij ij

f f f

2

()()()()()7

.917.911101001001053.1083.1081457.917.9180100100752

2222-+

-+-+-+-= ()()()()3

.1083.108957.917.91851001001203.1083.108852222-+-+-+-+

= 35.22

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的2χ分布表,得到()49.9222

=?αχ

第四步: 比较第二步和第三步的结果。 35.22 〉 9.49

=====> 我们无法接受原假设。

例题: 把得同一种病的患者分成两组:A,B.按不同的方法进行治疗.得到以下数据:

治疗方法与生存率有关系吗?

治疗方法与结果

生存 死亡 小计 A 组 49 31 80 B 组 29 41 70 小计 78 72 150

第一步:建立原假设和备择假设。

:

0H 生存率与治疗方法无关 ; :

1H 生存率与治疗方法有关 。

第二步:构筑检验统计量。

13.4215078

801..111

=?==*n f f f ,

40.3815072802..112=?==

*

n f f f ,

40.3615078

701..221=?==

*n f f f ,

60.33150

72

702..222=?==

*n f f f , ()

∑∑

*

*-=i

j

ij ij ij

f f f

2

2χ = 5.877

第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的2χ分布表,得到()84.3112

=?αχ

第四步: 比较第二步和第三步的结果。 5.877 〉 3.84

=====> 我们无法接受原假设。

9.7 方差同一性的检验

检验目标: 两个总体之间是否存在方差的差异. 从第一个总体中抽取m 个样本,m x x x 11211,,, ; 从第二个总体中抽取n 个样本,n x x x 22221,,, .

样本的均值为: ∑∑====n

j j m i i x n x x m x 1

221111,1 ,

总体的方差为: 2

221,σσ ,

()1~2

2

1111-?

??

? ??-∑=m x x m

i i χσ ()1~2

2

12

2

2-???

? ??-∑=n x x n j j χσ

则有, ()()()1,1~11

111

221

211------=∑∑==n m F x x n x x m F n

j j j m

i i 例题: 随机抽取10名学生进行英语,再抽取12名学生进行数学模拟试

验,

成绩如下表.根据这次试验,可以判断英语和数学这两门课成绩的分散程度一样吗?

考试成绩

第一步:建立原假设和备择假设。

:

0H 2

2m

e σσ= (这两门学科成绩分散程度一致) ; 考号 英语 数学

1 73 50

2 85 55

3 77 90

4 70 60

5 90 70

6 80 85

7 88 70

8 85 75

9 70 100

10 75 95

11 60

12 75

:

1H 2

2m

e σσ≠ (这两门学科成绩分散程度不一致) 。 第二步:构筑检验统计量。

()()75.41101112110

1

2

212

1

211=----=∑∑==j j

j i i x x x x F 第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。 查书后面的F 分布表,得到()11.39,11=αF 第四步: 比较第二步和第三步的结果。 4.75 〉 3.11

=====> 我们无法接受原假设。

9.8 方差分析(analysis of variance)

检验目标: 3个或3个以上总体间的平均值是否一致.

一般,假设有m 个总体,它们分别选取m i n n n n ,,,,,21 个样本,具体如下表:

方差分析数据 总体 1 2 … i …

m 小计 x11 x21 … xi1 … xm1 x12 x22 … xi2 … xm2 样本 … … … … … … x1j x2j … xij … xmj … … … … … … x1n1 x2n2 … xinj … xmnm 样本数 n1 n2 … nj … nm N 样本均值

x1

x2

… xj

xm x

ij x 来自第i 个总体,第j 个观察值。

假设 ()

2,~σμi ij N x ,μ 是i μ的加权平均, 则

i i αμμ+= ,m i ,,2,1 = 。

其中,∑∑===

m

i i

m

i i

i n

n 1

1

μ

μ,01

=∑=m

i i i n α 。

可以认为 i α 是第i 个总体的特殊值。

这时,观察值 i ij i ij n j m i x ,,2,1;,,2,1, ==++=εαμ 。 ()1,0~N ij ε 。

各总体之间的差就可以认为是m i i ,,2,1, =α之间是否存在差异。总体之间是否存在差异的检验,:

0H 0=i α (总体之间不存在差异) ;

:1H 0≠i α (总体之间存在差异) 。

进行几个规范性的定义:

∑∑===m i n j ij i x N x 111 , ∑==

i

n j ij

i

i x

n x 1

1 ,

()()∑∑∑∑====-+-=-=m

i n j i i ij m

i n j ij i

i

x x x x x x V 112

112

()()()()∑∑∑∑∑∑======--+-+-=m i n j i i ij m

i n j i m

i n j i ij i

i i x x x x x x x x 11112

112

2

()()()()∑∑∑∑∑∑======--+-+-=m

i n j i ij i m

i n j i m

i n j i ij i

i

i

x x x x x x x x 1

1

112

11

2

2

由于 ()01

1

=-=-∑∑==i i n j ij n j i ij x n x x x i

i

()()2111

2

11

2

V V x x x x V m i n j i m i n j i ij i

i +=-+-=∑∑∑∑====

方差分析表

变动因素 平方和 自由度 平均平方 F

组间 V2 m-1 V2/(m-1) (N-m)V2/(m-1)V1

组内 V1 N-m V1/(N-m) 小计 V

N-1

其中, ()N x x x x V i j ij i j

ij

i j ij 2

2???? ??-=-=∑∑∑∑∑∑ ()∑∑∑∑∑∑???????

?

?

???

?? ??-=-=i j ij i j ij i j ij n x x x x V 122

11

()

N x n x x x n V i j ij i j ij i i

i 2

12

2

2???? ??-

???

????

? ????

?? ??=-=∑∑∑∑∑ 在:0H 0=i α (总体之间不存在差异) ,()

2,~σμN x ij ,

()1~22112

-=???

? ??-∑∑==N V x x m

i n j ij i

χσσ; ()1~22112

-=???

? ?

?-∑=i n j i ij n V x x i χσσ ; ()1~22

212

-=??? ?

?-∑=m V x x m

i i χσσ 。 ======〉 ()()

()m N m F m N V m V F ----=,1~11

2

例题: 有四家汽车制造公司,抽选安装有同一型号发动机的四家公司生产的小

型汽车,进行每升汽油所行走公里数的试验。结果祥见下表。试问这四家公司生产的小汽车单位耗能所行走的距离有差异吗?

小型汽车行走距离

第一步:建立原假设和备择假设。

:

0H 0=i α (总体之间不存在差异) ; :

1H 0≠i α (总体之间存在差异) 。

第二步:构筑检验统计量。 先列表计算一些指标 ;

汽车生产商 1 2 3 4

12.3 11.1 11 12.5

12.9 12.5 11.4 12.9

单位耗油行走距离 13 12.9 12.1 13.3

13.4 13 12.7 13.7

13.1 14.6

13.8

14.6

样本数 4 7 4 5

各总体的平均值 12.9 13 11.8 13.4

计算表

汽车制造商 1 2 3 4 小计

各总体样本数 n(i) 4 7 4 5 20 sum(x) -0.4 0 -4.8 2 -3.2 sum(x)*sum(x) 0.16 0 23.04 4 sum(x)*sum(x)/n(i) 0.04 0 5.76 0.8 6.6 sum(x*x) 0.66 7.08 7.46 3.4 18.6

其次,根据计算表计算 V V V ,,21 ;

()088.1820)2.3)(2.3(6.182

2

=---=???? ??-

=-=∑∑∑∑∑∑N x x x x V i j ij i j

ij i j ij ()00.126.66.18122

11=-=?????

??

? ?

???

?? ??-=-=∑∑∑∑∑∑i j ij i j ij

i j ij n x x x x V

()

()()088.6202.32.36.62

12

2

2=---=???? ??-

???

????

? ?

???

?? ??=-=∑∑∑∑∑N x n x x x n V i j ij i j ij i i

i 于是, ()()

71.211

2=--=

m N V m V F 第三步:根据有意水准,查出临界值。

给出有意水准,例如%5=α。这意味着允许犯错误的概率为5%。

查书后面的F 分布表,得到()24.3420,14=--αF 第四步: 比较第二步和第三步的结果。 2.71 《 3.24

=====> 我们无法拒绝原假设。 不存在差异。

练习题

1.一个六面体扔500次,点数为3的那面出现了95回。请问这个东西的质量很好。

2.有一家工厂自称自己95%的产品是合格的。现在随机抽取其中200个产品进行调查,发现有18个产品不合格。请问工厂的说法对吗?

3.有一所大学,最近4年级毕业生中每年至少有10%的学生留级。今年,从毕业生中抽选500人进行跟踪调查,发现40人留级了。请

判断至少10%留级率正确与否。

4.一家药厂广告说服用新药的患者8小时内有90%的患者会见效。随机调查200名患者,发现170名患者在8小时内病情有所好转。请

问该份广告可信吗?

5.一份报告称在北京工作的前10年里,25%的人三年内至少要搬一次家。现在通过电话咨询500户来北京打工不满10年的居民,发现

112户3年内至少搬过一次家。请检验这份报告的正确性。

6.大型快餐店的管理者认为,如果把35元的套餐改为20元的套餐的话,来店顾客中的75%会更满意。随机抽选300名顾客进行调查,

发现212名顾客认为改成20元更好。请问管理者的判断正确与否。

7.英语考试结果表明:240男生有144人得90分以上,180名女生里有92人得90 分以上。请用统计方法判断语言的学习能力与性别有

关吗?

8.两种铸件模具做出的产品有无差异进行检验。结果发现:第一种模具作出的100个产品里有14个不合格;第二种模具生产出的200

个产品里有36 个次品。请问这两种模具生产出的产品的次品率有

差异吗?

9.一家公司调查100名不吃早饭的员工发现有45人上午工作时会感到疲劳;调查400名好好吃早饭的职工发现有140在上午的工作中

会感到疲劳。请问不吃早饭与上午工作感到疲劳又关系吗?

10.夏天调查100名北京的银行职员,发现68人喜欢喝燕京啤酒,不喜欢喝青岛啤酒;同一时间又调查了300名上海的银行从业人员。

发现与青岛啤酒相比,213人更喜欢喝燕京啤酒。请问啤酒喜好与

地区有关系吗?

11.一种机械零件的规格应该是直径0.5485厘米。现在随机抽取6个,测得他们平均直径为0.5479厘米,标准偏差为0.0003厘米。请问

按设计的标准在生产吗?

12.瓶装饮料。每瓶标注内容量为500毫升。随机抽取9瓶,测试结果:平均内容量为494毫升,标准差为3毫升。请问该种饮料是否保量?

13.单位时间内应该完成150份一种分类作业。现在随机调查49人,发现这49人单位时间内完成140份分类作业,标准偏差为15。请

问工人是否有怠工倾向?

14.调查30块标重为450克的火腿,结果发现这30块火腿的平均重量为446克,标准偏差为11克。请问这种火腿是不是分量不足?

15. 随机测量100只某种品牌的日光灯的寿命,结果:平均寿命1570

个小时,标准偏差为120个小时,请问可不可以认为这种荧光灯的寿命为1600个小时?

16. 一种橡胶管设计的坏损强度为3.625公斤。现在随机抽取30个作

强度试验,发现:他们平均破损强度为3590公斤,标准偏差为65.7 公斤。请问这种橡胶管达到设计的标准了吗?

17. 抽查5盒高中化学实验课某种实验材料,结果是:每盒实验材料可

以分别进行25次,28次,30 次,29次,和30 次实验。请判断厂商所说的每盒可以进行30次实验的说法可信吗?

18. 随机抽选400名成年人进行体重测试。结果表明是平均比标准体重

多7.2公斤,上下浮动(标准偏差)2.3公斤。请问通过这次调查可以判断成年人的平均体重比标准体重多6.4 公斤吗?

19. 一种产品要求品质的标准偏差控制在0.005以内。抽取8个样本,

测算结果如下:2.012,2.008,1.992,2.017,1.988,1.997,2.003,2.011。请问这种产品达到标准了吗?

20. 5枚硬币扔320次的结果如下表,请问可以用二项分布来拟合吗?

21. 一个咖啡的进口商就5种品牌的咖啡对1000名咖啡消费者进行了

调查,

请问咖啡各个牌子之间存在喜好差异吗?

22. 下表是一年就企业环境条件方面进行的调查。请问行业不同会带来

对环境关心的侧重点的不同吗?

23. 在一种纤维上分别刷上A ,B ,C ,和D 四种强化剂,以增强强度。

分别抽取5个样本进行试验,结果请参考下表。根据这次抽样的结果,我们可以判断各种强化剂之间存在效果差异吗?

正面的次数 0 1 2 3 4 5

观察的次数 6 56 87 109 49 6

二项分布 10 50 100 100 50 10

咖啡的牌子 A B C D E

人数 208 245 170 159 218

国际形势 市场情况 技术更新

情况

小计

原材料行

30 28 32 90

加工行业 47 55 38 140

非制造业 23 85 12 120

小计 100 168 82 350

A B C D 62 52 70 48 68 44 58 42 57 38 62 62 58 58 65 62

60 58 60 56

24.有一种自查的办法可以检查是否得了某种疾病。使用这种自查法,健康人的指标是,平均为350,标准偏差为80 ;病人的指标是平均为750,标准偏差为150。如果480以下的话,不用担心;超过480时,就要到医院进行周密的检查。

1)这种情况下的第一类错误和第二类错误都代表什么意义?

2)这种情况下的第一类错误和第二类错误都有多大?

所有计量经济学检验方法(全)

计量经济学所有检验方法 一、拟合优度检验 可决系数 TSS RSS TSS ESS R - ==12 TSS 为总离差平方和,ESS 为回归平方和,RSS 为残差平方和 该统计量用来测量样本回归线对样本观测值的拟合优度。 该统计量越接近于1,模型的拟合优度越高。 调整的可决系数)1/() 1/(12---- =n TSS k n RSS R 其中:n-k-1为残差平方和的自由度,n-1为总体平方 和的自由度。将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。 二、方程的显著性检验(F 检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 原假设与备择假设:H 0:β1=β2=β3=…βk =0 H 1: βj 不全为0 统计量 )1/(/--= k n RSS k ESS F 服从自由度为(k , n-k-1)的F 分布,给定显著性水平α,可得到临 界值F α(k,n-k-1),由样本求出统计量F 的数值,通过F>F α(k,n-k-1)或F ≤F α(k,n-k-1)来拒绝或接受原假设H 0,以判定原方程总体上的线性关系是否显著成立。 三、变量的显著性检验(t 检验) 对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。 原假设与备择假设:H0:βi =0 (i=1,2…k );H1:βi ≠0 给定显著性水平α,可得到临界值t α/2(n-k-1),由样本求出统计量t 的数值,通过 |t|> t α/2(n-k-1) 或 |t|≤t α/2(n-k-1) 来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。 四、参数的置信区间 参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 统计量 )1(~1??? ----'--= k n t k n c S t ii i i i i i e e βββββ 在(1-α)的置信水平下βi 的置信区间是 ( , ) ββααββ i i t s t s i i -?+?2 2 ,其中,t α/2为显著性 水平为α、自由度为n-k-1的临界值。 五、异方差检验 1. 帕克(Park)检验与戈里瑟(Gleiser)检验 试建立方程: i ji i X f e ε+=)(~2 或 i ji i X f e ε+=)(|~|

计量经济学实验报告6 单方程线性回归模型中异方差的检验与补救

内蒙古科技大学 实验报告 课程名称:计量经济学实验项目名称:单方程线性回归模型中异方差的检验与补救 院(系):经济与管理学院专业班级:姓名: 学号: 内蒙古科技大学 实验地点: 实验日期: 2013年 5 月 15 日 实验目的:掌握利用EViews软件对模型中存在的异方差进行检验和补救。实验内容: 根据我国2000年部分地区城镇居民每个家庭平均全年可支配收入X与消费支出Y的统计数据,通过建立双变量线性回归模型分析人均可支配收入对人均消费支出的线性影响,并讨论异方差的检验与修正过程。 1、异方差的检验 1)图示法 2)Park检验 3)Glejser检验 4)Goldfeld-Quandt检验 5)White检验 2、异方差的补救 1)加权最小二乘法(WLS) 2)对数变换 实验方法、步骤和结果: 一、前期准备工作,数据粘贴file-new-workfile Quick-empty group

内蒙古科技大学 并对数据重命名 ser01-x ser02-y 二、异方差的检验 1、先对x、y进行估计。在quick中选择estimate equation编辑方程y c x

内蒙古科技大学 2、将x、y建组,并命名为group02,并在group02中view菜单下选择graph-scatter-simple scaterr画出散点图。 从图像中可看出,三点分布由集中到慢慢扩大,而且比较明显,所以说该模型可能存在异方差。 3、y的估计值与残差平方的散点图进行判断 首先在eq01中proc菜单下选择make residual series,命名为res,找到残差。如图:

计量经济学课后习题

计量经济学课后习题 1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。 计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 4.建立与应用计量经济学模型的主要步骤有哪些? 答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5.模型的检验包括几个方面?其具体含义是什么? 答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 4.如何缩小置信区间?(P46) 由上式可以看出(1).增大样本容量。样本容量变大,可使样本参数估计量的标准差减小;同时,在同样置信水平下,n越大,t分布表中的临界值越小。(2)提高模型的拟合优度。因为样本参数估计量的标准差和残差平方和呈正比,模型的拟合优度越高,残差平方和应越小。 1.为什么计量经济学模型的理论方程中必须包含随机干扰项? (经典模型中产生随机误差的原因) 答:计量经济学模型考察的是具有因果关系的随机变量间的具体联系方式。由于是随机变量,意味着影响被解释变量的因素是复杂的,除了解释变量的影响外,还有其他无法在模型中独立列出的各种因素的影响。这样,理论模型中就必须使用一个称为随机干扰项的变量宋代表所有这些无法在模型中独立表示出来的影响因素,以保证模型在理论上的科学性。 3.一元线性回归模型的基本假设主要有哪些? 违背基本假设的模型是否不可以估计? 答:线性回归模型的基本假设有两大类:一类是关于随机干扰项的,包括零均值,同方差,不序列相关,满足正态分布等假设;另一类是关于解释变量的,主要有:解释变量是非随机的,若是

计量经济学检验报告

1.研究目的和意义 我们研究的对象是各地区居民消费支出的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民家庭每人每年的平均消费支出”来比较,而这正是可国家统计局中获得数据的变量。所以模型的被解释变量Y选定为“城市居民家庭平均每人生活消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2007年的截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,另外,居民消费支出具有一定的惯性,也就是说居民当年的消费支出在一定程度上受上一年已经实现的消费支出的影响。其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民家庭人均消费支出”相对应,选择在国家 X,统计局中可以获得的“各地区城市居民家庭人均可支配收入”作为解释变量 1 X。 “上年各地区城镇居民家庭平均每人生活消费支出”作为 2 从国家统计局中得到表1的数据: 表 1 城镇居民家庭平均每人生活消费支出与各地区城镇居民家庭人均可支配收入 地区Y X1 X2 北京14825.41 19977.52 13244.20 天津10548.05 14283.09 9653.26 河北7343.49 10304.56 6699.67 山西7170.94 10027.70 6342.63 内蒙古7666.61 10357.99 6928.60

计量经济学检验汇总

最全计量经济学检验汇总 现代计量经济学的检验包括以下三个大类: §1.1 系数检验 一、Wald 检验——系数约束条件检验 Wald 检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量。Wald 统计量计算无约束估计量如何满足原假设下的约束。如果约束为真,无约束估计量应接近于满足约束条件。 考虑一个线性回归模型:εβ+=X y 和一个线性约束:0:0=-r R H β,R 是一个已知的k q ?阶矩阵,r 是q 维向量。Wald 统计量在0H 下服从渐近分布)(2q χ,可简写为: )())(()(112r Rb R X X R s r Rb W -'''-=-- 进一步假设误差ε独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量 q W k T u u q u u u u F /) /(/)~~(=-''-'= u ~是约束回归的残差向量。F 统计量比较有约束和没有约束计算出的残差平方和。如果约束有效,这两个残差平方和差异很小,F 统计量值也应很小。EViews 显示2χ和F 统计量以及相应的p 值。 假设Cobb-Douglas 生产函数估计形式如下: εβα+++=K L A Q log log log (1) Q 为产出增加量,K 为资本投入,L 为劳动力投入。系数假设检验时,加入约束1=+βα。 为进行Wald 检验,选择View/Coefficient Tests/Wald-Coefficient Restrictions ,在编辑对话框中输入约束条件,多个系数约束条件用逗号隔开。约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。 为检验规模报酬不变1=+βα的假设,在对话框中输入下列约束:c(2)+c(3)=1 二、遗漏变量检验 这一检验能给现有方程添加变量,而且询问添加的变量对解释因变量变动是否有显著作用。原假设 0H 是添加变量不显著。 选择View/Coefficient Tests/Omitted Variables —Likehood Ration ,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开。例如:原始回归为 LS log(q) c log(L) log(k) ,输入:K L ,EViews 将显示含有这两个附加解释变量的无约束回归结果,而且显示假定新变量系数为0的检验统计量。 三、冗余变量 冗余变量检验可以检验方程中一部分变量的统计显著性。更正式,可以确定方程中一部分变量系数是否为0,从而可以从方程中剔出去。只有以列出回归因子形式,而不是公式定义方程,检验才可以进行。 选择View/Coefficient Tests/Redundant Variable —likelihood Ratio ,在对话框中,输入每一检验的变量名,相互间至少用一空格隔开。例如:原始回归为: Ls log(Q) c log(L) log(K) K L ,如果输入K L ,EViews 显示去掉这两个回归因子的约束回归结果,以及检验原假设(这两个变量系数为0)的统计量。 §1.2 残差检验 一、相关图和Q —统计量 在方程对象菜单中,选择View/Residual Tests/Correlogram-Q-Statistics ,将显示直到定义滞后阶数的残差自相关性和偏自相关图和Q-统计量。在滞后定义对话框中,定义计算相关图时所使用的滞后数。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q -统计量不显著,并且有大

计量经济学案例分析 课程报告 论文

中国经济增长影响因素实证分析 一、研究对象 经济增长问题既受各国政府和居民的关注,也是经济学理论研究的一个重要方面。在1978—2008年的31中,我国经济年均增长率高达9.6%,综合国力大大增强,居民收入水平与生活水平不断提高,居民的消费需求的数量和质量有了很大的提高。但是,我国目前仍然面临消费需求不足问题。因此,研究消费需求对经济增长的影响,并对我国消费需求对经济增长的影响程度进行实证分析,可以更好的理解消费对我国经济增长的作用。 二、数据收集与模型的建立 (一)数据收集 表2.1 中国经济增长影响因素模型时间序列表 年份国内生产总 值(y) 年末从业 人员数 (x1) 全社会固定资 产投资总额 (x2) 居民消费价格指 数(上年=100) (x3) 1980 4545.6 42361 910.9 107.5 1981 4891.6 43725 961 102.5 1982 5323.4 45295 1230.4 102 1983 5962.7 46436 1430.1 102 1984 7208.1 48197 1832.9 102.7 1985 9016 49873 2543.2 109.3 1986 10275.2 51282 3120.6 106.5 1987 12058.6 52783 3791.7 107.3 1988 15042.8 54334 4753.8 118.8 1989 16992.3 55329 4410.4 118 1990 18667.8 64749 4517 103.1 1991 21781.5 65491 5594.5 103.4 1992 26923.5 66152 8080.1 106.4 1993 35333.9 66808 13072.3 114.7 1994 48197.9 67455 17042.1 124.1 1995 60793.7 68065 20019.3 117.1 1996 71176.6 68950 22913.5 108.3 1997 78973 69820 24941.1 102.8 1998 84402.3 70637 28406.2 99.2 1999 89677.1 71394 29854.7 98.6 2000 99214.6 72085 32917.7 100.4 2001 109655.2 73025 37213.5 100.7 2002 120332.7 73740 43499.9 99.2 2003 135822.8 74432 55566.6 101.2 2004 159878.3 75200 70477.4 103.9 2005 184937.4 75825 88773.6 101.8 2006 216314.4 76400 109998.2 101.5 2007 265810.3 76990 137323.9 104.8

计量经济学试卷汇总_(含答案)

选择题(单选题1-10 每题1 分,多选题11-15 每题2 分,共20 分) 1、在多元线性回归中,判定系数R2随着解释变量数目的增加而 B A.减少 B.增加 C.不变 D.变化不定 2、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近1,则表明模型中 存在 C A.异方差性 B.序列相关 C.多重共线性 D.拟合优度低 3、经济计量模型是指 D A.投入产出模型 B.数学规划模 C.模糊数学模型 D.包含随机方程的经济数学模型 4、当质的因素引进经济计量模型时,需要使用 D A.外生变量 B.前定变量 C.生变量 D.虚拟变量 5、将生变量的前期值作解释变量,这样的变量称为 D A.虚拟变量 B.控制变量 C.政策变量 D.滞后变量 6、根据样本资料已估计得出人均消费支出Y对人均收入X的回归模型Ln Y=5+0.75LnX,这表明 人均收入每增加1%,人均消费支出将预期增加 B A.0.2% B.0.75% C.5% D.7.5% 7、对样本相关系数r,以下结论中错误的是 D A.越接近于1,Y与X之间线性相关程度越高 B.越接 近于0,Y与X之间线性相关程度越弱 C.-1≤r≤1

D.若r=0,则X与Y独立 8、当DW>4-d L,则认为随机误差项εi A.不存在一阶负自相关 B.无一阶序列相关 C.存在一阶正自相关D.存在一阶负自相关 9、如果回归模型包含二个质的因素,且每个因素有两种特征,则回归模型中需要引入 A.一个虚拟变量B.两个虚拟变量 C.三个虚拟变量 D.四个虚拟变量 10、线性回归模型中,检验H0: i =0(i=1,2,…,k) 时,所用的统计量t ?i 服从 var(?i ) A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2) 11、对于经典的线性回归模型,各回归系数的普通最小二乘法估计量具有的优良特性有ABC A.无偏性 B.有效性 C.一致性 D.确定性 E.线性特性 12、经济计量模型主要应用于ABCD A.经济预测 B.经济结构分析 C.评价经济政策 D.政策模拟 13、常用的检验异方差性的方法有ABC、 A.戈里瑟检验 B.戈德菲尔德-匡特检验 C.怀特检验 D.DW检验 E.方差膨胀因子检测 14、对分布滞后模型直接采用普通最小二乘法估计参数时,会遇到的困难有BCE A.不能有效提高模型的拟合优度 B.难以客观确定滞后期的长度 C.滞后期长而样本小时缺乏足够自由度 D.滞后的解释变量存在序列相关问题 E.解释变量间存在多重共线性问题

计量经济学调查报告

大学生月消费支出调查报告 一、引言 在当前尚且低迷,尚未完全复苏的经济环境下,消费问题被大家广泛关注。物价的连续上涨,直接反映了社会的消费和需求问题。当前的消费市场中,大学生作为一个特殊的消费群体正受到越来越大的关注。由于大学生年龄较轻,群体较特别,他们有着不同于社会其他消费群体的消费心理和行为。一方面,他们有着旺盛的消费需求,另一方面,他们尚未获得经济上的独立,消费受到很大的制约。消费观念的超前和消费实力的滞后,都对他们的消费有很大影响。特殊群体自然有自己特殊的特点,同时难免存在一些非理性的消费甚至一些消费的问题。为了调查清楚大学生的消费情况,我决定在身边的同学中进行一次消费的调研,对大家的消费进行归宗和分析。 二、理论综述 我们主要对大学生每人每月消费支出进行多因素分析,并从周围同学搜集相关数据,建立模型,对此进行数量分析。 影响大学生每人每月消费支出的主要因素如下: 1、学习支出 2、消费收入 3、生活支出 三、模型设定 Y:每人每月消费支出 X1:学习支出X2:消费收入 X3:生活支出 四、数据搜集 1、数据说明 我们特对周围大学生的消费水平做了简单调查,再用计量经济学的知识分析其影响因素。 2、数据的搜集情况 人数每人每月消 费 支出Y 学习支出 (X1) 消费收入(X2)生活支出(X3) 1760310800450 2630230600400 311002301350880 4420170450250 59601601000800 6580280500300 78702201000650 8300110400190 910501501300900 10126016015001100 11130030015001000 12500190550310 13600180750420 149001401000760

计量经济学名词解释

1、计量经济学 计量经济学是一门从数量上研究物质资料的生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学。 2、数据质量 数据满足明确或隐含需求程度的指标 3、相关分析 主要研究变量之间的相互关联程度,用相关系数表示。包括简单相关和多重相关(复相关)。 4、回归分析(Regression Analysis) 研究一个变量(因变量)对于一个或多个其他变量(解释变量)的数量依存关系。其目的在于根据已知的解释变量的数值来估计或预测因变量的总体平均值。 5.内生变量 指由模型系统内决定的变量,取值在系统内决定 6、面板数据 时间序列数据和截面数据的混合 7.异方差: 总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,则称线性回归模型存在异方差性。 8.自相关 自相关是在时间序列资料中按时间顺序排列的观测值之间的相关或在横截面资料中按空间顺序排列的观测值之间的相关 9.多重共线性 解释变量之间存在完全的线性关系或近似的线性关系。解释变量存在完全的线性关系叫完全多重共线;解释变量之间存在近似的线性关系叫不完全多重共线。 10.虚拟变量 虚拟变量:在建立模型时,有一些影响经济变量的因素无法定量描述 构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D 11.平稳序列 是指时间序列的统计规律不会随着时间的推移而发生变化。

12.伪回归 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。 13.协整 所谓协整,是指多个非平稳变量的某种线性组合是平稳的 14.前定变量 所有的外生变量和滞后的内生变量。前定变量=外生变量+滞后内生变量+滞后外生变量 15.恰好识别 恰好识别:能够唯一地估计出结构参数值。 16.结构式模型 体现经济理论中经济变量之间的关系结构的联立方程模型,称为结构式模型17.过度识别 过度识别:结构参数的估计值具有多个确定值 18.自回归模型 自回归模型:指模型中的解释变量仅是X 的当期值与被解释变量Y 的若干期滞后值,它由于被解释变量的滞后期值对被解释变量现期做了回归,故叫做自回归模型。 利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型。 19.拟合优度2R:拟合优度检验:指检验模型对样本观测值的拟合程度 20.修正的拟合优度2R 二、.

计量经济学考试重点整理

计量经济学考试重点整理 第一章: P1:什么是计量经济学?由哪三组组成? 定义:“用数学方法探讨经济学可以从好几个方面着手,但任何一个方面都不能和计量经济学混为一谈。计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学。” P9:理论模型的设计主要包含三部分工作,即选择变量,确定变量之间的数学关系,拟定模型中待估计参数的数值范围。 P12:常用的样本数据:时间序列,截面,虚变量数据 P13:样本数据的质量(4点) 完整性;准确性;可比性;一致性 P15-16:模型的检验(4个检验) 1、经济意义检验 2、统计检验 拟合优度检验 总体显著性检验 变量显著性检验 3、计量经济学检验 异方差性检验 序列相关性检验 共线性检验 4、模型预测检验 稳定性检验:扩大样本重新估计 预测性能检验:对样本外一点进行实际预测 P16计量经济学模型成功的三要素:理论、方法和数据。 P18-20:计量经济学模型的应用 1、结构分析 经济学中的结构分析是对经济现象中变量之间相互关系的研究。 结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。 计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。 2、经济预测 计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。 计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。 对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。 模型理论方法的发展以适应预测的需要。

计量经济学期末报告

计量经济学实验报告 我国居民储蓄余额的影响因素的计量分析 XX学院 XX专业 小组成员:(姓名及学号)

我国居民储蓄余额的影响因素的计量分析 一.研究的目的要求 1.研究的背景 居民储蓄额作为一个国家经济增长中来源最稳定、数额最大的影响因素,它的高低对一国的经济发展、投资和居民生活等方面都有不同程度的影响。目前我国国内居民储蓄意愿强劲、储蓄额居高不下,形成了储蓄的超常增长,主要呈现以下特点:(1)储蓄率世界之冠;(2)储蓄增长速度高于经济和居民收入增长速度;(3)城乡之间差别大;(4)不同收入阶层分布不均匀;(5)不同地区分布极不平均。我国储蓄的超常增长一方面能为银行提供了充足的信贷资金,保证金融机构的稳健运行,还能为国家提供了物质基础;此外,面对世界的日益发展,高储蓄额还能帮助我国进一步改革。但是,在另一方面我还国存在金融机构对资本的运用效益不高、居民投资渠不多、投资效益不稳定等问题。这些问题导致我国现在储蓄存款过剩、消费不足和资本形成不足同时并存的局面。 2013年6月余额宝正式上线,在此后的一年中该产品的客户数量和管理资产出现爆炸式的增长。截止2014年3月余额宝资金规模已经达到5413亿元,截止2014年4月,居民人民币存款减少1.23万亿元。余额宝作为一条“鲶鱼”和随后出现的众多“宝宝”们一起加速了中国利率市场化的进程,对未来我国储蓄额有着重大影响。 为了分析我国居民储蓄存款如今的发展状况、更好地把握我国储蓄余额未来的走向,所以对我国储蓄余额的及其影响因素的研究是十分必要的。 2.影响因素的分析 为了研究影响中国储蓄余额高低的主要原因,分析居民储蓄余额增长规律,预测中国储蓄余额的增长趋势,需要建立计量经济模型。通过参考相关文献并结合我国经济发展的实际情况提出了以下几个变量。(1)收入水平。根据经济理论可以认为,收入水平是影响储蓄的最主要因素。(2)利率水平。利率作为消费的机会成本也会对储蓄产生影响。理论上认为,利率越高,居民消费的机会成本越高,所以会减少消费增加储蓄;反之,利率越低消费成本越低,居民会增加消费减少储蓄。(3)物价水平。物价水平会影响消费和储蓄。物价水平越高相同消费水平需要支付的货币更多。而且物价水

计量经济学讲义共十讲

计量经济学讲义共十讲文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

第一讲 普通最小二乘法的代数 一、 问题 假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。我们对01ββ、这两个参数的值一无所知。我们的任务是利用样本数据去猜测01ββ、的取值。现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(,),(,),...,(,)N N y x y x y x 。问题是,如何利用该样本来猜测01ββ、的取值 为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x ,纵轴y )。既然y 与x 具有近似的线性关 系,那么我们就在图中拟合一条直线:01 ???y x ββ=+。该直线是对y 与x 的真实关系的近似,而0 1 ??,β β分别是对01 ,ββ的猜测(估计)。问题是,如何确定0?β与1 ?β,以使我们的猜测看起来是合理的呢 笔记: 1、为什么要假定y 与x 的关系是0 1y x ββε=++呢一种合理的解释 是,某一经济学理论认为x 与y 具有线性的因果关系。该理论在讨论x 与y 的关系时认为影响y 的其他因素是不重要的,这些因素对y 的影响即为模型中的误差项。 2、0 1y x ββε=++被称为总体回归模型。由该模型有: 01E()E()y x x x ββε=++。既然ε代表其他不重要因素对y 的影 响,因此标准假定是:E()0x ε=。故进而有:

01E()y x x ββ=+,这被称为总体回归方程(函数),而 01 ???y x ββ=+相应地被称为样本回归方程。由样本回归方程确定的?y 与y 是有差异的,?y y -被称为残差?ε。进而有:0 1 ???y x ββε=++,这被称为样本回归模型。 二、 两种思考方法 法一: 12(,,...,)N y y y '与12???(,,...,)N y y y '是N 维空间的两点,0 ?β与1 ?β的选择应该是这两点的距离最短。这可以归结为求解一个数学问题: 由于?i i y y -是残差?i ε的定义,因此上述获得0?β与1 ?β的方法即是0 ?β 与1 ?β的值应该使残差平方和最小。 法二: 给定i x ,看起来i y 与?i y 越近越好(最近距离是0)。然而,当你选择拟合直线使得i y 与?i y 是相当近的时候,j y 与?j y 的距离也许变远了,因此存在一个权衡。一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择应该使1y 与 2?y 、2y 与2?y 、...、N y 与?N y 的距离的平均值是最小的。距离是一个绝对值,数学处理较为麻烦,因此,我们把第二种思考方法转化求解数学问题: 由于N 为常数,因此法一与法二对于求解0?β与1 ?β的值是无差异的。 三、 求解

计量经济学报告报告

《计量经济学》课程论文 城镇居民消费主要影响因素的实证分析 小组成员:何志滔李学贤吴晓天 指导教师:张子昱 日期:2010年12月23日

城镇居民消费主要影响因素的实证分析 摘要 中国经济的快速增长,城镇化步伐加快。城镇居民的消费在国民经济中占有极其重要的比重,城镇居民的消费水平对整个国名经济的的发展有重大的作用。面对这个巨大的消费,如何提高消费水平就成了扩大内需、拉动经济所面对的问题。本文运用计量经济学的方法,就城镇居民的消费水平的主要影响因素进行了简单的分析。 关键词:城镇居民;消费水平;影响因素 一问题的提出 经济危机以来,中国遭遇增长上的瓶颈。一直以来中国经济的增长主要依赖于投资、出口和消费三架马车,而又以投资和出口的拉动作用最大。虽然我国一直在强调要扩大内需,但经济危机中由于出口减少而引起经济的下滑还是说明国内经济对出口的依赖还是很大的。 西方经济学中有很多关于需求、消费的理论。微观经济学中供求和均衡价格理论中的需求定理阐述了需求的定义和影响因素。需求是指某一特定时期内,在各种可能的价格水平下,消费者愿意而且能够买到的某种商品的数量。影响需求的主要因素包括商品本身的价格、其他商品的价格、消费者的偏好、消费者收入及人们对未来的期望等。 由于数据的可获得性及影响的重要性,对于城镇居民的消费水平主要选取了以下两个影响因素;城镇居民家庭可支配纯收入及商品零售价格指数。 二1991年到2008年城镇居民消费水平及其影响因素的统计数据(表1)

三建立模型 由数据分析,初步建立模型Y=b0+b1*X1+b2*X2+ui b0表示在没有任何影响因素下城镇居民的消费水平;b1表示城镇家庭可支配纯收入对城镇居民消费水平的影响;b2表示商品零售价格指数对城镇居民的消费水平的影响;ui为随机扰动项 四模型的检验与修正 (一)模型的参数估计及经济意义和统计意义上的检验 利用Eviews软件,做Y对X1 X2的回归。回归结果如下表1: Dependent Variable: Y Method: Least Squares Date: 12/22/10 Time: 12:48 Sample: 1991 2008 Included observations: 18 Variable Coeffici ent Std. Error t-Statisti c Prob. C 3435.487 1604.745 2.140831 0.0491 X1 0.782495 0.024778 31.58077 0.0000 X2 -20.2479 0 14.85835 -1.362728 0.1931 R-squared 0.986696 Mean dependent var 6826.167 Adjusted R-squared 0.984922 S.D. dependent var 3180.842 S.E. of regression 390.5890 Akaike info 14.92420

计量经济学第八讲v

第八讲 平稳时间序列 在严格意义上,随机过程{}t X 的平稳性是指这个 过程的联合和条件概率分布随着时间t 的改变而保持不变。在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳: 2();();(,)t t t t j j E X Var X Cov X X μδδ+=== 显然20δδ=。 在本讲义中,平稳皆指协方差平稳。当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。 (一)平稳随机过程的例子 1、白噪声过程{}t ε: 20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠=== 笔记: 假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。对于严格白噪声过程,有: , (12) ()()t t t t E E εεεε--=,。因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。

2、AR(1)过程: 011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程 为了验证上述过程满足平稳性条件,我们首先通过迭代得到:1 1 1 1 00 1 0t t i i t i i i t t y a a a y a ε---===++∑∑。接下来注意到, 1 1 1)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了 很久,即t 趋于无穷大,则0 1 )1(t a E y a μ-==;其次也有 1 1 ()() t i t i i t Var y Var a ε--==∑,当t 趋于无穷大时, 2 12 2 1()11()i t Var a a Var y εδ-= - = ;最后,当t 趋于无穷大时,有: 1211111111222 (12411112) 1......(...) [()()] [()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a a μμδδεεεεεεε+-----------++- -+++++++++++= == 关于AR(p)过程的平稳性,见附录。下图是对一个 平稳AR(1)过程的模拟。 1,(0,1) 10.8t N ID t t t y y εε-+=+ 笔记:

计量经济学实验报告

中国海洋大学 《计量经济学》实验报告实验项目名称:黄金价格影响因素解析 指导教师:殷克东 姓名:王焜 学号: 年级专业: 14金融 中国海洋大学经济学院

【实验步骤——自己操作】 一、实验数据: 黄金价格、美元指数、通胀率、原油价格、US利率、GDP、标准普尔指数的数据如下:二、实验步骤: (1)建立回归模型 1.建立实验文件 2.输入Y、X的数据 在EViews软件的命令窗口键入DATA命令,命令格式为:: 输入:data Y X1 X2 X3 X4 X5 X6 X7 3.建立回归模型: 建立Y C X1 X2 X3 X4 X5 X6 X7的回归,

其中Y代表黄金价格 X1代表美元指数 X2代表通胀率 X3代表原油价格 X4代表短期US 利率 X5代表长期US利率 X6代表GDP X7代表标准普尔指数 4.回归结果如下: 5、对模型的初步分析 a.对模型拟合度分析:从报告单可以看出,R-squared为,模型拟合度在89%左右。

b.对变量的显着性分析:在t检验中,截距项参数、RS的参数并不显着。可能为0。但要判断是否为0,还要对残差和变量进行检验。 c.对模型显着性分析F检验中,F统计量值为,大于显着水平为5%的临界值,说明模型显着。对多个解释变量的模型,若OLS法估价的R2与F值较大,但t检验值较小,则说明各解释变量对Y的联合线性作用显着,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显着。 d、对模型的残差项进行分析 异方差检验:怀特检验 由图知Obs*R-squared统计量为,概率值大于,说明不存在异方差 自相关检验 P(Obs*R-squared)为,大于的显着水平,所以不存在自相关。 e、对变量进行分析 对变量进行多重共线性检验 由相关系数矩阵知: 与RL、RS和SP存在明显的线性相关性。可以看出GDP与利率存在线性负相关,与股票市场存在线性正相关。因为GDP是反映国家经济的一个重要指标,因此,国家为了刺激经济,货币政策往往比较宽松,利率比较低,此时国家经济发展,GDP加速上升,带动股市上扬。 与SP存在明显的线性相关性。由股票理论价格=股票收益/利率知 道利率与股票价格存在负相关。 由于存在多重共线性存在,导致OLS下估计量的非有效、变量显着性检验失效和模型预测失效,因此必须克服模型多重共线性,对模型进行修改。 6、对模型的修正 前面已经大致检测出存在多重共线性的解释变量,分别是短期利率(X4)、长期利率(X5)、标准普尔指数(X7)、GDP(X6)。对这些解释变量进行逐步回归: 短期利率: 长期利率 标准普尔指数 GDP 可以看出在标长期利率的逐步回归中t检验最显着;R检验值为,在四个检验中最好;因

计量经济学讲义

计量经济学讲义 第四讲 趋势和DF 检验(修订版) 此翻译稿制作学习之用,如有错误之处,文责自负。 趋势平稳序列(TS )(图1和2) 一个趋势平稳序列绕着一个确定的趋势(序列的均值),其波动幅度不显示增大或者减小的趋势。 线性确定性趋势: t t t y εβα++= ),0(~2 σεiid t t=1,2,… 平方确定性趋势: t t t t y εγβα+++=2 ),0(~2 σεiid t t=1,2,… 通常: t t t f y ε+=)( ),0(~2 σεiid t t=1,2,… 均值是是随时间变化的(川),但是方差是常数。t ε可以为任意平稳序列,也就是说,不一定要是白噪声过程。 通过拟合一个确定的多项式时间趋势,趋势可以来消除:拟合趋势后残差将给出一个去趋势的序列。 一个带线性确定性趋势AR (1)过程可以写作: t 1-t 1t )1)-t (y (t y εβαφβα+--=-- ),0(~2 σεiid t t=1,2,… 此处确定性趋势被t y 减去。然而在实践中,α、β是未知的而且必须估计出来。于是模型可以被重述为: t 1-t 1111t y t )1()1(y εφβφβφαφ++-++-= 其中包含一个截距和一个趋势,也就是 t 1-t 1* *t y t y εφβα+++= 此处 βφαφα11*)1(+-= 且 βφβ)1(1* -= 若1||1<φ,那么此AR 过程就是围绕一个确定性趋势的平稳过程. 差分平稳序列(DF )(也叫单整序列)和随机性趋势 如果一个非平稳序列可以由一个平稳序列通过d 次差分得到,那么我们说这个序列就是d 阶单整的,写做I (d ).这一过程也因此叫做差分平稳过程(DSP ). 因此,平稳序列就是零阶单整的,I (0)。白噪声序列是I (0)。 所以如果序列t d t y w ?=是平稳的,那么t y 就是I (d )。?是差分算子,即 等等2-t 1-t t 2-t 1-t 1-t t 1-t t t t 21-t t t y 2y y )y y ()y y ()y y (y y ,y y y +-=---=-?=??=?-=? 如果序列 1-t t t t y y y w -=?= 是平稳的话,t y 是I (1); 如果序列2-t 1-t t t 2 t y 2y y y w +-=?= 是平稳的,t y 是I (2),

计量经济学--名词解释--简答题--部分汇总

计量经济学 第一部分:名次解释 第一章 1、模型:对现实的描述和模拟。 2、广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。 3、狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。 第二章 1、总体回归函数:指在给定Xi 下Y 分布的总体均值与Xi 所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。 2、样本回归函数:指从总体中抽出的关于Y ,X 的若干组值形成的样本所建立的回归函数。 3、随机的总体回归函数:含有随机干扰项的总体回归函数(是相对于条件期望形式而言的)。 4、线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的1次方出现。 5、随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。 6、残差项:是一随机变量,是针对样本回归函数而言的。 7、条件期望:即条件均值,指X 取特定值Xi 时Y 的期望值。 8、回归系数:回归模型中βo ,β1等未知但却是固定的参数。 9、回归系数的估计量:指用?μ01 ,ββ等表示的用已知样本提供的信息所估计出来总体未知参数的结果。 10、最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。 11、最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。 12、估计量的标准差:度量一个变量变化大小的测量值。

13、总离差平方和:用TSS表示,用以度量被解释变量的总变动。 14、回归平方和:用ESS表示:度量由解释变量变化引起的被解释变量的变化部分。 15、残差平方和:用RSS表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。 16、协方差:用Cov(X,Y)表示,度量X,Y两个变量关联程度的统计量。 17、拟合优度检验:检验模型对样本观测值的拟合程度,用2R表示,该值越接近1,模型对样本观测值拟合得越好。 18、t检验时针对每个解释变量进行的显著性检验,即构造一个t统计量,如果该统计量的值落在置信区间外,就拒绝原假设。 19、相关分析:研究随机变量间的相关形式 20、回归分析:研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论。 第三章 1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型成为多元线性回归模型,多元指多个变量。 2、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1个单位对解释变量带来的平均影响程度。 3、正规方程组:指采用OLS法估计线性回归模型时,对残差平方和关于各参数求偏导,并令偏导数为0后得到的一组方程,其矩阵形式为μ '' β= X X X Y 4、调整的多元可决系数:又称多元判定系数,是一个用于描述伴随模型中解释变量的增加和多个解释变量对被解释变量的联合影响程度的量。它与有如下关系: 5、多重共线性:指多个解释变量间存在线性相关的情形。如果存在完全的线性相关性,则模型的参数就无法求出,OLS回归无法进行。 6、联合假设检验:是相对于单个假设检验来说的,指假设检验中的假设有多个,不止一个。如多元

相关文档
最新文档