计量经济学-第三章

计量经济学-第三章
计量经济学-第三章

第三章、经典单方程计量经济学模型:多元线性回归模型

例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

fedu medu sibs edu 210.0131.0094.036.10++-=

R 2=0.214

式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与父亲受到教育的年数。问

(1)sibs 是否具有预期的影响?为什么?若medu 与fedu 保持不变,为了使预测的受教育水平减少一年,需要sibs 增加多少?

(2)请对medu 的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 解答:(1)预期sibs 对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为 10.36+0.131?12+0.210?12=14.452 10.36+0.131?16+0.210?16=15.816

因此,两人的受教育年限的差别为15.816-14.452=1.364

例2.以企业研发支出(R&D )占销售额的比重为被解释变量(Y ),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:

099

.0)046.0()

22.0()

37.1(05.0)log(32.0472.022

1=++=R X X Y

其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。如果X1增加10%,估计Y 会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D 强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D 强度Y 是否在统计上有显著的影响? 解答:(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y 变化的单位数,即?Y=0.32?log(X1)≈0.32(?X1/X1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y 会增加0.32个百分点。由此,如果X1增加10%,Y 会增加0.032个百分点。这在经济上不是一个较大的影响。

(2)针对备择假设H1:01>β,检验原假设H0:01=β。易知计算的t 统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t 值小于该临界值,所以不拒绝原假设。意味着R&D 强度不随销售额的增加而变化。在10%的显著性水平下,t 分布的临界值为1.311,计算的t 值小于该值,拒绝

原假设,意味着R&D 强度随销售额的增加而增加。

(3)对X2,参数估计值的t 统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y 在统计上没有显著的影响。 例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:

μ

ββββββββ++++++++=statetax localtax unemp popchang

income value density g hou 76543210sin

式中housing ——实际颁发的建筑许可证数量,density ——每平方英里的人口密度,value ——自由房屋的均值(单位:百美元),income ——平均家庭的收入(单位:千美元),popchang ——1980~1992年的人口增长百分比,unemp ——失业率,localtax ——人均交纳的地方税,statetax ——人均缴纳的州税

(1)检验模型A 中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉? (2)在模型A 中,在10%水平下检验联合假设H 0:βi =0(i=1,5,6,7)。说明被择假设,计

算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。

(3)哪个模型是“最优的”?解释你的选择标准。 (4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认

其是否为正确符号。 解答:(1)直接给出了P-值,所以没有必要计算t-统计值以及查t 分布表。根据题意,如果p-值<0.10,则我们拒绝参数为零的原假设。

由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value 、income 、popchang 的p-值仅比0.1稍大一点,在略掉unemp 、localtax 、statetax 的模型C 中,这些变量的系数都是显著的。

(2)针对联合假设H 0:βi =0(i=1,5,6,7)的备择假设为H1:βi =0(i=1,5,6,7) 中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A ,约束模型为模型D ,检验统计值为

462.0)

840/()7763.4()

37/()7763.47038.5()1/()/()(=-+-+-+=----=

e e e k n RSS k k RSS RSS F U U R U U R

显然,在H0假设下,上述统计量满足F 分布,在10%的显著性水平下,自由度为(4,32)

的F 分布的临界值位于2.09和2.14之间。显然,计算的F 值小于临界值,我们不能拒绝H0,所以βi (i=1,5,6,7)是联合不显著的。

(3)模型D 中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC 值最低,所以我们选择该模型为最优的模型。

(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期β3>0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型A 是这种情况,但它们的影响却非常微弱。

4、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:

μββββ++++=3322110X X X Y

你想检验的虚拟假设是H0:1221=-ββ。

(1)用21?,?ββ的方差及其协方差求出)?2?(2

1ββ-Var 。 (2)写出检验H0:1221=-ββ的t 统计量。

(3)如果定义θββ=-212,写出一个涉及β0、θ、β2和β3的回归方程,以便能直接得

到θ估计值θ

?及其标准误。 解答:(1)由数理统计学知识易知

)?(4)?,?(4)?()?2?(2

21121ββββββVar Cov Var Var +-=- (2)由数理统计学知识易知

)?2?(1?2?2

121ββββ---=se t ,其中)?2?(21ββ-se 为)?2?(2

1ββ-的标准差。 (3)由θββ=-212知212βθβ+=,代入原模型得

μ

ββθβμβββθβ+++++=+++++=33212103322120)2()2(X X X X X X X Y

这就是所需的模型,其中θ估计值θ

?及其标准误都能通过对该模型进行估计得到。 3-2.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?

1) i i i X Y εββ++=3

10

2) i i i X Y εββ++=log 10 3)

i i i X Y εββ++=log log 10

4) i i i X Y εβββ++=)(210 5) i i

i X Y εββ+=

10

6) i i i X Y εββ

+-+=)1(110

7) i i i i X X Y εβββ+++=1022110

3-3.多元线性回归模型与一元线性回归模型有哪些区别?

3-4.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?

3-5.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用? 3-6.请说明区间估计的含义。

3-7.什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:

i ki k i i i u x x x y +++++=ββββΛ22110,n i ,,2,1Λ=的正规方程组,及其推导过程。

3-16.考虑下列两个模型:

Ⅰ、i i i i u x x y +++=33221βββ Ⅱ、i i i i i u x x x y '+++=-332212)(ααα

要求:(1)证明:1??22-=βα ,11??βα= ,3

3??βα= (2)证明:残差的最小二乘估计量相同,即:i i u u

'=?? (3)在何种情况下,模型Ⅱ的拟合优度2

2R 会小于模型Ⅰ拟合优度2

1R 。

3-17.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:

方程A :3

215.10.10.150.125?X X X Y +--= 75.02

=R 方程B :4217.35.50.140.123?X X X Y

-+-= 73.02=R 其中:Y ——某天慢跑者的人数

1X ——该天降雨的英寸数 2X ——该天日照的小时数

3X ——该天的最高温度(按华氏温度) 4X ——第二天需交学期论文的班级数

请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?

(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?

3-18.对下列模型:i i i i u z x y +++=2βα (1)

i i i i u z x y +-+=ββα (2)

求出β的最小二乘估计值;并将结果与下面的三变量回归方程的最小二乘估计值作比较:

(3)i i i i u z x y +-+=γβα ,你认为哪一个估计值更好?

3-19.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):

i

i i i i X X X X Y 43219.561.07.124.286.10?-+++= (2.6) (6.3) (0.61) (5.9) 63.02

=R 35=n

要求:(1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说明。

3-22.下面给出依据15个观察值计算得到的数据:

693.367=Y , 760.4022=X ,0.83=X ,269.660422=∑i y

096.848552

2=∑i

x

,0.2802

3=∑i x , 346.747782=∑i

i

x

y

9.42503=∑i

i

x

y ,

0.479632=∑i i

x x

其中小写字母代表了各值与其样本均值的离差。

要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出2

R 与2

R ?

(3)估计2B 、3B 95%的置信区间;

(4)在%5=α下,检验估计的每个回归系数的统计显著性(双边检验); (5)检验在%5=α下所有的部分系数都为零,并给出方差分析表。

3-28.考虑以下预测的回归方程:t

t t RS F Y 33.510.0120?++-= 50.02

=R 其中:t Y ——第t 年的玉米产量(蒲式耳/亩)

t F ——第t 年的施肥强度(磅/亩) t RS ——第t 年的降雨量(英寸)

要求回答下列问题:(1)从F 和RS 对Y 的影响方面,说出本方程中系数10.0和33.5的含义; (2)常数项120-是否意味着玉米的负产量可能存在?

(3)假定F β的真实值为40.0,则估计值是否有偏?为什么?

(4)假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计值,则是否意味着RS β的真实值绝对不等于33.5?为什么?

3-29.已知线性回归模型U X Y +=B 式中~U (0,I 2

σ),13=n 且3=k (n 为样本

容量,k 为参数的个数),由二次型)()'(B B X Y X Y --的最小化得到如下线性方程组:

3??2?321=++βββ 9??5?2321=++βββ 8?6??3

21-=++βββ 要求:(1)把问题写成矩阵向量的形式;用求逆矩阵的方法求解之;

(2)如果53='Y Y ,求2

?σ; (3)求出β

?的方差—协方差矩阵。 习题答案

3-2.答:变量非线性、系数线性;变量、系数均线性;变量、系数均线性;变量线性、系数非线性;变量、系数均为非线性;变量、系数均为非线性;变量、系数均为线性。 3-3.答:多元线性回归模型与一元线性回归模型的区别表现在如下几方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更复杂; 3-4.在多元线性回归模型中,参数的最小二乘估计量具备线性、无偏性、最小方差性,同时多元线性回归模型满足经典假定,所以此时的最小二乘估计量是最优的线性无偏估计量,又称BLUE 估计量。对于多元线性回归最小二乘估计的正规方程组,

3-5.答:多元线性回归模型的基本假定有:零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项i u 服从均值为0方差为2

σ的正态分布假定。在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定;在有效性的证明中,利用了随机项独立同方差假定。

3-6.答:区间估计是指研究用未知参数的点估计值(从一组样本观测值算得的)作为近似值的精确程度和误差范围。

3-7.答:含有待估关系估计量的方程组称为正规方程组。 正规方程组的非矩阵形式如下:

??

???????=++++-=++++-=++++-=++++-∑∑∑∑∑∑∑∑0

)????(0)????(0)?

???(0)????(221102221102122110122110ki ki k i i ki i i ki k i i i i i ki k i i i i ki

k i i i x x x x x y x x x x x y x x x x x y x x x y ββββββββββββββββΛM ΛΛΛ 正规方程组的矩阵形式如下:

B

?X X '=Y X ' 3-16.解:(1)证明:由参数估计公式可得下列参数估计值

1?)()(?2

233232222332322223323222233322233232222

32332222-=-=

--=

∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑βα

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i i

i

i

i

i

i

i

i

i

i

i

i

i

i

i x

x x x x x x x x x x x x x x x x x x y x x x y x x x x x x x x x y x x x x y x &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&

3

233232223232222223323222332222233232222332222

23?)()(?βα

=-

=

--=

∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑i

i

i

i

i

i

i i i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

x

x x x x x x x x x x x x x x x x x y x x x

y x x x x x x x x x y x x x x y x

x &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&

1

3

322332233221????)?1(???β

ββααααα

=--=-+-=---=x x y x x y x x x y

⑵证明:

i i

i i i i i i i i i i u

x x y x x y x x x y u

?????)?1(?????3322133221332212=---=-+--=----='βββααα

ααα

⑶设:i i i x y z 2-= I 式的拟合优度为:

∑∑--

=-=2

2

21)(?11y y u TSS ESS R i i

II 式的拟合优度为:

∑∑-'-=-=2

2

2

2

)

(?11z z u

TSS ESS R i i 在⑵中已经证得i i u u

'=??成立,即二式分子相同,若要模型II 的拟合优度2

2R 小于模型I 的拟合优度2

1R ,必须满足:

22)()(y y z z

i i

-<-∑∑。

3-17.答:⑴方程B 更合理些。原因是:方程B 中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。

⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A 和方程B 中由于选择了不同的解释变量,如方程A 选择的是“该天的最高温度”而方程B 选择的是“第二天需交学期论文的班级数”,由此造成2X 与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。 3-18.答:将模型⑴改写成i i i i u x z y ++=-βα)2(,则β的估计值为:

∑∑---=2

)

()2)((?x x z y x x i

i i

i

β

将模型⑵改写成i i i i u z x y +-+=)(βα,则β的估计值为:

∑∑+--+--=2

)

()(?z x z x y

z x z x i

i

i

i

i

β

这两个模型都是三变量回归模型⑶在某种限制条件下的变形。如果限制条件正确,则前两个

回归参数会更有效;如果限制条件不正确则前两个回归参数会有偏。

3-19.答:⑴答案并不唯一,猜测为:1X 为学生数量,2X 为附近餐厅的盒饭价格,3X 为气温,4X 为校园内食堂的盒饭价格;

⑵理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。 3-22.解:⑴

7266.07578105506200.4796280096.848550

.47969.4250280346.74778?2323223223232322==

-??-?=

--=

∑∑∑∑∑∑∑∑i

i

i

i

i

i

i

i

i

i i

i

i x

x x x x x x x x y x x y β

7363

.275781020735800.4796280096.848550

.4796346.74778096.848559.4250?2

323223223222233==

-??-?=

--=

∑∑∑∑∑∑∑∑i

i

i

i

i

i

i

i

i

i i

i

i x

x x x x x x x x y x x y β

1572

.530.87363.2760.4027266.0693.367???3

3221=?-?-=--=X X Y βββ ⑵

3821

.612

9

.42507363.2346.747787266.0269.660423

15??33322222

=?-?-=

---=

-=

∑∑∑∑i

i i i i

i

x y x y y n e ββσ

768.1215

1

)()(211=??=

=σββA Var se 其中:∑∑∑∑∑∑∑-?-?+?=i

i i i i

i

i

i i i x x x x x

x x x X X x X x X A 3232232

2322

222322

同理,可得:0486.0)(2=βse ,8454.0)(3=βse 拟合优度为:9988.0??2

33222

=+=

∑∑∑i

i

i i i y

x y x y R ββ

9986.01

)

1(122=----=k

n n R R ⑶%5,12..==αf d ,查表得95.0)179.2(=≤t P

179.20486.07266.0179.22

≤-≤

-β,得到8325.06207.02≤≤β

179.28454.07363.2179.23

≤-≤-β,得到5784.48942.03≤≤β

8325.06207.0%9522≤≤∴ββ的置信区间为:,

5784.48942.0%9533≤≤ββ的置信区间为:

⑷)3,2,1(,0:0==i B H i ,0:1≠i B H

双边)%(5=α,12315..=-=f d 查表得临界值为179.2179.2≤≤-t

则:0:,179.20963.49768.120

1572.5311=∴>=-=

B t 拒绝零假设β

0:,179.29509.140486.007266.022=∴>=-=B t 拒绝零假设β

0:,179.22367.38454

.007363.233

=∴>=-=B t 拒绝零假设β

⑸所有的部分系数为0,即:0210===B B H ,等价于0:2

0=R H

方差来源 平方和 自由度 平方和的均值 来自回归 65963.018 2 32981.509 来自残差 79.2507 12 6.6042 总离差

66042.269

0203.49946042

.6509

.32981==

F ,12,2..%,5==f d α,F 临界值为3.89

F Θ值是显著的,所以拒绝零假设。

3-28.解:⑴在降雨量不变时,每亩增加一磅肥料将使第t 年的玉米产量增加0.1蒲式耳/亩;在每亩施肥量不变的情况下,每增加一英寸的降雨量将使第t 年的玉米产量增加5.33蒲式耳/亩;

⑵在种地的一年中不施肥、也不下雨的现象同时发生的可能性极小,所以玉米的负产量不可能存在;

⑶如果F β的真实值为0.40,并不能说明0.1是有偏的估计,理由是0.1是本题估计的参数,而0.40是从总体得到的系数的均值。

⑷不一定。即便该方程并不满足所有的古典模型假设、不是最佳线性无偏估计值,也有可能得出的估计系数等于5.33。

3-29.解:⑴该方程组的矩阵向量形式为:

??

????

????-=????????????????????893???611152121321

βββ ??????????-=??????????-?????????

?=??????????-213893611152121???1321

βββ ⑵9.13

13

8

2913353)(?2=-?-?-?-=--=k n RSS TSS σ

⑶β

?的方差—协方差矩阵为: ???

?

??????----=????

??????=X X '=---619.0225

.0675

.0225.0125.1475.2675.0475

.2525

.66111521219.1)(?)?(1

12σβ

Cov V

庞皓计量经济学课后答案第三章

统计学2班 第二次作业 1、?i =-151.0263 + 0.1179X 1i + 1.5452X 2i T= (-3.066806) (6.652983) (3.378064) R 2=0.934331 R 2=0.92964 F=191.1894 n=31 ⑴模型估计结果说明,各省市旅游外汇收入Y 受旅行社职工人数X 1,国际旅游人数X 2的影响。由所估计出的参数可知,在假定其他变量不变的情况下,当旅行社职工人数每增加1人,各省市旅游外汇收入增加0.1179百万美元。在嘉定其他变量不变的情况下。当国际旅游人数每增加1万人,各省市旅游外汇收入增加1.5452百万美元。 ⑵由题已知,估计的回归系数β1的T 值为:t (β1)=6.652983。 β2的T 值分为: t (β2)=3.378064。 α=0.05.查得自由度为n-2=22-2=29的临界值t 0.025(29)=2.045229 因为t (β1)=6.652983≥t 0.025(29)=2.045229.所以拒绝原假设H 0:β1=0。 表明在显著性水平α=0.05下,当其他解释变量不变的情况下,旅行社职工人数X 1对各省市旅游外汇收入Y 有显著性影响。 因为 t (β2)=3.378064≥t 0.025(29)=2.045229,所以拒绝原假设H 0:β2=0 表明在显著性水平α=0.05下,当其他解释变量不变的情况下,和国际旅游人数X 2对各省市旅游外汇收入Y 有显著性影响。 ⑶正对H O :β1=β2=0,给定显著水性水平α=0.05,自由度为k-1=2,n-k=28的临界值 F 0.05(2,28)=3.34038。由题已知F=191.1894>F 0.05(2,28)=3.34038,应拒绝原假设 H O :β1=β2=0,说明回归方程显著,即旅行社职工人数和旅游人数变量联合起来对各省市旅游外汇收入有显著影响。 2、⑴样本容量n=15 残差平方和RSS=66042-65965=77 回归平方和ESS 的自由度为K-1=2 残差平方和RSS 的自由度为n-k=13 ⑵可决系数R 2=TSS ESS =6604265965 =0.99883 调整的可决系数R 2=1-(1-R 2)k n n --1=1-(1-0.99883)1214=0.99863 ⑶利用可决系数R 2=0.99883,调整的可决系数R 2=0.99863,说明模型对样本的拟合很好。不能确定两个解释变量X 2和X 3个字对Y 都有显著影响。

计量经济学(庞浩)第五章练习题参考解答

第五章练习题参考解答 练习题 5.1 设消费函数为 i i i i u X X Y +++=33221βββ 式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差 项,并且2 22)(,0)(i i i X u Var u E σ==(其中2 σ为常数) 。试回答以下问题: (1)选用适当的变换修正异方差,要求写出变换过程; (2)写出修正异方差后的参数估计量的表达式。 5.2 根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。例如,设模型为u X Y 21β β=,对该模型中的变量取对数后得如下形式 u X Y ln ln ln ln 21++=ββ (1)如果u ln 要有零期望值,u 的分布应该是什么? (2)如果1)(=u E ,会不会0)(ln =u E ?为什么? (3)如果)(ln u E 不为零,怎样才能使它等于零? 5.3 由表中给出消费Y 与收入X 的数据,试根据所给数据资料完成以下问题: (1)估计回归模型u X Y ++=21ββ中的未知参数1β和2β,并写出样本回归模型的书写格式; (2)试用Goldfeld-Quandt 法和White 法检验模型的异方差性; (3)选用合适的方法修正异方差。 Y X Y X Y X 55 80 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80 110 180 260 110 160

79120135190125165 84115140205115180 98130178265130185 95140191270135190 90125137230120200 7590189250140205 741055580140210 1101607085152220 1131507590140225 12516565100137230 10814574105145240 11518080110175245 14022584115189250 12020079120180260 14524090125178265 13018598130191270 5.4由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求: (1)试建立我国北方地区农业产出线性模型; (2)选用适当的方法检验模型中是否存在异方差; (3)如果存在异方差,采用适当的方法加以修正。 地区农业总产值农业劳动力灌溉面积化肥用量户均固定农机动力(亿元)(万人)(万公顷)(万吨)资产(元)(万马力) 北京19.6490.133.847.5394.3435.3天津14.495.234.95 3.9567.5450.7河北149.91639 .0357.2692.4706.892712.6山西55.07562.6107.931.4856.371118.5内蒙古60.85462.996.4915.41282.81641.7辽宁87.48588.972.461.6844.741129.6吉林73.81399.769.6336.92576.81647.6黑龙江104.51425.367.9525.81237.161305.8山东276.552365.6456.55152.35812.023127.9河南200.022557.5318.99127.9754.782134.5陕西68.18884.2117.936.1607.41764 新疆49.12256.1260.4615.11143.67523.3 5.5表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量

庞皓计量经济学 第三章练习题及参考解答 (第3版)

第三章练习题及参考解答 3.1 第三章的“引子”中分析了,经济增长、公共服务、市场价格、交通状况、社会环境、政策因素,都会影响中国汽车拥有量。为了研究一些主要因素与家用汽车拥有量的数量关系,选择“百户拥有家用汽车量”、“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”等变量,2011年全国各省市区的有关数据如下: 表3.6 2011年各地区的百户拥有家用汽车量等数据 资料来源:中国统计年鉴2012.中国统计出版社

1)建立百户拥有家用汽车量计量经济模型,估计参数并对模型加以检验,检验结论 的依据是什么?。 2)分析模型参数估计结果的经济意义,你如何解读模型估计检验的结果? 3) 你认为模型还可以如何改进? 【练习题3.1参考解答】: 1)建立线性回归模型: 1223344t t t t t Y X X X u ββββ=++++ 回归结果如下: 由F 统计量为17.87881, P 值为0.000001,可判断模型整体上显著, “人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”等变量联合起来对百户拥有家用汽车量有显著影响。解释变量参数的t 统计量的绝对值均大于临界值0.025(27) 2.052t =,或P 值均明显小于0.05α=,表明在其他变量不变的情况下,“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”分别对百户拥有家用汽车量都有显著影响。 2)X2的参数估计值为5.9911,表明随着经济的增长,人均地区生产总值每增加1万元,平均说来百户拥有家用汽车量将增加近6辆。由于城镇公共交通的大力发展,有减少家用汽车的必要性,X3的参数估计值为-0.5231,表明随着城镇化的推进,“城镇人口比重”每增加1%,平均说来百户拥有家用汽车量将减少0.5231辆。汽车价格和使用费用的提高将抑制家用汽车的使用, X4的参数估计值为-2.2677,表明随着家用汽车使用成本的提高, “交通工具消费价格指数”每增加1个百分点,平均说来百户拥有家用汽车量将减少2.2677辆。 3)模型的可决系数为0.6652,说明模型中解释变量变解释了百户拥有家用汽车量变动的66.52%,还有33.48%未被解释。影响百户拥有家用汽车量的因素可能还有交通状况、社会环境、政策因素等,还可以考虑纳入一些解释变量。但是使用更多解释变量或许会面临某些基本假定的违反,需要采取一些其他措施。

计量经济学(第四版)习题及参考答案详细版

计量经济学(第四版)习题参考答案 潘省初

第一章 绪论 1.1 试列出计量经济分析的主要步骤。 一般说来,计量经济分析按照以下步骤进行: (1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项? 为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。 1.3什么是时间序列和横截面数据? 试举例说明二者的区别。 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。 横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 1.4估计量和估计值有何区别? 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如Y 就是一个估计量,1 n i i Y Y n == ∑。现有一样本,共4个数,100,104,96,130,则 根据这个样本的数据运用均值估计量得出的均值估计值为 5.1074 130 96104100=+++。 第二章 计量经济分析的统计学基础 2.1 略,参考教材。

2.2请用例2.2中的数据求北京男生平均身高的99%置信区间 N S S x = =45 =1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684 也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体? 原假设 120:0=μH 备择假设 120:1≠μH 检验统计量 () 10/25X X μσ-Z == == 查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化? 原假设 : 2500:0=μH 备择假设 : 2500:1≠μH ()100/1200.83?X X t μσ-= === 查表得 131.2)116(025.0=-t 因为t = 0.83 < 131.2=c t , 故接受原假 设,即从上次调查以来,平均月销售额没有发生变化。

《计量经济学》第三版例题stata解答

第二章 例2.1.1(p24) (1)表2.1.2中E(Y|X=800)即条件均值的求法,将数据直接复制到stata 中。 程序: sum y if x==800 程序: 程序: (2)图2.1.1的做法: 程序: twoway(scatter y x )(lfit y x ),title("不同可支配收入水平组家庭消费支出的条件分布图")xtitle("每月可支配收入(元)")ytitle("每月消费支出(元)")xtick(500(500)4000)ytick(0(500)3500)

例2.3.1(p37) 将数据直接复制到stata 中 程序: (1) total xiyi return list scalars: r(skip) = 0 r(first) = 1 r(k_term) = 0 r(k_operator) = 0 r(k) = 0 r(k_level) = 0 r(output) = 1 r(b) = 4974750 r(se) = 1507820.761894463 g a=r(b) in 1 total xi2 xiyi 4974750 1507821 1563822 8385678 Total Std. Err. [95% Conf. Interval] Scatter 表示散点图选项, lfit 表示回归线,title 表示 题目,xtick 表示刻度,(500 (500)4000)分别表示起 始刻度,中间数表示以单 位刻度,4000表示最后的 刻度。要注意的是命令中 的符号都要用英文字符, 否则命令无效。

return list g b=r(b) in 1 di a/b .67 (2) mean Yi gen m=r(b) in 1 mean Xi g n=r(b) in 1 di m-n*0.67 142.4 由此得到回归方程:Y=142.4+0.67Xi 例2.6.2(p53) 程序:(1)回归 reg y x

计量经济学第三章课后习题详解

第三章习题 3.1 2011年各地区的百户拥有家用汽车量等数据 北京37.71 8.05 86.20 95.92 天津20.62 8.34 80.50 103.57 河北23.32 3.39 45.60 99.03 山西18.60 3.13 49.68 98.96 19.62 5.79 56.62 99.11 内蒙 古 辽宁11.15 5.07 64.05 100.12 吉林11.24 3.84 53.40 97.15 黑龙 5.29 3.28 5 6.50 100.54 江 上海18.15 8.18 89.30 101.58 江苏23.92 6.22 61.90 98.95 浙江33.85 5.92 62.30 96.69 安徽9.20 2.56 44.80 100.25 福建17.83 4.72 58.10 100.75 江西8.88 2.61 45.70 100.91 山东28.12 4.71 50.95 98.50 河南14.06 2.87 40.57 100.59 湖北9.69 3.41 51.83 101.15 湖南12.82 2.98 45.10 100.02 广东30.71 5.07 66.50 97.55 广西17.24 2.52 41.80 102.28 海南15.82 2.88 50.50 102.06 重庆10.44 3.43 55.02 99.12 四川12.25 2.61 41.83 99.76 贵州10.48 1.64 34.96 100.71 云南23.32 1.92 36.80 96.25 西藏25.30 2.00 22.71 99.95 陕西12.22 3.34 47.30 101.59 甘肃7.33 1.96 37.15 100.54 青海 6.08 2.94 46.22 100.46 宁夏12.40 3.29 49.82 100.99 新疆12.32 2.99 43.54 100.97 一、研究的目的和要求 经济增长,公共服务、市场价格、交通状况,社会环境、政策因素都会影响中国汽车拥有量。为了研究一些主要因素与家用汽车拥有量的数量关系,选择“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”等变量来进行研究和分析。 为了研究影响2011年各地区的百户拥有家用汽车量差异的主要原因,分析2011年各地区的百户拥有家用汽车量增长的数量规律,预测各地区的百户拥有家用汽车量的增长趋势,需要建立计量经济模型。 二、模型设定 为了探究影响2011年各地区的百户拥有家用汽车量差异的主要原因,选择百户拥有家用汽车量为被解释变量,人均GDP、城镇人口比重、交通工具消费价格指数为解释变量。

计量经济学作业第5章(含答案)

计量经济学作业第5章(含答案)

第5章习题 一、单项选择题 1.对于一个含有截距项的计量经济模型,若某定性因素有m个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为() A. m B. m-1 C. m+1 D. m-k 2.在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X的回归关系明显不同。现以1991年为转折时期,设虚拟变 量,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作() A. B. C. D. 3.对于有限分布滞后模型 在一定条件下,参数可近似用一个关于的阿尔蒙多项式表示(),其中多项式的阶数m必须满足() A. B. C. D. 4.对于有限分布滞后模型,解释变量的滞后长度每增加一期,可利用的样本数据就会( ) A. 增加1个 B. 减少1个 C. 增加2个 D. 减少2个 5.经济变量的时间序列数据大多存在序列相关性,在分布滞后模型中,这种序列相关性就转化为() A.异方差问题 B. 多重共线性问题

C.序列相关性问题 D. 设定误差问题 6.将一年四个季度对因变量的影响引入到模型中(含截距项),则需要引入虚拟变量的个数为() A. 4 B. 3 C. 2 D. 1 7.若想考察某两个地区的平均消费水平是否存在显著差异,则下列那个模型比 较适合(Y代表消费支出;X代表可支配收入;D 2、D 3 表示虚拟变量)() A. B. C. D. 二、多项选择题 1.以下变量中可以作为解释变量的有() A. 外生变量 B. 滞后内生变量 C. 虚拟变量 D. 先决变量 E. 内生变量 2.关于衣着消费支出模型为:,其中 Y i 为衣着方面的年度支出;X i 为收入, ? ? ? =女性 男性 1 2i D; ? ? ? =大学毕业及以上 其他 1 3i D 则关于模型中的参数下列说法正确的是() A.表示在保持其他条件不变时,女性比男性在衣着消费支出方面多支出(或少支出)差额 B.表示在保持其他条件不变时,大学毕业及以上比其他学历者在衣着消费支出方面多支出(或少支出)差额 C.表示在保持其他条件不变时,女性大学及以上文凭者比男性和大学以下文凭者在衣着消费支出方面多支出(或少支出)差额 D. 表示在保持其他条件不变时,女性比男性大学以下文凭者在衣着消费支出方面多支出(或少支出)差额 E. 表示性别和学历两种属性变量对衣着消费支出的交互影响 三、判断题

计量经济学课后习题答案

计量经济学练习题 第一章导论 一、单项选择题 ⒈计量经济研究中常用的数据主要有两类:一类是时间序列数据,另一类是【 B 】 A 总量数据 B 横截面数据 C平均数据 D 相对数据 ⒉横截面数据是指【 A 】 A 同一时点上不同统计单位相同统计指标组成的数据 B 同一时点上相同统计单位相同统计指标组成的数据 C 同一时点上相同统计单位不同统计指标组成的数据 D 同一时点上不同统计单位不同统计指标组成的数据 ⒊下面属于截面数据的是【 D 】 A 1991-2003年各年某地区20个乡镇的平均工业产值 B 1991-2003年各年某地区20个乡镇的各镇工业产值 C 某年某地区20个乡镇工业产值的合计数 D 某年某地区20个乡镇各镇工业产值 ⒋同一统计指标按时间顺序记录的数据列称为【 B 】 A 横截面数据 B 时间序列数据 C 修匀数据 D原始数据 ⒌回归分析中定义【 B 】 A 解释变量和被解释变量都是随机变量 B 解释变量为非随机变量,被解释变量为随机变量 C 解释变量和被解释变量都是非随机变量 D 解释变量为随机变量,被解释变量为非随机变量 二、填空题 ⒈计量经济学是经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论,可以理解为数学、统计学和_经济学_三者的结合。

⒉现代计量经济学已经形成了包括单方程回归分析,联立方程组模型,时间序列分 析三大支柱。 ⒊经典计量经济学的最基本方法是回归分析。 计量经济分析的基本步骤是:理论(或假说)陈述、建立计量经济模型、收集数据、计量经济模型参数的估计、检验和模型修正、预测和政策分析。 ⒋常用的三类样本数据是截面数据、时间序列数据和面板数据。 ⒌经济变量间的关系有不相关关系、相关关系、因果关系、相互影响关系和恒 等关系。 三、简答题 ⒈什么是计量经济学它与统计学的关系是怎样的 计量经济学就是对经济规律进行数量实证研究,包括预测、检验等多方面的工作。计量经济学是一种定量分析,是以解释经济活动中客观存在的数量关系为内容的一门经济学学科。 计量经济学与统计学密切联系,如数据收集和处理、参数估计、计量分析方法设计,以及参数估计值、模型和预测结果可靠性和可信程度分析判断等。可以说,统计学的知识和方法不仅贯穿计量经济分析过程,而且现代统计学本身也与计量经济学有不少相似之处。例如,统计学也通过对经济数据的处理分析,得出经济问题的数字化特征和结论,也有对经济参数的估计和分析,也进行经济趋势的预测,并利用各种统计量对分析预测的结论进行判断和检验等,统计学的这些内容与计量经济学的内容都很相似。反过来,计量经济学也经常使用各种统计分析方法,筛选数据、选择变量和检验相关结论,统计分析是计量经济分析的重要内容和主要基础之一。 计量经济学与统计学的根本区别在于,计量经济学是问题导向和以经济模型为核心的,而统计学则是以经济数据为核心,且常常是数据导向的。典型的计量经济学分析从具体经济问题出发,先建立经济模型,参数估计、判断、调整和预测分析等都是以模型为基础和出发点;典型的统计学研究则并不一定需要从具体明确的问题出发,虽然也有一些目标,但可以是模糊不明确的。虽然统计学并不排斥经济理论和模型,有时也会利用它们,但统计学通常

计量经济学第三章练习题及参考全部解答

第三章练习题及参考解答 3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y ,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下: i i i X X Y 215452.11179.00263.151?++-= t=(-3.066806) (6.652983) (3.378064) R 2=0.934331 92964.02 =R F=191.1894 n=31 1)从经济意义上考察估计模型的合理性。 2)在5%显著性水平上,分别检验参数21,ββ的显著性。 3)在5%显著性水平上,检验模型的整体显著性。 练习题3.1参考解答: (1)由模型估计结果可看出:从经济意义上说明,旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。这与经济理论及经验符合,是合理的。 (2)取05.0=α,查表得048.2)331(025.0=-t 因为3个参数t 统计量的绝对值均大于048.2)331(025.0=-t ,说明经t 检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。 (3)取05.0=α,查表得34.3)28,2(05.0=F ,由于34.3)28,2(1894.19905.0=>=F F ,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。 3.2 表3.6给出了有两个解释变量2X 和.3X 的回归模型方差分析的部分结果: 表3.6 方差分析表 1)回归模型估计结果的样本容量n 、残差平方和RSS 、回归平方和ESS 与残差平方和RSS 的自由度各为多少? 2)此模型的可决系数和调整的可决系数为多少? 3)利用此结果能对模型的检验得出什么结论?能否确定两个解释变量2X 和.3X 各自对Y 都有显著影响? 练习题3.2参考解答: 变差来源 平方和(SS ) 自由度(df) 方差 来自回归(ESS) 来自残差(RSS) 总变差(TSS) 65965 — 66042 — — 14 — —

计量经济学第三章课后习题

(1)估计回归方程的参数及随机干扰项的方差∧2σ,计算2R及2R。(2)对方程进行F检验,对参数进行t检验,并构造参数95%的置信区间。 (3)如果商品单价变为35元,则某一月收入为20000元的家庭消费支出估计是多少?构造该估计值的95%的置信区间。(个值与均值)R代码与输出结果: x1=c(23.56,24.44,32.07,32.46,31.15,34.14,35.3,38.7,39.63,46.68) x2=c(7620,9120,10670,11160,11900,12920,14340,15960,18000,19300) y=c(591.9,654.5,623.6,647,674,644.4,680,724,757.1,706.8) nx1=length(x1) nx2=length(x2) ny=length(y) nx1;nx2;ny lm.1=lm(y~x1+x2) summary(lm.1) Call: lm(formula = y ~ x1 + x2) Residuals: Min 1Q Median 3Q Max -22.014 -14.084 4.591 10.502 19.640

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 626.509285 40.130100 15.612 1.07e-06 *** x1 -9.790570 3.197843 -3.062 0.01828 * x2 0.028618 0.005838 4.902 0.00175 ** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’1 Residual standard error: 17.39 on 7 degrees of freedom Multiple R-squared: 0.9022, Adjusted R-squared: 0.8743 F-statistic: 32.29 on 2 and 7 DF, p-value: 0.0002923 由输出结果显示,两个解释变量的估计值为-9.79057、0.028618。对方程进行F检验,其中F统计量的值为32.29,P值为0.0002923小于0.05,拒绝原假设,即认为该方程显著;对参数进行t检验,其P 值分别为0.01828、0.00175,均小于0.05,则拒绝原假设,即该回归参数显著。 anova(lm.1)#方差分析表 Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x1 1 12265.1 12265.1 40.558 0.0003785 ***

计量经济学作业第5章(含答案)

计量经济学作业第5章(含答案)

、单项选择题 1 ?对于一个含有截距项的计量经济模型,若某定性因素有 D. m-k 2 ?在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例 如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出 丫 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 [1 1991# WS D =< 量 r [O f 1毀坪以前,数据散点图显示消费函数发生了结构性变化:基本 消费部分下降了,边际消费倾向变大了。贝U 城镇居民线性消费函数的理论方程 可以写作( ) A. h 二几+耳扎+如)拓+斗 3. 对于有限分布滞后模型 在一定条件下,参数儿可近似用一个关于【的阿尔蒙多项式表示 ),其中多项式的阶数 m 必须满足( ) A .障匚上 B . m k C . D .用上上 4. 对于有限分布滞后模型,解释变量的滞后长度每增加一期,可利用的样本数 据就会( ) A.增加1个 B.减少1个 C.增加2个 D.减 少2个 5. 经济变量的时间序列数据大多存在序列相关性,在分布滞后模型中,这种序 列相关性就转化为( ) A. m B. m-1 C. m+1 将其引入模型中,则需要引入虚拟变量个数为( m 个互斥的类型,为 ) B. C. Y 讦 A+ +"0+ 斗 D.

A.异方差冋 题 B.多重 共线性问题

问题 6. 将一年四个季度对因变量的影响引入到模型中(含截 距项),则需要引入虚 拟变量的个数为( ) A. 4 B. 3 C. 2 D. 1 7. 若 想考察某两个地区的平均消费水平是否存在显著差异,则下列那个模型比 较适合(丫代表消费支出;X 代表可支配收入;D 2、D 3表示虚拟变量) () A.Yj"+陆+野 B . 二、多项选择题 1. 以下变量中可以作为解释变量的有 ( ) A.外生变量 B.滞后内生变量 C.虚 拟变量 D.先决变量 E.内生变量 2. 关于衣着消费支出模型为:h 吗+叩左+必史+勺3工』』+ "逅+色,其中 丫为衣着万面的年度支出;X 为收入, 1 女性 "i 大学毕业及以上 D = : D 3i =J o 男性, 3i 其他 则关于模型中的参数下列说法正确的是( ) A. $表示在保持其他条件不变时,女性比男性在衣着消费支出方面多支出 (或少 支出)差额 B. 珂表示在保持其他条件不变时,大学毕业及以上比其他学历者在衣着消 费支 出方面多支出(或少支出)差额 C. 5表示在保持其他条件不变时,女性大学及以上文凭者比男性和大学以 下文凭 者在衣着消费支出方面多支出(或少支出)差额 D. 表示在保持其他条件不变时,女性比男性大学以下文凭者在衣着消 费支出方面多支出(或少支出)差额 E. 表示性别和学历两种属性变量对衣着消费支出的交互影响 、判断题 1 ?通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容 C.序列相关性问题 D.设定误差 £ =坷++以叭JQ+舛 C. 】 D 丄吗皿吗+风+儿

第三章计量经济学练习题参考解答教学资料

第三章计量经济学练习题参考解答

第三章练习题参考解答 练习题 3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y ,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下: i i i X X Y 215452.11179.00263.151?++-= t=(-3.066806) (6.652983) (3.378064) R 2=0.934331 92964.02=R F=191.1894 n=31 (1)从经济意义上考察估计模型的合理性。 (2)在5%显著性水平上,分别检验参数21,ββ的显著性。 (3)在5%显著性水平上,检验模型的整体显著性。 3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数: 367.693Y =, 1402.760X =, 28.0X =, 15n =, 2()66042.269i Y Y -=∑, 211()84855.096i X X -=∑, 222()280.000i X X -=∑, 11()()74778.346i i Y Y X X --=∑, 22()()4250.900i i Y Y X X --=∑, 1122()()4796.000i i X X X X --=∑ 3.3 经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据:

(1) 建立家庭书刊消费的计量经济模型; (2)利用样本数据估计模型的参数; (3)检验户主受教育年数对家庭书刊消费是否有显著影响; (4)分析所估计模型的经济意义和作用 3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve )”模型: t t t t u X X Y +++=33221βββ 其中:t Y =实际通货膨胀率(%);t X 2=失业率(%);t X 3=预期的通货膨胀率(%) 下表为某国的有关数据, 表1. 1970-1982年某国实际通货膨胀率Y (%),

第三章答案计量经济学

3.8表1中列出了1995年北京市规模最大的20家百货零售商店的商品销售收入X和销售利润Y的统计资料。 表格 1 (1)根据Y,X的相关图分析异方差性; (2)利用Goldfeld-Quandt检验,White检验,Park检验和Gleiser检验进行异方差性检验; (3)利用WLS方法估计利润函数. 答: (1)由相关图初步判断模型存在递增型异方差

(2)Goldfeld-Quandt检验 中间剔除的数据个数C=20/4=5 则样本1和样本2的样本数为(20-5)/2=7 操作步骤: Smpl 1 7 Ls y c x 得到RSS1=0.858264 Smpl 14 20 Ls y c x 得到RSS2=38.08500

Smpl 1 20 Genr f=38.08500/0.858264 得到:F=38.08500/0.858264=44.3745,大于)117,117(05.0----F =5.05,表明模型存在递增型异方差。 White 检验 操作步骤 LS Y C X 方程窗口下拉View\residual test\ White Heteroskedasticity Test nR 2=8.413667,其伴随概率为0.014893,小于给定的显著性水平α=0.05,拒绝原 假设,认为回归模型存在异方差。 Park 方法: 操作步骤 Ls y c x Genr lne2=log(resid^2) Genr lnx=log(x) Ls lne2 c lnx

①Ln(e 2t )=-7.6928+1.83936Ln(x t ) R 2=0.365421,F=10.36527,prob (F)=0.004754 Gleises 方法: 操作步骤 Ls y c x Genr e1=abs(resid) Ls e1 c x Ls e1 c x^(1/2) Ls e1 c x^2 ②t e =-0.03529+0.01992x t R 2=0.5022, F=18.15856,prob(F)=0.000047 ③t e =-1.25044+0.32653t X

第三版计量经济学第五章习题作业

第五章习题2 根据经济理论建立计量经济模型 i i 10i X Y μββ++= 应用EViews 输出的结果如图1所示。 图1 用普通最小二乘法的估计结果如下: )29,...,2,1(707955.013179.58=+=∧ i X Y i i 利用上述结果计算残差∧ =i i i Y -Y e 。观察i e 的取值,好像随i X 的变化而变化,怀疑模型存在异方差性,下面通过等级相关系数和戈德菲尔特—夸特方法检验随机误差项的异方差性。 1.斯皮尔曼等级相关系数检验 按照斯皮尔曼等级相关检验的步骤,先将X 的样本观测值从小到大排列并划分等级,然后将i e 从小到大划分等级,计算i X 的等级与相应产生的i e 的等级的差i d 及2i d ,详见表1。 表1

计算等级相关系数 2334d 1 i 2i =∑= 0.42512329 -292334 6- 1N -N d 6- 1r 3 3 1i 2i =?==∑= 对等级相关系数进行检验,提出原假设与备择假设 ) ,(),(::28 1 0N 1-N 10N ~r 0 H 0H 10=≠=ρρ 构造Z 统计量 2.2495428*0.4251231 -N 1r Z ===

给定显著水平0.05=α,查正态分布表,得 1.96Z 2 =α因为 1.962.24954Z >=, 所以应拒绝原假设,接收备择假设,即等级相关系数显著,说明其随机误差项存在异方差性。 2. 戈德菲尔特—夸特方法检验 将X 的样本观测值按升序排列,Y 的样本观测值按原来与X 样本观测值的对应关系进行排列,略去中心7个数据,将剩下的22个样本观测值分成容量相等的两个子样本,每个子样本的样本观测值个数均为11。排列结果见表2。 用第一个子样本估计模型,得到的结果如图2所示: 图2

计量经济学课后习题答案汇总

计量经济学课后习题答 案汇总 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

计量经济学练习题 第一章导论 一、单项选择题 ⒈计量经济研究中常用的数据主要有两类:一类是时间序列数据,另一类是【 B 】 A 总量数据 B 横截面数据 C平均数据 D 相对数据 ⒉横截面数据是指【 A 】 A 同一时点上不同统计单位相同统计指标组成的数据 B 同一时点上相同统计单位相同统计指标组成的数据 C 同一时点上相同统计单位不同统计指标组成的数据 D 同一时点上不同统计单位不同统计指标组成的数据 ⒊下面属于截面数据的是【 D 】 A 1991-2003年各年某地区20个乡镇的平均工业产值 B 1991-2003年各年某地区20个乡镇的各镇工业产值 C 某年某地区20个乡镇工业产值的合计数 D 某年某地区20个乡镇各镇工业产值 ⒋同一统计指标按时间顺序记录的数据列称为【 B 】 A 横截面数据 B 时间序列数据 C 修匀数据 D原始数据 ⒌回归分析中定义【 B 】 A 解释变量和被解释变量都是随机变量 B 解释变量为非随机变量,被解释变量为随机变量 C 解释变量和被解释变量都是非随机变量 D 解释变量为随机变量,被解释变量为非随机变量 二、填空题 ⒈计量经济学是经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论,可以理解为数学、统计学和_经济学_三者的结合。 ⒉现代计量经济学已经形成了包括单方程回归分析,联立方程组模型,时间序列 分析三大支柱。

⒊经典计量经济学的最基本方法是回归分析。 计量经济分析的基本步骤是:理论(或假说)陈述、建立计量经济模型、收集数据、计量经济模型参数的估计、检验和模型修正、预测和政策分析。 ⒋常用的三类样本数据是截面数据、时间序列数据和面板数据。 ⒌经济变量间的关系有不相关关系、相关关系、因果关系、相互影响关系 和恒等关系。 三、简答题 ⒈什么是计量经济学它与统计学的关系是怎样的 计量经济学就是对经济规律进行数量实证研究,包括预测、检验等多方面的工作。计量经济学是一种定量分析,是以解释经济活动中客观存在的数量关系为内容的一门经济学学科。 计量经济学与统计学密切联系,如数据收集和处理、参数估计、计量分析方法设计,以及参数估计值、模型和预测结果可靠性和可信程度分析判断等。可以说,统计学的知识和方法不仅贯穿计量经济分析过程,而且现代统计学本身也与计量经济学有不少相似之处。例如,统计学也通过对经济数据的处理分析,得出经济问题的数字化特征和结论,也有对经济参数的估计和分析,也进行经济趋势的预测,并利用各种统计量对分析预测的结论进行判断和检验等,统计学的这些内容与计量经济学的内容都很相似。反过来,计量经济学也经常使用各种统计分析方法,筛选数据、选择变量和检验相关结论,统计分析是计量经济分析的重要内容和主要基础之一。 计量经济学与统计学的根本区别在于,计量经济学是问题导向和以经济模型为核心的,而统计学则是以经济数据为核心,且常常是数据导向的。典型的计量经济学分析从具体经济问题出发,先建立经济模型,参数估计、判断、调整和预测分析等都是以模型为基础和出发点;典型的统计学研究则并不一定需要从具体明确的问题出发,虽然也有一些目标,但可以是模糊不明确的。虽然统计学并不排斥经济理论和模型,有时也会利用它们,但统计学通常不一定需要特定的经济理论或模型作为基础和出发点,常常是通过对经济数据的统计处理直接得出结论,统计学侧重的工作是经济数据的采集、筛选和处理。 此外,计量经济学不仅是通过数据处理和分析获得经济问题的一些数字特征,而且是借助于经济思想和数学工具对经济问题作深刻剖析。经过计量经济分析实证检验的经济理论和模型,能够对分析、研究和预测更广泛的经济问题起重要作用。计量经济学从

计量经济学第三章练习题及参考全部解答

第三章练习题及参考解答 为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y ,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下: i i i X X Y 215452.11179.00263.151?++-= t= R 2 = 92964.02 =R F= n=31 1)从经济意义上考察估计模型的合理性。 2)在5%显著性水平上,分别检验参数21,ββ的显著性。 3)在5%显著性水平上,检验模型的整体显著性。 练习题参考解答: (1)由模型估计结果可看出:从经济意义上说明,旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加百万美元;国际旅游人数增加1万人次,旅游外汇收入增加百万美元。这与经济理论及经验符合,是合理的。 (2)取05.0=α ,查表得048.2)331(025.0=-t 因为3个参数t 统计量的绝对值均大于048.2)331(025.0=-t ,说明经t 检验3个参数均显著不为0,即旅行社职工人数 和国际旅游人数分别对旅游外汇收入都有显著影响。 (3)取05.0=α ,查表得34.3)28,2(05.0=F ,由于34.3)28,2(1894.19905.0=>=F F ,说明旅行社职工 人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。 表给出了有两个解释变量 2X 和.3X 的回归模型方差分析的部分结果: 1)回归模型估计结果的样本容量n 、残差平方和RSS 、回归平方和ESS 与残差平方和RSS 的自由度各为多少 2)此模型的可决系数和调整的可决系数为多少 3)利用此结果能对模型的检验得出什么结论能否确定两个解释变量 2X 和.3X 各自对Y 都有显著影响 练习题参考解答: (1) 因为总变差的自由度为14=n-1,所以样本容量:n=14+1=15 因为 TSS=RSS+ESS 残差平方和RSS=TSS-ESS=66042-65965=77 回归平方和的自由度为:k-1=3-1=2 残差平方和RSS 的自由度为:n-k=15-3=12 (2)可决系数为:2 65965 0.99883466042 ES R TSS S = == 修正的可决系数:2 2 2115177 110.998615366042 i i e n R n k y --=- =-?=--∑∑ (3)这说明两个解释变量2X 和.3X 联合起来对被解释变量有很显著的影响,但是还不能确定两个解释变量2X 和.3X 各 自对Y 都有显著影响。

相关文档
最新文档