光华管理学院古典线性回归模型
第四章--经典线性回归模型(高级计量经济学-清华大学-潘文清)PPT课件

.
11
• 一些有用的等式
(1) (2) 因为 (3)
则
且 (4)
X’e=0
b-=(X’X)-1X’
b=(X’X)-1X’Y=(X’X)-1X’(X+)=+(X’X)-1X’
定义nn方阵:
P=X(X’X)-1X’ , M=In-P P=P’ , M=M’
P2=P, M2=M
PX=X, MX=On(k+1) e=MY=M
SSR(b)=e’e=Y’MY=’M
.
12
三、高斯-马尔科夫定理
Gauss-Markov Theorem
•Question: OLS估计量的统计性质如何?
(1)[Unbiaseness] E(b|X)=, E(b)=
E(b|X)=E[(+(X’X)-1X’)|X]=+(X’X)-1X’E(|X)=
注意:
(1) 假设4可写成
E(ij|X)=2ij,
其中, i= j时,ij=1; i≠j时,ij=0
矩阵形式: E(’)=2I
.
7
(2)由假设2,
Var(i|X)=E(i2|X)-E[(i|X)]2=E(i|X)=2
同理, Cov(i,j|X)=E(ij|X)=0
(3) 假设4意味着存在非条件同方差性:
(2) 由于可以有j≤i, 或j>i, 意味着i既不依赖过去的X, 也不依赖于未来的X。因此排除了动态模型。
例:对AR(1)模型: Yi=0+1Yi-1+i=Xi’+i
这里Xi=(1, Yi-1)’,显然E(Xii)=E(Xi)E(i)=0,但
E(Xi+1i)≠0。因此,E(i|X关于严格外生性有其他的定义。 如定义为i独立于X,或X是非随机的。这一定义排 除了条件异方差性。而我们这里的假设2是允许存在 条件异方差性的。
古典线性回归模型

概率(Probability)对于一个随机事件A,用一个数P (A)来表示该事件发生的可能性大小,这个数P(A) 就称为随机事件A的概率,因此,概率度量了随机事 件发生的可能性的大小。 概率的定义 定义在事件域F上的一个集合函数P称为概率,如果 它满足如下三个条件: (i)P(A)≥0,对一切 F (ii)P(Ω)=1; P A A F (iii)若 ,i=1,2…,且两两互不相容,则 P( A ) 性质(iii)称为可列可加性(conformable addition) 或完全可加性。
某工厂用机器生产商品,当机器运转正常时,产品 合格率为98%,当机器发生故障时,产品合格率为 55%。每天开工的时候,机器运转正常的规律为95%。 已知某日早上第一件产品为合格品,则机器调整良 好的概率是多少? A:机器运转正常。B:合格品
P( A | B) P( AB) P( B | A) P( A) P( B | A) P( A) P( B) P( B) P( B | A) P( A) P( B | A) P( A)
由这个定义,其取值一定在-1和1之间。如果X和Y是相互独 立的,那么ρXY =0。如果Y=aX+b,这里a,b是不等于0的常数, 那么|ρXY|=1,此时,我们说X和Y是完全相关的。X和Y的值越 接近线性关系,|ρXY|值接近1。
相关系数=0能证明两个变量 不相关吗? 什么情况下等于1,什么情 况下等于-1?
3000
1500
2000
2500
a=5250,b=-800
回归的本质就是寻找y的平均值(在x的条 件下)
3
3.5 s w
4 Fitted values
北大光华金融硕士统计学考研讲义-多元回归分析

容易推出:在(1-)的置信水平下i的置信区间是
($i
t
2
s$i , $i
t
2
s$i )
其中,t/2为显著性水平为 、自由度为n-k1的临界值。
如何才能缩小置信区间?
• 增大样本容量n,因为在同样的样本容量下, n越大,t分布表中的临界值越小,同时,增大 样本容量,还可使样本参数估计量的标准差减 小;
注意:一元线性回归中,t检验与F检验一致
(不过多元的就没那么简单的关系了!)
一方面,t检验与F检验都是对相同的原假设 H0:1=0 进行检验;
另一方面,两个统计量之间有如下关系:
四、参数的置信区间
参数的置信区间用来考察:在一次抽样中所 估计的参数值离参数的真实值有多“近”。
在变量的显著性检验中已经知道:
总体回归函数的随机表达形式为
Yi 0 1 X1i 2 X 2i k X ki i
可以看到是对应于一元线形回归模型的,是一元线性回归模型的 自然引申与扩展!
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,X j每变化1个单位时,Y的 均值E(Y)的变化;
一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间
一、拟合优度检验
1、判定系数与调整的判定系数 总离差平方和的分解
则 TSS (Yi Y )2
((Yi Yˆi ) (Yˆi Y )) 2 (Yi Yˆi )2 2(Yi Yˆi )(Yˆi Y ) (Yˆi Y )2
Yi Y Yi Yˆi Yˆi Y
Yi
Y
2
光华管理学院古典线性回归模型

proc reg data=two; model eret=beta; model eret=beta x1; run; /* 可以看到两个回归结果中,beta的系数几乎相同。理论上应该完全相同*/
• 直观上为什么是这样?
• Ballentine diagram – 交叉部分哪去了? – 多元回归模型,只能反映边际关系(线性关系),联合影响(非 线性关系)无法反映出来
• 例题exer2.sas
/* 分步回归*/ proc reg data=one; model beta=beta2; output out=resout residual=ress; run; /* 第一步,把感兴趣的x对所有其它解释变量回
data one; set wang.exer1_ret09; run; proc sort data=one nodupkey; by id date; run;
proc reg outest=outfile EDF data=one noprint; model dretwd=retindex; by id; run; /* 估计结果输出到文件outfile中, EDF是要输出自由度、R2等指标, noprint是要求估计结果不要出现在output窗口*/
• 实证研究(计量经济分析)与案例研究的根本差别在于前者“看平均 ”,后者“看例子”(奇异值)。 – 前者是科学,后者是艺术,比如西医与中医。现实中更多的是介 乎科学与艺术之间,所以我们要中西医结合。
– 这里u是一个均值为0的随机变量。因为事实上,不可能只有x影响 y,我们把所有其它因素加总到了u中
2022年北京大学光华管理学院金融硕士考研真题考试科目考研经验考

2022年北京大学光华管理学院金融硕士考研真题考试科目考研经验考该文档包括考研就业、2022年真题、2022年育明学员考研经验、金融硕士大纲解析(部分)。
二、北大光华管理金融硕士学费北大光华管理金融硕士学费总额为12.8万元,奖学金:一等奖学金:12.8万元,二等奖学金:6.4万元。
金融硕士是高投入高产出的专业,没有一流的老师就没有一流的学生,请最好的老师培养金融硕士人才,这是行业需要。
考研真题其中微观:第一题亘古不变的考了消费者选择理论,推导消费者对两种商品的最优选择,然后根据这个最优选择推导这两种商品是否是奢侈品,然后再推导是否是吉芬品,说明理由。
第二题考了垄断,市场上有两类消费者,分别给出了需求函数,第一类消费者有10人,第二类消费者有20人,然后问如果垄断厂商采取两部价格定价,并且要使两类消费者都购买,垄断厂商应该如何制定入场费和边际价格;如果只需要保证一种消费者购买,应该如何制定价格策略;最后对比保留两种消费者和保留一种消费者哪个更好。
第三题记得考了厂商理论,一个厂商是价格接受者,给出成本函数,推导供给曲线。
当市场上变成了两个厂商时,平均供给与价格的关系;变成4个时,平均供给与价格的关系;变成无穷多个时平均供给与价格的关系....最后给出了需求函数,求市场均衡,并且指出市场均衡唯一存在条件。
第四题考了古诺均衡和何芬达尔指数,给出H指数的表达式,然后问如果市场上存在n个厂商,在这n个厂商古诺均衡时,证明一个所有厂商总利润与H指数和需求弹性的等式。
然后再这个基础之上将等式变形,指出如何推导。
第五题考了博弈论,有k个目击者,看到了一个犯罪分子,当有人告发时,则犯罪分子会被抓住,此时目击者效用为4;但是目击者都很忙,如果去告发,效用会-1,如果犯罪分子逍遥法外,目击者效用为0,然后问这个博弈的所有纯策略纳什均衡;当k=2时的混合策略纳什均衡;当有k个目击者时的混合策略纳什均衡,并问此时囚犯被抓住的概率(k的函数)。
北大光华管理学院统计学考研真题讲义资料整理

北大光华管理学院金融学考研真题讲义资料整理
各位考研的同学们,大家好!我是才思的一名学员,现在已经顺利的考上某某学校,某某专业,今天和大家分享一下这个专业的真题,方便大家准备考研,希望给大家一定的帮助。
2011年统计学
统计部分(60 分)
1(20 分)
X~N(μ 1 ,4),Y~N(μ 2 ,9)
(1) 求μ=μ 1 -μ 2 ,矩估计量û
(2) 求û的方差
(3) 若由于经费所限,n 1 +n 2 =100 固定,求n 1 、n 2 使得D û最小。
2(20 分)
一家厂商实行三种策略进行销售,X 1 :广告策略,X 2 :低价格策略及最后一种忘了,设为X 3 ,对三种策略销售
情况作为期20 周的观测,得到如下数据:
观测周数样本均值样本方差
20 8 7
20 12 13
20 10 10
α=0.05,问三种策略销售是否有显著差异?
(1) 请写出H 0 及对应的H 1 ?
(2) 写出计算步骤,得到检验统计值
(3) 根据上述调查,得到什么结论?
3(20 分)
假设回归直线过原点,即一元线性回归模型为уi =βx i +εi ,i=1,…,n , εi ~(0,δi
2 ),并且干扰项之间独立。
(1)给定观测值,求β最小二乘估计βols
(2)求Dβols
(3)若δi
2 已知,求β的广义最小二乘估计β
gls
(4)Dβgls
才思教育机构。
2004-2013北京大学光华管理学院考研真题及解析 统计学部分

说明:本套真题为回忆版。 一、判断(2 分/ 题) 1.SSR SST 2.若某企业员工的平均年薪增加 20% ,则他们的福利状况将有所改善。 3.
p 值随着显著性水平 增大而增大(大概这个意思吧)
4.有效性随着样本量 n 的增加而越有效,无偏性与 n 无关
官方网址 北大、人大、中财、北外教授创办 集训营、一对一保分、视频、小班、少干、强军
~
1 n yi ~ n i 1 xi ,问 是否为 的无偏估计;
Var ( ) 与 Var ( ) 的大小。 3.比较 (要用到 Couchy 不等式) 。
三、2005 年统计学 说明:本套真题为回Байду номын сангаас版。
一、设计题(每小题 8 分,共 24 分)
官方网址 北大、人大、中财、北外教授创办 集训营、一对一保分、视频、小班、少干、强军
2 2
官方网址 北大、人大、中财、北外教授创办 集训营、一对一保分、视频、小班、少干、强军
官方网址 北大、人大、中财、北外教授创办 集训营、一对一保分、视频、小班、少干、强军
(2)根据连续变量编制两个统计表,其中一个是采用理论界限,另一个采用实际界限。如果是按照理论界 限编制,试计算出每组的组距。 (14 分) 四、 (15 分)设总体 X 服从正态分布 N( μ ,0.3 ) ,X1,X2,-----,Xn 是总体 X 的一组样本, 试问,样本容量 n 至少应该多大,才能使 P{/ -μ /<0.1}≥0.95? 五、 (10 分)X1,X2,-----,Xn 和 Y1,Y2,-----,Y n 是两组独立同方差的正态的随机变量。他们的期望分别为μ μ y,请在 0.05 的水平下检验如下假设: H0:2μ x=3μ
第五章经典线性回归模型(II)(高级计量经济学-清华大学潘文清)

1、部分回归(partial regression)
Question: 如何解释j为“当其他变量保持不变,Xj 变化一个单位时Y的平均变化”?
Y
X1
在X1与X2影响Y的同时,可 能存在着X1与X2间的相互影
X2
响。如何测度?
将X2中的每一元素Xj (j=k1+1, , k)对X1回归:
Xj=X1(X1’X1)-1X1’Xj+[Xj-X1(X1’X1)-1X1’Xj] 或 X2=X1(X1’X1)-1X1’X2+[X2-X1(X1’X1)-1X1’X2]
因此,只有当2=0或X1与X2正交时,才有E(br|X1)=1
换言之,如果X2是Y的相关解释变量,且与X1非正 交,则略去X2的回归模型对参数的估计是有偏误的, 称为省略变量偏误(omitted variable bias)。
• 方差: 由于 br-E(br|X1)= (X1’X1)-1X1’1 则: Var(br|X1)=E{[br-E(br|X1)] [br-E(br|X1)]’}
1、估计量的方差 在离差形式的二元线性样本回归模型中:
yi=b1x1i+b2x2i+e
一般地,在多元回归中,记 Y=X11+X22+
特别地,假设X2=(Xk1, Xkn)’,即为X中的最后一列
由于曾经得到 b2=2+(X2’M1X2)-1X2’M11
因此
Var(b2)= (X2’M1X2)-1X2’M1E(11’)M1’X2(X2’M1X2)-1 =2(X2’M1X2)-1
2、多重共线性问题
“ The consequences of multicollinearity are that the sampling distribution of the coefficient estimators may have large variances that the coefficient estimates are unstable from sample to sample. Thus they may be too unreliable to be use” (Judge)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例题exer2.sas
libname wang "F:\current_teaching\econometrics_II_2\data";
data one; set wang.exer2_capm; beta2=beta*beta; run;
• 现在可以把所有的拟合误差加总(平方和)
• 最小化总拟合误差:这是一个标准的二次型问题,FOC给出
• 这样我们得到了beta的一组估计值,它使得拟合误差平方和最小. • 直观上,可以加总拟合误差的绝对值,而不是平方。但这里可以看出
,那么目标函数就不是二次型,没有显示解。 • 注意,这个公式可以理解成:先去均值,估计beta1,再估计beta0。
• 许多计量经济分析都可以归纳为“用x来解释y”或者是“y如何随着x 的变化而变化” – 比如
– 检验企业的信息透明度影响其资本成本的理论:资本成本(y)如 何随着信息透明度(x)的变化而变化
– 评估货币工具的效果:将来物价水平(y)如何随着现在的存款准 备金率(x)的变化而变化
• 当然,不可能只有x影响y,计量经济学的基本方法的是“看平均”, 如果平均来说,相同的x总导致相同的y,这时可以不管其它因素,只 要考虑x和y之间的因果关系。 – 平均时,其它因素的影响没有,因此可以假定其它因素不变。这 与经济学的“假定其它不变”的基本方法是一致的 – 因此,大多数的计量经济分析都可以归纳为“建立x和y之间的因 果关系”。
• 很多计量经济学课本也是开始介绍确定性x,然后再推广到随机性。
但这样处理的问题是开始时讨论条件
的前
半部分没有什么意义
• 并且,如果x是确定性的,它就不可能为结果,只有可能为原因,这 时相关关系就够了。
• 确定性x一般出现在可控实验中,金融经济问题一般是非实验问题。
15
第二节:线性回归模型的 OLS估计
–关键在控制变量Gov的选择及内生问题 • 因子预测问题:关键在因子的选择 • 不是金融计量经济学的重点,是实证金融的问题,但我们在第
三章还是给予初步讨论 – 如何分析?
• 包括模型的估计及检验 • 是计量经济学理论的重点
14
• 在数理统计中,也有多元回归模型,那里x是确定性的,而我们这里 的x是随机性的(随机性的一种特例,方差为0时,就是确定性)。
• 直观上为什么是这样?
• Ballentine diagram – 交叉部分哪去了? – 多元回归模型,只能反映边际关系(线性关系),联合影响(非 线性关系)无法反映出来
• 实证研究(计量经济分析)与案例研究的根本差别在于前者“看平均 ”,后者“看例子”(奇异值)。 – 前者是科学,后者是艺术,比如西医与中医。现实中更多的是介 乎科学与艺术之间,所以我们要中西医结合。
– 这里u是一个均值为0的随机变量。因为事实上,不可能只有x影响 y,我们把所有其它因素加总到了u中
– X和y的关系也不可能正好是线性的,但线性是最简单的近似。
2.导入多元线性回归模型
– 模型中,除了beta的经济含义外,
的经济含义是:给定x和z的观测值,平均来说,y的值为多少。而 这一条正好可以用来预测,即用因子x和z来预测y!
– 如果回归模型是用作预测,我们并不要求x是原因,y是结果。
Outline 1. 引言 2. 一元模型的OLS方法 3. 多元模型的OLS方法 4. 拟合优度 5. 在金融中的应用
1.引言
• 为什么要估计?给定回归模型,
参数beta未知,而计量分析主要是基于参数beta。比如 – CAPM的检验:
• Beta0=rf,beta1=rm-rf, 其它的beta=0
• OLS是最简单,也是最常用的估计方法 – 原理直观:总拟合误差最小 – 计算简单:二次型问题,有显示解 – 结果稳健:估计出来的参数有很好的稳健性质 – 应用广泛:条件要求少
• 简单的是美好的,《小的是美好的》 – 我们的估计方法是这样 – 接下来的模型设置是这样 – 其实人生、社会也是这样
2.一元模型的OLS方法
• 比如,x是上期的单一业务企业的组合回报,y是滞后一期的综 合企业回报。X当然不是y的原因,但这个模型可以帮助我们预
测
• 这时条件 ,因为要不然就没有
不是必须的,但最好满足
• 可见,许多计量经济学分析,本质上就是通过设立回归模型来分析。 这里有两个问题 – 如何设立模型? • CAPM的检验:理论已经告诉我们了: –但像这样确定性方程的理论,有些理论的检验比较复杂, 比如CCAPM • 信息透明度影响资本成本的检验:
这一点在将来的固定效应面板模型的讨论时会有用 • Beta1 与相关系数有关,但不是。这与因果关系与相关关系之间的关
系相一致
3.多元模型的OLS方法
– 推导过程 – 简单记ห้องสมุดไป่ตู้方法
• 估计统计量的性质
– 性质1:拟合误差之和为零, 即
• 证明:FOC – 性质2:回归变量与拟合误差的样本协方差为0, 即
– 信息透明度影响资本成本的检验:
• Beta1>0
– 因子预测模型:beta的大小 • 什么模型估计?找出最合适的参数beta,使得模型与观察到的数据尽
可能相一致。 – 什么是与数据尽可能相一致?在给定的一致的标准下,找最优 – 那“一致”的标准是什么?
• 依赖于模型假设及个人偏好 – 常见的有
• 后验概率:MLE估计 • 模型拟合误差平方和:OLS
第二章:古典线性回归模型
outline
1. 计量经济分析与线性回归模型 2. 线性回归模型的OLS估计 3. OLS估计的性质 4. 关于参数的假设检验
2
第一节:计量经济分析 与线性回归模型
Outline 1. 从计量经济分析到一元回归模型 2. 导入多元线性回归模型
1.从计量经济分析到一元回归模型
proc means data=one; var eret beta beta2; run; /*先看看数据特征是一个好习惯 */
/* 多元回归 */ proc reg data=one; model eret=beta beta2; run;
• 多元模型分步估计 – 多元回归估计公式有时难以理解及难以证明相关性质,我们可以 用两步法来估计。