计量经济学读书笔记

计量经济学读书笔记
计量经济学读书笔记

计量经济学读书笔记

第一章:统计基础 (2)

第二章:计量经济学总论 (7)

第三章:双变量回归分析 (9)

第3.1回归方法 (9)

第3.2结果检验 (10)

第3.3回归参数的分布 (11)

第四章:多变量回归分析 (13)

第五章:OLS的基本假设 (14)

第六章:多重共线性 (16)

第七章:异方差性 (17)

第八章:自相关 (18)

第九章:时间序列分析 (20)

第十章:面板数据分析 (30)

第十一章:其他重要的分析方法 (49)

******加权最小二乘法 (50)

******二阶段最小二乘法TSLS (51)

******非线性最小二乘法 (51)

******多项分布滞后(PDLS) (51)

******广义矩估计 (52)

******logit和probit模型 (52)

******因子分析 (54)

******Granger因果分析 (55)

****** 广义线性回归(Generalized least squares) (55)

******格兰格因果检验 (57)

******误差修正模型(ECM) (57)

第十二章:EVIEWS (58)

第12.1节EVIEWS基本操作 (58)

第12.3节EVIEWS时间序列分析 (60)

第十三章:SPSS (61)

第13.1SPSS基本操作 (61)

第十四章:数据分析实战经验 (70)

第一章:统计基础

0 常用英文词汇的统计意义 panel data=longitudinal data 是对各个个体进行连续观察的截面数据。回归时的扰动项u=unobserved是影响因变量的其他变量之和,Univariate 单个变量的,如Univariate descriptives 意思是单个变量的统计指标

1 基本概念

统计总体是我们所关心的一些个体组成,如由多个企业构成的集合,统计意义上的总体通常不是一群人或一些物品的集合,而是一组对个体某种特征的观测数据。

参数总体的数值特征描述,如均值、标准差等。

统计量是用样本数据计算出来总体参数的估计值,从一个给定的总体中抽取容量为N的所有可能的样本,对于每一个样本我们可计算出某个统计量的值,不同的样本得到的该统计量的值是不一样的,该统计量的不同的值是不同抽样的结果(根据这些不同抽样计算出的对同一参数进行估计的统计量,可以计算出由各个统计量构成的集体的方差,该方差就是在统计软件中参数后面扩号内的方差),这符合随机变量的定义,因此该统计量也是随机变量,这个统计量的分布称之为抽样分布,它是从同一总体所抽出,同样大小的所有可能样本,其统计量的值的分布,一般情况下是一个正态分布,因为所有的估计值都是对总体参数的近似估计,因而服从以真实值为中心的正态分布,如果总体的分布是已知的则可以根据公式计算统计量

抽样分布的分布参数(均值为总体的均值,标准差为总体的标准差与N的比值)。 4在一个样本之中

包含若干个样本点,各个样本点所对应的个体的某种特征是一个变量,不同个体的该变量的取值相互独立,并且服从某种分布,因此根据样本计算的统计量可以看成是若干个独立变量的函数形式,其分布参数如均值、标准差可用数学公式推导。

时间序列是指同一现象在不同时间的相继观察值排列而成的序列,平稳序列,它的各种统计指标不随着时间而变化,在时间序列的散点图中表现为各点分布在一个以均值为中心的条状带中,同一时间序列的因素分析是指区分时间序列中各种不同因素的影响,确定长期趋势(找一条长期的趋势线)、季节变动(确定季节比率)、循环变动和不规则变动。时间序列分析时一项重要的内容就是根据过去已有的数据来预测未来的结果,利用时间序列数据进行预测时,通常假定过去的变化趋势会延续到未来,这样就可以根据过去已有的形态或模式进行预测。

统计决策是指根据样本的信息对总体的情况做出判断。

点估计是根据样本用与计算总体参数相同的法则(如求平均数)+估计总体参数的具体值,因而叫点估计如用样本的平均身高作为总体的平均身高。

区间估计就是点估计值 边际误差,边际误差是根据显著性水平及统计量的标准差,如大样本时在0.05的水平下边际误差为1.96*标准差。95%置信区间是用样本数据计算出来的对总体参数一个区间估计,保证根据所有样本计算的置信区间中,有95%会把真正的总体参数包含在区间之中,根据不同样本数据对同一总体参数进行估计的相同概率的置信区间不同,根据一个样本计算的对参数进行估计的置信区间是对总体参数的一个区间估计,是总体参数的若干置信区间中的一个,如果继续不断的抽样下去。每个样本会产生一个新的对总体参数的置信区间,如果我们如此不停的抽样下去,所有区间中有95%会包含真正的参数值。区间的概念提醒我们,因为我们只有样本数据,所以我们对于总体的所有叙述都不是确定的。

变量是说明个体的某种特征的概念,如“受教育程度”、“身高”等,说明事物类别的名称叫做分类变量(categorical variable),如性别就有两个分类变量男、女;说明事物有序类别的一个名称,称为顺序变量(rank variable),如一等品、二等品、小学、初中、大学等;说明事物数字特征并且有米、或者公

里、年、吨等度量衡单位的叫做数值型变量(metric variable 或者scale variable)是量数据如产品产量年龄等。数值型数据围绕其平均值分布的集中程度称为数据的离差。

根据不同度量可以定义不同的离差,最常用的有全距、标准差等。以变量X 的标准差S 为单位来度量X 与其平均值X 之间的偏差的变量Z 称为标准化变量,它是一个无量纲量,标准化变量的数值称为标准分数或Z 分数。

偏度是一个分布中不对称程度或偏离对称程度的反映,如果分布的频数曲线右边的尾部比左边的长,则称分布是向右偏反之则称分布是向左偏。偏度=(均值-众数)/标准差。峰度是分布陡峭程度的反映,通常是相对于正态分布言,其值叫做峰度系数,用四阶中心矩与标准差的四次方的比值表示。

变异系数是指变量的标准差与平均值之比。

相关系数反映两个变量之间线性关系的强弱。

假设检验分为参数检验和非参数检验,前者是指对总体分布函数中未知参数提出某种假设,然后利用样本信息对所提出的假设进行检验并做出判断,参数检验需要样本所依赖的总体的分布作出一系列假定如总体服从正态分布且标准差相等,但实际情况中,上述的假定不一定完全合理,或者在应用中对这些假定有怀疑,因此统计学家设计了许多与总体的分布及相关参数无关的检验方法,称之为非参数检验。如一个人号称罚球命中率为80%,为了检验他是不是吹牛皮,于是让他现场投20个球,这就是显著性检验,结果他只投进了4个,计算得在命中率为80%情况下,投20个只进4个的概率为0.2%,则此0.2%就是通常所说的P 值。如果P 值很低(通常小于5%)则可以拒绝原假设。假设检验是为了比较两个值是否有显著的差别,在很多情况下我们给出一个原假设仅仅是为了拒绝它,因此原假设通常是与数据表面所显现出来的现象的相对立的现象。在假设检验中研究者如要确定某参数是否等于某个值须用双尾检验,如检验零件直径是否等于10;如果要确定参数大于或小于某值则用单尾检验如检验奶粉中蛋白质的含量是否大于30%。两者的区别仅仅在于拒绝域不同。在做假设检验时犯第一类错误(原假设正确却遭到拒绝)的最大概率称为显著性水平,显著性水平越高则表明限制条件越严格,在正态分布图豉肚部分的面积越小同时两侧的阴影部分的面积就越大,原假设被拒绝的可能性就越大,回归结果中某系数的精确显著性水平越高则越有可能接受原假设,即系数越有可能为0,系数在越高的显著性水平下显著则越有可能接受原假设即系数越有可能为0,系数不为0的可能性越小,在越低的显著性水平下显著则表明系数不为0的可能性越大。

假设一个统计量(如灯泡寿命)A 服从均值为μ标准差为δ的正态分布,则(A-μ)/δ叫做Z 分数(也叫标准化变量),它服从均值为0标准差为1的标准正态分布。t 统计量是模仿Z 分数而建立的,区别在于后者用于小样本标准差未知的情况下的均值检验而前者用于大样本标准差已知情况下的均值的检验(Z 或t 统计量计算公式中的μ都取原假设中的值),此时作为分母的是s/1 N 代替(s 为样本标准差),也就是用多个变量的均值的标准差代替,因为该统计量是根据样本的均值计算而得,也是用于均值的检验。T 和Z 检验用于检验回归方程中某个自变量的系数是否为0,F 检验用于检验是不是所有的系数都为0。

方差分析用于从方差的角度比较两个或多个总体的均值是否相等,研究分类型自变量对数值型自变量是否有影响,包括它们之间有没有关系、关系的强度如何等,所采用的方法就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著的影响,如行业不同是否对受到投诉的数量有影响,行业是称为因素,旅游、零售、家电具体的行业叫做因素水平(在SPSS 中相当于一个VARIABLE 的不同的值)。计算旅游、零售、家电各行业各自的标准差,然后平均得到组内方差,并认为组内方差是完全是由随机因素造成的,根据各行业的各自的平均值与总均值之差的平方和得到组间方差,并认为组间方差是由于不同的因素水平所造成的,如果各因素水平对因变量(投诉量)无影响,则组内方差与组间方差应该相等,或者说两者的差别在统计上是不显著的,组间与组内方差之比是一个F 统计量,通过检验这两个方差的差别是否显著来判断不同行业接受投诉量的均值是否有明显差别。

17 描述性统计量是对(相当于SPSS中的)某一变量特征进行描述的一些统计指标,均值是对一个变量的中心位置的度量,其计算方法是先加总所有CASE的值然后除以数据的个数,其应用如应收帐款的平均帐龄为45天。中位数是对中心位置的度量,它是当CASE按照升序排列时,处于中间位置的CASE的变量值,它是对均值的补充,如在年度收入和资产价值数据的报告中,这是因为个别异常大的收入或资产价值能够使均值膨胀,此时中位数是对中心位置的更好的度量,如应收帐款的帐龄的中位数为35天表示超过一半的应收帐款帐龄的天数在35天以上。众数也是对均值的补充,是在各CASE中出现频率最高的数据的值,如应收帐款帐龄的众数为31天,表示应收帐款最普通的帐龄为31天。四分位数是先把数据进行升序排列,然后把数据依次分为四段,每段含有25%的观察值,中间的三个分段点从小到大分别称为第一二三四分数点,如帐龄的第一四分数点为12天表示有25%的CASE的帐龄小于12天有75%的CASE的帐龄大于12天。极差是各CASE的某变量值的最大和最小值的差,该指标容易受异常值的影响,很少单独用来表示变异程度,如帐龄的极差为18表示最长的帐龄比最短的帐龄多18天。方差是利用所有的CASES对某变量值的变异程度的度量,在单位相同时可以用于比较两个变量的变异程度,可以用来度量与股票投资相关的风险,它给出每月收益如何围绕和期平均收益波动。如零件的尺寸的标准差表明了生产加工技术的稳定性。变异系数是标准差与均值的比值,常用于比较变量的变异程度,如A加工零件尺寸的变异系数为15%,而B为10%,表明A加工技术要比B稳定。切比雪夫定理认为与均值距离在Z个标准差以内的CASE例至少

为1-1/Z2,一般情况下68%的数据与均值距离在一个标准差以内,95%的数据在2个标准差以内,几乎所有的数据都在3个标准差以内,以上所述可以用于异常值的检测,然后确定异常值是否正确。

4 参数检验分为一个总体参数的检验和两个总体参数的比较检验,前者是为了确定某一总体的参数是不是某一个值,而后者是为了比较两个总体的参数是不是相等。检验(z检验和T检验)什么参数则需要根据样

本计算什么参数的值及该参数的标准差(δ/N或S/N),如要检验均值是否为某个值则需要根据样本计算样本均值及样本均值的标准差。

5大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允许的简化,我们可以用“平均”,“差距”或百分比等来概括大量数字。由于定性变量主要是计数,比较简单,常用的概括就是比例或百分比。下面主要介绍关于定量变量的数字描述。

6概率分布是关于总体的概念。有了概率分布就等于知道了总体。

6统计中各种常用分布

①CHI-SQUARE分布,一个正态分布的变量的平方服从自由度为1的CHI-SQUARE分布,K个独立的正态分布变量的平方和则服从自由度为K的CHI-SQUARE分布,在统计中CHI-SQUARE的自由度的意义是独立观察值的个数K,自由度是卡方分布的参数就像均值和标准差是正态分布的参数一样,如样本中每个灯泡的寿命服从正态分布,则5个灯泡的寿命的平方和服从自由度为5的卡方分布。CHI-SQUARE可以用于总体标准差是否为某值的假设检验。

②T分布,X来自一个正态总体样本,则变量服从T分布,其中U是总体的均值,S是样本方差,N是样本中样本点的数量,自由度为N-1,T统计量是根据样本数据计算而得。

③F分布,两个相互独立样本的样本方差之比在代入样本数据之前叫做F变量,代入样本数据之后叫做F统计量,服从F分布,F统计量经常用于比较两个样本的方差是否相等的假设检验,分子分母的样本方差

的计算公式分别为、,记为F (M-1,N-1)。另外它也可以用于检验拟合优度的显著性此时

,n 是观察值的个数,k 是包括截距在内的解释变量的个数。F-分布变量为两个2x -分布变量(在除以它们各自自由度之后)的比;而两个2x -分布的自由度则为F-分布的自由

度,因此,F-分布有两个自由度;第一个自由度等于在分子上的2x -分布的自由度,第二个自由度等于在分母的2x -分布的自由度。

④二项分布,二项试验是指把相同的试验进行N 次,并且每次试验只有两种可能的结果,单次试验成功的概率为P ,每一次试验都独立进行,如果对于卖保单的例子,如果随时间推移推销员疲劳并失去了热情,则不能保证“单次试验成功概率为P ”。在一个二项试验中,我们关心的是在N 次试验中出现成功的次数,如果以X 表示N 次试验中成功的次数,我们可以看到X 可取的值为0、1、2……N 因为值的个数是有限的,故X 是离散型随机变量,与该随机变量有关的概率分布叫做二项分布(属于离散型),如果知道每个顾客进店买某商品的概率和进店顾客的数量(根据以往的经验取得),则可以估计每天需要的货量。二项分布是指做有限次只有两个结果的试验中,实验成功次数为B 的概率,泊松分布是指做无限次只有两个结果的试验中,实验成功次数为B 的概率。

⑤泊松分布,泊松试验是指事件在任意两个等长度的区间内发生一次的概率相等,并且事件在一区间发生与否与其他区间独立,则事件发生的次数服从泊松分布(属于离散型)。在已知一个区间内事件发生次数的平均值μ时,事件在一个区间内发生X 次的概率为μx e μ-/x !,花旗银行用此公式计算1分钟内到达某ATM 机的人数为2及以上以上的概率以确定是否增加ATM 机的数量。

7 8对于连续型随机变量X ,a 下侧分位数(又称为a 分位数,a-quantile )定义为数x α,它满足关系

()p x x αα≤=。上侧分位数定义为满足关系()p x x αα≥=的x α。通常用z α表示标准正态分布的a 上侧分位数,即对于标准正态分布变量Z ,有()p z z αα≥=。

一个由正态变量导出的分布是2x -分布(chi-square distribution ,也翻译为卡方分布)。该分布在一

些检验中会用到。n 个独立正态变量平方和称为有n 个自由度的2x -分布。

正态变量的样本均值也是正态变量,能利用减去其均值再除以其(总体)标准差来得到标准正态变量。但用样本标准差来代替未知的总体标准差时,得到的结果分布就不再是标准正态分布了。它的密度曲线看上去有些象标准正态分布,但是中间瘦一些,而且尾巴长一些。这种分布称为t-分布(t-distribution ,或学生分布,Student ’s t)。

9判明一个事情的真伪,需要用事实说话。在统计中事实总是来源于数据。假定某药厂声称该厂生产的某种药品有60%的疗效。但是当实际调查了100名使用该药物的患者之后,发现有40名患者服后有效。这个数据是否支持药厂的说法呢?药厂所支持的模型实际上是一个参数为0.6的Bernoulli试验模型。100名患者的服药,实际上等于进行了100次试验。这就是二项分布B(100,0.6)模型。由于使用了药厂的0.6成功概率。这个模型是基于药厂的观点的。可以基于这个模型计算100名患者中有少于或等于40名患者治疗有效的概率。通过计算(或查表,后面会详细描述)易得,在药厂观点正确的假定下,这个概率为0.000042。这说明,如果药厂正确,那么只有40名患者有效这个事实是个小概率事件,即“少于或等于40名患者有效”的可能性只有大约十万分之四。这样在药厂的观点和事实之间有了矛盾。是事实准确还是药厂准确呢?显然人们一般不会认为药厂的说法可以接受。这样,就利用小概率事件来拒绝了药厂的说法。

这种用小概率事件对假定的模型进行判断是后面要介绍的假设检验的基础。

5 建模是一个建立估计回归方程的过程,经过这一过程,我们可以得到描述一个因变量和一个或多个自变量之间关系的估计回归方程。建模的主要结果应该是找到合适的函数形式来描述变量之间的关系,并且选择该模型所应包含的自变量。

6 假设检验中的原假设是从数据表面所显现出来的现象的相对立的现象。

7 假设检验时T、CHI-SQUARE、F、Z都是以正态总体的样本为基础的统计量,在代入样本的观察值以前叫做变量,服从抽样分布,并且它们的分布事先已知。只所以要用这些统计量是因为它们可以根据样本很容易的算出,然后可以比对在原假设正确的条件下取得该(T、F、Z、CHI-SQUARE)值的概率(P值),如果该概率小于确定的显著性水平,或者在无预先确定的显著性水平下小于5%,则拒绝原假设,否则接受原假设。也可以与确定的显著性水平下的Critical value相比对,如果大于Ccritical value则拒绝原假设。

8 假设检验中最重要的就是根据要检验的参数构造一个其分布情况已知的统计量,第二步是根据统计量的分布及事先人为规定的显著性水平确定一个大概率事件和小概率事件(大概率事件是指根据样本计算的统计量与原假设值距离在一定范围之内,小概率事件是指根据样本计算统计量与原假设值的距离在一定范围之外),第三步是根据样本统计量看是小概率事件发生还是大概率事件发生,如果大概率事件发生则原假设正确否则拒绝原假设。

9 无论是Z检验还是t检验归根到底都是要在一定的显著性水平下看根据样本计算的统计量与原假设值距离的远近,当然此距离是以标准差来计量,当此距离超过某一标准则认为原假设不正确,此标准是根据显著性水平通过查表来确定。越显著也就是显著性水平越高,检验标准越严格,接受原假设的区域越窄,如果要接受原假设则要求抽样值离原假设值越近,如0.1的显著性水平下要接受原假设要求的抽样值比在0.05水平下接受原假设要求的抽样值离原假设值近。

14 协方差是二元变量(X,Y)中X 和Y之间线性关系强弱的度量指标,在统计中用于度量两个变量间线性关系的强弱(因此SPSS的COVARIANCE MATRIX用于观察在度量单位相同的条件下各变量间相互

关系的强弱),是根据样本点计算而得,其定义式为,但是这个定义式用于样本协

方差的估计是有偏的,协方差的无偏估计量,如果协方差为大

的正值则表示存在强烈的正相关关系,如果协方差为大的负值则表示存在强烈的负相关关系,但是用协方差作为线性关系强度的度量指标时,存在的一个严重问题是协方差的值依赖于X和Y的度量单位,如使用厘米为单位计算的协方差要大于使用米作单位计算的协方差。为避免这种麻烦用相关系数代替,相关系数

的计算公式为。自变量和因变量之间的相关系数与用OLS回归方程中自变量的

系数不是一回事后者的计算公式为,但是两者的符号是相同的。

15 为什么协方差能表示线性关系的强弱呢?因为如果以X=X 和Y=Y 将散点图分为四个象限,如果协方差为正,则对他有最大影响的点一定在一和三象限,因此协方差为正值表示X 与Y 之间存在正线性关系.也就是说,当X 增大时,Y 的值也增大.如果协方差为负,对它有最大影响的点一定在二四象限。因此协方差为负就表明X 和Y 之间存在负线性关系。也就是说,当X 的值增大时,Y 的值减小。最后,如果各点是均匀分布在四个区域内,则协方差的值将接近于零,表示X 和Y 之间不存在线性关系。

第二章:计量经济学总论

1计量经济学的内容框架,包括最小二乘法基本原理、最小二乘法的假设条件和不满足假设条件时的处理办法三个大的部分。

最小二乘法的基本原理包括参数估计、估计参数的性质(BLUE )、估计结果的统计推断。首先是OLS 的原理,即最小二乘法是找一条线,使样本点与线之间距离的平方和最小,具体做法是首先假设一条线,然后求得用这条线的参数表示的距离的平方和,然后用求距离极值的一阶条件,求出这些参数,就得到了最小二乘法的估计结果,得到结果后就是对结果的统计推断,包括可决系数、T 检验、F 检验、以及假设条件是否满足前提假设的检验。

最小二乘法是在一系列假设的基础上进行的,这些假设主要是关于自变量与因变量关系、自变量间的关系,自变量与扰动项的关系、扰动项之间的关系。

接下来讨论的就是假设不满足的条件下的回归分析,包括的主要内容有非线性模型的线性化、特殊变量、异方差、自相关和多重共线性(概念、检验、原因、影响和处理办法)。

******最小二乘法的基本原理

最小二乘法是估计变量间相关关系的一种方法,变量间的相互关系总本而言有两种,其一是函数关系,其二是相关关系,变量间相互依赖相互影响,但是变量间所表现出的却不是确定的函数关系,如图,影响Y 的因素除了主要有X 之外,还有若干不重要的因素,把这些不确定的因素归并到一个变量中,建立变量之间关系的数学模型i i i Y a bX u =++,在这个数学模型中,a 和b 是有待估计的系数,最小二乘法就是估

计系数a 和b 的一种方法,具体的原理是,首先令X 和Y 之间的关系为??i i

Y a bX =+,然后把各个样本点的自变量值代入该式,计算出对应于各样本点的自变量i X 的因变量的值?i Y ,此?i

Y 是以?a 和?b 为参数的表达式,然后计算各样本点对应的i Y 与?i

Y 的差的平方和,该平方和是以?a 和?b 为参数的二元函数,接下来为了得到?a

和?b 的估计值就要求这个二元函数对?a 和?b 的偏导数,然后利用函数求极值的一阶条件,令二个偏导数分别等于0,然解方程组得到?a

和?b 的估计值,体现在图中是什么意思呢,就是找到一条最佳的线,

使各样本点到该线的纵向距离的平方和最小,求得?a 和?b 的估计值分别为X b Y a ??-=,和∑∑=2

?i i i

x y

x b ,

由这两个估计式的形式可以发现,要先估计?b

后估计?a ,这两个式子中i x 表示第i 个样本点的自变量值与各样本点的自变量的均值的差,∑表示加和,这是最简单的一元线性回归模型的估计方法,也是最小二乘法的一个最简单的应用,对于多变量的最小二乘法与此基本一样。其中最关键的一点是通过求极值条件,将各个样本点所代表的自变量和因变量关系转化为关于估计系数的方程。

通过最小二乘法把a 和b 的值估计出来以后,接下来一个问题就是估计结果的准确性了。

①a 和b 的准确性,由各样本点得到的a 和b 的估计值,只是根据抽样得到的样本点计算的,不一定就是真值,要得到真值就必然根据总体中所有的样本点进行估计,而这通常是不可能的,如对于灯炮内所充惰性气体的量与灯泡寿命的关系,不可以把所有的灯泡都拿来做试验,这在经济上是不可行的,我们所能做的只是根据其分布情况进行统计推断,看看这个统计量是不是无偏的,有效的。所谓无偏就是估计值的数学期望等于真值,其含义可以近似的理解为当我们对做若干次试验后得到的估计值的均值就是真值,即Y 和X 的真实的关系。有效性就是估计值的方差最小,通过概率分析可以知道,OLS 估计量是具有BLUE 的性质。

②a 和b 的显著性,根据概率论的知识可知,a 和b 是服从t 分布的,并且其方差也可以根据概率论的知识计算得到,可以根据样本计算出a 和b 的t 值,看估计得到的a 和b 是否具有统计显著性。

③a 和b 估计出以后的另一个问题是看这个方程的显著性和对Y 的变化情况的解释力,这要通过F 值和2R 来判断。

④最后,还要回过头来总体的看一下这个回归的结果,首先就是要问你怎么知道X 和Y 之间就是一种线性关系,如果不是线性关系,又该怎么办。这也就牵扯到最小二乘法的假设。从假设可以演生出计量经济学的其他的主要内容。

1 回归分析研究 一个变量对另一些变量的依赖关系,但他并不意味着因果关系。

2虚拟变量是指定性变量或者分类变量。

3在进行时间序列数据分析时首先要验证数据的平稳性,平稳是指一个时间序列的均值和方差在时间上都没系统性的变化,要看一时间序列是否平稳,可以计算一个时间段上的均值和方差然后与另一时间段上的均值与方差比较,如果相等则平稳否则不平稳。

4面板数据的缺点是异方差性,即样本中的样本点不是一帮人,相当于不能把苹果和桔子混同起来,如果必须把两者放在一起考虑如看水果的重量与光照的关系,可以加一个虚拟变量用以曲别苹果和桔子两种水果,时间序列数据的缺点是平稳性问题。

5通过经济数据了解经济变量的变化规律有时是存在相当大的局限性的,所以在建立模型时,必须依靠经济理论,同时对参数进行假设检验。

******不同回归方法的选择

在决定使用各种具体的回归方法之前,首先用OLS 进行一下回归,然后根据回归的结果考察使用哪种具体的方法进行回归。

第三章:双变量回归分析

第3.1回归方法

******回归模型bx a Y +=中Y 是一个数学期望的概念,解释变量x 取某一个确定值i x 时(在回归模型中i x 不是随机的而是确定的值),因变量由于扰动项的原因可以取得若干个值,可以认为对应自变量i x 的因变量是一个随机变量,回归模型中的Y 是在自变量取i x 时因变量所有可能取值的数学期望,因此在回归模型中的)x E(Y Y i =,根据回归方程每一个因变量的值可以分为数学期望和扰动项两部分的和。

3 线性回归方程Y=B1+B2*X1的完整表示应该是E (Y |Xi ) =B 1+B 2Xi ,E (Y |Xi )表示给定X 值相应的(或条件的) Y 的均值,也就是说回归方程的因变量的值是当解释变量为某个值时因变量所有可能取值的均值。

4线性回归方程的线性有两方面的含义,其一为解释变量线性,其二为系数线性,也就是说方程右边只能是系数与解释变量的乘积,其中的任何一个都不能是任何的函数形式。

1在一般的情况下,回归模型中要含有截距项,这样做有如下两点好处,第一,尽管模型中含有截距项,但若该项的出现是统计上不显著的,则可以认为回归结果是一个过原点的回归模型。第二,如果实际模型中含有截距而我们的回归模型中无截距则我们的模型就有了设定模型错误。因此模型中要含有截距项。

2在双变量模型中,如果因变量与自变量的单位都是货币,那么以元为单位与万元为单位的回归结果中的斜率是相同的,不同的是截距项要根据度量单位的变化而相应的扩大或缩小计量单位之间换算比例倍,如果因变量与自变量单位不同,一个是元一个是公斤,那么换成吨后的斜率将会发生变化。

3双对数log-log 模型是指等号两边的变量都采取对数的形式,如i i i u blnX a lnY ++=,这个模型用于估计因变量对自变量的弹性,系数b 就是就表示Y 对X 的弹性。

4log-linear 模型是指等号左边是logY ,等号右边是bx 的形式,如i i i u bX a lnY ++=,用于测量X 变化1时Y 变化的百分比,其大小为b ,当X 表示时间时,b 为因变量的瞬时增长率。

5linear-log 模型是指等号左边为Y ,等号右边为i bLnX 的形式,如i i i u blnX a Y ++=,用于确定X 变化1%时,Y 变化的绝对量。

6回归系数的方差1var()b 、2var()b 的计算,每一个样本点都可由一个向量表示,该向量的分量由自变量和因变量构成,自变量和因变量相当于一个样本点的坐标,自变量是确定的值,因变量的数值是由自变量的值和扰动项决定的,对于每一个样本点在回归之前解释变量和因变量的关系虽然是未知的,但却是确定的,因此,因变量的分布是由扰动项的分布决定的,根据扰动项的分布可以计算出因变量的分布,而回归的系数是由各样本点的自变量和因变量值确定的,因此,可以根据因变量的分布来计算出回归系数的分布,从而计算出这些系数的期望和方差。

7在计量中一个向量如无特殊说明都是指列向量。因为,通常情况下每个观察点都有一个自变量和因变量的关系方程,放在一起,各个变量对应一个列向量。

4在回归模型中,解释变量是确定的,对应每一个解释变量的值,因变量都是一个随机变量,因变量序列中有多少个CASE 则对应的有多少个作为随机变量的因变量,只所以是随机变量,是因为扰动项是随机变量。

2用最小二乘法估计的方程的系数是线性无偏一致最小估计量,最小是指方差最小,极大似然估计法也是估计方程系数的方法但其结果是有偏的不如最小二乘法的结果好。

第3.2结果检验

由于回归的结果是根据样本计算出的估计值,因此必须要检验其统计可靠性,统计可靠性的检验分为系数可靠性的检验和方程可靠性的检验,前者主要是t 检验,后者主要是F 检验和2R ,进行统计检验的前提条件就是要知道待检验变量的分布情况,这也是3.3的主要内容。

******对于一个样本总体因变量和自变量之间存在着一个总体回归函数,即在样本中包含总体中的所有的点时自变量与因变量之间的关系,这种关系是肯定存在的,但是由于在样本中不可能包括总体中的所有点,只能根据样本回归函数来代替总体回归函数,并且根据样本数据回归出的样本回归函数只能是总体回归函数的一个近似,并且不同的样本得到的样本回归函数不同,这就使得回归函数中的系数可以取得若干个值,

因此就有了在SPSS 回归结果中的某个回归系数的方差指标的由来,不同的样本回归函数对样本中因变量与自变量的关系的解释力不同,解释力的大小用R 2指标来衡量。

******因变量各个值与其均值的离差的平方和TSS 可以分解为估计的Y 值围绕其均值的离差的平方和ESS

加上残差的平方和RSS=2i u ∑,即TSS =2i y ∑ESS +RSS =2

i 2i 2u x b ∑+∑,即因变量的观测值围绕其均值的变异可以分为两部分,一部分来自回归线,这部分相当于固定的,另一部分来自随机势力,回归结果好坏的统计指标TSS

ESS R 2

=,当两个模型的因变量不同如一个是Y 另一个是LnY 时2R 不具有可比性。

1置信区间是在区间估计时用到的一个概念,求一个参数的置信区间首先根据样本计算出该参数的点估计值,然后再加减对应显著性水平的一段区间,这段区间通常是根据样本计算出的标准误的多少倍,具体多少倍要根据显著性水平确定。

2在用OLS 等方法估计出系数的数值后,还要检验一下这个点估计值是否是真值为0的情况下的一个随机值,也就是这个估计值可以在真值为0的情况下由于扰动项的原因而出现,如果检验的结果是估计值不可能在真值为0的情况下由于扰动项的原因而出现,那么就认为估计值是显著的。检验方法有两种,一种是置信区间检验法,即看在真值为0,标准误为根据样本计算出的标准误的情况下,根据显著性水平确定一个置信区间如果,估计值落在置信区间的外面则拒绝原假设认为真值不为0,估计值显著,由于显著性水平越低时对应的置信区间越长,因此在越低的显著性水平上拒绝原假设则估计值的显著性水平越高;第二种方法是T 值和F 值检验法,如果根据估计值和原假设值以及标准误计算出的T 值或F 值大于在规定显著性水平下,由T 值或F 值表查出的值,则拒绝原假设认为估计值是显著的。

3统计显著的概念 在统计学中,当我们拒绝虚拟假设时,我们说我们的发现是统计上显著的,反之,我们不拒绝虚拟时,我们说我们的发现不是统计上显著的。

4根据原假设和调查数据估计出的系数计算出的该系数的t 值越大,表示离原假设中该系数的假设值越远,越应拒绝原假设,估计的系数越显著。t 值可以理解为估计值距离原假设值几个标准误的距离。

5方差分析(ANOV A, analysis of variance)是指对因变量与其均值的离差的平方和TSS 的构成部分进行分析,给出的最终结果是F 值,以及这个F 值的精确显著性水平,F 值是ESS 除以其自由度1与RSS 除以其自由度n-1的比值,如果F 值大于由F 值表中查到的在参考显著性水平下的临界值,或者是这个F 值的精确显著性水平小于参考的显著性水平,就认为F 值显著,表明估计方程中所有参数不能同时为0,估计方程有意义。

第3.3回归参数的分布

最小二乘法的回归结果,都是根据样本的自变量和因变量估计的,根据假设可知样本的自变量是确定

的数值,样本的因变量的数值为i i i Y a bX u =++,其中的a 和b 代表X 和Y 之间关系的系数的真值,虽然不知道但却是一个确定的数值,i X 是已知的确定数值,i Y 是与i u 服从相同分布的随机变量,因此,根据样本的自变量和因变量值估计的系数和残差也是服从一定分布的,在假定i u 服从正态分布的条件下,这些估计量都是服从正态分布的。

******回归系数的估计值及其分布

根据样本用OLS 可以估计线性回归方程Y a bX u =++的系数a 、b ,它们是根据样本数据计算而得,

因此a 、b 是样本统计量,其无偏估计值分别为?a 、?b

22()()cov(,)?()()()i i i i i i X X Y Y X X X Y b Y Var X X X X X ??---=== ? ?--??

∑∑∑∑ ??a

Y bX =- 在上面的表达式中i X 和X 是已知的自变量的数值,是确定的(根据假设A5),因此2()i i

X X X X --∑是确定的常数,而i i i Y a bX u =++,其中a 和b 虽然是待估的系数,但确是一个确定的数, i X 也是确定的数,而i

u 是服从正态分布的变量,因此i Y 是服从正态分布的,并且其分布密度由i u 决定,而?b 是若干个i

Y 的线性组合,因此?b

也服从正态分布,其方差为22?var()()u i b X X σ=-∑,其均值根据无偏性为真值b 。其具体的推导过程如下:

()?i i i i

i i i i i i b K Y K a bX u a K b K X K u ==++=++∑∑∑∑∑ 而22

222220()1i i i i i i i i i i i i i i i i i x x K x x x x X x X x x X K X x x x x ===+===+=∑∑∑

∑∑∑∑∑∑∑

∑∑∑∑ 所以?i i b b K u =+∑

于是2

2?var()var()var()i i i i

u i b b K u K u K σ=+==∑∑∑ 其中2i i i x K x =∑、()22222221i i i i i i

x x K x x x ??=== ? ???∑∑∑∑∑∑、i i x X X =-

因此,22?var()u i b x σ=∑

同理,?a 服从正态分布,?a 的方差为22

2?var()()i

u i X b n X X σ=-∑∑,其均值为真值a 。

在实际计算时u 的方差是无法得到的,只能用残差的方差代替。

******回归残差的估计值及其分布 i Y 的估计值???i i Y a bX =+是服从正态分布的变量?a 和?b 的线性组合,因此也服从正态分布,残差?i i i

e Y Y =-是正态分布的变量i Y 和正态分布的变量?i

Y 的线性组合,因此,也是服从正态分布的。残差的方差的估计值为2

2

?2i

u e n σ=-∑

******回归的真值和估计值

回归方程系数的真值用a 和b 来表示,估计的系数用?a

和?b 表示,两者不同,真值就是一个具体的数值,而估计值由于是根据样本估计出的,因此,估计值是服从一定分布的随机变量。

第四章:多变量回归分析

1当回归模型中因变量和自变量各有一个时,回归方程中的系数叫做回归系数,当自变量多于1个时,回归方程中的系数叫做偏回归系数,表示在其他变量保持不变时某个自变量变化1单位所引起的因变量变化的大小。

2多自变量回归模型中可能面临多重共线性问题,即各个解释变量之间是线性关系,当各个变量之间不是线性关系而存在着其他关系时,模型不面临多重共线性的问题,多重共线性是模型设定时各个变量间的相互关系导致的问题,异方差性是由于样本数据扰动项的方差不同面而导致的问题。 3一般情况下只要解释变量的数量增加估计方程的2R 就要增加。adjusted 2

R 是考虑自变量个数的拟合集成度的判定标准。

4偏相关系数用于衡量在多个自变量的回归模型中,其他变量不变时两个变量间的相关性的大小。

1时间序列分析时应引入一个时间或趋势变量。

2在SPSS 回归结果中F 值对应的原假设是所有的系数同时为0,对这样一个假设的检验被称为对所估计回归线的总显著性检验,检验Y 与所有自变量有线性关系。

3要看因变量与自变量之间的关系是否随着时间的发展而改变,即由t t t u bX a Y ++=变为t t t u dX c Y ++=,用周检验。

第五章:OLS 的基本假设

1OLS 的估计量a 和b 都是扰动项u i 的线性函数,因此OLS 的估计量a 和b 的分布依赖于u i 的概率分布

状况,通过样本估计出a 和b 是为了对总体的a 和b 进行推断,而在推断之前必须要知道X b -Y a =、2i

i i x y x b ∑∑=这两个统计量的分布情况,而a 和b 都是扰动项u i 的线性函数,因此对u i 的分布情况做出假定后就知道了a 和b 的分布情况,

u i 正态分布时a 和b 也正态分布。

2u i 代表自变量取x i

时所对应的扰动项,它是一个变量可以取多个不同的值,服从一定的分布,因为自变量为x i 时因变量可以取多个不同的值,

******OLS 基本假设

这些基本假定总体上可以分为两大类,即针对各个变量之间关系的假定和各个CASE 之间关系的假定,各个变量之间关系又可分为三小类,一类是自变量之间的关系A2,如果有则去掉一些变量,另一类是因变量和自变量之间的关系A5,A5说明因变量不影响自变量,只有自变量对因变量的影响,即没有内生性的问题,第三类是自变量与扰动项之间的关系A7,如果不满足则用二阶段最小二乘法和工具变量法;各个CASE 之间的关系A3、A4和A6,A3和A4要求各CASE 的扰动项之间是独立同分布的,A6表明使用时间序列进行回归时数据要是平稳的,没有趋势。

A1:因变量与自变量之间呈线性关系即:y X βε=+,在每一观察点都有i i i y x βε'=+。

A2:无多重共线性,解释变量之间无线性相关关系,即矩阵X 是n k ?矩阵,并且秩k 。

A3:各观察点对应的扰动项的期望或均值为零(每个观察点都对应一个扰动项变量,不同观察点的扰动项是不同变量,可以有不同的分布参数,此处假定各个扰动项的期望都为0)即()0i E X ε=。

A4:无异方差性,各个观察点对应的扰动项的方差相同都为一常数,并且各扰动项之间的协方差为0,

即对于所有观察点i 都有2var()i X εδ= 并且cov(,)0i j X εε=,在残差图上表现为残差不是分布于以0

为中心的一条带上,而是呈现喇叭口等形状。

A5:各观察点自变量是确定的值并且已知,即矩阵X 已知。

A6:无自相关,各个扰动项都独立服从期望为0方差为2δ的正态分布,即向量X ε服从2(0,)N I δ,由

于I 是一个单位矩阵所以2I δ即表明各扰动项的方差为2

δ,也表明扰动项之间协方差为0,

A7:自变量与扰动项不相关,

******假设是否满足的检验方法

A1:

A2:

A3:

A4:

A5:

A6: 扰动项之间如自相关,在残差图上表现为一个大都大,一个小都小,像老鹰捉小鸡游戏中小鸡的行动一样,其存在于否的检验主要靠DW 值,DW 值如果比较严重的偏离了2则表明有自相关问题的存在。

A7:表现为残差图中残差的大小随着自变量的大小而有规律的变动。

******假设不满足时的处理方法

A1:

A2:

A3:

A4:

A5: A6:自相关的处理方法主要是把自变量和因变量同时减掉自身的2DW 倍,然后对减掉后的因变量和自变量的关系进行回归。

A7:如扰动项与自变量相关则用二阶段最小二乘法处理,

残差提供了有关扰动项的最佳信息,因此对于残差的分析是判断以上假定是否满足的基础,各种残差图直观的描述了残差的基本特征,如果假定对所有的X 值e 的方差都相等并且假定的X 与Y 之间的模型是合理的,则残差图中的所有点都应落在以0为中心的一条水平带中,并且大多数落在距离均值两个标准差的范围以内。关于自变量的残差图和关于预测值的残差图适用于A3;关于自变量的标准残图和残差的P-P 图可以判断A6,因为如果是正态分布则95%以上的标准残差应该在-2—+2之间;在使用OLS 时得到的残差均值肯定为0,因此残差不能提供关于是否满足A2的信息。A4可以通过残差的自相关图判断。

2var()i X εδ=中的X 表明在已知的观察点数据的基础上,2var()i X εδ=是说在观察点数据的基础上第i 个扰动项的方差为2δ。

A5表明自变量不能受因变量的影响,即自变量不能具有内生性,自变量影响因变量而因变量不能影响自变量。

4 为什么要有这些基本假设

使用最小二乘法根据各个样本点计算出各个回归系数之后,还要对回归系数进行统计推断,而进行统计推断的前提是要知道这些回归系数的分布情况,表明分布情况的最重要参数就是期望和方差,回归系数的期望和方差会受到假设中的相互关系的影响。22var()var()var(bX)()

i i u X a Y n X X =-=-∑∑ ()Y-bX E a E =(),2()()var()var()var()var()()()i i

i i X X Y Y u b X X X X --==--∑∑∑,

()()()()()i i

i

X X Y Y E b E X X --=-∑∑由以上两个式子可以看出,估计量的数学期望和方差要受到自变量关系、自变量与扰动项关系以及扰动项的分布情况的影响,为了保证回归结果的无偏及有效性以及统计推断的需要而做出一些基本的假设。

第六章:多重共线性

1多重共线性是模型设定时的问题,是指模型中的解释变量之间有线性关系,如果解释变量之间不是线性关系则不属于多重共线性问题。

2在完全的多重共线性时回归系数无法确定,并且标准误无穷大;如是非完全的多重共线性则可以确定回归系数但是标准误会较大,不能精确的估计标系数的大小。会出现回归方程的2

R 很大,而没有几个自变量的系数是显著的,因为多重共线性会使标准误增大较易接受原假设。OLS 回归结果仍是线性无偏一致,但不是方差最小的有效估计量。

3多重共线性的检验,不存在专门的检验方法,但可以通过回归结果反映出来,如2R 很大而没有几个自变量的系数是显著的、解释变量间相关系数和偏相关系数大、

4多重共线性的补救,合并具有高相关性的解释变量、剔除具有高相关性的变量使之仅剩一个,如事先知道1x 是2x 的2倍则可以将1x 换为22x ,多重共线性并不一定是坏事,如果回归分析的目的是预测,则多重共线性不是一个严重的问题,2

R 越大预测越准确,如果要考察因变量与自变量之间的相互数量关系,则多重共线性就是一个问题。也可以用因子分析和主成分分析等对原来的自变量进行分析综合正交化来消除变量间的相关性。

11 完全的多重共线性是一个很严重的问题,使得线性回归无法进行,但是非完全的多重共线性却是在实际中普遍存在的问题。在实际中多重共线性可以使OLS 估计量的方差和标准差变大,从而也使置信区间变宽了,但OLS 估计量相对于其他的估计方法而言仍是最优的,可以使回归方程的较高但是T 值并不都显著,同时使OLS 的估计量及其标准差对样本数据非常敏感,有时使回归系数的符号有误。多重共线性可以根据前述的现象判断还可以通过解释变量之间的相关系数表来确定。但是多重共线性的存在并不就是一个坏事情,这取决于研究的目的,如果是要确定模型用于预测则不一定是坏事情,因为多重共线性并不会很严重的影响整个方程的解释力即

,但如果是要精确的确定方程中的各个系数数则多重共线性是一个坏事情。

第七章:异方差性

******异方差性的概念

异方差性是指对应不同的自变量的值,扰动项的方差不同,违反了OLS 假设中的扰动项具有相同方差的假设,如随着人们收入的提高,人们的备用收入将会有更大的选择范围。异方差性可能是由于数据采集技术的提高使2

减小,也可能是由于异常值的出现而造成,也可能是由于边干边改进而导致。

******异方差性的来源

异方差性的直接来源是对应各个自变量i X 的扰动项i u 的方差不同,造成扰动项方差不同的原因可能是回归模型中忽略的解释变量的影响,也可能是样本点中的数据具有本质性的差别,如穷人和富人各自月支出的方差就有本质的不同。

******异方差性的后果

在异方差性存在的情况下,OLS 估计量仍然是线性无偏一致的,但却不是最有效的,多重共线性的结果相同。在进行回归分析时,估计的系数是i Y 的线性组合,而i Y 是对应于各个i X 的随机变量,其分布情况与i u 相同,因此,回归系数a 和b 的分布情况就取决于各个i u 的分布情况,异方差性存在的条件下,就没有办法得到回归系数的真实的方差,因此,会影响估计系数的有效性,并使各种检验无法进行,因为检验的前提条件是知道变量的分布情况。

******异方差性的检验

异方差的检验可以通过残差图来表示,以横轴为自变量,纵轴为回归以后的残差,只要不是平行于横轴的带状分布则证明有异方差性,也可以通过Glejser 和Goldfeld-quandt 检验看是否存在异方差性。SPSS 中在回归的对话框中点击PLOT 按钮,在弹出的对话框中选择ZRESID 和ZPRED 也可以观察是否有异方差性,

******异方差性的补救措施

如果自变量取各个值时的方差是已知的,那么在回归方程两边同除以方差,就可以消除异方差性,此时的回归模型变为i i i i i i i Y X u a =+b +σσσσ?????? ? ? ???????

,与原来的回归模型i i i Y =a+bX +u 不同,相当于在回归之前先将变量除以方差,然后再用原来的模型进行回归(这种先将原始变量转换成满足满足经典模型假设的转换变量,然后再使用OLS 程序,叫做广义最小二乘法GLS ,WLS 是GLS 的一种),在异方差性存在的条件下原来的这种简单的回归模型所表示的因变量与自变量的关系是不对的,为了得到因变量与自变量间正确的关系必须对原回归模型进行调整。当2σ未知时要找到与2

σ成正比的变量然后在原OLS 方程两边同除以这个变量来消除异方差性,也可以对变量分别取对数来减小相异的方差的绝对值的大小。确定有异方差性之后就应该使用加权最小二乘法(WLS )进行回归,选择一个与扰动项方差成比例的变量做为权数,在SPSS 中是通过在回归对话框中点击WLS 然后在WLS WEIGHT 中选入加权变量。另一个方法就是先对因变量和自变量去对数,减少各自的变动幅度来减轻异方差性,然后进行OLS 回归。

第八章:自相关

自相关是指按时间或空间排序的观测值序列的成员之间的相关,是一个变量序列内部前后观测值之间的相关,通常是一个变量的值受其前期值的影响,自相关也叫序列相关,在OLS 分析中的自相关问题是指残差序列的前后项之间的相关性。自相关分为自回归、移动平均和自回归移动平均三种情况。

通常情况下用到的自相关有两种一种是序列的前后值之间的自相关,另一种是回归方程的残差序列的前后值之间的自相关,前者在在EVIEWS 中打开该序列对象后用view------correlogram 来检验,回归结果的残差序列是否存在着自相关通过DW 值是否接近于2来判断,如果远离2则表明存在序列相关。

在回归方程的自变量中加上AR(1)与回上因变量的1阶滞后项是不同的,加了一阶滞后项的回归方程的形式为CHANGE = 8*CLOSE - 8*MAX + 4 + 9*CHANGE(-1)。

2自相关和异方差性都是出自样本数据的问题,多重共线性是模型设定的缺陷,时间序列通常都有明显的惯性从而导致自相关,也有可能是有未包括在方程中的自变量所致,即有一些因素未被作为自变量纳入到方程中。

3多重共线性、异方差性和自相关存在时用OLS 回归的结果都是线性无偏一致的,但不是最有效的,如果完全符合经典线性模型的假定,那么OLS 回归的结果就是线性无偏一致并且是最有效的。多重共线性是自变量之间的线性关系造成的,自相关和异方差是对应不同自变量的扰动项之间的对应关系而引起的。异方差是指对应i x 和对应j x 的扰动项i u 和j u 的方差D(i u )和D(j u )不相等,自相关是指对应t x 和对应t-1x 的

扰动项t u 和t-1u 的关系为t t-1t u =u +ρε,ρ叫自协方差系数。

4如果两个时期的扰动项之间的关系形如t t-1t u =u +ρε,这个方程式叫做一阶自回归模式AR(1),如果扰动项之间的关系为t t-1t-2t u =u u +ργε+就叫做AR(2)。如果扰动项是由t t-1t u =v +v λ产生的,其中V 是零均值和懒定方差的随机干扰项,那么这种自回归模式叫做MA(1)。如果扰动项的产生机制为t t-1t t-1u =u v +v ργ+那么这种自回归模式叫做ARMA(1,1),ARIMA 模型又叫Box —Jenkins 模型,Box —Jenkins 模型实际上是主要运用于单变量、同方差场合的线性模型,单变量异方差场合下用ARCH 和GARCH 模型,多变量条件下用协整(co-integration )理论,非线性条件下用门限自回归模型。

5自相关的检验 可以横纵为时间纵轴为残差(相当于扰动项),绘残差图,如果不是分布在一个带状区则表明存在着自相关。也可以使用Durbin-Watson 检验得到DW 值,如果该值离2很远则表明存在自相关,

6自相关的补救措施 如果自相关为t t-1t u =u +ρε即AR(1),则在回归之前把因变量和自变量分别减去自已的ρ倍再用标准的OLS 模型进行回归,即t t-1t t-1t (Y Y )a(-)+b(X X )ρρρε-=1-+,在自相关存在的条件下t t t Y =a+bX +ε所表示的自变量与因变量之间的关系是不对的,必须用改进的模型进行回归。

在EVIEWS 中自相关的补救措施是在回归方程的自变量中加上AR(1),此AR(1)相当于在回归中考虑了残差的影响,在方程对象的view----presentation 中考虑了AR(1)的回归方程通常形式为CHANGE =1*CLOSE - 9*MAX + 4 + [AR(1)= 1]。

7在假定不存在序列相关的情况下使用t t t Y =a+bX +ε进行回归的结果不理想,往往是由回归结果的DW 值偏离2很远来判断,因此断定存在序列相关性,由此断定使用t t t Y =a+bX +ε作为回归模型是不正确的,必须采取补救措施来纠正自相关的影响,采取补救措施指的是对模型进行调整,回归方法仍然是OLS ,对数据之间的关系建模最终是要得到两个变量之间的相互关系的方程,t t-1t t-1t (Y Y )a(-)+b(X X )ρρρε-=1-+与t t t Y =a+bX +ε一样也是表示两个变量的相互关系,只不过在序列相关存在的情况下,后者是所表示的变量之间的关系是不正确的。

13 自相关是指在时间(如在时间序列数据中)或者空间(如在横截面数据中)按顺序所列观察值序列的各成员间存在着相关,简言之就是本期的扰动项与前期的扰动项相关,是由于时间序列数据的非静态性

(Non-stationary)引起的,时间数列的非静态性与截面数据的异方差性相对应,相当于用于计算统计量的样本随时间而发生了改变,从而样本的方差和均值也发生了改变,使得各个时期的数据好像不属于一个相同的样本,从使普通的回归方法无效,通常是由于时间序列的惯性以及模型设定等方面的原因导致的,其

后果与异方差相同,实践中很难取得关于U的数据,只是用残差来代替,因此可以借助于回归后的残差进行是否存在自相关的分析,在SPSS中通过Graphs→Time series→Autocorrelations绘制残差自相关图来观察自相关情况;也可以通过OLS线性回归结果中杜宾-瓦尔森d检验的d值来判断,d的取值范围是0到4,当取2时无自相关,当接近与4时负相关,接近于0时正相关,在SPSS回归对话框中点击Statistics在弹出的对话框中选Durbin- watson,就可以输出D值。当时间序列存在自相关时用Analyze→Time series→

Auto-regression 回归,回归结果中的AR(1)表明回归方程中含有因变量的一阶滞后。

14 异方差性和自相关的区别与联系,异方差性是指各个观察点所对应的扰动项的方差不相等,自相关是指各个观察点所对应的扰动项的之间是相关的,存在异方差性而不存在自相关时各个扰动项的协方差矩阵只有对角线上元素非0,并且不相等。存在自相关时各个扰动项的协方差矩阵的各项是协方差,对角线上的元素为方差,并且非对角线上的元素由于存在自相关而不为0。存在异方差和自相关都不符合Markov 条件,为了解决这两个问题所采取的解决措施的思路是一样的,都是找到一个矩阵,在回归方程的两边同时乘以该矩阵,将协方差矩阵变为只有对角线上的元素相等,非对角线上的元素为0的矩阵,使之满足OLS的假设条件A4,由线性代数的知识我们知道,一个矩阵与他的逆阵的乘积是一个单位阵,

第九章:时间序列分析

时间序列数据最大的问题就在于自相关问题的存在,时间序列分析主要有单时间序列的分析和多个时间序列的回归分析两类。单个时间序列的分析模型不同于普通经济计量模型,它不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化,利用过去的规律来推测未来,主要根据自相关性、移动平均性和单整性等;它明确考虑时间序列的非平稳性。多时间序列分析时,应该充分考虑平稳性问题。

******时间序列的定义,时间序列是对随机过程的一次观测结果,而随机过程是指随时间由随机变量组成的一个有序序列。

******为什么时间序列的平稳性非常重要,主要是为避免伪回归问题,在用一个时间序列对另一个时间序

R,这种情况表明存在伪列做回归时,虽然两者之间并无任何有意义的关系,但经常会得到一个很高的2

回归问题,伪回归的另一个重要表现是DW明显的偏离2,这种情况说明存在伪回归问题。例如儿子的身高与门前小树的高度之间的回归,因此在时间序列变量进行回归之前要进行平稳性检验。

多个时间序列之间关系的分析方法主要有三种,其一,是对不平稳序列进行加工,得到平稳序列再进行回归分析,如得到各自的差分序列,然后进行分析,当然差分序列之间的回归得到的就不是原变量之间的关系,而是原变量的差分之间的关系,原变量之间不存在通常意义上的回归关系,因为硬按原变量回归得到的结果是不满足基本假设是没有意义的。其二,是进行协整分析来分析两个不平稳的变量之间是否存在稳定的相互关系,如果存在那么采用误差修正模型进行分析。其三,是硬按原变量进行回归,同时在解释变量中加上AR和MA项以使回归残差满足基本假设。

******用EVIEWS估计方程时在Equation Estimation对话框中输入的AR(n)的含义,Estimating higher order

AR k you should enter your specification, AR models is only slightly more complicated. To estimate an ()

(完整word版)计量经济学知识点总结

第一章:1计量经济学研究方法:模型设定,估计参数,模型检验,模型应用 2.计量经济模型检验方式:①经济意义:模型与经济理论是否相符②统计推断:参数估计值是否抽样的偶然结果③计量经济学:是否复合基本假定④预测:模型结果与实际杜比 3.计量经济学中应用的数据类型:①时间序列数据(同空不同时)②截面数据(同时不同空)③混合数据(面板数据)④虚拟变量数据(学历,季节,气候,性别) 第二章:1.相关关系的类型:①变量数量:简单相关/多重相关(复相关)②表现形式:线性相关(散布图接近一条直线)/非线性相关(散布图接近一条直线)③变化的方向:正相关(变量同方向变化,同增同减)/负相关(变量反方向变化,一增一减不相关) 2.引入随机扰动项的原因:①未知影响因素的代表(理论的模糊性)②无法取得数据的已知影响因素的代表(数据欠缺)③众多细小影响因素综合代表(非系统性影响)④模型可能存在设定误差(变量,函数形式设定)⑤模型中变量可能存在观测误差(变量数据不符合实际)⑥变量可能有内在随机性(人类经济行为的内在随机性) 3.OLS回归线数学性质:①剩余项的均值为零②OLS回归线通过样本均值③估计值的均值等于实际观测值的均值④被解释变量估计值与剩余项不相关⑤解释变量与剩余项不相关 4.OLS估计量”尽可能接近”原则:无偏性,有效性,一致性 5.OLS估计式的统计性质/优秀品质:线性特征,无偏性特征,最小方差性特征 第三章:1.偏回归系数:控制其他解释变量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,即对Y平均值直接或净的影响 2.多元线性回归中的基本假定:①零均值②同方差③无自相关④随机扰动项与解释变量不相关⑤无多重共线性⑥正态性…一元中有12346 3. OLS回归线数学性质:同第二章3 4. OLS估计式的统计性质:线性特征,无偏性特征,最小方差性特征 5.为什么用修正可决系数不用可决系数?可决系数只涉及变差没有考虑自由度,如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难 第四章:1.多重共线性背景:①经济变量之间具有共同变化趋势②模型中包含滞后变量③利用截面数据建立模型可出现..④样本数据自身原因 2.后果:A完全①参数估计值不确定②csgj值方差无限大B不完全①csgj量方差随贡献程度的增加而增加②对cs区间估计时,置信区间区域变大③假设检验用以出现错误判断④可造成可决系数较高,但对各cs估计的回归系数符号相反,得出错误结论 3.检验:A简单相关系数检验法:COR 解释变量.大于0.8,就严重B方差膨胀因子法:因子越大越严重;≥10,严重C直观判断法:增加或剔除一个解释变量x,估计值y发生较大变化,则存在;定性分析,重要x标准误差较大并没通过显著性检验时,则存在;x回归系数所带正负号与定性分析结果违背,则存在;x相关矩阵中,x之间相关系数较大,则存在D逐步回归检验法:将变量逐个引入模型,每引入一个x,都进行F检验,t检验,当原来引入的x由于后面引入的x不显著是,将其剔除.以确保每次引入新的解释变量之前方程种植包含显著变量. 4.补救措施:①剔除变量法②增大样本容量③变换模型形式:自相关④利用非样本先验信息⑤截面数据与时序数据并用:异方差⑥变量变换 第五章:1.异方差产生原因:①模型中省略了某些重要的解释变量②模型设定误差③数据测量误差④截面数据中总体各单位的差异 2.后果:A参数估计统计特性:参数估计的无偏性仍然成立;参数估计方差不再是最小B参数显著性检验:t统计量进行参数检验失去意义C预测影响:将无效 3检验:A图示①相关图形分析data x y,看散点图,quick→graph→x,y→OK→scatter diagram→

计量经济学 心得

计量经济学学习心得报告 通过这个学期学习的计量经济学这门课程,王新华老师在我们学习计量经济学给了我们很多细 心的讲解和耐心的指导,我们针对学习内容主要学到的主要有两点:一:对EVIES软件的熟练操作与应用,学会了Eviews软件,我感觉自己真的是很幸运,因为毕竟有些软件是属于那种有价无市的,如果没有老师的传授我不可能从市场上或是从思想上认识到它;二:对于计量经济 学各种案例分析的认识我是很深刻的,在这一次对一个案例进行回归分析讲述中,我不但巩固 了老师课堂所讲的知识,也提高了胆识,增长了见识,也学会了团队与协作的力量。 以下我将着重从两个方面阐述我对计量经济学知识的一些认识以及个人从中学到的经验与心得。一:计量经济学教我了我很多。 在学习计量经济学的过程中,我可以旁征博引,同时老师也给了我很多有意思的启发,因为即 将面临考研的抉择,这门课也是我考研过程中必备的一门课程,因此,它作为一门核心必修课,我们都会很用心得听讲,并对一些重要的知识做了记录,从而为自己的考研奠定一定的基础。 二:计量经济学的系统知识 计量经济学的定义为:用数学方法探讨经济学可以从好几个方面着手,但任何一个方面都不能 和计量经济学混为一谈。计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经 济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应视为数学应用于经济学 的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系 来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计 量经济学。 计量经济学关心统计工具在经济问题与实证资料分析上的发展和应用,经济学理论提供对于经 济现象逻辑一致的可能解释。因为人类行为和决策是复杂的过程,所以一个经济议题可能存在 多种不同的解释理论。当研究者无法进行实验室的实验时,一个理论必须透过其预测与事实的 比较来检验,计量经济学即为检验不同的理论和经济模型的估计提供统计工具。 在计量经济学一元线性回归模型,我认识到:变量间的关系及回归分析的基本概念,主要包括:其次有一元线形回归模型的参数估计及其统计检验与应用,包括: 我也学会了参数的最大似然估计法语最小二乘法。对于最小二乘法,当从模型总体随机抽取n 组样本观测值后,最合理的参数估计量应该使得模型能最好的拟合样本数据,而对于最大似然 估计法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽 取该n组样本观测值的概率最大。显然,这是从不同原理出发的两种参数估计方法。即:

计量经济学讲解习题二Word版

计量经济学练习题(二) 一、单选题 1、根据样本资料建立某消费函数如下:,其中C为消费,x为收入,虚拟变量,所有参数均检验显著,则城镇家庭 的消费函数为。 A、 B、 C、 D、 2、如果某个结构方程是恰好识别的,估计其参数可用。 A、最小二乘法 B、极大似然法 C、广义差分法 D、间接最小二乘法 3、某商品需求函数为,其中y为需求量,x为价格。为了考虑“地 区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为。 A、2 B、 4 C、5 D、6 4、消费函数模型,其中y为消费,x为收入, ,,,该模型中包含了几个质 的影响因素。 A、1 B、2 C、 3 D、4

5、同一统计指标按时间顺序记录的数据列称为 A、横截面数据 B、时间序列数 据 C、修匀数据 D、平行数据 6、判断模型参数估计量的符号、大小、相互之间关系的合理性属于()准则。 A、经济计量准则 B、经济理论准则 C、统计准则 D、统计准则和经济理论准则 7、对于模型,为了考虑“地区”因素(北方、南方),引入2 个虚拟变量形成截距变动模型,则会产生。 A、序列的完全相关 B、序列的不完全相关 C、完全多重共线性 D、不完全多重共线性 8、简化式模型是用所有()作为每个内生变量的解释变量。 A、外生变量 B、先决变量 C、虚拟变量 D、滞后内生变量 9、联立方程模型中,如果某一个方程具有一组参数估计量,则该方程为. A、不可识别 B、恰好识别 C、过度识别 D、模型可识别 10、如果联立方程模型中某个结构方程包含了所有的变量,则这个方程。 A、恰好识别 B、不可识别 C、过度识别 D、不确定 11、对于联立方程模型,若在第1个方程中被解释变量为,解释变量全部为先决变量;在第2个方程中被解释变量为,解释变量中除了作为第

计量经济学分析计算题Word版

计量经济学分析计算题(每小题10分) 1.下表为日本的汇率与汽车出口数量数据, X:年均汇率(日元/美元) Y:汽车出口数量(万辆) 问题:(1)画出X 与Y 关系的散点图。 (2)计算X 与Y 的相关系数。其中X 129.3= ,Y 554.2=,2 X X 4432.1∑ (-)=,2 Y Y 68113.6∑(-)=,()()X X Y Y ∑--=16195.4 (3)采用直线回归方程拟和出的模型为 ?81.72 3.65Y X =+ t 值 1.2427 7.2797 R 2=0.8688 F=52.99 解释参数的经济意义。 2.已知一模型的最小二乘的回归结果如下: i i ?Y =101.4-4.78X 标准差 (45.2) (1.53) n=30 R 2=0.31 其中,Y :政府债券价格(百美元),X :利率(%)。 回答以下问题:(1)系数的符号是否正确,并说明理由;(2)为什么左边是i ?Y 而不是i Y ; (3)在此模型中是否漏了误差项i u ;(4)该模型参数的经济意义 是什么。 3.估计消费函数模型i i i C =Y u αβ++得 i i ?C =150.81Y + t 值 (13.1)(18.7) n=19 R 2=0.81 其中,C :消费(元) Y :收入(元) 已知0.025(19) 2.0930t =,0.05(19) 1.729t =,0.025(17) 2.1098t =,0.05(17) 1.7396t =。

问:(1)利用t 值检验参数β的显著性(α=0.05);(2)确定参数β的标准差;(3)判断一下该模型的拟合情况。 4.已知估计回归模型得 i i ?Y =81.7230 3.6541X + 且2X X 4432.1∑ (-)=,2 Y Y 68113.6∑ (-)=, 求判定系数和相关系数。 5.有如下表数据 日本物价上涨率与失业率的关系 (1)设横轴是U ,纵轴是P ,画出散点图。根据图形判断,物价上涨率与失业率之间是什么样的关系?拟合什么样的模型比较合适? (2)根据以上数据,分别拟合了以下两个模型: 模型一:1 6.3219.14 P U =-+ 模型二:8.64 2.87P U =- 分别求两个模型的样本决定系数。 7.根据容量n=30的样本观测值数据计算得到下列数据:XY 146.5= ,X 12.6=,Y 11.3=,2X 164.2=,2Y =134.6,试估计Y 对X 的回归直线。 8.下表中的数据是从某个行业5个不同的工厂收集的,请回答以下问题:

计量经济学复习要点1

计量经济学复习要点 第1章 绪论 数据类型:截面、时间序列、面板 用数据度量因果效应,其他条件不变的概念 习题:C1、C2 第2章 简单线性回归 回归分析的基本概念,常用术语 现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。 简单线性回归模型是只有一个解释变量的线性回归模型。 回归中的四个重要概念 1. 总体回归模型(Population Regression Model ,PRM) t t t u x y ++=10ββ--代表了总体变量间的真实关系。 2. 总体回归函数(Population Regression Function ,PRF ) t t x y E 10)(ββ+=--代表了总体变量间的依存规律。 3. 样本回归函数(Sample Regression Function ,SRF ) t t t e x y ++=10??ββ--代表了样本显示的变量关系。 4. 样本回归模型(Sample Regression Model ,SRM ) t t x y 10???ββ+=---代表了样本显示的变量依存规律。 总体回归模型与样本回归模型的主要区别是:①描述的对象不同。总体回归模型描述总体 中变量y 与x 的相互关系,而样本回归模型描述所关的样本中变量y 与x 的相互关系。②建立模型的依据不同。总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。③模型性质不同。总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变。 总体回归模型与样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。 线性回归的含义 线性:被解释变量是关于参数的线性函数(可以不是解释变量的线性函数) 线性回归模型的基本假设 简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u 的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定) 普通最小二乘法(原理、推导) 最小二乘法估计参数的原则是以“残差平方和最小”。

计量经济学课后习题1-8章

计量经济学课后习题总结 第一章绪论 1、什么事计量经济学? 计量经济学就是把经济理论、经济统计数据和数理统计学与其他数学方法相结合,通过建立经济计量模型来研究经济变量之间相互关系及其演变的规律的一门学科。 2、计量经济学的研究方法有那几个步骤? (1)建立模型:包括模型中变量的选取及模型函数形式的确定。 (2)模型参数的估计:通过搜集相关是数据,采用不同的参数估计方法,进行模型参数估计。 (3)模型参数的检验:包括经济检验、以及统计学方面的检验。 (4)经济计量模型的应用:经济预测、经济结构分析、经济政策评价。 3、经济计量模型有哪些特点? 经济计量模型是一个代数的、随即的数学模型,它可以是线性或非线性(对参数而言)形式。 4、经济计量模型中的数据有哪几种类型 (1)定量数据:时间序列数据、截面数据、面板数据 (2)定型数据:虚拟变量数据 第二章一元线性回归模型 1、什么是相关关系?它有那几种类型?(书上没有确切的答案) (1)相关关系:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量 间的这种相互关系,称为具有不确定性的相关关系 (2)相关关系的种类 1.按相关程度分类: (1)完全相关:一种现象的数量变化完全由另一种现象的数量变化所确定。在这种情况下,相关关系便称为函数关系,因此也可以说函数关 系是相关关系的一个特例。 (2)不完全相关:两个现象之间的关系介于完全相关和不相关之间 (3)不相关:两个现象彼此互不影响,其数量变化各自独立 2.按相关的方向分类: (1)正相关:两个现象的变化方向相同 (2)负相关:两个现象的变化方向相反 3.按相关的形式分类 (1)线性相关:两种相关现象之间的关系大致呈现为线性关系 (2)非线性相关:两种相关现象之间的关系并不表现为直线关系,而是 近似于某种曲线方程的关系

计量经济学-李子奈-计算题整理集合

计算分析题(共3小题,每题15分,共计45分) 1、下表给出了一含有3个实解释变量的模型的回归结果: 方差来源 平方和(SS ) 自由度(d.f.) 来自回归65965 — 来自残差— — 总离差(TSS) 66056 43 (1)求样本容量n 、RSS 、ESS 的自由度、RSS 的自由度 (2)求可决系数)37.0(-和调整的可决系数2 R (3)在5%的显著性水平下检验1X 、2X 和3X 总体上对Y 的影响的显著性 (已知0.05(3,40) 2.84F =) (4)根据以上信息能否确定1X 、2X 和3X 各自对Y 的贡献?为什么? 1、 (1)样本容量n=43+1=44 (1分) RSS=TSS-ESS=66056-65965=91 (1分) ESS 的自由度为: 3 (1分) RSS 的自由度为: d.f.=44-3-1=40 (1分) (2)R 2=ESS/TSS=65965/66056=0.9986 (1分) 2R =1-(1- R 2)(n-1)/(n-k-1)=1-0.0014?43/40=0.9985 (2分) (3)H 0:1230βββ=== (1分) F=/65965/39665.2/(1)91/40 ESS k RSS n k ==-- (2分) F >0.05(3,40) 2.84F = 拒绝原假设 (2分) 所以,1X 、2X 和3X 总体上对Y 的影响显著 (1分) (4)不能。 (1分) 因为仅通过上述信息,可初步判断X 1,X 2,X 3联合起来 对Y 有线性影响,三者的变化解释了Y 变化的约99.9%。但由于 无法知道回归X 1,X 2,X 3前参数的具体估计值,因此还无法 判断它们各自对Y 的影响有多大。 2、以某地区22年的年度数据估计了如下工业就业模型 i i i i i X X X Y μββββ++++=3322110ln ln ln 回归方程如下: i i i i X X X Y 321ln 62.0ln 25.0ln 51.089.3?+-+-= (-0.56)(2.3) (-1.7) (5.8) 2 0.996R = 147.3=DW 式中,Y 为总就业量;X 1为总收入;X 2为平均月工资率;X 3为地方政府的

计量经济学课后习题答案

计量经济学练习题 第一章导论 一、单项选择题 ⒈计量经济研究中常用的数据主要有两类:一类是时间序列数据,另一类是【 B 】 A 总量数据 B 横截面数据 C平均数据 D 相对数据 ⒉横截面数据是指【A 】 A 同一时点上不同统计单位相同统计指标组成的数据 B 同一时点上相同统计单位相同统计指标组成的数据 C 同一时点上相同统计单位不同统计指标组成的数据 D 同一时点上不同统计单位不同统计指标组成的数据 ⒊下面属于截面数据的是【D 】 A 1991-2003年各年某地区20个乡镇的平均工业产值 B 1991-2003年各年某地区20个乡镇的各镇工业产值 C 某年某地区20个乡镇工业产值的合计数 D 某年某地区20个乡镇各镇工业产值 ⒋同一统计指标按时间顺序记录的数据列称为【B 】 A 横截面数据 B 时间序列数据 C 修匀数据D原始数据 ⒌回归分析中定义【 B 】 A 解释变量和被解释变量都是随机变量 B 解释变量为非随机变量,被解释变量为随机变量 C 解释变量和被解释变量都是非随机变量 D 解释变量为随机变量,被解释变量为非随机变量 二、填空题 ⒈计量经济学是经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论,可以理解为数学、统计学和_经济学_三者的结合。 ⒉现代计量经济学已经形成了包括单方程回归分析,联立方程组模型,时间序列分 析三大支柱。

⒊经典计量经济学的最基本方法是回归分析。 计量经济分析的基本步骤是:理论(或假说)陈述、建立计量经济模型、收集数据、计量经济模型参数的估计、检验和模型修正、预测和政策分析。 ⒋常用的三类样本数据是截面数据、时间序列数据和面板数据。 ⒌经济变量间的关系有不相关关系、相关关系、因果关系、相互影响关系和恒 等关系。 三、简答题 ⒈什么是计量经济学?它与统计学的关系是怎样的? 计量经济学就是对经济规律进行数量实证研究,包括预测、检验等多方面的工作。计量经济学是一种定量分析,是以解释经济活动中客观存在的数量关系为内容的一门经济学学科。 计量经济学与统计学密切联系,如数据收集和处理、参数估计、计量分析方法设计,以及参数估计值、模型和预测结果可靠性和可信程度分析判断等。可以说,统计学的知识和方法不仅贯穿计量经济分析过程,而且现代统计学本身也与计量经济学有不少相似之处。例如,统计学也通过对经济数据的处理分析,得出经济问题的数字化特征和结论,也有对经济参数的估计和分析,也进行经济趋势的预测,并利用各种统计量对分析预测的结论进行判断和检验等,统计学的这些内容与计量经济学的内容都很相似。反过来,计量经济学也经常使用各种统计分析方法,筛选数据、选择变量和检验相关结论,统计分析是计量经济分析的重要内容和主要基础之一。 计量经济学与统计学的根本区别在于,计量经济学是问题导向和以经济模型为核心的,而统计学则是以经济数据为核心,且常常是数据导向的。典型的计量经济学分析从具体经济问题出发,先建立经济模型,参数估计、判断、调整和预测分析等都是以模型为基础和出发点;典型的统计学研究则并不一定需要从具体明确的问题出发,虽然也有一些目标,但可以是模糊不明确的。虽然统计学并不排斥经济理论和模型,有时也会利用它们,但统计学通常不一定需要特定的经济理论或模型作为基础和出发点,常常是通过对经济数据的统计处理直接得出结论,统计学侧重的工作是经济数据的采集、筛选和处理。 此外,计量经济学不仅是通过数据处理和分析获得经济问题的一些数字特征,而且是借助于经济思想和数学工具对经济问题作深刻剖析。经过计量经济分析实证检验的经济理论和模型,能够对分析、研究和预测更广泛的经济问题起重要作用。计量经济学从经济理论和经济模型出发进行计量经济分析的过程,也是对经济理论证实或证伪的过程。这些是以处理数

计量经济学总结

计量经济学复习范围 一、回归模型的比较 1.根据模型估计结果观察分析 (1)回归系数的符号与值的大小就是否符合经济理论要求 (2)改变模型形式之后就是否使判定系数的值明显提高 (3)各个解释变量t 检验的显著性 2.根据残差分布观察分析 在方程窗口点击View \ Actual,Fitted,Residual\Tabe(或Graph) (1)残差分布表中,各期残差就是否大都落在σ ?±的虚线框内。 (2)残差分布就是否具有某种规律性,即就是否存在着系统误差。 (3)近期残差的分布情况 二、 判断新的解释变量引入模型就是否合适(遗漏变量检验) 1、基本原理 如果模型逐次增加一个变量, 由于增加一个新的变量,ESS 相对于RSS 的增加,称为这个变量的“增量贡献”或“边际贡献”。 不引入:0H (即引入的变量不显著) ())'','(~)''/(/' k k F k n RSS k ESS ESS F new old new --= 或 )'','(~/)1(/)(''2' 22k k F k n R k R R F NEW OLD NEW ---= 其中,'k 为新引进解释变量的个数,''k 为引进解释变量后的模型中参数个数。 判别增量贡献的准则:如果增加一个变量使2R 变大,即使RSS 不显著地减少,这个变量从边际贡献来瞧,就是值得增加的。 若F>F 或者对应的P 值充分小,拒绝 则认为引入新的解释变量合适;否则,接受则认为引入新的解释变量不合适。 三、伪回归的消除 如果解释变量与被解释变量均虽随时间而呈同趋势变动,如果不包含时间趋势变量而仅仅就是将Y 对X 回归,则结果可能仅仅反映这两个变量的同趋势特征而没有反映它们之间的真实关系,这种回归也称为伪回归。

计量经济学计算题题库

五、简答题: 1.给定一元线性回归模型: t t t X Y μββ++=10 n t ,,2,1 = (1)叙述模型的基本假定;(2)写出参数 0β和1β的最小二乘估计公式; (3)说明满足基本假定的最小二乘估计量的统计性质; (4)写出随机扰动项方差的无偏估计公式。 2.对于多元线性计量经济学模型: t kt k t t t X X X Y μββββ+++++= 33221 n t ,,, 21= (1)该模型的矩阵形式及各矩阵的含义; (2)对应的样本线性回归模型的矩阵形式; (3)模型的最小二乘参数估计量。 6.线性回归模型的基本假设。违背基本假设的计量经济模型是否可以估计 五、简答题: 1.答:(1)零均值,同方差,无自相关,解释变量与随机误差项相互独立(或者解释变量为非随机变量) (2)∑∑=== n t t n t t t x y x 1 21 1 ?β,X Y 1 0??ββ-= (3)线性即,无偏性即,有效性即 (4)2 ?1 2 2 -= ∑=n e n t t σ ,其中∑∑∑∑∑=====-=-=n t t t n t t n t t n t t n t t y x y x y e 1 11 21 2211 21 2 ??ββ 2. 答: (1)N XB Y +=; 1 21?? ? ????? ??=n n Y Y Y Y )1(2122212 12111111+???????? ??=k n kn n n k k X X X X X X X X X X 1 )1(210?+????? ??? ??=k n B ββββ 1 21???????? ??=n n N μμμ (2)E B X Y +=?; (3)()Y X X X B ''=-1 ?。 6.答: (1)随机误差项具有零均值。即

计量经济学的概念

计量经济学是经济科学领域内的一门应用科学,以一定的经济理论和实际统计资料为基础,运用数学、统计方法与计算机技术,以建立经济计量模型为主要手段,定量分析研究具有随机特性的经济变量关系。 2、数理经济模型与计量经济模型的区别。 数理:揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 计量:揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。 3、经典计量经济学模型的一般形式。 4、计量经济学的数据类型。 时间序列数据:按时间先后排列的统计数据。 截面数据:一个或多个变量在某一时点上的数据集合。 合并数据(平行数据):既包含时间序列数据又有截面 数据。 5、建立计量经济学模型的步骤。 1) 模型的数学形式。③拟定模型中待估计参数的理论期望 值。 2)样本数据的收集: 差项产生序列相关。②截面数据易引起模型随机误差项 产生异方差。③样本数据的质量:完整性、准确性、可 比性、一致性。 3)模型参数的估计。 4 度检验、变量的显着性检验、方程的显着性检验。③计 量经济学检验:序列相关、异方差法(随机误差项)、 多重共线性(解释变量)④模型预测检验。 6、计量经济学模型的应用。 1)结构分析;2)经济预测;3)政策评价;4)检验与发展经济理论。 7、如何正确选择解释变量。 作为“变量”的原因:1 2)考虑数据的可得性;3)考虑入选变量之间的关系。 8、回归分析的目的。 1)根据自变量的取值,估计应变量的均值;2)检验建立在经济理论基础上的假设;3) 值,预测应变量的均值。 9、总体回归函数(PRF)和样本回归函数(SRF)各变量系数名称及函数方程。 10、随机误差项(Ui)的性质或主要内容。

计量经济学重点知识归纳整理

1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值 {}n i Y X i i ,2,1:),(?=,普通最小二乘法要求样本回归函数尽可以好地拟合这组 值,即样本回归线上的点∧ i Y 与真实观测点Yt 的“总体误差”尽可能地小。普通 最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和 最小。 2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义, 或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。从此 意义看,加权最小二乘法也称为广义最小二乘法。 3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不 存在异方差性的模型,然后采用普通最小二乘法估计其参数。 4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种 参数估计方法。 5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适 用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。 6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程 采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关 系体系,计算得到结构式参数的估计量的一种方法。 7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数, 而是互不相同,则认为出现了异方差性。 8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机 干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设, 称为存在序列相关性。 9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++?+++=i k 22110i , 其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。如果某两个或多个解释

计量经济学计算题总结

计量经济学计算题总结 1、表中所列数据是关于某种商品的市场供给量Y和价格水平X的观察值: ①用OLS法拟合回归直线; ②计算拟合优度R2; ③确定β1是否与零有区别。 2、求下列模型的参数估计量,

3 、设某商品需求函数的估计结果为(n=18 ): 解:(1) 4 、

5、 模型式下括号中的数字为相应回归系数估计量的标准误。又由t分布表和F分布表得知:t0.025(5)=2.57,t0.025(6)=2.45;F0.05(3,6)=4.76,F0.05(4,5)=5.19, 试根据上述资料,对所给出的两个模型进行检验,并选择出一个合适的模型。

解:(1 )总离差平方和的自由度为n-1,所以样本容量为35。 (2) (3) 7.某商品的需求函数为 其中,Y 为需求量,X1为消费者收入,X2为该商品价格。 (1)解释参数的经济意义。 (2)若价格上涨10%将导致需求如何变化? (3)在价格上涨10%情况下,收入增加多少才能保持需求不变。 (4)解释模型中各个统计量的含义。 220.611 4384126783 /(1)10.587/(1)ESS R TSS RSS n k R TSS n ===--=-=-ESS/k 解:(1)由样本方程的形式可知,X1的参数为此商品的收入弹性,表示X2的参数为此商品的价格弹性。 (2)由弹性的定义知,如果其它条件不变,价格上涨10%,那么对此商品的需求量将下降1.8%。 (3)根据同比例关系,在价格上涨10%情况下,为了保持需求不变,收入需要增加0.46×0.018= 0.00828,即 0.828%。 (4)第一行括弧里的数据0.126、0.032是参数估计量的样本标准差,第二行括弧里的数据3.651、-5.625是变量 显著性检验的t 值,t 值较大,说明收入和价格对需求的影响显著. 分别是决定系数、调整的决定系数、方程显著性检验的F 值,这三个统计量的取值较大,说明模型的总体拟合 效果较好。 8、 现有X 和Y 的样本观察值如下表: X 2 5 10 4 10 Y 4 7 4 5 9 假设Y 对X 的回归模型为: 试用适当的方法估计此回归模型。

(完整word版)计量经济学习题与答案

期中练习题 1、回归分析中使用的距离是点到直线的垂直坐标距离。最小二乘准则是指( ) A .使∑=-n t t t Y Y 1 )?(达到最小值 B.使∑=-n t t t Y Y 1 达到最小值 C. 使 ∑=-n t t t Y Y 1 2 )(达到最小值 D.使∑=-n t t t Y Y 1 2)?(达到最小值 2、根据样本资料估计得出人均消费支出 Y 对人均收入 X 的回归模型为 ?ln 2.00.75ln i i Y X =+,这表明人均收入每增加 1%,人均消费支出将增加 ( ) A. 0.75 B. 0.75% C. 2 D. 7.5% 3、设k 为回归模型中的参数个数,n 为样本容量。则对总体回归模型进行显著性检验的F 统计量与可决系数2 R 之间的关系为( ) A.)1/()1()/(R 2 2---=k R k n F B. )/(1)-(k ) R 1/(R 22k n F --= C. )/()1(22k n R R F --= D. ) 1()1/(22R k R F --= 6、二元线性回归分析中 TSS=RSS+ESS 。则 RSS 的自由度为( ) A.1 B.n-2 C.2 D.n-3 9、已知五个解释变量线形回归模型估计的残差平方和为 8002=∑t e ,样本容量为46,则随机 误差项μ的方差估计量2 ?σ 为( ) A.33.33 B.40 C.38.09 D. 20 1、经典线性回归模型运用普通最小二乘法估计参数时,下列哪些假定是正确的( ) A.0)E(u i = B. 2 i )V ar(u i σ= C. 0)u E(u j i ≠ D.随机解释变量X 与随机误差i u 不相关 E. i u ~),0(2 i N σ 2、对于二元样本回归模型i i i i e X X Y +++=2211???ββα,下列各式成立的有( ) A.0 =∑i e B. 0 1=∑i i X e C. 0 2=∑i i X e D. =∑i i Y e E. 21=∑i i X X 4、能够检验多重共线性的方法有( ) A.简单相关系数矩阵法 B. t 检验与F 检验综合判断法 C. DW 检验法 D.ARCH 检验法 E.辅助回归法

计量经济学知识点总结

绪论 计量经济学:根据理论和观测的事实,运用合适的推理方法使之联系起来同时推导,对实际经济现象进行的数量分析。 计量经济学(定量分析)是经济学(定性分析)、统计学和数学(定量分析)的结合。 目的:把实际经验的内容纳入经济理论,确定变现各种经济关系的经济参数,从而验证经济理论,预测经济发展的趋势,为制定经济策略提供依据。 类型:理论计量经济学和应用计量经济学 计量经济学的研究步骤: (一)模型设定:要有科学的理论依据选择适当的数学形式方程中的变量要具有可观测性 (二)估计参数:参数不能直接观测而且是未知的 (三)模型检验:经济意义的检验、统计推断检验、计量经济学检验、模型预测检验 (四)模型应用:经济分析、经济预测、政策评价和检验、发展经济理论计量经济模型:计量经济模型是为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型,是以数学形式对客观经济现象所作的描述和概括。 计量经济研究中应用的数据包括:①时间序列②数据截面③数据面板④数据虚拟变量数据 第二章 简单线性回归模型:只有一个解释变量的线性回归模型 相关系数:两个变量之间线性相关程度可以用简单线性相关系数去度量 总体相关系数:对于研究的总体,两个相互关联的变量得到相关系数。 总体相关系数Var方差Cov协议方差

总体回归函数:将总体被解释函数Y的条件期望表现为解释变量X的函数 总体 个体随机扰动项 引入随机扰动项的原因? ①作为未知影响因素的代表②作为无法取得数据的已知因素的代表③作为众多细小因素的综合代表④模型的设定误差⑤变量的观测误差⑥经济现象的内在随机性。 简单线性回归的基本假定? (1)零均值假定时,即在给定解释变量Xi得到条件下,随机扰动项Ui的条件期望或条件均值为零。 (2)同方差假定,即对于给定的每一个Xi,随机扰动项Ui的条件方差等于某一常数。 (3)无相关假定,即随机扰动项Ui的逐次值互不相干,或者说对于所有的i和j(I不等于j),ui和uj的协方差为零。 (4)随机扰动项ui与解释变量Xi不想管 (5)正态性假定,即假定随机扰动项ui服从期望为零、方差为的正态分布。 最小二乘准则:用使估计的剩余平方和最小的原则确定杨讷回归函数 最小二乘估计量评价标准:无偏性、有效性、一致性。 统计特性:线性特性、无偏性、有效性。 E()= P28

计量经济学知识点重点总结

一、一些应该掌握的概念(课都上完以后回顾时候提到的应该知道的一些知识,有可能会出简答题) 1、中心极限定理 2、大数定理 3、正态分布 4、契比雪夫不等式 5、方差,期望 6、协方差及其相关系数, 二、一些基本题型 1、随机变量分布,“离散型100%考,图形不会的补考!”(此为他课上威胁性话语,所以重视程度排在第一位了……不知道是不是真考,《北方工业大学》版本有一个其他的数据的例子,供参考) 例:设对任意x,定义F(x)=P{X≤x}=P{w|X(w)≤x} X 1 2 3 P 1/3 1/3 1/3 求F(x)=P(X≤x)的分布 1)x<1时,F(x)= P(X<1)=0 2)1≤x<2时,F(x)= P(X≤1)=P(X=1)=1/3 3)2≤x<3时,F(x)= P(X≤2) =P(X=1)+ P(X=2)=2/3 4)3≤x时,F(x)= P(X≤3) =P(X=1)+P(X=2)+ P(X=3)=1 图形:次图形为右连续 F(x) 0 1 2 3 x 2、需求量,很容易考(原话) P15的例1.5,实在打不出来,留个地,大家自己写上去吧。 3、联合概率密度(简单被积分数,身高、体重作为随机变量) 例:用X表示身高,Y表示体重,(X,Y)为二维随机变量 定义F(l,w)=P{X≤l1, Y≤w1} 当两个事件相互独立时,得出

F(l,w)=F X(l) * F Y(w) 即同时满足身高、体重条件的概率为满足身高事件的概率与满足体重的概率乘积。 4、古典概型例子 例一:有藏品100个,其中5个次品,求取8个里面最多2个次品的概率?解:书上p6,例1.1 其中应注意公式: n! C m n =---------------------- m!(n-m)! (公式打得难看了一点,但是很有用) 例二:黑球a个,白球b个,放在一起抓阄。1≤k≤a+b,求在第k个位置抓到黑球的概率? 解: a*(a+b-1)! / (a+b)! =a/(a+b) 此用来证明第k次抽签时与前面抽到的概率都相等,(本人认为考的可能性小,哈哈) 例三:n个人坐一圈,求其中2个熟人坐一起的概率 解: P=2/(n-1) 即为,把两个人看作一个整体,与其他n-1个人排列,有n-1种方法,他们之间的座位左右更换,有两个,所以得出上式。太简单了,估计不会考吧? 例四:n个人,至少2个人同生日的概率 如p6,例1.2 P=1 - 365*364*…(365-n+1)/365n 例五:n双不同的鞋,取2k只,(2k

计量经济学学习心得

计量经济学小结 经过一个学期对计量经济学的学习,我收获了很多,也懂得了很多。通过以计量经济学为核心,以统计学,数学,经济学等学科为指导,辅助以一些软件的应用,从这些之中我都学到了很多知识。同时对这门课程有了新的认识,计量经济学对我们的生活很重要,它对我国经济的发展有重要的影响。 计量经济学对我们研究经济问题是很好的方法和理论。学习计量经济学给我印象和帮助最大的主要对EVIES软件的熟练操作与应用,记得以前学运筹学的时候,我学会了Lindo软件,而现在我又学会了Eviews软件,我感觉自己真的是很幸运,因为毕竟有些软件是属于那种有价无市的,如果没有老师的传授我不可能从市场上或是从思想上认识到它; 初步投身于计量经济学,通过利用Eviews软件将所学到的计量知识进行实践,让我加深了对理论的理解和掌握,直观而充分地体会到老师课堂讲授内容的精华之所在。在实验过程中我们提高了手动操作软件、数量化分析与解决问题的能力,还可以培养我在处理实验经济问题的严谨的科学的态度,并且避免了课堂知识与实际应用的脱节。虽然在实验过程中出现了很多错误,但这些经验却锤炼了我们发现问题的眼光,丰富了我们分析问题的思路。通过这次实验让我受益匪浅。 计量经济学是一门比较难的课程,其中涉及大量的公式,不容易理解且需要大量的运算,其中需要很好的数学基础、统计基础和自己

的分析思考能力,以及良好的计量软件应用能力,所以在学习的过程中我遇到了很多困难。但通过这次的实验,我对课上所学的最小二乘法有了进一步的理解,在掌握理论知识的同时,将其与实际的经济问题联系起来。在目前的学术现状下,要求研究者必须掌握计量的研究方法,这是实证研究最好的工具。用计量的工具,我们才能够把经济现象肢解开来,找到其中的脉络,进而分析得更加清晰。 对于计量经济学这一学科,虽然只是一门选修课,但是对我们很有用,特别是对EVIES软件的运用。我自认为自己对这一软件还没有完全掌握,在后期的学习中,希望能继续学习,熟练掌握这一软件的运用。

计量经济学计算题解法汇总

计量经济学:部分计算题解法汇总 1、求判别系数——R^2 已知估计回归模型得 i i ?Y =81.7230 3.6541X + 且2X X 4432.1∑ (-)=,2Y Y 68113.6∑(-)=, 2、置信区间 有10户家庭的收入(X ,元)和消费(Y ,百元)数据如下表: 10户家庭的收入(X )与消费(Y )的资料 X 20 30 33 40 15 13 26 38 35 43 Y 7 9 8 11 5 4 8 10 9 10 若建立的消费Y 对收入X 的回归直线的Eviews 输出结果如下: Dependent Variable: Y Adjusted R-squared F-statistic Durbin-Watson (1(2)在95%的置信度下检验参数的显著性。(0.025(10) 2.2281t =,0.05(10) 1.8125t =,0.025(8) 2.3060t =,0.05(8) 1.8595t =) (3)在90%的置信度下,预测当X =45(百元)时,消费(Y )的置信区间。(其中29.3x =,2()992.1x x - =∑) 答:(1)回归模型的R 2 =,表明在消费Y 的总变差中,由回归直线解释的部分占到90%以上,回归直线的代表性及解释能力较好。(2分) 家庭收入对消费有显著影响。(2分)对于截距项,

检验。(2分) (3)Y f =+×45=(2分) 90%置信区间为(,+),即(,)。(2分) 注意:a 水平下的t 统计量的的重要性水平,由于是双边检验,应当减半 3、求SSE 、SST 、R^2等 已知相关系数r =,估计标准误差?8σ=,样本容量n=62。 求:(1)剩余变差;(2)决定系数;(3)总变差。 (2)2220.60.36R r ===(2分) 4、联系相关系数与方差(标准差),注意是n-1 在相关和回归分析中,已知下列资料: 222X Y i 1610n=20r=0.9(Y -Y)=2000σσ∑=,=,,,。 (1)计算Y 对X 的回归直线的斜率系数。(2)计算回归变差和剩余变差。(3) (2)R 2=r 2==, 总变差:TSS =RSS/(1-R 2)=2000/=(2分)

(完整版)计量经济学知识点(超全版)

1.经济变量:经济变量是用来描述经济因素数量水平的指标。(3分) 2.解释变量:是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。(2分)它对因变量的变动做出解释,表现为方程所描述的因果关系中的“因”。(1分)3.被解释变量:是作为研究对象的变量。(1分)它的变动是由解释变量做出解释的,表现为方程所描述的因果关系的果。(2分) 4.内生变量:是由模型系统内部因素所决定的变量,(2分)表现为具有一定概率分布的随机变量,是模型求解的结果。(1分) 5.外生变量:是由模型系统之外的因素决定的变量,表现为非随机变量。(2分)它影响模型中的内生变量,其数值在模型求解之前就已经确定。(1分) 6.滞后变量:是滞后内生变量和滞后外生变量的合称,(1分)前期的内生变量称为滞后内生变量;(1分)前期的外生变量称为滞后外生变量。(1分) 7.前定变量:通常将外生变量和滞后变量合称为前定变量,(1分)即是在模型求解以前已经确定或需要确定的变量。(2分) 8.控制变量:在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量,(2分)它一般属于外生变量。(1分) 9.计量经济模型:为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型,(2分)是以数学形式对客观经济现象所作的描述和概括。(1分) 10.函数关系:如果一个变量y的取值可以通过另一个变量或另一组变量以某种形式惟一地、精确地确定,则y与这个变量或这组变量之间的关系就是函数关系。(3分) 11.相关关系:如果一个变量y的取值受另一个变量或另一组变量的影响,但并不由它们惟一确定,则y与这个变量或这组变量之间的关系就是相关关系。(3分) 12.最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法,称为最小二乘法。(3分) 13.高斯-马尔可夫定理:在古典假定条件下,OLS估计量是模型参数的最佳线性无偏估计量,这一结论即是高斯-马尔可夫定理。(3分) 14.总变差(总离差平方和):在回归模型中,被解释变量的观测值与其均值的离差平方和。(3分) 15.回归变差(回归平方和):在回归模型中,因变量的估计值与其均值的离差平方和,(2分)也就是由解释变量解释的变差。(1分) 16.剩余变差(残差平方和):在回归模型中,因变量的观测值与估计值之差的平方和,(2分)是不能由解释变量所解释的部分变差。(1分) 17.估计标准误差:在回归模型中,随机误差项方差的估计量的平方根。(3分) 18.样本决定系数:回归平方和在总变差中所占的比重。(3分) 19.点预测:给定自变量的某一个值时,利用样本回归方程求出相应的样本拟合值,以此作为因变量实际值和其均值的估计值。(3分) 20.拟合优度:样本回归直线与样本观测数据之间的拟合程度。(3分) 21.残差:样本回归方程的拟合值与观测值的误差称为回归残差。(3分) 22.显著性检验:利用样本结果,来证实一个虚拟假设的真伪的一种检验程序。(3分)23.回归变差:简称ESS,表示由回归直线(即解释变量)所解释的部分(2分),表示x对y的线性影响(1分)。 24.剩余变差:简称RSS,是未被回归直线解释的部分(2分),是由解释变量以外的因素造成的影响(1分)。 25.多重决定系数:在多元线性回归模型中,回归平方和与总离差平方和的比值(1分),

相关文档
最新文档