建立计量经济学模型的步骤和要点
建立计量经济学模型的步骤

建立计量经济学模型的步骤引言计量经济学是经济学中的一个重要分支,通过建立数学模型来研究经济现象和经济政策的影响。
建立计量经济学模型是进行实证研究的关键步骤,在经济学领域中具有广泛的应用。
本文将探讨建立计量经济学模型的步骤,并介绍每个步骤的具体内容和注意事项。
步骤一:确定研究问题研究问题是建立计量经济学模型的起点,研究者需要明确要解决的经济问题,并明确研究目的和假设。
例如,研究者可能要探索某种经济政策的影响,或者研究产品价格与市场需求之间的关系等。
确定研究问题需要广泛阅读相关文献,了解前人的研究成果,以及当前经济环境和政策的背景。
步骤二:收集数据数据是建立计量经济学模型的基础,研究者需要收集与研究问题相关的数据。
数据可以来自各种渠道,包括文献、政府统计数据、调查问卷等。
在收集数据时,需要注意数据的可靠性和有效性。
有时候,数据可能存在缺失或错误,需要进行数据清洗和验证。
步骤三:选择合适的模型框架在建立计量经济学模型时,研究者需要选择适合的模型框架。
模型框架可以是经济理论提供的基本关系模型,也可以是根据实际情况进行调整和修改的模型。
研究者需要根据研究问题和数据的特点,选择合适的模型框架。
步骤四:选择合适的变量在建立计量经济学模型时,研究者需要选择合适的变量。
变量是模型中的核心要素,反映了经济现象之间的关系。
合适的变量选择可以提高模型的解释力和预测能力。
选择变量时,需要考虑变量的可测性和相关性,并且尽量选择与研究问题密切相关的变量。
步骤五:估计模型参数在建立计量经济学模型后,研究者需要估计模型的参数。
参数估计可以通过最小二乘法等统计方法进行。
通过估计模型参数,可以得到参数的估计值和估计误差,并进行显著性检验。
参数估计的过程可以使用计量经济学软件进行。
步骤六:评估模型拟合度在建立计量经济学模型后,研究者需要评估模型的拟合度。
模型拟合度反映了模型对数据的拟合程度,可以通过统计指标如R方、调整R方、残差平方和等进行评估。
建立计量经济经济学模型的步骤和要点-PPT文档资料111页

ˆ 1
xi yi
x
2 i
ˆ 0 Y ˆ1 X
• 正规方程的表达式
ei 0 ei X i 0
第二周 答疑
• 期望、方差、协方差、相关系数的直观含义
期望衡量样本均值 方差衡量样本值相对样本均值的偏离程度 协方差衡量两个样本的相关性有多少,也就是一个样 本的值的偏离程度会对另一个样本的值的偏离产生什 么影响 相关系数衡量两个样本的相关性有多少
• 其目的在于通过后者的已知或设定值,去估计 和(或)预测前者的(总体)均值。
• 两类变量;
–被解释变量(Explained Variable)或应变量 (Dependent Variable)。
–解释变量(Explandependent Variable)。
– 该收入水平下所有家庭的平均消费支出E(Y|Xi),称 为系统性(systematic)或确定性(deterministic)部 分;
– 其他随机或非确定性(nonsystematic)部分i。
• 称为总体回归函数(PRF)的随机设定形式。表 明被解释变量除了受解释变量的系统性影响外, 还受其他因素的随机性影响。由于方程中引入了 随机项,成为计量经济学模型,因此也称为总体 回归模型(PRM)。
627 814 924 1144 1364 1551 1749 2046 2178 2530
638
E89(43Y75 | X109=172980011)21=1505 61103459078
1595 1650
1804 1848
2068 2266 2101 2354
2629 2860
968 1045 1243 1474 1672 1881 2189 2486 2871
计量经济学的步骤

计量经济学的步骤一、问题的确定:首先需要明确研究的经济问题。
例如,研究一些政策的影响、一些市场是否存在失灵、一些经济理论的验证等。
问题的确定是研究的出发点,其重要性在于指导后续的研究设计和数据选择。
二、模型的构建:根据所研究问题的具体情况,选择适合的经济模型。
经济模型是对经济现象进行简化和抽象的描述。
常用的经济模型有线性回归模型、自回归模型等。
模型的构建是研究的理论基础,通过模型的构建可以提供对经济现象的更深入理解和解释。
四、变量的测量:根据模型的需求,对数据中的变量进行定义和测量。
变量的测量是将具体的经济现象转化为可观测的数值。
通常情况下,需要对模型中的自变量和因变量进行测量。
例如,对于研究经济增长的模型,自变量可以是产出、劳动力、资本等,因变量可以是经济增长率。
五、模型的估计:通过统计方法对构建的模型进行估计。
常用的估计方法包括最小二乘估计、极大似然估计等。
估计的目标是通过样本数据来推断总体的参数。
估计结果不仅可以提供对模型参数的估计值,还可以提供参数的显著性检验、置信区间等。
六、模型的诊断:对已估计的模型进行诊断。
主要是检验模型的假设是否成立,模型的拟合效果如何。
常见的诊断方法有残差分析、多重共线性检验等。
诊断的目标是评估模型的可靠性和解释能力。
七、模型的应用:根据模型的结果进行经济现象的解释和预测。
研究者可以根据模型的参数估计值和影响系数进行政策建议、市场预测等。
八、结果的解释:对模型结果进行解释和讨论。
解释的目标是对研究问题给出有说服力的解释,或者推断因果关系,同时提出研究的限制和改进。
以上是计量经济学的一般步骤。
不同的研究问题和模型可能会有一些差别,但整体的流程是相似的。
通过这些步骤,我们可以将经济问题转化为可观测的数据,并利用统计方法对其进行分析,从而为经济理论和政策的制定提供支持。
建立计量经济学模型的步骤和要点

(2)数据来源
• 计量经济分析所需要的数据可以充分利用统计部 门提供的资料或是其他一些诸如网上期刊得到的 二手资料,以减少收集数据的工作量。
• 在没有有效来源时,可由自己通过调查得到。
(3) 样本数据的质量
数据高质量的标准: 完整性; 准确性; 可比性; 一致性
(1)完整性—— 模型中包含的所有变量都必须拥 有相同容量的样本观测值。 例如:P54表2.6.1 对于“遗失数据”的处理方法: 法一:样本容量足够大且样本点间的联系并不紧密 时,将出现遗失数据的所在样本点整个去掉。 法二:样本容量有限,样本点间的联系紧密时,采 取特定技术将遗失数据补上。
§1.2 建立计量经济学模型的步骤和要点(重 点)
一、理论模型的设计 (重点) 二、样本数据的收集(次重点) 三、模型参数的估计 四、模型的检验 五、计量经济学模型成功的三要素
讲述流程
一、用例子阐述建立计量经济学模型的步骤 二、具体实施中各步骤需完成的工作及各步 要点
一、建立计量经济学模型的步骤示例
(2)准确性有两方面含义: 第一:所得到的数据必须准确反映它所描述的经 济因素的状态,即统计数据或调查数据本身是准 确的;
α和β的经验值。
Q 76.05-3.88* P
Q顶上的帽子符号表示一种估计值。 根据估计结果,空调价格上涨100元,空调需 求量下降0.388万台。
④模型检验 以一定的标准,对估计结果进行检验。 如:斜率是否小于0?估计结果是否可靠?
小结:建立计量经济学模型的四个步骤
步骤
例子
1 理论模型的设计 2样本数据收集 3模型参数估计 4 模型检验
69
x
63
60 -
xx x
60
58
§1.3 建立与应用计量经济学模型的主要步骤

△ 政策评价
• 政策评价的重要性。 • 经济政策的不可试验性。 • 计量经济学模型的“经济政策实验室”功
能。
△ 理论检验与发展
• 任何经济学理论,只有当它成功地解释了过去,才能为人们 所接受。计量经济学模型提供了一种检验经济理论的好方法。
• 一个成功的模型,必须是很好地拟合样本数据,而样本数据 是已经发生的经济活动的客观再现,所以在模型中表出来的 经济活动的数量关系,是经济活动所遵循的规律,即理论的 客观再现。于是就提出了计量经济学模型的两方面功能:
稳定性检验:改变样本容量重新估计;具体作法是,
将原来估计的模型参数的样本数据增加(或减少)1~2个 观测数据,对模型参数进行重新估计,将新估计的模型与 原模型进行对比。如果参数的符号未发生变化、数值的大 小也未发生大的改变,则表明原估计的模型比较稳定,可 靠性较高。反之,则不稳定。
预测性能检验:对样本外一点进行实际预测。具体作
(2) 确定模型的数学形式
a 利用经济学和数理经济学的成果;
b 根据样本数据作出变量的散点图,由散点图显示的
函数关系作为理论模型的形式;
c 选择可能的形式试模拟,再选择结果较好的一种。
(3)拟定模型中待估计参数的理论期望值区间
符号、大小、 关系 例如:ln(人均食品需求量)=α+βln(人均收入)
+γln(食品价格) +δln(其它商品价格)+ε 其中α 、β、γ、δ的符号、大小、 关系
能够熟练使用。
四、模型的检验
(1)经济意义检验
根据拟定的符号、大小、关系
例如:ln(人均食品需求量)=-2.0-0.5ln(人均收入) -4.5ln(食品价格) +0.8ln(其它商品价格) ln(人均食品需求量)=-2.0+0.5ln(人均收入)- 4.5ln(食品价格)+0.8ln(其它商品价格) ln(人均食品需求量)=-2.0+0.5ln(人均收入)- 0.8ln(食品价格) +0.8ln(其它商品价格)
专题2.1 建立计量经济学模型的步骤和要点

§1.2 计量经济学模型建立、检验
一、居民人均消费模型—建模与统计检验
例2.5.1 考察中国居民收入与消费支出的关系。
GDPP: 人均国内生产总值(1990年不变价)
CONSP:人均居民消费(以居民消费价格指数(1990=100)缩减)。
表 2.5.1 年份 人均居民消费 CONSP 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 395.8 437.0 464.1 501.9 533.5 572.8 635.6 716.0 746.5 788.3 836.4 779.7 中 国 居 民 人 均 消 费 支 出 与 人 均 G D P ( 元 /人 ) 人 均 GDP GDPP 675.1 716.9 763.7 792.4 851.1 931.4 1059.2 1185.2 1269.6 1393.6 1527.0 1565.9 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 年份 人均居民消费 CONSP 797.1 861.4 966.6 1048.6 1108.7 1213.1 1322.8 1380.9 1460.6 1564.4 1690.8 人 均 GDP GDPP 1602.3 1727.2 1949.8 2187.9 2436.1 2663.7 2889.1 3111.9 3323.1 3529.3 3789.7
(万千瓦) 18022 19497 20913 22950 24836 26575 28067 28708 29389 30308 31817 33802 36118 38547 42016 45208 48996 52574
简述建立计量经济学模型的基本步骤

简述建立计量经济学模型的基本步骤计量经济学是经济学中的一个重要分支,它通过应用数学和统计学的方法来分析经济现象。
建立一个合理有效的计量经济学模型是进行经济研究的基础,下面将简述建立计量经济学模型的基本步骤。
1. 提出问题和目标建立计量经济学模型的第一步是明确研究的问题和目标。
研究者需要明确自己要解决的经济问题,确定研究的目标和范围。
例如,研究者可能想要探究某个经济政策对就业率的影响,或者分析某个产业的市场竞争程度等。
2. 收集数据在建立计量经济学模型之前,研究者需要收集相关的经济数据。
数据的选择和获取对于研究的可靠性和有效性至关重要。
研究者可以通过各种途径收集数据,包括统计年鉴、调查问卷、实地观察等。
在收集数据时,研究者需要注意数据的可靠性、完整性和时效性。
3. 确定理论框架在建立计量经济学模型之前,研究者需要确定一个合适的理论框架。
理论框架是指用来解释经济现象和规律的理论体系。
研究者可以借鉴已有的经济理论,也可以根据自己的研究问题提出新的理论框架。
理论框架应该具有逻辑严密性,并能够解释研究问题。
4. 建立计量经济学模型在确定了理论框架之后,研究者可以开始建立计量经济学模型。
计量经济学模型是用来描述经济现象和规律的数学模型。
根据研究问题的不同,可以建立不同类型的计量经济学模型,例如线性回归模型、时间序列模型等。
在建立模型时,研究者需要根据理论框架和收集到的数据选择合适的模型形式,并进行模型参数的估计。
5. 进行实证分析建立计量经济学模型之后,研究者需要进行实证分析,即利用模型对收集到的数据进行分析。
实证分析的目的是通过对数据的处理和模型的估计来验证理论假设,并得出结论。
研究者可以利用统计软件进行实证分析,计算模型的参数估计值和统计检验结果。
6. 解释和讨论结果在完成实证分析之后,研究者需要解释和讨论实证结果。
研究者可以根据模型的参数估计值和统计检验结果来解释研究问题,并讨论结果的经济意义和政策启示。
运用Stata建立计量经济学模型

➢
(2)为分析类似项目提供借鉴
➢ 操作:(1)在回顾窗口选择命令并复制
➢
(2)点击do-file Editor,或打开一个已存在的do文件
➢
(3)将复制的命令粘贴在do文件中
➢
(4)编辑已执行过的命令,包括增加注释
➢
(5)调试do文件
➢
(6)保存
9/2/2020
17
总结
➢1、准备工作;目录、日志、读入数据、熟 悉数据、时间变量、more、……;
➢ 通过信息矩阵检验执行的white异方差检验
➢ estat imtest, white
➢
9/2/2020
解析检验的零假设H0:同方差
6
4、诊断模型
➢ (2)检验序列相关 ➢ 散点图法
➢ predict r ➢ gen lagr=l.r ➢ scatter r lagr,xline(0) yline(0)
➢ pe(0.#) < pr(0.#)向前法是空模型的开始
➢ D. (有进有出)向后法 sw reg ...,pe(0.#) pr(0.#)
➢ pe(0.#) < pr(0.#)向后法是满模型的开始
9/2/2020
11
5、修正模型
➢ (4)修正随机解释变量 ➢ tsset year ➢ ivreg consp (gdpp=l.gdpp) ➢ 用滞后一期的gdpp作gdpp的工具变量 ➢ 常数项虚拟变量自己作自己的工具变量。 ➢ ivreg y1 x1 x2 (y2 y3 = z1 z2 z3) x3 ➢ 用z1 z2 z3作y2和y3的工具变量 ➢ x1 x2 x3和常数项虚拟变量自己作自己的工具变量
➢6、应用模型:置信区间、预测、结构分析、 边际分析、弹性分析、……;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
建立计量经济学模型的步骤和要点| [<<][>>]一、理论模型的设计对所要研究的经济现象进行深入的分析,根据研究的目的,选择模型中将包含的因素,根据数据的可得性选择适当的变量来表征这些因素,并根据经济行为理论和样本数据显示出的变量间的关系,设定描述这些变量之间关系的数学表达式,即理论模型。
例如上节中的生产函数就是一个理论模型。
理论模型的设计主要包含三部分工作,即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围。
1. 确定模型所包含的变量在单方程模型中,变量分为两类。
作为研究对象的变量,也就是因果关系中的“果”,例如生产函数中的产出量,是模型中的被解释变量;而作为“原因”的变量,例如生产函数中的资本、劳动、技术,是模型中的解释变量。
确定模型所包含的变量,主要是指确定解释变量。
可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。
其中有些变量,如政策变量、条件变量经常以虚变量的形式出现。
严格他说,上述生产函数中的产出量、资本、劳动、技术等,只能称为“因素”,这些因素间存在着因果关系。
为了建立起计量经济学模型,必须选择适当的变量来表征这些因素,这些变量必须具有数据可得性。
于是,我们可以用总产值来表征产出量,用固走资产原值来表征资本,用职工人数来表征劳动,用时间作为一个变量来表征技术。
这样,最后建立的模型是关于总产值、固定资产原值、职工人数和时间变量之间关系的数学表达式。
下面,为了叙述方便,我们将“因素”与“变量”间的区别暂时略去,都以“变量”来表示。
关键在于,在确定了被解释变量之后,怎样才能正确地选择解释变量。
首先,需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。
这是正确选择解释变量的基础。
例如,在上述生产问题中,已经明确指出属于供给不足的情况,那么,影响产出量的因素就应该在投入要素方面,而在当前,一般的投入要素主要是技术、资本与劳动。
如果属于需求不足的情况,那么影响产出量的因素就应该在需求方面,而不在投入要素方面。
这时,如果研究的对象是消费品生产,应该选择居民收入等变量作为解释变量;如果研究的对象是生产资料生产,应该选择固定资产投资总额等变量作为解释变量。
由此可见,同样是建立生产模型,所处的经济环境不同、研究的行业不同,变量选择是不同的。
其次,选择变量要考虑数据的可得性。
这就要求对经济统计学有透彻的了解。
计量经济学模型是要在样本数据,即变量的样本观测值的支持下,采用一定的数学方法估计参数,以揭示变量之间的定量关系。
所以所选择的变量必须是统计指标体系中存在的、有可靠的数据来源的。
如果必须引入个别对被解释变量有重要影响的政策变量、条件变量,则采用虚变量的样本观测值的选取方法。
第三,选择变量时要考虑所有入选变量之间的关系,使得每一个解释变量都是独立的。
这是计量经济学模型技术所要求的。
当然,在开始时要做到这一点是困难的,如果在所有入选变量中出现相关的变量,可以在建模过程中检验并予以剔除。
从这里可以看出,建立模型的第一步就已经体现了计量经济学是经济理论、经济统计学和数学三者结合的思想。
在选择变量时,错误是容易发生的。
下面的例子都是从已有的计量经济学应用研究成果中发现的,代表了几类容易发生的错误。
例如农副产品出口额=-107.66+0.13×社会商品零售总额十0.2 2×农副产品收购额这里选择了无关的变量,因为社会商品零售总额与农副产品出口额无直接关系,更不是影响农副产品出口额的原因。
再如生产资料进口额=0.73×轻工业投资+0.21×出口额+0.18×生产消费+67.60×进出口政策这里选择了不重要的变量,因为轻工业投资对生产资料进口额虽有影响,但不是重要的,或者说是不完全的,重要的是全社会固定资产投资额,应该选择这个变量。
再如农业总产值=0.78+0.24×粮食产量+0.05×农机动力—0.2 1×受灾面积这里选择了不独立的变量,因为粮食产量是受农机动力和受灾面积影响的,它们之间存在相关性。
值得注意的是上述几个模型都能很好地拟合样本数据,所以绝对不能把对样本数据的拟合程度作为判断模型变量选择是否正确的主要标准。
变量的选择不是一次完成的,往往要经过多次反复。
2. 确定模型的数学形式选择了适当的变量,接下来就要选择适当的数学形式描述这些变量之间的关系,即建立理论模型。
选择模型数学形式的主要依据是经济行为理论。
在数理经济学中,已经对常用的生产函数、需求函数、消费函数、投资函数等模型的数学形式进行了广泛的研究,可以借鉴这些研究成果。
需要指出的是,现代经济学尤其注重实证研究,任何建立在一定经济学理论假设基础上的理论模型,如果不能很好地解释过去,尤其是历史统计数据,那么它是不能为人们所接受的。
这就要求理论模型的建立要在参数估计、模型检验的全过程中反复修改,以得到一种既能有较好的经济学解释又能较好地反映历史上已经发生的诸变量之间关系的数学模型。
忽视任何一方面都是不对的。
也可以根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,由散点图显示的变量之间的函数关系作为理论模型的数学形式。
这也是人们在建模时经常采用的方法。
在某些情况下,如果无法事先确定模型的数学形式,那么就采用各种可能的形式进行试模拟,然后选择模拟结果较好的一种。
3. 拟定理论模型中待估参数的理论期望值理论模型中的待估参数一般都具有特定的经济含义,它们的数值,要待模型估计、检验后,即经济数学模型完成后才能确定,但对于它们的数值范围,即理论期望值,可以根据它们的经济含义在开始时拟定。
这一理论期望值可以用来检验模型的估计结果。
拟定理论模型中待估参数的理论期望值,关键在于理解待估参数的经济含义。
例如上述生产函数理论模型中有4个待估参数和α、β、γ和A。
其中,α是资本的产出弹性,β是劳动的产出弹性,γ近似为技术进步速度,A是效率系数。
根据这些经济含义,它们的数值范围应该是0<α<1,0<β<1,α+β≈1,0<γ<1并接近0,A>0。
二、样本数据的收集样本数据的收集与整理,是建立计量经济学模型过程中最为费时费力的工作,也是对模型质量影响极大的一项工作。
从工作程序上讲,它是在理论模型建立之后进行,但实际上经常是同时进行的,因为能否收集到合适的样本观测值是决定变量取舍的主要因素之一。
1. 几类常用的样本数据常用的样本数据有三类:时间序列数据、截面数据和虚变量数据。
时间序列数据是一批按照时间先后排列的统计数据,一般由统计部门提供,在建立计量经济学模型时应充分加以利用,以减少收集数据的工作量。
在利用时间序列数据作样本时,要注意以下几个问题。
一是所选择的样本区间内经济行为的一致性问题。
例如,我们建立纺织行业生产模型,选择反映市场需求因素的变量,诸如居民收入、出口额等作为解释变量,而没有选择反映生产能力的变量,诸如资本、劳动等,原因是纺织行业属于供大于求的情况。
对于这个模型,利用时间序列数据作样本时,只能选择80年代后期以来的数据,因为纺织行业供大于求的局面只出现在这个阶段,而在80年代中期以前的一个长时期里,我国纺织品是供不应求的,那时制约行业产出量的主要因素是投入要素。
二是样本数据在不同样本点之间的可比性问题。
经济变量的时间序列数据往往是以价值形态出现的,包含了价格因素,而同一件实物在不同年份的价格是不同的,这就造成样本数据在不同样本点之间不可比。
需要对原始数据进行调整,消除其不可比因素,方可作为模型的样本数据。
三是样本观测值过于集中的问题。
经济变量在时间序列上的变化往往是缓慢的,例如,居民收入每年的变化幅度只有5%左右。
如果在一个消费函数模型中,以居民消费作为被解释变量,以居民收入作为解释变量,以它的时间序列数据作为解释变量的样本数据,由于样本数据过于集中,所建立的模型很难反映两个变量之间的长期关系。
这也是时间序列不适宜于对模型中反映长期变化关系的结构参数的估计的一个主要原因。
四是模型随机误差项的序列相关问题。
用时间序列数据作样本,容易引起模型随机误差项产生序列相关。
这个问题后面还要专门讨论。
截面数据是一批发生在同一时间截面上的调查数据。
例如,工业普查数据、人口普查数据、家计调查数据等,主要由统计部门提供。
用截面数据作为计量经济学模型的样本数据,应注意以下几个问题。
一是样本与母体的一致性问题。
计量经济学模型的参数估计,从数学上讲,是用从母体中随机抽取的个体样本估计母体的参数,那么要求母体与个体必须是一致的。
例如,估计煤炭企业的生产函数模型,只能用煤炭企业的数据作为样本,不能用煤炭行业的数据。
那么,截面数据就很难用于一些总量模型的估计,例如,建立煤炭行业的生产函数模型,就无法得到合适的截面数据。
二是模型随机误差项的异方差问题。
用截面数据作样本,容易引起模型随机误差项产生异方差。
这个问题后面还要专门讨论。
虚变量数据也称为二进制数据,一般取0或1。
虚变量经常被用在计量经济学模型中,以表征政策、条件等因素。
例如,建立我国的粮食生产计量经济学模型,以粮食产量作为被解释变量,解释变量中除了播种面积、化肥使用量、农机总动力、成灾面积等变量外,显然,政策因素是不可忽略的。
1980年前后,由于实行了不同的政策,即使上述变量都没有变化,粮食产量也会发生大的变化。
于是必须在解释变量中引人政策变量,用一个虚变量表示,对于1980年以后的年份,该虚变量的样本观测值为1,对于1980年以前的年份,该虚变量的样本观测值为0。
也可以取0、l以外的数值,表示该因素的变化程度。
例如,在工业生产模型中用虚变量表示气候对工业生产的影响,可以将不同年份气候的影响程度,分别用0、1、-1,甚至0.5、-0.5等表示。
不过,这种方法应慎用,以免违背客观性。
2. 样本数据的质量样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性四个方面。
完整性,即模型中包含的所有变量都必须得到相同容量的样本观测值。
这既是模型参数估计的需要,也是经济现象本身应该具有的特征。
但是,在实际中,“遗失数据”的现象是经常发生的,尤其在中国,经济体制和核算体系都处于转轨之中。
在出现“遗失数据”时,如果样本容量足够大,样本点之间的联系并不紧密的情况下,可以将“遗失数据”所在的样本点整个地去掉;如果样本容量有限,或者样本点之间的联系紧密,去掉某个样本点会影响模型的估计质量,则要采取特定的技术将“遗失数据”补上。
准确性,有两方面含义,一是所得到的数据必须准确反映它所描述的经济因素的状态,即统计数据或调查数据本身是准确的;二是它必须是模型研究中所准确需要的,即满足模型对变量口径的要求。
前一个方面是显而易见的,而后一个方面则容易被忽视。