不确定性:用贝叶斯线性回归通向更好的模型选择之路

不确定性:用贝叶斯线性回归通向更好的模型选择之路
不确定性:用贝叶斯线性回归通向更好的模型选择之路

不确定性:用贝叶斯线性回归通向更好的模型选择之路

关键词:概率、神经网络

关注过Mathematica Stack Exchange(我强烈推荐给各位Wolfram语言的用户)的读者们可能最近看过这篇博文内容了,在那篇博文里我展示了一个我所编写的函数,可以使得贝叶斯线性回归的操作更加简单。在完成了那个函数之后,我一直在使用这个函数,以更好地了解这个函数能做什么,并和那些使用常规拟合代数如Fit使用的函数进行比较。在这篇博文中,我不想说太多技术方面的问题(想要了解更多贝叶斯神经网络回归的内容请参见我前一篇博文- https://wolfr.am/GMmXoLta),而想着重贝叶斯回归的实际应用和解释,并分享一些你可以从中得到的意想不到的结果。

01 准备工作

获取我的BayesianLinearRegression (https://wolfr.am/GMn9Di7w)函数最简单的方法是参考我上传到Wolfram Function Repository 的内容。如想要使用本博文中的代码范例,你可以计算下列代码,这段代码为该函数创建了一个快捷方式。

你也可以访问GitHub repository并参照安装说明,使用以下代码加载BayesianInference安装包:

或者,你也可以通过计算BayesianLinearRegression 的独立源文件(https://wolfr.am/GMngf5Uj)的方式获取该函数,只是如果你没有完整的BayesianInference安装包的话,你可能无法使用我后面会用到的函数regressionPlot1D。该函数的定义在BayesianVisualisations.wl(https://wolfr.am/GMnlzNkh)文件中。

02 回到基础

我现在要做一些对有数据拟合背景的大部分人都非常熟悉的事情:多项式回归。我可以用更复杂的例子,但是我发现用贝叶斯函数做数据拟合,即使是在如多项式回归这样简单的范例上也能延伸出很多新的可能性,所以其实这是一个非常好的演示范例。

下面我用了一组有直线关系趋势的数据,但同时也留下了一些问题:

现在我们从第一件事情做起:为数据拟合一条直线。具体来说,我会拟合模型y=a+bx+,其中NormalDistribution[0,σ]. BayesianLinearRegression和LinearModelFit 使用相同的语法,但是它还能返回一个包括所有与该拟合相关信息的关联关系:

我会着重解释后验分布和log-evidence。Log-evidence是一个说明模型对数据组拟合程度的数字。

这个值是好是坏?我们现在还不好说:这只是一个与对相同数据进行拟合的其他模型对比的一个值。我后面会在说到贝叶斯奥卡姆剃刀(Bayesian Occam’s razor)部分的时候说模型比较,但是现在我们先仔细看一看我们刚才计算出的先行拟合。这个拟合的关联关系中有一个关键称为“后验(Posterior)”, 其中包括了一个很有用的概率分布的数字:

在贝叶斯推断中,“后验(posterior)”这个词指的是在观察数据后的认知状态(与“先验(prior)相对”指的是还不了解数据的状态。回归参数的后验分布可以告诉我们参数a和b是如何被数据约束的。可视化这一过程最好的方式是通过ContourPlot来实现:

乍看之下,这看起来有点奇怪。a和b为什么互相关联?其中一种思考方式是看当迫使这两个系数其中一个变化时,拟合会如何变化。例如,可以固定a和b并用FindFit尝试找到可以拟合数据的最佳值。下图说明了这个思考尝试:

可以本能判断a与b之间确实相关,因为这些点的质量中心轻微偏向了原点的左下方:

这说明当a增加,b也需要增加,这样才能符合点群的质量中心。这里我略微更向下移了一点,这个效应就更加明显了:

另一个思考和上的后验分布的方法是将拟合想象成由无限条直线组成,在平面上随机绘制且权重由其对数据的拟合程度决定。计算该权重就是贝叶斯推断所讨论的内容。在下图中,我用RandomVariate绘制了从后验来的很多直线。当调低每条直线的透明度后,你可以看到直线趋于集中的区域:

我喜欢把这个直线群的分布称为“底层值分布”,这也是拟合会返回的分布之一。可以通过InverseCDF 便捷地计算分布的分位数并绘制该分布。在下个例子中,我绘制了5%、50%和95%分位数,意味着你会期待90%的直线会落在阴影区域内:

BayesianLinearRegression也可以计算误差项的标准差,而且就像回归系数a和b一样,它有自己

的分布。方差遵循一个InverseGammaDistribution,所以可以使用TransformedDistribution获取

的分布:

所以简单来说,后验误差项的分布所以简单来说,后验误差项的分布是NormalDistribution[0, σ],

其中InverseGammaDistribution[10.005,3.09154]。我们可以用

ParameterMixtureDistribution来计算这个分布:所以简单来说,后验误差项的分布是NormalDistribution[0, σ], 其中InverseGammaDistribution[10.005,3.09154]。我们可以用ParameterMixtureDistribution来计算这个分布:是NormalDistribution[0, σ], 其中InverseGammaDistribution[10.005,3.09154]。我们可以用ParameterMixtureDistribution来计算这个分布:

03 不确定的不确定度

先说明一下:模型的不确定度是不确定的,这个观点我最开始也有点难以想通。为了让情况再复杂一点,我前面提到的所有线条都有和a和b关联的误差条。因此如果你想要使用这个模型做一个预测,你需要考虑无数带有无限数量误差条的趋势线。这要求考虑很多不确定性!

用这种方式思考回归问题就能明白为什么贝叶斯推断是一个包含了很多复杂几分的艰巨任务。但是对于线性回归,我们很幸运,因为可以使用符号来解决所有的积分并在无限中继续前进。这也是为什么科学家和工程师这么喜欢线性数学的原因之一:所有事情都可以用很漂亮的公式来处理。

能告诉你可以预期在何处找到未来的数据(考虑到之前提到的所有不确定)的分布称为后验预测分布(posterior predictive distribution)。所以刚才拟合的数据长这样:

下面我就用Git仓库中的函数regressionPlot1D来绘制这个分布,这也是我刚才展示的底层值绘图的简便方法。我还加上了一个当你在做预测模型的“点估算(point estimate)”时会得到的分布。这就意味

着你从后验中获得了a、b和的最佳值,并假设这些值是完全确定的情况下使用这些值来绘制y=a+bx+

。点估算可以帮助让结果更加可控,因为概率分布是很难使用的,但是把分布减少到单个的值也就意味着舍弃了信息。这里我使用了Mean(期望值)来减少单个值的分布,当然你也可以使用其他集中性的度量如中位数或众数:

所以这就说到了用一条直线拟合这些点。但是数据的形状说明也许二次回归拟合会更合适(当然我使用这个例子就是为了说明这一点),所以现在我们可以展示贝叶斯模型对比是怎么工作的了。我准备用最高5

阶的多项式来拟合数据,每一个多项式代表一个可以解释这些数据的模型。从这些数据所有可能解释中,我要选择最好的一个。

04 贝叶斯奥卡姆剃刀定律

在贝叶斯推断中,模型的概率分布和回归系数的a、b和的分布一样。模型的后验概率取决于两个因素:

■一个被称为证据或边缘似然的量。这个量衡量的是当考虑到回归参数如a、b和的不确定度时模型对数据的拟合程度。BayesianLinearRegression将这个量返回为“LogEvidence”,数字越高,拟合得越好。该证据由于一个时常被称为贝叶斯奥卡姆剃刀定律的效应会自动考虑模型的复杂程度(可参见David MacKay的著作中第28章的范例

■模型的先验概率

在看到数据前,通常你只需要考虑所有模型的可能性是相等的。但是有时候,你会对数据有很多先验信息,知道数据是由某个模型生成的,且你只想接收那些明显能证明现有模型比其他模型更好的结论是错误的证据。

比如,如果数据来源于一个通过以电压作为参数的标准电阻函数测量的电流,测量数据会有噪声(且有可能偏误),那我会觉得欧姆定律适用在这里,并且用一条直线拟合这些数据是正确的。这更像是一点噪声可能会让数据看起来像符合二次拟合,而欧姆定律好像突然在实验中不对了。在这种情况下,我会给欧姆定律设定一个接近于1的先验概率,并把剩余的那一点点概率分配在其他待考虑的模型中。这符合由Dennis Lindley提出的一个叫Cromwell’s rule的原理:

“对月亮是新鲜乳酪做的这个观点保留一点点可能性,哪怕是百万分之一,但还是把它留在那里,否则那些从月亮回来的带着新鲜乳酪的宇航员们可能会把你堵得水泄不通。“

那么现在让我们来看看不同多项式的拟合看上去如何,并且它们的证据都是什么:

你可以看到,一阶和二阶拟合在最佳模型的竞争上很相近。如果我们假设所有模型的先验概率一样,那么我们可以通过对log-evidence取幂并将其正态化来计算拟合的相对概率。我们可以借用神经网络框架中的SoftmaxLayer来进行这个操作。

在这个表格中,我按照概率对模型进行了分类,并把它们累加,然后你就能很容易地看出从上到下总概率是多少。记住这些概率只意味着我们现在研究的这个微观世界:当我增加更多的模型那一刻起,所有概率都可能会改变。在贝叶斯推断中,你可以只比较你想要首先构想的那几个模型:不存在可以在完全客观的角度上告诉你数据拟合好坏的普适度量。你能希望的只是在你所考虑的模型群中找到最好的模型,因为你没有考虑到的模型是无法进行对比的。

05 小插曲:和LinealModelFit作比较

到现在,可以把用BayesianLinearRegression做的拟合和用LinearModelFit做的拟合进行一个对比,这同时也展示了一些拟合优度的度量:

如预料一样,度量不受模型复杂程度影响,随模型阶数的升高而上升。而其他所有度量似乎更倾向于二阶模型:记住越好的模型,Bayesian information criterion(贝叶斯信息标准)(或称为BIC,是负log-evidence的一个近似量)、Akaike information criterion(赤池信息标准)(AIC) 和AIC校正值都

越高。对修正而言,有最高值的模型最优。我们再比较一下从LinearModelFit和贝叶斯方法中得到的二阶模型预测区间:

你可以看到,从LinearModelFit得到的置信区间会比后验预测区间更宽一些(所以也会更悲观一些)。产生这个差异的一个主要原因是贝叶斯预测考虑了所有后验分布中模型参数的相关性,并把该相关性应用于预测使得预测区间可以缩小一点。另一个解释这个结果的方式是,贝叶斯分析在计算预测区间时不会提前舍弃信息因为它会完全保留所有中间分布。这个效应在数据变少时会更加显著,如同下图说明的一样(如果你对贝叶斯先验在这个范例中扮演的角色有所怀疑,我建议你可以自己尝试一下逐渐减少先验信息然后对比结果):

06 整合结论

所以现在我们有一些多项式模型,之中的两个在竞争最优模型,但没有明显的胜出者。所以我们应该选择哪一个?贝叶斯简单地回答了这个问题:为什么不保留这两个?我们仍然在研究一个概率论的观点:答案可能就在这两个模型中间的某个地方,没有必要明确哪个选择是最好的。选择一个模型也是点估算的一种

形式,我们之前看到了点估算会舍弃一些可能有用的信息。但是我们还能选择像之前一样通过将a、b和所有可能的值取平均并把直线拟合进数据中,来把这个差异分离。函数MixtureDistribution在这里会非常有用,它可以将不同的后验预测合并进一个新的分布。甚至不需要仅仅考虑一阶和二阶模型:我们可以按照权重合并所有模型:

(注意BayesianInference安装包中的MixtureDistribution的自定义压缩格式。)底层值区间把很好的突出了模型结合。

那为什么我们要停在这里?多项式世界中还有更多的模型可以探索,所以我们稍微延伸一点。比如,为什么不尝试一下像的拟合(即:没有常量偏移)?有最高为5阶的63个模型可以尝试:

下面的函数可以让模型拟合过程更简便快捷:

拟合所有最高5阶的多项式,并查看最优的10个拟合:

我现在又可以计算预测区间了,但确实没有必要在这个整合模型中包含所有模型,因为只有少数模型的权重会很高。为了更好地可以处理这个分布,我会为总概率质量舍弃一些可能性%的模型:

很有意思的事情是,我们发现没有常数偏移的模型明显会更优,他们能给出在原点附近范围非常窄的底层值估算。外推区间也会比之前更宽,但这只是一个关于外推的危险信号:如果我们确实相信所有多项式都是解释这些数据的同等有力的竞争者,那么较宽的外推区间就是这个假设的一个很自然的结果,因为毕竟可以解释数据的可能模型太多。这还是优于另一个选项:设想一下你可以非常精确地做外推,但之后可能基于这个错误的精确性做出一些重要决定,最后被证明结果是错误的。

另外,思考我们现在了解的我们数据拟合的基础函数的回归系数也很有意思。在下面的代码中,我计算了回归系数分布每个部分的MarginalDistribution并可视化它们的置信区间:

把这个置信区间与你用单个5阶多项式而非63个不同的多项式拟合时得到的置信区间比较,后者明显包含的信息更少:

第一个图显示,我们可以确定多项式中的和是0,且我们现在已经知道了、和项的符号,但我们只能通过尝试所有可能的多项式,把它们相互比较并最终得出结论。

这个过程也与让拟合项消失的其他常用方法不同,称为LASSOFitRegularization:

06 整合结论

我希望这篇贝叶斯回归的内容会对你有些许帮助。如果你还对BayesianLinearRegression使用的底层数学感兴趣的话,你可以查阅维基百科的贝叶斯线性回归、贝叶斯多元回归和共轭先验。

用Wolfram函数存储库中的BayesianLinearRegression或下载BayesianInference 安装包,可以尝试怎么用贝叶斯回归更好的处理你自己的数据。我很期待看到大家以不同的方式使用BayesianLinearRegression,并在Wolfram 社区上分享你的结果和小建议!

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

简单线性回归模型试题及答案

第二章 简单线性回归模型 一、单项选择题: 1、回归分析中定义的( B )。 A 、解释变量和被解释变量都是随机变量 B 、解释变量为非随机变量,被解释变量为随机变量 C 、解释变量和被解释变量都为非随机变量 D 、解释变量为随机变量,被解释变量为非随机变量 2、最小二乘准则是指使( D )达到最小值的原则确定样本回归方程。 A 、1?()n t t t Y Y =-∑ B 、1?n t t t Y Y =-∑ C 、?max t t Y Y - D 、21?()n t t t Y Y =-∑ 3、下图中“{”所指的距离是( B )。 A 、随机误差项 i 、?i Y 的离差 4、参数估计量?β是i Y 的线性函数称为参数估计量具有( A )的性质。 A 、线性 B 、无偏性 C 、有效性 D 、一致性 5、参数β的估计量β?具备有效性是指( B )。 A 、0)?(=βVar B 、)?(βVar 为最小 C 、0?=-ββ D 、)?(ββ-为最小 6、反映由模型中解释变量所解释的那部分离差大小的是( B )。 A 、总体平方和 B 、回归平方和 C 、残差平方和 D 、样本平方和 7、总体平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是( B )。 A 、RSS=TSS+ESS B 、TSS=RSS+ESS C 、ESS=RSS-TSS D 、ESS=TSS+RSS 8、下面哪一个必定是错误的( C )。 A 、 i i X Y 2.030?+= ,8.0=XY r B 、 i i X Y 5.175?+-= ,91.0=XY r C 、 i i X Y 1.25?-=,78.0=XY r D 、 i i X Y 5.312?--=,96.0-=XY r 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?356 1.5Y X =-,这说明( D )。 A 、产量每增加一台,单位产品成本增加356元 B 、产量每增加一台,单位产品成本减少1.5元 C 、产量每增加一台,单位产品成本平均增加356元 D 、产量每增加一台,单位产品成本平均减少1.5元 10、回归模型i i i X Y μββ++=10,i = 1,…,25中,总体方差未知,检验010=β:H 时,所用的检验统计量1?1 1?βββS -服从( D )。 A 、)(22-n χ B 、)(1-n t C 、)(12-n χ D 、)(2-n t 11、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值的( B )。 A 、i C (消费)i I 8.0500+=(收入) B 、di Q (商品需求)i I 8.010+=(收入)i P 9.0+(价格) C 、si Q (商品供给)i P 75.020+=(价格) D 、i Y (产出量)6.065.0i K =(资本)4.0i L (劳动) 12、进行相关分析时,假定相关的两个变量( A )。 X 1?β+ i Y

经典线性回归模型

2 经典线性回归模型 §2.1 概念与记号 1.线性回归模型是用来描述一个特定变量y 与其它一些变量x 1,…,x p 之间的关系。 2. 称特定变量y 为因变量 (dependent variable )、 被解释变量 (explained variable )、 响应变量(response variable )、被预测变量(predicted variable )、回归子 (regressand )。 3.称与特定变量相关的其它一些变量x 1,…,x p 为自变量(independent variable )、 解释变量(explanatory variable )、控制变量(control variable )、预测变量 (predictor variable )、回归量(regressor )、协变量(covariate )。 4.假定我们观测到上述这些变量的n 组值:( ) ip i i x x y , , , 1 L (i=1,…,n)。称 这n 组值为样本(sample )或数据(data )。 §2.2 经典线性回归模型的假定 假定 2.1(线性性(linearity)) i ip p i i x x y e b b b + + + + = L 1 1 0 (i=1,…,n)。 (2.1) 称方程(2.1)为因变量y 对自变量x 1,…,x p 的线性回归方程(linear regression equation ),其中 ( ) p , k k , , 1 0 L = b 是待估的未知参数(unknown parameters ), ( ) n i i , , 1 L = e 是满足一定限制条件的无法观测的误差项(unobserved error term ) 。称自 变量的函数 ip p i x x b b b + + + L 1 1 0 为回归函数(regression function )或简称为回归 (regression )。称 0 b 为回归的截距(ntercept),称 ( ) p k k , , 1 L = b 为自变量的回归系数 (regression coefficients ) 。某个自变量的回归系数表示在其它条件保持不变的情况下,

非线性回归分析

SPSS—非线性回归(模型表达式)案例解析 2011-11-16 10:56 由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS 的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二! 非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型 还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢? 答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究: 第一步:非线性模型那么多,我们应该选择“哪一个模型呢?” 1:绘制图形,根据图形的变化趋势结合自己的经验判断,选择合适的模型 点击“图形”—图表构建程序—进入如下所示界面:

点击确定按钮,得到如下结果:

放眼望去, 图形的变化趋势,其实是一条曲线,这条曲线更倾向于"S" 型曲线,我们来验证一下,看“二次曲线”和“S曲线”相比,两者哪一个的拟合度更高! 点击“分析—回归—曲线估计——进入如下界面

在“模型”选项中,勾选”二次项“和”S" 两个模型,点击确定,得到如下结果: 通过“二次”和“S “ 两个模型的对比,可以看出S 模型的拟合度明显高于

常见非线性回归模型

常见非线性回归模型 1.简非线性模型简介 非线性回归模型在经济学研究中有着广泛的应用。有一些非线性回归模型可以通 过直接代换或间接代换转化为线性回归模型,但也有一些非线性回归模型却无 法通过代换转化为线性回归模型。 柯布—道格拉斯生产函数模型 y AKL 其中L和K分别是劳力投入和资金投入, y是产出。由于误差项是可加的, 从而也不能通过代换转化为线性回归模型。 对于联立方程模型,只要其中有一个方程是不能通过代换转化为线性,那么这个联立方程模型就是非线性的。 单方程非线性回归模型的一般形式为 y f(x1,x2, ,xk; 1, 2, , p) 2.可化为线性回归的曲线回归 在实际问题当中,有许多回归模型的被解释变量y与解释变量x之间的关系都不是线性的,其中一些回归模型通过对自变量或因变量的函数变换可以转化为

线性关系,利用线性回归求解未知参数,并作回归诊断。如下列模型。 (1)y 0 1e x (2)y 0 1x2x2p x p (3)y ae bx (4)y=alnx+b 对于(1)式,只需令x e x即可化为y对x是线性的形式y01x,需要指出的是,新引进的自变量只能依赖于原始变量,而不能与未知参数有关。 对于(2)式,可以令x1=x,x2=x2,?,x p=x p,于是得到y关于x1,x2,?, x p 的线性表达式y 0 1x12x2 pxp 对与(3)式,对等式两边同时去自然数对数,得lnylnabx ,令 y lny, 0 lna, 1 b,于是得到y关于x的一元线性回归模型: y 0 1x。 乘性误差项模型和加性误差项模型所得的结果有一定差异,其中乘性误差项模型认为yt本身是异方差的,而lnyt是等方差的。加性误差项模型认为yt是等 方差的。从统计性质看两者的差异,前者淡化了y t值大的项(近期数据)的作用, 强化了y t值小的项(早期数据)的作用,对早起数据拟合得效果较好,而后者则 对近期数据拟合得效果较好。 影响模型拟合效果的统计性质主要是异方差、自相关和共线性这三个方面。 异方差可以同构选择乘性误差项模型和加性误差项模型解决,必要时还可以使用 加权最小二乘。

案例分析报告(一元线性回归模型)

案例分析报告(2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 2204120202 学生姓名:陈维维 2014 年 11月

案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模

译文:不确定性、演化与经济理论

译文|不确定性、演化与经济理论 伟大的价格理论大师阿尔钦于2013年2月19日驾鹤仙逝。作为他的fans,我一直想做点什么,以资纪念。思来想去,觉的最好的方式莫过于传播他的经济思想,所以我就把《不确定性、演化与经济理论》译成中文,与经济理论爱好者分享。这是一篇开创性的论文,此文一问世,就奠定了作者顶尖经济学家的地位,激起了持续10余年的有关经济学方法论的激烈争论。 如果你以前没有读过,也没有从其他途径了解到此文的思想,那么此文将具备极强的震撼力。此外,文章在写作方法上也堪称典范,值得再三揣摸、仿效。 在此文中,我将对经济分析的基本公理做一个修正,以便纳入了不完全信息和不确定的预见。这种分析方法摒弃了“利润最大化”假设,不再依赖于可预测的个人行为——标准教科书通常把它作为对真实情况的一级近似(a first approximation)。尽管做了这些变动,但是保留了用于分析这种(可预测)行为的概念,因为这些概念不依赖于动机或预见。这篇文章所提倡的分析方法体现了生物进化和自然选择的原理,即通过将经济系统视作一种“选择采纳机制”,在那些在寻求“成功”或“利润”过程中发生的探究行动中进行选择。由此产生的分析既适用于那些常被当作偏离了规范经济行为的行动,也能用于传统经济理论能够解释的行为。理论的广泛适用性以及剔除了“精确预期”和“固态知识”这两个不切实际的假定为经济学研究提供了动力。 本文的阐述安排如下:首先,明确简述“利润最大化”被普遍忽略的一个方面,即当预见是不确定的时候,“利润最大化”作为某一

具体行动的指导就毫无意义。其次,从介绍环境选择的因素开始构建分析方法。经济系统按照“实现正利润”的原则选择后验的最合适的行为。这一点将放在一个没有丝毫个体理性、预见或者动机的极端随机行为模型中阐述。它表明,即使在这个极端模型中,经济学家也能够使用传统分析工具来预测和解释事件,只不过使用方式有所修正。 再次,将环境选择这一现象和个体有动机的行为结合在一起。这种有动机的行为基于普遍存在的不确定性和不完全信息。适应、模仿和试错用于追求“正利润”不是追求“最大化利润”。最后一个部分讨论几点结论和推测。 一、“利润最大化”不是行动指南 对经济行为的现行经济分析严重依赖于理性人所做的决策,通常假定理性个体总是寻求完全最优状况。有两项准则众所周知:利润最大化和效用最大化。根据这两项准则,合适的行为类型由边际或邻域不等式表征,如果等号成立,则实现了最优。但是,通常会加上的标准限定条件是通常没有人真的能根据这些图表或概念最优化其自身的境况,因为个体所处位置不确定,有时甚至供给需求函数的斜率也不确定。尽管如此,经济学家仍然基于这些图表和概念解释和推断个体决策,因为经济学家们断言,个体即便不是明确地,也会潜意识使用这些概念。 对这种研究方法的批判非常广泛,但是只有G.Tintner的批判是真正致命的。他认为当存在不确定性时,利润最大化毫无意义。不确定性的产生至少有两个来源:(1)不完美的预见;(2)面对包含多变量的复杂问题时,即便最优选择是明确的,人类也无能为力。G.Tintner 的论证很简单。根据定义,在不确定的条件下,每个可能被选择的行动是潜在结果的概率分布,而不是唯一的结果。不确定性意味着这些潜在结果的概率分布是重叠的。这里需要强调的是每个可能的行动都

历届诺贝尔经济学奖得主及其主要贡献

历届诺贝尔经济学奖得主及其主要贡献(1969—2015) 诺贝尔经济学奖的由来 诺贝尔经济学奖(The Prize in Economic Sciences),是由瑞典银行在1968年,为纪念诺贝尔而增设的并非诺贝尔遗嘱中提到的五大奖励领域之一,全称为“纪念阿尔弗雷德-诺贝尔瑞典银行经济学奖(The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel)”,通常称为诺贝尔经济学奖(Nobel economics prize),也称瑞典银行经济学奖。 1969年(瑞典银行的300周年庆典)第一次颁奖,由挪威人弗里希和荷兰人扬-廷贝亨共同获得,美国经济学家萨缪尔森、弗里德曼等人均获得过此奖。 2015年诺贝尔经济学奖将于斯德哥尔摩时间10月12日13时(北京时间12日19时)举行。 经济学奖并非根据阿尔弗雷德-诺贝尔的遗嘱所设立的,但在评选步骤、授奖仪式方面,与诺贝尔奖相似。奖项由瑞典皇家科学院每年颁发一次,遵循对人类利益做出最大贡献的原则给奖。 诺贝尔经济学奖可以颁发给单个人,也可以最多由三人分享,其主要目的是表彰获奖者在宏观经济学、微观经济学、新的经济分析方法等领域所作的贡献。今年的诺贝尔经济学奖奖金仍为1000万瑞典克朗(约合140万美元)。 “诺贝尔经济学奖”历届获奖者名单 从1969年至2015年诺贝尔经济学奖已经颁发了47次,获奖者人数达76人,其中包括美国著名的经济学家萨缪尔森、弗里德曼。 1969年 拉格纳·弗里希(RAGNAR FRISCH)挪威人 简·丁伯根(JAN TINBERGEN)荷兰人 主要贡献:他们发展了动态模型来分析经济进程。前者是经济计量学的奠基人,后者经济计量学模式建造者之父。 1970年 保罗·安·萨默尔森(PAUL A SAMUELSON )美国人 主要贡献:他发展了数理和动态经济理论,将经济科学提高到新的水平。他的研究涉及经济学的全部领域。 1971年 西蒙·库兹列茨(SIMON KUZNETS )美国人 主要贡献:在研究人口发展趋势及人口结构对经济增长和收入分配关系方面做出了巨大贡献。 1972年 约翰·希克斯(JOHN R. HICKS)英国人 肯尼斯·约瑟夫·阿罗(KENNETH J. ARROW)美国人 主要贡献:他们深入研究了经济均衡理论和福利理论。 1973年 华西里·列昂惕夫(W ASSIL Y LEONTIEF)苏联人 主要贡献:发展了投入产出方法,该方法在许多重要的经济问题中得到运用。 1974年 弗·冯·哈耶克(FRIEDRICH AUGUST VON HAYEK)澳大利亚人

多元线性回归模型

第四章 多元线性回归模型 在一元线性回归模型中,解释变量只有一个。但在实际问题中,影响因变量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意愿(用劳动参与率度量)的因素不仅包括经济形势(用失业率度量),而且包括劳动实际工资;根据凯恩斯的流动性偏好理论,影响人们货币需求的因素不仅包括人们的收入水平,而且包括利率水平等。当解释变量的个数由一个扩展到两个或两个以上时,一元线性回归模型就扩展为多元线性回归模型。本章在理论分析中以二元线性回归模型为例进行。 一、预备知识 (一)相关概念 对于一个三变量总体,若由基础理论,变量21,x x 和变量y 之间存在因果关系,或21,x x 的变异可用来解释y 的变异。为检验变量21,x x 和变量y 之间因果关系是否存在、度量变量21,x x 对变量y 影响的强弱与显著性、以及利用解释变量21,x x 去预测因变量y ,引入多元回归分析这一工具。 将给定i i x x 21,条件下i y 的均值 i i i i i x x x x y E 2211021),|(βββ++= (4.1) 定义为总体回归函数(Population Regression Function,PRF )。定义),|(21i i i i x x y E y -为误差项(error term ),记为i μ,即),|(21i i i i i x x y E y -=μ,这样i i i i i x x y E y μ+=),|(21,或 i i i i x x y μβββ+++=22110 (4.2) (4.2)式称为总体回归模型或者随机总体回归函数。其中,21,x x 称为解释变量(explanatory variable )或自变量(independent variable );y 称为被解释变量(explained variable )或因变量(dependent variable );误差项μ解释了因变量的变动中不能完全被自变量所解释的部分。 在总体回归模型(4.2)中参数210,,βββ是未知的,i μ是不可观察的,统计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本n i x x y i i i ,,2,1),,,(21 =,对(4.1)式进行估计,若21021,,),,|(βββi i i x x y E 的估 计量分别记为^2^1^0^,,,βββi y ,则定义(4.3)式为样本回归函数 i i i x x y 2^ 21^1^0^βββ++= (n i ,,2,1 =) (4.3) 注意,样本回归函数随着样本的不同而不同,也就是说^2^1^0,,βββ是随机变量,它们的随机性是由于i y 的随机性(同一组),(21i i x x 可能对应不同的i y )、21,x x 各

经典线性回归模型的诊断与修正

经典线性回归模型的诊断与修正下表为最近20年我国全社会固定资产投资与GDP的统计数据:1 年份国内生产总值(亿元)GDP 全社会固定资产投资(亿元)PI 1996 71813.6 22913.5 1997 79715 24941.1 1998 85195.5 28406.2 1999 90564.4 29854.7 2000 100280.1 32917.7 2001 110863.1 37213.49 2002 121717.4 43499.91 2003 137422 55566.61 2004 161840.2 70477.43 2005 187318.9 88773.61 2006 219438.5 109998.16 2007 270232.3 137323.94 2008 319515.5 172828.4 2009 349081.4 224598.77 2010 413030.3 251683.77 2011 489300.6 311485.13 2012 540367.4 374694.74 2013 595244.4 446294.09 1数据来源于国家统计局网站年度数据

1、普通最小二乘法回归结果如下: 方程初步估计为: GDP=75906.54+1.1754PI (32.351) R2=0.9822F=1046.599 DW=0.3653 2、异方差的检验与修正 首先,用图示检验法,生成残差平方和与解释变量PI的散点图如下:

从上图可以看出,残差平方和与解释变量的散点图主要分布在图形的下半部分,有随PI的变动增大的趋势,因此,模型可能存在异方差。但是否确定存在异方差,还需作进一步的验证。 G-Q检验如下: 去除序列中间约1/4的部分后,1996-2003年的OLS估计结果如下所示:

线性回归模型的研究毕业论文

线性回归模型的研究毕业论文 1 引言 回归分析最早是由19世纪末期高尔顿(Sir Francis Galton)发展的。1855年,他发表了一篇文章名为“遗传的身高向平均数方向的回归”,分析父母与其孩子之间身高的关系,发现父母的身高越高或的其孩子也越高,反之则越矮。他把儿子跟父母身高这种现象拟合成一种线性关系。但是他还发现了个有趣的现象,高个子的人生出来的儿子往往比他父亲矮一点更趋向于平均身高,矮个子的人生出来的儿子通常比他父亲高一点也趋向于平均身高。高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”。于是“线形回归”的术语被沿用下来了。 回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。按照参数估计方法可以分为主成分回归、偏最小二乘回归、和岭回归。 一般采用线性回归分析,由自变量和规定因变量来确定变量之间的因果关系,从而建立线性回归模型。模型的各个参数可以根据实测数据解。接着评价回归模型能否够很好的拟合实际数据;如果不能够很好的拟合,则重新拟合;如果能很好的拟合,就可以根据自变量进行下一步推测。 回归分析是重要的统计推断方法。在实际应用中,医学、农业、生物、林业、金融、管理、经济、社会等诸多方面随着科学的发展都需要运用到这个方法。从而推动了回归分析的快速发展。 2 回归分析的概述 2.1 回归分析的定义 回归分析是应用极其广泛的数据分析方法之一。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 2.2 回归分析的主要容

论不确定性与理论定律适用性的理解问题

?科学哲学?论不确定性与理论定律适用性的理解问题 郑 祥 福 自从科学哲学家埃弗瑞特(Everet )提出“多个世界”(multi 2worlds )概念以来,不确定性问题引起科学家和哲学家们的重视和探讨,这不仅加深了人们对客观规律的理解,也推进了科学认识的发展。既然存在不确定性问题,那么客观规律究竟有多大程度的确定性呢?根据不确定的程度,我们又可以把规律区分为哪几种类型呢?本文将就这些问题做一些粗浅的探讨。 一、爱丁顿的“鱼网”与“理论之床” 爱丁顿认为他的理论是“主体选择论”。他用鱼网理论说明:如果鱼网的网眼是两英寸,那么小于两英寸的鱼就会逃脱,而捕鱼者则会认为所有的鱼都是两英寸以上的。爱丁顿的观点与歌德十分相似。歌德说,我们仅仅看到我们所知道的东西:无论是自然规律还是自然现象,当人们发现它时,并没有从各个不同侧面对之加以分析,而是像一个旅行者,在外出旅行时不得不去适应各个旅馆中的床。自然现象在被人们观察时,也往往会被调整到适合于各个理论之床。因此图尔敏说,物理学家“做的最多的事情是推断存在的理论会满足于每一种他所选择研究的新物质体系,而任何他考虑的物质体系,都将使那些其结构最为相似的物质体系在行为、运动上也十分类似”(Toul m in,p.79)。 爱丁顿与图尔敏似乎都是从主体选择的角度出发,试图论述科学理论的主观性的一面,从而主张理论之不确定性。然而,20世纪自然科学的发展告诉我们,客观世界本身就存在着各种不确定性。 首先,在自然科学中,经典力学具有严格的决定性。按照这种严格决定论,只要我们知道了组成宇宙的每一个质点在某一瞬间的速度与位置,同时知道动力学方程,那么我们就可以推算出宇宙的过去与未来。但是,随着19世纪末20世纪初概率统计概念进入物理学,量子力学揭示了大量微观粒子随机运动的规律性,人们开始意识到了埃弗瑞特“多个世界”概念的实在论意义:严格决定论定律只能适用于较单纯的宏观世界、适用于简单现象,而一旦涉及复杂的、多元素或多自由度的系统时,严格决定论的解释就会变得无能为力。量子力学揭示的是一个迥异于我们肉眼所见的世界,它表明量子世界的规律性与宏观世界的规律性无法互换适用。有人称量子世界为非充分决定论的世界,所揭示的是粒子的非连续性、非局部联系等特征,同时,量子世界的生存状态如何,更依赖于实验室观察者的眼光与视力,更离不开人的主体选择性。 其次,现代科学认识表明,在科学中存在大量“反事实”情形,我们每时每刻都有可能发现反例的存在。科学认识中的反事实分析有可能揭示出科学理论的不完善性,从而使科学理论的确定性方面受到质疑。之所以如此,是因为“科学理论并不以其全部复杂性来描述现象系统的运动,而是企图按照少量的参数来描述现象”(Suppe,p.94)。因此,现代西方科学哲学家主张采取语义学的理论观,把自然定律看作是一个模型,这个模型可以用来说明世界,但它只存在于语义学领域,并不关乎 ? 08?

(完整word版)多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。其中已有变量:“c ”—截距项 “resid ”—剩余项。在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。 年份 人口自然增长率 (%。) 国民总收入(亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024

第二讲 不确定性下的期望效用理论

第二讲 不确定性下的期望效用理论 确定性条件下的消费与投资尽管考虑了跨时问题,但未来投资收益是完全确定的。未来往往是未知的,现实中更多重要的经济决策是在不确定环境下做出的,很难直接运用第一章阐述的效用理论来研究不确定性环境中的个体选择,必须建立起一整套基于不确定性的专门理论——期望效用理论来那就不确定性下的个体最优决策行为。我们从一个经典的案例开始讲起。 圣.彼得堡悖论(St Peterburg Paradox )关系到经济学理论的一个重要问题:如何对一个含风险的赌局进行评估?200多年前,瑞士数学家丹尼尔.伯努利(Daniel Bernoulli )对该悖论提出了开创性的解,从此创立了效用理论以及期望效用理论。该悖论是丹尼尔.伯努利的表兄尼古拉斯.伯努利于1713年提出来的。1713年9月9日,尼古拉斯.伯努利在写给数学家M. de Montmort 的信中提出了5个问题,其中第5个问题是这样的: 彼得掷一枚硬币,如果第一次掷硬币头面朝上,彼得答应给保尔一盾(荷兰盾);如果第一次掷的结果是背面朝上,则掷第二次; 如果第二次掷硬币头面朝上, 彼得付保尔2个盾;如果第二次掷的结果是背面朝上,则掷第三次……,到第n 次,如结果是头面朝上,彼得付保尔1 2n -个盾。这个博 局可以无限期地玩下去。保尔在该博局中所获的价值的期望值是多少? 尼古拉斯.伯努利之所以提出这个问题,是由于他发现数学界对这个赌局的期望收益的计算与实际生活中发现的该博局的门票价之间存在着悖论。他发现,如果计算保尔的期望收入,则 2321 1 111()*1()*2()*2...()*2...22221111...... 22 22n n E w -=+++++=++ ++ +=∞ 按这个估算,保尔在该博局中的所获为无穷大,他应该付无穷大来买这个机会。但是,在实际生活中,任何一个理智正常的人若出卖这个机会,其卖价不会超过20盾,因为当时瑞士类似的赌局的门票不超过20盾。 如何解释这个悖论? 大数学家M. de Montmort (1678-1719) 对此并没有回答,但将尼古拉斯.伯努利的信连同上述问题公开出版了。从而引起了数学界后来者的兴趣。 2.1偏好与效用 2.1.1风险备选项的描述 假设C 为代表所有可能的结果所组成的集合。如果集合所有结果数目有限,则可以用 {}12,,n C x x x = 来表示。假设12,,n x x x 状态发生的概率分别为12,,n p p p (任意一种状态i x 发生的概率为i p ,满足0i p ≥,且1 1n i i p ==∑ ) ,我们称1212(,,;,,)n n L x x x p p p = 表示一个简单博彩。 (说明:博彩是描述风险备选项的一个正式工具。简单博彩有时候也写成这种形式:

如何用不确定性解决模型问题

如何用不确定性解决模型问题 随着深度神经网络功能越来越强大,它们的结构也越来越复杂。这些复杂结构也带来了新的问题,即模型的可解释性。 想创建稳定、不易受对抗样本攻击的模型,可解释性是很重要的。另外,为新的研究领域设计模型也是一项富有挑战的工作,如果能了解模型在做什么,可以对这一过程有所帮助。过去几年,为了对模型的可解释性加以研究,研究者们提出了多种方法,包括: LIME:通过局部线性近似值计算解释模型的预测 Activation Maximization:一种能了解那种输入模式可以生成最大的模型回应的方法 特征可视化 在低维解释空间中嵌入一个DNN图层 从认知心理学中借鉴方法 不确定性估计法——本文关注的重点 在我们开始研究如何用不确定性解决模型问题、解释模型之前,首先让我们了解一下为什么不确定性如此重要。 你为什么应该关注不确定性? 一个重要的例子就是高风险的应用,假设你正在创建一个模型,可以帮助医生判断病人的严重程度。在这种情况下,我们不应该仅仅关心模型的精确度,更要关注模型对其预测结果有多大程度的肯定。如果不确定性太高,医生需要谨慎决策。 自动驾驶汽车是另外一个有趣的例子。如果模型不确定是否有行人在马路上,我们可以利用这一信息让车子减速,或者发出警报让驾驶员手动操作。 不确定性还可以在缺乏数据样本的情况下帮助我们。如果模型不是在与样本相似的数据上训练的,它可能无法输出想要的结果。谷歌照片曾经将黑种人错误地认成了大猩猩,就是由于这个原因,种类单一的训练集可能导致令人尴尬的结果。 不确定性的最大用途,也是本文的主要目的,就是为模型排除错误。首先,让我们了解一下不确定性都有哪几种不同类型。

线性回归模型

线性回归模型 1.回归分析 回归分析研究的主要对象是客观事物变量之间的统计关系,它是建立在对客观事物进行大量试验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的方法。回归分析方法是通过建立模型研究变量间相互关系的密切程度、结构状态及进行模型预测的一种有效工具。 2.回归模型的一般形式 如果变量x_1,x_2,…,x_p与随机变量y之间存在着相关关系,通常就意味着每当x_1,x_2,…,x_p取定值后,y便有相应的概率分布与之对应。随机变量y与相关变量x_1,x_2,…,x_p之间的概率模型为 y = f(x_1, x_2,…,x_p) + ε(1) f(x_1, x_2,…,x_p)为变量x_1,x_2,…,x_p的确定性关系,ε为随机误差项。由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。 当概率模型(1)式中回归函数为线性函数时,即有 y = beta_0 + beta_1*x_1 + beta_2*x_2 + …+ beta_p*x_p +ε (2) 其中,beta_0,…,beta_p为未知参数,常称它们为回归系数。当变量x个数为1时,为简单线性回归模型,当变量x个数大于1时,为多元线性回归模型。 3.回归建模的过程 在实际问题的回归分析中,模型的建立和分析有几个重要的阶段,以经济模型的建立为例:

(1)根据研究的目的设置指标变量 回归分析模型主要是揭示事物间相关变量的数量关系。首先要根据所研究问题的目的设置因变量y,然后再选取与y有关的一些变量作为自变量。通常情况下,我们希望因变量与自变量之间具有因果关系。尤其是在研究某种经济活动或经济现象时,必须根据具体的经济现象的研究目的,利用经济学理论,从定性角度来确定某种经济问题中各因素之间的因果关系。(2)收集、整理统计数据 回归模型的建立是基于回归变量的样本统计数据。当确定好回归模型的变量之后,就要对这些变量收集、整理统计数据。数据的收集是建立经济问题回归模型的重要一环,是一项基础性工作,样本数据的质量如何,对回归模型的水平有至关重要的影响。 (3)确定理论回归模型的数学形式 当收集到所设置的变量的数据之后,就要确定适当的数学形式来描述这些变量之间的关系。绘制变量y_i与x_i(i = 1,2,…,n)的样本散点图是选择数学模型形式的重要手段。一般我们把(x_i,y_i)所对应的点在坐标系上画出来,观察散点图的分布状况。如果n个样本点大致分布在一条直线的周围,可考虑用线性回归模型去拟合这条直线。 (4)模型参数的估计 回归理论模型确定之后,利用收集、整理的样本数据对模型的未知参数给出估计是回归分析的重要内容。未知参数的估计方法最常用的是普通最小二乘法。普通最小二乘法通过最小化模型的残差平方和而得到参数的估计值。即 Min RSS = ∑(y_i – hat(y_i))^2 = 其中,hat(y_i)为因变量估计值,hat(beta_i)为参数估计值。 (5)模型的检验与修改 当模型的未知参数估计出来后,就初步建立了一个回归模型。建立回归模型的目的是应用它来研究经济问题,但如果直接用这个模型去做预测、控制和分析,是不够慎重的。因为这个模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。统计检验通常是对回归方程的显著性检验,以及回归系数的显著性检验,还有拟合优度的检验,随机误差项的序列相关检验,异方差性检验,解释变量的多重共线性检验等。 如果一个回归模型没有通过某种统计检验,或者通过了统计检验而没有合理的经济意义,就需要对回归模型进行修改。 (6)回归模型的运用 当一个经济问题的回归模型通过了各种统计检验,且具有合理的经济意义时,就可以运用这个模型来进一步研究经济问题。例如,经济变量的因素分析。应用回归模型对经济变量之间的关系作出了度量,从模型的回归系数可发现经济变量的结构性关系,给出相关评价的一些量化依据。 在回归模型的运用中,应将定性分析和定量分析有机结合。这是因为数理统计方法只是从事物的数量表面去研究问题,不涉及事物的规定性。单纯的表面上的数量关系是否反映事物的本质这本质究竟如何必须依靠专门学科的研究才能下定论。 Lasso 在多元线性回归中,当变量x_1,x_2,…,x_3之间有较强的线性相关性,即解释变量间出现严重的多重共线性。这种情况下,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘的效果变得很不理想。为了解决这一问题,可以采用子集选择、压缩估计或降维法,Lasso即为压缩估计的一种。Lasso可以将一些增加了模型复杂性但与模型无关的

多元线性回归模型习题及答案

、单项选择题 1. 在由n 30的一组样本估计的、包含 3个解释变量的线 性回归模型中,计算得多重决定 系数为0.8500,则调整后的多重决定系数为( D ) A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327 2. 下列样本模型中,哪一个模型通常是无效的( B ) C I A. C i (消费)=500+0.8 打(收入) B. Qd (商品需求)=10+0.8 I i (收入)+0.9 P (价格) 3.用一组有30个观测值的样本估计模型 y t b o b i^t dX 2t U t 后,在0.05的显著性水 平上对b1的显著性作 t 检验,则 b 1 显著地不等于零的条件是其统计量 t 大于等于( C ) A 10.05 (30) B t 0.025(28) C t 0.025 (27 ) D F 0.025 (1,28) 4.模型 ln y t lnb 0 b 1 In x t U t 中,bl 的实际含义是(B ) A. x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于X 的边际倾向 5、 在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模 型 中 存 在 (C ) A.异方差性 B.序列相关 C.多重共线性 D . 高 拟合 优 度 6. 线性回归模型 y t b ) b 1x 1t b 2x 2t ........ b k x kt u t 中,检验 H °:b t 0(i 0,1,2,...k ) 时,所用的统计量 A. t (n-k+1) B.t (n-k-2) 多元线性回归模型 C. D. Q i (商品供给)=20+0.75 P (价格) (产出量) =0.65 L i (劳动) K i 0.4 (资本) 服从(C )

相关文档
最新文档