相关系数,多元线性回归
线性相关与回归(简单线性相关与回归、多重线性回归、Spearman等级相关)

4.剔除强影响点(Influential cases;或称为突出点, outliers)
通过标准化残差(Standardized Residuals)、学生氏残 差(Studentlized Residuals)来判断强影响点 。当指标 的绝对值大于3时,可以认为样本存在强影响点。
删除强影响点应该慎重,需要结合专业知识。以下两种情 况可以考虑删除强影响点:1.强影响点是由于数据记录错 误造成的;2.强影响点来自不同的总体。
r r t sr 1 r2 n2
只有当0时,才能根据|r|的大小判断相关 的密切程度。
4.相关与回归的区别和联系 (1)相关与回归的意义不同 相关表达两个变量 之间相互关系的密切程度和方向。回归表达两个变 量之间的数量关系,已知X值可以预测Y值。从散点 图上,散点围绕回归直线的分布越密集,则两变量 相关系数越大;回归直线的斜率越大,则回归系数 越大。 (2)r与b的符号一致 同正同负。
5.自变量之间不应存在共线性(Collinear)
当一个(或几个)自变量可以由其他自变量线性表示时,称 该自变量与其他自变量间存在共线性关系。常见于:1.一个 变量是由其他变量派生出来的,如:BMI由身高和体重计算 得出 ;2.一个变量与其他变量存在很强的相关性。 当自变量之间存在共线性时,会使回归系数的估计不确定、 预测值的精度降低以及对y有影响的重要自变量不能选入模 型。
P值
截距a 回归系数b sb 标准化回归系数 t值 P值
3.直线回归的预测及置信区间估计
给定X=X0, 预测Y
3.直线回归的预测及置信区间估计
因变量
自变量
保存(产生新变量,保 存在当前数据库) 统计
3.直线回归的预测及置信区间估计
实验二__多元线性回归模型和多重共线性范文

实验二__多元线性回归模型和多重共线性范文多元线性回归是一种常用的统计分析方法,用于研究多个自变量与一个因变量之间的关系。
在进行多元线性回归分析时,一个重要的问题是多重共线性。
多重共线性是指多个自变量之间存在高度相关性,这会导致回归模型的不稳定性,参数估计的不准确性,以及对自变量的解释能力下降等问题。
在进行多元线性回归分析之前,首先需要对自变量之间的相关性进行检验。
常用的方法有相关系数、方差膨胀因子(VIF)等。
相关系数用于衡量两个变量之间的线性关系,其值介于-1和1之间,接近于1表示高度正相关,接近于-1表示高度负相关。
VIF用于衡量一个自变量与其他自变量之间的相关性,其值大于1且越接近于1,表示相关性越强。
如果发现多个自变量之间存在高度相关性,即相关系数接近于1或VIF接近于1,就需采取措施来解决多重共线性问题。
一种常用的方法是通过增加样本量来消除多重共线性。
增加样本量可以提高模型的稳定性,减小参数估计的方差。
但是,增加样本量并不能彻底解决多重共线性问题,只能部分缓解。
另一种常用的方法是通过变量选择来解决多重共线性问题。
变量选择可以将高度相关的自变量从模型中剔除,保留与因变量高度相关的自变量。
常用的变量选择方法包括前向选择、逐步回归和岭回归等。
这些方法都是根据一定的准则逐步筛选变量,直到得到最佳模型为止。
在变量选择中,需要注意在变量剔除的过程中,要确保剩余变量之间的相关性尽可能小,以提高模型的稳定性和准确性。
此外,还可以通过变换变量来解决多重共线性问题。
变换变量可以通过对自变量进行平方项、交互项等操作,以减小相关性。
变换变量的方法需要根据实际情况来选择,具体操作可以参考相关的统计学方法教材。
总之,多元线性回归模型在实际应用中经常遇到多重共线性问题。
通过检验自变量之间的相关性,选择合适的变量和适当的变量变换方法,可以有效解决多重共线性问题,提高模型的稳定性和准确性。
在具体的研究中,应根据实际情况选择适合的方法来解决多重共线性问题,以确保回归分析结果的可靠性和有效性。
相关分析方法

相关分析方法在进行相关分析时,我们需要选择合适的方法来进行研究,以便得出准确的结论。
下面将介绍几种常用的相关分析方法。
首先,相关系数分析是一种常用的相关分析方法。
相关系数分析可以用来衡量两个变量之间的线性关系强度。
常见的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。
皮尔逊相关系数适用于连续变量,而斯皮尔曼相关系数适用于等级变量或者偏序变量。
通过计算相关系数,我们可以了解两个变量之间的相关程度,从而判断它们之间是否存在显著的关系。
其次,回归分析也是一种常用的相关分析方法。
回归分析可以用来探究自变量和因变量之间的关系。
通过建立回归模型,我们可以预测因变量的数值,并且了解自变量对因变量的影响程度。
回归分析可以分为简单线性回归和多元线性回归,具体选择哪种回归模型取决于研究的实际情况。
此外,方差分析也是一种重要的相关分析方法。
方差分析适用于比较两个或多个组之间的均值差异。
通过方差分析,我们可以判断不同组之间的均值是否存在显著差异,从而了解它们之间的相关性。
方差分析可以分为单因素方差分析和多因素方差分析,具体选择哪种方差分析方法需要根据研究的实际情况来确定。
最后,卡方检验也是一种常用的相关分析方法。
卡方检验适用于分析两个或多个分类变量之间的关联性。
通过卡方检验,我们可以判断两个或多个分类变量之间是否存在相关性,从而了解它们之间的关系。
卡方检验可以帮助我们理清变量之间的关联关系,为进一步分析提供依据。
综上所述,相关系数分析、回归分析、方差分析和卡方检验是常用的相关分析方法。
在实际研究中,我们可以根据研究的具体目的和数据类型选择合适的相关分析方法,以便得出准确的结论。
希望本文介绍的相关分析方法能够对您的研究工作有所帮助。
回归系数与相关系数的关系

回归系数与相关系数的关系回归分析是一种常用的统计方法,它可以用来研究两个或多个变量之间的关系。
其中,回归系数和相关系数是回归分析中非常重要的概念,它们之间存在着密切的关系。
本文将从回归系数和相关系数的定义、计算方法以及意义等方面,探讨它们之间的关系。
一、回归系数和相关系数的定义回归系数是用来描述自变量与因变量之间关系的参数。
在一元线性回归中,回归系数通常表示为β1,它表示因变量y对自变量x的变化量,即y的平均值随着x的变化而变化的程度。
在多元回归中,回归系数通常表示为βi,表示因变量y对自变量xi的变化量,即y 的平均值随着xi的变化而变化的程度。
相关系数是用来描述两个变量之间线性相关程度的指标。
它通常用r表示,在一定程度上反映了两个变量之间的相似程度。
当r=1时,表示两个变量完全正相关;当r=-1时,表示两个变量完全负相关;当r=0时,表示两个变量之间不存在线性相关关系。
二、回归系数和相关系数的计算方法在一元线性回归中,回归系数β1的计算方法为:β1=Σ((xi- x)(yi- y))/Σ(xi- x)^2其中,x表示自变量的平均值,y表示因变量的平均值,xi和yi 分别表示第i个样本的自变量和因变量的值。
相关系数r的计算方法为:r=Σ((xi- x)(yi- y))/√(Σ(xi- x)^2Σ(yi- y)^2)在多元回归中,回归系数βi的计算方法为:βi=(XTX)^-1XTY其中,X表示自变量的矩阵,Y表示因变量的向量,T表示转置,-1表示矩阵的逆。
三、回归系数和相关系数的意义回归系数和相关系数都是用来描述两个变量之间关系的指标,但它们的意义有所不同。
回归系数描述的是因变量在自变量变化时的变化量,它可以用来预测因变量的变化情况。
例如,一个人的身高和体重之间存在一定的关系,假设我们已经建立了身高和体重之间的回归模型,其中回归系数为2.5,那么当这个人的身高增加1厘米时,他的体重预计会增加2.5公斤。
多元线性相关与回归分析

第三节 多元线性相关与回归分析一、标准的多元线性回归模型上一节介绍的一元线性回归分析所反映的是1个因变量与1个自变量之间的关系。
但是,在现实中,某一现象的变动常受多种现象变动的影响。
例如,消费除了受本期收入水平的影响外,还会受以往消费和收入水平的影响;一个工业企业利润额的大小除了与总产值多少有关外,还与成本、价格等有关。
这就是说,影响因变量的自变量通常不是一个,而是多个。
在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。
这就产生了测定与分析多因素之间相关关系的问题。
研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。
多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,只是在计算上比较麻烦一些而已。
限于本书的篇幅和程度,本节对于多元回归分析中与一元回归分析相类似的内容,仅给出必要的结论,不作进一步的论证。
只对某些多元回归分析所特有的问题作比较详细的说明。
多元线性回归模型总体回归函数的一般形式如下:t kt k t t u X X Y ++⋯++=βββ221 (7.51)上式假定因变量Y 与(k-1)个自变量之间的回归关系可以用线性函数来近似反映.式中,Y t 是变量Y 的第t个观测值;X jt 是第j 个自变量X j 的第t个观测值(j=1,2,……,k);u t 是随机误差项;β1,β2,… ,βk 是总体回归系数。
βj 表示在其他自变量保持不变的情况下,自变量X j 变动一个单位所引起的因变量Y 平均变动的数额,因而又叫做偏回归系数。
该式中,总体回归系数是未知的,必须利用有关的样本观测值来进行估计。
假设已给出了n个观测值,同时1ˆβ,2ˆβ…,k βˆ为总体回归系数的估计,则多元线性回归模型的样本回归函数如下:t kt k t t e X X Y ++⋯++=βββˆˆˆ221 (7.52) (t =1,2,…,n)式中,e t 是Y t 与其估计t Y ˆ之间的离差,即残差。
回归分析概念、相关、多元回归分析

都有显著的线性关系? 不一定。
进行单个自变量的显著性检验.
四、自变量的偏回归效果显著性检验 把在其它自变量对 线性回归基础上 对 的线性回归效果称做 对 的偏回归效果。
检验假设: 定理6.4.2 在m元正态线性模型下, 是 的 最小二乘估计量, 为残差平方和 估计量,则有:
其中
与 独立
是矩阵 主对角线上第
定理6.1.1 在定义6.1.1 的条件下 ,函数
是所有
的函数
中均值方差最小的函数 ,即对任意给定的函数
,总有
成立。
称 y E(Y x1, , xp )为回归函数. (Y,x1,…,xp)服从多元
在
的条件下
正态分布时,回归函数 为线性回归函数
y E(Y x1, , xp ) a0 a1x1 apxp
编号 1 2 3 4 5 6 7 8 9 10
X 820 780 720 867 690 787 934 679 639 820 Y 165 158 130 180 134 167 186 145 120 158 试问进食量与体重增量间有无相关关系?
实例 SPSS软件实现和结果分析 1. SPSS数据输入格式 10行2列
.940** 1.000
Sig. (2-tailed)
.000
.
N
10
10
**. Correlation is significant at the 0.01 level (2-tailed).
P=0.000<0.05, 拒绝原假设的证据较充分
结论:进食量与体重增量间有显著线性相关关系.
§4 多元线性回归分析
几何直观理解 数据散点图
4000
3800
回归分析概念相关多元回归分析

回归分析概念相关多元回归分析回归分析是一种统计学方法,用于研究因变量和一个或多个自变量之间的关系。
它可以用来预测或解释因变量在自变量变化时的变化情况。
相关分析是回归分析的一种特殊情况,用于研究两个变量之间的关系。
它通过计算两个变量之间的相关系数来衡量它们的线性相关程度。
相关系数的取值范围在-1到1之间,接近1表示正相关,接近-1表示负相关,接近0表示无相关。
与相关分析相比,多元回归分析可以同时研究一个因变量和多个自变量之间的关系。
它通过拟合一个线性模型来预测或解释因变量的变化。
多元回归分析的最常见形式是多元线性回归,它可以用来研究因变量在多个自变量变化时的变化情况。
在多元回归分析中,每个自变量都有一个回归系数,代表它对因变量的影响程度。
多元回归分析需要满足一些假设,包括线性假设(因变量和自变量之间的关系是线性的)、独立性假设(观测之间是相互独立的)、等方差性假设(残差的方差是恒定的)和正态性假设(残差是正态分布的)。
如果这些假设不成立,可能需要采取一些特殊技术,如非线性回归或转换变量。
多元回归分析的步骤包括数据收集、模型建立、模型拟合和结果解释。
在数据收集阶段,需要收集因变量和自变量的数据。
在模型建立阶段,需要选择适当的自变量,并建立一个数学模型。
在模型拟合阶段,需要使用统计软件拟合模型,并计算回归系数和拟合优度。
在结果解释阶段,需要解释回归系数的含义,并进行模型的诊断和解释。
多元回归分析有很多应用领域,包括经济学、社会科学、医学等。
它可以用来预测销售额、分析市场需求、评估政策效果等。
通过多元回归分析,研究人员可以深入了解因变量与多个自变量之间的复杂关系,并得出有关预测和解释的结论。
总结起来,回归分析是一种统计学方法,用于研究变量之间的关系。
相关分析是其特殊情况,用于研究两个变量之间的关系。
多元回归分析是同时研究一个因变量和多个自变量之间的关系。
多元回归分析的步骤包括数据收集、模型建立、模型拟合和结果解释。
相关系数回归方程计算公式

相关系数回归方程计算公式相关系数和回归方程是统计学中常用的两个概念。
它们用于研究变量之间的关系,并可以帮助我们理解和预测数据。
相关系数是一个度量变量之间线性关系强度的指标。
它可以测量两个变量之间的相关性,并提供一个介于-1和1之间的值。
相关系数为正值表示正相关,为负值表示负相关,而接近0则表示两个变量之间几乎不存在线性关系。
在数学上,相关系数可以根据协方差和变量的标准差来计算。
协方差度量了两个变量之间的总体偏离程度,而标准差度量了每个变量的离散程度。
相关系数公式如下:ρ = cov(X, Y) /(σX * σY)其中,ρ表示相关系数,cov(X,Y)表示变量X和Y之间的协方差,σX表示X的标准差,σY表示Y的标准差。
回归方程是用来描述自变量与因变量之间关系的数学模型。
它可以通过最小二乘法来确定最佳拟合直线或曲线,以预测因变量的值。
回归方程通常采用一元或多元线性回归模型。
一元线性回归方程如下:Y=β0+β1X+ε其中,Y表示因变量,X表示自变量,β0和β1是回归系数,ε表示误差项。
多元线性回归方程如下:Y=β0+β1X1+β2X2+...+βnXn+ε其中,Y表示因变量,X1、X2,…,Xn表示自变量,β0、β1、β2,…,βn表示回归系数,ε表示误差项。
为了确定回归方程中的回归系数,通常使用最小二乘法。
最小二乘法通过最小化实际观测值与预测值之间的残差平方和,来确定最佳拟合直线或曲线。
残差是观测值与预测值之间的差异。
计算回归系数的公式为:β1 = Σ((Xi- Xmean)(Yi-Ymean)) / Σ((Xi - Xmean)^2)β0 = Ymean - β1Xmean其中,Xi表示自变量的观测值,Xmean表示自变量的平均值,Yi表示因变量的观测值,Ymean表示因变量的平均值。
回归方程和相关系数可以帮助我们理解和预测变量之间的关系。
通过计算相关系数和回归方程,我们可以了解变量之间的线性关系强度,并可以预测因变量的值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二届苏北数学建模联赛优秀论文抑制房地产泡沫问题的模型设计朱朝霞,邸苏闯,陈成(中国矿业大学,徐州221008)摘要:本文讨论了影响房地产价格的主要因素,找出了价格和其主要因素之间近似成线性关系,从而建立表示房地产价格的数学模型——多元线性回归模型,并对模型进行了全方面的论述,得出求解其中各个参数的方法,并最终求出房地产价格。
建模过程中,首先用科学分析的方法,确定主要因素并对其作数学抽象,再针对各因素综合运用多种数学方法进行分析求解。
第一,用概率论与数理统计的方法找出价格和各个因素之间的近似线性关系,确定模型;第二,用最小二乘法求解模型中的参数;第三,用回归分析确定模型精度及检验,从而得出一个完整的数学模型;第四,通过该模型深入分析了影响房地产价格主要因素,提出了一些政策建议,把高的开发成本降下来,同时调整供给结构。
第五,根据模型及建议进行合理的预测,最后分析模型的优缺点并提出了改进方向。
一问题重述所谓房地产泡沫直的是商品房售价远远超过起实际的价值。
近几年来,我国各大城市房价出现了普遍的持续上涨、高居不下的情况。
房价的上涨使生活成本大幅度增加,导致许多低收入人群买房难,目前我国城镇居民的人均居住面积只有发达国家的一半左右,甚至低于不少发展中国家,居民不是没有住房需求,而是现有的货币支付能力无法使其去实现购房的愿望。
尽管现在买房可以贷款,可以分期付款,但这也需要居民有相当好的收入水平,还要用好多年来供房直到中年甚至更晚才可以还清,一生中最好的时光就都交给了房子。
因此如何有效地抑制价格上扬,甚至能够降低房价,是一个备受关注的社会问题。
下面就就这个问题展开分析与建立数学模型,来研究如何有效的抑制房价上扬。
二基本假设影响房价的因素有许多,房屋建造成本、市场供求关系、城市经济发展、城市规模、等等。
现假设房屋价格与各个因素间的关系均为线性关系,且:(1)房屋建造成本用竣工房屋造价来代替。
(2)城市经济发展用人均GDP来表示。
(3)城市规模用建成区面积来表示。
(4)市场供求关系通过消费者的支付能力竣工房屋价格来体现,而消费者的支付能力有通过在岗职工的平均工资来衡量。
(5)房地产价格通过房屋均衡价格来表示(6)忽略消费者偏好如有无学校、绿化率、停车位、热水供应状态、通信、房屋建筑形式等对住房价格的影响。
(7) 忽略消费成本如交通费用、物业费用、停车费用等对房价的影响。
(8) 忽略一些炒作对房价的影响。
三 基本符号、变量和用语A :表示人均GDP 序列(元)B :表示在岗职工平均工资序列(元)C :表示竣工房屋造价序列(元/㎡)D :城乡人均储蓄余额序列/元Y :住房均衡价格指标序列,均衡价格(equilibrium price)是指消费者对某种商品的需求量等于生产者所提供的该商品的供给量时的市场价格。
均衡价格是由需求和供给两种力量共同决定的。
它与吸纳率和交易价格有关。
[1]t :为随机变量;Uy,Ua,Ub,Uc Ud 分别为Y,A,B,C,D 序列的均值序列ΔY,ΔA,ΔB,ΔC,ΔD 分别表示Y-Uy,A-Ua,B-Ub,C-Uc,D-Ud 序列,即中心化序列2 б:序列的方差1a ,2a ,3a ,4a :模型参数 S(a):为残差的平方和n :统计城市数(样本数) R :中心化序列的协方差四 建立模型并分析一、 模型推导过程表一为我国12个主要城市住房均衡价格及其相关因素的统计表。
依照此表我们可以求得各因素与住房均衡价格的相关系数进而判断各因素对房价的影响程度如表二所示。
同时可以求得各个因素序列的平均值,见附表一自学得到:求相关系数的相关程序1830.773 15401.42 241.6667 0.110667 10300.67 8.850833 12110.24 1149.167 function coeff = myPearson(X , Y)% 本函数实现了皮尔逊相关系数的计算操作%% 输入:X=[3494.971636.21424.85859.21872.571655.621935.431222.491502.943119.621934.312311.06];% X:输入的数值序列Y=[1984615976104251067874891498918429102619142308051681619961]; % Y:输入的数值序列%% 输出:% coeff:两个输入数值序列X,Y的相关系数%if length(X) ~= length(Y)error('两个数值数列的维数不相等');return;endfenzi = sum(X .* Y) - (sum(X) * sum(Y)) / length(X);fenmu = sqrt((sum(X .^2) - sum(X)^2 / length(X)) * (sum(Y .^2) - sum(Y)^2 / length(X)));coeff = fenzi / fenmu;end %函数myPearson结束由表二可得,住房均衡价格与非农业人口变化率、人均住宅面积、建成面积的相关系数相对要小,所以这里我们忽略二者的影响,只考虑其他主要因素的影响,主要包括:人均GDP、在岗职工平均工资、竣工房屋造价、城人均储蓄余额等方面通过表一我们依次做出主要因素和住房均衡价格的关系图:图1图2图3图4由均衡房价和人均GDP 、均衡房价和人均工资、均衡房价和竣工造价, 均衡房价和居民平均储蓄的关系图可以看出,均衡房价和人均GDP 、人均工资、竣工造价、居民平均储蓄存在着相依的关系,很容易想到用多元线性回归模型 Y=1a A+2a B+3a C+4a D+…….+ t ε表示因变量Y,对自变量A,B,C,D …….的相依性,其中1a ,a ,3a ,4a …….为参数模型特点如下:1、A 、B 、C 、D ….为一般变量,t ε为随机变量;2、Y 为一般变量和随机变量的线形组合,Y 序列的值既取决于A,B,C 序列,又受制于t ε。
如表三所示各序列t ε一般假定为白噪声序列,假定其服从均值为0,方差为2 б的正态分布将其中心化后得Y-Uy=1a *(A-Ua)+ 2a *(B-Ub)+ 3a *(C-Uc)+ 4a *(D-Ud)+ t ε 上式即为ΔY =1a *ΔA +2a *ΔB +3a *ΔC +4a *ΔD+ t ε 现在对模型的参数进行最小二乘法估计其中ΔY 、ΔA 、ΔB 、ΔC 、ΔD 各序列(矩阵)的值见表四表四令a= (1a ,2a ,3a ,4a )T ,则a 的最小二乘估计,应使残差t ε平方和S(a)达到最小,其中S(a)=∑=nt 12tε =∑=nt 1(ΔY t-1a *ΔA t-2a *ΔB t-3a *ΔC -4a *ΔDt)2,取a∂∂S(a) =0即可得到:1a ∂∂S(a) =∑=nt 12*(ΔY t-1a *ΔA t-2a *ΔB t-3a *ΔCt-4a *ΔD)*(-ΔAt)=0---------------------------式1用Rya 表示序列ΔY 和ΔA 的协方差,Raa 表示ΔA 序列的方差,Rba,表示序列ΔB 和ΔA 的协方差,Rca 表示序列ΔC 和ΔA 的协方差:式1可写成:-Rya+1a *Raa+2a *Rba+3a *Rca+4a *Rda=0-----------------------------式2 同理2a ∂∂S(a)=o 推出: -Ryb+1a *Rab+2a *Rbb+3a *Rcb+4a *Rdb =0-----------------------------式33a ∂∂S(a)=0推出: -Ryc+1a *Rac+2a *Rbc+3a *Rcc+4a *Rdc =0-----------------------------式44a ∂∂S(a)=0推出: -Ryd+1a *Rad+2a *Rbd+3a *Rcd+4a *Rdd=0-----------------------------式5 把式2、式3,式4,式5写成矩阵相乘的形式为:⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡ Rdd Rcd Rbd Rad Rdc Rcc Rbc Rac Rdb Rcb Rbb Rab Rda Rca Rba Raa * ⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡4321a a a a =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡Ryd Ryc Ryb Rya 推求参数的公式为:⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡4321a a a a = ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡ Rdd Rcd Rbd Rad Rdc Rcc Rbc Rac Rdb Rcb Rbb Rab Rda Rca Rba Raa * ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡Ryd Ryc Ryb Rya --------------式6具体到本题中,我们运用往年的统计数据对模型中各个参数的求解。
经计算得各个协方差的值为:(利用matlab 软件) Raa=38730662Rba=Rab=18250255 Rca=Rac=2543343 Rda=Rad=25327000 Rbb=8106483Rcb=Rbc=1257098 Rdb=Rbd=11269000 Rcc=211174.1 Rdc=Rcd=1882000Rdd=22936000Rya=4475718 Ryb=2197259 Ryc=343656.3 Ryd=3251000通过矩阵运算得到1a ,2a ,3a ,4a 的值为:(利用matlab 软件)1a ,=0.0583 2a =-0.04873a =1.1621 4a =0.0059把系数1a ,2a ,3a ,4a 代回原模型得:Y-1830.77=0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+0.0059*(D-12110.24)+ t ε利用表三中的均衡房价、人均GDP 、在岗职工平均工资、竣工房屋造价、城乡人均储蓄余额反推t ε的值,即:t ε=Y-1830.77-[0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+0.0059*(D-12110.24)]得到的12个t ε值为:图5由于t 的平均值为0.584,相对Y 值来说非常小,可以近似看成是0,从而予以忽略故模型进一步化简为:Y-1830.77=0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+ 0.0059*(D-12110.24)即Y=0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+ 0.0059*(D-12110.24)+1830.77即Y =1a *ΔA +2a *ΔB +3a *ΔC +4a *ΔD+ Uy二、 回归分析应用上述模型从理论上来说可以由一个城市的人均GDP 、在岗职工平均工资、竣工房屋造价、城乡人均储蓄余额等方面的信息来推求这个城市的均衡房价。