基于层次分析法和回归分析的房价分析与预测模型

基于层次分析法和回归分析的房价分析与预测模型
基于层次分析法和回归分析的房价分析与预测模型

题目:基于层次分析法和回归分析的房价分析与预测模型

摘要

随着我国住房制度的商品化改革,我国住宅产业蓬勃发展,逐渐成为影响国计民生的重要产业之一。然而近年来国内大中型发达城市的商品住宅价格水平飞速增长,已经呈现出超过人民承受能力和经济发展水平的趋势。为此,确定这些城市商品住宅价格水平合理性,并探究影响价格的相关因素,提出正确的对策措施成为稳定经济、改善人民生括的首要问题。【1】

为了反映不同因素对房价的影响,我们查阅各种资料利用互联网,收集到2010年5月以来的三个与房价联系紧密的数据,即人口数量、居民人均可支配收入和住房成本。为了反映全国各类城市房价的情况,我们选取三类城市,即直辖市、沿海开放城市、一般省会城市,并兼顾地理位置分布,选取九个有代表性的城市:北京、上海、重庆、深圳、福州、大连、武汉、成都、西宁。

对于问题一,房价的合理性分析。我们运用层次分析法。以人口数量、居民人均可支配收入和住房成本为准则层,以房价的合理、基本合理和不合理为方案层,建立三层层次结构分析模型。根据不同城市的特点,设置三个影响因素的权值,然后求出组合权向量,根据权向量中相应元素的数值大小,判断该城市房价的合理性。

对于问题二,房价未来走势的预测,我们运用回归分析法,将三个影响因素作为变量。先分别讨论房价相对于各因素的变化情况,用EXCEL作出房价相对于各因素的变化图,利用移动平均法消除不规则因素的影响,求出房价与各因素的移动平均数,大致确定房价与影响因素之间的变化关系。然后利用MATLAB软件对房价进行拟合,得出房价的函数表达式,对未来4个月房价的走势进行预测,并利用2011年5月的数据对模型进行检验,发现预测结果与实际结果比较吻合,有一定的通用性。

对于问题三,房价合理的具体措施,以及可能对经济发展产生的影响。我们根据前两个问题所得的结果,针对不同城市出现的问题,和房价不合理的方面提出几点改善房价合理性的建议,并对房价在经济发展上的影响情况作简要分析。

关键词:层次分析法房价合理性移动平均法层次分析法房价预测

一.问题重述

房价问题事关国计民生,对国家经济发展和社会稳定有重大影响,一直是各国政府大力关注的问题。我国自从取消福利分房制度以来,随着房价的不断飙升,房价问题已经成为全民关注的焦点议题之一,从国家领导人、地方政府官员,到开发商、专家学者、普通百姓通过各种媒体表达各种观点,但对于房价是否合理、未来房价的走势等关键问题,至今尚未形成统一的认识。

请根据中国国情,收集建筑成本、居民收入等与房价密切相关的数据,选取我国具有代表性的几类城市对房价的合理性及房价的未来走势等问题进行定量

分析;根据分析结果,进一步探讨使得房价合理的具体措施,以及可能对经济发展产生的影响,并进行定量分析。

二.问题分析

对题目进行分析,我们发现可以将问题分为三个,即房价的合理性分析为综合评价类问题,房价的未来走势分析为预测类问题,而房价合理的措施及对经济发展的影响是跟据前两个问题的结果综合分析得出结论。

首先,对于问题一:房价的合理性分析,由于2010年4月北京出台了“限购令”,全国各大城市纷纷效仿,这一政策对房价影响较大,因此我们收集了从2010年5月开始四个与房价联系紧密的数据,即住房成本、居民人均可支配收入、人口数量和通货膨胀率,考虑到住房成本内容繁杂,找不到十分合适的数据,为简化处理在这里用土地价格代替住房成本。然后按城市类型,选取三类城市:直辖市、沿海开放城市、一般省会城市,并兼顾地理位置分布,选取九个有代表性的城市:北京、上海、重庆、深圳、福州、大连、武汉、成都、西宁。然后运用层次分析法,结合收集的数据将每个城市的房价评价为合理、基本合理、不合理。

其次,对于问题二:房价未来走势的预测,属于预测类问题,我们运用回归分析法,将三个影响因素作为变量。先分别讨论房价相对于各因素的变化情况,用EXCEL作出房价相对于各因素的变化图,利用移动平均法消除不规则因素的影响,求出房价与各因素的移动平均数,大致确定房价与影响因素之间的变化关系。然后利用MATLAB软件对房价进行拟合,得出房价的函数表达式,对未来4个月房价的走势进行预测,并利用2011年5月的数据对模型进行检验,发现预测结果与实际结果比较吻合,有一定的通用性。

最后,对于问题三:房价合理的具体措施,以及可能对经济发展产生的影响。我们根据前两个问题所得的结果,针对不同城市出现的问题,和房价不合理的方面提出几点改善房价合理性的建议,并对房价在经济发展上的影响情况作简要分析。

三.模型假设

1.所收集到的大部分数据真实可靠。

2.国内外经济发展稳定,短期内通货膨胀没有明显变化,即通货膨胀率不变。

3.短期内城市居民生活状态趋于稳定,没有重大的自然灾害、战争和社会动乱等不稳定因素的影响。

4.今年各月供求关系、经济形势、政府政策等宏观因素与往年相应月份相同保持稳定。

5.在影响房价的因素中,各因素如住房成本和居民生活水平相互独立。

四.符号说明

λ矩阵的最大特征值

max

U最大特征值对应的特征向量

C.矩阵一致性指标

I

R

C.矩阵一致性比较率

R.平均一致性指标

I

w总排序

n离散时间序列

x地价

1

x居民人均可支配收入

2

β回归系数估计值

y房价

五.模型的建立与求解

5.1数据的整合:

确定了所需要的数据后,我们查询了国家统计局网站【2】、搜房网【3】、中国城市地价网【4】、各城市政府网站等官方网站,收集了大量真实可靠的数据。由于数据种类较多,且数据量较大,不易于分析处理,我们将数据整合,并导入EXCEL表格中,制成各城市月房价表、月居民人均可支配收入表、月土地价格表(见附录一),然后作出各城市地价与房价,居民人均可支配收入与房价的关系曲线。为了消除政策调整,房产炒作,自然灾害等偶然因素的影响,而体现出价格变化趋势,运用移动平均法,重新制成各城市月房价移动平均值表、月居民人均可支配收入移动平均值表、月土地价格移动平均值表(见附录),然后分别作出地价移动平均值与房价移动平均值,居民人均可支配收入移动平均值与房价移动平均值的关系曲线。

5.2层次分析法(解决问题一:房价的合理性分析)

5.2.1模型分析与建立

要分析各城市房价是否合理,就需要对各城市房价的合理性进行评价,因此我们运用层次分析法。【5】对于准则层的确定,通过查阅相关资料,我们了解到,房价的影响因素有人口数量、居民人均可支配收入、通胀水平、住房成本等,由于假设通胀水平在短期内不发生变化,所以以人口数量、居民人均可支配收入和住房成本为准则层,以房价的合理、基本合理和不合理为方案层,建立层次结构分析模型,模型结构如图5.2.1所示:

图5.2.1

5.2.2模型求解

利用层次分析法分析某个城市房价是否合理,首先要根据所收集到的数据,分析各影响因素对房价影响程度的大小;然后,根据分析的结果,设定各个影响因素的权值;最后,通过计算得到组合权向量。根据组合权向量中对应的值来评价该城市的房价是否合理。

由于我们选取了九个城市,计算过程繁复芜杂,计算量大,此处以武汉市为例,对模型求解过程表述如下:

房价的确定,主要应该考虑当地城镇居民的可支配收入水平,收入水平高房地产商自然会将房价抬高,因此把居民人均可支配收入的权重设为最大;而住房成本直接关系到房屋的售价,但是住房的成本包括很多方面,如土地,建材,人工,管理等,为了分析方便,这里做一下简化处理,用土地价格代替住房成本,通过对大量数据分析同时查阅了相关资料后,我们发现土地价格对房价有一定的影响,但影响不及居民人均可支配收入的大;人口决定了住房需求,因此人口多少也会在一定程度上影响房价,但是一个城市的人口在短时间内变化并不明显,而且买房人一般是有一定经济基础的,这些人在城市人口中只占有少数比例。以武汉市为例,准则层B 的三个因素(B 1,B 2,B 3)的两两判断矩阵设定如表5.2.2.1所示。

表5.2.2.1 两两判断矩阵

权重 人口

居民人均可支配收入

建筑成本

人口

1 1/5 1/3 居民人均可支配收入

5 1 3 建筑成本

3

1/3

1

1.成对比较矩阵A 的计算:

从而得到其相对应的成对比较矩阵如下所示:

????

?

?????=1313315315111A

通过MATLAB 软件求得矩阵A 的最大特征值0385.3max =λ,该最大特征值对

应的特征向量为:

U=(0.1506 0.9161 0.3715)T

然后将其单位化后得到权向量:

U=(0.1047 0.6370 0.2583)T

2.对矩阵A 进行一致性检验: (1)矩阵一致性指标I C .的计算: 1

.1max 1--=

n n

I C λ 公式1

代入n=3,0385.31max =λ 求得 013.0.1=I C (2)矩阵一致比较率1.R C 计算: 查找n=3的平均一致性指标52.0.1=I R I

R I

C R C ...=

公式2 得1.0025.0.1<=R C 可以判断矩阵A 满足一致性。 3.构造C B -层对比矩阵:

??????????=13/27/42/315/64/76/5111B ??

??

?

?????=17/32/13/713/424/3112B ??

??

?

?????=17/33/23/712/32/33/2113B

通过计算C B -层两两判断矩阵的特征值、特征向量、一致性指标及一致性

比较率,得出层次分析法的参数表如表5.2.2.2所示。 表5.2.2.2

1B

2B

3B

C B -层权重

0.3687

0.3574 0.3148 0.3955 0.4558 0.4779 0.2357

0.1868 0.2073 C B -层最大特征值 3.0126 3.0020 3.0001 C B -层1.I C

0.0063 0.0010 0.0001 C B -层1.I R 0.52 0.52 0.52 C B -层1.R C

0.0121

0.0019

0.0001

如表5.2.2.2所示,一致性比率均小于0.1,则矩阵均满足一致性条件。 总排序: []U B B B w 32

1

7= 公式3

求得[]T

w 1972.04552.03476.07=

对于其他八个城市,我们根据收集到的数据和各个城市的具体情况,对各城市的特点分析如下:

对于北京和上海市,考虑到其人口较多,且地理位置优越,人均收入水平较高;对于重庆市,虽然人口较多,但经济发展水平远不及北京和上海,且处于西南内陆,属丘陵地貌,地理条件较差,受炒作因素的影响较小;对于深圳、福州和大连这类沿海开放城市,其经济发达,气候条件优越,适宜居住,因此地价较高;对于武汉、成都和西宁这类处于中西部的普通省会城市,正处于稳定发展中,经济相对落后,人口较多,住房成本相对稳定,因此其房价主要受人口和居民人均可支配收入的影响较大。

同理可求得其它城市的总排序1w (北京)、2w (上海)、3w (重庆)、4w (深圳)、5w (福州)、6w (大连)、8w (成都)、9w (西宁)分别为:

[]T w 3871

.04051.02078.01= []T w 3974.04162.01864.02= []T w 1732

.04812.03356.03= []T w 2061.04757.03182.04= []T w 1374

.04553.04073.05= []T w 1395.04253.04052.06= []T w 1368

.04255.04377.08= []T w 1751.04034.04215.09=

5.3回归分析法(解决问题二:房价的未来走势分析)

5.3.1模型分析与建立

对于房价未来走势的分析,属于预测问题。我们收集到了与房价有关的数据,

这些数据与房价之间存在着一定的数学关系,利用回归分析法对数据进行拟合,求得房价关于各影响的函数表达式,就能利用此表达式对房价的未来走势作出预测。【6】

由于影响房价的因素有人口数量、居民人均可支配收入和住房成本,用回归分析法对房价进行拟合就属于多项式拟合。

5.3.2模型求解

首先确定各影响因素的与房价之间的变化关系,由于人口在一年内变化很小,在确定房价变化函数时可忽略。我们先尝试着作出了居民人均可支配收入、住房成本与房价之间的变化关系图,我们发现图像上有很大的波动,可能是由于政策调整、炒作等不规则因素造成的,为了消除这些不规则因素,而体现出变量之间内在的关系,我们运用移动平均法利用EXCEL 计算出房价、居民人均可支配收入、住房成本的移动平均数,作出移动平均数表(见表5.3.2.1—表5.3.2.3)

表5.3.2.1 房价移动平均数表

表5.3.2.2 地价移动平均数表

2010年7月 2010年8月 2010年9月 2010年10月 2010年11月 2010年12月 2011年1月 2011年2月 2011年3月 2011年4月 北京 12394 12566 12548 12462 12335 12272 12602 13039 13537 13895 上海 19682 19621 19602 19574 19652 19765 19841 19944 20527 20742 重庆 2595 2617 2661 2730 2801 2900 2965 2998 3028 3036 深圳 17673 17766 17858 17856 17887 18064 18446 18850 19201 19402 福州 3977 3991 4147 5659 7179 8696 10079 10407 10583 10748 大连 2180 2213 2248 2269 2308 2325 2336 2357 2366 2374 武汉 2908 2928 2948 2972 2993 3032 3081 3121 3162 3185 成都 6832 6860 6892 6914 6955 7015 7099 7185 7251 7288 西宁 664

669

675

676

679 684

688

692

697

698

2010年7月 2010年8月 2010年9月 2010年10月 2010年11月 2010年12月 2011年1月 2011年2月 2011年3月 2011年4月 北京 23336 24026 24683 25436 25616 25712 25808 25941 26345 26464 上海 27506 27523 27773 28208 28619 29232 29334 29217 29194 28841 重庆 6642 6685 6859 7092 7316 7577 7757 7856 7957 7963 深圳 18145 18753 19134 19341 19841 20318 20979 21619 22106 22217 福州 10931 10921 11073 11265 11497 11841 12099 12553 12779 12822 大连 10809 11109 11369 11690 11886 12163 12443 12670 12901 12968 武汉 6816 6960 7117 7301 7460 7714 7873 8041 8249 8271 成都 8732 8776 8795 8877 8951 9090 9194 9302 9458 9481 西宁

4048

4084

4245

4309

4347

4376

4591

4731

5082

5213

表5.3.2.3 居民人均可支配收入移动平均数表

2010年7

月2010年8

2010年9

2010年

10月

2010年

11月

2010年

12月

2011年1

2011年2

2011年3

2011年4

北京2401 2421 2445 2474 2486 2618 2788 2991 3212 3284 上海2895 2905 2914 2913 2923 2942 2955 2972 2990 2991 重庆1577 1606 1618 1644 1676 1737 1808 1874 1951 1969 深圳2690 2729 2771 2815 2862 2938 3016 3091 3166 3187 福州1917 1943 1984 2017 2048 2088 2113 2142 2165 2179 大连1731 1768 1814 1856 1905 1984 2052 2119 2175 2188 武汉1916 1949 1969 2000 2020 2045 2070 2099 2133 2147 成都1629 1659 1687 1704 1717 1757 1800 1889 1990 2035 西宁1111 1175 1247 1315 1369 1413 1447 1467 1488 1500

根据上表所得数据,用EXCEL作出房价、地价、居民人均可支配收入随时间的变化图(以武汉为例),如图5.3.2.1—图5.3.2.3

图5.3.2.1 图5.3.2.2

图5.3.2.3

我们发现除了北京和上海,其他城市的地价与房价、居民人均可支配收入与房价基本呈二次或线性关系,所以在拟合时对这两个城市要单独处理,但拟合的方法是一样的。以武汉为例,模型的建立和求解过程如下:

(1)对武汉市地价作二次拟合,用n 代表离散时间序列,n=0,1,2,3···

n=0表示数据起始点,得到如下结果,如图5.3.2.4:

图5.3.2.4

4333.28884136.155530.121++=n n x 公式4

(2)对武汉市居民居民人均可支配收入作一次拟合,得到如下结果,如图5.3.2.5:

图5.3.2.5

0667.18937697.252+=n x 公式5

(3)作出武汉房价和地价的关系图,发现用MATLAB 作二次拟合较为合适,

如下图5.3.2.6:

图5.3.2.6

同理,对房价和居民人均消费水平作二次拟合的图形,如图5.3.2.7:

图5.3.2.7

经过以上的分析已经知道,房价与地价、居民居民人均可支配收入均为二次函数关系。

设房价y 与地价1x ,居民居民人均可支配收入2x 满足如下关系:

2

2

32122110x x x x y ββββ+++= 公式6

使用MATLAB 作回归分析,取α=0.05得到表5.3.2.4(其他城市计算结果见附录一):

表5.3.2.4 武汉市房价回归分析结果 参数

参数估计 参数置信区间 0

β

-110166.48978 [-137440.46601 ,-82892.51356]

148.03401 [94.26050 ,201.80752] 2β

-112.43205 [-173.98737 ,-50.87673] 3β

-0.02424 [-0.03328 ,-0.01519] 4β

0.02912

[0.01351 ,0.04473]

0000

.02===p 3564.1052F 0.9996R

上表显示:武汉市房价y 的96.99%可由模型确定。F 值远远超过F 检验的

临界值,p 远小于α,则该模型从整体上看是可用的。同时可以看出,置信区间不包含零点。 由此可写出回归方程:

2

2

2

12102912.043205.11203401.14848978.110166x x x x y +-+-=

同理,求得各城市的计算结果,见附录

利用本模型预测未来房价的走势,作出表5.3.2.5:

表5.3.2.5 未来房价的走势

城市 房价 时间

2011年5月 2011年6月 2011年7月 北京 28205 37933 37426 上海 26576 20967 15272 重庆 8131 7600 7196 深圳 23523 23603 24502 福州 13620 13152 13207 大连 13406 12864 12692 武汉 8391 7874 7644 成都 9890 10224 11015 西宁

6248

6471

7201

可得到如下结论结论:北京房价持续走高,六月份过后,有一小的跌幅;上海房价短期内将持续下降;重庆房价短期内也将有所下降;深圳市房价短期内持续走高且走势强劲;福州短期房价有所波动,但波动不大;大连房价未来短期内有小幅下跌;武汉市未来短期内房价也有小幅下降;成都市房价未来短期内仍将持续上涨,且涨势强劲;西宁市房价未来短期内也将上涨,且涨势强劲。

六.结果分析

6.1房价的合理性分析

由模型一所得的各城市的房价合理性的组合权向量,比较向量中各元素的数值大小,即可说明各城市房价的合理性情况,以下对各城市房价的合理性及产生房价不合理的原因做简要分析:

1.直辖市

北京、上海和重庆房价合理性组合权向量的总排序如下:

[]T w 3871

.04051.02078.01= []T w 3974.04162.01864.02= []T

w 1732

.04812.03356.03= 从以上结果来看,北京和上海虽然都呈现房价基本合理的情况,但两个城市房价不合理的权值均比房价合理的权值大,这表明这两个城市的房价合理性较差。而重庆市,房价基本合理的权值最大,房价合理的权值均比房价不合理的权值大,说明其房价合理性较好。

北京市带有我国地广人多、人均占地不足的普遍特点,土地的稀缺使得土地获得成本提高,无疑会带来住房建造成本的增加,推动房价提高:另一方面,住房需求随着人口增长而逾趋旺盛,而有限的住房供给使供需缺口显得尤为突出,进一步拉动了房价的提高。而且北京市作为全国性的金融、政治,文化中心,具有其他地区所不具有的区位优势。房价自然会很高,以至于超出了大多数居民的承受能力,产生了房价不合理的情况。

上海是国际化的大都市,是中国经济发展的前沿,具有得天独厚的地理优势,东临海滨,自然环境优越,交通便捷,水陆空都相当发达。上海的这些优势使很多外国投资者选择上海投资和居住,增加了上海房地产的需求量,是导致上海房市居高不下的根本原因之一。上海是全国的金融中心、航运中心,使得很多人定居上海发展的基础。在市场经济调节过程中,市场供给相对于市场需求的不足,使得房价一路攀升。因此,国家适时地进行宏观调控,然而宏观调控仍然难以解决房地产价格过高的现状。追其原因即为上文提出的两点原因:一是资源的稀缺;而是国内外人口涌入上海导致了需求的增加。

重庆的房价和别的一线城市比并不高,但居民都有房价不合理的呼声,我们必须认识到评价一个地方的房价,必须看它是否和当地居民当月的收入水平持平。最近4年来,重庆房价都是以10%左右的比例在增加,没有暴涨暴跌。从总体上看,重庆的房地产市场价格和投资规模都是适中的,房地产投资构架是没有问题的。未来两到三年,重庆房价会持续地缓慢增长,但不会暴涨暴跌。由此看

出重庆市的房价是较合理的。

2.沿海开放城市

深圳、福州和大连房价合理性组合权向量的总排序如下:

[]T w 2061

.04757.03182.04= []T w 1374.04553.04073.05= []T

w 1395

.04253.04052.06= 从结果来看,三个城市房价都较为合理,仅有深圳房价合理的权重最小,房价不合理的权重最大,这表明相较而言,深圳市的房价的合理性较差。

深圳市位于中国南方珠江三角洲东岸,是中国第一个经济特区,它与香港陆地相连。在国家政策倾斜下,历经30年深圳从一个南疆边陲小镇发展成为现代国际化城市,创造了世界城市化、工业化和现代化的奇迹。深圳是中国口岸最多和惟一拥有海陆空口岸的城市,是中国与世界交往的主要门户之一,有着强劲的经济支撑与现代化的城市基础设施。虽然政府对炒楼行为有明显遏制,但房价仍在上涨,这更多是因为房地产市场存在供求总量与结构上不够平衡导致的,这也是深圳房价不合理的重要原因。

对于福州而言,福州市平均工资水平偏低,而部分楼盘商品房价格显得过高。但也要看到,福州是省会中心城市,这里的生态环境比较好,2010年7月被中国环境规划院评为“最宜居城市”,有大批来自国外、台湾地区和大陆其他省市的客商看中这块“福地”,纷纷在福州购房置业,这在一定程度上推动了福州高价商品房市场的发展,导致福州房价水平提高,超出了工资收入水平。但这并不影响其房价的合理性,福州市积极稳妥的调控政策,使得福州房地产业健康稳定发展,房价保持着一定的合理性。

大连,位于欧亚大陆东岸,中国东北辽东半岛最南端,西北濒临渤海,东南面向黄海,全国14个沿海开放城市之一,是中国辽宁省的一个重要沿海港口城市,省内第二大城市,是中国东北主要的对外门户;也是东北亚重要的国际航运中心、国际物流中心、区域性金融中心。经过多年的发展,大连已成为我国最具开放色彩的城市之一。因此发地产中出现的一些问题也比较正常,房价总体而言较为合理。

3.一般省会城市

武汉、成都和西宁房价合理性组合权向量的总排序如下:

[]T w 1972

.04552.03476.07= []T w 1368.04255.04377.08= []T

w 1751

.04034.04215.09= 从结果来看,三个城市房价都较合理,由于同属内陆城市,经济不如其他一线城市发达,人均收入水平较低,消费水平低,因此房价均较低

武汉是华中地区最大都市及中心城市,长江中下游特大城市之一,华中地区的最大城市和区域中心城市,中国重要的工业基地、科教基地和综合交通枢纽,也是国家重点建设的工业城市,拥有门类齐全、配套能力强的特点。有关专家指出,我国中部崛起战略将加快武汉中心城市地位的提升,也为武汉的房地产业提供了更多的商机。武汉相应着中央“中部崛起”的号召,正快速的发展,房地产发展也较迅速,正逐布满足城市居民的住房需求。

成都刚刚被国家批准为新特区,其经济发展后劲充足;再加上成都良好的人文环境,使得在成都进行投资成为热点,这带动了成都的房价上涨。有数据表明,购买成都的房子有一半是外地人,他们普遍看好成都的经济发展;而且成都人讲究休闲,舒适,市民本身就有改善居住环境的要求,这就加强了购房的刚性需求。城市魅力不断扩散,成都房价上涨就是自然而然的事了。随着地铁1号线的建设与贯通,2号线的正式开工,成都市中心物业还可能迎来更大规模的升值浪潮。但就目前的情况来看,成都的房价是合理的。

西宁市是青海省省会,西宁地处青海东部,国家实施“西部大开发”战略以来,西宁的社会经济发展迅速,这为房价上涨营造了前提条件。近年来,房地产市场需求旺盛,得益于居民收入增加、购买力增强,社会整体经济水平提高促进了市场的繁荣。投资型需求加速房价上涨,住房既具有经久性、单件性、固定性等自然属性,又具有满足人们居住和财富增值的社会属性,投资型需求势必追高价格。今后,西宁房地产市场的潜在需求仍然很大,居民收入水平将保持增长,带动购房能力的提高,今后房价还会上涨。但是,违背经济规律,盲目炒作的涨价不会发生;受政府宏观调控、结构调整、规范市场,及消费者理性消费等条件的制约,西宁的房产市场会更加稳定健康的发展,房价涨幅将趋于平缓。这与其房价合理的论断是相符合的。

综上所述,我们得出结论,经济发达,地理环境优越的城市房价普遍较高,且存在很多房价不合理的因素,房价合理性较差;而其他经济欠发达,地理条件不太优越的城市,房价较低,能被大部分的城市居民接受,房价合理性较好。

6.2房价未来走势预测的分析

为了检验模型二结果的准确性,我们收集了刚刚公布的各城市5月份的房价。将预测值与实际值对比计算得,各城市的预测房价与实际房价的误差,制成表6.2.1:

表6.2.1 房价误差表

北京上海重庆深圳福州大连武汉成都西宁市

5.27% -11.32 -1.58% -2.18% 7.45% 0.92% -2.32% 0.75% 1.71% 差

上表说明总体上房价的预测值与实际值相差不大,该模型在房价的短期预测方面具有一定的可行性。但是,针对上海、福州、北京等城市预测不够精准的情况,我们作了细致分析后认为,像上海、福州、北京等发达城市有着人口流动性大,房价泡沫相对其他城市大,受炒作因素大等因素的影响,从而导致预测结果与实际有所偏差。

七.使房价合理的措施,以及可能对经济发展产生的影响

7.1使房价合理的具体措施

通过分析模型求解得出的结论,我们了解到,各类城市的房价都有不合理的方面,由此我们总结归纳了房价不合理的原因,并这对这些原因,提出几点改善房价和理性的具体措施。

1.调整社会保障性住房供给方式

经济适用房本是我国政府的一项“民心”工程,旨在平抑房价,鼓励购房,解决中低收入家庭的住房问题。这一制度在实践中也的确给部分群众带来了实惠,但由于政策界限不清,销售目标就难免错位。在实际操作中,核实和计算收入的标准缺乏可操作性,资格认定存在多重标准,使得经济适用房的消费群体不当的扩大,出现了高收入者与中低收入者争相抢购的局面。

为此政府应该调整社会保障性住房的供给方式,经济适用房作为面向低收入者的具有一定福利性质的住房,其标准不宜过高。可降低公房建筑面积,降低装修成本,使其仅能满足基本的居住需求但谈不上舒适。这样的住房条件自然不会引起高收入者的兴趣,也就间接解决了资格鉴定和搭便车的问题。

2.强化公共住房体制

从国外的经验来看,公共住房体制是现有的解决城市住房问题的必不可少的手段。一般来说,低收入家庭的家庭资产不足以支持一次性购买住房这类高价值的不动产,即使使用补贴手段降低房价,住房的总价仍然超出他们的支付能力。

因此政府应该采取租赁的形式将福利性住房提供给低收入者,投入资金兴建公房并以低租金出租给住房保障对象;另有一种做法是对半公营或微利私营组织提供利率或者贷款补贴,使其兴建针对低收入住户的可出租房屋,并以优惠低廉的房租提供给低收入者。无论是哪种做法,其顺利运作的前提都是建立严格的享受补贴资格认定标准和制度,并明确落实公房的金融财政支持政策,保证有足够的资金来源。我国的经济适用房制度要改变只售不租的提供方式,其次是对于福利性住房的享受者的资格认定制度和标准要完善。只有解决了公共住房问题,才能保证商品住宅市场的健康发展,才不会出现望房兴叹和对房价过高的怨言。

3.利用货币政策及财政政策抑制住房市场过热的可能

利用房地产信贷政策,这一政策的重要作用在于防止房地产泡沫冲击银行体系,并抑制房价非理性上涨。在房价暴涨时,人们的投机行为会将房价越拾越高,而银行发放的贷款质量会随之急剧下降并转化为银行风险,从而导致对银行体系的冲击。因此,对住房信贷采取一定得控制手段,能够将投机行为控制在可接受范围内,并平抑房价。

4.从机制上完善商品住宅市场

要完善信息披露机制,商品住宅市场具有垄断性质,一方面的原因就是信息不对称,购房者高度分散,在市场上处于竞争弱势,在这种情况下,如何使消费者建立起理性的价格预期并保证房价保持在健康水平上就成了一个重要的问题。为了保护购房者的利益,使商品住宅市场健康运转,政府必须对房地产企业

实行强制信息披露政策,并且建立专门机构监督房价成本;也可以考虑由政府出面支持独立的高水平的房地产研究机构,尽可能提供客观和准确地房价信息。

5.完善土地利用机制

高价地段兴建起往往是利润价格更高的高档住宅或者别墅,从而出现高档住宅供过于求,普通住宅供不应求的结构性失调现象,并导致价格的不合理。导致这种现象的原因就在于土地利用机制不合理,没有有效分格开商品住宅的高、中、低档市场。如果在城市规划方案中明确规定不同地块的住宅档次分配,在高、中、低不同的住宅细分市场上分别展开竞争,就能够在保护市场竞争机制的同时保护不同收入组别居民的住房权利,并解决住房供给结构性失调,并平抑对于住房价格不合理的呼声。

7.2房价合理性对经济的影响

住宅价格问题一直受到全国的关注,过高的房价对经济的发展、社会的稳定都造成很大影响,以下就不合理的房价对经济的负面影响做简要分析:

1.抑制居民有效消费需求

现行的高房价几乎掏空了中下阶层城市居民的腰包,严重地抑制了国内有效消费需求。中国经济增长模式已经由投资与外贸为主转向投资、外贸与内需并举是必然趋势,投资和外贸的增长空间由于资源有限性和受到他国牵制而相当有限,因而启动内需是政府的必然选择。

2.影响产业结构调整

因为房地产业的高额利润,其他行业的顶级企业都把资金转向投入到房地产。这造成了社会资金过度集中于房地产业,其他行业的发展势必受到影响,有碍于产业结构的调整。住房价格较高,居民购买力偏重于购房消费,引起城市产业向房地产不适当地倾斜,使得对其他产品的购买力增长缓慢甚至下降,不仅影响城市的合理消费结构。而且不利于扩大内需、不利于发展服务业等其他产业。最终不利于建立合理的产业结构。

3.增加了地区和居民之间的贫富差距

房价的快速增长加剧了地区之间和居民之间的贫富差距。当前,我国的收入分配的不平等状况表现很严重,而房价的升高,特别是像北京这样的大城市房价增长迅速,这就意味财富以货币和固定资产的形式向经济发达、居住环境好的地区集聚,在向少数收入高的人。低收入的居民收入的增长赶不上房价的增长,住房支付的能力正在下降.很多人被挡在住房市场之外。

4.助推通货膨胀.削弱企业竞争力

国内房地产价格的连年持续高速攀升.对我国最近几年来的通货膨胀起到很大的助推作用。房地产市场是一种典型的垄断竞争市场,房地产商为获得高额垄断利润,大建高档豪华公寓和写字楼,压缩经济适用房和普通住宅的投资建设规模。发布虚假市场供求信息,一定程度上造成房地产价格大幅攀升,从而一方

面通过产业链的作用导致以房屋和办公楼为生产要素的下游产业,如零售、金融、法律、保健、信息等服务业的生产成本急剧增加。另一方面,由于企业支付工人工资中的租房或住房补贴的增加而导致企业生产成本的直接上升。从而推动了价格总水平的上涨,同时也削弱了企业的竞争力。

八.模型评价

问题一中所使用的是层次分析模型,在已知信息比较少的情况下,能使决策思维过程数学化,从而对多准则的比较复杂的决策问题提供了一种解决方法。最大的优点在于思路清晰,步骤简单。但是同样存在着缺点,那就是主观性太强。

问题二中所使用的回归模型能够清晰地体现房价和各影响因素的数学关系。我们所预测的5月份房价除少数发达城市以外,与最近公布的5月房价基本吻合,说明该模型有一定的应用价值。但是,该模型只能用于短期预测,对于长期预测效果欠佳。

九.参考文献

【1】伍凌宇,李朝鲜,北京市商品住宅价格合理性探讨,万方数据库,2011年5月

【2】国家统计局网站,https://www.360docs.net/doc/507002077.html,/,2011年5月14日【3】搜房网,https://www.360docs.net/doc/507002077.html,/,2011年5月14日

【4】中国城市地价网,https://www.360docs.net/doc/507002077.html,/,2011年5月14日

【5】姜启源,谢金星,叶俊,数学模型,北京:高等教育出版社,2003年

【6】邬学军,周凯,宋军全,数学建模竞赛辅导教程,浙江大学出版社,2009年8月

十.附录

附表一 北京市房价回归分析结果 参数

参数估计 参数置信区间 0β 215249.5905 [-271185.8595 ,701685.0405]

1β -42.9553 [-138.1075 ,52.1970] 2β

58.5633 [-82.3335 ,199.4602] 3β 0.0017 [-0.0022 ,0.0055] 4β

-0.0103

[-0.0372 ,0.0167]

823.702=R 927.44=F 0353.0p =

附表二 上海市房价回归分析结果

参数

参数估计 参数置信区间 0β

-5952368.9430 [-11538605.1600 , -366132.7247]

90.0687 [-36.5375 ,216.6749] 2β

3436.1784 [147.6939 ,6724.6629] 3β -0.0022 [-0.0053 ,0.0009] 4β

-0.5832

[-1.1466 ,-0.0199]

493.902

=R 938.323=F 0020.0p =

附表三 重庆市房价回归分析结果

参数

参数估计 参数置信区间

0β -9015.9230 [-20437.4517 ,2405.6056]

1β 13.1394 [6.7486 ,19.5302] 2β

-7.3749 [-16.8399 ,2.0901] 3β -0.0018 [-0.0029 ,-0.0006] 4β

0.0020

[-0.0004 ,0.0044]

997.902=R 888.94297=F 0000.0p =

参数

参数估计 参数置信间区

0β -93953.7236 [-260015.5905 ,72108.1432]

1β 0.0277 [-20.8622 ,20.9178] 2β

66.6043 [-1.3905 ,134.5990] 3β 0.0000 [-0.0005 ,0.0006] 4β

-0.0106

[-0.0229 ,0.0016]

981.902=R 597.0653=F 0000.0p =

附表五 福州市房价回归分析结果

福州

参数

参数估计 参数置信区间

0β 84933.8087 [15547.3872 ,154320.2302]

-0.0176 [-0.3746 ,0.3394] 2β

-78.1820

[-147.5324 ,-8.8316] 3β 0 [5-109.02-? ,5-107.92?] 4β

0.0206

[0.0035 ,0.03777]

957.902=R 131.2287=F 0000.0p =

附表六 大连市房价回归分析结果

参数

参数估计 参数置信区间

0β -104807.5394 [-230033.2216 , 20418.1427] 1β 97.5849 [-19.1735 , 214.3432] 2β

-0.7641 [19.5325 , 18.0041] 3β -0.0209 [-0.0470 , 0.0053] 4β

0.0011

[-0.0034 , 0.0056]

986.902=R 862.5874=F 0000.0p =

相关分析与回归分析的异同

问:请详细说明相关分析与回归分析的相同与不同之处 相关分析与回归分析都是研究变量相互关系的分析方法,相关分析是回归分析的基础,而回归分析则是认识变量之间相关程度的具体形式。 下面分为三个部分详细描述两种分析方法的异同: 第一部分:相关分析 一、相关的含义与种类 (一)相关的含义 相关是指自然与社会现象等客观现象数量关系的一种表现。 相关关系是指现象之间确实存在的一定的联系,但数量关系表现为不严格相互依存关系。即对一个变量或几个变量定一定值时,另一变量值表现为在一定范围内随机波动,具有非确定性。如:产品销售收入与广告费用之间的关系。 (二)相关的种类 1. 根据自变量的多少划分,可分为单相关和复相关 2. 根据相关关系的方向划分,可分为正相关和负相关 3. 根据变量间相互关系的表现形式划分,线性相关和非线性相关 4.根据相关关系的程度划分,可分为不相关、完全相关和不完全相关 二、相关分析的意义与内容 (一)相关分析的意义 相关分析是研究变量之间关系的紧密程度,并用相关系数或指数来表示。其目的是揭示现象之间是否存在相关关系,确定相关关系的表现形式以及确定现象变量间相关关系的密切程度和方向。 (二)相关分析的内容 1. 明确客观事物之间是否存在相关关系 2. 确定相关关系的性质、方向与密切程度 三、直线相关的测定 (一)相关表与相关图 1. 相关表 在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称为相关表。 2. 相关图

把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为相关图。利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。 (二)相关系数 1. 相关系数的含义与计算 相关系数是直线相关条件下说明两个变量之间相关关系密切程度的统计分析指标。相关系数的理论公式为: y x xy r δδδ2= (1)xy 2δ 协方差 x δ x 的标准差 y δ y 的标准差 (2)xy 2δ 协方差对相关系数r 的影响,决定:???<>数值的大小正、负)或r r r (00 简化式 ()()2222∑∑∑∑∑∑∑-?--= y y n x x n y x xy n r 变形:分子分母同时除以2 n 得 r =???????????? ??-???????????? ??-?-∑∑∑∑∑∑∑2222n y n y n x n x n y n x n xy =()[]()[]2222y y x x y x xy -*-?-=y x y x xy δδ-?- n x x x ∑-=2)(δ=()[]n x x x x ∑+?-222=()222x n x x n x +??-∑∑ = () 22x x - 2. 相关系数的性质

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

层次分析法模型

二、模型的假设 1、假设我们所统计和分析的数据,都是客观真实的; 2、在考虑影响毕业生就业的因素时,假设我们所选取的样本为简单随机抽样,具有典型性和普遍性,基本上能够集中反映毕业生就业实际情况; 3、在数据计算过程中,假设误差在合理范围之内,对数据结果的影响可以忽略. 三、符号说明

四、模型的分析与建立 1、问题背景的理解 随着我国改革开放的不断深入,经济转轨加速,社会转型加剧,受高校毕业生总量的增加,劳动用工管理与社会保障制度,劳动力市场的不尽完善,以及高校的毕业生部分择业期望过高等因素的影响,如今的毕业生就业形势较为严峻.为了更好地解决广大学生就业中的问题,就需要客观地、全面地分析和评价毕业生就业的若干主要因素,并将它们从主到次依秩排序. 针对不同专业的毕业生评价其就业情况,并给出某一专业的毕业生具体的就业策略. 2、方法模型的建立 (1)层次分析法 层次分析法介绍:层次分析法是一种定性与定量相结合的、系统化、层次化的分析方法,它用来帮助我们处理决策问题.特别是考虑的因素较多的决策问题,而且各个因素的重要性、影响力、或者优先程度难以量化的时候,层次分析法为我们提供了一种科学的决策方法. 通过相互比较确定各准则对于目标的权重,及各方案对于每一准则的权重.这些权重在人的思维过程中通常是定性的,而在层次分析法中则要给出得到权重的定量方法. 我们现在主要对各个因素分配合理的权重,而权重的计算一般用美国运筹学

家T.L.Saaty 教授提出的AHP 法. (2)具体计算权重的AHP 法 AHP 法是将各要素配对比较,根据各要素的相对重要程度进行判断,再根据计算成对比较矩阵的特征值获得权重向量k W . Step1. 构造成对比较矩阵 假设比较某一层k 个因素12,,,k C C C 对上一层因素ο的影响,每次两个因素i C 和j C ,用ij C 表示i C 和j C 对ο的影响之比,全部比较结果构成成对比较矩阵C ,也叫正互反矩阵. *()k k ij C C =, 0ij C >,1 ij ji C C =, 1ii C =. 若正互反矩阵C 元素成立等式:* ij jk ik C C C = ,则称C 一致性矩阵. 标度ij C 含义 1 i C 与j C 的影响相同 3 i C 比j C 的影响稍强 5 i C 比j C 的影响强 7 i C 比j C 的影响明显地强 9 i C 比j C 的影响绝对地强 2,4,6,8 i C 与j C 的影响之比在上述两个相邻等级之间 11 ,,29 i C 与j C 影响之比为上面ij a 的互反数 Step2. 计算该矩阵的权重 通过解正互反矩阵的特征值,可求得相应的特征向量,经归一化后即为权重向量 12 = [ , ,..., ]T k k k kk Q q q q ,其中的ik q 就是i C 对ο的相对权重.由特征方程 A-I=0λ,利用Mathematica 软件包可以求出最大的特征值 max λ 和相应的特征向 量. Step3. 一致性检验 1)为了度量判断的可靠程度,可计算此时的一致性度量指标CI :

一元线性回归模型案例分析

一元线性回归模型案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

简述回归分析的概念与特点

简述回归分析的概念与特点 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 方差齐性 线性关系 效应累加 变量无测量误差 变量服从多元正态分布 观察独立 模型完整(没有包含不该进入的变量、也没有漏掉应该进入的变量) 误差项独立且服从(0,1)正态分布。 现实数据常常不能完全符合上述假定。因此,统计学家研究出许多的回归模型来解决线性回归模型假定过程的约束。 研究一个或多个随机变量Y1 ,Y2 ,…,Yi与另一些变量X1、X2,…,Xk之间的关系的统计方法。又称多重回归分析。通常称Y1,Y2,…,Yi为因变量,X1、X2,…,Xk为自变量。回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型。最简单的情形是一个自变量和一个因变量,且它们大体上有线性关系,这叫一元线性回归,即模型为Y=a+bX+ε,这里X是自变量,Y是因变量,ε是随机误差,通常假定随机误差的均值为0,方差为σ^2(σ^2大于0)σ2与X的值无关。若进一步假定随机误差遵从正态分布,就叫做正态线性模型。一般的情形,差有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由自变量的影响,即表示为自变量的函数,其中函数形式已知,但含一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。当函数形式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时,称为非线性回归分析模型。当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。 回归分析的主要内容为:①从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。②对这些关系式的可信程度进行检验。③在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。④利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。

回归分析方法及其应用中的例子

3.1.2 虚拟变量的应用 例3.1.2.1:为研究美国住房面积的需求,选用3120户家庭为建模样本,回归模型为: 123log log P Y βββ++logQ= 其中:Q ——3120个样本家庭的年住房面积(平方英尺) 横截面数据 P ——家庭所在地的住房单位价格 Y ——家庭收入 经计算:0.247log 0.96log P Y -+logy=4.17 2 0.371R = ()() () 上式中2β=0.247-的价格弹性系数,3β=0.96的收入弹性系数,均符合经济学的常识,即价格上升,住房需求下降,收入上升,住房需求也上升。 但白人家庭与黑人家庭对住房的需求量是不一样的,引进虚拟变量D : 01i D ?=?? 黑人家庭 白人家庭或其他家庭 模型为:112233log log log log D P D P Y D Y βαβαβα+++++logQ= 例3.1.2.2:某省农业生产资料购买力和农民货币收入数据如下:(单位:十亿元) ①根据上述数据建立一元线性回归方程:

? 1.01610.09357y x =+ 20.8821R = 0.2531y S = 67.3266F = ②带虚拟变量的回归模型,因1979年中国农村政策发生重大变化,引入虚拟变量来反映农村政策的变化。 01i D ?=?? 19791979i i <≥年 年 建立回归方程为: ?0.98550.06920.4945y x D =++ ()() () 20.9498R = 0.1751y S = 75.6895F = 虽然上述两个模型都可通过显着性水平检验,但可明显看出带虚拟变量的回归模型其方差解释系数更高,回归的估计误差(y S )更小,说明模型的拟合程度更高,代表性更好。 3.5.4 岭回归的举例说明 企业为用户提供的服务多种多样,那么在这些服务中哪些因素更为重要,各因素之间的重要性差异到底有多大,这些都是满意度研究需要首先解决的问题。国际上比较流行并被实践所验证,比较科学的方法就是利用回归分析确定客户对不同服务因素的需求程度,具体方法如下: 假设某电信运营商的服务界面包括了A1……Am 共M 个界面,那么各界面对总体服务满意度A 的影响可以通过以A 为因变量,以A1……Am 为自变量的回归分析,得出不同界面服务对总体A 的影响系数,从而确定各服务界面对A 的影响大小。 同样,A1服务界面可能会有A11……A1n 共N 个因素的影响,那么利用上述方法也可以计算出A11……A1n 对A1的不同影响系数,由此确定A1界面中的重要因素。 通过两个层次的分析,我们不仅得出各大服务界面对客户总体满意度影响的大小以及不同服务界面上各因素的影响程度,同时也可综合得出某一界面某一因素对总体满意度的影响大小,由此再结合用户满意度评价、与竞争对手的比较等因素来确定每个界面细分因素在以后工作改进中的轻重缓急、重要性差异等,从而起到事半功倍的作用。 例 3.5.4:对某地移动通信公司的服务满意度研究中,利用回归方法分析各服务界面对总体满意度的影响。 a. 直接进入法 显然,这种方法计算的结果中,C 界面不能通过显着性检验,直接利用分析结果是错误

多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

, 设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年 年份 @ 人口自然增长率 (%。) 国民总收入 (亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15037 1366 1989 … 17001 18 1519 1990 18718 1644 1991 【 21826 1893 1992 26937 2311 1993 . 35260 2998 1994 48108 4044 1995 — 59811 5046 1996 70142 5846 1997 ~ 78061 6420 1998 83024 6796 1999 【 88479 7159 2000 98000 7858 2001 [ 108068 8622 2002 119096 9398 2003 : 135174 10542 2004 159587 12336 2005 、 184089 14040 2006 213132 16024

数学建模之层次分析法

第四讲层次分析法 在现实世界中,往往会遇到决策的问题,比如如何选择旅游景点的问题,选择升学志愿的问题等等。在决策者作出最后的决定以前,他必须考虑很多方面的因素或者判断准则,最终通过这些准则作出选择。 比如选择一个旅游景点时,你可以从宁波、普陀山、浙西大峡谷、雁荡山和楠溪江中选择一个作为自己的旅游目的地,在进行选择时,你所考虑的因素有旅游的费用、旅游地的景色、景点的居住条件和饮食状况以及交通状况等等。这些因素是相互制约、相互影响的。我们将这样的复杂系统称为一个决策系统。这些决策系统中很多因素之间的比较往往无法用定量的方式描述,此时需要将半定性、半定量的问题转化为定量计算问题。层次分析法是解决这类问题的行之有效的方法。层次分析法将复杂的决策系统层次化,通过逐层比较各种关联因素的重要性来为分析、决策提供定量的依据。 一、建立系统的递阶层次结构 首先要把问题条理化、层次化,构造出一个有层次的结构模型。一个决策系统大体可以分成三个层次: (1) 最高层(目标层):这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果; (2) 中间层(准则层):这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则; (3) 最低层(方案层):这一层次包括了为实现目标可供选择的各种措施、决策方案等。 比如旅游景点问题,我们可以得到下面的决策系统: 目标层——选择一个旅游景点 准则层——旅游费用、景色、居住、饮食、交通 方案层——宁波、普陀山、浙西大峡谷、雁荡山、楠溪江 二、构造成对比较判断矩阵和正互反矩阵 在确定了比较准则以及备选的方案后,需要比较若干个因素对同一目标的影响,从额确定它们在目标中占的比重。如旅游问题中,五个准则对于不同决策者在进行决策是肯定会有不同的重要程度,而不同的方案在相同的准则上也有不同的适合程度表现。层次结构反映了因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的

案例分析 一元线性回归模型

案例分析报告 (2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 2204120202 学生姓名:陈维维 2014 年 11月 案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,?最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定?

我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模型。因此建立的是2008年截面数据模型。影响各地区城镇居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。 为了与“城镇居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 以下是2008年各地区城镇居民人均年消费支出和可支配收入表

层次分析法模型

二、模型的假设 1、假设我们所统计与分析的数据,都就是客观真实的; 2、在考虑影响毕业生就业的因素时,假设我们所选取的样本为简单随机抽样,具有典型性与普遍性,基本上能够集中反映毕业生就业实际情况; 3、在数据计算过程中,假设误差在合理范围之内,对数据结果的影响可以忽略、 三、符号说明

四、模型的分析与建立 1、问题背景的理解 随着我国改革开放的不断深入,经济转轨加速,社会转型加剧,受高校毕业生总量的增加,劳动用工管理与社会保障制度,劳动力市场的不尽完善,以及高校的毕业生部分择业期望过高等因素的影响,如今的毕业生就业形势较为严峻、为了更好地解决广大学生就业中的问题,就需要客观地、全面地分析与评价毕业生就业的若干主要因素,并将它们从主到次依秩排序、 针对不同专业的毕业生评价其就业情况,并给出某一专业的毕业生具体的就业策略、 2、方法模型的建立 (1)层次分析法 层次分析法介绍:层次分析法就是一种定性与定量相结合的、系统化、层次化的分析方法,它用来帮助我们处理决策问题、特别就是考虑的因素较多的决策问题,而且各个因素的重要性、影响力、或者优先程度难以量化的时候,层次分析法为我们提供了一种科学的决策方法、 通过相互比较确定各准则对于目标的权重,及各方案对于每一准则的权重、这些权重在人的思维过程中通常就是定性的,而在层次分析法中则要给出得到权重的定量方法、 我们现在主要对各个因素分配合理的权重,而权重的计算一般用美国运筹学家T、L、Saaty教授提出的AHP法、 (2)具体计算权重的AHP 法 AHP法就是将各要素配对比较,根据各要素的相对重要程度进行判断,再根据 W、 计算成对比较矩阵的特征值获得权重向量 k

第三章回归分析原理

第三章 回归分析原理 3·1、一元线性回归数学模型 按理说,在研究某一经济现象时,应该尽量考虑到与其有关各种有影响的因素或变量。但作为理论的科学研究来说,创造性地简化是其的基本要求,从西方经济学的基本理论中,我们可以看到在一般的理论分析中,至多只包含二、三个 变量的数量关系的分析或模型。 这里所讨论的一元线性回归数学模型,是数学模型的最简单形式。当然要注意的是,这里模型讨论是在真正回归意义上来进行的,也可称之为概率意义上的线性模型。 在非确定性意义上,或概率意义上讨论问题,首先要注意一个最基本的概念或思路问题,这就是总体和样本的概念。 我们的信念是任何事物在总体上总是存在客观规律的,虽然我们无论如何也不可能观察或得到总体,严格说来,总体是无限的。而另一方面,我们只可能观察或得到的是样本,显然样本肯定是总体的一部分,但又是有限的。 实际上概率论和数理统计的基本思想和目的,就是希望通过样本所反映出来的信息来揭示总体的规律性,这种想法或思路显然存在重大的问题。但另一方面,我们也必须承认,为了寻找总体的规律或客观规律,只能通过样本来进行,因为我们只可能得到样本。 在前面我们已经知道,用回归的方法和思路处理非确定性问题或散点图,实际上存在一些问题,亦即只有在某些情况下,回归的方法才是有效的。因此,在建立真正回归意义上建立其有效方法时,必须作出相应的假设条件。 基本假设条件: (1)假设概率函数)|(i i X Y P 或随机变量i Y 的分布对于所有i X 值,具有相同的方差2σ ,且2σ 是一个常数,亦即)(i Y Var =)(i Var μ=2σ。 (2)假设i Y 的期望值)(i Y E 位于同一条直线上,即其回归直线为 )(i Y E =i X βα+ 等价于 0)(=i E μ 这个假设是最核心的假设,它实际上表明)(i Y E 与i X 之间是确定性的关系。 (3)假设随机变量i Y 是完全独立的,亦即。j i u u Cov Y Y Cov j i j i ≠==,0),(),(

(完整版)基于层次分析法的模糊综合评价模型

2016江西财经大学数学建模竞赛 A题 城市交通模型分析 参赛队员: 黄汉秦、乐晨阳、金霞 参赛队编号:2016018 2016年5月20日~5月25日

承诺书 我们仔细阅读了江西财经大学数学建模竞赛的竞赛章程。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C中选择一项填写): A 我们的参赛队编号为2016018 参赛队员(打印并签名) : 队员1. 姓名专业班级计算机141 队员2. 姓名专业班级计算机141 队员3. 姓名专业班级计算机141 日期: 2016 年 5 月 25 日

编号和阅卷专用页 江西财经大学数学建模竞赛组委会 2016年5月15日制定

城市交通模型分析 摘要 随着国民经济的高速发展和城市化进程的加快,我国机动车保有量及道路交通流量急剧增加,交通出行结构发生了根本变化,城市道路交通拥挤堵塞问题已成为制约经济发展、降低人民生活质量、削弱经济活力的瓶颈之一。本篇论文针对道路拥挤的问题采用层次分析法进行数学建模分析,讨论拥堵的深层次问题及解决方案。 首先建立绩效评价指标的层次结构模型,确定了目标层,准则层(一级指标),子准则层(二级指标)。 其次,建立评价集V=(优,良,中,差)。对于目标层下每个一级评价指标下相对于第m 个评价等级的隶属程度由专家的百分数u 评判给出,即U =[0,100]应用模糊统计建立它们的隶属函数A(u), B(u), C(u) ,D(u),最后得出目标层的评价矩阵Ri ,(i=1,2,3,4,5)。利用A,B 两城相互比较法,根据实际数据建立二级指标对于相应一级指标的模糊判断矩阵P i (i=1,2,3,4,5) 然后,我们经过N 次试验调查,明确了各层元素相对于上层指标的重要性排序,构造模糊判断矩阵P ,利用公式 1 ,ij ij n kj k u u u == ∑ 1 ,n i ij j w u ==∑ 1 ,i i n j j w w w == ∑ []R W R W R W R W R W W R W O 5 5 4 4 3 3 2 2 1 1 ,,,,==计算出权重值,经过一致性检验公式 RI CI CR = 检验后,均有0.1CR <,由此得出各层次的权向量()12,,T n W W W W =K 。然后后, 给出建立绩效评价模型(其中O 是评价结果向量),应用模糊数学中最大隶属度原则,对被评价城市交通的绩效进行分级评价。 接着在改进方案中,我们具体以交叉口为中心建立模型,其中包括道路长度、宽度、车辆平均长度、车速等等考虑因素。通过车辆排队长度可以间接判断交通拥堵情况,不需要测量车速、时间等因素而浪费的人力物力和财力,有效的提高了工作成本和效率。为管理城市交通要道提供了良好的模型和依据。 【关键字】交通拥堵 层次分析法 模糊综合评判 绩效评价 隶属度

层次分析法的计算步骤

8.3.2 层次分析法的计算步骤 一、建立层次结构模型 运用AHP进行系统分析,首先要将所包含的因素分组,每一组作为一个层次,把问题条理化、层次化,构造层次分析的结构模型。这些层次大体上可分为3类 1、最高层:在这一层次中只有一个元素,一般是分析问题的预定目标或理想结果,因此又称目标层; 2、中间层:这一层次包括了为实现目标所涉及的中间环节,它可由若干个层次组成,包括所需要考虑的准则,子准则,因此又称为准则层; 3、最底层:表示为实现目标可供选择的各种措施、决策、方案等,因此又称为措施层或方案层。 层次分析结构中各项称为此结构模型中的元素,这里要注意,层次之间的支配关系不一定是完全的,即可以有元素(非底层元素)并不支配下一层次的所有元素而只支配其中部分元素。这种自上而下的支配关系所形成的层次结构,我们称之为递阶层次结构。 递阶层次结构中的层次数与问题的复杂程度及分析的详尽程度有关,一般可不受限制。为了避免由于支配的元素过多而给两两比较判断带来困难,每层次中各元素所支配的元素一般地不要超过9个,若多于9个时,可将该层次再划分为若干子层。 例如,大学毕业的选择问题,毕业生需要从收入、社会地位及发展机会方面考虑是否留校工作、读研究生、到某公司或当公务员,这些关系可以将其划分为如图8.1所示的层次结构模型。 图8.1 再如,国家综合实力比较的层次结构模型如图6 .2: 图6 .2 图中,最高层表示解决问题的目的,即应用AHP所要达到的目标;中间层表示采用某种措施和政策来实现预定目标所涉及的中间环节,一般又分为策略层、约束层、准则层等;最低层表示解决问题的措施或政策(即方案)。 然后,用连线表明上一层因素与下一层的联系。如果某个因素与下一层所有因素均有联系,那么称这个因素与下一层存在完全层次关系。有时存在不完全层次关系,即某个因素只与下一层次的部分因素有联系。层次之间可以建立子层次。子层次从属于主层次的某个因素。它的因素与下一层次的因素有联系,但不形成独立层次,层次结构模型往往有结构模型表示。 二、构造判断矩阵 任何系统分析都以一定的信息为基础。AHP的信息基础主要是人们对每一层次各因素的相对重要性给出的判断,这些判断用数值表示出来,写成矩阵形式就是判断矩阵。判断矩阵是AHP工作的出发点,构造判断矩阵是AHP的关键一步。 当上、下层之间关系被确定之后,需确定与上层某元素(目标A或某个准则Z)相联系的下层各元素在上层元素Z之中所占的比重。 假定A层中因素Ak与下一层次中因素B1,B2,…,Bn有联系,则我们构造的判断矩阵如表8.16所示。 表8.16 判断距阵 Ak B1 B2 …Bn

第六章相关与回归分析方法

第六章 相关与回归分析方法 第一部分 习题 一、单项选择题 1.单位产品成本与其产量的相关;单位产品成本与单位产品原材料消耗量的相关 ( )。 A.前者是正相关,后者是负相关 B.前者是负相关,后者是正相关 C.两者都是正相关 D.两者都是负相关 2.样本相关系数r 的取值范围( )。 A.-∞<r <+∞ B.-1≤r ≤1 C. -l <r <1 D. 0≤r ≤1 3.当所有观测值都落在回归直线 01y x ββ=+上,则x 与y 之间的相关系数( )。 A.r =0 B.r =1 C.r =-1 D.|r|=1 4.相关分析与回归分析,在是否需要确定自变量和因变量的问题上( )。 A.前者无需确定,后者需要确定 B.前者需要确定,后者无需确定 C.两者均需确定 D.两者都无需确定 5.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是( )。 A.完全相关 B.微弱相关 C.无线性相关 D.高度相关 6.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x ,这意味着年劳动生产率每提高1千元时,工人工资平均( )。 A.增加70元 B.减少70元 C.增加80元 D.减少80元 7.下面的几个式子中,错误的是( )。 A. y= -40-1.6x r=0.89 B. y= -5-3.8x r =-0.94 C. y=36-2.4x r =-0.96 D. y= -36+3.8x r =0.98 8.下列关系中,属于正相关关系的有( )。 A.合理限度内,施肥量和平均单产量之间的关系 B.产品产量与单位产品成本之间的关系 C.商品的流通费用与销售利润之间的关系 D.流通费用率与商品销售量之间的关系 9.直线相关分析与直线回归分析的联系表现为( )。 A.相关分析是回归分析的基础 B.回归分析是相关分析的基础 C.相关分析是回归分析的深入 D.相关分析与回归分析互为条件 10.进行相关分析,要求相关的两个变量( )。 A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 11.相关关系的主要特征是( )。 A.某一现象的标志与另外的标志之间存在着确定的依存关系 B.某一现象的标志与另外的标志之间存在着一定的关系,但它们不是确定的关系 C.某一现象的标志与另外的标志之间存在着严重的依存关系 D.某一现象的标志与另外的标志之间存在着函数关系 12.相关分析是研究( )。 A.变量之间的数量关系 B.变量之间的变动关系 C.变量之间相互关系的密切程度 D.变量之间的因果关系 13.现象之间相互依存关系的程度越低,则相关系数( )。 A.越接近于0 B.越接近于-1 C.越接近于1 D.越接近于0.5 14.在回归直线01y x ββ=+中,若10 β<,则x 与y 之间的相关系数( )。 A. r=0 B. r=1 C. 0<r <1 D. —l <r <0 15.当相关系数r=0时,表明( )。 A.现象之间完全无关 B.相关程度较小

主成分分析法概念及例题

主成分分析法 主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法 [编辑] 什么是主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 [编辑] 主成分分析的基本思想

在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 [编辑] 主成分分析法的基本原理 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 [编辑] 主成分分析的主要作用

回归分析与相关分析联系 区别

回归分析与相关分析联系、区别?? 简单线性回归分析是对两个具有线性关系的变量,研究其相关性,配合线性回归方程,并根据自变量的变动来推算和预测因变量平均发展趋势的方法。 回归分析(Regression analysis)通过一个变量或一些变量的变化解释另一变量的变化。 主要内容和步骤:首先依据经济学理论并且通过对问题的分析判断,将变量分为自变量和因变量,一般情况下,自变量表示原因,因变量表示结果;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;接着要估计模型的参数,得出样本回归方程;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验,计量经济学检验、预测检验;当所有检验通过后,就可以应用回归模型了。 回归的种类 回归按照自变量的个数划分为一元回归和多元回归。只有一个自变量的回归叫一元回归,有两个或两个以上自变量的回归叫多元回归。 按照回归曲线的形态划分,有线性(直线)回归和非线性(曲线)回归。 相关分析与回归分析的关系 (一)相关分析与回归分析的联系 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。 (二)相关分析与回归分析的区别 1.相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分。因此,在回归分析中,变量之间的关系是不对等的。 2.在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是确定的,因变量才是随机的,即将自变量的给定值代入回归方程后,所得到的因变量的估计值不是唯一确定的,而会表现出一定的随机波动性。 3.相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,由于变量之间是对等的,因此相关系数是唯一确定的。而在回归分析中,对于互为因果的两个变量(如人的身高与体重,商品的价格与需求量),则有可能存在多个回归方程。 需要指出的是,变量之间是否存在“真实相关”,是由变量之间的内在联系所决定的。相关分析和回归分析只是定量分析的手段,通过相关分析和回归分析,虽然可以从数量上反映变量之间的联系形式及其密切程度,但是无法准确判断变量之间内在联系的存在与否,也无法判断变量之间的因果关系。因此,在具体应用过程中,一定要注意把定性分析和定量分析结合起来,在定性分析的基础上展开定量分析。

相关文档
最新文档