数理统计大作业

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3791.7 5820 0 3120.6 4950
.97 34804 .35 28778 .54 24165 .68 20017 .31 17636 .45 15301 .38 12581 .51 10682 .58 9262. 8 8234. 04 6909. 82 6038. 04 5126. 88 4255. 3 3296. 91 2990. 17 2821. 86 2727. 4 2390. 47 2140. 36 2090. 73
9016.0 4 7208.0 5 5962.6 5 5323.3 5 4891.5 6 4545.6 2 4062.5 8
三、模型的建立
1.数学模型及其假设
假设有n个影响因素(x1 ,x2 …xn ) Y=β 0+β1x1+β 2x2+… +β kxk+u,u∼N(0,δ2 )
多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(Σ Ɛ) 为最小的前提下,用最小二乘法或最大似然估计法求解参数。 矩阵形式如下
286.93 570 454.6
7457 63 3399 95 3239 56 3119 74 2986 42 5465 37 3182 58
2543.2 4305 1832.9 3376. 4 1430.1 2849. 4 1230.4 2570 961 910.9 2350 2140 180
2040. 79 947.3 5 775.5 9 700.0 2 629.8 9 571.7 537.8 2
.31 216314 .43 184937 .37 159878 .34 135822 .76 120332 .69 109655 .17 99214. 55 89677. 05 84402. 28 78973. 03 71176. 59 60793. 73 48197. 86 35333. 92 26923. 48 21781. 5 18667. 82 16992. 32 15042. 82 12058. 62 10275. 18
8430 62036. 179921 81 .47 7310 51043. 166863
83 19 84 19 85 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04
展水平,特别是,一国按人口平均计算的国民收入额,是反映该国经济发展水平 和人民生活水平的一项重要的综合指标。因此,要更好的进行资源配置和更好的 了解国家的发展水平, 需要对国民总收入进行预测及分析。影响国民总收入的因 素有很多, 如经济活动人口、 各项税收、 固定资产投资、 货运等多种因素的影响。 为此,我们在根据宏观经济理论的基础上,利用从国家统计局获得的从 1979~ 2011 共 33 年的相关数据。 对国民收入的理论及其内部因素相互间影响着实分析。 并进一步采用多元线性回归分析方法对以上因素进行了显著性分析, 从而确定了 关于国民总收入的最优多元线型回归方程。
二、数据的采集和整理
本文在进行统计时,查阅中国国家统计局收录的 1979 年至 2011 年连续 33 年的全国国民总收入收入为因变量, 考虑一些与其关系密切并且直观上有线性关 系的因素, 初步选取这 33 年的进出口总额、 建筑业总产值、 农林牧渔业总产值、 货物运输量、全社会固定资产投资、社会消费品零售总额、各项税收、居民消费 水平为自变量, 分析它们之间的联系。 根据选择的指标, 从中国统计局查选数据, 整理如表 2-1。 1979-2011 年国民总收入及其影响因素统计表 年 份 居民 消费 水平 (元 ) 1257 0 1052 2 9283 建筑业 总产值 ( 亿 元) 进出口 总 额 ( 亿 元) 农 林 牧 渔 业 总 产 值 ( 亿 元) 81303 .92 69319 .76 60361 .01 58002 .15 48893 货 物 运 输 量 ( 万 吨) 3696 961 3241 807 2825 222 2585 937 2275 全社会 固定资 产投资 (亿元) 社 会 消 费 品 零 售 总 额(亿 元) 311485 18391 .13 8.6 251683 15699 .77 8.4 224598 13267 .77 8.4 172828 11483 .4 0.1 137323 93571 各 项 税 收 ( 亿 元) 国民总 收 入 ( 亿 元)
822 2037 060 1862 066 1706 412 1564 492 1483 447 1401 786 1358 682 1293 008 1267 427 1278 218 1298 421 1234 938 1180 396 1115 902 1045 899 9857 93 9706 02 9884 35 9821 95 9482 29 8565 57
ˆ ˆ X ˆ X , ˆ X ( i = 1, 2,, n ) ˆ = 其回归方程为: Y i 1 2 2i 3 3i k ki
2.Matlab 多元线性回归的实现
(1)b=regress(Y, X )确定回归系数的点估计值,其中 X,Y 如上式所示。 (2)[b,bint,r,rint,stats]=regress(Y,X,alpha) 求回归系数的点估计和区间估计、并 检验回归模型。 ①bint 表示回归系数的区间估计. ②r 表示残差 ③rint 表示置信区间 ④stats 表示用于检验回归模型的统计量,有三个数值:相关系数 r2、F 值、 与 F 对应的概率 p (3)X=[X1'~ X8'];stepwise(X,Y)检验各自量对因变量的显著性影响,剔除影响 不显著的因变量,优化回归方程。 (4)rcoplot(r,rint)画出残差及其置信区间,对回归方程进行优化。
研究生“数理统计”课程课外作业
姓名:杨伟学号:20131002051 学院:动力工程学院专业:动力工程及工程热物理 类别:学术上课时间:4-14 周
成绩:
国民总收入的多元线性回归模型


本文首先选取了我国自 1979 至 2011 年间的国民总收入为因变量, 并选取了 8 个主要影响因素(进出口总额、建筑业总产值、农林牧渔业总产值、货物运输 量、全社会固定资产投资、社会消费品零售总额、各项税收、居民消费水平), 进一步利用软件 Matlab 对以上数据进行了多元线性回归。从而找到了能反映国 民总收入与各因素之间关系的“最优”回归方程。 所得结论与我国当前经济形势 相印证。
6299 5596 5032 4475 4144 3887 3632 3346 3159 3002 2789 2355 1833 1393
71 41557. 16 34552. 1 29021. 45 23083. 87 18527. 18 15361. 56 12497. 6 11152. 86 10061. 99 9126.4 8 8282.2 5 5793.7 5 4653.3 2 3253.5
.94 109998 .16 88773. 61 70477. 43 55566. 61 43499. 9 37213. 5 32917. 7 29854. 7 28406. 2 24941. 1 22913. 5 20019. 3 17042. 1 1 3072.3 8080.1 5594.5 4517 4410.4 4753.8
.7 140974 116921 .8 95539. 1 70483. 5 51378. 2 42183. 6 39273. 2 29896. 2 26849. 7 26967. 2 24133. 8 23499. 9 20381. 9 11271 9119.6 7225.8 5560.1 4155.9 3821.8 3084.2
0 符号说明
变量 国民总收入(亿元) 居民消费水平(元) 建筑业总产值(亿元) 进出口总额(亿元) 农林牧渔业总产值(亿元) 货物运输量(万吨) 全社会固定资产投资(亿元) 社会消费品零售总额(亿元) 各项税收(亿元) 符号 Y X1 X2 X3 X4 X5 X6 X7 X8
一、介绍
文中主要应用多元线性回归的统计方法,对数据进行分析处理,最终得出能 够反映各个因素对财政收入影响的最“优”模型。 国民收入,作为一国经济发展的重要指标,对经济的增长,企业的投资,以 及居民的日常消费有着密不可分的影响。自改革开放以来,我国的国民收入从 1979 年的 4062.58 亿元到 2011 年的 468562.38 亿元,短短的 33 年的时间里, 国民收入增加 100 余倍,极大程度地促进了投资,消费,与进出口等领域史无前 例的增长,而这一现象,无论是在中国的历史上,还是在同期发达国家的发展进 度上, 都是屈指可数。国民收入综合地反映了一国的经济实力和社会生产力的发
19 79 19 80 19 81 19 82 19
116463 .32 96031. 13 76807. 74
236401 .99 201722 .15 150648 .06
89738 .39 73210 .79 59521 .59 54223 .79 45621
473104 .05 401512 .8 401512 .8 314045 .43 265810
Y1 1 u1 Y u Y 2 2 U 2 Yn k u n 1 X 21 1 X 22 X 1 X 2 n X 31 X 32 X 3n X k1 Xk2 X kn
1116 2174.4 4 932 1564.3 3 833 1345.0 1 788 1282.9 8 714 1131.6 5 565 952.65 497
808.07 2580.4
.02 40810 .83 39450 .89 36238 .99 29691 .8 27390 .75 26179 .64 24915 .77 24519 .06 24541 .86 23788 .36 22353 .73 20340 .86 15750 .47 10995 .53 9084. 71 8157. 03 7662. 09 6534. 73 5865. 27 4675. 7 4013. 01
Y1 1 X 21 Y 1 X 22 2 = Yn 1 X 2 n
其中:
X 31 X 32 X 3n
X k1 Xk2 X kn
1 u1 u 2+ 2 k u n
20 05 20 06 20 07 20 08 20 09 20 10 20 11
446 361 316 288 264 238 208
675.1
2066.7
517.15 1201 419.54 860.1 345.33 771.3 282.3 735.3
3619. 49 3214. 13 2750 2483. 26 2180. 62 1922. 6 1697. 6
这样多元总体线性回归函数的矩阵形式为: Y = X + U ;类似地,多元样本线性回归
ˆ +e 函数的矩阵形式为: Y = X
其中
ˆ ˆ Y e1 1 1 e ˆ ˆ Y 2 2 2 ˆ ˆ பைடு நூலகம் e ˆ ˆ Y en k n
.6 79145 .2 68352 .6 59501 52516 .3 48135 .9 43055 .4 39105 .7 35647 .9 33378 .1 31252 .9 28360 .2 23613 .8 18622 .9 14270 .4 10993 .7 9415. 6 8300. 1 8101. 4 7440
相关文档
最新文档