数理统计-回归分析

国家财政收入的逐步回归分析应用数理统计课程论文

2012届材料科学与工程学院

学号

姓名

2012年11月18日

摘要

财政作为一国政府的活动,是政府职能的具体体现,主要有资源配置、收入再分配和宏观经济调控三大职能。财政收入是政府部门公共收入,是国民收入分配中用于保证政府行使其公共职能,实施公共政策以及提供公共服务的资金需求。财政收入的增长状况关系着一个国家经济的发展和社会的进步。本文选取了我国自1979至2010年间的财政收入数据,并选取了7个可能的影响因素,利用SPSS 统计软件,运用多元线性回归的逐步回归方法建立了国家财政收入的回归模型。得出了影响国家财政收入的显著性变量,并将所得到的模型给予了合理的经济解释。

关键词:财政收入 SPSS 回归分析

目录

1.引言 (1)

1.1 理论回归方程 (1)

1.2研究意义 (1)

1.3 研究内容及方法 (1)

2.数据统计 (2)

2.1 数据的收集 (2)

2.2 散点图 (3)

2.3 逐步回归分析 (5)

3. 结论和讨论 (8)

3.1 结论 (8)

3.2 讨论 (8)

参考文献 (9)

1.引言

1.1 理论回归方程

Y=β0+β1X1+β2X2+……+βp X p +ε

E (ε) =0, Var (ε) =σ2

式中,β0,β1,β2,……βp,σ2是与X1,X2,……X p无关的未知参数

ε是不可观测的随机变量。

1.2研究意义

财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。财政收入对国民经济的运行及社会发展具有重要影响。

1.3 研究内容及方法

影响财政收入的因素有很多,如工业总产值、农业总产值、建筑业总产值、社会消费品零售总额等。如何找到影响财政总收入的各个因素,并建立它们与财政收入的数学模型是十分必要的。基于此目的,本文从国家统计信息网上选取了1997-2010年间的年度财政收入及主要影响因素的数据,包括工业总产值、农业总产值、建筑业总产值、社会消费品零售总额等,并进一步采用多元逐步回归分析方法对以上因素进行了显著性分析,从而确定了关于财政收入的最优多元线型回归方程。

2.数据统计

2.1 数据的收集

本文在进行统计时,查阅《中国统计年鉴2011》中收录的1997年至2010年连续14年的全国财政收入数据,同时,选取了7个可能对国家财政收入产生影响因素,初步选取了这14年的工业总产值、农业总产值、建筑业总产值、社会消费品零售总额、卫生总费用、外汇储备、人口总数为自变量,分析它们与国家财政收入数据之间的联系。

根据选择的指标,从《中国统计年鉴201》查选数据,如表2-1。

表2-1 1997—2010我国财政收入及其影响因素的统计数据

年份(年)财政收

入(亿

元)

工业总产

(亿元)

农业总

产值

(亿

元)

建筑业

总产值

(亿元)

社会消

费品零

售总额

(亿元)

卫生总

费用

(亿元)

外汇储

(亿美元)

人口数

(百万

人)

-- Y X1X2X3X4X5X6X7 1997 8651.14 52921.4 14441.9 9126.48 31252.9 3196.71 1398.90 1223.89 1998 9875.95 67737.14 14817.6 10061.99 33378.1 3678.72 1449.59 1276.27 1999 11444.08 72707.04 14770.0 11152.86 35647.9 4047.50 1546.75 1236.26 2000 13395.23 85673.66 14944.7 12497.60 39105.7 4586.63 1655.74 1284.53 2001 16386.04 95448.98 15781.3 15361.56 43055.4 5025.93 2121.65 1247.61 2002 18903.64 110776.48 16537.0 18527.18 48135.9 5790.03 2864.07 1257.86 2003 21715.25 142271.22 17381.7 23083.87 52516.3 6584.10 4032.51 1292.27 2004 26396.47 201722.19 21412.7 29021.45 59501 7590.29 6099.32 1299.88 2005 31649.29 251619.50 23070.4 34552.10 67177 8659.91 8188.72 1307.56 2006 38760.20 316588.96 24737.0 41557.16 76410 9843.34 10663.40 1314.48 2007 51321.78 405177.13 24658.1 51043.71 89210 11573.97 15282.49 1321.29 2008 61330.35 507284.89 28044.2 62036.81 114830.1 14535.40 19460.30 1328.02 2009 68518.30 548311.42 30777.5 76807.74 132678.4 17541.90 23991.52 1334.50 2010 83101.51 698590.54 36941.1 96031.13 156998.4 --- 28473.38 1340.91

2.2 散点图

将各个因素(自变量)分别与财政收入(因变量)绘制散点图,如下图所示。散点图有助于判断所选的影响因素与国家财政收入的数据之间是否在存在一定的线性关系,达到初步筛选自变量的目的。

020000

4000060000800001000000

10000

20000

30000

40000

农业总产值(亿元)

财政收入(亿元)

图2-1 财政收入与农业总产值的关系

010000

20000300004000050000600007000080000900000

200000

400000600000800000

工业总产值(亿元)

财政收入(亿元)

图2-2 财政收入与工业总产值的关系

图2-3 财政收入与建筑业总产值的关系

10000

20000300004000050000600007000080000900000

20000

40000

60000

80000

100000120000

建筑业总产值(亿元)

财政收入(亿元)

020000

400006000080000100000

5000

10000

15000

20000

卫生总费用(亿元)

财政收入(亿元)

图2-4 财政收入与卫生总费用的关系

图2-5 财政收入与社会消费品零售总额关系

图2-6 财政收入与外汇储备的关系

图2-7 财政收入与人口数目的关系

020000

4000060000800001000000

50000

100000

150000

200000

社会消费品零售总额(亿元)

财政收入(亿元

020000

4000060000800001000000

5000

10000

15000

20000

25000

30000

外汇储备(亿美元)

财政收入(亿元

010000

20000300004000050000600007000080000900001200

12201240126012801300132013401360

人口数目(百万人)

财政收入(亿元)

从上列图中可以看出,财政收入与人口总数不存在线性关系,应予以剔除,而其他因素与财政收入存在良好的线性关系。

2.3 逐步回归分析

将自变量X1,X2,X3,X4,X5,X6作为待筛选量,使用专业统计分析软件IBM SPSS Statistics 19作为逐步回归计算工具,αin=0.05,αout=0.1。其分析结果如下表所示。

表2-2 输入/移去的变量

模型输入的变量移去的变量方法

1 工业总产值. 步进(准则: F-to-enter 的概率<= .050,F-to-remove 的概率>= .100)。

2 社会消费品

零售总额

.

步进(准则: F-to-enter 的概率<= .050,F-to-remove 的概

率>= .100)。

3 外汇储备. 步进(准则: F-to-enter 的概率<= .050,F-to-remove 的概率>= .100)。

注:a. 因变量: 财政收入

表2-2中显示了回归方程引入自变量的步骤及标准。系统在进行回归过程中产生了3个回归模型,模型1是按照Option对话框确定的标准概率值,先将与财政收入(Y)线性关系最密切的自变量工业生产总值(X1)引入模型,建立Y与X1的一元线性回归模型,而后再逐步引入变量X4、X6,分别建立模型2、3。

表2-3模型汇总

模型R R 方调整R 方标准估计的误差

1 .994a.989 .988 1494.49400

2 .998b.995 .994 1046.31023

3 .999c.998 .997 737.26590

注:a. 预测变量: (常量), 工业总产值。

b. 预测变量: (常量), 工业总产值, 社会消费品零售总额。

c. 预测变量: (常量), 工业总产值, 社会消费品零售总额, 外汇储备。

从表中可以看出随着变量X1、X4、X6、的逐个引入,模型的复相关系数(R)逐渐最大,估计值的标准误差逐渐减小。

表2-4 方差分析

模型平方和df 均方 F Sig.

1 回归 1.781E9 1 1.781E9 797.40

2 .000a 残差20101610.737 9 2233512.304

总计 1.801E9 10

2 回归 1.792E9 2 8.962E8 818.600 .000b 残差8758120.781 8 1094765.098

总计 1.801E9 10

3

回归 1.797E9 3 5.991E8 1102.178 .000

残差3804927.001 7 543561.000

总计 1.801E9 10

注:a. 预测变量: (常量), 工业总产值。

b. 预测变量: (常量), 工业总产值, 社会消费品零售总额。

c. 预测变量: (常量), 工业总产值, 社会消费品零售总额, 外汇储备。

d. 因变量: 财政收入

从表2-4中可以看出,当各个自变量引入时,Sig.=0.000,说明自变量对回归方

程的影响均较显著,但模型3的回归方差与总方差相差最小。

模型

非标准化系数标准系数

t Sig.

B 标准误差试用版

1

(常量) 3742.108 805.349 4.647 .001 工业总产值.115 .004 .994 28.238 .000

2

(常量) -6821.251 3329.712 -2.049 .075 工业总产值.049 .021 .425 2.378 .045 社会消费品零售总

.408 .127 .575 3.219 .012

3

(常量) -8807.695 2436.763 -3.615 .009 工业总产值-.064 .040 -.554 -1.593 .155 社会消费品零售总

.601 .110 .847 5.472 .001 外汇储备 2.080 .689 .713 3.019 .019 注:a. 因变量: 财政收入

从表2-5中可以得出,线性回归方程为:

Y= -8807.695 - 0.064X1 + 0.601X4 + 2.08X6

表2-6 已排除的变量

模型Beta In t Sig. 偏相关

共线性统计量

容差

1

农业总产值-.156a-1.187 .269 -.387 .069 建筑业总产值.597a 1.847 .102 .547 .009 社会消费品零售总额.575a 3.219 .012 .751 .019 卫生总费用.420a 2.367 .045 .642 .026 外汇储备-.039a-.093 .928 -.033 .008

2

农业总产值-.257b-6.629 .000 -.929 .064 建筑业总产值-.831b-1.468 .185 -.485 .002 卫生总费用-1.277b-2.208 .063 -.641 .001 外汇储备.713b 3.019 .019 .752 .005

续表2-6 已排除的变量

3

农业总产值-.211c-4.480 .004 -.877 .037 建筑业总产值-.946c-3.719 .010 -.835 .002 卫生总费用-.455c-.630 .552 -.249 .001

注:a. 模型中的预测变量: (常量), 工业总产值。

b. 模型中的预测变量: (常量), 工业总产值, 社会消费品零售总额。

c. 模型中的预测变量: (常量), 工业总产值, 社会消费品零售总额, 外汇储备。

d. 因变量: 财政收入

表2-6中显示了方程外各模型变量的有关统计量,即Beta、t值和p值、偏相关系数和共线性统计的容许值。

3. 结论和讨论

3.1 结论

综上所述,可以认为,逐步回归方程为:

Y= -8807.695 - 0.064X1 + 0.601X4 + 2.08X6

从模型中可以看出,工业生产总值是影响财政收入的主要因素,而且随着生活水平的提高,社会消费品零售总额所占的比重越来越大。

3.2 讨论

通过该模型的研究,传统的国民经济产业部门的影响作用越来越弱,我们这里说的越来越弱并不意味着它已经失去了它的支柱地位,而是由于我们国家经济政策,市场状况等的限制,传统的产业部门已经趋于饱和,想要有所突破已经越来越困难,发展空间有限,虽然它的重要性在减弱,但是它所处的基础地位还是不容动摇的。而工业的发展在财政收入中居于主导地位,同时,社会消费品零售总额对财政收入的影响趋于显著。

该模式受所选数据有限的制约,利用线性方程所得的预测值与实际财政收入之间必定存在一定的出入,加之数据的真实性、操作的准确性、软件自身的误差都会使逐步回归方程的预测值与实际值有较大偏差。这将有待于进一步的研究。

参考文献

[1]孙海燕,周梦,李卫国,冯伟. 应用数理统计[M]. 北京:北京航空航天大学数学

系, 2012.

[2] 刘荣. 基于逐步回归方法的国家财政收入的影响因素分析[J]. 劳动保障世界, 2012, (5):51-54.

[3] 国家统计局. 2011年中国统计年鉴[M]. 中国统计出版社,2011.

[4] 高培勇. 当前经济形势与2012年财政政策[J]. 财贸经济,2012,(2):5-11.

概率论与数理统计知识点总结!

《概率论与数理统计》 第一章随机事件及其概率 §1.1 随机事件 一、给出事件描述,要求用运算关系符表示事件: 二、给出事件运算关系符,要求判断其正确性: §1.2 概率 古典概型公式:P (A )= 所含样本点数 所含样本点数 ΩA 实用中经常采用“排列组合”的方法计算 补例1:将n 个球随机地放到n 个盒中去,问每个盒子恰有1个球的概率是多少?解:设A : “每个盒子恰有1个球”。求:P(A)=?Ω所含样本点数:n n n n n =???... Α所含样本点数:!1...)2()1(n n n n =??-?-?n n n A P ! )(=∴ 补例2:将3封信随机地放入4个信箱中,问信箱中信的封数的最大数分别为1、2、3的概率各是多少? 解:设A i :“信箱中信的最大封数为i”。(i =1,2,3)求:P(A i )=? Ω所含样本点数:6444 443==?? A 1所含样本点数:24234=?? 8 36424)(1== ∴A P A 2所含样本点数: 363423=??C 16 9 6436)(2== ∴A P A 3所含样本点数:443 3 =?C 16 1644)(3== ∴A P 注:由概率定义得出的几个性质: 1、0

P(A 1+A 2+...+ A n )= P(A 1) + P(A 2) +…+ P(A n ) 推论2:设A 1、 A 2、…、 A n 构成完备事件组,则 P(A 1+A 2+...+ A n )=1 推论3: P (A )=1-P (A ) 推论4:若B ?A ,则P(B -A)= P(B)-P(A) 推论5(广义加法公式): 对任意两个事件A 与B ,有P(A ∪B)=P(A)+P(B)-P(A B) 补充——对偶律: n n A A A A A A ???=???......2121 n n A A A A A A ???=??? (2121) §1.4 条件概率与乘法法则 条件概率公式:P(A/B)= )()(B P AB P (P(B)≠0)P(B/A)= ) () (A P AB P (P(A)≠0) ∴P (AB )=P (A /B )P (B )= P (B / A )P (A ) 有时须与P (A+B )=P (A )+P (B )-P (AB )中的P (AB )联系解题。 全概率与逆概率公式: 全概率公式: ∑==n i i i A B P A P B P 1 )/()()( 逆概率公式: ) () ()/(B P B A P B A P i i = ),...,2,1(n i = (注意全概率公式和逆概率公式的题型:将试验可看成分为两步做,如果要求第二步某事件的概率,就用全概率公式;如果求在第二步某事件发生条件下第一步某事件的概率,就用逆概率公式。) §1.5 独立试验概型 事件的独立性: )()()(B P A P AB P B A =?相互独立与 贝努里公式(n 重贝努里试验概率计算公式):课本P24 另两个解题中常用的结论—— 1、定理:有四对事件:A 与B 、A 与B 、A 与B 、A 与B ,如果其中有一对相互 独立,则其余三对也相互独立。 2、公式:)...(1)...(2121 n n A A A P A A A P ???-=??? 第二章 随机变量及其分布

统计学(回归分析)演示教学

统计学论文(回归分析)

◆统计小论文11财一金一凡 11060513 指数回归分析 ●摘要:指数,根据某些采样股票或债券的价格所设计并计算出来的统计数 据,用来衡量股票市场或债券市场的价格波动情形。 ●经济学概念:从指数的定义上看,广义地讲,任何两个数值对 指数函数图像 比形成的相对数都可以称为指数;狭义地讲,指数是用于测定多个项目在不同场合下综合变动的一种特殊相对数。 指数的应用和理论不断发展,逐步扩展到工业生产、进出口贸易、铁路运输、工资、成本、生活费用、股票证券等各个方面。其中,有些指数,如零售商品价格指数、生活消费价格指数,同人们的日常生活休戚相关;有些指数,如生产资料价格指数、股票价格指数等,则直接影响人们的投资活动,成为社会经济的晴雨表。至今,指数不仅是分析社会经济的景气预测的

重要工具,而且被应用于经济效益、生活质量、综合国力和社会发展水平的综合评价研究。 引言:在这个市场经济发达的年代,企业的发展尤为突出,针对年度销售额进行的指数回归分析,能够有效的对企业进行监管和提高发展水平。通过对标准误差、残差、观测值等的回归分析,减少决策失误,使企业更好的发展。销售额是企业的命脉,也是企业在经营过程中的最重要的参考指标,针对年度销售额的指数回归分析,切实保障了企业在当今竞争中的地位与经济形势。 一、一元线性回归模型的基本理论 首先是对线性回归模型基本指数介绍:随机变量y与一般变量x的理一元线性回归模型表示如下: yt = b0 + b1 xt +ut(1)上式表示变量yt 和xt之间的真实关系。其中yt 称作被解释变量(或相依变量、因变量),xt称作解释变量(或独立变量、自变量),ut称作随机误差项,b0称作常数项(截距项),b1称作回归系数。 在模型 (1) 中,xt是影响yt变化的重要解释变量。b0和b1也称作回归参数。这两个量通常是未知的,需要估计。t表示序数。当t表示时间序数时,xt和yt称为时间序列数据。当t表示非时间序数时,xt和yt称为截面数据。ut则包括了除xt以外的影响yt变化的众多微小因素。ut的变化是不可控的。上述模型可以分为两部分。(1)b0 +b1 xt是非随机部分;(2)ut是随机部分。 二、回归模型初步建立与检验

常用的数理统计及数据处理方法

常用的数理统计及数据处理方法 水泥厂生产中的质量控制和分析都是以数据为基础的技术活动。如果没有数据的定量分析,就无法形成明确的质量概念。因此,必须通过对大量数据的整理和分析,才能发现事物的规律性和生产中存在的问题,进而作出正确的判断并提出解决的方法。 第一节数理统计的有关概念 一、个体、母体与子样 在统计分析中,构成研究对象的每一个最基本的单位称为个体。 研究对象的所有个体的集合即全部个体称为母体或总体,它可以无限大,也可以是有限的,如一道工序或一批产品、半成品、成品,可根据需要加以选择。 进行统计分析,通常是从母体中随机地选择一部分样品,称为子样(又称样本)。用它来代表母体进行观察、研究、检验、分析,取得数据后加以整理,得出结论。取样只要是随机和足够的数量,则所得结论能近似地反映母体的客观实际。抽取样本的过程被称作抽样;依据对样本的检测或观察结果去推断总体状况,就是所谓的统计推断,也叫判断。 例如,我们可将一个编号水泥看成是母体,每一包水泥看成是个体,通过随机取样(连续取样或从20个以上不同部位取样),所取出的12kg检验样品可称为子样,通过检验分析,即可判断该编号水泥(母体)的质量状况。 二、数据、计量值与计数值 1,数据 通过测试或调查母体所得的数字或符号记录,称为数据。在水泥生产中,无任对原材料、半成品、成品的检验,还是水泥的出厂销售,都要遇到很多报表和数据,特别是评定水泥质量好坏时,更要拿出检验数据来说明,所以可用与质量有关的数据来反映产品质量的特征。 根据数据本身的特征、测试对象和数据来源的不同,质量检验数据可分为计量值和计算值两类。 2,计量值 凡具有连续性或可以利用各种计量分析一起、量具测出的数据。如长度、质量、温度、化学成分、强度等,多属于计量值数据。计量值也可以是整数,也可以是小数,具有连续性。

数理统计课程设计一元线性回归

二氧化碳吸附量与活性炭孔隙结构的线性回归分析 摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。选取分布大致呈直线的一组数据为拟合的样本数据.对样本数据利用最小二乘法进行回归分析,参数确定,并对分析结果进行显著性检验。同时利用ma tl ab 的r egress 函数进行直线拟合。结果表明:孔径在3。 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。 关键字:活性炭 孔容 CO2吸附量 m atla b 一、问题分析 1。1.数据的收集和处理 本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴张双全,罗雪岭等人的研究成果[1]。以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的C O2吸附量和孔容的关系.数据如下表所示: 表1:孔分布与CO2吸附值 编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。因为处理方式不同得到不同结果是互不影响的,可以看出C O2的吸附量的值是互相独立 编号 孔容/(11 10L g μ--?) CO 2吸附 量 1/()mL g -? 0。5~0。8nm 0.8~1.2nm 1。2~1。8nm 1.8~2。2nm 2.2~2。2n m 2。5~3。0nm 3.0~3。5 nm 1 7.18 16.2 24.4 75.2 70 96 115 64 2 6.59 14.4 18.4 53.7 50 85。6 91 55.1 3 4.5 4 11 18.9 71 6 5 78.3 91 53.7 4 5.13 13.4 29。9 10。3 90 7 6 122 53。 7 5 4.16 10.5 18。9 83.8 78 80。5 113 61。7 6 4。92 12。1 23.4 81.6 72 56 99 53.6 7 5.0 8 12.6 23.8 93.5 86 77.8 122 65。5 8 5.29 13 25。1 88.4 69 66.4 107 57。7 9 7.47 16.9 26.9 46。4 78 93.2 107 58.2 10 5.44 13 21.4 44.1 91 98.6 137 76。6 11 1。81 64。6 18.3 53.1 114 110 142 75 12 1.24 27.7 39。5 126 114 98。6 183 98.7

概率论与数理统计公式定理全总结

第一章 P(A+B)=P(A)+P(B)- P(AB) 特别地,当A 、B 互斥时, P(A+B)=P(A)+P(B) 条件概率公式 概率的乘法公式 全概率公式:从原因计算结果 Bayes 公式:从结果找原因 第二章 二项分布(Bernoulli 分布)——X~B(n,p) 泊松分布——X~P(λ) 概率密度函数 怎样计算概率 均匀分布X~U(a,b) 指数分布X~Exp (θ) 分布函数 对离散型随机变量 对连续型随机变量 分布函数与密度函数的重要关系: 二元随机变量及其边缘分布 分布规律的描述方法 联合密度函数 联合分布函数 联合密度与边缘密度 离散型随机变量的独立性 连续型随机变量的独立性 第三章 数学期望 离散型随机变量,数学期望定义 连续型随机变量,数学期望定义 ● E(a)=a ,其中a 为常数 ● E(a+bX)=a+bE(X),其中a 、b 为常数 ● E(X+Y)=E(X)+E(Y),X 、Y 为任意随机变量 随机变量g(X)的数学期望 常用公式 ) () ()|(B P AB P B A P =)|()()(B A P B P AB P =) |()(A B P A P =∑ ==n k k k B A P B P A P 1)|()()(∑ ==n k k k i i k B A P B P B A P B P A B P 1 )|()()|()()|() ,...,1,0()1()(n k p p C k X P k n k k n =-==-,,...) 1,0(! )(== =-k e k k X P k ,λλ 1)(=? +∞ ∞ -dx x f )(b X a P ≤≤?=≤≤b a dx x f b X a P )()() 0(1 )(/≥= -x e x f x θ θ ∑≤==≤=x k k X P x X P x F ) ()()(? ∞ -=≤=x dt t f x X P x F )()()(? ∞ -=≤=x dt t f x X P x F )()()() ,(y x f ),(y x F 0 ),(≥y x f 1),(=?? +∞∞-+∞ ∞ -dxdy y x f 1),(0≤≤y x F },{),(y Y x X P y x F ≤≤=?+∞ ∞ -=dy y x f x f X ),()(?+∞ ∞ -=dx y x f y f Y ),()(} {}{},{j Y P i X P j Y i X P =====) ()(),(y f x f y x f Y X =∑+∞ -∞ =?= k k k P x X E )(? +∞ ∞ -?=dx x f x X E )()(∑ =k k k p x g X g E )())((∑∑=i j ij i p x X E )(dxdy y x xf X E ??=),()() (1 )(b x a a b x f ≤≤-= ) ()('x f x F =

统计学专业实习论文

题目:关于城镇居民人均可支配收入的分析 学院: 班级: 姓名: 学号 指导教师: 2016年12月28日

摘要 收入分配和消费结构都是国民经济的重要课题,而居民消费的主要来源又是居民收入。本文通过应用多元线性回归分析方法对我国各地区城镇居民收入的现状进行分析,找出影响人均可支配收入的因素。城镇居民可支配收入是检验我国社会主义现代化进程的一个标准。本文以我国城镇居民人均可支配收入为研究对象,选取可能影响居民人均可支配收入的5个因素,运用多元线性回归分析建立模型,先运用普通最小二乘方法建立回归方程,再对方程进行异方差,自相关和多重共线性诊断,再用前进法,后退法,逐步回归法消除多重共线性,又运用岭回归,主成分法,偏最小二乘方法建立回归方程。进而确定5个因素对居民人均可支配收入的影响程度,分析出影响城镇居民收入的主要原因,并对模型联系实际进行分析,以供国家进行决策做参考。 关键词:城镇居民人均可支配收入逐步回归岭回归偏最小二乘

目录 1.引言 (1) 2.数据来源及介绍 (2) 3.模型方法和介绍 (3) 3.1多元线性回归模型 (3) 3.1.1多元线性回归模型的一般形式 (3) 3.1.2多元线性回归模型的基本假定 (4) 4. SAS程序及输出结果 (6) 4.1 用普通最小二乘方法作多元线性回归 (6) 4.1.1相关分析 (6) 4.1.2普通最小二乘法作多元线性回归 (6) 4.2模型检验 (8) 4.2.1异方差模型检验 (8) 4.2.2 自相关检验 (9) 4.2.3 异常值检验 (10) 4.2.4多重共线性检验 (11) 4.3 模型修正 (12) 4.3.1前进法 (12) 4.3.2后退法 (13) 4.3.3逐步回归 (14) 4.3.4最优子集回归 (16) 4.3.5 岭回归 (17) 4.3.6主成分回归 (20) 4.3.7偏最小二乘回归 (21) 5.结论及建议 (22) 6.参考文献 (23) 7.附录 (24)

概率与数理统计典型例题

《概率与数理统计》 第一章 随机事件与概率 典型例题 一、利用概率的性质、事件间的关系和运算律进行求解 1.设,,A B C 为三个事件,且()0.9,()0.97P A B P A B C ==U U U ,则()________.P AB C -= 2.设,A B 为两个任意事件,证明:1|()()()|.4 P AB P A P B -≤ 二、古典概型与几何概型的概率计算 1.袋中有a 个红球,b 个白球,现从袋中每次任取一球,取后不放回,试求第k 次 取到红球的概率.(a a b +) 2.从数字1,2,,9L 中可重复地任取n 次,试求所取的n 个数的乘积能被10整除的 概率.(58419n n n n +--) 3.50只铆钉随机地取来用在10个部件上,其中有3个铆钉强度太弱,每个部件用3只铆钉,若将3只强度太弱的铆钉都装在一个部件上,则这个部件强度就太 弱,从而成为不合格品,试求10个部件都是合格品的概率.(19591960 ) 4.掷n 颗骰子,求出现最大的点数为5的概率. 5.(配对问题)某人写了n 封信给不同的n 个人,并在n 个信封上写好了各人的地址,现在每个信封里随意地塞进一封信,试求至少有一封信放对了信封的概率. (01(1)! n k k k =-∑)

6.在线段AD上任取两点,B C,在,B C处折断而得三条线段,求“这三条线段能构成三角形”的概率.(0.25) 7.从(0,1)中任取两个数,试求这两个数之和小于1,且其积小于 3 16 的概率. (13 ln3 416 +) 三、事件独立性 1.设事件A与B独立,且两个事件仅发生一个的概率都是 3 16 ,试求() P A. 2.甲、乙两人轮流投篮,甲先投,且甲每轮只投一次,而乙每轮可投两次,先投 中者为胜.已知甲、乙每次投篮的命中率分别为p和1 3 .(1)求甲取胜的概率; (2)p求何值时,甲、乙两人的胜负概率相同?( 95 ; 5414 p p p = + ) 四、条件概率与积事件概率的计算 1.已知10件产品中有2件次品,现从中取产品两次,每次取一件,去后不放回,求下列事件的概率:(1)两次均取到正品;(2)在第一次取到正品的条件下第二次取到正品;(3)第二次取到正品;(4)两次中恰有一次取到正品;(5)两次中 至少有一次取到正品.(28741644 ;;;; 45954545 ) 2.某人忘记了电话号码的最后一个数字,因而他随意地拨号,假设拨过了的数字不再重复,试求下列事件的概率:(1)拨号不超过3次而接通电话;(2)第3次拨号才接通电话.(0.3;0.1) 五、全概率公式和贝叶斯公式概型 1.假设有两箱同种零件:第一箱内装50件,其中10件为一等品;第二箱内装30件,其中18件为一等品,现从两箱中随意挑选出一箱,然后从该箱中先后随机取出两个零件(取出的零件均不放回),试求:(1)先取出的零件是一等品的概率;(2)在先取出的零件是一等品的条件下,第二次取出的零件仍然是一等品 的概率.(2690 ; 51421 ) 2.有100个零件,其中90个一等品,10个二等品,随机地取2个,安装在一台设备上,若2个零件中有i个(0,1,2 i=)二等品,则该设备的使用寿命服从参

数据统计在统计学中的地位

数据统计在统计学中的地位 XXX XX级X班XXXXXXXXX 一、数理统计与统计学的主要特点 (一)数理统计的主要特点 数理统计就是通过对随机现象有限次的观测或试验所得数据进行归纳,找出这有限数据的内在数量规律性,并据此对整体相应现象的数量规律性做出推断或判断的一门学科。概括起来有如下几方面的特点:一是随机性,就是说数理统计的研究对象应当具有随机性,确定性现象不是数理统计所要研究的内容。二是有限性,就是说数理统计据以研究的随机现象数量表现的次数是有限的。三是数量性,即数理统计以研究随机现象的数量规律性为主,而对随机现象质的研究为次。四是采用的研究方法主要为归纳法。最后,数理统计通过对小样本的研究以达到对整体的推断都具有一定的概率可靠性。用样本推断总体误差的存在是客观的,但是数理统计不仅重在研究误差的大小,还指出误差发生的可能性的大小。 从数理统计的学科特征来看,数理统计是应用数学中最重要、最活跃的学科之一。由此可见!数理统计从学科划分来说,应属于数学学科,但是其重在应用!而不是纯数学理论或方法的研究,故其采用的方法也就重在归纳法,而不是数学的演绎法。 综上所述,数理统计的主要特点可以用一句话概括为、数理统计是一门对随机现象进行有限次的观测或试验的结果进行数量研究,并依之对总体的数量规律性做出具有一定可靠性推断的应用数学学科。 (二)统计学的主要特点 统计学是一门收集、整理和分析统计数据的方法论科学,其目的在于探索数据的内在数量规律性,以达到对客观事物的科学认识。 统计学从其研究的范围来说有三大领域:数据的收集$数据的整理和数据的分析。首先,这三大领域随着统计学的不断发展,已很难分辨出哪个领域更重要些。也许有很多人认为数据的分析要相对重要些。在对1900 年和1910年美国两次农业普查资料进行分析时,列宁曾指出:“全部问题,任务的全部困难在于,如何综合这些资料,才能确切地从政治上经济上说明不同种类或类型的农户的整个情况。”这足见数据整理的重要性。近年来困扰我国统计研究的并不是数据的分析方法,而是缺少充分真实有效的统计数据,造成无法用数据去检验或证实相应的经济理论、经济模型和经济政策。数据收集的重要性可见一斑。其次,统计学是一门方法论科学。长期以来,人们一直认为在这众多的方法中,统计研究的基本方法是大量观察法、统计指标法、统计分组法和模型推断法。特别是大量观察法更成为统计学最重要的基本特征方法之一,也可以说这是统计学与数理统计的根本区别之一,否则,统计学也就真的成了现代西方数理统计学了。随着统计学由早期的纯粹描述统计不断拓展为描述统计与推断统计并重,直至有的学者认为现代统计学应该以推断统计为主,描述统计为辅,暂且不论这种观点是否有不妥之处,但可足见推断统计学已在现代社会生活中起到举足轻重的作用。事实上,推断统计已成为现代统计学的基本特征之一。再次,统计学从其成为一门科学的那一天起,就把对现象数量方面的研究作为自己的基本特征,但是,同时强调要以

北航数理统计回归分析大作业

应用数理统计第一次大作业 学号: 姓名: 班级: 2013年12月

国家财政收入的多元线性回归模型 摘 要 本文以多元线性回归为出发点,选取我国自1990至2008年连续19年的财政收入为因变量,初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的“最优”回归方程: 46?578.4790.1990.733y x x =++ 从而得出了结论,最后我们用2009年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。 关键词:多元线性回归,逐步回归法,财政收入,SPSS 0符号说明 变 量 符号 财政收入 Y 工 业 X 1 农 业 X 2 受灾面积 X 3 建 筑 业 X 4 人 口 X 5 商品销售额 X 6

进出口总额X7

1 引言 中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。 国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,批发和零售贸易餐饮业,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。 2解决问题的方法和计算结果 2.1 样本数据的选取与整理 本文在进行统计时,查阅《中国统计年鉴2010》中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上

统计学论文范文

统计学论文范文 统计学论文范文 统计学课程是统计专业的专业基础理论课,也是财经类各专业学科的基础课和必修课,进入21世纪,随着我国市场化步伐的加快,市场对各种社会经济信息需求日益增加, 无论是国民经济管理,还是公司企业乃至个人的经营、投资决策,都越来越依赖于相关信息的取得及相应的数量分析,这些都高度依赖于统计方法。统计方法已成为管理、经贸、金融等许多学科和社会经济实践活动领域科学研究的重要方法。如何在统计学的教学中培养能满足社会主义市场经济建设所需要的统计学专业人才,必然需要我们认真研究和改革教学方法。 一、传统的统计学课程教学成在的主要问题及负面影响 (一)传统教学存在的主要问题。 1、学生对人生的目标模糊,在课堂上缺乏主动性、自觉性大部分学生都带着原来的一些不好的学习习惯、学习方法,使他们在接受知识上比别的同学要慢一些,而且在课余时间,他们也不能自我加压。对于人生的长远打算更是缺乏认识,或者说有的同学是害怕思考,在回避或者逃避这个问题,缺乏青年人那种对知识广泛涉猎,锐意进取的精神。 2、学生文化基础差,入学成绩普遍偏低。 近年来随着高校的全面扩招,高等教育的学生综合素质也在明显的下降,高职专科这个层次的学生已是高等教育的最低层次,学生的素质特别是文化课的成绩较差。很多高职高专学校只要考生过了提

档线就可以录取,所以其文化课基础可想而知。 3、统计学课程的计算太复杂。 如组距数列的编制,其资料中的数据有几十至上百,要将其中的数据从小到大排列再分组,光凭眼睛观察是不行的,还有几何平均数的计算、方差分析、相关与回归分析、指数曲线趋势模型、多元回归预测等等,这些计算都很复杂,手工计算量非常大,没有计算机软件的支撑,是很难进行教学实际问题分析的。 4、教师教学重理论,实践教学深广度不够。 有些教师上课时滔滔不绝,黑板写得满满的,学生不停地记笔记。这种满堂灌、填鸭式的教法带来很多弊病。教师讲得过多,他所能提供给学生独立掌握知识、主动训练能力的机会就越少,学生常处于被动位置,没有时间及时思考、消化、吸收,所学知识当然没法巩固。再有,讲得过多,重点不突出,学生掌握不了要领,课堂气氛也沉闷,学生容易产生疲劳。加上统计学的数学知识太多,本来他们的基础就不是那么好,无法听懂这些理论知识。 还有在当前评估热潮的推动下,许多学校开展了轰轰烈烈、前所未有的实践教学,但受诸多因素影响,大多浮于表面,实践教学深度不够,还不能使学生全面地、系统地、高质量地完成专业技能训练。统计学课程一般每周4~6节,总学时约60~70节,而实践课只占10%左右。这意味着该专业学生在课程学习中,从事的主要是理论学习和简单的上机实践操作,课程考察也主要以理论知识为主,实践技能的培养被忽视了。

数理统计复习题第五章

第五章 大数定律与中心极限定理 一、 典型题解 例1设随机变量X 的数学期望()(){}2,3E X u D X X u σσ==-≥方差,求P 的大小区间。 解 令3εσ=,则有切比雪夫不等式有: ()() ()22 221 ,339D X P X E X P X E X σεσεσ????-≥≤ -≥≤=????有 例2在n 次独立试验中,设事件A 在第i 次试验中发生的概率为()1,2,....i p i n = 试证明:A 发生的频率稳定于概率的平均值。 证 设X 表示n 次试验中A 发生的次数,引入新的随机变量0i A X A ?=??1,发生? ,不发生 ()12,...i n =, ,则X 服从()01-分布,故 ()()(),1i i i i i i i E X p D X p p p q ==-=, 又因为 () ()2 2 4140i i i i i i i i p q p q p q p q -=+-=-≥, 所以 ()()1 1,2, (4) i i i D X p q i n =≤ = 由切比雪夫大数定理,对,o ε?>有()11lim 1n i i n i p X E X n ε→∞ =?? -<=???????? ∑ 即 11lim 1n i n i X p p n n ε→∞ =?? -<=???? ∑ 例 3 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学 生无家长,1名家长、2名家长来参加会议的概率分别为。若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布。(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率。 解(1)以()400,,2,1 =k X k 记第k 个学生来参加会议的家长数,则k X 的分布律为 k X 0 1 2 k P 0.05 0.8 0.15

北航数理统计第二次大作业-数据分析模板

数理统计第二次大作业材料行业股票的聚类分析与判别分析 2015年12月26日

材料行业股票的聚类分析与判别分析摘要

1 引言 2 数据采集及标准化处理 2.1 数据采集 本文选取的数据来自大智慧软件的股票基本资料分析数据,从材料行业的股票中选取了30支股票2015年1月至9月的7项财务指标作为分类的自变量,分别是每股收益(单位:元)、净资产收益率(单位:%)、每股经营现金流(单位:元)、主营业务收入同比增长率(单位:%)、净利润同比增长率(单位:%)、流通股本(单位:万股)、每股净资产(单位:元)。各变量的符号说明见表2.1,整理后的数据如表2.2。 表2.1 各变量的符号说明 自变量符号 每股收益(单位:元)X1 净资产收益率(单位:%)X2 每股经营现金流(单位:元)X3 主营业务收入同比增长率(单位:%)X4 净利润同比增长率(单位:%)X5 流通股本(单位:万股)X6 每股净资产(单位:元)X7 表2.2 30支股票的财务指标 股票代码X1 X2 X3 X4 X5 X6 X7 武钢股份600005-0.0990-2.81-0.0237-35.21-200.231009377.98 3.4444宝钢股份6000190.1400 1.980.9351-14.90-55.011642427.88 6.9197山东钢铁600022-0.11650.060.0938-20.5421.76643629.58 1.8734北方稀土6001110.0830 3.640.652218.33-24.02221920.48 2.2856

杭钢股份600126-0.4900-13.190.4184-36.59-8191.0283893.88 3.4497抚顺特钢6003990.219310.080.1703-14.26714.18112962.28 1.4667盛和资源6003920.0247 1.84-0.2141-5.96-19.3739150.00 1.2796宁夏建材6004490.04000.510.3795-22.15-92.3447818.108.7321宝钛股份600456-0.2090-2.53-0.3313-14.81-6070.2043026.578.1497山东药玻6005290.4404 5.26 1.2013 6.5016.7825738.018.5230国睿科技6005620.410011.53-0.2949 3.3018.9416817.86 3.6765海螺水泥600585 1.15169.05 1.1960-13.06-25.33399970.2612.9100华建集团6006290.224012.75-0.57877.90-6.4034799.98 1.8421福耀玻璃6006600.790014.250.9015 3.6017.27200298.63 6.2419宁波富邦600768-0.2200-35.02-0.5129 3.1217.8813374.720.5188马钢股份600808-0.3344-11.710.3939-21.85-689.22596775.12 2.6854亚泰集团6008810.02000.600.1400-23.63-68.16189473.21 4.5127博闻科技6008830.503516.71-0.1010-10.992612.8023608.80 3.0126新疆众和6008880.0523 1.04-0.910662.64162.0464122.59 5.0385西部黄金6010690.0969 3.940.115115.5125.5712600.00 2.4965中国铝业601600-0.0700-2.920.2066-9.0882.79958052.19 2.3811明泰铝业6016770.2688 4.66-1.09040.8227.8640770.247.4850金隅股份6019920.1989 3.390.3310-10.05-39.01311140.26 6.7772松发股份6032680.35007.00-0.3195-4.43-9.622200.00 6.0244方大集团0000550.0950 5.66-0.480939.2920.6742017.94 1.6961铜陵有色0006300.0200 1.220.6132 3.23-30.74956045.21 1.5443鞍钢股份000898-0.1230-1.870.7067-27.32-196.21614893.17 6.4932中钢国际0009280.572714.45-0.4048-14.33410.2441286.57 4.2449中材科技0020800.684610.27 1.219547.69282.1740000.00 6.8936中南重工0024450.1100 4.300.340518.8445.0950155.00 2.7030 2.2 数据的标准化处理 由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标准化处理。本文采用Z得分值法标准化的方法进行标准化,用x的值减去x的均值再除以样本的方差。也就是把个案转换为样本均值为0、标准差为1的样本。如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此类问题,使不同变量的数值具有同等的重要性。经Z标准化输出结果见表 2.2。 表2.2 经Z标准化后的数据 ZX1ZX2ZX3ZX4ZX5ZX6ZX7

教育统计学

0055《教育统计学》2016年12月期末考试指导 一、考试说明 (一)说明 考试为开卷考试,考试题型为撰写论文,主要考察对四种分析方法的应用分析能力,考试时随机抽取一种方法考核,试卷满分为100分,考试时间90分钟,考试时可携带相关资料。 (二)论文选题及内容要求 1、论文选题为教学课件讲授内容中的如下知识点: (1)应用独立样本T检验方法进行数据统计分析的研究。(字数不限) 根据试卷中提供的数据和分析结果,进行讨论:差异与显著性差异的关系。 a. 讨论包括:本题所使用的数据统计分析方法的解释说明、结果分析和解释等2部分。 b. 解释为什么均值差异要分辨显著与不显著,为什么会出现有很大差异却不显著的现象。 (2)应用协方差分析方法进行数据统计分析的研究。(2000字左右) 在问题提出部分需要说明协变量(至少要有1个)的选择理由,采用自己虚拟的数据来阐述研究方法和结论解释。 (3)应用卡方检验统计分析方法进行数据统计分析的研究。(字数不限) 期望分布1(%) 53 13 11 6 14 3 总计:100% 实际分布2(%) 44 11 15 5 16 9 总计:100% 根据试卷提供的数据,分析模拟结果,注重解释所研究问题为什么要选择卡方检验的研究方法,并对统计分析结果做解释和讨论。 (4)应用偏相关分析方法进行数据统计分析的研究(2000字左右) 在问题提出部分必须说明中介变量(或称为桥梁变量)的判定与选择理由,采用自己虚拟

的数据来阐述研究方法和结论解释。 2、论文结构包括:问题提出,研究意义,实验过程,使用的数据统计分析方法,结论分析等5部分。 3、研究中使用的数据一律采用考生自己虚拟的数据,只注重研究问题的价值和意义,为什么选择这样的研究方法和统计分析结果的解释和讨论。 4、考试采取随机抽题的方式,随机抽取其中的一个选题考试(即一套试卷),考试期间仅允许携带平时个人研究撰写(手写)的资料(不允许电子打印版及手写复印版)、教材(教育统计学和数据统计分析与实践SPSS for Windows),不允许带其他材料。 5、学生将研究论文写在学院的统一考试答题纸上,要求字迹工整。考试结束后现场密封答题随期末试卷一同寄回学院批改。 二、论文大纲 (一)问题提出 这部分首先需要阐述研究问题提出的背景,其次是说明研究问题,以及具体研究的问题维度,最好是能结合自己工作的实践确定问题。 例如: (二)研究意义 研究问题必须具有明确的意义和研究价值,该部分主要描述通过这项研究,能获得什么样的价值,对什么有意义、有价值,研究的意义应当扎根于社会问题、教育问题或者是国民经济有关的问题。 (三)实验过程 这部分内容包括: 1. 被试的选取及样本的大小和特征; 2. 对被试采用的测试是:问卷、访谈、行为观察还是系统测试; 3. 在考题指定的研究方法中,相应的变量(如协变量、中介变量)是什么?有几个?对变

数理统计复习题第八章

第七章 假设检验 三、典型题解 例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.498 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 解: 根据样本值判断5.05.0≠=μμ还是.提出两个对立假设 0100:5.0:μμμμ≠==H H 和 选择统计量:)1,0(~/0 N n X Z σμ-= 取定0.05a =,则/20.025 1.96,z z a ==又已知 9, 0.015, n s ==由样本计算得0.511x =, 2.2 1.96=>,于是拒绝假设 0H , 认为包装机工作不正常. 例2:某工厂生产的固体燃料推进器的燃烧率服从正态分布),(2 σμN , s cm s cm /2,/40==σμ,现用新方法生产了一批推进器,从中随机取25n =只,测得燃 烧率的样本均值为s cm x /25.41=.设在新方法下总体均方差仍为s cm /2,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?(取显著性水平05.0=α) 解:根据题意需要检验假设 00 :40H m m ?(即假设新方法没有提高了燃烧率), 10 :H m m >(即假设新方法提高了燃烧率), 这是右边检验问题,拒绝域为 0.05 1.645x z z = ?,由 3.125 1.645 x z = =>可得z 值落到拒绝域中故在显著性水平0.05 a =下拒绝0 H . 即认为这批推进器的燃烧率较以往有显著提高. 例3:某切割机在正常工作时, 切割每段金属棒的平均长度为10.5cm, 标准差是0.15cm, 今

数理统计-回归分析

国家财政收入的逐步回归分析应用数理统计课程论文 2012届材料科学与工程学院 学号 姓名

2012年11月18日

摘要 财政作为一国政府的活动,是政府职能的具体体现,主要有资源配置、收入再分配和宏观经济调控三大职能。财政收入是政府部门公共收入,是国民收入分配中用于保证政府行使其公共职能,实施公共政策以及提供公共服务的资金需求。财政收入的增长状况关系着一个国家经济的发展和社会的进步。本文选取了我国自1979至2010年间的财政收入数据,并选取了7个可能的影响因素,利用SPSS 统计软件,运用多元线性回归的逐步回归方法建立了国家财政收入的回归模型。得出了影响国家财政收入的显著性变量,并将所得到的模型给予了合理的经济解释。 关键词:财政收入 SPSS 回归分析

目录 1.引言 (1) 1.1 理论回归方程 (1) 1.2研究意义 (1) 1.3 研究内容及方法 (1) 2.数据统计 (2) 2.1 数据的收集 (2) 2.2 散点图 (3) 2.3 逐步回归分析 (5) 3. 结论和讨论 (8) 3.1 结论 (8) 3.2 讨论 (8) 参考文献 (9)

1.引言 1.1 理论回归方程 Y=β0+β1X1+β2X2+……+βp X p +ε E (ε) =0, Var (ε) =σ2 式中,β0,β1,β2,……βp,σ2是与X1,X2,……X p无关的未知参数 ε是不可观测的随机变量。 1.2研究意义 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。财政收入对国民经济的运行及社会发展具有重要影响。 1.3 研究内容及方法 影响财政收入的因素有很多,如工业总产值、农业总产值、建筑业总产值、社会消费品零售总额等。如何找到影响财政总收入的各个因素,并建立它们与财政收入的数学模型是十分必要的。基于此目的,本文从国家统计信息网上选取了1997-2010年间的年度财政收入及主要影响因素的数据,包括工业总产值、农业总产值、建筑业总产值、社会消费品零售总额等,并进一步采用多元逐步回归分析方法对以上因素进行了显著性分析,从而确定了关于财政收入的最优多元线型回归方程。

概率论与数理统计公式总结

概率论与数理统计公式总 结 Prepared on 22 November 2020

第一章 P(A+B)=P(A)+P(B)- P(AB) 特别地,当A 、B 互斥时, P(A+B)=P(A)+P(B) 条件概率公式 概率的乘法公式 全概率公式:从原因计算结果 Bayes 公式:从结果找原因 第二章 二项分布(Bernoulli 分布)——X~B(n,p) 泊松分布——X~P(λ) 概率密度函数 怎样计算概率 均匀分布X~U(a,b) 指数分布X~Exp (θ) 分布函数 对离散型随机变 量 对连续型随机变量 分布函数与密度函数的重要关系: 二元随机变量及其边缘分布 分布规律的描述方法 联合密度函数 联合分布函 数 联合密度与边缘密度 ) () ()|(B P AB P B A P = )|()()(B A P B P AB P =) |()(A B P A P =∑==n k k k B A P B P A P 1 ) |()()(∑== n k k k i i k B A P B P B A P B P A B P 1 ) |()() |()()|() ,...,1,0()1()(n k p p C k X P k n k k n =-==-,,...) 1,0(! )(== =-k e k k X P k ,λ λ 1)(=?+∞ ∞-dx x f ) (b X a P ≤≤?=≤≤b a dx x f b X a P )()() 0(1 )(/≥= -x e x f x θ θ ∑≤==≤=x k k X P x X P x F ) ()()(? ∞ -=≤=x dt t f x X P x F )()()(? ∞ -=≤=x dt t f x X P x F )()()(),(y x f ) ,(y x F 0 ),(≥y x f 1),(=??+∞∞-+∞ ∞-dxdy y x f 1 ),(0≤≤y x F } ,{),(y Y x X P y x F ≤≤=)(1 )(b x a a b x f ≤≤-= ) ()('x f x F =

相关文档
最新文档