计量经济学数据word版
《计量经济学》第3章数据

《计量经济学》各章数据第3章 多元线性回归模型例3.1.1 经过研究,发现家庭书刊消费水平受家庭收入及户主受教育年数的影响。
现对某地区的家庭进行抽样调查,得到样本数据如表3.1.1所示,其中y 表示家庭书刊消费水平(元/年),x 表示家庭收入(元/月),T 表示户主受教育年数。
下面我们估计家庭书刊消费水平同家庭收入、户主受教育年数之间的线性关系。
回归模型设定如下: t t t t u T b x b b y +++=210(t =1,2, …)表3.1.1 某地区家庭书刊消费水平及影响因素的调查数据表例3.4.1根据表3.4.1给出的中国1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),劳动投入L(用从业人员度量,单位为万人),以及资本投入K(用全社会固定投资度量,单位:亿元),试建立我国的柯布——道格拉斯生产函数。
表3.4.1 1980-2003年中国GDP、劳动投入与资本投入数据例3.4.2 某硫酸厂生产的硫酸透明度一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。
影响透明度的主要金属杂质是铁、钙、铅、镁等。
通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。
测量了47组样本值,数据见表3.4.3。
试建立硫酸透明度(y)与铁杂质含量(x)的回归模型。
表3.4.3 硫酸透明度(y)与铁杂质含量(x)数据例3.4.3假设某企业在15年中每年的产量Y(件)和总成本X(元)的统计资料表3.4.7所示,试估计该企业的总成本函数模型。
表3.4.7 某企业15年中每年总产量与总成本统计资料3.6.1 案例1——中国经济增长影响因素分析根据表3.6.1给出的1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),最终消费CS(单位:亿元),投资总额I(用固定资产投资总额度量,单位:亿元),出口总额(单位:亿元)统计数据,试对中国经济增长影响因素进行回归分析。
计量经济学数据库

1027.534543 1607 1270.191708 1769.7 1371.593143 1996.5 1559.463265 2048.4 1777.400678 2162.3 1978.387403 2375.6 2316.089496 2789 2564.396891 3448.7 2788.690811 3967 3233.040981 4585.8 3865.362169 5777.2 4265.923062 6484
1317.664 520.7844 3790.1855 1665.0776 1184.6755
2238.0866 1248.6706
9514 10525 12808 17041 17465 17861 18262 18653 19040 19922 20781 21616 22412 23151 24123 25159 26230 27293 28389 29630 30953 32103 33322 34687
4
114.1 113.7 113.7 112.3 107.5
陕西 甘肃 青海 宁夏
8273 6035 7234 8992
3683 2975 3684 3894
13977
3.8
11881
4
11878
3.2
14739
3.8
111.4 109.3 105.8 108.6
新疆
7276
3590
12486
3.5
2009 2010
北京 天津 河北 山西 内蒙古
辽宁 吉林
40152 42361 49873 64749 65491 66152 66808 67455 68065 68950 69820 70637 71394 72085 72797 73280 73736 74264 74647 74978 75321 75564 75828 76105
(完整word版)计量经济学总结第三版庞皓,推荐文档

(完整word版)计量经济学总结第三版庞皓,推荐文档计量经济学第一章导论一节什么是计量经济学统计学,经济学,数学的结合二节研究步骤一、模型假定估计解释变量与被解释变量的关系,设置随机扰动项μ二、估计参数通过变量的样本观测值合理的估计总体模型的参数,是计量经济学的核心内容三、模型检验(1)经济意义检验,检验所估计的模型与经济理论是否相符(2)统计推断信息,检验参数估计值是否是抽样的偶然结果,需要运用数理统计中统计推断方法对模型及参数的统计可靠性作出说明(3)计量经济学检验,t检验和F检验检验模型是否符合计量经济学假定,如多重共线性,随机扰动项的自相关和异方差性(4)模型预测检验四、模型应用三节变量参数数据与模型一、变量经济变量:在不同的时间或空间有不同状态,回去不同的数值且可观测eg.居民家庭收入X和居民消费支出Y分类:(1)流量与存量(2)解释变量/自变量与被解释变量/因变量(3)内生变量(由模型所决定的变量,是模型求解的结果)和外生变量(由模型以外决定的变量)二、参数的估计所得到的参数估计值迎“尽可能接近总体参数真实值”原则三、计量经济学中应用的数据(1)时间序列数据(2)截面数据(3)面板数据(4)虚拟变量数据二章简单线性回归模型一节回归分析与回归函数一、相关分析与回归分析(一)经济变量之间的相关关系经济变量之间有两种关系,一种是确定性的函数关系,另一种是不确定的统计关系,也叫相关关系。
当一个或若干个变量x取一定值时,与之对应的另一个变量Y的值虽然不确定,但按照某种规律在一定范围内变化,称这种变量之间的关系为不确定的统计关系或相关关系。
分类(1)简单相关关系/多重相关关系(2)线性相关/非线性相关(3)正相关/负相关(4)完全相关/不相关(二)简单线性相关关系的度量1简单线性相关系数总体相关系数ρρ反应了总体两个变量X和Y的线性相关程度。
变量X和Y的样本相关系数通常用表示2相关系数特点(1)(2)相关系数至反应变量间线性相关程度,不能说明非线性关系(3)样本相关系数不是确定的值,二是随抽样变动的随机变量(三)回归分析相关分析:(1)分析是否存在相关关系(2)明确相关关系类型(3)激浪祥光关系密切程度回归分析用于具体测定变量之间相关关系的数量形式,是关于一个变量(被解释变量)对另一个变量(解释变量)依存关系的研究,用适当的数学模型近似的表达或估计变量之间平均变化关系二、总体回归函数将总体被解释变量Y的条件期望表现为解释变量X的函数,这个函数称为总体回归函数:若Y的总体条件期望是解释变量X的线性函数,可表示为关于线性的解释(1)模型就变量而言是线性的(2)模型就参数而言是线性的一般指第二个三、随机扰动项μ个别值总是分布在条件期望周围,而不是全在代表平均值轨迹的回归线上,零各个与条件期望的偏差为μ(表示对Y有影响但是没有纳入模型的诸多因素的综合影响)若总体回归函数是只有一个解释变量的线性函数,有有等式暗含的假设条件,也就是假设回归线通过Y的天健期望或条件均值引入随机扰动项的原因:(1)作为未知影响因素的代表(2)(3)(4)(5)(6)四、样本回归函数对于实际经济问题,由于总体包含的单位数太多,无法掌握所有单位的数值,总体回归函数虽然存在但往往未知,能做到的只是通过对样本观测获得的信息去顾及总体回归函数。
计量经济学[精品文档]
![计量经济学[精品文档]](https://img.taocdn.com/s3/m/20aa03d7102de2bd960588df.png)
计量经济学班级:金融1班学号: 6013205281姓名:谢明亮练习11992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据(见教材Pg56-57,练习题2.1数据)(1) 通过散点图和相关系数,分别分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。
(2) 对所建立的回归模型分别进行模型的参数估计和检验,并用规范的形式写出估计检验结果。
从散点图可以看出,各国人均寿命随着人均GDP的增加而增加,近似于线性关系.用规范的形式将参数估计和检验的结果写为t Y = 56.64794+0.1283601X(1.960820) (0.027242)t = (28.88992) (4.711834)2R =0.526082 F=22.20138 n=22模型检验:1.意义检验所估计参数1β=56.6479,2β=0.128360,说明人均GDP 每增加100美元,亚洲各国人均寿命增加0.128360年。
这与预期的实际意义相符。
2.拟合优度和统计检验拟合优度的度量:可决系数2R =0.526082,说明对样本数据的拟合度一般,即解释变量“人均GDP ”只能对解释变量“亚洲各国人均寿命”的一半多差异做出解释。
对回归系数t 检验:针对0H :1β=0和H0:2β=0,估计的回归系数1β的标准误差和t 值分别为:SE (1β)=1.960820,t (1β)=28.88992;估计的回归系数2β的标准误差和t 值分别为:SE (2β)=0.027242,t (2β)=4.711834。
取α=0.05,查分布表得自由度为22-2=20的临界值025.0t (20)=2.086。
因为t (1β)=28.88992>025.0t (20)=2.086,所以拒绝原假设0H :1β=0;同理可知,拒绝0H :2β=0。
对斜率系数的显著性检验表明,:人均GDP 对亚洲各国人均寿命确实有显著影响。
(完整word版)计量经济学重点知识归纳整理(word文档良心出品)

1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学实验数据2

计量经济学实验数据21、中国税收增长的分析《中国统计年鉴》数据序列相关性的检验和修正年份税收收入(亿元)(Y)国内生产总值(亿元)(X2)财政支出(亿元)(X3)商品零售价格指数(%)(X4)1978 519.28 3624.1 1122.09 100.7 1979 537.82 4038.2 1281.79 102.0 1980 571.70 4517.8 1228.83 106.0 1981 629.89 4862.4 1138.41 102.4 1982 700.02 5294.7 1229.98 101.9 1983 775.59 5934.5 1409.52 101.5 1984 947.35 7171.0 1701.02 102.8 1985 2040.79 8964.4 2004.25 108.8 1986 2090.73 10202.2 2204.91 106.0 1987 2140.36 11962.5 2262.18 107.3 1988 2390.47 14928.3 2491.21 118.5 1989 2727.40 16909.2 2823.78 117.8 1990 2821.86 18547.9 3083.59 102.1 1991 2990.17 21617.8 3386.62 102.9 1992 3296.91 26638.1 3742.20 105.4 1993 4255.30 34634.4 4642.30 113.2 1994 5126.88 46759.4 5792.62 121.7 1995 6038.04 58478.1 6823.72 114.8 1996 6909.82 67884.6 7937.55 106.1 1997 8234.04 74462.6 9233.56 100.8 1998 9262.80 78345.2 10798.18 97.4 1999 10682.58 82067.5 13187.67 97.0 2000 12581.51 89468.1 15886.50 98.5 2001 15301.38 97314.8 18902.58 99.2 2002 17636.45 104790.6 22053.15 98.72、2002年中国各地区城市居民人均年消费支出和可支配收入地区城市居民家庭平均每人每年消费支出(元)Y 城市居民人均年可支配收入(元)X北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南10284.60 7191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.925574.728988.485413.445459.646360.245413.084598.285827.9212463.929337.566679.686051.066524.526260.166100.5613249.808177.6411715.606032.409189.366334.647614.366245.406788.526958.5611137.207315.326822.727238.046610.805944.087240.56西藏陕西甘肃青海宁夏新疆6952.44 5278.045064.245042.526104.925636.408079.126330.846170.526067.446899.64附表2002年中国各地区最终消费与国内生产总值数据异方差的检验和修正地区国内生产总值(亿元)X 最终消费(亿元)Y北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南2845.651840.15577.781779.971545.795033.082032.4835614950.849511.916748.153290.134253.682175.689438.315640.114662.2839831467.71901.851046.43936.192828.091331.322110.542149.074295.963306.12108.092225.231357.474582.613114.132408.842553.14广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆10647.712231.19545.961749.774421.761084.92074.71138.731844.271072.51300.95298.381485.481597.05299.861078.062691.47833.871430.4482.791004.5674.42197.79223.52854.63、1994年—2003年中国旅游收入及相关数据年份国内旅游收入Y(亿元)国内旅游人数X2(万人次)城镇居民人均旅游支出X3(元)农村居民人均旅游支出X4(元)公路里程 X5(万公里)铁路里程X6(万公里)1994 1023.5 52400 414.7 54.9 111.78 5.90 1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 数据来源:《中国统计年鉴2004》附3、1985年—2007年能源消费量及其影响因素单位:亿元多重共线性检验和修正年份能源消费EC第一产业GDP(GDP1)第二产业GDP(GDP2)第三产业GDP(GDP3)进出口总额IE固定资产投资FI1985 76682 2564 3867 2585 2067 2543 1986 80850 2789 4493 2994 2580 3121 1987 86632 3233 5252 3574 3084 3792 1988 92997 3865 6587 4590 3822 4754 1989 96934 4266 7278 5448 4156 4410 1990 98703 5062 7717 5888 5560 4517 1991 103783 5342 9102 7337 7226 5595 1992 109170 5867 11700 9357 9120 8080 1993 115993 6964 16454 11916 11271 130721994 122737 9573 22445 16180 20382 17042 1995 131176 12136 28679 19978 23500 20019 1996 138948 14015 33835 23326 24134 22914 1997 137798 14442 37543 26988 26967 24941 1998 132214 14818 39004 30580 26850 28406 1999 133831 14770 41034 33873 29896 29855 2000 138553 14945 45556 38714 39273 32918 2001 143199 15781 49512 44362 42184 37214 2002 151797 16537 53897 49899 51378 43500 2003 174990 17382 62436 56005 70484 55567 2004 203227 21413 73904 64561 95539 70477 2005 224682 22420 87365 73433 116922 88774 2006 246270 24040 103162 84721 140971 109998 2007 265583 28095 121381 100054 166740 1373244、四川省2000年各地区医疗机构数与人口数地区人口数(万人)X 医疗机构数(个)Y地区人口数(万人)X医疗机构数(个)Y成都1013.3 6304 眉山339.9 827自贡315 911 宜宾508.5 1530攀枝花103 934 广安438.6 1589泸州463.7 1297 达州620.1 2403德阳379.3 1085 雅安149.8 866绵阳518.4 1616 巴中346.7 1223广元302.6 1021 资阳488.4 1361遂宁371 1375 阿坝82.9 536内江419.9 1212 甘孜88.9 594乐山345.9 1132 凉山402.4 1471南充709.2 40645、 1985-2003年农村居民人均收入和消费单位:元年份全年人均纯收入(现价)全年人均消费性支出(现价)消费价格指数(1985=100)人均实际纯收入(1985可比价)人均实际消费性支出(1985可比价)1985 1986 1987 1988 1989 1990 1991 1992 397.60 423.80462.60544.90601.50686.30708.60784.00317.42357.00398.30476.70535.40584.63619.80659.80100.0106.1112.7132.4157.9165.1168.9176.8397.60399.43410.47411.56380.94415.69419.54443.44317.40336.48353.42360.05339.08354.11366.96373.191993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003921.601221.001577.701923.102090.102162.002214.302253.402366.402622.24 769.70 1016.81 1310.36 1572.10 1617.15 1590.33 1577.42 1670.00 1741.00 1834.00 1943.30 201.0 248.0 291.4 314.4 322.3 319.1 314.3 314.0 316.5 315.2 320.2 458.51 492.34 541.42 611.67 648.50 677.53717.64747.68785.41818.86382.94410.00449.69500.03501.77498.28501.75531.85550.08581.85606.81注:资料来源于《中国统计年鉴》1986-2004。
(完整word版)计量经济学复习笔记

计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:模型设定一一确定变量和数学关系式估计参数一一分析变量间具体的数量关系模型检验一一检验所得结论的可靠性模型应用一一做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响, 但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E (人3 )= 3 随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,3估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2 CH3线性回归模型模型(假设)一一估计参数一一检验一一拟合优度一一预测1、模型(线性)(1)关于参数的线性模型就变量而言是线性的;模型就参数而言是线性的。
Yi = 3 1+ 3 2lnX i+u线性影响随机影响Y i=E (Y|X i) +u E (Y|X i) =f(X i)= 3 1+3 2lnX 引入随机扰动项,(3)古典假设A零均值假定 E ( U i |X i) =0B同方差假定Var(u i|XJ=E(u i2)=2(TC无自相关假定Cov(u i ,u j)=0D随机扰动项与解释变量不相关假定Cov(u i ,X i )=0E正态性假定u~N(0, d 2)F无多重共线性假定Rank(X)=k2、估计在古典假设下,经典框架,可以使用OLS方法:OLS 寻找min Ee i2人B iois = (Y均值)-人B 2(X均值)人B 2ois = Ex i y〃Ex i23、性质OLS回归线性质(数值性质)(1)回归线通过样本均值(X均值,Y均值)(2)估计值人Y的均值等于实际值Y的均值(3)剩余项e i的均值为0(4)被解释变量估计值人Y与剩余项8不相关Cov(人Y,ej=0(5)解释变量X与剩余项8不相关Cov(e i,X i)=0在古典假设下,OLS的统计性质是BLUE统计最佳线性无偏估计4、检验(1) Z检验Ho: B 2=0原假设验证B 2是否显著不为0标准化:Z= (A B 2- B 2) /SE (A B 2)〜N( 0,1 ) 在方差已知,样本充分大用Z检验拒绝域在两侧,跟临界值判断,是否B2显著不为0(2) t检验一一回归系数的假设性检验方差未知,用方差估计量代替 A d 2=Ee i2/(n-k) 重点记忆t =(人卩2- B 2) / A SE (A B 2)〜t (n-2)拒绝域:|t|>=t 2/a( n-2)拒绝,认为对应解释变量对被解释变量有显著影响。
《计量经济学》第7章数据

表7.1.3 中国进出口贸易总额数据(单位:百亿元人民币)
进出口总额
虚拟变量
年份
y
时间x D1
D1*x
1950 0.415
1
0
0
1951 0.595
2
0
0
1952 0.646
3
0
0
1953 0.809
4
0
0
1954 0.847
5
0
0
1955 1.098
6
0
0
1956 1.087
7
0
0
1957 1.045
585
1992 3009
2509
1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
659 686 834 1075 1293 1437 1723 1976 2182 2485
576 615 726 992 1170 1282 1648 1812 1936 2167
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例1.3序列T和H分别表示某地区1997年1月至2000年12月的气温和绝对湿度的月平均值序列,数据见表1.2。
要求绘制序列H的经验累计分布函数图和它与序列T的QQ 图。
例2.1表2.1是1950—1987年间美国机动车汽油消费量和影响消费量的变量数值。
其中各变量表示:qmg—机动车汽油消费量(单位:千加仑);car—汽车保有量;pmg—机动汽油零售价格;pop—人口数;rgnp—按1982年美圆计算的gnp(单位:十亿美圆);pgnp—gnp指数(以1982年为100)。
以汽油量为因变量,其他变量为自变量,建立一个回归模型。
表2.1(0201) 1950—1987年间美国机动车汽油消费量数据ls qmg c car pmg pop rgnp pgnpls car c pmg pop rgnp pgnpeqcarscalar vifcar=1/(1-eqcar.@R2) (vifcar是方差扩大因子)同时工作表中产生vifcar=229.1862方差扩大因子只要有一个超过10,说明存在多重共建性检验零假设H0:car对qmg的影响不重要在主窗口输入eq01.testdrop car3.多重共建性处理方法:2.3。
差分法其中算子:ls qmg-qmg(-1) car-car(-1) pmg-pmg(-1) pop-pop(-1) rgnp-rgnp(-1) pgnp-pgnp(-1)ls qmg c qmg(-1) car pmg pmg(-1) pop pop(-1) rgnp rgnp(-1) pgnp pgnp(-1)Qmg t=qmg t-1+0543292cart-0.543292car t-1Ls qmg-eq02.@coefs(1)*qmg(-1) c car-eq02.@coefs(1)*car(-1) pmg-eq02.@coefs(1)*pmg(-1) pop-eq02.@coefs(1)*pop(-1) rgnp-eq02.@coefs(1)*rgnp(-1) pgnp-eq02.@coefs(1)*pgnp(-1)Scalar beta0=eq04.@coefs(1)/(1-eq02.@coefs(1)) 得beta0=75541509.38 回归模型为 Qmg=75541509.38+1.4390*car-…… White 检验 打开equation view-例2.2为研究采取某项保险革新措施的速度y 与保险公司的规模x1和保险公司类型的关系,选取下列数据:y —一个公司提出该项革新直至革新被采纳间隔的月数,x1—公司的资产总额(单位:百万元),x2—定性变量,表示公司类型:其中1表示股份制公司,0表示互助公司。
数据资料见表2.5。
要建立的模型:i i i i x x y εβββ+++=22110得到模型为y=33.87407-0.101742*x1+8.055469*x2差分回归方程:t t x y ∇=∇*65.0即1165.065.0---=-t t t t x x y y即1165.065.0---+=t t t t x x y y消除自相关的模型:qmg=75541509.38+1.4390*car-10354749*pmg-503.50*pop-5290.80*rgnp-565089.4*pgnp某市楼盘销售价格及相关情况的抽样调查表,其中建筑类别分别用1、2、3、4表示多层、多层别墅、小高层、高层;交通状况综合分、物业管理综合分、周边配套等级是通过对居民用户的问卷调查平均而得。
1.Y关于X1、X2、X3、X4和X5的回归方程;2.对回归方程和解释变量做显著性检验;3.当X1=4,X2=8,X3=7,X4=36%,X5=8时,对楼盘的均价进行预测。
例3.1表3.3是某企业在16个月度的产品产量和单位成本资料,研究二者关系。
表3.3 (0301)某企业某产品产量和单位成本资料月度序号obs产量(台)x单机位成本(元/台)y 14300346.2324004343.3434300327.4645016313.2755511310.7565648307.6175876314.5686651305.7296024310.82106194306.83117558305.11127381300.71136950306.84146471303.44156354298.03168000296.21为了明确产量和单机成本是何种关系,先绘制散点图。
genr lx=log(x)genr ly=log(y)ls ly c lxls log(y) c log(x)log(y)=c(1)+c(2)*log(x)双曲线模型: y=a+b/x对数曲线模型:y=a+blnx双对数曲线模型: lny=a+lnx在自变量个数K=1,样本量n=16,在显著性水平 =0.01下,d L=0.84,d u=1.00,此时有D.W=1.151568D.W=1.115981D.W=1.156127均有d u=1.0≤D.W=1.151568≤4- d u=3说明三种模型来描述x与y的关系都比较好。
例3.2 根据例3.1中数据,用非线性最小二乘法建立成本函数模型例3.3粮食产量通常由粮食生产劳动力(L)、化肥施用量(K)等因素决定。
表3.8是我国粮食生产的有关数据(由于粮食生产劳动力不易统计,假定它在农业劳动力中的比例是一定的,故用农业劳动力的数据代替),研究其间关系,建立Cobb—Douglas生产函数模型。
生产的产出量与投入要素之间并不简单地满足线性关系,通常讨论的生产函数,都是以非线性的形式出现。
Cobb—Douglas生产函数模型为Y=aL b K1-b(3.2.4)Y=c(1)*l^c(2)*k^(1-c(2))Y=c(1)*l^c(2)*k^(1-c(2))Coefficient Std. Error t-Statistic Prob.C(1)0.4742530.03618413.106620.0000C(2)0.7635520.01754143.529600.0000R-squared0.945223Mean dependent var40114.73 Adjusted R-squared0.942941S.D. dependent var7222.666S.E. of regression1725.278Akaike infocriterion17.81797Sum squared resid71438041Schwarz criterion17.91474Log likelihood-229.6336Hannan-Quinncriter.17.84584Durbin-Watson stat 1.178765例4.1我国轿车保有量资料见表4.1表4.1(0401)1971—1992年我国轿车保有量根据表绘制时间序列曲线趋势图。
例4.6我国民航客运量数据的季节调整。
有关数据见表4.6例5.4序列Pt是某国1960年至1993年GNP平减指数的季度时间序列。
例5.6表5.4是我国1990年1月至1997年12月工业总产值的月度资料(1990年不变价格),记作IP t,共有96个观测值,对序列IP t建立ARMA模型。
表5.4 1990年1月至1997年12月我国工业总产值单位:亿元例5.6 表5.4是我国1990年1月至1997年12月工业总产值2资料(1990年不变价格),记作ipt,共有96个观测值,对序列ipt建立ARMA模型。
例6.1表6.1是某水库1998年至2000年各旬的流量、降水量数据。
试对其建立多项式分布滞后模型。
LS VOL C RA RA(-1) RA(-2) RA(-3) RA(-4) RA(-5) RA(-6)LS VOL c pdl(series name lags order optionsLS VOL c pdl(ra,9,6 )Variable Coefficient Std. Error t-Statistic Prob.C-186.6747134.7779-1.3850540.1711 PDL01-1.754639 1.938446-0.9051780.3689PDL02-0.627491 2.049412-0.3061810.7605PDL030.780418 1.3668340.5709670.5701PDL040.2304630.4903450.4700020.6400PDL05-0.0147330.183776-0.0801700.9364PDL06-0.0242630.023555-1.0300540.3071PDL070.0026110.0065650.3978000.6922R-squared0.753184Mean dependent var888.0580 Adjusted R-squared0.724860S.D. dependent var1241.393 S.E. of regression651.1569Akaike info criterion15.90403 Sum squared resid25864326Schwarz criterion16.16306 Log likelihood-540.6890Hannan-Quinn criter.16.00679 F-statistic26.59247Durbin-Watson stat 1.903413 Prob(F-statistic)0.000000六介多项式的检验 T统计量的相关概率太大了,所以相关性不好LS VOL c pdl(ra,9,5 )Variable Coefficient Std. Error t-Statistic Prob.C-189.5507133.6672-1.4180790.1612 PDL01-1.333475 1.612718-0.8268500.4115PDL02-0.109091 1.570947-0.0694430.9449PDL030.3053520.6603360.4624190.6454PDL040.0817920.3152670.2594370.7962PDL050.0564470.041616 1.3563670.1799PDL06-0.0166690.013704-1.2163350.2285R-squared0.752543Mean dependent var888.0580 Adjusted R-squared0.728596S.D. dependent var1241.393 S.E. of regression646.7215Akaike info criterion15.87764 Sum squared resid25931423Schwarz criterion16.10428 Log likelihood-540.7784Hannan-Quinn criter.15.96755 F-statistic31.42482Durbin-Watson stat 1.897721 Prob(F-statistic)0.000000LagDistribution of RA i Coefficient Std. Error t-Statistic. *|030.2731 3.217099.41009 . * |18.15629 2.59687 3.14082 * |20.88833 1.720840.51622 *. |3-0.92771 1.88469-0.49223 *. |4-1.33347 1.61272-0.82685 *. |5-1.01564 1.61361-0.62942 * |60.69384 1.877880.36948 . * |7 3.81751 1.78166 2.14267 T统计量的相关概率还是太大了0.9449,所以相关性不好LS VOL c pdl(ra,9,4 )C-192.7441134.1490-1.4367910.1557 PDL01-2.201333 1.451790-1.5162890.1344PDL02 1.4651620.893758 1.6393270.1061PDL030.8923650.452415 1.9724490.0530PDL04-0.2922490.069748-4.1900610.0001PDL050.0157060.0247920.6335030.5287R-squared0.746638Mean dependent var888.0580 Adjusted R-squared0.726530S.D. dependent var1241.393 S.E. of regression649.1779Akaike info criterion15.87223 Sum squared resid26550210Schwarz criterion16.06650 Log likelihood-541.5920Hannan-Quinn criter.15.94931F-statistic37.13130Durbin-Watson stat 1.917450 Prob(F-statistic)0.000000LagDistribution of RA i Coefficient Std. Error t-Statistic. *|028.9405 3.036299.53153 T统计量的相关概率还是太大了0.9449,所以相关性不好LS VOL c pdl(ra,9,3 )Variable Coefficient Std. Error t-Statistic Prob.C-182.8158132.6058-1.3786410.1728 PDL01-2.660015 1.252455-2.1238400.0376PDL02 1.1967410.783251 1.5279150.1315PDL03 1.1586180.166665 6.9517880.0000PDL04-0.2616620.050099-5.2228850.0000R-squared0.745024Mean dependent var888.0580 Adjusted R-squared0.729088S.D. dependent var1241.393 S.E. of regression646.1344Akaike info criterion15.84960 Sum squared resid26719342Schwarz criterion16.01149 Log likelihood-541.8111Hannan-Quinn criter.15.91382 F-statistic46.75112Durbin-Watson stat 1.940066 Prob(F-statistic)0.000000这个就好多了LS VOL c pdl(ra,9,3 )能不能减小9呢?把9改为6/ 最终发现改为8最好Variable Coefficient Std. Error t-Statistic Prob.C-170.8551128.4471-1.3301590.1881 PDL01-2.535784 1.200150-2.1128890.0385PDL02 1.2612190.930553 1.3553430.1800PDL03 1.1308020.172132 6.5693970.0000PDL04-0.2683540.073921-3.6302900.0006R-squared0.741959Mean dependent var881.0714 Adjusted R-squared0.726080S.D. dependent var1233.750 S.E. of regression645.7127Akaike info criterion15.84734 Sum squared resid27101416Schwarz criterion16.00794 Log likelihood-549.6567Hannan-Quinn criter.15.91113 F-statistic46.72448Durbin-Watson stat 1.927732 Prob(F-statistic)0.000000例6.2表6.6中,序列St和Zt分别表示1992年1月至1998年12月经居民消费价格指数调整的中国城镇居民月人均可支配收入和人均生活费支出时间序列,现以人均生活费支出Zt为因变量,建立自回归分布滞后模型。