2015重庆大学数理统计大作业

合集下载

重庆大学数理统计试题3

重庆大学数理统计试题3
一、设 X1 , X 2 ,…,X m , X m1 ,…,X mn 为来自总体 X ~N 0, 2 的一个样本, 试确定下列统计量的分布
n Xi
i 1 m n m
( 1 ) Y1
m
2
i m 1
X
; ( 2 ) Y2
2 i
n X i 2 m Xi
i m 1 i 1 mn 2
n n 2 i 1 2 1 e 2 ) ( 2 2 ) 2 e 2 2 n xi2
xi2
n
L( 2 , X 1 , X 2 ,
Xn) (
i 1
ln( L( 2 , X 1 , X 2 , ln( L( 2 , X 1 , X 2 , d 2
xi2 n X n )) ln( 2 ) ln 2 i 1 2 2 2 X n )) n 1 n 1 n 2 i 1 ( xi 2 ) 2 2 2 4 2 2( ) 2 n i 1
s
2
c1
1 1 2 (n 1), c2 2 (n 1) n 1 2 n 1 1 2 s2
k0 :{
2
c2或
s2
2
c1}
(2) H0 : 2 1, H1 : 2 2
2 拒绝域 k0 : (n 1)s 2 12 (n 1);22s 2 0.95 (22) 33.92; :
m
2 i m1
X

n X i 2 m Xi
i m 1 i 1 mn 2
Y2 ~ F (m, n)
2 i
n
Xi
(3)
i 1
m
m n
m
~ N (0,1),

重庆大学概率与数理统计课后答案第二章

重庆大学概率与数理统计课后答案第二章
X
3 0.1 4 0.3 5
4 6 ; 10 10
P
2)
0.6
x3 0, 0.1, 3 x 4 F ( x) P{ X x} 0.4, 4 x 5 x5 1,
3. 设一学生用同一台机床接连独立地制造 3 个同种零件,第 i 个为不合格品的概率为
1 ,以 X 表示汽车停下时通过的交通岗个数,求 X 的分布律。 2
X 的可能取值:0,1,2,3,4 1 P( X 0) 2 1 1 P( X 1) ( ) 2 2 4 1 1 P( X 2) ( )3 2 8 1 1 P( X 3) ( ) 4 2 16 1 1 2 1 3 1 4 1 P( X 4) 1 ( ) ( ) ( ) 2 2 2 2 16

1
所以 A (2)

f x dx Ae|x|dx 2 Ae x dx 2 A
0


1 ; 2 P 0 X 1 f x dx
0 1 11 1 | x| e dx e x dx 0.316 0 2 0 2 1
解:设 X 为同一时刻使用的设备数,可能取值为:0,1,2,3,4,5, 则 X ~ B(5, 0.2) , (1) P{ X 2}
P{ X k} C
k 0 k 0
2
2
k 5
0.2 k 0.85 k 0.9421 ;
(2) P{X 2} 1 P{X 0,1} 1 0.85 5 0.2 0.84 0.2627 6.一电话总机每分钟收到呼唤次数 X 服从参数为 4 的泊松分布。求(1)某一分钟恰有 8 次 呼唤的概率; (2)某一分钟的呼唤次数大于 3 的概率。 解: (1) X ~ P(4)

重庆大学硕士研究生《数理统计》课程大作业(论文)

重庆大学硕士研究生《数理统计》课程大作业(论文)

一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。

2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。

这说明,重庆未来的发展不可限量。

自1997年直辖以来,重庆市的经济社会发展极为迅猛。

全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。

在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。

过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。

作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。

建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。

数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。

因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。

建筑企业是建筑业的主体。

众多的建筑企业的良好发展构成了建筑业的良好发展。

对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。

在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。

企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。

所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。

为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。

重庆大学数理统计试题答案版

重庆大学数理统计试题答案版

涉及到的有关分位数:()()()()()()()()()()()()20.950.950.950.9750.9750.9752222220.9750.0250.0250.9750.950.97520.95 1.645,16 1.746,15 1.753,16 2.12,15 2.131,1628.851527.49,16 6.91,15 6.26,1 5.02,1 3.84,27.382 5.99u t t t t χχχχχχχχ=============一、设123,,X X X 是来自总体~(0,3)X N 的样本。

记()2332i 1111,32i i i X X S X X====-∑∑,试确定下列统计量的分布:(1)3113i i X =∑;(2)23119i i X =⎛⎫⎪⎝⎭∑;(3)()23113i i X X=-∑;(4X解:(1)由抽样分布定理,311~(0,1)3i i X X N ==∑(2)因311~(0,1)3i i X N =∑,故223321111~(1)39i i i i X X χ==⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭∑∑(3)由抽样分布定理,()()()2223321131211~(2)3323i i i i S X X X X χ==-=⋅-=-∑∑(4)因()222~(0,1),~23X N S χ,X 与2S独立,故()~2X t 。

二、在某个电视节目的收视率调查中,随机调查了1000人,有633人收看了该节目,试根据调查结果,解答下列问题:(1)用矩估计法给出该节目收视率的估计量;(2)求出该节目收视率的最大似然估计量,并求出估计值;(3)判断该节目收视率的最大似然估计是否是无偏估计;(4)判断该节目收视率的最大似然估计是否是有效估计。

解:总体X 为调查任一人时是否收看,记为~(1,)X B p ,其中p 为收视率(1)因EX p =,而^E X X =,故收视率的矩估计量为^Xp =(2)总体X 的概率分布为()1()1,0,1xxf x p p x -=-=1111()(1)(1)(1)ln ()ln (1)ln(1)ln ()(1)01nniii ii i nx n x x x n X n n Xi L p p p pp p p L p nX p n X p d L p nX n X dp p p==---=∑∑=-=-=-=+---=-=-∏解得收视率p 的最大似然估计量为^Xp =现有一参量为1000的样本121000,,X X X ……,,且10001633ii X==∑则6330.6331000X ==,故收视率的极大似然估计值为0.633.(3)因E X p =,故^X p =是无偏估计(4)因()ln ()(1)1(1)d L p nX n X nX p dp p p p p -=-=---,又E X p=故收视率的最大似然估计X 是p 的有效估计。

数理统计大作业题目和答案0348

数理统计大作业题目和答案0348

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。

(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。

)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。

)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-n i i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2()~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑(~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

(完整word版)数理统计大作业1

(完整word版)数理统计大作业1

研究生课程考核试卷科目:数理统计教师: 李寒宇姓名: 蔡亚楠学号:20131102015t 专业:高电压与绝缘技术类别:学术型上课时间: 2014年3月至2014年5月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)相对地过电压数据的统计分析摘要:过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。

电力系统的过电压分布情况决定了电气设备的绝缘水平。

变电站过电压由于影响因素的随机性,使得过电压数据复杂且具有随机性。

本文结合电气工程专业的背景,分析了相对地过电压数据的分布规律。

首先对三相的过电压数据分别进行双样本同分布检验,采用两总体分布比较的假设检验方法。

检验结果显示三相的样本具有相同的分布规律,因此将三相的过电压数据合并进行总体的分布规律检验。

文中运用拟合优度2 检验法检验总体分布是否福才能够正态分布。

检验结果表明样本总体分布不服从正态分布,而是服从切断正态分布.针对相对地过电压数据的统计分析有助于确定设备的绝缘水平,具有一定的研究价值.关键词:过电压;假设检验;统计分布一、问题提出过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。

电力系统的过电压分布情况决定了电气设备的绝缘水平.由于过电压数据出现的随机性较大,且有明显的统计特征,因此在对单次过电压数据进行统计分析的同时,还可以用数理统计的方法对系统采集的多次样本进行统计分析研究,并预测过电压的概率分布规律,以便将所得结论用于确定设备及线路的绝缘水平,合理解决绝缘配合问题,使设备绝缘故障率或停电故障率降低到经济上和安全运行上可以接受的水平.二、数据描述本次研究以TR2000过电压在线监测装置在某变电站实地运行所采集的过电压数据进行分析。

该变电站的等级为110kV/38.5kV/10。

5kV,以往的运行经验发现,35kV侧事故频繁,属第一、二类等级符合用户较集中,故在35kV侧安装了一台TR2000过电压在线监测装置.通过对监测装置中导出的数据进行进制转换、图形显示、统计分析等手段,分析变电战过电压的规律,由此可以对电力系统设计、改造和故障分析等工作提供可靠的依据.根据现场情况,将暂态过电压记录倍率设定为1。

重庆大学硕士研究生数理统计课外大作业

重庆大学硕士研究生数理统计课外大作业

重庆大学硕士研究生“数理统计”课外作业学生:学号:201510****专业:动力工程专业重庆大学动力工程学院二O一五年十二月学号201510******* 姓名**** 学院****学院专业****专业成绩一元线性回归分析在风力发电中的应用摘要:能源短缺和环境恶化日益严重,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,风力发电的装机容量也越来越大。

风力机是风力发电机组重要的组成部分,实现风能向机械能的转化,机械能再通过直流发电机转发为电能,其中直流发电机输出的直流电压和风速紧密相关。

本文以课题研究中测得的实验数据为基础,对风力发电直流电输出和风速的线性相关关系进行计算分析,运用数理统计中一元线性回归分析及假设检验的相关知识,采用EXCEL软件进行辅助计算,最终得到了风力发电的直流电输出和风速的线性关系显著,对以后的课题研究具有一定的借鉴作用。

1 问题提出与分析在能源短缺和环境趋向恶化的今天,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,也越来越多地被应用到风力发电中。

风力机和发电机是风力发电机组中将风能转化为电能的重要装置,它们不仅直接关系到输出电能的质量和效率,也影响着整电量输出和风速的相关性。

风力机是风力发电机组重要的组成部分,其实现了风动能到风轮机轴机械能的转化,机械能通过直流电动机转发为电能,其中直流电动机产生的直流电压和风力紧密相关。

风力发电的设计和评价和电量输出与风速的关系密不可分,其中对于数学知识要求很高。

本文以课题研究中实验测得的数据为基础,对风力发电直流电输出和风速是否存在线性关系进行分析,运用数理统计中一元线性回归及非参数检验的相关知识,结合EXCEL软件进行辅助计算分析,最终得到了风力发电的直流电输出和风速关系,为以后科研工作和风力发电的应用具有指导意义。

综上所述,对风力发电的直流电输出和风速的研究,具有理论与实践的重要意义。

2 数据描述本文以风力发电的直流输出和风速的关系为研究对象,采用实验中观察得出的直流电输出和风速的部分数值进行计算分析,风力发电的直流电输出y(单位:MW)和风速x(单位:nmile/h)的数据如表1所示。

重庆大学数理统计试题(四套)

重庆大学数理统计试题(四套)

X (4)分析随机变量 S
24 的分布。
2
二 ( . 20 分) 设总体分布 X 的密度函数为 f x; c x 未知,求 (1)参数 的矩估计量 ˆ1 ; 1 ˆ ; (2)参数 g 的极大似然估计 g ˆ 无偏性,有效性和相合性。 (3)试分析 g
4
四、某公司的考勤员试图证实星期一的缺勤是其他四个工作日缺勤的两倍,已有三 月的缺勤记录如下表所示: 星期 缺勤数 给定显著水平 一 二 304 176 ,请用检验证实。 三 139 四 141 五 130
五、(20 分)合成纤维抽丝工段第一导丝盘的速度 y 对丝的质量是很重要的因素。如 由生产记录得相关数据 ( xi , yi ) ,i 1,2,...,10 , 今发现它与电流的周波 x 有密切的关系, 计算得到 x 49.61 , y 16.86 , l xx 1.989 , l xy 0.674 l yy 0.244 。 (1)求第一导丝盘的速度 y 与电流的周波 x 的经验回归直线方程; (2)在显著水平 0.05 下,检验 y 与 x 是否有显著的线性关系; (3)求 ,并求回归系数 1 的置信度为 95% 的置信区间。
六、设组观测数据(xi , yi )(i =1,2,…, n) 满足 yi =β0+β1(x- x ) +εi , 1 n εi ~ N (0,σ 2) (i =1,2,…, n)(其中 x= X i )且 ε1,ε2,…,εn 相互独立。 n 1 ˆ , ˆ; (1) 求系数 β0,β1 的最小二乘估计量
2 2 2 (1)当 n=17 时,求常数 k 使得 P( X Y 1 2 k S X SY 2S X ,Y ) 0.95
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生课程考核试卷(适用于课程论文、提交报告)科目:数理统计教师:刘琼荪姓名:xxx 学号:20150702xxx 专业:机械工程类别:学术上课时间:2016 年 3 月至2016 年 4 月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)我国上世纪70-90年代民航客运量回归分析摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展。

随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。

我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。

利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。

关键词:民航客运量影响因素回归模型一、问题提出及问题分析2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。

截止2004年底,我国定期航班航线达到1200条,其中国内航线(包括香港、澳门航线)975条,国际航线225条,境内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。

民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机。

2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位。

从上述事实可以看出我国民航的发展所取得的成果显著。

当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等[1]。

为了研究过去的情况,从中国统计年鉴[2]得到1994年统计摘要,分析类似因素对我国航空客运量的影响。

二、数据描述如下为所得统计数据:表1 1978-1993年统计数据三、模型建立:(1)提出假设条件,明确概念,引进参数;参考相关书籍[3],设随机变量民航客运量为Y (万人),解释变量1X ,2X ,3X ,4X ,5X 分别为国民收入(亿元),消费额(亿元),铁路客运量(万人),民航航线里程(万公里),来华旅游入境人数(万人),且回归函数11225501155(|,,,)E Y X x X x X x x x βββ==⋅⋅⋅==++⋅⋅⋅+,称201155,0,Y x x E D DY βββεεεσ=++⋅⋅⋅++===,为多元线性回归模型,015,,,βββ⋅⋅⋅为回归系数,ε为随机误差。

125(,,,,),1,2,,5i i i i x x x y i ⋅⋅⋅=⋅⋅⋅为上述来自多元线性回归模型的样本值,满足:201155125,0,,1,2,,5,,,,i i i i i i y x x E D i βββεεεσεεε⎧=++⋅⋅⋅++===⋅⋅⋅⎨⋅⋅⋅⎩相互独立为了便于对模型进行参数估计、模型检验、变量选择等,有必要对模型作如下一些基本假定。

1. 解释变量1X ,2X ,3X ,4X ,5X 是可控制的、非随机变量,互不相关。

2. 随机误差项具有零均值和同方差的性质,即2,1,2,,5i D i εσ==⋅⋅⋅,并且125,,,εεε⋅⋅⋅相互独立,则有(),0,,,1,2,5i j Cov i j i j =≠=…,εε。

3. 随机变量误差项服从正态分布,即()2~0,,1,2,5i N i =…εσ (2)模型构建:由表1通过EXCEL 绘制变量,1,2,,5i X i =⋅⋅⋅对因变量Y 的关系散点图如下:图1 民航客运量与国民收入关系图图2 民航客运量与消费额关系图图3 民航客运量与铁路客运量关系图图4 民航客运量与民航航线里程关系图图5 民航客运量与来华旅游入境人数关系图由以上的散点图看出:y 与3x 存在非线性关系,但与其它几个变量基本是线性相关的。

所以首先考虑回归模型为多元线性模型。

四、模型求解。

采用最小二乘估计法求解模型参数,采用SPSS 软件计算,得到如下结果:表2 拟合过程小结RR 平方调整后的 R 平方标准估算的错误Durbin-Watson(U)1.999a.998.99749.492401.993模型摘要b模型a. 预测变量:(常量),x5, x3, x4, x2, x1b. 因变量:y表3 方差分析平方和自由度均方F显著性回归13818876.76952763775.3541128.303.000b残差24494.981102449.498总计13843371.75015b. 预测变量:(常量),x5, x3, x4, x2, x1ANOVA a模型1a. 因变量:y表4 回归过程统计量标准系数B标准错误贝塔容许VIF (常量)450.909178.078 2.532.030x2-.561.125-2.485-4.478.001.0011740.508x1.354.085 2.447 4.152.002.0011963.337x3-.007.002-.083-3.510.006.315 3.171x421.578 4.030.531 5.354.000.01855.488x5.435.052.5648.440.000.04025.1931a. 因变量:y系数a模型非标准化系数t 显著性共线性统计图6 残差图则回归方程为12345450.9090.3540.5610.00721.5780.435y x x x x x =+--++五、模型分析检验(1)决定系数由决定系数2R =0.998看出回归方程高度显著。

(2)方差分析表123451128.303=0.000,,,y F P x x x x x =,值,这说明,整体上对有高度显著的影响。

(3)回归系数的显著性检验(t 检验):回归系数的显著性检验由显著性一列看出自变量的回归系数都通过了t 检验(即收尾概率小于规定的显著性水平0.05),说明5个自变量对y 的影响显著。

其中3x 铁路客运量的显著性为0.006最大,但仍小于5%。

(4)检验残差序列的自相关性(D-W 检验):D-W=1.993≈2,所以认为模型不存在序列的自相关性。

(6)异方差检验从残差图看出所有点落在±2之间,没有明显变化趋势,所以认为()2~0,,1,2,5i N i =…εσ综上,认为用最小二乘估计的方法估计的模型理论上是有效的。

(7) 模型进一步分析虽然,模型通过了检验,但是由之前的图可知2x 与y 正相关,但2x (国民消费额)的回归系数是负值,显然是矛盾的,同时1x 和2x 的VIF 很大,4x ,5x 的VIF 也大于10,其原因是自变量之间的共线性,因而回归模型还要就共线性问题进行谈论。

如下表是各变量之间的相关系数:表5 相关系数表可以看出, y 与1x ,2x ,4x ,5x 的相关系数都在0.9以上,说明所选自变量与y 高度线性相关,验证之前的散点图。

用y 与自变量作多元线性回归是适合的。

另一方面,3x 与各变量的相关系数均小于0.5,而1x ,2x ,4x ,5x 之间的相关系数均达到0.9以上,所以应尝试解决它们之间的共线性。

首先剔除VIF 最大的1x ,计算剩余变量参与的回归方程。

结果如下:表6 统计量表可以看出,当前2x 的VIF 最大,同时2x 也没通过t 检验,其显著性0.233远大于0.05,故继续剔除2x 。

计算剩余参数的回归方程,结果如下:表7 统计量表表8 拟合过程小结表9 方差分析表平方和df均方FSig.回归13766977.58134588992.527720.839.000残差76394.169126366.181总计13843371.75015Anovab模型1可以看出三个变量的VIF 均小于10,且均通过了t 检验。

说明此回归模型不存在强多重共线性,回归系数也有合理的经济解释。

20.994R 说明回归方程高度显著,方差分析的结果也说明回归方程显著性高。

图7 残差直方图图8 残差正态P-P 图由P-P 图和直方图可知残差服从正态分布,所以模型是有效的[4]。

所以民航客运量的回归模型为:345591.8760.0126.4360.317y x x x =-++。

六、岭回归模型除了上述方法,在处理自变量之间存在强线性相关的情况时,可以采用岭回归进行估计(虽然牺牲了一定的无偏性)[5]。

采用SPSS 编写程序运行可得到如下岭回归结果。

表10 K值表R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF KK RSQ x1 x2 x3 x4 x5______ ______ ________ ________ ________ ________ ________.00000 .99823 2.447386 -2.48510 -.083140 .530538 .563537.02000 .99233 .187301 .092804 -.095611 .457966 .300920.04000 .99085 .215764 .162616 -.086464 .389117 .260362.06000 .98998 .228824 .190661 -.081056 .356915 .243273.08000 .98932 .235679 .205373 -.076926 .337619 .233855.10000 .98873 .239543 .214116 -.073407 .324407 .227824.12000 .98816 .241760 .219676 -.070252 .314569 .223561.14000 .98759 .242981 .223345 -.067345 .306809 .220327.16000 .98699 .243559 .225800 -.064628 .300426 .217741.18000 .98636 .243702 .227435 -.062066 .295009 .215585.20000 .98571 .243539 .228490 -.059635 .290298 .213730图9 岭迹图由上述结果,可知RSQ均大于0.98,取K=0.85,再进行岭回归,得岭回归模型:表11 岭回归统计表可以看出除了3x 的回归系数为负,其余均为正,同时各变量的显著性检验均通过。

相关文档
最新文档