实验四-线性回归分析
简单回归分析

一、线性回归分析若是自变数与依变数都是一个,且Y 和X 呈线性关系,这就称为一元线性回归。
例如,以X 表示小麦每667m 2有效穗数,Y 表示小麦每667m 2的产量,有效穗数即属于自变数,产量即属于依变数。
在这种情形下,可求出产量依有效穗数而变更的线性回归方程。
在另一种情形下,两类变数是平行关系很难分出哪个是自变数,哪个是依变数。
例如,大豆脂肪含量与蛋白质含量的关系,依照需要确信求脂肪含量依蛋白质含量而变更的回归方程,或求蛋白质含量依脂肪含量而变更的回归方程。
回归分析要解决的问题要紧有四个方面:一是依如实验观看值成立适当的回归方程;二是查验回归方程是不是适用,或对回归方程中的回归系数的进行估量;三是对未知参数进行假设考试;四是利用成立起的方程进行预测和操纵。
(一)成立线性回归方程用来归纳两类变数互变关系的线性方程称为线性回归方程。
若是两个变数在散点图上呈线性,其数量关系可能用一个线性方程来表示。
这一方程的通式为:上式叫做y 依x 的直线回归。
其中x 是自变数,y ˆ是依变数y 的估量值,a 是x =0时的y ˆ值,即回归直线在y 轴上的截距,称为回归截距,b 是x 每增加一个单位时,y 将平均地增加(b >0时)或减少(b <0时) b 个单位数,称为回归系数或斜率(regression coefficient or slope )。
要使 能够最好地代表Y 和X 在数量上的互变关系,依照最小平方式原理,必需使将Q 看成两个变数a 与b 的函数,应该选择a 与b ,使Q 取得最小值,必需求Q 对a ,b 的一阶偏导数,且令其等于零,即得:()()⎩⎨⎧∑=∑+∑∑=∑+212xyx b x a yx b an ()()∑∑=--=-=nn Q bx a y yy Q 1min212ˆbx a y +=ˆ()1.7ˆbx a y+=由上述(1)解得:将()代入(2),那么得:()的分子 是x 的离均差与y 的离均差乘积总和,简称乘积和(sum of products ),可记为SP ,分母是x 的离均差平方和,也可记为SS x 。
《统计学》实验报告

图做准备。
实验二:主要是要求学生利用Excel的数据处理功能,掌握Excel
制图方法,能够较为准确地显示统计数据的发布特征。
实验三:分解分析法是分析时间序列常用的统计方法。季节时间序列是趋
势变动(T)、季节变动(S)、循环变动(C)和随机变动(I)综合影响的结果,分解过程要从原始序列中消除随机变动,然后分别识别出季节变动和趋势变动的变化模式。
实验二:
(1)直方图的绘制
(2)折线图的绘制
(3)饼形图的绘制
掌握统计数据的整理方法和Excel的几种基本统计制图操作方法;进一步学习统计数据的整理方法和Excel的基本操作理论。
实验三:
1、计算一次移动平均,消除随机波动
2、中心化移动平均数。
3、计算各个季节指数
4、计算平均季节指数。
5、计算调整后的季节指数
b.“高级筛选”使用“数据-筛选-高级筛选”菜单,调用对话框来实现筛选
3、数据的排序:靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列
4、Frequency函数
用途:以一列垂直数组返回某个区域中数据的频率分布。它可以计算出在给定的值域和接收区间内,每个区间包含的数据个数。
6、消除旅游人数序列中的季节变动。
7、对消除季节变动的旅游人数进行回归分析。
8、预测。
掌握时间序列的因素分解分析方法,将时间序列的分解分析方法理论与Excel的基本操作理论结合相结合。
实验四:
1、根据统计数据绘制散点图
2、计算相关系数
掌握实验的基本原理和方法:此分析可用于判断两组数据之间的关系。可以使用“相关系数”分析方法来确定两个区域中数据的变化是否相关,即一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关系数为零);结合使用相关分析的基本理论和Excel的基本操作理论。
统计学课内实验报告(详解+心得)1

一.实验目的与要求(一)目的实验一: EXCEL的数据整理与显示1. 了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;2. 熟悉EXCEL用于预处理的基本菜单操作与命令;3. 熟悉EXCEL用于整理与显示的基本菜单操作与命令。
实验二: EXCEL的数据特征描述、抽样推断熟悉EXCEL用于数据描述统计、抽样推断实验三: 时间序列分析掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作与命令。
实验四: 一元线性回归分析掌握EXCEL用于相关与回归分析的基本操作与命令。
(二)要求1.按要求认真完成实验任务中规定的所有练习;2.实验结束后要撰写格式规范的实验报告, 正文统一用小四号字, 必须有页码;3、实验报告中的图表制作要规范, 图表必须有名称和序号;4、实验结果分析既要简明扼要, 又要能说明问题。
二、实验任务实验一根据下面的数据。
1.1用Excel制作一张组距式次数分布表, 并绘制一张条形图(或柱状图), 反映工人加工零件的人数分布情况。
从某企业中按随即抽样的原则抽出50名工人, 以了解该企业工人生产状况(日加工零件数):117 108 110 112 137 122 131 118 134 114 124 125 123127 120 129 117 126 123 128 139 122 133 119 124 107133 134 113 115 117 126 127 120 139 130 122 123 123128 122 118 118 127 124 125 108 112 135 5091.2整理成频数分布表, 并绘制直方图。
1.3 假设日加工零件数大于等于130为优秀。
实验二百货公司6月份各天的销售额数据如下(单位:万元)257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269295(1)计算该百货公司日销售额的均值、众数、中位数;(2)计算该百货公司日销售额的极差、标准差;(3)计算日销售额分布的偏态系数和峰度系数。
实验四-线性回归分析

条件指数反映解释变量间多重共线性的指标。当0<=Ki<10时,多重共线性较弱;当 10<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。
❖分析→回归→线性→把课题总数放入因变量框;把投入人年 数、投入高级职称的人数、投入科研事业费、专著数、论文数、 获奖数放入自变量框→方法点向后→ 点统计量→ 选共线性诊 断、残差的Dubin-Watson→ 继续→确定→查看输出窗口
❖⑴绘制产量与生产费用的散点图,判断二者之间的关系形态。 ❖⑵计算产量与生产费用之间的线性相关系数 ❖⑶对相关系数的显著性进行检验(α=0.05),并说明二者之间的关 系强度。
❖正线性相关关系
❖r=0.92,P=0<α=0.05,拒绝原假设,表明产量与生产 费用之间的线性关系显著。
❖11.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统 计数据:
2、根据教材P274“SPSS计算相关系数的基本步骤”, 在练习1绘制散点图的基础上,对于案例8-1,练习通 过计算相关系数,判定分析家庭收入与打算购买的住 房面积之间相关关系的强弱。
❖分析→相关→双变量→把家庭收入、计划面积放入变量框→确定→查 看输出窗口→家庭收入与计划面积的简单相关系数为0.323,存在弱的 正相关。P=0<0.01=α,认为两总体不是零相关。
一实验目的掌握spss绘制散点图和计算相关系数的方法掌握回归分析的一般步骤和回归的统计检验包括回归方程的拟合优度检验回归方程的显著性检验回归系数的显著性检验和残差分析二实验内容1练习教材中p264案例81通过绘制散点图分析家庭收入与打算购买的住房面积存在怎样的统计关系数据文件为住房状况调查
❖一、实验目的 ❖掌握spss 绘制散点图和计算相关系数的方法 ❖掌握回归分析的一般步骤和回归的统计检验 (包括回归方程的拟合优度检验、回归方程的显 著性检验、回归系数的显著性检验和残差分析)
计量经济学实验报告

计量经济学实验报告:马艺菡学号:4班级:9141070302任课教师:静文实验题目简单线性回归模型分析一实验目的与要求目的:影响财政收入的因素可能有很多,比如国生产总值,经济增长,零售物价指数,居民收入,消费等。
为研究国生产总值对财政收入是否有影响,二者有何关系。
要求:为研究国生产总值变动与财政收入关系,需要做具体分析。
二实验容根据1978-1997年中国国生产总值X和财政收入Y数据,运用EV软件,做简单线性回归分析,包括模型设定,模型检验,模型检验,得出回归结果。
三实验过程:(实践过程,实践所有参数与指标,理论依据说明等)简单线性回归分析,包括模型设定,估计参数,模型检验,模型应用。
(一)模型设定为研究中国国生产总值对财政收入是否有影响,根据1978-1997年中国国生产总值X和财政收入Y,如图11978-1997年中国国生产总值和财政收入(单位:亿元)1996 66850.5 7407.991997 73452.5 8651.14根据以上数据作财政收入Y 和国生产总值X的散点图,如图2从散点图可以看出,财政收入Y和国生产总值X大体呈现为线性关系,所以建立的计量经济模型为以下线性模型:(二)估计参数1、双击“Eviews”,进入主页。
输入数据:点击主菜单中的File/Open/EV Workfile—Excel—GDP.xls;2、在EV主页界面点击“Quick”菜单,点击“Estimate Equation”,出现“Equation Specification”对话框,选择OLS估计,输入““y c x”,点击“OK”。
即出现回归结果图3;参数估计结果为:Y=857.8375+0.100036iX(67.12578)(0.002172)t=(12.77955)(46.04910)2r=0.991583F=2120.520S.E.=208.5553DW=0.864 0323、在“Equation”框中,点击“Resids”,出现回归结果的图形(图4):剩余值(Residual)、实际值(actual),拟合值(fitted)4、.(三)模型检验1.经济意义检验回归模型为:Y=857.8375+0.100036*X(其中Y为财政收入,iX为国生产总值;)所估计的参数=0.100036,说明国生产总值每增加1亿元,财政收入平均增加0.100036亿元。
线性回归实验总结

线性回归实验总结线性回归是一种分析数据的统计学方法,可以用来预测和描述定义两个变量之间的关系,可以用于研究两个或更多的变量之间的影响,也可以通过线性回归来探究各变量对结果的贡献。
本文对线性回归进行了一次实验,并对实验结果进行了总结。
1.验背景线性回归是一种用于确定变量之间相互影响的统计方法。
影响可以是某一变量对另一变量的影响,也可以是多个变量都影响另一个变量的影响。
本次实验的目的是研究四个变量(营销投入、品牌认知度、社交媒体活动和客户忠诚度)对销售额的影响。
2.验方法(1)为了实现实验的目的,我们首先收集了有关4个变量以及销售额的长期数据,包括每季度营销投入、每年品牌认知度、每周社交媒体活动和每月客户忠诚度。
(2)我们使用SPSS软件分析数据,得出R Square(R2)值,用来衡量4个变量对销售额的影响。
(3)使用回归分析,来检验4个变量对销售额的影响,得出回归系数。
3.验结果(1)R Square(R2)值 0.7,说明4个变量对销售额的影响程度占整个因变量的70%。
(2)回归分析结果显示:营销投入的系数最高,为0.53,表明营销投入对销售额影响最大;其次是品牌认知度,系数为0.32;社交媒体活动系数为0.17;最后是客户忠诚度,系数为0.11。
4.验结论本次实验表明,营销投入、品牌认知度、社交媒体活动和客户忠诚度与销售额的关系十分密切,如果想要提高销售额,企业可以增加对营销投入的预算,提高对品牌的认知度,拓展社交媒体活动,提高客户忠诚度。
5.验建议(1)可以进一步开展临床实验,来详细了解4个变量以及销售额之间的关系,以此得出更加精准的结论。
(2)实验时间跨度较短,可以开展更长时间的实验,以证实线性回归模型的有效性。
(3)可以收集更加丰富的变量,来更加准确的解释4个变量的影响。
本次线性回归实验表明,营销投入、品牌认知度、社交媒体活动和客户忠诚度对销售额的影响十分显著,企业可以在此基础上采取合理的措施,以提高市场营销的效率。
实验四 数据分析___方差和回归分析

实验四数据分析----方差和回归分析班级:10级人力资源管理学号:1003131014 姓名:李绍林一、实验目的1.掌握单因素方差分析过程。
2.掌握双因素方差分析过程。
3.掌握一元线性回归分析过程。
4.掌握多元线性回归分析过程。
5.掌握残差分析过程。
二、实验内容1.Analyze|Compare Means|One-Way ANOVA…命令。
2.Analyze|General Linear Model|Univariate…命令。
3.Analyze|Regression|Linear…命令。
三、预习要求1.准备好一个数据文件,个案数量越多越好。
2.熟悉方差分析的统计思想和统计原理。
3.熟悉线性回归模型、参数估计方法和显著性检验方法。
4.熟悉残差分析思想及各种残差图的作用。
四、参考书目《统计分析方法与SPSS应用教程》(杨小平主编)第七章和第八章。
五、实验步骤1.打开数据文件“小汽车耗油量.sav”,在Analyze的下拉菜单中选中CompareMeans 在右侧的菜单中选中One-Way ANOVA,在打开的One-Way ANOVA对话框中将“耗油量”选中并放入Dependent list列表框中,将“汽车品牌”选中放入Factor列表框中,在Options 按钮中选中Descriptive选项、Homongeneity of variance test选项,其他均默认。
2.打开数据文件“广告效果.sav”, 在Analyze的下拉菜单中选中General LinearModel 在右侧的菜单中选中Unvariate,在打开的Unvariate对话框中将“销售额”选中并放入Dependent variable列表框中,将“广告方式”、“销售地区”选中放入Fixed Factor(s)列表框中,打开Model按钮,在其对话框中将“广告方式”、“销售地区”选入Model,按住Ctrl,将两者同时选入,单击Post Hoc按钮,选用LSD法进行多重比较;在Options 按钮中选中Descriptive选项、选中Homongeneityt选项,其他均默认。
spss实验四、实验步骤

实验四:SPSS一元线性相关回归分析预测为了了解某地母亲身高x与女儿身高Y的相关关系,随机测得10对母女的身高如下表所示:1.画出x、Y散点图,观察因变量与自变量之间关系是否有线性特点;2.试对x与Y进行一元线性回归分析,列出一元线性回归预测模型;3.预测当母亲身高为161cm时女儿的身高?1.画出x、Y散点图,观察因变量与自变量之间关系是否有线性特点;[实验步骤](1)在数据编辑窗口中打开“母女身高.sav”。
(2)选择菜单:【图形】→【旧对话框】→【散点/点状】(3)出现下面的对话框。
(4)点击【简单分布】按钮,出现下面对话框。
(5)将变量“女儿身高”、“母亲身高”依次选入Y轴与X轴,单击【确定】按钮即可。
2.试对x与Y进行一元线性回归分析,列出一元线性回归预测模型;[实验步骤](1)在数据编辑窗口中打开“母女身高.sav”。
(2)选择菜单:【分析】→【回归】→【线性】(3)这时将出现以下对话框,在左侧变量框中选择“女儿身高”,单击右向按钮,选入右侧上方的“因变量”框中,作为模型的被解释变量。
再选择“母亲身高”,单击右向按钮,选入右侧下方的“自变量”框中,作为模型的解释变量。
(4)单击【统计量】按钮,弹出“线性回归:统计量”对话框,如下图所示。
在“回归系数”框中选择“估计”。
(5)单击【继续】按钮回到线性回归分析对话框。
单击【绘制】按钮,打开“线性回归分析:图形”对话框,如下图所示。
从左边变量框中选择变量决定绘制何种散点图,这里分别把因变量(DEPENDNT)和标准化残差(ZRESID)选为Y和X轴来进行绘图,通过观察残差图我们可以验证回归模型是否符合经典回归模型的基本假设。
(6)单击【继续】按钮,回到线性回归分析对话框。
单击【保存】按钮,打开“线性回归分析:保存”对话框,如下图所示。
选择此对话框的选项,可决定将预测值、残差或其他诊断结果值作为新变量保存于当前工作文件或是保存到新文件。
在“预测值”框中选择“标准化”和“未标准化”的预测值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖二、实验内容
❖1、练习教材中P264案例8-1,通过绘制散点图, 分析家庭收入与打算购买的住房面积存在怎样的 统计关系,数据文件为“住房状况调查.sav”
4、条件指数
条件指数反映解释变量间多重共线性的指标。当0<=Ki<10时,多重共线性较弱;当 10<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。
❖分析→回归→线性→把课题总数放入因变量框;把投入人年 数、投入高级职称的人数、投入科研事业费、专著数、论文数、 获奖数放入自变量框→方法点向后→ 点统计量→ 选共线性诊 断、残差的Dubin-Watson→ 继续→确定→查看输出窗口
❖1、容忍度
是测量解释变量间多重共线性的重要统计量。容忍度的取值范围在0~1之间,越接近于0 表示多重共线性越强;越接近于1表示多重共线性越弱。
2、方差膨胀因子
方差膨胀因子是容忍度的倒数,方差膨胀因子的取值大于等于1。通常,如果膨胀因子大 于等于10,说明解释变量xi与方程中其余解释变量之间有严重的多重共线性。
❖复合函数的拟合优度高于幂函数,值的增长速度高于幂函数,从居民消费 未来趋势看,教育支出将可能占消费性支出的较大比例,并呈快速增长的趋 势,因此,采用复合函数。方程是 教育支出=20.955× 说明复合 函数拟合高于幂函数。
❖案例9-3
❖拟合优度R方=0.938,比较理想;回归方程显著的显著性检验: P=0<0.05,通过检验;回归方程系数的显著性检验:P=0<0.05,通过检验, 说明模型可用;回归方程是 在外就餐=12.522*e0.154个案顺序
❖在外就餐的拟合回归线;2003,2004年的预测值分 别为683.49853,797.2。
单样本柯尔莫哥洛夫-斯米诺夫检验
❖分析→回归→线性→保存,选残差中的标准化→继续→确定→分析→非参数检验 →1样本k-s(1) →把standardized residual 放入检验变量列表→确定→查看输出窗 口→P=0.809,表明标准化残差和标准正态分布不存在显著差异,可以认为残差满 足了线性模型的前提要求。
❖⑴人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 ❖⑵计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 ❖⑶利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 ❖⑷计算判定系数,并解释其意义。 ❖⑸检验回归方程线性关系的显著性(α=0.05) ❖⑹如果某地区的人均GDP为5000元,预测其人均消费水平。 ❖⑺求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
❖分析→回归→线性→保存,选距离中cook距离,杠杆值→继续→确定→ 查看输出窗口→没有发现强影响点。(库克距离大于1对应的解释变量为 强影响点。杠杆值越高,对应的解释变量就越可能是强影响点)
❖*4、练习教材中P320案例9-2、案例9-3,了解曲 线估计的一般原理和操作方法。对应的数据文件 为“年人均消费支出和教育.sav”。
❖图形→散点→矩阵分布→把变量放入矩阵变量中→确定→从图中看它 们之间都有一定的线性关系。不良贷款与贷款余额的线性关系比较密 切,与固定资产投资最不密切。
❖分析→相关→双变量→把要分析的变量放入变量框中→确定→查看输出 窗口→不良贷款与其他变量都属于正线性相关关系,其中与各项贷款余额 最密切(r=0.844),与本年度固定资产最不密切(r=0.519)。
特征根 条件指数 方差比(比例之和等于1)
❖回归方程的显著性检验:P=0<α=0.05应拒绝原假设,认为各回归系数不同时为0,被 解释变量与解释变量全体的线性关系是显著的,可建立线性模型。回归系数显著性检 验:有的P>α=0.05,因此不拒绝原假设,认为这些偏回归系数与0无显著差异,它们与 被解释变量的线性关系是不显著的,不应保留在方程中。从容忍度和方程膨胀因子看, 投入高级职称的人年数与其他变量的多重共线性很严重,可考虑剔除该变量。第七个 特征根既能解释投入人年数方差的84%,也能解释高级职称的人年数方差的98%,还 可以解释专著数方差的44%,这些变量存在多重共线性;5,6,7条件指数都大于10。
❖分析→相关→双变量→把家庭收入、计划面积放入变量框→确定→查 看输出窗口→家庭收入与计划面积的简单相关系数为0.323,存在弱的 正相关。P=0<0.01=α,认为两总体不是零相关。
❖3、练习教材中P309案例9-1,掌握线性回归分析的 基本操作,理解回归参数的普通最小二乘估计的原理, 掌握回归方程的拟合优度检验、回归方程显著性检验、 回归系数显著性检验、残差分析的基本概念、原理和 判断规则。数据文件为“高校科研研究.sav”
❖分析→回归→线性→绘制→把ZRESD放入Y轴、ZPRED放入X轴;继续→确定→ 查看输出窗口→随着标准化预测值的变化,残差点在0线周围随机分布,但残差的 等方差性并不完全满足,方差似乎有增大的趋势。分析→回归→线性→保存→在残 差中选标准化,在预测值中选标准化→继续→确定→分析→相关→双变量→把预测 值和残差值选到变量窗口,相关系数选spearman →确定→查看输出窗口→说明残 差与预测值的spearman等级相关系数为-0.176,且P=0.344,检验不显著,因此认 为异方差现象并不明显。
收集到1981-2002年居民在外就餐消费的数据, 现希望对居民未来在外就餐的趋势进行分析和预 测。数据“年人均消费支出和教育.sav”
❖分析→预测→序列图→把在外就餐放入变量框,把年份放入 时间轴标签→确定→查看输出窗口→大致呈指数形式,可利用 曲线估计进行分析。
❖分析→回归→曲线估计→因变量在外就餐;自变量年份→模型选指数分 布,点保存,预测值,预测范围,观测值输入27 →继续→确定→查看输出 窗口
❖图形→旧对话框→散点图→简单分布→定义→把计划面积放入Y轴; 家庭收入放入X轴→确定→查看输出窗口→说明大部分的数据点集中 在一定区域中,有少部分数据点“脱离”整体数据较远,家庭收入与 计划购买住房面积之间存在一定正的弱相关。
2、根据教材P274“SPSS计算相关系数的基本步骤”, 在练习1绘制散点图的基础上,对于案例8-1,练习通 过计算相关系数,判定分析家庭收入与打算购买的住 房面积之间相关关系的强弱。
1.试绘制散点图,并分析不良贷款与贷款余额、累计应收贷款、 贷款项目个数、固定资产投资额之间的关系; 2.计算不良贷款、贷款余额、累计应收贷款、贷款项目个数、固 定资产投资额之间的相关系数; 3.求不良贷款对贷款余额的估计方程; 4.检验不良贷款与贷款余额之间线性关系的显著性(α=0.05); 回归系数的显著性(α=0.05); 5.绘制不良贷款与贷款余额回归的残差图。
❖拟合优度的检验:经过六步,完成回归方程的建立,最终为第六个模 型。随着解释变量的不断减少,方程的拟合优度下降了。说明建立回归 方程并不是一味追求高的拟合优度为唯一目标的,还要重点考察解释变 量是否对被解释变量有贡献。方程的DW检验值为1.747,残差存在一定 程度的正自相关。(P296)
❖最终方程为第六个:P=0<α=0.05,被解释变量与解释变量间 的线性关系显著,建立线性模型是恰当的。
❖第六个模型:P=0<α=0.05,说明投入人年数与被解释变量间的线性关系显著, 它保留在模型中是合理的。最终方程是 立项课题数=-94.524+0.492投入人年数 意味着投入人年数每增加一个单位会使立项课题数增加0.492个单位。注:通常情 况下,即使常数项在模型中不显著,我们也会在模型中保留,去掉它会对模型带 来不利的影响。
❖案例9-2 收集到1990-2002年全国人均消费性支出和教育支 出的数据,希望对居民家庭教育支出和消费性支 出之间的关系进行研究。文件名“年人均消费支 出和教育.sav”
❖散点图:图形→旧对话框→散点图→简单分布→定义→教育支出放Y轴, 年人均消费性支出放X轴→确定→查看输出窗口→说明两变量之间呈非线 性关系,可尝试二次曲线、三次曲线、复合函数、幂函数模型。
二、实验作业: •一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施 建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该 银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银 行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,管理者 希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款 的办法。该银行所属的25家分行2002年的有关业务数据是“例 11.6.xls”。
❖分析→回归→线性→把课题总数放入因变量框;把投入人年 数、投入高级职称的人数、投入科研事业费、专著数、论文数、 获奖数放入自变量框→方法点进入→ 点统计量→ 选共线性诊断 → 继续→确定→查看输出窗口→由于该方程中含有多个变量, 所以看调整R方=0.924,拟合优度较高,被解释变量可以被模型 解释的部分较多,不能被解释的部分较小。
3、特征根和方差比
特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。最大特征根的 值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅 通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。
解释变量标准化后它的方差为1。如果某个特征根既能够刻画某解释变量方差的较大部分 (0.7以上),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量 间存在较强的线性相关关系。
2.练习《统计学》教材P330 练习题11.1、 11.6、11.7、11.8、11.15,对应的数据文件 为“习题11.1.xls”、 “习题11.6.xls”、 “习 题11.7.xls”、 “习题11.8.xls”、 “习题 11.15.xls”。(任选两题)
❖11.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: