实验三-回归分析

实验三-回归分析
实验三-回归分析

实验三 回归分析

1.为了分析X 射线的杀菌作用,用200千伏的X 射线来照射细菌,每次照射6分钟用平板计数法估计尚存活的细菌数,照射次数记为 t ,照射后的细菌数y 如表1所示。

表1 X 射线照射次数与残留细菌数

试求:①给出y 与t 的二次函数回归模型;②在同一坐标系内做出原始数据与拟合结果的散点图;③预测t=16时残留的细菌数;④根据问题实际意义,你认为选择多项式函数是否合适?⑤给出非线性回归模型,并预测照射16次后细菌残留数目。

解:(1)实验程序: t=1:15;

y=[352 211 197 160 142 106 104 60 56 38 36 32 21 19 15];

rstool(t',y','purequadratic')

结果如图1所示:

50100150200250300350

图1

在Matlab 工作区中输入命令:beta ,rmse

beta =347.8967 -51.1394 1.9897 rmse =22.2649

所以y 与t 的二次回归模型函数:29897.11394.518967.347t t y +-= (2)画出同一坐标散点图,如图2所示,程序如下: [p,s]=polyfit(t,y,2); Y=polyconf(p,t,y); plot(t,y,'k+',t,Y,'r')

051015

50100150200250300350

400

图2 散点图

(3)当t=16时,计算程序如下: [p,s]=polyfit(t,y,2); Y=polyconf(p,16); 结果是:Y =39.0396

即说明预测残留的细菌数y=39.0396个;

(4)用二次函数计算出细菌残留数为39.0396,显然与实际不相符合。根据实际问题的意义可知:尽管二次多项式拟合效果较好,但是用于预测并不理想。因此,如何根据原始数据散点图的规律,选择适当的回归曲线是非常重要的,因此有必要研究非线性回归分析。

(5)由(2)散点图可知,可以假设将要拟合的的非线性模型为t /b ae y =对将要拟合的非线性模型t /b ae y =,建立的M-文件volum.m 如下: function yhat=volum(beta,t) yhat=beta(1)*exp(beta(2).*t);

%输入数据 t=1:15;

y=[352 211 197 160 142 106 104 60 56 38 36 32 21 19 15]; beta0=[150,0]';

%求回归系数

[beta,r,J]=nlinfit(t',y','volum',beta0); beta

y=nlpredci('volum',16,beta,r,J)

得结果:beta =400.0905 -0.2240,y =11.1014,即回归模型为:

t e y 2240.0-0905.400=,那么根据此模型我们可以知道:当t=16时,残留的细菌数y=11.1014,很显然这样的结果会更令人满意!

2.某销售公司将库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据作了汇总(表 2),该公司试图根据这些数据找到销售额与其他变量之间的关系,以便进行销售额预测并为工作决策提供参考依据。(1)建立销售额的回归模型;(2)如果未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为27万元,试根据建立的回归模型预测该月的销售额。

表2 库存资金额、广告投入、员工薪酬、销售额汇总表(单位:万元)

月份 库存资金额(x1) 广告投入(x2) 员工薪酬总额(x3) 销售额(y)

1 75.

2 2 77.6

3 80.7

4 76.0

5 79.5

6 81.8

7 67.7

8 98.3

9 74.0 10 151.0 11 90.8 12 102.3 13 115.6 14 125.0 15 137.8 16 175.6 17 155.2 18 174.3

解:首先,作出因变量与各自变量的样本散点图,如图3所示,程序如下:

x1=[75.2 77.6 80.7 76.0 79.5 81.8 67.7 98.3 74.0 151.0 90.8 102.3 115.6 125.0 137.8 175.6 155.2 174.3];

x2=[30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4];

x3=[21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8];

y=[1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 1407.1 1551.3 1601.2 2311.7 2126.7 2256.5]; subplot(1,3,1),plot(x1,y,'g*'); subplot(1,3,2),plot(x2,y,'k+'); subplot(1,3,3),plot(x3,y,'ro');

21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8 1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 1407.1 1551.3 1601.2 2311.7 2126.7 2256.5

30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4

图3 因变量y 与各自变量的样本散点图

从图上可以看出这些点大致分布在一条直线旁边,因此有较好的线性关系,

可以采用线性回归。设回归方程为:3322110?????x x x y ββββ+++=,建立M-文件输入如下程序:

x1=[75.2 77.6 80.7 76.0 79.5 81.8 67.7 98.3 74.0 151.0 90.8 102.3 115.6 125.0 137.8 175.6 155.2 174.3];

x2=[30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4];

x3=[21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8];

y=[1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 1407.1 1551.3 1601.2 2311.7 2126.7 2256.5]; n=18;m=3;

x=[ones(n,1),x1',x2',x3'];

[b,bint,r,rint,s]=regress(y',x,0.05); b,bint,r,rint,s

运行后即得到结果如表3所示

表3 对初步回归模型的计算结果

残差列向量r =[44.0394 59.3264 96.5750 -35.3239 179.3461 -36.4116 180.2202 -244.3408 -99.0812 84.1521 -184.5600 67.5082 -33.4048 -89.1104 -159.6274 69.7451 44.7425 56.2050]T

对应残差的)1(α-置信区间rint 如下:

[-228.8318,316.9105]、 [-214.8092,333.4620] [-173.5015,366.6515]、 [-311.2066,240.5589] [-75.9312,434.6233]、 [-313.1813, 240.3581] [-69.6357,430.0762]、 [-449.7576,-38.9240] [-365.7729,167.6105]、 [-69.8815,238.1857] [-428.0384,58.9185]、 [-208.3399,343.3563] [-312.3682, 245.5587]、[-199.0870,20.8662] [-415.9094,96.6547]、 [-172.6973,312.1875] [-207.2697,296.7547]、 [-186.8695,299.2794]。

因此得到初步的回归方程为:3215698.92879.157252.59075.53-?x x x y

+++=,当未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为

27万元,那么根据所建立的回归模型可以预测出该月的销售额为1751.2万元。

3.葛洲坝机组发电耗水率的主要影响因素为库水位、出库流量。现从数据库中将 2005年10月某天15时-16时06分范围内的出库流量、库水位对应的耗水率读取处理,数据如表4所示,试利用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。(表4数据来源:余波,多元线性回归分析在机组发电耗水率中的应用,计算机与现代化,2008(2))

表4 耗水率与出库流量、库水位数据

时间 库水位(米) 出库流量 机组发电耗水率 (年-月-天-时) (立方米) (立方米/万千瓦)

解:首先,作出耗水率y 与各自变量的样本散点图,如图4所示,程序如下:

x1=[65.08 65.10 65.12 65.17 65.21 65.37 65.38 65.39 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84];

x2=[15607 15565 15540 15507 15432 15619 15536 15514 15519 15510 15489 15437 16355 14708 14393 14296];

y=[60.46 60.28 60.10 59.78 59.44 59.25 58.91 58.76 58.73 58.63 58.48 58.31 57.96 57.06 56.43 55.83]; subplot(1,2,1),plot(x1,y,'g*'); subplot(1,2,2),plot(x2,y,'k+');

x 10

4

图4 耗水率y 与库水位、出库量关系散点图

65.08 65.10 65.12 65.17 65.21 65.37 65.38 65.39 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84

2005-10-15:00 2005-10-15:02 2005-10-15:04 2005-10-15:06 2005-10-15:08 2005-10-15:10 2005-10-15:12 2005-10-15:14 2005-10-15:16 2005-10-15:18 2005-10-15:20 2005-10-15:22 2005-10-16:00 2005-10-16:02 2005-10-16:04 2005-10-16:06

15607 15565 15540 15507 15432 15619 15536 15514 15519 15510 15489 15437 16355 14708 14393 14296

60.46 60.28 60.10 59.78 59.44 59.25 58.91 58.76 58.73 58.63 58.48 58.31 57.96 57.06 56.43 55.83

从散点图中可以看出机组发电耗水率y 与库水位1x 有较好的线性关系,而与出库流量2x 的关系难以确定,可以采用建立二次函数的回归模型。一般的多元二项式回归模型可表示为:εβ

βββ++

+++=∑≤≤m

k j k j jk

m m x x x x y ,1110...。程序如下:

x=[x1',x2'];

rstool(x,y,'interaction',0.05) % 包含线性项和完全二次项(交叉)

结果得到交互式化面,如图5所示

图5 耗水率y 与库水位、出库流量的一个交互界面

在左边图形下方的方框中输入65.40,右边图形下方的方框中输入15519,则画面左边的‘Predicted Y ’下方的数据变为58.7291,其置信区间在16162.07291.58±,即表明预测出库水位为65.40米,出库流量为15529立方米时的机组发电耗水率为58.7291立方米/万千瓦。

在画面左下方的下拉式菜单Export 里选“all ”,则beta 、rmse 和residuals 的值都发送到MATLAB 界面,只需在MATLAB 界面中输入:beta ,rmse ,residuals 即可得到结果如下:

beta =-559.9056 9.2385 0.0611 -0.0009 rmse= 0.1643

residuals =0.0079 -0.0189 -0.0674 -0.0963 -0.1520 0.2737 0.0638 -0.0149 0.0009 0.0605 0.1302 0.3036 -0.2672 -0.1403 -0.0481 -0.0356 故该多元线性回归模型:21210009.0-0611.02385.99056.559-x x x x y ++=,剩余标准差为0.1643,说明此回归模型的显著效果很好。

x 10

4

回归分析 实验报告

城镇居民家庭收入的逐步回归分析 07级数学1班盛平0707021012 摘要:用多元统计中逐步回归分析的方法和SAS软件解决了可支配收入与其他收入之间的关系,并用此模型预测在以后几年里居民平均每人全年家庭可支配收入。 关键词:逐步回归分析多元统计SAS软件 正文 1 模型分析 各地区城镇居民平均每人全年家庭可支配收入y与工薪收入x1、经营净收入x2、财产性收入x3和转移性收入x4有关,共观测了15组数据,试用逐步回归法求‘最优’回归方程。 各地区城镇居民平均每人全年家庭收入来源(2007年) 单位:元 2模型的理论 (1)基本思想:逐个引入自变量,每次引入对y影响最显著的自变量,并对方程中的老变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中既不漏掉对Y影响显著的变量,又不包含对Y影响不显著的变量。 (2)逐步筛选的步骤:首先给出引入变量的显著性水平 和剔除变量的显著性 in

水平 ;然后按图4.1的框图筛选变量。 out 3模型的求解 (1)源程序: data ch; input x1 x2 x3 x4 x5 y @@; cards; 28.2 47.9 44.1 3.8 23.9 100.0 31.3 47.1 43.6 3.5 21.6 100.0 30.2 48.2 43.9 4.3 21.6 100.0 ?? 31.9 46.1 41.9 4.2 22.0 100.0 33.4 44.8 40.6 4.1 21.8 100.0 33.2 44.4 39.9 4.5 22.4 100.0 32.1 43.1 38.7 4.4 24.8 100.0 28.4 42.9 38.3 4.6 28.7 100.0 ?? 27.2 43.7 38.6 5.1 29.1 100.0

SPSS实验报告_线性回归_曲线估计

《数据分析实务与案例实验报告》 曲线估计 学号:2013111104000614 班级:2013 应用统计 姓名: 日期: 2 0 1 4 – 12 – 7 数学与统计学学院

一、实验目的 1. 准确理解曲线回归分析的方法原理。 2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。 3. 熟练掌握曲线估计的SPSS 操作。 4. 掌握建立合适曲线模型的判断依据。 5. 掌握如何利用曲线回归方程进行预测。 6. 培养运用多曲线估计解决身边实际问题的能力。 二、准备知识 1. 非线性模型的基本内容 变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。 下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。 乘法模型: 123y x x x βγδαε= 其中α,β,γ,δ 都是未知参数,ε是乘积随机误差。对上式两边取自然对数得到 123ln ln ln ln ln ln y x x x αβγδε=++++

上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是2ln (0,)n N I εδ: , 而不是2n N I εδ:(0,) ,因此检验之前,要先检验ln ε 是否满足这个假设。 三、实验内容 已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D 生产函数验证了劳动和资本对经济增长的影响机理。所有这些研究都极少将劳动、资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。 现从我国能源消费、全社会固定资产投资和就业人员的实际出发,假定生产技术水平在短期能不会发生较大变化,经济增长、全社会固定资产投资、就业人员、能源消费可以分别采用国内生产总值、全社会固定资产投资总量、就业总人数、能源消费总量进行衡量,并假定经济增长与能源消费、资本和劳动力的关系均满足C-D 生产函数。 问题中的C-D 生产函数为: Y AK L E αβγ= 式中:Y 为GDP ,衡量总产出;K 为全社会固定资产投资,衡量资本投入量;L 为就业人数,衡量劳动投入量;E 为能源消费总量,衡量能源投入量;A,α,β, γ 为未知参数。根据C-D 函数的假定,一般情形α,β,γ均在0和1之间,但当α,β,γ中有负数时,说明这种投入量的增长,反而会引起GDP 的下降,当α,β,γ中出现大于1的值时,说明这种投入量的增加会引起GDP 成倍增加,这在经济学现象中都是存在的。 以我国1985—2004年的有关数据建立了SPSS 数据集,参见

(实验2)多元回归分析实验报告

陕西科技大学实验报告 课 程: 数理金融 实验日期: 2014 年 5 月 22 日 班 级: 数学112 交报告日期: 2013 年 5 月 23 日 姓 名: 常海琴 报告退发: (订正、重做) 学 号: 201112010101 教 师: 刘利明 实验名称: 多元回归分析 一、实验预习: 1.多元回归模型。 2.多元回归模型参数的检验。 3.多元回归模型整体的检验。 二、实验的目的和要求: 通过案例分析掌握多元回归模型的建立方法和检验的标准;并掌握分析解决实际金融问题的能力。 三、实验过程:(实验步骤、原理和实验数据记录等) 软件:Eviews3.1 数据:给定美国机动车汽油消费量研究数据。 实验原理:最小二乘法拟合多元线性回归方程 数据记录: 实例中1950年到1987年机动汽车的消费量、汽车保有量、汽油价格、人口数、国民生产总值 图1各个量之间的关系

陕西科技大学理学院实验报告 - 2 - 1、录入数据 图2录入数据 2、回归分析 443322110X X X X Y βββββ++++= 图3运行结果 Y=24553723+1.418520x1-27995762x2-59.87480x3-30540.88x4 S (25079670) (0.266) (5027085) (198.5517) (9557.981) T (0.979) (5.314) (-5.568) (-0.301) (-3.195) 2R =0.966951 F=241.3764 - R =0.9629 dw=0.6265 四、实验总结:(实验数据处理和实验结果讨论等) 用残差和最小确定直线位置是一个途径。计算残差和有相互抵消的问题。用残差绝对值和最小确定直线位置也是一个途径绝对值计算起来比较麻烦。最小二乘法用绝对值平方和最小确定直线位置。0β、1β、2β、3β、4β具有线性特性,无偏特性,有效性。-R =0.9629基本上接近于1,拟合效果较好。

多元线性回归SPSS实验报告

回归分析基本分析: 将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图 注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。 第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。 第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。 第五列:回归方程的估计标准误差=9.822 回归方程的显著性检验-回归分析的方差分析表 F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。 注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。 第四列:标准化偏回归系数。 第五列:偏回归系数T检验的t统计量。 第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。 于是,多元线性回归方程为: y=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6 回归分析的进一步分析: 1.多重共线性检验 从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

回归分析实验报告

实验报告 实验课程:[信息分析] 专业:[信息管理与信息系统] 班级:[ ] 学生姓名:[ ] 指导教师:[请输入姓名] 完成时间:2013年6月28日

一.实验目的 多元线性回归简单地说是涉及多个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。本实验要求掌握附带残差分析的多元线性回归理论与方法。 二.实验环境 实验室308教室 三.实验步骤与内容 1打开应用统计学实验指导书,新建excel表 2.打开SPSS,将数据输入。 3.调用SPSS主菜单的分析——>回归——>线性命令,打开线性回归对话框,指定因变量(工业GDP比重)和自变量(工业劳动者比重、固定资产比重、定额资金流动比重),以及回归方式;逐步回归(图1)

图1 线性对话框 4.在统计栏中,选择估计以输出回归系数B的估计值、t统计量等,选择Duribin-watson以进行DW检验;选择模型拟合度输出拟合优度统计量值,如R^2、F统计量值等(图2)。 图2 统计量栏

5.在线性回归栏中选择直方图和正态概率图以绘制标准化残差的直方图和残差分析与正态概率比较图,以标准化预测值为纵坐标,标准化残差值为横坐标,绘制残差与Y的预测值的散点图,检验误差变量的方差是否为常数(图3)。 图3 绘制栏 6.提交分析,并在输出窗口中查看结果,以及对结果进行分析。 系统在进行逐步分析的过程中产生了两个回归模型,模型1先将与因变量(销售收入)线性关系的自变量地区人口引入模型,建立他们之间的一元线性关系。而后逐步引入其他变量,表1中模型2表明将自变量人均收入引入,建立二元线性回归模型,可见地区人口和人均收入对销售收入的影响同等重要。

一元线性回归分析实验报告

一元线性回归在公司加班 制度中的应用 院(系): 专业班级: 学号姓名: 指导老师: 成 绩: 完成时间 :

一元线性回归在公司加班制度中的应用 一、实验目的 掌握一元线性回归分析的基本思想与操作,可以读懂分析结果,并写出回归方程,对回归方程进行方差分析、显著性检验等的各种统计检验 二、实验环境 SPSS21、0 windows10、0 三、实验题目 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经10周时间,收集了每周加班数据与签发的新保单数目,x 为每周签发的新保单数目,y 为每周加班时间(小时),数据如表所示 y 3、5 1、0 4、0 2、0 1、0 3、0 4、5 1、5 3、0 5、0 1. 画散点图。 2. x 与y 之间大致呈线性关系? 3. 用最小二乘法估计求出回归方程。 4. 求出回归标准误差σ∧ 。 5. 给出0 β∧ 与1 β∧ 的置信度95%的区间估计。 6. 计算x 与y 的决定系数。 7. 对回归方程作方差分析。 8. 作回归系数1 β∧ 的显著性检验。 9. 作回归系数的显著性检验。 10. 对回归方程做残差图并作相应的分析。 11. 该公司预测下一周签发新保单01000x =张,需要的加班时间就是多少?

12.给出0y的置信度为95%的精确预测区间。 13.给出 () E y的置信度为95%的区间估计。 四、实验过程及分析 1、画散点图 如图就是以每周加班时间为纵坐标,每周签发的新保单为横坐标绘制的散点图,从图中可以瞧出,数据均匀分布在对角线的两侧,说明x与y之间线性关系良好。 2、最小二乘估计求回归方程 系数a 模型非标准化系数标准系数t Sig、 B 的 95、0% 置信区间 B 标准误差试用版下限上限

spss软件分析异常值检验实验报告

实验五:残差分析 【实验目的】 (1)通过残差检验,掌握残差分析的方法 (2)异常值检验 【仪器设备】 计算机、spss软件、何晓群《实用回归分析》表和表的数据 【实验内容、步骤和结果】 对何晓群《实用回归分析》表的数据进行残差分析 原始数据如表1,其中y表示货运总量(亿吨)x1表示工业总产值(亿元)x2表示农业总产值(亿元)x3表示居民非商业支出(亿元) 表1. 对表1数据用spss软件进行分析得以下各表

由上表可知复相关系数R=,决定系数R方=,由决定系数看出回归方程的显著性不高,接下来看方差分析表3 由表3知F值为较小,说明x1、x2、x3整体上对y的影响不太显著。 表4系数 模型非标准化系数标准系数 t Sig. B标准误差试用版 1(常量).096 x1.385.100 x2.535.049 x3.277.284

表4系数 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .096 x1 .385 .100 x2 .535 .049 x3 .277 .284 回归方程为 123348.280 3.7547.10112.447y x x x =-+++

图1.学生化残差

差 残差: 对数据用spss进行分析得 表6异常值的诊断分析

数据不存在异常值.绝对值最大的删除学生化残差为SDR=,因而根据学生化删除残差诊断认为第6个数据为异常值.其中中心化杠杆值,cook距离为位于第一大.因此第6个数据为异常值. 对何晓群《实用回归分析》表的数据进行残差分析 原始数据为 : 表个啤酒品牌的广告费用和销售量

实验7 线性回归

实验编号: 07 师大SPSS实验报告2017 年 4 月 24 日 计算机科学学院2015级5班实验名称:线性回归 :唐雪梅学号:2015110538 指导老师:__朱桂琼___ 实验成绩:___ 实验七线性回归 一.实验目的及要求 1.了解SPSS 特点结构操作 2.利用SPSS进行简单数据统计 二.实验容 (1)消费者品牌偏好分析:通过品牌使用时间和价格敏感度了解消费者的品牌偏好。 某彩妆系列产品公司进行了一项关于消费者品牌偏好态度的分析,调研人员收集了有关的调研数据,用11点标尺度量态度(1=非常不喜欢该品牌,11=非常喜欢该品牌)对于价格敏感度的度量也用11点标尺(1=对价格完全不敏

思考题: (1)消费者对品牌的使用时间以及对其价格的敏感度对消费者的品牌偏好有何种影响?它们之间是一种什么样的关系? (2)如果有影响,品牌偏好与使用时间之间的关系能否用一个模型表示出来? (2)销售额和员工数量的关系: 随着公司的持续发展,常常有滑入无效率困境的危险,假定某公司的销售开始滑坡,但公司还是不停地招聘新人,公司有某个10年的关于销售额和员 (1)以销售额为自变量,员工数为因变量画出散点图,并建立一个回归模型,通过员工的数量来预测销售额。 (2)解释回归系数的实际意义。 (3)根据分析的结果回答:如果这个趋势继续下去,你对公司的管理层有何建议?你认为管理层应该关注什么? (3)制度变迁是经济增长的源头,根据研究衡量制度变迁有两个变量:非国有化率和国家财政收入占GDP的比重。 自1998年以来中国的经济增长率一直未突破9%的状态,因此以9%为分界点,将经济增长定义为1(经济增长大于等于9%)或0(经济增长小于9%),

5回归分析实验报告

回归分析实验报告 姓名:班级:学号(后3位): 一.实验名称:回归分析 二.实验性质:综合性实验 三.实验目的及要求: 1. 掌握统计工具【回归】的使用方法. 2.掌握线性回归分析的方法,并能对统计结果进行正确的分析. 3.学会非线性回归方程的构建方法,并能进行有关的分析. 四.实验内容、实验操作关键步骤及实验主要结果 x 1.为了研究某商品的需求量Y与价格之间的关系,收集到下列10对数据: x 1 1.5 2 2.5 3 3.5 4 4 4.5 5 价格 i y10 8 7.5 8 7 6 4.5 4 2 1 需求量 i x (1)求需求量Y与价格之间的线性回归方程. α0.05下,对线性回归关系显著性检验. (2)在显著性水平= 实验操作关键步骤及实验主要结果 在EXCEL中选用【 】工具模块,得到如下表的实验结果.因此: x. (1)求需求量Y与价格之间的线性回归方程为 α0.05(2)由于检验的P-value=,所以,在显著性水平= 下,线性回归关系 .

2.随机调查10个城市居民的家庭平均收入与电器用电支出Y 情况得数据(单位:千元)如下: x 收入i x 18 20 22 24 26 28 30 30 34 38 支出 i y 0.9 1.1 1.1 1.4 1.7 2.0 2.3 2.5 2.9 3.1 (1) 求电器用电支出Y 与家庭平均收入之间的线性回归方程. x (2) 计算样本相关系数. (3) 在显著性水平=α0.05下,作线性回归关系显著性检验. (4) 若线性回归关系显著,求=25时,电器用电支出的点估计值. x 实验操作关键步骤及实验主要结果 在EXCEL 中选用【 】工具模块,得到如下表的实验结果.因此: (1)求电器用电支出Y 与家庭平均收入之间的线性回归方程为 x . (2)样本相关系数 . (3)由于检验的P- value=,所以,在显著性水平 =α0.05下,线性回归关系 . (4)=25时,电器用电支出的点估计值 x .

一元回归分析实验报告

实验报告 实验目的: 1.构建一元及多元回归模型,并作出估计 2.熟练掌握假设检验 3.对构建的模型进行回归预测 实验内容: 对1970——1982年某国实际通货膨胀率、失业率和预期通货膨胀率进行分析,根据下表(表一)提供的数据进行模型设定,假设检验及回归预测。 表一 年份Y X2 X3 1970 5.92 4.90 4.78 1971 4.30 5.90 3.84 1972 3.30 5.60 3.31 1973 6.23 4.90 3.44 1974 10.97 5.60 6.84 1975 9.14 8.50 9.47 1976 5.77 7.70 6.51 1977 6.45 7.10 5.92 1978 7.60 6.10 6.08 1979 11.47 5.80 8.09 1980 13.46 7.10 10.01 1981 10.24 7.60 10.81 1982 5.99 9.70 8.00 实验步骤: 1.模型设定: 为分析实际通货膨胀率(Y)分别和失业率(X2)、预期通货膨胀率(X3)之间的关系,作出如下图所示的散点图。 图一

从上示散点图可以看出实际通货膨胀率(Y)分别和失业率(X2)不呈线性关系,与预期通货膨胀率(X3)大体呈现为线性关系,为分析实际通货膨胀率(Y)分别和失业率(X2)、预期通货膨胀率(X3)之间的数量关系,可以建立单线性回归模型和多元线性回归模型:

1231 Y X ββμ=++ 123322Y X X βββμ=+++ 2.估计参数 在Eviews 命令框中输入 “ls y c x2”,按回车,对所给数据做简单的一元线性回归分析。分析结果见表二。 表二 Dependent Variable: Y Method: Least Squares Date: 10/09/11 Time: 17:23 Sample: 1970 1982 Included observations: 13 Variable Coefficient Std. Error t-Statistic Prob. C 1.323831 1.626284 0.814022 0.4329 X3 0.960163 0.228633 4.199588 0.0015 R-squared 0.615875 Mean dependent var 7.756923 Adjusted R-squared 0.580955 S.D. dependent var 3.041892 S.E. of regression 1.969129 Akaike info criterion 4.333698 Sum squared resid 42.65216 Schwarz criterion 4.420613 Log likelihood -26.16904 F-statistic 17.63654 Durbin-Watson stat 1.282331 Prob(F-statistic) 0.001487 由回归分析结果可估计出参数1β、2β 即^ 31.3238310.960163Y X =+ (1.626284)(0.228633) ()()0.814022 4.199588 t = 2 0.615875R = F=17.63654 n=13

应用回归分析实验报告

一元线性回归 一、实验题目1 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周的时间,收集了每周加班时间的数据和签发的新保单数目,x为每周签发的新报数目,y为每周加班时间(小时),数据见下表: 二、实验内容 散点图如下所示:

[数据集1] 描述性统计量 均值标准偏差N y 2.850 1.4347 10 x 762.00 379.746 10

残差图分析:

1.x 与y 之间大致呈线性关系。 2、设回归方程为01y x ββ∧ ∧ ∧ =+ 1β∧ = 12 2 1 (2637021717) 0.0036(71043005806440) ()n i i i n i i x y n x y x n x -- =- =--= =--∑∑ 01 2.850.00367620.1068y x ββ-∧- =-=-?= 0.10680.0036y x ∧ ∴=+可得回归方程为 3、 22 n i=1 1()n-2i i y y σ∧∧=-∑ 2 n 01i=1 1(())n-2i y x ββ∧∧=-+∑ =0.2305 σ∧ =0.4801 4、 由于2 1 1(, )xx N L σββ∧ t σ ∧= = 服从自由度为n-2的t 分布。因而 /2|(2)1P t n αασ????<-=- ?? ?? 也即:1/2 11/2 (p t t ααβββ∧ ∧ ∧ ∧ -<<+=1α- 可得195%β∧ 的置信度为的置信区间为 0.4801/0.4801/??(0.0036-1.8600.0036+1.860 即为:(0.0028,0.0044) 220 01()(,())xx x N n L ββσ- ∧ +

实验7线性回归

实验编号: 07 四川师大SPSS实验报告 2017 年 4 月 24 日 计算机科学学院2015级5班实验名称:线性回归 姓名:唐雪梅学号: 2015110538 指导老师:__朱桂琼___ 实验成绩:_ __ 实验七线性回归 一.实验目的及要求 1.了解SPSS 特点结构操作 2.利用SPSS进行简单数据统计 二.实验内容 (1)消费者品牌偏好分析:通过品牌使用时间和价格敏感度了解消费者的品牌偏好。 某彩妆系列产品公司进行了一项关于消费者品牌偏好态度的分析,调研人员收集了有关的调研数据,用11点标尺度量态度(1=非常不喜欢该品牌,11=非常喜欢该品牌)对于价格敏感度的度量也用11点标尺(1=对价格完全不敏

思考题: (1)消费者对品牌的使用时间以及对其价格的敏感度对消费者的品牌偏好有何种影响?它们之间是一种什么样的关系? (2)如果有影响,品牌偏好与使用时间之间的关系能否用一个模型表示出来? (2)销售额和员工数量的关系: 随着公司的持续发展,常常有滑入无效率困境的危险,假定某公司的销售开始滑坡,但公司还是不停地招聘新人,公司有某个10年的关于销售额和员 (1)以销售额为自变量,员工数为因变量画出散点图,并建立一个回归模型,通过员工的数量来预测销售额。 (2)解释回归系数的实际意义。 (3)根据分析的结果回答:如果这个趋势继续下去,你对公司的管理层有何建议?你认为管理层应该关注什么? (3)制度变迁是经济增长的源头,根据研究衡量制度变迁有两个变量:非国有化率和国家财政收入占GDP的比重。 自1998年以来中国的经济增长率一直未突破9%的状态,因此以9%为分界点,将经济增长定义为1(经济增长大于等于9%)或0(经济增长小于9%),

回归分析实验报告(含程序及答案)

实验报告三课程应用回归分析 学生姓名陆莹 学号20121315021 学院数学与统计学院 专业统计学 任课教师宋凤丽 二O一四年四月十七日

(1) shuju<-read.table("E:/4.14.txt") namesdata<-c("y",paste("x",1:2,sep="")) colnames(shuju)<-namesdata lm.shuju<-lm(y~.,data=shuju) summary(lm.shuju) Call: lm(formula = y ~ ., data = shuju) Residuals: Min 1Q Median 3Q Max -747.71 -229.80 -2.15 267.23 547.68 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -574.0624 349.2707 -1.644 0.1067 x1 191.0985 73.3092 2.607 0.0121 * x2 2.0451 0.9107 2.246 0.0293 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’ 1 Residual standard error: 329.7 on 49 degrees of freedom Multiple R-squared: 0.2928, Adjusted R-squared: 0.264 F-statistic: 10.15 on 2 and 49 DF, p-value: 0.0002057 >plot(lm.shuju,2) 由上图可知,残差通过正态性检验,原假设成立。

R语言实验报告—回归分析在女性身高与体重的应用

R语言实验报告 回归分析中 身高预测体重的模型 学院: 班级: 学号: 姓名: 导师: 成绩:

目录 一、实验背景 (1) 二、实验目的 (1) 三、实验环境 (1) 四、实验内容 (1) 1.给出实验女性的身高体重信息; (2) 2.运用简单线性回归分析; (2) 3.运用多项式回归分析 (2) 五、实验过程 (2) (一)简单线性回归 (2) 1.展示拟合模型的详细结果 (2) 2.女性体重的数据 (2) 3.列出拟合模型的预测值 (3) 4.列出拟合模型的残差值 (3) 5.得出身高预测体重的散点图以及回归线 (3) (二)多项式回归 (5) 1.展示拟合模型的详细结果 (5) 2.身高预测体重的二次回归图 (5) 六、实验分析 (7) 七、总结 (7)

一、实验背景 从许多方面来看,回归分析都是统计学的核心。她其实是一个广义的概念,通指那些用一个或多变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。通常,回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。 二、实验目的 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具; 本次试验要求掌握了解R语言的各项功能和函数,能够通过完成试验内容对R语言有一定的了解,会运用软件对数据进行分析; 通过本实验加深对课本知识的理解以及熟练地运用R语言软件来解决一些复杂的问题。 三、实验环境 Windows系统,R或者R Studio 四、实验内容 本实验提供了15个年龄在30—39岁间的女性的身高和体重信息,运用回归分析的方法通过身高来预测体重,获得一个等式可以帮助我们分辨哪些过重或过轻的个体。

实验五相关分析与回归分析

一、问题描述 2016年1月12日 13:04 学习并使用SPSS软件进行相关分析和回归分析,具体包括: (1) 皮尔逊pearson简单相关系数的计算与分析 (2) 学会在SPSS上实现一元及多元回归模型的计算与检验。 (3) 学会回归模型的散点图与样本方程图形。 (4) 学会对所计算结果进行统计分析说明。 二、实验原理 2016年1月12日 13:13 1.相关分析的统计学原理 相关分析使用某个指标来表明现象之间相互依存关系的密切程度。用来测度简单线性相关关系的系数是Pearson简单相关系数。 2.回归分析的统计学原理 相关关系不等于因果关系,要明确因果关系必须借助于回归分析。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。 线性回归数学模型如下: 在模型中,回归系数是未知的,可以在已有样本的基础上,使用最小二乘法对回归系数进行估计,得到如下的样本回归函数: 回归模型中的参数估计出来之后,还必须对其进行检验。如果通过检验发现模型有缺陷,则必须回到模型的设定阶段或参数估计阶段,重新选择被解释变量和解释变量及其函数形式,或者对数据进行加工整理之后再次估计参数。回归模型的检验包括一级检验和二级检验。一级检验又叫统计学检验,它是利用统计学的抽样理论来检验样本回归方程的可靠性,具体又可以分为拟和优度评价和显著性检验;二级检验又称为经济计量学检验,它是对线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验等。 三、数据录入 2016年1月13日 20:05 有“连续变量简单相关系数的计算与分析_时间与成绩”数据文件,以此录入做相关分析:

一元线性回归分析实验报告

一元线性回归在公司加班制度中的应用 院(系): 专业班级: 学号姓名: 指导老师: 成绩: 完成时间:

一元线性回归在公司加班制度中的应用 一、实验目的 掌握一元线性回归分析的基本思想和操作,可以读懂分析结果,并写出回归方程,对回归方程进行方差分析、显著性检验等的各种统计检验 二、实验环境 SPSS21.0 windows10.0 三、实验题目 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经10周时间,收集了每周加班数据和签发的新保单数目,x 为每周签发的新保单数目,y 为每周加班时间(小时),数据如表所示 y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 2. x 与y 之间大致呈线性关系? 3. 用最小二乘法估计求出回归方程。 4. 求出回归标准误差σ∧ 。 5. 给出0 β∧与1 β∧ 的置信度95%的区间估计。 6. 计算x 与y 的决定系数。 7. 对回归方程作方差分析。 8. 作回归系数1 β∧ 的显著性检验。 9. 作回归系数的显著性检验。 10.对回归方程做残差图并作相应的分析。

11.该公司预测下一周签发新保单01000 x=张,需要的加班时间是多少? 12.给出0y的置信度为95%的精确预测区间。 13.给出 () E y的置信度为95%的区间估计。 四、实验过程及分析 1.画散点图 如图是以每周加班时间为纵坐标,每周签发的新保单为横坐标绘制的散点图,从图中可以看出,数据均匀分布在对角线的两侧,说明x和y之间线性关系良好。 2.最小二乘估计求回归方程

用SPSS 求得回归方程的系数01,ββ分别为0.118,0.004,故我们可以写出其回归方程如下: 0.1180.004y x =+ 3.求回归标准误差σ∧ 由方差分析表可以得到回归标准误差:SSE=1.843 故回归标准误差: 2= 2SSE n σ∧-,2σ∧=0.48。 4.给出回归系数的置信度为95%的置信区间估计。 由回归系数显著性检验表可以看出,当置信度为95%时:

实验7相关及回归分析SPSS应用

实验7 相关与回归分析 7.1实验目的 熟练掌握一元线性回归分析的SPSS应用技能,掌握一元非线性回归分析的SPSS应用技能,对实验结果做出解释。 7.2相关知识(略) 7.3实验内容 7.3.1一元线性回归分析的SPSS实验 7.3.2一元非线性回归分析的SPSS实验 7.4实验要求 7.4.1准备实验数据 1.线性回归分析数据 (The Wall 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》 Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉 的次数的数据,见表7-1所示。 表7-1 美国航空公司航空正点率与乘客投诉次数资料 2.非线性回归分析数据 1992~2013年某国保费收入与国内生产总值的数据,试研究保费收入与国内生产

总值的关系的数据,见表7-2所示。 表7-2 1992~2013年某国保费收入与国内生产总值数据 单位:万元 7.4.2完成一元线性回归分析的SPSS 实验,对实验结果作出简要分析。 7.4.3完成一元非线性回归分析的SPSS 实验,对实验结果作出简要分析。 7.5实验步骤 7.5.1 完成一元线性回归分析的SPSS 实验步骤 1.运用SPSS 绘制散点图散点图。 第一步:在excel 中输入数据 图7-1 第二步:将excel 数据导入spss 单击打开数据文档按钮(或选择菜单文件→打开)→选择文件航空公司航班

正点率与投诉率.xls 图7-2 第三步:选择菜单图形→旧对话框→散点/点状,在散点图/点图对话框中, 选择简单分布按钮 图7-3 第三步:在简单散点图对话框中,将候选变量框中的投诉率添加到Y轴,航班正点率添加到X轴,点击确定:

相关与回归分析实验报告

课程论文 题目统计学实验 学院数学与统计学院 专业金融数学 班级14金融数学 学生姓名罗星蔓 指导教师胡桂华 职称教授 2016 年 6 月21 日

相关与回归分析实验报告 一、实验目的:用EXCEL进行相关分析和回归分析. 二、实验内容: 1.用EXCEL进行相关分析. 2.用EXCEL进行回归分析. 三、实验步骤 采用下面的例子进行相关分析和回归分析. 相关分析: 数学分数(x)统计学分数(y) 数学分数(x) 1 统计学分数(y) 0.986011 1 回归分析: SUMMARY OUTPUT 回归统计 Multiple R 0.986011 R Square 0.972217 Adjusted R 0.968744 Square 标准误差 2.403141 观测值 x 方差分 析

df SS MS F Significance F 回归分析1 1616.69 9 1616.69 9 279.943 8 1.65E-07 残差8 46.2006 9 5.77508 6 总计9 1662.9 Coefficie nts 标准误 差 t Stat P-valu e Lower 95% Upper 95% 下限 95.0% 上限 95.0% Intercept 12.32018 4.2862 79 2.8743 3 0.0206 91 2.4360 05 22.204 36 2.4360 05 22.204 36 数学分数(x)0.896821 0.0536 01 16.731 52 1.65E- 07 0.7732 18 1.0204 24 0.7732 18 1.0204 24 RESIDUAL OUTPUT 观测值预测统计学分数 (y) 残差标准残差 1 84.06587 0.934133 0.412293 2 93.03408 -1.03408 -0.4564 3 66.12945 3.87055 4 1.708324 4 93.03408 -3.03408 -1.33913 5 82.27223 0.727775 0.321214 6 90.34361 -0.34361 -0.15166 7 93.03408 0.965922 0.426323 8 52.67713 -2.67713 -1.18159 9 90.34361 2.656385 1.172433 10 84.06587 -2.06587 -0.9118 PROBABILITY OUTPUT 百分比排 位统计学分数 (y) 5 50 15 70 25 82 35 83 45 85 55 90 65 90 75 92

SPSS实验报告材料91487

CENTRAL SOUTH UNIVERSITY SPSS实验报告 学生王强 学号4303110516 指导教师邵留国 学院商学院 专业工商1101

实验一、数据集 实验目的:掌握基本的统计学理论,学会使用SPSS录入数据,建立SPSS数据集。 实验容: 1.3:三十名儿童身高、体重样本数据如下表所示。建立SPSS数据集。 三十名儿童身高、体重样本数据

13 14 15 男 男 男 14 14 14 168.0 164.5 153.0 50.0 44.0 58.0 28 29 30 女 女 女 15 15 15 158.0 158.6 169.0 44.3 42.8 51.1 实验步骤: 步骤一:启动SPSS。 步骤二:选择文件,新建,数据,如图。 步骤三:切换到变量视图,定义变量。其中,性别变量需要设置值标签。如图所 示。 步骤四:切换到数据视图,按照次序依次输入数据。 步骤五:保存数据。

实验结果:

实验二:统计量描述 实验目的: (1)结合图表描述掌握各种描述性统计量的构造原理及其应用。 (2)熟练掌握运用SPSS进行统计描述的基本技能。 实验容:大学生在校期间的各门课程考试成绩,尽管在学生与学生之间、院系之间、男女生之间以及不同的课程之间,都存在着各种各样的差异,但整体上的分布状况还是有规律可循的。今有两个学院共1040名男女生的统计学和经济学期末考试成绩数据,储存在SPSS数据文件中,文件名:lytjcj.sav。试运用图表描述与统计量描述的方法,对此数据展开尽可能全面和深入的描述与分析。 实验步骤: 步骤一:打开SPSS数据,文件名:lytjcj.sav。如图。

一元线性回归分析实验报告

. . . 一元线性回归在公司加班制度中的应用 院(系): 专业班级: 学号姓名: 指导老师: 成绩: 完成时间:

一元线性回归在公司加班制度中的应用 一、实验目的 掌握一元线性回归分析的基本思想和操作,可以读懂分析结果,并写出回归方程,对回归方程进行方差分析、显著性检验等的各种统计检验 二、实验环境 SPSS21.0 windows10.0 三、实验题目 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经10周时间,收集了每周加班数据和签发的新保单数目,x为每周签发的新保单数目,y为每周加班时间(小时),数据如表所示 2.x与y之间大致呈线性关系? 3.用最小二乘法估计求出回归方程。 4.求出回归标准误差σ∧。 5.给出0β∧与1β∧的置信度95%的区间估计。 6.计算x与y的决定系数。 7.对回归方程作方差分析。 8.作回归系数1β∧的显著性检验。 9.作回归系数的显著性检验。 10.对回归方程做残差图并作相应的分析。 x=,需要的加班时间是多少? 11.该公司预测下一周签发新保单01000

12.给出0y的置信度为95%的精确预测区间。 E y的置信度为95%的区间估计。 13.给出()0 四、实验过程及分析 1.画散点图 如图是以每周加班时间为纵坐标,每周签发的新保单为横坐标绘制的散点图,从图中可以看出,数据均匀分布在对角线的两侧,说明x和y之间线性关系良好。 2.最小二乘估计求回归方程

用SPSS 求得回归方程的系数01,ββ分别为0.118,0.004,故我们可以写出其回归方程如下: 0.1180.004y x =+ 3.求回归标准误差σ∧ ANOVA a 模型 平方和 自由度 均方 F 显著性 1 回归 16.682 1 16.682 72.396 .000b 残差 1.843 8 .230 总计 18.525 9 a. 因变量:y b. 预测变量:(常量), x 由方差分析表可以得到回归标准误差:SSE=1.843 故回归标准误差: 2= 2SSE n σ∧-,2σ∧=0.48。 4.给出回归系数的置信度为95%的置信区间估计。

SPSS相关分析实验报告.doc

SPSS相关分析实验报告 篇一:spss对数据进行相关性分析实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R 值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。

(1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。 b.在spssd的菜单栏中选择点击,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.000<0.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.8665<0.921,说明它们之间的显著性关系稍有减弱。通过相关关系与偏相关关系的比较可以得知:在粮价的影响下,人均收入对人均食品支出的影响更大。 三、实验总结 1、熟悉了用spss软件对数据进行相关性分析,熟悉其操

相关文档
最新文档