实验六 用SPSS进行非线性回归分析
SPSS—非线性回归(模型表达式)案例解析

SPSS—非线性回归(模型表达式)案例解析SPSS—非线性回归(模型表达式)案例解析2011-11-16 10:56由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS 的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二!非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢?答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究:第一步:非线性模型那么多,我们应该选择“哪一个模型呢?”1:绘制图形,根据图形的变化趋势结合自己的经验判断,选择合适的模型点击“图形”—图表构建程序—进入如下所示界面:点击确定按钮,得到如下结果:放眼望去, 图形的变化趋势,其实是一条曲线,这条曲线更倾向于"S" 型曲线,我们来验证一下,看“二次曲线”和“S曲线”相比,两者哪一个的拟合度更高!点击“分析—回归—曲线估计——进入如下界面在“模型”选项中,勾选”二次项“和”S"两个模型,点击确定,得到如下结果:通过“二次”和“S“ 两个模型的对比,可以看出S 模型的拟合度明显高于“二次”模型的拟合度(0.912 >0.900)不过,几乎接近接着,我们采用S 模型,得到如下所示的结果:结果分析:1:从ANOVA表中可以看出:总体误差= 回归平方和+ 残差平方和(共计:0.782)F统计量为(240.216)显著性SIG为(0.000)由于0.000<0.01 (所以具备显著性,方差齐性相等)2:从“系数”表中可以看出:在未标准化的情况下,系数为(-0.986)常数项为2.672所以S 型曲线的表达式为:Y(销售量)=e^(b0+b1/t) = e^(2.672-0.986/广告费用)当数据通过标准化处理后,常数项被剔除了,所以标准化的S型表达式为:Y(销售量) = e^(-0.957/广告费用)下面,我们直接采用“非线性”模型来进行操作第一步:确定“非线性模型”从绘图中可以看出:广告费用在1千万——4千多万的时候,销售量增加的跨度较大,当广告费用超过“4千多万"的时候,增加幅度较小,在达到6千多万”达到顶峰,之后呈现下降趋势。
非线性回归案例与spss

2020/5/31
7
SPSS曲线拟合
1,
2020/5/31
8
2,
2020/5/31
9
3,点击ok,得到结果报表和图形
2020/5/31
10
报表分析
Linear:
compoud:
方程:y=-1.33E4+4.318E3t 方程:y=3603.061(1.192)t
SSE=1.589E9,R2=0.856
SSE=0.122782,R2=0.99188
复合函数是按线性化后的回归模型计算的,因此两
者的残差不能直接比较。为了与线性回归的拟合效果直
接相比,可以先储存复合函数回归的残差序列,然后计
算出复合函数回归的
SSE =262467769=2.625×108, R2=1-262467769/11043353279=0.97623,
2020/5/31
23
2020/5/31
通过以上分析可以认为药物 反应程度y与药剂量x符合以 下非线性回归方程:
yˆ 99.541
99.541
1
x
6.7612 Βιβλιοθήκη 4.7996 R2=0.999
24
2020/5/31
3
导入数据
1,
2,
2020/5/31
4
3,
2020/5/31
5
散点图
2020/5/31
6
散点图分析
从散点图上看到,GDP大致为指数函数形式。复 合函数y=b0bt1的形式与经济意义更相吻合。自变 量为时间变量时,Curve Estimation命令提供了直 接选取自变量为时间的功能,做复合函数y=b0bt1 的曲线回归,同时做简单线性回归y=b0+b1t以做 比较。
非线性回归的参数设置_SPSS 统计分析从入门到精通_[共3页]
![非线性回归的参数设置_SPSS 统计分析从入门到精通_[共3页]](https://img.taocdn.com/s3/m/b94e9cb227d3240c8547ef16.png)
155回归分析 第 8 章2.参数初始值的选择
SPSS 的“非线性”过程需要设置待估参数的初始值,
初始值的大小直接影响着模型的收敛性。
参考图8-27
所示的散点图,对初始值进行如下的计算和设置。
(1)b 1代表了销售量上升趋势的终点,观察散点
图,发现销售量的最大值接近于13,因此建议设定b 1
的初始值为13。
(2)b 2为当x = 0时的y 值与y 的最大值(上限)
之差,因此,可以用y 的最小值减去b 1作为b 2的初始
值,即b 2=7−b 1=7−13=−6。
(3)b 3的初始值可以用图中两个分离点的斜率来表示。
取两个点(x =2,y =8)和(x =5,y =12)
,它们之间的斜率为(12−8)/(5−2)=1.33,所以b 3的初始值可以设为−1.33。
8.3.3 非线性回归的参数设置
依次单击菜单“分析→回归→非线性…”执行非线性回归分析的功能,其主设置界面如图8-28所示,在此设置分析变量和模型的函数形式。
图8-28 非线性回归分析的主设置界面
1.变量选择及模型设置
在变量列表中单击选中“销售量”变量,单击从上至下第一个
按钮,将其指定为因变量;在
模型表达式编辑框中输入b1+b2*EXP(b3*advert)。
① 因变量:从变量列表中选入一个数值型变量作为因变量。
② 模型表达式编辑框:用于设置模型的函数表达式,可以直接输入和编辑函数表达式;还可以从变量列表中选入自变量的名称(单击旁边的即可);从符号区域选入数字或运算符(单变量列表
参数列表
函数说明区 函数列表
图8-27 销售量对广告费用的散点图。
SPSS在非线性回归分

8.4 SPSS在非线性回归分析中的应用
8.4 SPSS在非线性回归分析中的应用
(5)线性回归和非线性回归的股票预测图
图8-35显示了原始数据、线性回归模型、非线性回归模型三者的比较。其中, “股票 A” 是实际曲线,“ Predicted Values” 是本案例建立的非线性回归方 程的预测曲线,“ Unstandardized Predicted Values” 是不考虑股票 B 、 C 交 互项的二元线性模型的预测曲线。可以明显看到,非线性回归的预测效果要好 于二元线性回归的预测效果,说明了这里我们引入股票B、C交互项的合理性。
单击【Save】按钮,弹出如下图所示的对话框。它表示要保存到数据文件中的 统计量。
Predicted Values:输出回归模型的预测值。
Residuals:输出回归模型的残差。 Derivatives:模型各个参数的一阶导数值。 Loss function values:损失函数值。
8.4 SPSS
在非线性回归分析中的应用
Step04:输入回归方程
在【Model Expression (模型表达式)】文本框中输入需要拟合的方程式,该方 程中包含自变量、参数变量和常数等。自变量从左侧的候选变量列表框中选 择,参数变量从左侧的【Parameters (参数)】列表框里选入。同时,拟合 方程模型中的函数可以从【Function (函数组)】列表框里选入;方程模型 的运算符号可以用鼠标从窗口“数字符号”显示区中点击输入。
非线性回归分析

非线性回归分析(转载)(2009-10-23 08:40:20)转载分类:Web分析标签:杂谈在回归分析中,当自变量和因变量间的关系不能简单地表示为线性方程,或者不能表示为可化为线性方程的时侯,可采用非线性估计来建立回归模型。
SPSS提供了非线性回归“Nonlinear”过程,下面就以实例来介绍非线性拟合“Nonlinear”过程的基本步骤和使用方法。
应用实例研究了南美斑潜蝇幼虫在不同温度条件下的发育速率,得到试验数据如下:表5-1 南美斑潜蝇幼虫在不同温度条件下的发育速率温度℃17.5 20 22.5 25 27.5 30 35 发育速率0.0638 0.0826 0.1100 0.1327 0.1667 0.1859 0.1572 根据以上数据拟合逻辑斯蒂模型:本例子数据保存在DATA6-4.SAV。
1)准备分析数据在SPSS数据编辑窗口建立变量“t”和“v”两个变量,把表6-14中的数据分别输入“温度”和“发育速率”对应的变量中。
或者打开已经存在的数据文件(DATA6-4.SAV)。
2)启动线性回归过程单击SPSS主菜单的“Analyze”下的“Regression”中“Nonlinear”项,将打开如图5-1所示的线回归对话窗口。
图5-1 Nonlinear非线性回归对话窗口3) 设置分析变量设置因变量:从左侧的变量列表框中选择一个因变量进入“Dependent(s)”框。
本例子选“发育速率[v]”变量为因变量。
4) 设置参数变量和初始值单击“Parameters”按钮,将打开如图6-14所示的对话框。
该对话框用于设置参数的初始值。
图5-2 设置参数初始值“Name”框用于输入参数名称。
“Starting”框用于输入参数的初始值。
输入完参数名和初始值后,单击“Add”按钮,则定义的变量及其初始值将显示在下方的参数框中。
需要修改已经定义的参数变量,先用将其选中,然后在“Name”和“Starting”栏里进行修改,完成后点击“Change”按钮确认修改。
spss-非线性回归分析

实验三非线性回归分析(2学时)一、实验重点掌握非线性回归分析的方法。
二、实验难点模型的选择及对SPSS软件的输出结果进行分析和整理。
三、实验举例例1、对GDP(国内生产总值)的拟合。
选取GDP指标为因变量,单位为亿元,拟合GDP关于时间t的趋势曲线。
以1981年为基准年,取值为t=1,1998年t=18,1991-1998年的数据如下:解:分析过程(一)画散点图图3.1:Y 与t 的散点图图3.2:Ln Y 与t 的散点图(二)根据画散点图,及经济背景可选用模型 复合函数:01t y b b = (也称增长模型或半对数模型)同时,做简单线性回归 01y b b t =+ 以作比较。
(三)模型求解直接用SPSS 软件的Curve Estimation 命令计算。
(也可以用线性化的方法求解,结果基本一致。
) 运行结果如下:(四)结果分析线性回归方程:2ˆ133754417.520.856y t R =-+=复合函数回归方程:ˆ3603.06(1.1924)t y= ………(*)2ˆln 8.190.1760.992y t R =+=注意:不能直接比较两模型的拟合优度,需要对复合函数模型处理,利用(*)式,得到复合函数的残差,计算该模型的残差平方和RSS=2.1696×108 ,并计算y 的离差平方和TSS=1.1×1010 ,得到非线性回归的相关指数82102.169610110.981.110RSS R TSS ⨯=-=-≈⨯ 由于该相关指数大于线性回归的拟合优度,所以可以判断复合函数模型比线性回归模型要好。
例2 、一位药物学家是用下面的非线性模型对药物反应拟合回归模型1021()i i c i c y c u c =-++ 其中,自变量x 为药剂量,用级别表示; 因变量y 为药物反应程度,用百分数表示。
三个参数c 0 ,c 1 ,c 2都是非负的, c 0 的上限是100%,三个参数的初始值取为c 0 =100,c 1=5 ,c 2=4.8.测得9个数据如下表:解:分析过程:(一)画散点图从图形上看,y 与x 确实呈非线性关系! (二)模型求解用SPSS 软件的Nonlinear 命令计算,具体操作如下: (1)建立数据集;(2)在数据窗口点击:Analyze → Regression → Nonlinear …,出现窗口在将y 点入Dependent 框中,在Model Expression 框中输入表达式:c0-c0/(1+(x/c2)**c1)(3) 点击Parametere …, 出现下图:在Name 框中输入: c0Starting Value 框中输入:100点击add,即可得到参数c0的初始赋值,类似的方法可以得到c1和c2参数的初始赋值,Continue 。
SPSS—非线性回归(模型表达式)案例解析

SPSS—非线性回归(模型表达式)案例解析2011-11-16 10:56由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS 的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二!非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢?答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究:第一步:非线性模型那么多,我们应该选择“哪一个模型呢?”1:绘制图形,根据图形的变化趋势结合自己的经验判断,选择合适的模型点击“图形”—图表构建程序—进入如下所示界面:点击确定按钮,得到如下结果:放眼望去, 图形的变化趋势,其实是一条曲线,这条曲线更倾向于"S" 型曲线,我们来验证一下,看“二次曲线”和“S曲线”相比,两者哪一个的拟合度更高!点击“分析—回归—曲线估计——进入如下界面在“模型”选项中,勾选”二次项“和”S"两个模型,点击确定,得到如下结果:通过“二次”和“S“ 两个模型的对比,可以看出S 模型的拟合度明显高于“二次”模型的拟合度(0.912 >0.900)不过,几乎接近接着,我们采用S 模型,得到如下所示的结果:结果分析:1:从ANOVA表中可以看出:总体误差= 回归平方和 + 残差平方和(共计:0.782)F统计量为(240.216)显著性SIG为(0.000)由于0.000<0.01 (所以具备显著性,方差齐性相等)2:从“系数”表中可以看出:在未标准化的情况下,系数为(-0.986)常数项为2.672所以 S 型曲线的表达式为:Y(销售量)=e^(b0+b1/t) = e^(2.672-0.986/广告费用)当数据通过标准化处理后,常数项被剔除了,所以标准化的S型表达式为:Y(销售量) = e^(-0.957/广告费用)下面,我们直接采用“非线性”模型来进行操作第一步:确定“非线性模型”从绘图中可以看出:广告费用在1千万——4千多万的时候,销售量增加的跨度较大,当广告费用超过“4千多万"的时候,增加幅度较小,在达到6千多万”达到顶峰,之后呈现下降趋势。
实验六用spss进行非线性回归分析

实验六用SPSS进行非线性回归分析例:通过对比12个同类企业的月产量(万台)与单位成本(元)的资料(如图1),试配合适当的回归模型分析月产量与单位成本之间的关系图1原始数据和散点图分析一、散点图分析和初始模型选择在SPSS数据窗口中输入数据,然后插入散点图(选择Graphs→Scatter命令),由散点图可以看出,该数据配合线性模型、指数模型、对数模型和幂函数模型都比较合适。
进一步进行曲线估计:从Statistic下选Regression菜单中的Curve Estimation命令;选因变量单位成本到Dependent框中,自变量月产量到Independent框中,在Models框中选择Linear、Logarithmic、Power和Exponential四个复选框,确定后输出分析结果,见表1。
分析各模型的R平方,选择指数模型较好,其初始模型为但考虑到在线性变换过程可能会使原模型失去残差平方和最小的意义,因此进一步对原模型进行优化。
模型汇总和参数估计值因变量: 单位成本方程模型汇总参数估计值R 方F df1df2Sig.常数b1线性.912110.000对数.943110.000幂.931110.000指数.955110.000自变量为月产量。
表1曲线估计输出结果二、非线性模型的优化SPSS提供了非线性回归分析工具,可以对非线性模型进行优化,使其残差平方和达到最小。
从Statistic下选Regression菜单中的Nonlinear命令;按Paramaters按钮,输入参数A:和B:;选单位成本到Dependent框中,在模型表达式框中输入“A*EXP(B*月产量)”,确定。
SPSS输出结果见表2。
由输出结果可以看出,经过6次模型迭代过程,残差平方和已有了较大改善,缩小为,误差率小于,优化后的模型为:迭代历史记录b迭代数a残差平方和参数A B+133.087导数是通过数字计算的。
a. 主迭代数在小数左侧显示,次迭代数在小数右侧显示。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验六用SPSS进行非线性回归分析
例:通过对比12个同类企业的月产量(万台)与单位成本(元)的资料(如图1),试配合适当的回归模型分析月产量与单位成本之间的关系
图1原始数据和散点图分析
一、散点图分析和初始模型选择
在SPSS数据窗口中输入数据,然后插入散点图(选择Graphs→Scatter命令),由散点图可以看出,该数据配合线性模型、指数模型、对数模型和幂函数模型都比较合适。
进一步进行曲线估计:从Statistic下选Regression菜单中的Curve Estimation命令;选因变量单位成本到Dependent框中,自变量月产量到Independent框中,在Models框中选择Linear、Logarithmic、Power和Exponential四个复选框,确定后输出分析结果,见表1。
分析各模型的R平方,选择指数模型较好,其初始模型为
但考虑到在线性变换过程可能会使原模型失去残差平方和最小的意义,因此进一步对原模型
模型汇总和参数估计值
因变量: 单位成本
方程模型汇总参数估计值
R 方 F df1 df2 Sig. 常数b1
线性.912 1 10 .000
对数.943 1 10 .000
幂.931 1 10 .000
指数.955 1 10 .000
自变量为月产量。
表1曲线估计输出结果
二、非线性模型的优化
SPSS提供了非线性回归分析工具,可以对非线性模型进行优化,使其残差平方和达到最小。
从Statistic下选Regression菜单中的Nonlinear命令;按Paramaters按钮,输入参数A:和B:;选单位成本到Dependent框中,在模型表达式框中输入“A*EXP(B*月产量)”,确定。
SPSS输出结果见表2。
由输出结果可以看出,经过6次模型迭代过程,残差平方和已有了较大改善,缩小为,误差率小于,
优化后的模型为:
迭代历史记录b
迭代数a残差平方和参数
A B
+133
.087
导数是通过数字计算的。
a. 主迭代数在小数左侧显示,次迭代数在小数右侧显
示。
b. 由于连续残差平方和之间的相对减少量最多为
SSCON = ,因此在 22 模型评估和 10 导数评估之后,
系统停止运行。
表2非线性回归的输出结果
传统手工运算求解,运算量与迭代次数成正比;而使用SPSS求解,只要输入了初始参数值和模型表达式,无论迭代多少次,都可快速得到最后结果,不仅减轻了计算强度,而且提高了数据准确度,相比Excel又有了极大的进步。