sps软件相关分析
基于仿真软件SPS的凝析油管道运行优化分析

第51卷第8期 辽 宁 化 工 Vol.51,No. 8 2022年8月 Liaoning Chemical Industry August,2022收稿日期: 2021-11-22基于仿真软件SPS 的凝析油管道运行优化分析左江伟,李汉成,郑锐,许红明,田一波,徐思莹,杨子航(中国石油塔里木油田分公司油气运销部,新疆 库尔勒 841000)摘 要: 对于高黏高含蜡凝析油的输送,采用加热输送方式能有效降低输送摩阻,避免管道因析蜡严重而造成凝管停输,而合理地设置凝析油出站温度,确保油品全线温度始终高于析蜡点,能极大降低天然气用量,对于管线平稳安全运行具有重要意义。
以英买凝析油和英牙凝析油管线为研究对象,基于SPS 仿真软件模拟了凝析油在不同地温和进站温度在析蜡点的出站温度,并根据现场天然气能耗结果进行了分析。
结果表明:在夏季运行时,管道全线最少可节约用气2万m 3,冬季运行时可节约天然气8万m 3,这对于热油管线的优化运行提供了一定参考。
关 键 词:凝析油;管道;天然气;SPS;析蜡点;能耗中图分类号:TE832 文献标识码: A 文章编号: 1004-0935(2022)08-1111-04含蜡凝析油在管道长距离输送过程中蜡晶分子的析出及蜡沉积层的逐步形成,会造成管道输送能力下降和运行成本增加[1-2],严重时在清管作业时会引发凝管现象,造成管道清管器卡阻及蜡堵事故,而采用加热输送能有效缓解这一情况。
另一方面,当中间加热站油品出站温度设置较高时,势必造成大量天然气的浪费。
因此,平衡凝析油出站温度和管线清管周期是含蜡凝析油管道输送过程中必须面对的问题[3-5]。
目前,塔里木油田应对高含蜡凝析油蜡沉积问题的解决方法主要有添加化学防蜡剂、提高含蜡凝析油出站温度以、管线设置保护层、长输管线设置加热站、定期清管等。
而对于凝析油出站温度设置问题,一般采用稳态热力计算苏霍夫公式进行调整[6-7]。
美国Stoner 公司开发的SPS 软件能够实现长输管道的离线实时模拟计算,在液体管网的稳态和瞬态计算方面具有应用广、精度高的特点。
典型相关分析实证分析

典型冗余分析
身体形态变量被自身的典型变量、健康状况的典型变量解释的方差比例
Redundancy Analysis
Proportion of Variance of Set-1 Explained by Its Own Can. Var.
Prop Var
CV1-1
.576
CV1-2
.129
CV1-3
.053
Proportion of Variance of Set-1 Explained by Opposite Can.Var.
Prop Var
CV2-1
.527
CV2-2
.044
CV2-3
.002
身体形态变量被自身的第一典型变量解释了57.6%
同时表明,代表次子头型特征的第一典型变量U1 为:
两个典型变量中头长和头宽的系数都比较大,可以认为是 关于头型特征的综合变量。这一对包含了长子和次子头型 相关性主要信息的典型变量表明了,由于遗传因素的作用, 长子和次子的头型具有很强的相关性。
3. 冗余分析 从下表可以看到,长子的头型变量被自身的第一典型变量 解释了 86.7%,次子的头型变量被自身的第一典型变量解 释了 91.8%。
INCLUDE ' C:\Program Files (x86)\SPSSInc\SPSS16\ Canonical correlation.sps'.
CANCORR SET1=x1 x2 x3 x4 /
SET2=y1 y2 y3 / .
图1.1 语句窗口
2. 点击语句窗口Run菜单中的All子菜单项,运行典型相关宏 命令,得出结果。
SPS多因素方差分析

体育统计与SPSS读书笔记(八)—多因素方差分析(1)具有两个或两个以上因素的方差分析称为多因素方差分析。
多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。
如果再加上性别上的因素,那就成了三因素了。
如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。
如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。
个人收集整理勿做商业用途下面用例子的形式来说说多因素方差分析的运用。
还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。
形成年级和不同教学法班级双因素。
个人收集整理勿做商业用途分析:1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据),年级不同教学方法的班级定性班定量班定性定量班五年级(班级每个人)(班级每个人)(班级每个人)初中二年级(班级每个人)(班级每个人)(班级每个人)高中二年级(班级每个人)(班级每个人)(班级每个人)2.因为有重复数据,所以存在在数据交互效应的可能。
我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。
交互作用是多因素实验分析的一个非常重要的内容。
如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量丫,因素A与B之间存在交互作用则已说明这两个因素都丫对有影响,而不管其主效应是否具有显著性。
在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。
在大多数场合交互作用的信息比主效应的信息更为有用。
根据上面的判断。
根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。
[油气储运网]SPS管道动态分析软件
![[油气储运网]SPS管道动态分析软件](https://img.taocdn.com/s3/m/bd66a46e28ea81c759f57898.png)
2020/11/12
25
第四部分 SPS的使用方法
1)建立管道连接关系
2020/11/12
26
第四部分 SPS的使用方法
2)输入管网结构参数
红色表示需要输入内 容的地方
2020/11/12
27
第四部分 SPS的使用方法
3)插入流体
2020/11/12
28
第四部分 SPS的使用方法
输入完数据之后,保存当前文件。SPS将 自动生成inprep文件。
对于管段,采用划分网格的方法将管段划 分成多个网格。将管段流动方程应用到每个网 格,再统一求解便可得到整个管网的工艺参数 变化情况。
SPS的文件组成如下:
2020/11/12
11
第二部分 SPS软件数学模型
人工输入 部分
2020/11/12
12
内容纲要
第一部分 SPS软件简介
第二部分 SPS软件数学模型
2020/11/12
20
第四部分 SPS的使用方法
二、SPS使用流程
具体到SPS,它的使用步骤如下:
1)建立inprep文件
PREPR
2)编写intran文件
3)计算
TRANS
TPORT
4)用Tport查看变化曲线
5)用Grafr导出计算参GR数AFR
2020/11/12
21
第四部分 SPS的使用方法
五、可用外界程序灵活调用 SPS提供了完善的应用程序接口(API)。各种计
算机高级语言可以通过API控制SPS的计算过程和计算 结果。
在实时模拟中,可利用SPS的强大接口功能,进行 二次开发,得到功能更加强大的管道模拟系统。
2020/11/12
SPS介绍

SPS(stoner pipeline simulator)Stoner公司的SPS(Stoner Pipeline Simulator)。
该软件能够实现长输管道的离线实时模拟计算,是世界公认的用于长距离输油(气)管道设计、计算以及全线自动化控制模拟的高精度软件。
在液体管网的稳态和瞬态计算方面应用较广,已在国内多项石油管道工程研究与设计中应用。
SPS软件家族包括管道的实时在线仿真(Statefinder)、泄露检测(Leakfinder)、实时状态预测(Predictor)、操作员培训系统(Trainer)和离线仿真(Simulator)5个软件。
其中Statefinder、Leakfinder和Predictor是SPS软件中的在线产品,它们的运行需要SCADA系统实时数据的支持,能够实时动态的模拟管网的运行状态。
Leakfinder可以在管网实时运行中进行泄漏检测,而Predictor则可以对动态管网的未来运行状态进行预测。
Trainer用于培训管网系统操作人员,它可以模拟真实的SCADA系统运行状态,使操作员在模拟的环境下学习如何操作管理管网系统。
Simulator是其它四个软件模块的基础,,用于管道离线仿真、管道设计、管道运行能力的估算等。
众所周知,SPS/仿真器拥有精确模拟管道设备中流体液力学和全部控制系统性能(非理想化)的手段,它所提供的仿真精度是任何其它软件所不能比拟的。
SPS拥有的强大的二次开发能力,是其他同等软件所不具备的。
它提供的ADL开发环境使得在不改变基本的核心仿真软件的前提下,可以设置与基本仿真同时运行的应用,或者控制仿真过程。
新定义的变量可以表示为仿真数据的函数,它们的值可以象任何隐式仿真数据一样用于报告、结果显示、或传递给第三方的应用或系统。
操作员可以根据需要开发自己的应用程序、可选择多种数学函数、可模拟PLC多种运行逻辑、可增改泄漏检测的算法,等等,以满足仿真过程中的各种需要。
SPSS基本概述与介绍

SPSS基本概述与介绍在教育技术学研究中,常常需要对大量的数据进行统计处理,这是一项细致而繁琐的工作,如果完全依靠手工来进行,工作量较大,且难以保证准确性,也得不到高的精度。
为了减轻整理和计算大量数据的负担,提高工作效率,我们必须充分利用现代化的技术手段。
随着计算机软件技术的发展,计算机在分析数据方面发挥了相当大的作用,它功能多、速度快、计算精确、较易利用,并且计算机统计软件可以完成更为精确系统的数据分析与统计计算。
在教育技术研究资料统计处理中常采用的统计软件有SPSS INC公司的SPSS统计软件系统、SAS统计分析系统和Microsoft公司的Excel软件等。
SPSS是Statistics Package for Social Sciences(社会科学统计软件包)的缩写,它是社会科学研究人员首选的统计软件,也是目前世界上最流行的统计软件之一。
因而被广泛应用于社会科学和自然科学的各个领域中。
一、SPSS统计软件概况SPSS是专业的通用统计软件包,它是一个组合式软件包,兼有数据管理、统计分析、统计绘图和统计报表功能,界面友好,使用简单,广泛用于教育、心理、医学、市场、人口、保险等研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。
SPSS对硬件系统的要求较低,普通配置的计算机都可以运行该软件;对运行的软件环境要求宽松,有各种版本可运行在WINDOWS 3X、9X、2000环境下,现在较新的10.0版可运行在WINDOWS 2000中(SPSS早期版本运行于DOS下,这里不再进行介绍,本节以SPSS 10.0版本为例介绍的该软件的使用)。
SPSS 10.0有英文版和汉化版两种版本,可运行在中英文平台上。
SPSS统计软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如Dbase,Excel,Lotus 等)。
它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又下含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。
SPSS数据分析

SPSS数据分析SPSS(统计软件包科学)是一种数据分析软件,广泛应用于社会科学、生物医学和市场研究等领域。
它提供了各种统计技术,包括描述统计方法、假设检验、回归分析、因子分析和聚类分析等。
这些统计方法可以帮助研究人员从收集到的数据中得到有关变量之间关系的洞察力。
SPSS的主要功能包括数据准备、数据描述、数据转换和数据分析。
在数据准备阶段,SPSS可以导入各种数据格式,包括Excel、文本文件和数据库文件等。
它可以帮助用户检查数据的完整性,清除重复值和缺失值,并进行数据质量检查。
在数据描述阶段,SPSS可以计算并展示变量的描述性统计信息,如均值、标准差和分布情况。
此外,SPSS还提供了绘制直方图、箱线图和散点图等图形功能,以可视化变量的分布和关系。
在数据转换阶段,SPSS可以进行数据清洗和重编码等操作。
例如,如果需要对变量进行合并或分组,可以使用SPSS的合并和分组功能。
此外,SPSS还提供了一个功能强大的RECDO命令,可以根据一些条件对变量进行重新编码。
在数据分析阶段,SPSS提供了各种统计方法,以帮助研究人员解决特定的问题。
例如,如果研究人员想要了解两个变量之间是否存在关联,可以使用SPSS的相关分析功能。
如果研究人员想要确定其中一种干预是否对一些结果变量产生显著影响,可以使用SPSS的回归分析功能。
除此之外,SPSS还提供了因子分析、聚类分析和多元方差分析等高级分析方法。
总之,SPSS是一种功能强大的数据分析软件,可以帮助研究人员从收集到的数据中提取有用的信息。
无论是描述统计还是高级分析,SPSS 都提供了丰富的工具和方法来满足各种研究需求。
通过使用SPSS,研究人员可以更好地理解他们的数据,并从中得出有关变量之间关系的结论。
SPS 管道仿真系统介绍

SPS管道仿真系统介绍Stoner Pipeline Simulator (SPS)是德国GL集团公司的管道仿真系统。
SPS是世界领先的单相流动态模拟软件,能够实现长输管道的离/在线瞬态模拟计算、泄漏检测、批次管理(批次跟踪、界面检测)等,可用来辅助解决管道的运行技术问题,包括瞬态水力、热力分析、控制系统设计及管道运行控制等,可模拟各类管道元件如机泵阀、控制元件、热力元件及各种仪表检测元件。
SPS高级瞬态模拟仿真软件功能特点包括:模拟范围:管道配置不限;单相流,批次输送或混合输送管道(非多相流);可模拟液柱分离及气化;交互式或批文件模拟;图形人机建模界面;多种初始工况供选择。
一、SPS的特点和功能单一或混合的多种介质:能够模拟单一的流体介质,单相的多种混合流体介质。
体积,热值,组分跟踪以及进行成品油界面跟踪:能够对气体在管道内各点进行组分,热值等跟踪分析。
能够进行成品油不同油品间的界面跟踪。
热力模型:能够模拟等温模型,绝热模型和温变模型。
理论模拟:能够在现场设备和模拟设备建立相应的连接,以达到与现场相一致。
线,转动设备,截断不同类型的管道设备运用,例如管标准的管道设备:阀和止回阀,感应器,流量计,PID 控制和控制阀等。
单位的处理:拥有公制和英制两种单位,另外可以自己定义单位。
重新启动的能力:能够在给定的状态下,重新模拟运行,并且接受不同的控制方法,不用做重复的工作。
数据输入捷径:使用一些缺省的字符串和命令,达到简单操作的目的。
强大的逻辑控制语言:在INTRAN文件中使用特殊的语言来做为逻辑控制。
这种语言有很好的弹性可以用来模拟RTU逻辑或现场的硬件控制。
二、SPS仿真软件-模块架构三、SPS典型应用:管道启/停输程序分析;运行稳定性分析;泵机组运行计划分析;各种运行方案的经济研究;批次跟踪研究;水击泄放系统优化和控制;连锁控制系统逻辑设计;运行预测管理;事故隐患分析及应对策略评估;培训管道操作人员;预测管道泄漏对环境的影响;研究批次、部分分输或油品掺混效果;管道系统的温升研究;管道破裂事故研究。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两变量间相关关系的测量方法在物理类文献中见到判断相关的方法比较单一,不如社会学那么丰富。
尽管有不少相关系数以前并未遇到,但也在整理的过程中同时学习。
下面是自己整理的两变量间相关关系的测量方法。
难免疏漏,请各位加以修正补充。
一、相关关系事物之间的联系大致可以分为两类,一类是确定性关系,变量之间存在着一一对应的关系,即函数关系;另一类是不完全确定的关系,两个变量之间存在着相互依赖、相互影响的关系,却不是严格的一一对应关系,称为相关关系。
相关关系反映的是变量之间是否存在联系亦即联系的程度。
确定性关系与相关关系之间往往无法截然区分,一方面,由于测量误差等随机因素的影响,确定性关系在现实中往往通过相关关系表现出来;另一方面,当人们对客观事物的内部规律了解得更深刻时,相关关系又有可能转化为确定性关系。
二、变量类型依据测量尺度,在社会科学研究中一般将变量分为定类变量、定序变量和定距变量三大类(此外,还有“定比变量”,社会科学研究不作区分)。
它们之间的关系是从定类变量开始,后一个变量比前一个变量的层次高,后一个变量除具有前一个变量的特征外,还具有自己的特点。
定类变量:变量的取值仅仅只有类别属性之分,例如性别,没有大小、优劣之别。
在社会调查研究活动中,凡是涉及到类型划分社会现象均属于定类变量。
定序变量:变量的取值除了有类别属性之分外,还有等级或次序的区别,例如教育程度,态度量度。
凡属于等级或次序上有区别的变量均为定序变量。
定距/定比变量:变量的取值除了具有类别、次序区别之外,还有类别之间、序列之间的标准化距离的变量。
变量的值之间可以比较大小,两个值的差有实际意义。
在对社会现象的调查研究中,凡是可以用固定标准测量的、可以划分出距离的变量,均属于定距变量。
其中,定距/定比变量的区别:定距变量=0,不表示“没有”,因此这一测量类型所得出的数据在数学运算上只能进行加、减运算,而不能做乘除等运算;定比变量=0,表示“没有”,即有一个有实际意义的零点(绝对零点),因此,定比变量除了可做加减运算,又能做乘除运算。
(但两者在SPSS中没有太大的区别)。
分 类 定 义举 例 数学特征 定类变量按照对象的某种特征划分类别性别科目=、≠定序变量按照对象的某种特征,把类别按顺序、等级排列评价等级=、≠>、<定距变量对象不仅可按特征排序,而且还可以测量序列间的距离年龄 工资=、≠;>、<;+、— (定比变量还包括×、÷)对研究变量的不同特征遵循如下的分类方法:定类变量 要求变量的特征分类具有可辨别性,且不同类别应无同一性的性质。
定序变量 要求变量的特征与属性可以排序或分等级。
定距变量 要求测量单位具有相等的意义,且没有绝对意义的“零点”。
定比变量要求测量单位具有相等的意义,且有一个绝对意义的“零点”。
三、基本方法 (一)绘制散点图 (略)(二)计算相关系数对不同类型的变量数据,应采用不同的相关系数来度量。
1.定类变量——定类变量 (1)φ-Phi 系数描述2×2数据相关程度最常用的一种相关系数 对于一个具体的2×2维列联表 X1 X2 Y1 a b Y2 c d(2)C系数,也称列联系数列联表是观测数据按两个或更多属性(定类变量)分类时所列出的频数(或概率)表。
当一张表格超过2维时,Phi的值不一定是在0---1之间,为了获得0≤Phi ≤1,皮尔逊建议用列联系数C的最高限取决于行数和列数,一般达不到上限1。
(3)Cramer's V系数V的最高上限可以达到1。
PRE(减少误差比例测量法,Propoctionate reduction in error)数值的意义:就是用一个现象(如变量X)来预测另一个现象(如变量Y)时能够减除百分之几的误差。
PRE=(E1—E2)/E1E1:当不知道X变量去估计Y变量时所产生的误差(全部误差)E2:知道X变量再去估计Y变量产生的误差E1—E2为剩余的误差Lambda和Tau-y 系数都是具有PRE性质的系数(4) Lambda(λ)系数这种相关测量法也叫做Cuttman’s coefficient of predictability,它的基本的逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。
消减的误差再全部误差中所占的比例越大,表示两个变量之间相关的程度越大。
分为:对称形式——用于测量两个变量间的关系是对等的,即无自变量与因变量之分。
简写成λ系数。
非对称形式——测量两个变量间的关系有自变量与因变量之分。
简写成λy(x为自变量,y为因变量)一般来说,系数在0~1之间取值,值越大表明相关程度越高。
Lambda相关测量法是以众数作为预测的工具,没有考虑其他的条件。
如果众数都出现在频数分布表的某一行或某一列时,Lambda系数将等于0,但并不说明X和Y一定完全无关。
同时,这也说明Lambda系数测量X 、Y的相关水平是较为粗糙的一种方法。
因此社会学研究中有时采用Goodman和 Kruskal的Tau-y系数。
(5) Goodman and Kruskal的Tau-y系数这个系数的敏感度高于Lambda系数,但只适合于分析不对称的关系,属于不对称相关测量法,要求两个定类变量中有一个是自变量,有一个是因变量。
Tau-y系数的值介于0—1之间,具有消减误差比例的意义,这个系数的特色是在计算时会包括所有的边缘次数和条件次数。
在那么多相关系数中,在进行研究时,一般选择哪一个比较好?在定类——定类关系中,如果是不对称关系,最好选择用的是Tau-y,如果是对称的关系,则最好选择用的是Lambda系数,Phi、C、V系数没有消减误差比例的意义,而且假定两个变量之间的关系是对称的。
在这三个系数中,由于V不受表的大小的影响,因此用得比较多,也比较适合于进行社会学研究。
三、基本方法(一)绘制散点图(略)(二)计算相关系数对不同类型的变量数据,应采用不同的相关系数来度量。
常用的I 行J 列表格Y(因变量) X (自变量)1 2 jJ1 n 11 n 12… n 1j … n 1Jn 1· 2 n 21 n 22… n 2j … n 2J n 2·…in i1 n i2… n ij … n iJ n i· …I n I1 n I2… n Ij … n IJn I· 总和n ·1 n ·2… n ·j … n ·J1.定类变量——定类变量 2×2表格的相关度量 以卡方为基础的量度 (1)φ-Phi 系数在相关度量法中不采用拟合优度卡方是因为拟合优度卡方过分依赖于样本数大小。
将卡方除以n 针对样本量n 进行修正就是φ系数:,或者变量X和Y的边缘分布的变异影响φ的大小。
在其他数值保持不变的情况下,边缘分布越不平衡,φ值越小。
当一个或两个边缘分布非常偏斜的时候,较不敏感的量度方法可能是更好的选择。
φ是一个对称量度系数,对φ的计算并不依赖于哪个变量是因变量。
I×J表格的相关量度法当I和J都大于2时,φ随I和J的增加而增大,因此φ没有上限,这样系数间就缺乏了比较。
部分因为这个原因,统计学家提出了许多新的φ修正系数。
这些修正系数全都是对称的,并且当变量是统计独立时等于零。
然而,最大的两个缺点是,它们通常不能获得它们的最大值,并且取值范围在0和1.0之间很难解释。
(2)C系数,也称列联系数列联表是观测数据按两个或更多属性(定类变量)分类时所列出的频数(或概率)表。
当一张表格超过2维时,Phi的值不一定是在0---1之间,为了获得0≤Phi≤1,皮尔逊建议用列联系数当列联表中两个变量不相关时,C=0,若两个变量相关时,则C 随着I和J的变化而变化,但0≤C<1。
C<1表现出C系数的一个缺陷,这不满足作为相关系数应该具备的特点(两个变量完全相关时,相关系数应为1)。
一些研究者建议不要将C系数用在小于5×5的表格中(Garson,1976)(3)Cramer's V系数Cramer’s V系数修正了φ系数无上限和C系数的上限小于1的不足。
当变量X和Y不相关时,V=0,当两个变量完全相关时,则V=1。
除了对表格唯独和边缘分布灵敏之外,这几个基于卡方的量度系数并没有直观的有吸引力的解释。
即使它们取值范围在0和1.0之间,也很难说0.49这么一个数值反映了什么关系。
很可能这个关系是微弱的,但是没有可以操作的标准来评估他的大小。
这类量度系数最早是作为通常的相关系数的近似值发展起来的,现在已经被更多的易于解释的量度系数所补充。
为了避免以卡方为基础的量度系数的弱点,统计学家已经发展出各种其他方法,其中最流行的就是减少误差比例量度法(Proportional-reduction-in-error measures,简称PRE)PRE数值的意义:就是用一个现象(如变量X)来预测另一个现象(如变量Y)时能够减除百分之几的误差。
PRE=(E1—E2)/E1E1:当不知道X变量去估计Y变量时所产生的误差(全部误差)E2:知道X变量再去估计Y变量产生的误差E1—E2为剩余的误差Lambda和Tau-y 系数都是具有PRE性质的系数(4) Lambda(λ)系数这种相关测量法也叫做Cuttman’s coefficient of predictability,它的基本的逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。
消减的误差再全部误差中所占的比例越大,表示两个变量之间相关的程度越大。
分为:对称形式——用于测量两个变量间的关系是对等的,即无自变量与因变量之分。
简写成λ系数。
非对称形式——测量两个变量间的关系有自变量与因变量之(x为自变量,y为因变量)分。
简写成λy一般来说,系数在0~1之间取值,值越大表明相关程度越高。
例:性别与吸烟态度的交互分类(人)态度 Y 性别X 合计 男 女赞同 反对96 1824 62114 86合计120 80200 根据λ系数公式有因此,我们可以说,性别与对吸烟态度之间存在中等程度的相关。
Lambda 相关测量法是以众数作为预测的工具,没有考虑其他的条件。
如果众数都出现在频数分布表的某一行或某一列时,Lambda 系数将等于0,但并不说明X 和Y 一定完全无关。
同时,这也说明Lambda 系数测量X 、Y 的相关水平是较为粗糙的一种方法。
因此社会学研究中有时采用Goodman 和 Kruskal 的 Tau-y 系数。
(5) Goodman and Kruskal 的Tau-y 系数这个系数的敏感度高于Lambda 系数,但只适合于分析不对称的关系,属于不对称相关测量法,要求两个定类变量中有一个是自变量,有一个是因变量。