三种常用的不同变量之间相关系数的计算方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三种常用的不同变量之间相关系数的计算方法

1.定类变量之间的相关系数.

定类变量之间的相关系数,只能以变量值的次数来计算,常用λ系数法,

其计算公式为:

(3.2.12)

式中,为每一类x中y分布的众数次数;为变量y各分类次数的众数次数;n为总次数。一般来说,λ系数在0~1之间取值,值越大表明相关程度越高。

例如,性别与对吸烟的态度资料见表3—2。

表3—2 性别与对吸烟态度

态度y

性别x

男女合计(Fy)

容忍反对37

15

8

42

45

57

合计(Fx)52 50 102

从y的分布来看,对吸烟的态度众数是“反对”,众数次数为57,即=57。再从x的每

一个分组(男、女)中y的次数分布来看,男性中y的分布众数是“容忍”,次数为37(f1m);女性中y的分布众数是“反对”,次数为42(f2m);总次数为102(n)。于是,

从计算结果可知,性别与对吸烟态度的相关程度为0.49,属于中等相关。

2.定序变量之间的相关系数

定序变量之间的相关测量常用Gamma系数法和Spearman系数法。Gamma系数法计算公式为:

(3.2.13)

式中,G为系数;Ns为同序对数目;Nd为异序对数目。

所谓序对是指表明高低位次的两两配对,如果一对个案在变量x,y的分类表现位次一致,则为同序对;如果位次相反,则为异序对。

G系数取值在—1--十1之间。G=1,表示完全正相关;G=-1,表示完全负相关;G=0,表示完全不相关;-1

(3.2.14)

式中,P为系数;D为所测定的两个数列中每对项目之间的登记差,这个差的正值之和等于负值之和;N为项数。系数p主要代表两个定序变量的等级相关程度,其取值范围和相关程度含义与G系数相同。

3.定距变量之间的相关系数

定距变量之间的相关测量常用Pearson系数法。对于未分组资料,Pearson系数法计算公式为:

对于已分组资料,Pearson系数法计算公式为

r系数取值范围和相关程度的含义与G系数相同。

相关文档
最新文档