SPSS相关分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.4.1 偏相关分析和偏相关系数 (1)简单相关系数研究两变量间线性相关性,若 还存在其他因素影响,其往往夸大变量间的相关性, 不是两变量间线性相关强弱的真实体现。 例如,研究商品的需求量、价格和消费者收入之 间的线性关系时,需求量和价格的相关关系实际还包 含了消费者收入对价格和商品需求量的影响。此时, 单纯利用简单相关系数来评价变量间的相关性是不准 确的,需要在剔除其他相关因素影响的条件下计算变 量间的相关。偏相关的意义就在于此。
one2world@yahoo.com.cn
8.1.3 正线性相关与负线性相关 线性相关可以分为: (1)正线性相关:两个变量线性的相随变动方向 相同。 (2)负线性相关:两个变量线性的相随变动方向 相反。
one2world@yahoo.com.cn
8.1.4 相关分析 如果仅仅研究变量之间的相互关系的密切程度和 变化趋势,并用适当的统计指标描述。这就是相关分 变化趋势,并用适当的统计指标描述。这就是相关分 析。 如果要把变量间相互关系用函数表达出来,用 一个或多个变量的取值来估计另一个变量的取值,这 就是回归分析 就是回归分析。 回归分析。 绘制散点图和计算相关系数是相关分析最常用的 工具,它们的相互结合能够达到较为理想的分析效果。
one2world@yahoo.com.cn
one2world@yahoo.com.cn
one2world@yahoo.com.cn
8.3 计算相关系数 8.3.1 相关系数的特点 利用相关系数进行变量间线性关系的分析通常需 要完成以下两个步骤: 1.计算样本相关系数r; 1.计算 相关系数r ①相关系数r的取值在①相关系数r的取值在-1~+1之间 +1之间 ②r>0表示两变量存在正的线性相关关系;r<0表 r>0表示两变量存在正的线性相关关系;r<0表 示两变量存在负的线性相关关系 ③r=1表示两变量存在完全正相关;r=-1表示两 表示两变量存在完全正相关;r 变量存在完全负相关;r 变量存在完全负相关;r=0表示两变量不相关 ④|r|>0.8表示两变量有较强的线性关系; |r|<0.3 |r|>0.8表示两变量有较强的线性关系; 表示两变量之间的线性关系较弱
2 (1 − ry22 )(1 − r12 )
其中,ry1、ry 2、r12 分别表示y和x1的相关系数、y和x 2的相关系数、 x1和x 2的相关系数。
偏相关系数的取值范围及大小含义与相关系数 相同。
one2world@yahoo.com.cn
(2)对样本来自的两总体是否存在显著的净相 关进行推断,检验统计量为:
one2world@yahoo.com.cn
Kendall τ 相关系数
τ = (U − V )
2 n(n − 1)
U − 一致对数目, − 非一致对数目, V
在小样本下,Kendall相关系数服从Kendall分 在小样本下,Kendall相关系数服从Kendall分 布;在大样本下, Kendall相关系数的检验统计量 Kendall相关系数的检验统计量 为Z统计量,定义为: 9n(n − 1) Z =τ 2(2n + 5) Z统计量近似服从标准正态分布。
t= r n−2 1− r 2 ~ t (n − 2)
one2world@yahoo.com.cn
2 Spearman等级相关系数 Spearman等级相关系数 ①Spearman等级相关系数用来度量定序变量间的线性 Spearman等级相关系数用来度量定序变量间的线性 相关关系, ②设计思想与Pearson简单相关系数相同,只是数据为 ②设计思想与Pearson简单相关系数相同,只是数据为 非定距的,故计算时并不直接采用原始数据( xi , yi ),而 是利用数据的秩,用两变量的秩 (U i ,Vi ) 代替 ( xi , yi ) 代入 Pearson简单相关系数计算公式 Pearson简单相关系数计算公式 ③于是其中的 xi 和 yi 的取值范围被限制在1和n之间, 的取值范围被限制在1 且可被简化为:
第8章:相关分析 章 Correlations
8.1 相关分析 8.1.1 统计关系与函数关系 客观事物之间的关系大致可分为两大类关系: 函数关系: (1)函数关系:当一个或几个变量取一定的值时, 另一个变量有确定值与之相对应,我们称这种关系为 确定性的函数关系。 统计关系: (2)统计关系:两事物之间的一种非一一对应的 关系,即当一个变量x取一定值时,另一变量y无法依 确定的函数取唯一确定的值。
r = 1−
6∑ Di2 n(n −1)
2
,其中∑ D = ∑(Ui −Vi )
i =1 2 i i =1
n
n
2
one2world@yahoo.com.cn
①如果两变量的正相关性较强,它们秩的变化具有同 n n 步性,于是 ∑ Di2 = ∑ (U i − Vi )2 的值较小,r趋向于1; 的值较小,r趋向于1 ②如果两变量的正相关性较弱,它们秩的变化不具有 n n 2 同步性,于是 ∑ Di = ∑ (U i − Vi )2 的值较大,r趋向于0; 的值较大,r趋向于0 ③小样本下,在零假设成立时, Spearman等级相关系 Spearman等级相关系 数服从Spearman分布; 数服从Spearman分布; ④在大样本下, Spearman等级相关系数的检验统计量 Spearman等级相关系数的检验统计量 为Z统计量,定义为 Z = r n − 1 Z统计量近似服从标准正态分布。
one2world@yahoo.com.cn
8.2 绘制散点图 8.2.1 散点图的特点 散点图: 散点图:是将数据以点的形式画在直角坐标系上, 通过观察散点图能够直观的发现变量间的相关关系及 它们的强弱程度和方向。 在实际分析中,散点图经常表现出某些特定的形 式。如绝大多数的数据类似于“橄榄球”的形状,或 集中形成一根“棒状”,而剩余的少数数据点则零散 地分布在四周。通常“橄榄球”和“棒状”代表了数 据对的主要结构和特征,可以利用曲线将这种主要结 构的轮廓描绘出来,是数据的主要特征更突出。
one2world@yahoo.com.cn
8.3.3 计算相关系数的应用举例 对于案例8 对于案例8-1,通过绘制散点图得知家庭收入与计 划购买的住房面积之间存在一定的正的弱相关关系, 为更确定地反映两者之间线性关系的强弱,采用计算 相关系数的方法。由于这两个变量为定距变量,故采 用Pearson相关系数。 Pearson相关系数。 【分析(Analyze)】 分析(Analyze) 【相关(correlate)】 相关(correlate) 【两变量 (bivariate)】 bivariate)
one2world@yahoo.com.cn
y
y
r=1
完全正相关
r=0.7~0.8
正相关
x
r=0
无相关
x
y
y
y
r=-1
完全负相关
x
r=-0.7 ~ -0.8
负相关
x
r=0
无相关
x
one2world@yahoo.com.cn
8.2.2 散点图应用举例
案例: 案例: 利用住房状况问卷调查数据,分析家庭收 入与打算购买的住房面积之间存在怎样的统计 关系。(数据:住房状况调查.sav) 关系。(数据:住房状况调查.sav) 操作: 图形(Graps) 操作:【图形(Graps)】 【散点图(Scatter)】 散点图(Scatter)
one2world@yahoo.com.cn
偏相关系数的分析步骤 (1)计算样本的偏相关系数 假设有三个变量y 假设有三个变量y、x1和x2,在分析x1和y之间的 ,在分析x 净相关时,需控制x 的线性作用,则x 净相关时,需控制x2的线性作用,则x1和y之间的一 阶偏相关定义为:
ry1,2 = ry1 − ry 2 r12
one2world@yahoo.com.cn
8.3.2 相关系数的种类 对不同类型的变量应采用不同的相关系数来度量, 常用的相关系数主要有Pearson简单相关系数、 常用的相关系数主要有Pearson简单相关系数、 Spearman等级相关系数和Kendall Spearman等级相关系数和Kendall 相关系数等。 τ 1.Pearson简单相关系数 1.Pearson简单相关系数(适用于两个变量都是数 简单相关系数(适用于两个变量都是数 n 值型的数据) ∑(xi − x)( yi − y) Rxy = n i=1 2 2 n ∑(xi−x) ∑(yi−y) i=1 i=1 Pearson简单相关系数的检验统计量为: Pearson简单相关系数的检验统计量为:
one2world@yahoo.com.cn
8.1.2 线性相关和非线性相关
统计关系可再进一步分为: (1)线性相关:当一个变量的值发生变化时,另 线性相关: 线性相关 外的一个变量也发生大致相同的变化。在直角坐标系 中,如现象观察值的分布大致在一条直线上,则现象 之间的相关关系为线性相关或直线相关 线性相关或直线相关(Linear 线性相关或直线相关 correlation)。 (2)非线性相关:如果一个变量发生变动,另 非线性相关: 非线性相关 外的变量也随之变动,但是,其观察值分布近似的在 一条曲线上,则变量之间的相关关系为非线性相关或 非线性相关或 曲线相关( correlation) 曲线相关(Curvilinear correlation)
one2world@yahoo.com.cn
Baidu Nhomakorabea
(3)偏相关分析也称净相关分析,它在控制其他 变量线性影响的条件下分析两变量间的线性关系,所 采用的工具是偏相关系数。 (4)控制变量个数为1时,偏相关系数称一阶偏 )控制变量个数为1 相关;当控制两个变量时,偏相关系数称为二阶偏相 关;当控制变量的个数为0 关;当控制变量的个数为0时,偏相关系数称为零阶 偏相关,也就是简单相关系数。
one2world@yahoo.com.cn
one2world@yahoo.com.cn
因p=0.000<a(0.01) 故拒绝原假设,即拒绝零相关 因相关系数为0.323,意味着两者存在弱相关。 因相关系数为0.323,意味着两者存在弱相关。
one2world@yahoo.com.cn
8.4 偏相关分析
one2world@yahoo.com.cn
one2world@yahoo.com.cn
简单散点图 ①表示一对变量间统计关系的散点图 ②将纵轴变量选入【 ②将纵轴变量选入【Y 轴】, ③将横轴变量选入【 ③将横轴变量选入【X轴】, ④将分组变量选入【设置标记】 ④将分组变量选入【设置标记】:用该变量分组,并在 一张图上用不同颜色绘制若干个散点图。 ⑤将标记变量选入【标注个案】 ⑤将标记变量选入【标注个案】:将标记变量的各变量 值标记在散点图相应点的旁边。
one2world@yahoo.com.cn
2.对样本来自的两总体是否存在显著的线性关系 2.对样本来自的 进行推断。 由于存在随机抽样和样本数量较少等原因,通常 样本相关系数不能直接用来说明样本来自的总体是否 具有显著的线性相关性,而需要通过假设检验的方式 对样本来自的总体是否存在显著的线性相关关系进行 统计推断。基本步骤是: (1)提出原假设,即两总体无显著的线性关系。 (2)选择检验统计量,即不同的相关系数。 (3)计算检验统计量的观测值和对应的概率值。 (4)决策:p与a的关系。 )决策:p
i =1 i =1
i =1
i =1
one2world@yahoo.com.cn
3.Kendall 相关系数
(1)用非参数检验方法度量定序变量间的线性相关关 系 (2)利用变量秩数据计算一致对数目和非一致对数目。 ①当两个变量具有较强的正相关关系,则一致对数目 较大,非一致对数目较小, ②当两个变量具有较强的负相关关系,则一致对数目 较小,非一致对数目较大, ③当两个变量相关性较弱,则一致对数目和非一致对 数目大致相等,
n−q−2 t =r 1− r 2
其中,r为偏相关系数,n为样本数,q 其中,r为偏相关系数,n为样本数,q为阶数。 t统计量服从n-q-2个自由度的t分布。 统计量服从n 个自由度的t
相关文档
最新文档