怎么用SPSS进行相关分析

相关分析的应用示例

【例】

表1是某市从1978年至1992年社会商品零售总额、居民收入和全市总人口统计数字表，试分析它们之间是否存在线性关系。

表1某市统计表

第一步：建立数据文件。

定义变量：序号为Number，假设年份用y表示，零售总额用r表示，居民收入用i表示，全市总人口用p表示，输入数据，如下截图示：

第二步：进行数据分析。

在数据文件管理窗口中，点击Analyze，展开下拉菜单，再点击Correlate中的Bivariate项，进入Bivariate Correlations对话框，请童鞋们看下图：

(1)在左边的这个东东为源变量列框，右边的Variables

框为待分析的变量列框，就是这个东东：

(2)再看下边的Correlation Coefficients选项，也就是分析方法选择项，就是

这个东东。

主对话框中有三种相关系数可供选择，分别对应于三种分析方法：Pearson：皮尔逊相关，计算连续变量或是等间距测度的变量间的相关分析；Kendall：肯德尔相关，计算等级变量间的秩相关；

Spearman：斯皮尔曼相关，计算斯皮尔曼秩相关。

（童鞋们要注意以下选择：

对于非等间距测度的连续变量，因为分布不明，可以使用等级相关分析，也可以使用Pearson相关分析；

对于完全等级的离散变量，必须使用等级相关分析相关性，当数据资料不服从双变量正态分布或总体分布型未知，或原始数据是用等级表示时，宜用Spearman或Kendall相关分析。）

(2)再往看下边的Test of Significance选项，东东：级选择显著性检验类型，他们兄弟俩的区别是：

Two-tailed：双尾检验，如果事先不知道相关方向（正相关还是负相关）则可以选择此项；

One-tailed：单尾检验，如果事先知道相关方向可以选择此项。

反正你也不晓得，你就选双尾好了。

(3)继续往下看，这个东东，Flag Significant Correlations：表明显著水平，如果选择此项，输出结果中在相关系数值值右上方是用“*”表示显著水平为5%；用“**”表示其显著水平为1%。

在本例中，在源变量列框中，选中“零售总额r”，“居民收入i”和“总人口p，

点击右边键头这个按钮，使之进入Variables框中。就变成了这个样子了：

分析方法选择Pearson项，双尾检验。

再点击最右边的“Options”按钮，进入Options对话框，看下边这个图：

在对话框中，有两项选择项。

（1）Statistics：统计量选择项

在该栏中有两个有关统计量的选择项，只有在主对话框中选择了Pearson相关分析方法时才可以选择这两个选择项，如果选择了这些项，在输出结果中就会得到样本的相应的统计量数值。它们是：

Means and standard deviations：均值与标准差；

Cross-product deviations and covariances：叉积离差阵和协方差阵。

（2）missing values：缺失值的处理方法选择项，在该栏中有两个关于缺失值的处理方法选择项：

Exclude cases pairwise：仅剔除正在参与计算的两个变量值是缺失值的观测量。这样在多元相关分析中或多对两两分析中，有可能相关系数矩阵中的相关系数是根据不同数量的观测量计算出来的，系统默认为此项；

Exclude cases listwise：剔除在主对话框中Variables矩形阵中列出的变量带有缺失值的所有观测量。这样计算出来的相关系数矩阵，每个相关系数都是一句相同数量的观测量计算出来的。

在这个例中，我们选择均值与标准差（Means and standard deviations）和叉积离差阵和协方差阵（Cross-product deviations and covariances）两项，缺失值的处理用默认项。这个样子：

点击“Continue”按钮，返回上一级对话框。

再点击“OK”按钮即可，得到的结果看下边两个表：

上表是该市从1978年到1992年的社会零售总额、居民收入和总人口水平的平均数分别为130.2760、112.8747和89.8513，它们分别的标准差为57.97819、52.69135和6.00592，15是它的样本数。

再看这个表，显示了它们之间的Pearson相关系数，1%的显著水平的双尾检验概率值，叉积离差阵和协方差阵。

从表中可以看出，社会零售总额与居民收入之间的相关系数为0.991，双尾检验的概率值为0，小于1%，即相关程度是显著的，叉积离差值为42403.443，协方差为3028.817,；社会零售总额与总人口的相关系数为0.850，双尾检验的概率值为0，小于1%，即相关程度也是显著的，叉积离差值为4141.919，协方差为295.851；居民收入与总人口的相关系数为0.790，双尾检验的概率值为0，小于1%，即相关程度是显著的，叉积离差值为3498.399，协方差为249.886。因此可以说，该市从1978年到1992年社会零售总额、居民收入和总人口两两之间有着

明显的线性关系。

后边这个矩阵很重要的一个表了，主要解释他们之间有木有存在我们当初想要的相关关系，童鞋们可以用一些数据实验一下下。

另外，数据录入的时候在大家都还不是很熟悉情况下最好先定义变量，打开的时候看左下角的那两个工资表，就是这个两个东东，

你点击这个，出来这个

这个就是需要你进行定义的一些选项，如name、type、width是关于它的名称，数值类型、宽度等等这些，你可以根据需要进行定义，还有decimals小数点label 变量名标签等等。像例题

当然，如果你已经很熟悉了，而且有些变量又都是系统已经默认的，那你直接在工作表状态下输入也可以，但是需要你已经很熟悉的前提下，知道个分别代表啥子。

好了，童鞋们可以自己找一些数据来试试，多鼓捣几下就会了。

另外，如果你的毕业论文中学会有用到这样的分析软件来做论文的话，我相信你都会得高分，I promise!