SPSS-4-多变量的描述性统计

合集下载

SPSS软件学习_spss统计描述过程

变量频数statistics选项统计频数表统计频数图（加正态分布图）
11
分布曲线形状：偏度的含义
偏度：
大于0表示=正偏=右偏=均值在中位数的右边
左偏
右偏
均值中位数众数
众数中位数均值
63
12
分布曲线形状：峰度的布
峰度大于0
13
二、描述统计量过程
Frequency
Horsepower
70
60
50
40
30
20
10
Std. Dev = 38.52
Mean = 104.8
0
N = 400.00
50.0 70.0 90.0 110.0 130.0 150.0 170.0 190.0 210.0 230.0
60.0 80.0 100.0 120.0 140.0 160.0 180.0 200.0 220.0
中位数适用于任意分布类型的资料。用中位数来描述连续变量会损失很多信息，对于对称分布资料，优先考虑使用均数，仅仅均数不能使用时才用中位数加以描述；
中位数对于定序变量、连续变量均可以使用。对定序变量通常采用中位数（不是众数）来反映更多、更精确的信息。
36
4.2.3 其它集中趋势描述指标
1. 截尾均数数据排序去掉最两端的数据（常用的截尾均数有5% 截尾均数，即两端去掉5%的数据，在SPSS 中Explore中可以实现）
如果截尾均数与原均数相差不大，说明数据不存在极端值，反之相反。
37
2.几何平均数
常用于计算百分比、比率、指数、增长率等指标的平均数
几何平均数算术平均数公式（要求 xi > 0 ）

SPSS第四章基本统计分析

中 0 500 0
高 0 0 600
一致
1 - 29
青中老
低 0 0 400
中 0 600 0
高 500 0 0
应用举例
受教育程度越高通信支出越高吗？受教育程度越高通信支出比例越高吗？
1 - 30
多选项分析
什么是多选项问题？
(1)即:在回答某些问题时,答案在两个以上例如:请问您平时主要的休闲娱乐方式是: a.看电视、听广播 b.玩游戏 c.体育运动 d.逛街购物e.经常去港澳游玩 f.看书学习 g.喝酒聊天 h.工作太忙,没时间休闲娱乐又如：您经常浏览的网站？在下列品牌中您信任哪些品牌？ (2)多选项问题不能直接处理。因为SPSS中的一个变量对每一个答案只能取一个值。
2 2
2
C
2
1 - 27
分析列联表中变量间的关系
Ordinal（定序变量）

反映定序变量一致性指标行变量等级越高，列变量等级也越高或越低 ——一致性高行变量等级越高，列变量等级不定——不一致指标绝对值越大越相关，越接近0越无关
1 - 28
定序变量一致性检验
年龄与工资收入交叉列联表低青 400 一致中 0 老 0
n 3
3
计算描述统计量
描述陡峭程度的统计量

峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。
峭度为0表示与正态分布峭度相同。大于0表示比正态分布陡，尖峰。小于0表示比正态分布缓；平峰。
Kurtosis
1 - 12
1 n -1
i 1 ( xi x) / SD 3
n 4 4
计算描述统计量

第十二章spss多选变量分析

第1步：打开“大学生择业考虑的因素.sav”文件。
第2步：启动分析过程。点击【分析】【多重响应】【定义变量集…】。
第3步：设置分析变量。在定义多重响应集的对话框，然后把该试题的几个选项变量“V1_1”、“V1_2”…“V1_9”选中，点击向右按钮将它们移动到“集合中的变量”框中。
在“变量编码方式”框里，有“○二分法”、“○类别”两个单选按钮，
第4步：完成设置。在前面的信息完成设置后，点击【添加】按钮，则该多选题的定义就添加显示到了右边的“多重响应集”框内。
注意：如果该数据问卷中，如果还有其他多选题，可以继续添加。
第十二章多选变量分析
第
十二
12.1 多选变量的编码录入、定义设置
章 12.2 多选变量的描述统计、交叉表分析
另外一个定义模块在菜单【数据】【定义变量集…】中（也可以在【分析】【定制表】【多重响应集…】中打开，打开的对话框窗口是一样的）。
在此定义模块进行定义，则数据集会自动保留存储此定义，下次打开该数据集，还可以看到和使用该多选题变量的定义集。以上两种定义模块的对话窗的界面功能基本相似。
案例：【例12-5】择业中考虑的主要因素有哪些？（多选）
录入：某被试在三个填空中分别选A、C、F，则该被试在对应的这三个变量选项A、选项C、选项F下分别录入1、2、3，其他选项则输入0。
第三种题型：全部排序题
案例：【例12-4】以下是研究型教学教师应具备的素质，您
认为其重要性依次排序（最重要的排最前）：__、__、__、 __、__。
A、树立正确的价值观，有事业心和责任感；
12.3.1 全部排序题的分析
案例：【例12-6】下列是选择报考研究生时需要考虑的若

SPSS应用二描述统计

j 1
列合计 n j f ij , j 1 , 2 , , c . 而样本容量 n f ij
r i 1
i 1 j 1
r
c
r × c 列联表
列行 1 2 … 1 2 … … … … c 合计
f11 f 21
…
f 12
f 22
…
f1c
f r2
…
n1
n2
…
r
合计
P25
P0
偏度和峰度系数
偏态是指大部份的数值落在平均数的哪一边，若分配較多集中在低数值方面，是为正偏态分配 (或称右偏态分配)；若分配较多集中在高数值方面，是为负偏态分配(或称左偏态分配)，正态分布的偏态为0，SPSS计算公式为：
n SKewness (n 2)
s ( xi x )2
计算
公式: n为奇数时
MX
(
n 1 ) 2
n为偶数时
1 M X n X n ( 1) 2 (2) 2
中位数的特征
1. 计算时只利用了位置居中的测量值优点：对极值不敏感缺点：并非考虑到每个观测值 2. 适用于各种分布类型的资料，特别适合于：大样本偏态分布资料或者一端或两端无确切数值的资料
580 560 540 520 500 480 460 440 420
560 540 500 460 440
2500
520 510 500 490 480
2500
510 505 500 495 490
2500
均数
500
500
500
甲
乙丙
离散与变异性指标
全距四分位间距方差标准差变异系数

spss第四章描述统计简介PPT课件

定义：设，对样本数据集合中的所有数据的排序结果为X1≤X2≤…≤Xn，n为样本容量，则上述排序的序列中，处于“正中间位置”上的数据，称为样本中位数。
当n 为奇数时：正中间位置号码=（n+1）/2 样本中位数=X(n+1)/2
当n为偶数时：正中间位置号码=（n+1）/2是小数，处于n/2与(n/2)+1之间。样本中位数=(Xn/2+X(n/2)+1)/2 如5位同学的学习成绩：3，3，3，4，5。中间位置是第三位，中位数：3。如果六位同学： 3，3，4，5，5，5。中间位置是3与4位中间的位置，中位数为：（4＋5）/2=4.5
第四章描述统计量简介
2024/10/23
第三章样本数据特征的初步分析
1
调查杭州市居民收入情况，得到
调查顾客对产品的满意第度情四况章，获得100个样本数据，能分
样本100统个计样本量数描据，述根据这些数据，
析出哪些信息？
你最想得到哪些信息？
调查大学生群体中对手机品牌的偏好程度，你如何描述调查结果？
• 选择Percentile Values 栏中的选项，输出所选变量的百分值
• Dispersion（离差）栏，用于
指定输出反映变量离散程度的统计量
• Central Tendency （集中趋势）
栏，用于指定输出反映变量集中趋势的统计量
• Distribution （分布特征）栏，
用于指定输出描述分布形状和
如果样本容量为n，那么，某个样本值出现的频率＝该样本值出现的频次/n
2024/10/23
第三章样本数据特征的初步分析
9
分类数据或顺序数据描述频次与频率的图形方法

描述性统计分析

第六章描述性统计分析－－ Descriptive Statistics 菜单详解6.1 Frequencies 过程 6.1.1 界面说明 6.1.2 分析实例 6.1.3 结果解释 6.2 Descriptives 过程 6.2.1 界面说明 6.2.2 结果解释 6.3 Explore 过程 6.3.1 界面说明 6.3.2 结果解释6.4 Crosstabs 过程 6.4.1 界面说明 6.4.2 分析实例 6.4.3 结果解释描述性统计分析是统计分析的第一步，做好这第一步是下面进行正确统计推断的先决条件。

先决条件。

SPSS SPSS 的许多模块均可完成描述性分析，但专门为该目的而设计的几个模块则集中在Descriptive Statistics 菜单中，最常用的是列在最前面的四个过程：Frequencies 过程的特色是产生频数表；Descriptives 过程则进行一般性的统计描述；性的统计描述；Explore Explore 过程用于对数据概况不清时的探索性分析；过程用于对数据概况不清时的探索性分析；Crosstabs Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验，我们常用的X 2检验也在其中完成。

检验也在其中完成。

§6.1 Frequencies 过程频数分布表是描述性统计中最常用的方法之一，频数分布表是描述性统计中最常用的方法之一，Frequencies Frequencies 过程就是专门为产生频数表而设计的。

它不仅可以产生详细的频数表，它不仅可以产生详细的频数表，还可以按要求给出某百分位还可以按要求给出某百分位点的数值，以及常用的条图，圆图等统计图。

点的数值，以及常用的条图，圆图等统计图。

和国内常用的频数表不同，几乎所有统计软件给出的均是详细频数表，即并不按某种要求确定组段数和组距，而是按照数值精确列表。

如果想用Frequencies 过程得到我们所熟悉的频数表，请先用第二章学过的Recode 过程产生一个新变量来代表所需的各组段。

spss描述性统计分析实验总结(3篇)

spss描述性统计分析实验总结(3篇)为期半个学期的统计学试验就要完毕了，这段以来我们主要通过excl软件对一些数据进展处理，比方抽样分析，方差分析等，经过这段时间的学习我学到了许多，把握了许多应用软件方面的学问，真正地学与实践相结合，加深学问把握的同时也熬炼了操作力量，回忆整个学习过程我也有许多体会。

统计学是比拟难的一个学科，作为工商专业的一名学生，统计学对于我们又是相当的重要。

因此，每次试验课我都坚持按时到试验室，试验期间仔细听教师讲解，看教师操作，然后自己独立操作数遍，不懂的问题会请教教师和同学，有时也跟同学商议找到更好的解决方法。

几次试验课下来，我感觉我的力量的确提高了不少。

统计学是应用数学的一个分支，主要通过利用概率论建立数学模型，收集所观看系统的数据，进展量化的分析、总结，并进而进展推断和猜测，为相关决策供应依据和参考。

它被广泛的应用在各门学科之上，从物理和社会科学到人文科学，甚至被用来工商业及政府的情报决策之上。

可见统计学的重要性，仔细学习显得相当必要，为以后进入社会有更好的竞争力，也为多把握一门学科，对自己对社会都有好处。

几次的试验课，我每次都有不一样的体会。

个人是理科出来的，对这种数理类的课程原来就很感兴趣，经过书本学问的学习和试验的实践操作更加加深了我的兴趣。

每次做试验后回来，我还会不定时再独立操作几次为了不遗忘操作方法，这样做可以加深我的记忆。

依据记忆曲线的理论，学而时习之才能保证对学问和技能的真正以及把握更久的把握。

就拿最近一次试验来说吧，我们做的是“平均进展速度”的问题，这是个比拟简单的问题，但是放到软件上进展操作就会变得麻烦，书本上只是直接给我们列出了公式，但是对于其中的原理和意义我了解的还不够多，在做试验的时候难免会有许多问题。

不惊奇的是这次试验好多人也都是不明白，操作不好，不像以前几次试验教师讲完我们就差不多把握了，但是这次好像遇到了大麻烦，由于内容比拟多又是一些没接触过的东西。

(可视化整理)spss统计分析-实例分析

众数（Mode）统计学名词，在统计分布上具有明显集中趋势点的数值，代表数据的一般水平（众数可以不存在或多于一个）。修正定义：是一组数据中出现次数最多的数值，叫众数，有时众数在一组数中有好几个。用M表示。理性理解：简单的说，就是一组数据中占比例最多的那个数。
全距也称为极差，是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据，全距大的一组数据要比全距小的一组数据更为分散。计算公式：最大值－最小值。
1.2 描述分析
计算基本描述统计量的操作
（1）分析—描述统计—描述（2）将分析变量选择到变量框中（3）单击选项按钮指定基本统计量
1.2 描述分析
1.2.2 应用例一
案例1－3：计算人均住房面积的基本描述统计量，并对本市户口和外地户口家庭的情况进行比较。操作步骤：
• 调用命令Analyze\Descriptive Statistics \Descriptives
1.1频数分析
1.1频数分析
输出结果
1.1 频数分析＿例1
例1－1 分析住房状况调查数据中户主的从业状况和目前所住房屋的产权情况思路：利用频数分布表及图形条件：都是分类变量，直接分析步骤：
• 调用命令：
• Analyze\Descriptive Statistics\Frequencies
常用统计量：均值、中位数、众数
1.2 描述分析
刻画离散程度的统计量
离散程度是指一组数据远离其“中心值”的程度。
如果数据都紧密地集中在“中心值”的周围，数据的离散程度较小，说明这个“中心值”对数据的代表性好；相反，如果数据仅是比较松散地分布在“中心值”的周围，数据的离散程度较大，则此“中心值”说明数据特征是不具有代表性的。

SPSS问卷分析---编码录入及描述统计详解

SPSS问卷分析---编码录入及描述统计详解SPSS问卷分析最白痴问题---编码录入及描述统计详解问卷调查的方法用得很广泛，对于没有接触过spss的人第一步面临的就是问卷编码问题，有很多外专业的同学都在问这个问题，现在通过举例的方法详细讲解如下，以方便第一次接触SPSS的同学也能做简单的分析。

后面还有分析时的操作步骤，以及比较适用的深入统计分析方法的简单介绍。

自己写的，错误之处请指正，调查分析问卷回收，在经过核实和清理后就要用SPSS做数据分析，首先的第一步就是把问题编码录入。

SPSS的问卷分析中一份问卷是一个案，首先要根据问卷问题的不同定义变量。

定义变量值得注意的两点:一区分变量的度量，Measure的值，其中Scale是定量、Ordinal是定序、Nominal是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型，他们的变量的定义和处理的方法各有不同，我们详细举例介绍如下:1 单选题:答案只能有一个选项例一当前贵组织机构是否设有面向组织的职业生涯规划系统,A有 B 正在开创 C没有 D曾经有过但已中断编码:只定义一个变量，Value值1、2、3、4分别代表A、B、C、D 四个选项。

录入:录入选项对应值，如选C则录入32 多选题:答案可以有多个选项，其中又有项数不定多选和项数定多选。

)方法一(二分法): (1例二贵处的职业生涯规划系统工作涵盖哪些组群,画钩时请把所有提示考虑在内。

A月薪员工 B日薪员工 C钟点工编码:把每一个相应选项定义为一个变量，每一个变量Value值均如下定义:“0” 未选，“1” 选。

录入:被调查者选了的选项录入1、没选录入0，如选择被调查者选AC，则三个变量分别录入为1、0、1。

(2)方法二:例三你认为开展保持党员先进性教育活动的最重要的目标是那三项: 1( ) 2 ( ) 3( )A、提高党员素质B、加强基层组织C、坚持发扬民主D、激发创业热情E、服务人民群众F、促进各项工作编码:定义三个变量分别代表题目中的1、2、3三个括号，三个变量Value值均同样的以对应的选项定义，即:“1” A，“2” B，“3” C，“4” D，“5” E，“6” F录入:录入的数值1、2、3、4、5、6分别代表选项ABCDEF，相应录入到每个括号对应的变量下。

统计分析与Spss应用第五章(描述性统计分析)

选入需要描述的变量，可选入多个
确定是否将原始数据的标准正态变换结果存为新变量。
变量列表顺序字母顺序均数升序均数降序。
Descriptive Statistics N 血清总胆固醇 Valid N (listwise) Minimum Maximum 101 2.70 7.22 101 Mean Std. Deviation 4.6995 .86162

5.1.1 对话框界面及各部分选项说明【Display frequency tables复选框】确定是否在结果中输出频数表。【Statistics钮】单击后弹出Statistics对话框，用于定义需要计算的其他描述统计量。
集中趋势指标
百分位数指标
计算百分数时选此项
离散趋势指标分布指标
1
.002
.000
Hale Waihona Puke .006.002b
.000
.005
639 61.974 d 65.957 55.621 9.398
e
40 40
.014 .006
.016b .009b .011b .003
b
.008 .003 .004 .000
.025 .016 .018 .006 .001
b
1
.002
.000
.002
descriptive statistics菜单主要内容

(1)频数分布表分析(Frequencies)：其特色就是产生频数表，对分类数据和定量资料都适用。 (2)统计描述分析(Descriptive)进行一般性描述，适用于服从正态分布的定量资料。 (3) Explore 过程：用于对数据分布状况不清楚时的探索性分析，它会杂七杂八给出一大堆可能用到的统计指标和统计图，让研究者参考。 (4)Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验我们常用的X2 检验也在其中完成 (5)Ratio过程；用于对两个连续性变量计算相对比指标，它可以计算出一系列非常专业的相对比描述指标。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

四、相关测量法和测量层次
3、定类（序）变量—定距变量： Eta系数
（1）Eta系数适合于因变量以定距层次进行测量而自变量以定类层次或定序层次测量的数据。显然这是一种不对称的相关测量法。Eta的平方也具有消除误差（PRE）的意义。
（2） SPSS的实现 Analyze → Descriptive Statistics → Crosstabs → Statistics
二、交互分类表 Cross table
2、SPSS的实现
Analyze → Descriptive Statistics → Crosstabs
在左图中将因变量志愿[y]选到行中（Row），将自变量教育水平[x] 选到列中（Column）。
左图中Layer是分层变量框，如果还要考察不同性别的人关于志愿与教育水平的关系，可以将性别变量选入此框中，还可以进一步的分层下去。
间的关系。这个值，通常称为相关系数。
2、相关测量法有很多种，怎样选择？首先要注意变量的测量层次：定类、定序、定距。
属于不同测量层次的变量，就要用不同的相关测量法。
3、相关系数的意义（1）表示两变量间的相关程度的大小（2）还希望具有消减误差比例的作用。
三、简化相关与消减误差
4、消减误差比例（PRE测量法） Proportionate Reduction in Error （简称 PRE）
在左图Nominal（定类）栏中选择 Lanmbda项，即可得到Lambda值和 tau-y值。
下列也是对两定序变量相关系数的测量方法： Contingency coefficient: 列联系数。 Phi and Cramer’s V: 计算Phi系数和
Cramer’s V系数。 Uncertainty coefficient: 不确定性系数。
相关系数。结果显示： t2（年龄）与t7（政治成绩）之间的积矩相关系数R为-0.513，
说明年龄越大的考生所取得的政治成绩越低。
下表中第二行，Ordinal by Ordianl Spearman Correlation是针对定序定序变量测得的Spearman（斯皮尔曼）相关系数。即将两定距变量的值按大小顺序排列，只使用其定序的数学特征，来检测两数列秩序之间的相互关联。
PRE的数值越大，就表示以X值预测Y值时能够减少的误差所占的比例越大；也就是说，X与Y的相互关系越强。若E1 = E2 ，表示用X预测Y产生的误差与不以X来预测Y所产生的误差相等，则PRE=0，反映X与Y是不相关的。
四、相关测量法和测量层次
1、两个定类变量：Lambda（λ） ,tau-y（τ）
三、简化相关与消减误差
4、消减误差比例（PRE测量法）
现在假定不知道X的值，我们在预测Y值时所产生的全部误差是E1（见图1）；如果知道X的值，我们可以根据X的每个值来预测Y的值；假定误差总数是E2（见图2），则以X的每个值来预测Y值时所减少的误差就是：E1 - E2（见图2的阴影部分）。这个数值（ E1 - E2 ）与原来的全部误差（ E1 ）相比，就是消减误差比例。用公式表示为： PRE = （ E1 - E2 ）/ E1
在左图Ordinal By Interval（定类定距）栏中选择Eta项，即可得到Eta 值。
对于定序-定距变量的相关系数测量，可将定序变量降低为定类变量处理，仍用Eta值来计算。
四、相关测量法和测量层次
3、定类（序）变量—定距变量： Eta系数
（3）案例：计算2000级课堂调查数据.sav中变量t1（性别）和t3（身高）之间的相
第四讲多变量的描述性统计
一、相关的概念二、交互分类表三、简化相关与消减误差四、相关测量法和测量层次
一、相关的概念
案例：
在某地区调查1000名青年人的最大志愿，其中有40%的人选择快乐家庭、50%的人选择理想工作和10%的人选择增广见闻。我们要问：为什么这些青年的最大志愿会有不同？若同时调查了这些青年人的受教育水平，分为高（本科或以上程度）、中（高中程度）、低（初中或以下程度），人数比例分别为10%、60%和 30%。我们可以追问：青年人的志愿与其受教育水平是否相关呢？换言之，是否因为教育水平不同，所以人生志愿也不同？
不对称关系（asymmetrical relationship）：变量X影响 Y，而Y不影响X。表示为： X → Y
对称关系（symmetrical relationship）：变量X和Y不确定或不区分影响的方向。表示为： X ←→ Y
二、交互分类表 Cross table
1、交互分类表：同时根据两个变量的值，将所研究的个案分类。
表 1000名青年人的教育水平与志愿
交互分类表又称列联表。
一般将自变量（如，教育水平）放在表的列（Columns，即表的顶端）；将因变量（如，志愿）放在表的行（Rows，即表的旁边）。
上表单元格中显示的是频数，而且表下端显示的总数也不相等，因而不利于进行比较；为求相互比较从而知道两个变量间的相互关系，就必须标准化；最常用的，将频数显示为百分比，就按照100进行了标准化，这样就利于比较了。
在左图Ordinal（定序）栏中选择值和dy值。
Kendall’s tau-b和Kendall’s tau-c两系数也是用于测量两定序变量间的相关系数的。
四、相关测量法和测量层次
2、两个定序变量：Gamma , dy
（4）案例：计算2000级课堂调查数据.sav中变量t8（对本科所学专业的态度）和
t18（你对自己事业发展前途的评价）之间的相关系数。
结果显示：①上表显示的是dy值，变量t8和t18的相互影响的相关系数为0.262；变量t18对t8的影响系数为0.278；变量t8对t18的影响系数为0.247。
②下表显示的是Gamma值，表示变量t8和t18的相互影响的相关系数为0.421。
系数法。
dy =（P+Q）/（P+Q+Ty）
P：同序对数， Q：异序对数，Ty：具有相同Y值而不同X值的同序对数。
四、相关测量法和测量层次
2、两个定序变量：Gamma , dy
（3）SPSS的实现 Analyze → Descriptive Statistics → Crosstabs → Statistics
四、相关测量法和测量层次
1、两个定类变量：Lambda（λ） ,tau-y（τ）
（2）τ相关测量法由于λ相关测量法是以众数作为预测准则，不理会众数以外的次数分布，
因此若众数集中在条件次数表的同一行或同一列，则λ值便会等于0，这时λ测量法就失效了；这种情况下就要采用另一种方法——τ相关测量法。这是一种不对称的相关测量法，因此也必须将研究中最感兴趣的被预测变量指明为因变量。同样在计算τ统计量时，SPSS将同时算出两个不对称的τ值。
若两个变量都属于定类测量层次，可用Lambda相关测量法，也可用古德曼（Goodman）和古鲁斯卡（Kruskal）的tau-y相关测量法。两者各有不同特色，但相关系数都具有PRE的意义。
（1）λ相关测量法 λ是基于消减误差比例的原理（PRE）上的相关测度，λ反映了当用一个变
量的值来预测其它变量的值时误差的减少量。它是一种对称关系（Symmetrical）的测度，即两变量不区分自变量和因变量，因而可以计算三种不同的λ值，一种是两变量对称考量时的λ值；还有两种是两变量处于不对称考量时，以行变量作为因变量的λ值，以及以列变量作为因变量的λ值。这三种方法通常不会产生相同的λ值，因此，必须注意两变量的对称关系，若是非对称的，要指明哪一个是因变量，即最令人感兴趣的被预测的那个变量。当要计算λ统计量时，SPSS将显示出这个对称的λ和两个不对称的λ三个值。
二、交互分类表 Cross table
右图是志愿与教育水平的交互分类表，且只是频数表，没有显示百分比。
显示百分比：Analyze → Descriptive Statistics → Crosstabs → Cells
在左图左下角Percentages栏显示的就是百分比选项：
Row：选中，显示行百分比；例：显示占行变量“志愿”中“快乐家庭”的总人数的百分比。
一、相关的概念
正相关
负相关
不相关
线性相关-正相关
非线性相关1
非线性相关2
一、相关的概念
4、相关除了注意强弱与方向这两个性质外，还要注意两个变量是否有因果关系。
两个变量的相关可能有因果关系（当原因变量发生变化时，结果变量也随着发生变化）；
两个变量的相关也可能没有因果关系，而是发生共同变化。
X→ Y 一个变量为因X（称为自变量，Independent variable）一个变量为果Y（称为因变量，dependent variable）
关系数。
结果显示： t3（身高）对t1（性别）的相关系数为0.939，说明用身高来推测其性别的准确度可达93.9%；
t1（性别）对t3（身高）的相关系数为0.809，说明用性别来推测其身高的准确度可达80.9%。
四、相关测量法和测量层次
4、定距变量—定距变量：积矩相关系数 R
（1）对于定距—定距变量用得最多的方法是Pearson相关系数（积矩相关系数）R测量法，它是线性的、对称关系的。R的平方具有消除误差（PRE）的意义，称为决定系数。
映了当用一个变量上观测的等级来预测它们在另一变量上的等级时可以减少的误差量。这也是一种对称关系的测量法。
G = (P - Q)/(P + Q)
⑵ dy系数相关测量法
Gamma测量法是对称关系的，如果我们认定某定序变量是自变量（X），
另一定序变量是因变量（Y），最好是采用适于简化不对称关系的萨默斯dy
社会学研究的主要目标是预测或解释社会现象的变化。