列联表资料的SPSS分析讲解

合集下载

SPSS统计分析教程列联表分析

SPSS统计分析教程列联表分析

2 列联表分析(Crosstabs)列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。

SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。

其中卡方检验是分析列联表资料常用的假设检验方法。

例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。

预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。

数据如下表。

山东烟台历年观测数据分级表()注:摘自《农业病虫统计测报》 131页。

1) 输入分析数据在数据编辑器窗口打开“”数据文件。

数据文件中变量格式如下:2)调用分析过程在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图3)设置分析变量选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:”行变量框中。

选择列变量:将“玉米螟卵高峰发生期[y]”变量选入“Columns:”列变量框中。

4)输出条形图和频数分布表Display clustered bar charts: 选中显示复式条形图。

Suppress table: 选中则不输出多维频数分布表。

5)统计量输出点击“Statistics”按钮,弹出统计分析对话框(如下图)。

Chi-Square: 卡方检验。

选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验(Continuity Correction)及Fisher精确概率检验(Fisher’s Exact test)的结果。

第四章 SPSS的基本统计分析知识讲解

第四章 SPSS的基本统计分析知识讲解

多选项分析
多选项分析的基本思路
– 定义多选项变量集 – 多选项频数分析 – 多选项交叉分组下的频数分析
多选项分析
定义多选项变量集
目的:将已分解的变量定义为一个集合,便于进行多选 项分析
– 菜单选项:analyze->multiple response->define sets – 从原变量中选取被分解的变量(数值型)到variables in
进一步计算
– cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
分析列联表中变量间的关系
目的:
通过列联表分析,检验行列变量之间是否独立。
方法:
– 卡方检验:对品质数据的相关性进行度量
频数分析
基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形
计算描述统计量
目的
– 精确把握变量的总体分布状况,了解数据的集中趋 势、离散趋势、对称程度、陡峭程度。
– 菜单选项:analyze->multiple response->crosstabs
频数分析
目的
粗略把握变量值的分布状况。
例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)
采用的方法
– 计算频分布表:包括计算 频数、累计频数、百分比、累 计百分比

应用SPSS软件进行列联表分析

应用SPSS软件进行列联表分析

应用SPSS软件进行列联表分析在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。

例如在一项全球教育水平的研究中,调查了400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。

定义四个变量:gender(性别)、educat(学历)、minority(种族)、count(人数),其中前三个为分类变量,并且gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等,3表示学历高;minority变量值为0、1,标签值定义为:0表示非少数种族,1表示为少数种族。

下面做gender、educat、minority的三维列联表分析及其独立性检验。

数据文件如图1所示。

图1第一步:用“count”变量作为权重进行加权分析处理。

从菜单上依次选Data--weight Cases 命令,打开对话框,如图2所示。

图2点选Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。

第二步:从菜单上依次点选Analyze--Deseriptive Statistics--Crosstabs命令,打开列联分析对话框(Crosstabs),如图3所示。

图3第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移入行变量Row(s)框内,并将受教育年限编码后得到的学历变量educat移入列变量Column(s)框内(若此时单击OK按钮,则会输出一个2*3的二维列联表)。

这里要输出一个三维列联表,将变量种族minority作为分层变量移入Layer框中,并且可以勾选左下方的Display clustered bar charts项,以输出聚集的条形图,如图8图9所示。

图4第四步:选择统计量,单击Cosstabs对话框下侧的Statistics按钮,打开其对话框,如图5 所示。

SPSS 教程 第三章 基本分析

SPSS 教程     第三章 基本分析

描述性统计分析(Descriptive Statistics)统计分析往往是从了解数据的基本特征开始的。

描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。

两者相互补充,共同反映数据的全貌。

这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。

1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。

下面我们通过例子来学习单变量频数分析操作。

1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。

2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。

图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。

在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。

4)输出频数分布表Display frequency tables,选中显示。

5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。

Cut points for 10 equal groups:将数据平分为输入的10个等份。

Percentile(s)::用户自定义百分位数,输入值0—100之间。

选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。

列联表资料的SPSS分析

列联表资料的SPSS分析
我们以实验研究列联表资料实例,运用SPSS 软件包进行统计分析,对操作过程和结果解释予 以详细说明,希望能给大家提供借鉴。
1
一、一般四格表(2 × 2 列联表)资料
实验研究一般四格表(2×2 列联表)资料分析目的主 要有 2 个,一是分析两个比率总体的差别有无统计学意义 或两样本某指标的分布(或构成)总体是否相同,二是分 析两个分类特征是否有关联。
别;Kappa 检验(SPSS 不给可信区间),Kappa = 0.824, P < 0. 01,说明两种检查具有较好的一致性。
可以看出, 两种检验结果是矛盾的。为什么呢? McNemar 法一般用于样本含量 n 不太大的资料,因只考 虑结果不一致的情况,而未考虑样本含量 n 和结果一致的 情况,所以,当 n 很大且结果一致率高时,不一致的数值 相对较小,容易出现有统计学意义的检验结果,但实际意 义可能不大。本例即是如此,应以一致性检验结果为准。 实际上,对于两种检验(查)方法或诊断方法结果进行分 析时,主要分析的也就是一致性。根据Kappa 值判断一致 性强度的标准尚有争议,一般认为:Kappa 值< 0.4 时, 一致性较差;在 0.4~0.75 之间有中度至高度一致性;> 0.75 时,有极好的一致性。
列联表资料的SPSS分析
在实验研究与基础实验研究中,所分析的指 标可以是定量的,也可以是定性的。其定量指标, 有时也转化成定性资料进行分析。这些定性资料 或由定量资料转化而来的定性资料,一般都整理 成列联表形式,根据资料性质和分析目的选择恰 当的分析方法进行统计分析,并将统计分析结果 与专业知识相结合, 做出合理的解释。
51
合计
260 182 144
532
有效率(%)
96.60 90.11 81.94

列联表资料的SPSS分析39页PPT

列联表资料的SPSS分析39页PPT
❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
列联表资料的SPSS分析
1、纪律是管理关系的形式。——阿法 纳西耶 夫 2、改革如果不讲纪律,就难以成功。
3、道德行为训练,不是通过语言影响 ,而是 让儿童 练习良 好道德 行为, 克服懒 惰、轻 率、不 守纪律 、颓废 等不良 行为。 4、学校没有纪律便如磨房里没有水。 ——夸 美纽斯
5、教导儿童服从真理、服从集体,养 成儿童 自觉的 纪律性 ,这是 儿童道 德教育 最重要 的部分 。—— 陈鹤琴

SPSS列联表分析

SPSS列联表分析

例3: 以下是胃癌真菌病因研究中3种食物样品的真菌检出率,比较3种食物真菌检出率有无差异.
本例中SPSS提示没有理论频数小于5,且最小的理论频数为8.00,故直接选择Pearson 卡方结果,即χ2=22.841,P<0.001,提示三种食物中真菌检出率不同.此时还需要进一步考虑三种食物真菌检出率到底谁与谁之间的差异存在统计学意义,这里就需要用到卡方分割,通俗讲就是把RC列联表拆分成若干个四个表分别进行χ2检验,进而判断不同组两两比较差异是否用统计学意义,但是因为多组比较可能会增加犯I类错误概率,所以还需要对χ2检验的P值进行校正.常用Bonferroni法进行校正,本例中需要进行3次两两比较,校正的检验水准α=0.05/比较次数=0.05/3=0.0167,即当两两比较P<0.0167才能认为差异有统计学意义.
Kappa一致性检验
1、Kappa检验旨在评价两种方法是否存在一致性,或者是同一个研究者先后两次的诊断结果 2、Kappa检验会利用列联表的全部数据 3、Kappa检验可计算Kappa值用于评价一致性大小
配对χ2检验(McNemar检验)
1、配对χ2检验主要确定两种方法诊断结果是否有差别 2、配对χ2检验只利用“不一致“数据,如表中b和c 3、配对χ2检验只能给出两种方法差别是否具有统计学意义的判断
无效 疗效=1
好转 疗效=2
显效 疗效=3
治愈 疗效=4
合计
有效率%
甲法
24
26ห้องสมุดไป่ตู้
72
186
308
92.2
乙法
20
16
24
32
92
78.3
丙法
20
22
14
22

用SPSS作列联分析

用SPSS作列联分析

列联表的一般结构
列联表中的自由度
I×j列联表
f ij
C1 f11 f 21
C2 f12 f 22

Cj
f1 j f2 j
合计
RT 1 RT 2
R1 R2

Ri

f i1

fi 2

f ij

RTi
合计
CT 1
CT 2
CTj
n
3×3列联表自由度为4
C1 R1 R2
R3
C2 f12 f 22
大学生的运动偏好是否存在差异的问题。如果男女大学生的运动偏好没有差 异,体育部与学生会将针对全体学生发起整体性的宣传活动;如果有差异, 将分别针对男生和女生采取不同的宣传策略。为此,体育部与学生会随机发 放了200份问卷,让每一个学生在乒乓球、羽毛球、网球这三个运动项目上选 择出自己最喜欢的一项。调查数据整理后,得出如表下所示的表格:
f 2

接受域
拒绝域
0.05
0
5.9915 22.4
2
2 22.4 5.9915,拒绝原假设。结论:男女大学生的
运动偏好是有差异的,做出这一推断的把握程度是95%。
某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性
与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采
1954

a bc d a c b d
ad bc

525 763 831 1123 985 969
0.43
Φ相关系数比较适用于2×2列联表。列联表的行数 和列数大于2时, Φ相关系数会出现大于是1情况。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表2 婴儿喂养方式与腹泻的关系
喂养方式
人工 母乳
有腹泻
30 17
无腹泻
10 25
数据录入: 定义变量,变量 1 Name 为“method”,变量 2
Name为“result”,变量 3 Name 为“count”,Type 均为“Numeric”,Decimals均为“0”,其它为默认设 置;
输入数据,method:1 为“人工喂养”,2 为 “母乳喂养”;result:1 为“有腹泻”, 2 为“无腹 泻”。 分析过程:
例1. 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地 塞米松(对照组)降低颅内压的疗效,将200例颅内压增 高患者随机分为2 组, 见表1。
表1 试验组和对照组降低颅内压疗效的比较
组别 试验组 对照组
合计
有效 99 75 174
无效 5 21 26
有效率(%) 95.20 78.13 87.00
合计 104 96 200
① 频数加权(所有列联表资料均需经过频数加权, 以下例题分析中省略该过程):
Data →Weight Cases Weight Cases by: Frequency Variable:count
OK
② 分析: Analyze →Descriptive Statistics → Crosstabs Rows:group Columns: effect Statistics:√ Chi- square:Continue OK
列联表资料的SPSS分析
在实验研究与基础实验研究中,所分析的指 标可以是定量的,也可以是定性的。其定量指标, 有时也转化成定性资料进行分析。这些定性资料 或由定量资料转化而来的定性资料,一般都整理 成列联表形式,根据资料性质和分析目的选择恰 当的分析方法进行统计分析,并将统计分析结果 与专业知识相结合, 做出合理的解释。
该资料n大于40,所有T 均大于5,可取Pearson
c2 值和似然比(Likelihood ratio)c2值,二者 c2
值分别为12.123 和12.864,P < 0.01,试验组和对 照组的疗效差别有统计学意义,可认为异梨醇口
服液降低颅内压的疗效优于氢氯噻嗪 + 地塞米松。
例2. 一项关于婴儿喂养方式与腹泻关系的 研究,资料如表2;试分析腹泻与喂养方式 间是否有关联。
两个指标存在关联,Pearson 列联系数 C = 0.592,关联程度中等。
例4. 某研究者用胃镜和活检对1 321 例患 者进行胃癌检查,结果见表 4。问胃镜和 活检的结果是否一致?
表4 1 321 例患者胃镜和活检结果
胃镜
+ -
活检
+
-
143
48
4
1 126
数据录入: 同例 3。
表3 同一批标本两个指标的检测结果
甲指标
乙指标
+
-
+
217
23
-
34
162
数据录入: 定义变量,变量 1 Name 为 “A”,变量 2 Name 为
“B”,变量 3 Name 为“count”,Type 均为 “Numeric”, Decimals 均为 “0”,其它为默认设置;
输入数据,A= 1、B= 1:甲指标 “+”、乙指标“+”; A= 1、B= 2:甲指标 “+”、乙指标“-”; A= 2”;A= 2、B= 2:甲指标“-”、乙指 标“-”。 分析过程:
Analyze → Descriptive Statistics → Crosstabs Rows:A Columns:B Statistics:√ Chi – square,√ Contingency coefficient,√ McNemar
Continue
OK
主要结果与解释:
McNemar c2 检验(SPSS McNemar 检验法不给 c2 值),P = 0.185,说明两个 指标分布的差别无统计学意义;一般c2 检 验,Pearson c2 = 235.821, P < 0.01,说明
Analyze → Descriptive Statistics → Crosstabs Rows:method Columns:result Statistics:√ Chi- square,√ Contingency coefficient
Continue
OK
主要结果与解释:
这里,n > 40,且所有 T > 5,取Pearson
c2 检验结果,c2 = 9.981, P < 0.01,可认
为婴儿腹泻与喂养方式有关联;Pearson 列 联系数 C = 0.329,根据 C ≥ 0.7为高度关联、 C ≥ 0.4 为中度关联、C < 0.4 为低度关联的 判断原则,二者关联强度较弱。
二、配对四格表(2×2 列联表)资料
例3. 某研究者对同一批标本进行两个指标 的检测,结果见表3。问:① 两个指标的分 布有无差别? ② 两个指标有无关联?
主要结果与解释:根据2×2表资料 c2 检验的应用
条件:①总例数(n)≥ 40 且所有的理论值(T)
≥ 5 时,选用一般的 c2 检验;P ≈a 时, 改用Fisher
确切概率法;② n ≥ 40, 有1 ≤ T ≤ 5 时,选用连续校 正的检验;或改用Fisher确切概率法;③ n < 40, 或T < 1 时,用Fisher 确切概率法。
我们以实验研究列联表资料实例,运用SPSS 软件包进行统计分析,对操作过程和结果解释予 以详细说明,希望能给大家提供借鉴。
一、一般四格表(2 × 2 列联表)资料
实验研究一般四格表(2×2 列联表)资料分析目的主 要有 2 个,一是分析两个比率总体的差别有无统计学意义 或两样本某指标的分布(或构成)总体是否相同,二是分 析两个分类特征是否有关联。
数据录入: 打开SPSS;点击Variable View 定义变量,变量 1
Name 为“group”,Type 为“String”;变量 2 Name 为“effect”,Type 为“String”;变量3 Name 为 “count”;Type 为 “Numeric”,Decimals 为“0”, 其它为默认设置;点击Data View 输入数据。 分析过程:
相关文档
最新文档