X2检验-spss

合集下载

SPSS操作步骤全

SPSS操作步骤全

两组患者生存时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间 秩次
时间 秩次
12
4.5
5
1
25
10
8
2
27
11
12
4.5
29 12.5
12
4.5
38
17
12
4.5
42
19
17
7
46 20.5
21
8
46 20.5
24
9
56
23
29 12.5
60
24
30
14
34
15
36
16
40
18
48
22
n1=10 T1=162
9 ok
10 统计结果
11 结果解释
卡方检验SPSS操作
二 配对四格表的卡方检验 (配对设计)
1 输入数据
指定频数变量
2 选择Analyze菜单
3 描述统计过程
4 crosstabs过程
5 选行变量 列变量
6 statistics按钮
甲法 乙法
7 选择mcnemar
10 统计结果
抗体滴度 气雾组(亿/ml) 皮下注 合 平均
80
100
射组 计 秩次 80
1:10
2
4
2
8 4.5
9
1:20
15
7
1 31 20 300
1:40
10
12
13 66 49 490
1:80
5
7
9 87 77 385
1:160
1
2
5 95 91.5 91.5

第五章 SPSS参数检验

第五章 SPSS参数检验

(3)option选项 (3)option选项
1 - 20
SPSS两配对样本 SPSS两配对样本t检验 两配对样本t
(三)基本思路
计算t统计量和对应的相伴概率P(绝对值大于等于 计算t统计量和对应的相伴概率P(绝对值大于等于 的双侧概率) 的双侧概率) 结论:P≤α,则拒绝H 结论:P≤α,则拒绝H0,认为两总体均值有显著差异 .P> α,不能拒绝H0. α,不能拒绝H
use specified values:定义分组变量的分组标志值分别 values:定义分组变量的分组标志值分别 是什么 cut point:分组变量为连续变量.输入一个数字,将大于等 point:分组变量为连续变量.输入一个数字, 于该值的分成一组, 于该值的分成一组,小于该值的分成另一组.
1 - 17
两总体服从正态分布
1 - 19
SPSS两配对样本 SPSS两配对样本t检验 两配对样本t
(三)基本思路
H0:两总体均值无显著差异,差值序列的均值u0 =0. 两总体均值无显著差异,差值序列的均值u D 构造统计量:同单样本均值检验 t=
D=XD=X- u0 S为差值序列的标准差
S/ n
实质是先求出每对测量值的差值; 实质是先求出每对测量值的差值;然后检验差 值序列的均值是否与0有显著差异. 值序列的均值是否与0有显著差异. 如果差值的均值与0有显著差异, 如果差值的均值与0有显著差异,则认为两总体 均值存在显著差异;否则, 均值存在显著差异;否则,与0无显著差异,则认 无显著差异, 为两总体均值不存在显著差异. 为两总体均值不存在显著差异.
例如:男生和女生的高等数学平均成绩有显著差异吗?
(二)要求: 要求: 两样本必须相互独立, 两样本必须相互独立,即:抽取其中一批样本对抽取另 一批样本没有任何影响。 两总体服从正态分布

SPSS术语表

SPSS术语表

SPSS社会科学统计软件包术语表Nominal定类Ordinal定序Scale: Interval定距Ratio 定比N 受试者人数Std. Deviation标准差Std. Error Mean各组平均数的标准误Variance方差Range全距Skewness 偏态值Kurtosis峰数Histograms直方图With normal curve正态曲线Population总体Descriptive statistics描述统计Inferential statistics推断统计Parametric tests参数检验Data view 数据视窗Variable view变量视窗Name定义变量名Type 定义变量类型Width 定义数值需要的字节数Decimal 定义数值中小数的位数Label定义变量名的真实含义Values 定义数值的真实含义Missing 定义缺省值Columns定义列的宽度Scale 定义变量的测量类型Cell 单元格Numeric数值型String 字符串型Target variable 目标变量Functions函数Numeric expression数值表达式Independent Samples T Test独立样本T检验,又称受试者间检验between-subjects Levine’s Test for Equality of Variances 方差齐性检验Sig. 表示Levine检验的显著性概率Equal variances assumed方差齐性检验相等Equal variances not assumed方差非齐性Mean Difference两组的平均值之差Df自由度(degree of freedom)Sig.(2-tailed)双尾t检验的显著性概率95%Confidence Interval of the Difference平均值的差值95%置信区间Group Statistics分组描述统计量表Independent Samples Test独立样本检验表Paired-Samples T Test配对样本T检验Paired-Samples Correlation配对样本相关统计表One-Sample T Test单样本t检验X2 卡方检验Null hypothesis虚无假设Observed frequency 观察次数Expected frequency理论次数Crosstab, cross tabulation列联表Pearson chi-square test Pearson卡方检验likelihood-ratio chi-square 似然比卡方检验fisher’s exact test Fisher精确检验Yates’ corrected chi-square Yates连续性校正卡方检验Two-way table 2×2列联表Linear-by-linear association test线性关联检验Asymp. Sig. (2-sided) 显著性Cochran’s and Mantel-Haenszel statistics 分层卡方检验四格表卡方检验配对卡方检验。

统计学

统计学

两组患者性别、年龄、病程以及肿瘤情况等一般资料无明显差异(P>0.05)。

所有计量数据均用x2表示,运用SPSS20.0统计软件包处理。

多组计量数据比较采用单因素方差分析,组间两两比较采用t检验。

以p<0.05为差异有统计学意义。

对本次的研究结果,我们采用统计学软件SPSS 20.0对统计的数据进行处理,计量资料采用t检验,计数的资料采用x2检验,以P<0.05具有统计学意义。

采用统计学软件SPSS20.0对所得数据进行处理,组与组之间的基本资料比较以(x±s)表示,以t检验,组与组之间的临床效果比较以χ2检验,P<0.05表示差异有统计学意义。

用n/%表示计数资料,采用x2检验,用(x±s)表示计量资料,采用t检验,运用SPSS20.0统计学软件对数据进行分析处理,差异具有统计学意义的标准为P<0.05。

采用SPSS 20.0统计软件对统计所得的具体数据进行分析,所有计量资料均用均数±x±)表示,比较采用t检验,计数资料用n/%表示,比较采用x2检验,如果P <0.05,标准差(s
则表示结果有统计学意义。

并对以此为依据的不同外科手术处理结果进行分析
出血停止时间用均数±标准差(x±s)表示,比较采用t检验,贫血发生率和治疗有效率用n/%表示,比较采用x2检验,统计所得具体数据的分析采用SPSS20.0统计软件,如果P <0.05,则表示结果有统计学意义。

对本研究中所有数据进行统计学处理的过程中运用统计学软件SPSS20.0,用(s
x±)表示计量资料,用单因素方差分析多组间比较,用q检验两两比较,P<0.05表示具有统计学差异。

SPSS教程-非参数检验

SPSS教程-非参数检验
两独立样本的非参数检验是在对总体分布不很 了解的情况下,通过分析样本数据,推断样本 来自的两个独立总体分布是否存在显著差异。
一般用来对两个独立样本的均数、中位数、离 散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。
Mann-Whitney检验
=0.18576
计算表
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
单样本K-S检验
利用样本数据推断样本来自的总体是否服从某一理论 分布,是一种拟合优度的检验方法,适用于探索连续 型随机变量的分布
步骤
计算各样本观测值在理论分布中出现的理论累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算理论累计概率值与实际累计概率值的差D(x) 计算差值序列中最大绝对差值D
针麻效果
(1) Ⅰ Ⅱ Ⅲ Ⅳ

肺癌 (2) 10 17 19 4
三种病人肺切除术的针麻效果比较肺化脓症Fra bibliotek肺结核
(3)
(4)
24
48
41
65
33
36
7
8
合计 (5) 82 123 88 19
SPSS基本操作
与例7的操作相同
随机区组设计资料的秩和检验
M检验(Friedman法)法计算步骤
将每个区组的数据由小到大分别编秩 计算各处理组的秩和Ri 求平均秩:R=1/2b(k+1) 计算各处理组的( Ri-R) 求M 查M界值表,F近似法
参数统计(parametric statistics) : 在 统计推断 中,若样本所来自的总体分布为已知的函数形式 (正态/近似正态分布),但其中的参数未知,统 计推断的目的就是对这些未知参数进行估计/检验, 这类统计推断方法称参数统计。

SPSS统计分析简明教程

SPSS统计分析简明教程
SPSS统计分析简明教程
It is applicable to work report, lecture and teaching
Courseware template
SPSS统计分析简明教程
On the evening of July 24, 2021
主要内容
n 1 SPSS统计软件介绍 n 2 SPSS统计软件基本功能 n 3 利用SPSS进行统计描述 n 4 利用SPSS进行统计检验
n 在统计过程进行后,SPSS会自动生成一系列数 据表,SPSS提供了图形生成工具将结果可视化。
n 5 保存和导出分析结果
n 利用SPSS的输出功能导出分析结果
On the evening of July 24, 2021
Courseware template
2 SPSS统计软件基本功能
n SPSS统计分析的基本操作
n 利用Transform->Computer进行计算 n 将SPSS的输出图形导出为*.htm, *.jpg,
*.bmp等
On the evening of July 24, 2021
Courseware template
3 SPSS统计描述
n 统计描述方法,是研究简缩数据并描述这些 数据的统计方法。
n Transform->Computer计算总分
On the evening of July 24, 2021
Courseware template
2 SPSS统计软件基本功能
n SPSS统计分析的基本过程
n 3 统计分析
n 按研究的要求和数据的情况确定统计分析方法, 然后对数据进行统计分析。
n 4 统计结果可视化

计数资料常用检验方法


.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组 有效数 无效数 合计
在R×C表中,如T<5的格子数超过基本格 子的1/5时,不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV


2(1.46) 107
乙组 74
32 6
1(1.54) 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列(或两 行) ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大(n>100), 而率又不太小时(比如np或n(1p)均大于5,此时率的分布近似正 态分布),可选择u检验(或X2
检验)见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)

spss假设检验


独立样本的T检验 2.2 独立样本的 检验
独立样本的T检验目的是推断两个独立总体的均值是否 独立样本的T检验目的是推断两个独立总体的均值是否 两个独立总体 存在显著差异。 存在显著差异。 例2-2: 科技文教人员与公司职员的平均假日支出是否存在显著差异? 科技文教人员与公司职员的平均假日支出是否存在显著差异? 两个独立总体:科技文教人员与公司职员 两个独立总体: 均值:平均假日支出 均值: H 0 : 科技文教人员与公司职员的平均假日支出无显著差异; 科技文教人员与公司职员的平均假日支出无显著差异 无显著差异; 有显著差异。 科技文教人员与公司职员的平均假日支出有显著差异 H1 : 科技文教人员与公司职员的平均假日支出有显著差异。
接受零假设只是表明在给定的显著性水平下, 接受零假设只是表明在给定的显著性水平下, 样本数据不足以拒绝它,并不意味着它肯定是正确的; 样本数据不足以拒绝它,并不意味着它肯定是正确的; 同理,拒绝零假设也只是表明在给定的显著性水平下, 同理,拒绝零假设也只是表明在给定的显著性水平下, 样本数据不足以接受它,并不意味着它肯定是错误的。 样本数据不足以接受它,并不意味着它肯定是错误的。
H 0 : µ = 500
H 1 : µ ≠ 500
其重量的平均值为 X ≈ 505.3,
标准差为 S ≈ 2.9
Sig.<0.05时,拒绝零假设,即认为“有显著差异”。 Sig.<0.05时 拒绝零假设,即认为“有显著差异” Sig.=0.001<0.05, 拒绝零假设,即认为该包装不合格 拒绝零假设,
表2-1 接受教育的平均年限的T检验结果(一) 接受教育的平均年限的T检验结果(
Test Value = 16 95% Confidence Interval of the Difference Lower -2.00 Upper -.28

spss卡方分布


数据文件
43
笃 学
精 业
修 德
厚 生
• 分析时不需加权,直接按列联表分析。
45
笃 学
精 业
修 德
厚 生
结果: χ2=1.139,双侧P=0.888,差异无统计学 意义,尚不能认为不同年龄组的孕妇的新生儿 的出生体重有不同。
练习题
• 1. 某学者将120名60岁以上的老人按其是 否患有高血压分为两组,并调查他们的食 盐量,请问患高血压和患高血压的老人食 盐量超标率是否相同。 表5 高血压患病与食盐问题
厚 生
合计 515 522 969 2006
49
数据文件
35
笃 学
精 业
修 德
厚 生
36
笃 学
精 业
修 德
厚 生
(二)定义频数变量 • Data → Weight Cases… (三)列联表分析 • Analyze → Descriptive Statistics → Crosstabs…
37
笃 学
精 业
修 德
厚 生
38
笃 学
精 业
修 德
厚 生
4
笃 学
精 业
修 德
厚 生
5
笃 学
精 业
修 德
厚 生
• (二)必须指定频数变量,即 • Data →Weight Cases,在对话框里, 将频数变量放入频数变量栏中;
频数表数据需要用 Weight cases 如果是原始数据不要 用 Weight cases !!!
数据文件
6
笃 学
精 业
修 德
厚 生
四格表资料χ2检验的适用条件
T为理论频数, n为样本含量。

SPSS列联表分析


例3: 以下是胃癌真菌病因研究中3种食物样品的真菌检出率,比较3种食物真菌检出率有无差异.
本例中SPSS提示没有理论频数小于5,且最小的理论频数为8.00,故直接选择Pearson 卡方结果,即χ2=22.841,P<0.001,提示三种食物中真菌检出率不同.此时还需要进一步考虑三种食物真菌检出率到底谁与谁之间的差异存在统计学意义,这里就需要用到卡方分割,通俗讲就是把RC列联表拆分成若干个四个表分别进行χ2检验,进而判断不同组两两比较差异是否用统计学意义,但是因为多组比较可能会增加犯I类错误概率,所以还需要对χ2检验的P值进行校正.常用Bonferroni法进行校正,本例中需要进行3次两两比较,校正的检验水准α=0.05/比较次数=0.05/3=0.0167,即当两两比较P<0.0167才能认为差异有统计学意义.
Kappa一致性检验
1、Kappa检验旨在评价两种方法是否存在一致性,或者是同一个研究者先后两次的诊断结果 2、Kappa检验会利用列联表的全部数据 3、Kappa检验可计算Kappa值用于评价一致性大小
配对χ2检验(McNemar检验)
1、配对χ2检验主要确定两种方法诊断结果是否有差别 2、配对χ2检验只利用“不一致“数据,如表中b和c 3、配对χ2检验只能给出两种方法差别是否具有统计学意义的判断
无效 疗效=1
好转 疗效=2
显效 疗效=3
治愈 疗效=4
合计
有效率%
甲法
24
26ห้องสมุดไป่ตู้
72
186
308
92.2
乙法
20
16
24
32
92
78.3
丙法
20
22
14
22
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X2 检验 X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。在SPSS中,所有X2检验均用Crosstabs完成。 Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现。 界面说明

【Rows框】 用于选择行*列表中的行变量。 【Columns框】 用于选择行*列表中的列变量。 【Layer框】 Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。 【Display clustered bar charts复选框】 显示重叠条图。 【Suppress table复选框】 禁止在结果中输出行*列表。 【Statistics】按钮 弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。 Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。 Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。 Contingency coefficient复选框:即列联系数,其值界于0~1之间; Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramer's V 则界于0~1之间; Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差; Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。 Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。 Gamma复选框:界于0~1之间,所有观察实际数集中于左上角和右下角时,其值为1; Somers'd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例; Kendall's tau-b复选框:界于-1~1之间; Kendall's tau-c复选框:界于-1~1之间; Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例; Kappa复选框:计算Kappa值,即内部一致性系数; Risk复选框:计算比数比OR值; McNemanr复选框:进行McNemanr检验,即常用的配对计数资料的X2检验(一种非参检验); Cochran's and Mantel-Haenszel statistics复选框:计算X2M-H统计量(分层X2,也有写为X2CMH

的),可在下方输出H0假设的OR值,默认为1。

【Cells】按钮 弹出Cells对话框,用于定义列联表单元格中需要计算的指标: Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected); Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total); Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj. Standardized);

【Format钮】 用于选择行变量是升序还是降序排列。

分析实例 一、四格表资料的X2检验 例6.1 某医生用呋喃硝胺和甲氰咪胍治疗十二指肠溃疡,结果如下表,问两种药物治疗效果有无差别? 组 别 愈合 未愈合 合计 有效率(%) 呋喃硝胺 54 8 62 87.09 甲氰咪胍 44 20 64 68.75 合 计 98 28 126 77.78 【建立数据文件】 由于此处给出的是频数表(大部分资料都以这种形式给出),因此在建立数据集时可以直接输入三个变量: 行变量(分组变量):变量名取“R”,变量值为 1=“呋喃硝胺组”,2=“甲氰咪胍组” 列变量(疗效变量):变量名取“C”,变量值为 1=“愈合”,2=“未愈合” 指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。 所建立的数据集如下表。 然后用Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。 R C F 1.00 1.00 54.00 1.00 2.00 44.00 2.00 1.00 8.00 2.00 2.00 20.00

【操作过程】 Data==>Weight Cases (对数据按频数进行加权) Weight Cases by单选框:选中 Freqency Variable:选入F 单击OK钮 Analyze==>Descriptive Statistics==>Crosstabs Rows框:选入R Columns框:C Statistics按钮:选中Chi-square复选框,单击Continue钮 Cells...按钮: 选中Row 复选框,单击Continue钮 单击OK钮 【结果解释】 上题分析结果如下:

Case Processing Summary

126100.0%0.0%126100.0%组别 * 疗效NPercentNPercentNPercentValidMissingTotalCases

首先是有效记录数和处理记录缺失值情况报告,可见126例均为有效值。 组别 * 疗效 Crosstabulation

5486287.1%12.9%100.0%44206468.8%31.3%100.0%982812677.8%22.2%100.0%

Count% within 组别Count% within 组别Count% within 组别呋喃硝胺甲氰米胍组别Total

愈合未愈合疗效Total

上表为列出的四格表,其中加入变量值和变量值标签,看起来很清楚。 Chi-Square Tests6.133b1.0135.1181.0246.3041.012.018.011

6.0841.014126

Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases

ValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)

Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is13.78.b.

上表给出了一堆检验结果,从左到右为:检验统计量值(Value)、自由度(df)、双侧近似概率(Asymp.Sig.2-sided)、双侧精确概率(Exact Sig.2-sided)、单侧精确概率(Exact Sig.1-sided);从上到下为:Pearson卡方(Pearson Chi-Square即常用的卡方检验)、连续性校正的卡方值(Continuity Correction)、对数似然比方法计算的卡方(Likelihood Ratio)、Fisher's确切概率法(Fisher's Exact Test)、线性相关的卡方值(Linear by Linear Association)、有效记录数(N of Valid Cases)。另外,Continuity Correction和Pearson卡方值处分别标注有a和b,表格下方为相应的注解:a.只为2*2表计算。b.0%个格子的期望频数小于5,最小的期望频数为13.78。因此,这里无须校正,直接采用第一行的检验结果,即X2=6.133,P=0.013。 因P=0.013,可以认为两种药物疗效有差异,结合样本率,可以认为呋喃硝胺有效率高于甲氰米胍。 如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可,其余的对我们而言用处不大,可以视而不见。

二、配对计数资料X2检验 例6.2 有28份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果如下表,试检验甲、乙培养基生长率有无差别。 甲乙两种结核杆菌培养基的培养结果 乙培养基 甲培养基 + — 合 计 + 11 9 20

— 1 7 8 合 计 12 16 28 【建立数据文件】 输入三个变量: 行变量(代表甲培养基):变量名取“R”,变量值为 1=“生长”,2=“未生长” 列变量(代表甲培养基):变量名取“C”,变量值为 1=“生长”,2=“未生长” 指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。 所建立的数据集如下表。 然后用Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。

相关文档
最新文档