第七章 spss之均数间的比较

合集下载

10简述SPSS中均数比较

10简述SPSS中均数比较

10简述SPSS 中均数比较(compare mean)过程中的均数比较类型及应用。

➢ 均数比较的类型及其应用:
1) 单个样本均数与总体均数比较: ①N >50,z 检验。

②N <50,正态,t 检验;偏态,变量变换或者秩和检验

操作:Analyze -Compare Means - One-Sample T Test ☐
选定分析的变量 ☐
输入待比较的总体参数μ
0,确定单双侧检验水准
☐ 选定需要输出的差异的置信区间
2) 配对样本的均数比较:
①差值正态,t 检验
②差值偏态,变量变换或者秩和检验 ☐ 按Analyze - ☐ 选定待分析的配对变量,成对选入。

☐ 默认输出差异的95%置信区间
3) 两个样本均数的比较
a 、N >50,z 检验
b 、N <50 两样本方差齐: ①原始资料呈正态分布时: t 检验 ②原始资料不呈正态分布,但样本量较大时: t 检验
③原始资料不呈正态分布,且样本量较小时:非参数检验
c 、N <50 两样本方差不齐:
①数据变换后方差齐: t 检验
②数据变换后方差不齐: t 、检验

待比较的两组数据应存放于一个变量上,以分组变量区分组别。


按Analyze -Compare Means - Independent-Sample T Test ☐
选定待比较的变量 ☐
选定分组变量 ☐ 定义两个比较组
4) 平均值比较
5) 摘要独立样本T 检验
6) 单因素ANOVA 检验。

SPSS均值比较

SPSS均值比较
本没有任何影响,两组样本个案数目可以不同,
个案顺序可以随意调整。
• 样本来自的两个总体应该服从正态分 布。
两独立样本T检验的零假设H0为两总体均 值之间不存在显著差异。
在具体的计算中需要通过两步来完成:第 一,利用F检验判断两总体的方差是否相同; 第二,根据第一步的结果,决定T统计量和自 由度计算公式,进而对T检验的结论作出判断。
从两种情况下的T统计量计算公式可以看 出,如果待检验的两样本均值差异较小,t值 较小,则说明两个样本的均值不存在显著差异; 相反,t值越大,说明两样本的均值存在显著 差异。
4.3.2 SPSS中实现过程
研究问题 分析A、B两所高校大一学生的高考数学成
绩之间是否存在显著性差异。
实现步骤
表4-2 两所学校学生的高考数学成绩表
定距变量又称为间隔(interval)变量, 它的取值之间可以比较大小,可以用加减法计 算出差异的大小。例如,“年龄”变量、“收 入”变量、“成绩”变量等都是典型的定距变 量。
Pearson简单相关系数用来衡量定距变量 间的线性关系。如衡量国民收入和居民储蓄存 款、身高和体重、高中成绩和高考成绩等变量 间的线性相关关系。
4.3 两独立样本T检验
4.3.1 统计学上的定义和计算公式
定义:所谓独立样本是指两个样本之间彼 此独立没有任何关联,两个独立样本各自接受 相同的测量,研究者的主要目的是了解两个样 本之间是否有显著差异存在。这个检验的前提 如下。
• 两个样本应是互相独立的,即从一总 体中抽取一批样本对从另一总体中抽取一批样
6.1 相关分析的基本概念
任何事物的变化都与其他事物是相互联系 和相互影响的,用于描述事物数量特征的变量 之间自然也存在一定的关系。变量之间的关系 归纳起来可以分为两种类型,即函数关系和统 计关系。

SPSS均值比较

SPSS均值比较
具体步骤见课堂演示。
17
两个总体方差差异的F检验
1. 两个独立总体方差差异的检验 2. 为参数检验过程 3. 假定
两个总体都服从正态分布
▪ 这一检验对正态假定较为敏感
18
方差的F检验
1. 假设
H
0
:
σ
2 1
σ
2 2
H
1
:
σ
2 1
σ
2 2
2. 检验统计量

H
0
:
σ
2 1
σ
2(
2
or

H
1
:
σ
2 1
0.05
df 21 25- 2 44
拒绝H0
0.025
拒绝H0
0.025
-2.0154 0 2.0154 t
t ( 3 .27 - 2.53) (0) 2 . 03
1 . 51
1 21
1 25
决定:
在 0 . 05 水平上拒绝 H 0 结论:
有证据表明存在均值差
异。
临界值
9
两样本不同方差均值的t 检验
NYSE NASDAQ
样本容量 21
25
均值
3.27
2.53
标准差 1.30
1.16
假定总体方差相同, 试检验平均
利息收益有没有差异(= 0.05)。
7
检验统计量的计算
t (X1 X2 ) (μ1 μ 2 ) (3.27 - 2.53) (0) 2.03
S2P
1
n
1
1 n2
1.51
均值比较
(双样本检验)
1
学习目标
1. 区分独立总体与相关总体的概念 2. 混合方差时两独立总体均值差异的t检验 3. 不同方差时两独立总体均值差异的t检验 4. 两总体方差差异的F检验 5. 两个独立总体的中位数差异的秩和检验 6. 两个独立总体比率差异的Z检验 7. 两个相关总体(成对样本)均值差异的t检验 8. 两个相关总体中位数差异的符号秩检验

SPSS均数的比较 PPT资料共37页

SPSS均数的比较 PPT资料共37页
33
SPSS12.0统计软件
单因素方差分析
Post Hoc 对话框
SPSS12.0统计软件
单因素方差分析
Mul tiple C omparis ons Dependent Variab le: 血糖下降值
LSD
(I) 分组 高剂量 组
(J) 分组 低剂量 组
Mean Difference (I-J)
肺活量
Leven e Statis tic d f1
2.852
2
d f2 28
Sig . .075
AN OVA
肺活量
Sum of S quares df Mean S quare F
Betw een Gro9up.2s66
2 4.633 84.544
Within Group1s.534
28
.055
T otal
H0及H1 对适用条件的检查: 正态性、方差齐性 方差分析表的阅读
28
SPSS12.0统计软件
单因素方差分析
Analyze——Compare Means——One-Way ANOVA
SPSS12.0统计软件
单因素方差分析
Te s t of Homoge ne ity of Variance s
均数的比较
均数间的比较
预分析——Means过程
单样本设计t检验 两独立样本t检验 配对设计t检验
Analyze
Compare Means
预分析——Means过程
该过程更倾向于对样本进行描述 它可以按分组变量计算描述指标,进行检验前的 预分析 也可直接进行比较
例:对数据hb.sav进行预分析
预分析——Means过程

spss课件-均值比较与检验

spss课件-均值比较与检验
功能:分組計算、比較指定變數的描述統計量。包括均值、標準
差、總和、觀測數、方差等等,還可以給出方差分析表和線性檢驗 結果。描述統計量公式P126。
Analyze-> Compare Means->Means
• Dependent List:因變數(分析變數,一般為定距或定序變數) • Independent List:引數(分組變數,為分類變數,注意可分
要求:a. 被比較的兩組樣本彼此獨立, 沒有
配對關係 b. 兩組樣本均來自正態總體 c. 均值是對於檢驗有意義的描述統計量
兩組樣本方差相等和不等時使用的計算t值的公式不 同。因此應該先對方差進行齊次性檢驗。SPSS的輸出, 在給出方差齊和不齊兩種計算結果的t值,和t檢驗的 顯著性概率的同時,還給出對方差齊次性檢驗的F值 和F檢驗的顯著性概率。用戶需要根據F檢驗的結果自 己判斷選擇t檢驗輸出中的哪個結果,得出最後結論。
能否用樣本均值估計總體均值?兩個變數均值接近的 樣本是否來自均值相同的總體?換句話說,兩組樣本 某變數均值不同,其差異是否具有統計意義?能否說 明總體差異?這是各種研究工作中經常提出的問題。 這就要進行均值比較。
8.1.2 進行均值比較及檢驗的過程
MEANS過程:不同水準下(不同組)的描述統計量,如男女
的平均工資,各工種的平均工資。目的在於比較。術語:水準數 (指分類變數的值數,如sex變數有2個值,稱為有兩個水準)、 單元Cell(指因變數按分類變數值所分的組)、水準組合
T test 過程:對樣本進行T檢驗的過程
• 單一樣本的T檢驗:檢驗單個變數的均值是否與給定的常數之 間存在差異。
• 獨立樣本的T檢驗:檢驗兩組不相關的樣本是否來自具有相同 均值的總體(均值是否相同,如男女的平均收入是否相同,是 否有顯著性差異)

SPSS均数比较过程.ppt

SPSS均数比较过程.ppt
检验水平α:即显著性水平,一般取0·05或0·01。
第Ⅰ类错误:当无效假设为真时,却被否定,即 “弃真”错误。 α为第Ⅰ类错误的概率。
第Ⅱ类错误:当无效假设为假时,却被接受,即 “取伪”错误。 β为第Ⅱ 类错误的概率。
10
假设检验的两类错误
假设检验基于小概率原理:给定检验水平α,如果零假设 成立条件下出现现有统计量的概率等于或小于α,则认为 此事件可能性很小,因此就拒绝零假设。
x
Z1
2
n
3
推断统计
本节中的均数比较过程是典型的参数检验,参数检 验是推断统计的重要组成部分。
推断统计:由样本数据推断总体特征的方法。在 对样本数据描述的基础上,以概率形式对总体的 数量特征进行表述。
总体数据无法获得 搜集总体数据投入较大。
推断统计包括参数估计和假设检验两种形式,二 者原理一致,仅表现形式不同。
第一类错误和第二类错误又是一对矛盾:在其他条件不 变下,减少犯第一类错误的可能性,势必增加犯第二类 错误的可能性。
要同时减少一、二两类错误的概率,只有增加样本量。
置信度 取伪错误
弃真错误 检验效能11
双侧检验
检验样本均值与总体均值有没有显著性差异 显著性水平α=0·05 如:出生婴儿的平均体重是否为3公斤?
X
Z
15
图 标准正态曲线下从
到u范围面积示意图
16
2、标准正态分布与t统计量
正态分布N(,2)的资料,其样本均数服从正态分布N(μ,2/n),并且 变换后的统计量 Z X 服从标准正态分布N(0,1) 。
/ n
但在实际研究时,往往是未知的,因此只能用样本的标准差S作为
的一个近似值(估计值)代替,得到变换后的统计量并记为

SPSS推断统计之均值比较与方差分析 PPT课件

SPSS推断统计之均值比较与方差分析 PPT课件
• H0: 某一数值 • 指定为 = 号,即 或 • 例如, H0: 3190(克)
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 1. 与原假设对立的假设,也称“研究假设” 2. 研究者想收集证据予以支持的假设总是有不
等号: , 或 3. 表示为 H1
H0值 临界值 计算出的样本统计量
利用 P 值进行检验 (决策准则)
1. 单侧检验
• 若p-值 ,不拒绝 H0 • 若p-值 < , 拒绝 H0
2. 双侧检验
• 若p-值 /2, 不拒绝 H0 • 若p-值 < /2, 拒绝 H0
假设检验中的两类错误
1. 第一类错误(弃真错误)
• 原假设为真时拒绝原假设 • 会产生一系列后果 • 第一类错误的概率为
✓ 配对样本t检验
•Paired-samples t-test •同一变量、同一组在不同的情况、均值差异
Independent-samples t-test
例子:sex differences in self-esteem scores (dataFile1.sav) • 研究问题
Is there a significant difference in the mean of self-esteem scores for males and females? • 分析单元:个人 (Individual) • 自变量:性别 (分类变量) •因变量:self-esteem score (等比变量) • 需满足的假定条件
被称为显著性水平
2. 第二类错误(取伪错误)
• 原假设为假时接受原假设 • 第二类错误的概率为(Beta)
假设检验的流程

spss 均值的比较与检验

spss 均值的比较与检验
执行单样本T检验过程,SPSS将显示:每个检验变量的统计量的均值、标准 差和均值的标准误差,检验样本是否来自总体均数为一指定总体的结果;显示 样本值与常数之差以及其95%的置信区间。
三、应用举例
例5-5-1,某轮胎厂的质量分析报告中说明,该厂某轮胎的平均寿命在 一定的载重负荷与正常行驶条件下会大于25000公里。平均轮胎寿命的公里数 近似服从正态分布。现对该厂该种轮胎抽出一容量为15的样本,试验结果得样 本均值为27000公里。能否做出结论:该厂产品与申报的质量标准相符?数据 如下(e5-5-2.sav)
z ~ t (n 1) sz / n
在显著水平α下, 双侧检验的H0拒绝区域为: | t | t (n 1)
2
二、配对样本T检验功能与应用
配对样本T检验是进行配对样本均数的比较。执行该过程, SPSS显示:
每个变量的均数、标准差、标准误和样本含量;
每对变量的相关系数;
每对变量的均数的差值、差值的标准误和可信区间; 检验每对变量均数的差值是否来自总体均数为0 的t检验结果。 三、应用举例 例5-5-4 :(e5-5-5.sav)
设总体X服从正态分布N(μ,σ2),其中σ2未知。从中抽出子样 (x1,x2,…,xn),现要检验假设H0: μ= μ0,H1: μ≠ μ0,其中μ0为已知 常数。 x μ0 其中S为子样标准差。 通常σ是未知: T
s / n 1
若H0成立,则统计量T服从自由度为n-1的t分布。对于给定的α, 由t分布表可查得临界值t α/2(n-1), 使 P{|T|>t α/2(n-1)}= α 如果算得T的值t落入其拒绝域|t|>t α/2(n-1)内,则拒绝H0;否则 不能拒绝H0。 二、单样本T检验的功能与应用
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章均数间的比较--Compare Means菜单详解(医学统计之星:张文彤)上次更新日期:7.1 Means过程7.1.1 界面说明7.1.2 结果解释7.2 One-Samples T Test过程7.2.1 界面说明7.2.2 结果解释7.3 Independent-Samples T Test过程7.3.1 界面说明7.3.2 结果解释7.4 Paired-Samples T Test过程7.4.1 界面说明7.4.2 分析实例7.4.3 结果解释7.5 One-Way ANOVA过程7.5.1 界面说明7.5.2 分析实例7.5.3 结果解释知道吗?在计算机领域中有个著名的80/20规则,也就是在奔腾及更早的CPU所采用的CISC指令集中,有80%的任务是被20%的最常用指令所完成的;换言之,另外80%的复杂指令只完成20%的不常用任务。

好了,言归正传。

现在我要非常高兴的向大家宣布:80/20规则在SPSS的使用中同样有效!仅以Analyze菜单为例,其中最常用的子菜单为:∙Discriptive Statistics∙Compare Means∙General Linear Model(第一项)∙Correlate∙Regression(前半截)只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用SPSS解决80%的统计学难题。

如果不满足,你在召开新闻发布会的时候还可以对以上指标进行四舍五入:)。

此时课堂上有一美眉提问:老师,那我们是不是可以只学这几项功能就行了?我...我...气死我了...好,言归更正传。

在以上五个菜单中,Compare Means是最简单的一个,但使用频率却几乎最高!因此,他的重要性也就不用我多说了吧...(以下省略五十万字)。

下面让我们大家一起踏上Compare Means之旅。

该菜单集中了几个用于计量资料均数间比较的过程。

具体有:∙Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比较。

∙One-Samples T Test过程进行样本均数与已知总体均数的比较。

∙Independent-Samples T Test过程进行两样本均数差别的比较,即通常所说的两组资料的t检验。

∙Paired-Samples T Test过程进行配对资料的显著性检验,即配对t检验。

∙One-Way ANOV A过程进行两组及多组样本均数的比较,即成组设计的方差分析,还可进行随后的两两比较。

§7.1Means过程和上一章所讲述的几个专门的描述过程相比,Means过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再次调用其他过程。

显然要方便的多。

7.1.1 界面说明【Dependent List框】用于选入需要分析的变量。

【In dependent List框】用于选入分组变量。

【Options钮】弹出Options对话框,选择需要计算的描述统计量和统计分析:o Statistics框可选的描述统计量。

它们是:1.sum,number of cases 总和,记录数2.mean, geometric mean, harmonic mean 均数,几何均数,修正均数3.standard deviation,variance,standard error of the mean 标准差,均数的标准误,方差4.median, grouped median 中位数,频数表资料中位数(比如30岁组有5人,40岁组有6人,则在计算grouped median时均按组中值35和45进行计算)。

5.minimum,maximum,range 最小值,最大值,全距6.kurtosis, standard error of kurtosis 峰度系数,峰度系数的标准误7.skewness, standard error of skewness 偏度系数,偏度系数的标准误8.percentage of total sum, percentage of total N 总和的百分比,样本例数的百分比o Cell Statistics框选入的描述统计量。

o Statistics for First layer复选框组1.Anova table and eta 对分组变量进行单因素方差分析,并计算用于度量变量相关程度的eta值。

2.Test for linearity 检验线性相关性,实际上就是上面的单因素方差分析。

7.1.2 结果解释有了上一章的基础,Means过程的输出看起来就不太困难了。

以第一章的数据为例,输出如下:Means上表还是缺失值报告。

常用统计描述量报表。

这里按默认情况输出均数,样本量和标准差。

由于我们选择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。

上表为单因素方差分析表。

在选择了Anova table and eta或Test for linearity复选框时出现。

实际上就是在检验各组间均数有无差异。

上面各项的具体含义将在单因素方差分析一节中解释。

相关性度量指标,给出Eta值以及Eta值的平方根。

§7.2One-Samples T Test过程One-Samples T Test过程用于进行样本所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任意值,该对话框的界面非常简单。

7.2.1 界面说明【Test Variables框】用于选入需要分析的变量。

【Test Value框】在此处输入已知的总体均数,默认值为0。

【Options钮】弹出Options对话框,用于定义相关的选项,有:o Confidence Interval框输入需要计算的均数差值可信区间范围,默认为95%。

如果是和总体均数为0相比,则此处计算的就是样本所在总体均数的可信区间。

o Missing V alues单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。

默认为前者,以充分利用数据。

7.2.2 结果解释One-Samples T Test过程的输出也是比较简单的,由描述统计表和t检验表组成,比如要检验数据li1_1.sav中血磷值的总体均数是否等于1,则输出如下:T-Test所分析变量的基本情况描述,有样本量、均数、标准差和标准误。

上表为单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。

由上表可知:t=2.975,P=0.007。

因此可以认为血磷值的总体均数不等于1。

§7.3Independent-Samples T Test过程Independent-Samples T Test过程用于进行两样本均数的比较,即常用的两样本t 检验。

该对话框的界面我们在第一章已经见过了,和上面的One-Samples T Test 对话框非常相似。

7.3.1 界面说明【Test Variables框】用于选入需要分析的变量。

【Grouping Variable框】用于选入分组变量。

注意选入变量后还要定义需比较的组别。

【Define Groups框】用于定义需要相互比较的两组的分组变量值。

可以这样来理解:如果分组变量有3个取值(即有三组),而我们做t检验是比较其中的某两组,这时就可以用Define Groups框来指定需比较的两组。

当然,如果分组变量只有2个取值时,我们仍然要再该框中进行定义,这也算是SPSS 对话框存在的一个小缺陷吧。

【Options钮】和One-Samples T Test对话框的Options钮完全相同,此处不再重复。

7.3.2 结果解释比如要检验数据li1_1.sav中克山病患者与健康人的血磷值是否相同,用Independent-Samples T Test过程的结果输出如下:T-Test两组需检验变量的基本情况描述。

可见该结果分为两大部分:第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,P = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,P=0.019。

从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。

最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。

如果你觉得上表太宽,用第三章学过的行列转置功能可以使它变的紧凑许多。

§7.4Paired-Samples T Test过程该过程用于进行配对设计的差值均数与总体均数0比较的t检验,对统计学比较熟悉的朋友可以看出,他的功能实际上是和One-Samples T Test过程相重复的(等价于已知总体均数为0的情况),但Paired-Samples T Test过程使用的数据输入格式和前者不同,即我们所称的统计表格格式,因此仍然有存在的价值。

对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。

7.4.1 界面说明整个界面上只有一个Paired Variable框需要介绍,他用于选入希望进行比较的一对或几对变量--注意这里的量词是对而不是个。

选入变量需要成对成对的选入,即按住Ctrl键,选中两个成对变量,再单击将其选入。

如果只选中一个变量,则按钮为灰色,不可用。

7.4.2 分析实例例7.1 某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无差别(卫统第三版例4.5)?大白鼠对号正常饲料组维生素E缺乏1 3550 24502 2000 24003 3000 18004 3950 32005 3800 32506 3750 27007 3450 25008 3050 1750解:为了说明问题,此处假设输入数据时就按照上表格式输入,其中正常饲料组变量名为G1,维生素E缺乏组变量名为G2。

相关文档
最新文档