非参数统计分析讲解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9
1.80
合计
500
500
__
__
5.98
根据显著性水平 ,有 2 (3) 7.82,由于
Q 5.98 2 (3) 7.82
表明5%的显著水平下,不能拒绝原假设,即观测的比率与期望的比
率一06致:37。
7
如果分布是连续的其检验步骤为:
(1)提出统计假设 H0:Fx F0x
由统计假设出发,将总体取值范围分为m个互不相
为总体的分布函数为 F0 x 。
06:37
10
卡方检验的窗口,SPSS的卡方检验主 要用来检验离散随机变量的分布。
06:37
11
卡方检验的窗口。
06:37
12
X
1 2 3 4 T o ta l
Observed N 380 69 43 8 500
Expected N 400.0 60.0 35.0 5.0
06:37
4
一、χ2拟合优度检验
在实际问题中,会遇到必须了解总体的分布函数的 时候,这时利用样本资料对总体的分布函数进行检验就 成了非常重要的了。
我们需要检验总体的分布函数F(x)是否等于某个给 定的函数 F0(x) ,可以根据经验来确定。其中含有未知 参数时,应利用样本资料采用点估计求得后,再进行检 验。
第二章 单样本非参数检验
06:37
1
思考的要点
各种检验方法的思路 各种检验方法统计量的构造 各种检验方法的应用场合 在SPSS与R中如何完成
06:37
2
第一节 卡方检验 第二节 二项分布检验 第三节 单样本的KS检验 第四节 符号检验 第五节 Cox-Stuart趋势检验 第六节 游程检验 第七节 Wilcoxon符号秩检验
06:37
13
【练习1】 盒中有5种球,重复抽取200次(每 次抽1个球)各种球出现的次数见下表。问盒中5 种球的个数是否相等?显著水平α=0.05。
种别
1 2 3 4 5 ∑
06:37
fi 35 40 43 38 44
200
14
第二节 二项分布检验
二项分布检验(binomial test)是通过考察二分类 变量的每个类别中观察值的频数与特定二项分布下 的期望频数之间是否存在显著差异,来判断抽取样 本所依赖的总体是否服从特定概率为p的二项分布。
H0 : p1 80%, p2 12%, p3 7%, p4 1% H1 : pi pi0
06:37
6
类型
fi
npi (ei )
fi npi
( fi npi )2
( fi npi )2 npi
A
380
Βιβλιοθήκη Baidu
400
-20
400
1.00
B
69
60
9
81
1.35
C
43
35
8
64
1.83
D
8
5
3
06:37
5
【例1】某金融系统贷款的偿还类型有四种,各种的 预期还率为80%、12%、7%和1%。在一段时间的观察记 录中,A型按时偿还的有380笔、B型偿还有69笔、C型有 43笔、D笔有8笔。问在5%显著性水平上,这些结果与预 期的是否一致。α=0.05。
解:这个问题属于要检验每一类型的出现概率与理论 期望概率是否相等,即检验
Re si du a l -20.0 9.0 8.0 3.0
Test Statistics
Chi-Squarea df
X P值大于0.05,结果说明还贷情 5.979 况与预期是一致的。
3
Asymp. Sig.
.113
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.0.
容的小区间:t0,t1 t1,t2 L tm1,tm
区间个数以7~14为宜。然后,统计出每个区间 内样本点的数目fi,再用pi表示变量在第i个区间的概 率,
06:37
8
(2)选择适当统计量
m
2
fi npi 2
i 1
npi
在原假设为真的条件下,这个统计量近似地服从具
有m1r个自由度的χ2 分布,其中r是需要用样本来估计 的总体的未知参数的数目,若没有未知参数需要估计,
SPSS的数据格式
合格品
频数
1
20
0
5
表中的“1”表示合格品;“0”表示不合格品
06:37
16
(SPSS binomial test)
第 1 步 : 指 定 “ 频 数 ” 变 量 : 点 击 【Data】 【Weight-Cases】,将“频数”选入
【Frequency Variable】 【OK】 第2步:选择【Analyze】【Nonparametric
Tests-Binomial】选项进入主对话框 第3步:将待检验的变量选入【Test Variable
List】(本例为“合格品”) 第4步:在【Test Proportion】中输入检验的概率
(本例为0.9),点击【OK】
06:37
17
SPSS的输出结果
表中的合格品的观察比例为0.8,检验比
例为0.9。精确单尾概率为0.098,它表示如果该
批产品的合格率为0.9,那么25个产品中合格品
数量小于等于20个的概率为0.098。P>0.05,不拒
绝原假设,没有证据表明该批产品的合格率不是
二项分布检验的原假设是:抽取样本所依赖的 总体与特定的二项分布无显著差异。
如果检验的p值小于0.05,则拒绝原假设。
06:37
15
【例2】 根据以往的生产数据,某种产品 的合格率为90%。现从中随机抽取25个进行检 测,合格品为20个。检验该批产品的合格率是 否为90%?(产品合格率X~B(n,0.9))
06:37
3
第一节 Chi-Square test 卡方检验
卡方检验通常称为拟合优度检验。主要是通 过样本观测值检验总体是否服从某个分布。如果 数据是连续的,需要将连续的分布进行分段,计 算每段的期望概率与观测到的频率之间是否差异 很大。在SPSS中的Chi-Square test ,主要是对 离散的总体进行拟合优度检验。
则r为零。
06:37
9
(3)由给定的显著性水平,查表确定临界值
2 m 1 r( 这种检验是右侧检验)。
(4)利用样本值 x1,x2,x3,…,xn 计算实际频数 fi ,再计
算经验概率 pi ,据以计算的值
2
m
fi
npi
2
i1 npi
(5)作结论,若 2 2 m 1 r ,则拒绝原假设,即认 为总体的分布函数不为 F0x;反之,则接受原假设,即认
相关文档
最新文档