单样本非参数检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p 2P(S 1n 8, p 0.5) 0.0704
p大于显著性水平0.05。表明调查数据支持原假设。即 生产过程不需要调整。
第二节 基于符号检验的中位数置信区间
例 我国国有经济15个行业的1996年职工平均工资按从 小到大的次序为(单位:元)
4038 4940 5798 6161 6344 6610 6695 6709 6967 6992 7897 7987 8546 8679 8701 求中位数的置信区间。
第二章 单样本非参数检验
第一节 符号检验 第二节中位数的置信区间 第三节 Wilcoxon符号秩检验
第一节 符号检验
平均数mean(包括切尾平均数)中位数median 和众数 mode 都可用来表示数据的中心位置,参数数据分析中总 体的中心位置常用均值表示,例如当总体服从正态分布
时,使用 t 检验方法检验均值。而非参数数据分析方法中,
总体的中心位置常用总体的中位数表示,故关于中心位 置的检验问题就是关于中位数的检验问题。
符号检验(SING TEST)是利用正号和负号的数目对
某种假设做出判定的非参数方法。
符号检验虽然是最简单的非参数检验,但它体现 了非参数统计的一些基本思路.首先看一个例子。
例1联合国人员在世界上66个大城市的生活花费指数 (以纽约市1996年12月为100)按自小至大的次序排 列如下(这里北京的指数为99):

S+=得正符号的数目 S—=得负符号得数目
可以知道S +或S— 均服从二项分布B(66,0.5)。 则S+和S—可以用来作检验的统计量. 左侧检验H0 : M 99; H1 : M 99,当零假设为真的时, S+应该 不大不小。当S+过小,即只有少数的观测值大于99,则认定 中位数99可能太大,实际总体的中位数可能要小一些。对于
这个总体的中间水平是多少?北京市在该水平之上 还是之下?(北京为99)
这个例子经过简单计算,得到样本均值为96.45,而 样本中位数为91;它们都可作为总体的中心的估计,除 此之外,众数(频率最大的点,本例是88)可作为中间位 置.在本例中,总体分布是未知的,为此从看该数据的 直方图中很难说这是什么分布。
发生的概率仅为0.0124,所以不大可能。也就是说,北
京的生活指数(99)不可能小于世界大城市的中间水准.
对于双边假设检验,为计算方便,一般取S+和 S—中较小的一个做检验统计量;如用K表示,则 K=min(S+,S—)。在本例子中,若是双边检验,P 值应该二倍于单侧检验的。
检验统计量 P-值 检验的结果
j
Cnk
k i
1 2
k
1 2
nk
j
Cnk
k i
1 2
n
由于得到的区域是以中位数位对称的,故
1 p X (k1) M X (nk)
右侧检验H0 : M 99; H1 : M 99 ,当零假设为真的时, S+应 该不大不小。当S+过大,即有多数的观测值大于99,则认定 中位数99可能太小,目前实际总体的中位数可能要大一些。
双侧检验 H0 : M 99; H1 : M 99 对备择假设H1来说关心的是 等于正的次数是否与等于负的次数有差异。
一般情况,备择假设采用我们觉得有道理的方向。上面的 例题采用左侧检验,备择检验:M<99。因为只有一点为99, 舍去这一点,于是从66减少到65。而s+=23在零假设下(下 面概率p=0.5),二项分布的概率
B(23,65,0.5) C6253 (0.5)23 (1 0.5)6523
就是该检验的p值。P(S+ <23)=0.0124。 也就是说,在零假设下,目前由该样本所代表的事件的
H 0 : M 99; H1 : M 99 H 0 : M 99; H1 : M 99
(s+ =23)
S+ (s+ =23)
P( S+ <23)=0.0124
2P( S+ <23)=0.0248
拒绝零假设
拒绝零假设
百度文库结论
中位数小于99
中位数不等于99
[例] 生产过程是否需要调整。 某企业生产一种钢管,规定长度的中位数是l0米。现 随机地:从正在生产的生产线上选取10根进行测量, 结果: 9.8 10.1 9.7 9.9 9.8 10.0 9.7 10.0 9.9 9.8
30
20
10
Std. Dev = 18.09
Mean = 96.5
0
N = 66.00
70.0
90.0
110.0
130.0
150.0
170.0
190.0
80.0
100.0
120.0
140.0
160.0
180.0
VAR00001
假定用总体中位数M来表示中间位置,就意味着样 本点 X1,取,大X 于n M的概率应该与取小于M的概率相 等。所研究的问题可以看作是只有两种可能“成功” 或“失败”。成功为“+”, 即大于中位数M;失败 为“-”,即小于中位数M。
分析:中位数是这个问题中所关心的一个位置参数。 若产品长度真正的中位数大于或小于10米,则生产过 程需要调整。故做双侧检验,建立假设
H 0 : M 10; H1 : M 10
为了对假设作出判定,先要得到检验统计量S +或 S— 。将调查得到数据分别与10比较,算出各个符号的 数目: s + =1, s— =7,n=8。
66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110 110 110 111 113 115 116 117 118 155 192
定义2.1把n个样本点按从小达到的顺序排列,得
X (1) X (2) X (n)
假设顺序统计量X (i) X ( j) ,由X (i) , X ( j) 构成区间 X(i), X(j) 作为中位数的置信区间。
由于大于和小于中位数M的样本点数服从B(N,0.5)
1 p X (i) M X ( j)
相关文档
最新文档