第5讲单样本非参数检验4游程检验
单样本游程检验

单样本游程检验车间生产的20个轴承外座圈为下列数据15.0415.3614.5714.5315.5714.6915.3714.6614.5215.4115.3414.2815.0114.7614.3815.8713.6614.9715.2914.95利用游程检验这20个轴承的外座圈周长大于中位数14.96和小于中位数14.96的情况的出现是不是随机的。
数据《非参数统计》xx之手算:建立假设组:H0:外座圈周长大于中位数14.96和小于中位数14.96情况的出现是随机的。
H1:外座圈周长大于中位数14.96和小于中位数14.96情况的出现不是随机的。
x D=x-14.9615.040.0815.360.414.57-0.3914.53-0.4315.570.6114.69-0.2715.370.4114.66-0.314.52-0.4415.410.45符号++--+-+--+x D=x-14.9615.340.3814.28-0.6815.010.0514.76-0.214.38-0.5815.870.9113.66-1.314.970.0115.290.3314.95-0.01符号+-+--+-++-U=14,m=10,n=10查表得,P=0.242>=0.05,因此不能拒绝原假设,即认为外座圈周长大于中位数14.96和小于中位数14.96情况的出现是随机的。
SPSS:操作:Analyze——Nonparametric Tests——RunsRuns TestTest ValueCases < Test ValueCases >= Test ValueTotal CasesNumber of RunsZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)a轴承外座圈周长14.96101020141.149.251.255Point Probabilitya. Median .076由输出结果可知,精确双尾检验概率P=0.255>=0.05,因此不能拒绝原假设,即认为外座圈周长大于中位数14.96和小于中位数14.96情况的出现是随机的。
第九章1 非参数检验--单样本

调用此过程可对单样本进行 KolmogorovSmirnov Z检验,它将一个变量的实际频数 分 布 与 正 态 分 布 ( Normal ) 、 均 匀 分 布 (Uniform)、泊松分布(Poisson)进行
比较
Analyze-> Nonparametric Tests->1-Sample K-S
补充:二项分布检验实例
实例:为验证某批产品的一等品率是否达到90%,现从 该批产品中随机抽取23个样品进行检测,结果有19个一 等品(1-一等品,0-非一等品)。(变量2个:一等 品和个数,Cases 2个:1 19 和0 4)
加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial
如果相伴概率值大于显著性水平,则不能拒绝零假设 H0,认为样本来自的总体分布形态与指定的二项分布 不存在显著差异。
SPSS二项分布检验的数据是实际收集到的样本数据, 而非频数数据。
所以同样需要加权case
实例1:Strain.sav 18个学生先后学用两种方法打同样的结。
紧急情况下选用先学的方法打结的16人, 用后学的方法打结的2人。第一其中相同的0(或相同的1)在一起称为一个游程(单独
的0或1也算)。 这个数据中有4个0组成的游程和3个1组成的游程。一共
游程检验

市场有效性检验游程检验在金融中主要用于检验市场有效性,比如检验证券市场,外汇市场,黄金期货市场等的有效性。
为什么会用游程检验检验市场有效性呢?下面我就从市场有效性的概念做一下解释。
所谓有效市场,就是市场价格波动服从随机游走趋势,市场价格总是能反映可获得的信息。
如果市场中的价格不能充分反映可获得的信息,投资者则可以利用技术分析的方法获得超额利润。
对市场有效性的检验,就是从统计上检验市场价格波动是否服从随机游走趋势,因此可以用游程检验来检验市场有效性。
下面我就检验股票市场有效性来介绍一下游程检验在金融中的应用。
市场有效性按其强弱程度可分为弱式有效、半强势有效、强势有效三种。
要检验市场有效性,必须先检验市场是否具有弱式有效性市场,若无弱式有效性,那就更谈不上强式有效性。
因此对我国市场有效性检验应从弱式有效性检验入手。
在弱式有效市场的假设下,当前的价格充分反映了全部历史时间序列信息都包括在当前的价格变化之中了。
因此,过去、现在和未来的价格变化之间是没有关系的,价格变化是相互独立的,也就是随机的,技术分析交易规则是无效的。
一.检验方法市场弱式有效性检验的检验方法一般包括两种:一是对随机误差项{}ε序列进行相关性检验,考察是否从在序列自相关;二是进行游t程检验(Runs test),考察股票市场是否通过该检验,并据此判断中国市场是否达到了弱式有效有效性。
游程检验可以避免时间序列相关性检验的两个缺点,一是可能受异常值干扰,但在相关系数中不能反映;二是可能收到有限方差存在与否的影响。
本文只对游程检验方法做一下探讨。
Geary(1970)采用游程检验来检验时间序列中的自相关性,以检验这些序列是否是纯随机的。
如果对时间序列进行游程检验后发现,该序列的游程数显著小于纯随机时间序列游程数的数学期望,则说明该时间序列呈现出持续地随趋势变动的特征,容易发生同方向的持续变化,时间序列具有正的自相关性;反之,如果该序列的游程数显著大于纯随机时间序列游程数的数学期望,则说明该时间序列呈现出反转和均值回复的特征,时间序列具有负的自相关性。
非参数检验

?
等级资料的分析方法是否和 一般计数资料的检验方法相同呢?
等级资料的分析应该选用什么方法?
实例1 考察硝苯地平治疗老年性支气管炎的疗效,治疗组 60人,用硝苯地平治疗,对照组58人,常规治疗,两组患
者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 19 20 显效 35 24 百分比(%) 无效 10.00 24.14 有效 31.67 34.48 显效 58.33 41.38
Test Statistics Chi-Squarea df Asymp. Sig. 身 体状 况 12.135 4 .016
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.0.
分布类型检验
分布位置检验
Nonparametric Test菜单(1)
• 分布类型检验方法
–Chi-Square 检验二项/多项分布 分类资料 –Binomial 检验二项分类变量分布 –Runs 检验样本序列随机性(游程检验) –1-Sample K-S 检验样本是否服从各种分布
Nonparametric Test菜单(2)
ill 1.00 num 1.00
1
2
0.00
399.00
• 1.weight cases by:num • 2.analyze-nonparametric test-binomial
Binomial Test Category 1.00 .00 N 1 399 400 Observed Prop. .00 1.00 1.00 Test Prop. .01 Asymp. Sig. Exact Sig. (1-tailed) (1-tailed) a,b .090 .090
§5 非参数检验(纲要)

§5.非参数检验参数检验:估计或检验总体参数统计分析方法对总体有特殊要求,如t检验要求总体符合正态分布,F 检验要求误差呈正态分布且各组方差齐等,这些方法称为参数检验。
非参数检验:数据的总体分布未知或无法确定,统计分析不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的检验方法。
5.1.1 主要功能适用于有明显分类特征的某些数据,主要用于检验属于某一类的对象或实际观测数与根据某理论假设所期望的频数间是否有显著差异。
5.1.2 实例操作例5-1某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否相同?星期一二三四五六日死亡数11 19 17 15 13 16 195.1.2.1 数据准备在数据编辑器窗口,定义变量名:各日为Day,死亡数为Death。
按顺序输入数据,结果见死亡危险性.sav。
1.Data菜单→Weight Cases...命令项→弹出Weight Cases对话框;2.核选weight cases by,选Death并点击【➢】钮使之进入Frequency框,定义死亡数为权数;3.再点击OK钮即可。
13.1.2.2 统计分析步骤1.Statistics菜单→Nonparametric Tests…→Chi-Square...命令项→弹出Chi-Square Test对话框。
2.从变量名列表框中选变量(Day)并【➢】移入到Test variable框中,则对其对应的数据进行检验。
其他选项的意义:Expected Range栏: 确定对变量中的那些数据进行检验。
◎Get from data: 全部数据参与检验(默认)。
◎Use specified range: 确定自定义的下限和上限。
Expected Values:◎All categories equal: 假设变量中各组数据的期望值相等(默认)。
检验服从均匀分布时选此项。
◎Values: 窗口中输入数值→Add,移入到右侧框中,重复可以输入多个数值,它们将被作为需要检验分布的期望值。
单样本非参数检验1卡方检验【24页】

(1)建立零假设和备择假设
H0 :总体分布函数为 F(x); H1 :总体分布函数不为 F(x)。
分布函数和密度函数的区别知道吧?
(2)构造和计算统计量
◆把实轴 (,分) 成 k 个不相交的区间 (,a 1 ](a ,1 ,a 2 ],,.(.a k . 1 ,, )
◆设样本观察值 x1,x2,...x,n落入每个区间的实际频数为 f i 则实际频率为 f i
因此,医学家的研究结论是正确的哦。
3.3 卡方检验的SPSS软件实现
(1)输入例子中的数据,如图所示。
切记要加权!
卡检验的SPSS操作
勾选“值”
输入2.8, 点“添加”
改成1,点“添加”, 依次进行
1个2.8,6个1,最后点 OK!
得到卡方检验结果,分两部分
死亡日期
O bserv ed N Expected N Residual
1.00
55
53.5
1.5
2.00
23
19.1
3.9
3.00
18
19.1
-1.1
4.00
11
19.1
-8.1
5.00
26
19.1
6.9
6.00
20
19.1
.9
7.00
15
19.1
-4.1
Total
168
注意:学习了卡方检验的方法和过程后,你会解读软件给 出的分析结果吗?
答案
• P值=0.256,大于显著性水平0.05,接受原 假设,认为原分布成立,即原来医生的结 论是正确的。
中,拒绝零假设,即总体不服从指定分布 F(X )
即 2 的概率P值??显著性水平
非参数统计 随机游程检验
在R软件中,我们可以直接调用函数进行随机游程检 验,首先需要装在软件包tseries。选择Packages-Install pacakges(s),
在弹出的对话框中选择一个稳定的镜像地址,系统会自动连 接到主页:/上的统计包。选择需要的 统计包自动安装,在输入library(tseries)。
n1 1 n 0 1 2( )( ) k 1 k 1 P(R 2k) n ( ) n1
建立了抽样分布之后,在零假设成立时,可以计算 P(R r)或者 P(R r) 的值,进行检验。
小样本的例子(p69 例3.8)
例3.8 某银行观察平时到银行柜台办理业务的人员的性别 (用M表示男性,用F表示女性): FMMMMMFMMFMMMMFMFMMMFFFMMM 解:检验假设问题如下: H0: 男女出现顺序随机 H1: 男女出现顺序不随机 =0 .05
n1 个1, n 0 n1 n ,这时R取任何一个值 R为游程个数,假设有 n 0个0, n 的概率都是1/(n ) ,R的条件分布
1ቤተ መጻሕፍቲ ባይዱ
n 1 n 1 n 1 n 1 ( 1 )( 0 ) ( 1 )( 0 ) k 1 k k k 1 P(R 2k 1) n ( ) n1
随机游程检验
在实际中,经常需要考虑一个序列中的数据出现 是否与顺序无关,这关系到数据是否独立。
如果数据有上升或下降的趋势,或有呈周期性变 化的规律等特征时,均可能表示数据与顺序是有 关的,或者说序列不是随机出现的。
基本概念
在一个二元序列中,0和1交替出现: 1000011101100001110 其中一个由0或1连续构成的串称为一个游程, 一个游程中数据的个数称为游程的长度。 一个序列中游程个数用R表示。 表示0和1交替轮 换的频繁程度。 序列长度为n,n1表示序列中1的个数,n0表示0的 个数。 如果0/1序列中0和1出现的顺序规律性不强,随机 性强,则0和1出现不会太集中,也不会太分散。 通过0和1出现的集中程度度量序列随机性大小。
非参数卡方、单样本K-S、两个独立样本检验
非参数卡方检验1.理论非参数检验是在总体分布未知或知道甚少的情况下,不依赖于总体布形态,在总体分布情况不明时,用来检验不同样本是否来自同一总体的统计方法进。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
非参数检验优势:检验条件宽松,适应性强。
针对,非正态、方差不等的已及分布形态未知的数据均适用。
检验方法灵活,用途广泛。
运用符号检验、符号秩检验解决不能直接进行四则运算的定类和定序数据。
非参数检验的计算相对简单,易于理解。
但非参数检验方法对总体分布假定不多,缺乏针对性,且使用的是等级或符号秩,而不是实际数值,容易失去较多信息。
非参数卡方检验:用于检验样本数据的分布是否与某种特定分布情况相同。
非参数卡方检验通过三步检验:1.卡方统计量:X2=B 其中K 是样本分类的个数,0表示实际观测的频数,B 表示理论分布下的频数。
2.拟合优度检验:A.对总体分布建立假设。
B.抽样并编制频率分布表。
C.以原假设为真,导出期望频率。
D.计算统计量。
E.确定自由度,并查x2表,得到临界值。
F.比较x2值与临界值,做出判断。
3.独立性检验A.对总体分布建立假设。
B.抽样并编制r*c 列联表。
C.计算理论频数。
D.计算检验统计量。
E.确定自由度,并查x2表,得到临界值。
F.比较x2值与临界值,做出判断。
2.非参数卡方检验操作步骤第一步:将需检验的数据导入spss中并进行赋值后,点击分析非参数检验、旧对话框、卡方。
图2操作步骤第一步第二步:进入图中对话框后点击,首先将需检验的数据放入检验变量列表中,后在期望值选项中所以类别相等或者值(值:需要手动输入具体的分布情况)。
如果特殊情况需要调整检验置信区间,点击精确,进入图中下方对话框后点击蒙特卡洛法框里收到填入。
点击继续、确定。
图3操作步骤第二步第三步:如果需要看描述统计结果和四分位数值可以点击选项、勾选描述、四分位数。
点击继续、确实。
图4操作步骤第二步3.非参数卡方检验结果然后非参数卡方检验的描述统计、卡方检验频率表、检验统计结果就出来了。
参数检验和非参数检验
5.4.2 两相关样本检验实例
• 【例5.4】为分析一种新药的效果,特选取了
15名病人进行试验,下面的资料给出了试验 者服药前后的血红蛋白数量。试用两相关样 本检验方法判断该药能否引起患者体内血红 蛋白数量的显著变化。
的高三学生的高考数学成绩做均值过程分析, 研究不同学校的学生之间成绩的差异。
• 配书资料\源文件\4\习题\原始数据文件\习题
4.1.sav
• (2)试对2.1节例题中山东省某学校50名高
二学生的身高的数据做单一样本t检验,检验 其是否与该校全体学生的平均身高170cm有 明显的差别。
• 配书资料\源文件\4\习题\原始数据文件\习题
义。
5.1.1 卡方检验的功能与意义
• SPSS的卡方检验(Chi-square Test)是非参数
检验(Nonparametric Tests)方法的一种, 其基本功能是通过样本的频数分布来推断总 体是否服从某种理论分布或者某种假设分布。 这种检验过程是通过分析实际的频数与理论 的频数之间的差别或者说吻合程度来完成的。
5.6.1 多相关样本检验的功能与意义
• 跟前面的检验方法一样,SPSS的多相关样本
检验(K-Related samples Test)也是非参数检 验(Nonparametric Tests)方法的一种,其 基本功能是可以判断多个相关的样本是否来 自相同分布的总体。
5.6.2 多相关样本检验实例
参数检验和非参数检验
4.1.1 均值过程分析的功能与意义
参数、非参数检验操作步骤讲解
参数、非参数检验操作步骤参数检验非参数检验对象针对参数做的假设针对总体分布情况做的假设使用范围等距数据和比例数据(度量)定类数据和定序数据(名义和有序)分布正态分布正态、非正态分布内容Means检验单样本T检验独立样本T检验配对样本T检验卡方检验(均匀分布)二项分布检验(两个变量)游程检验(随机分布)K-S检验(正态分布检验)参数检验一Means过程Means过程用于统计分组变量的的基本统计量,这些基本统计量包括:均值(Mean)、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。
1数据编辑窗口输入分析的数据2 分析→比较均值→均值因变量、自变量的选择可根据实际情况。
“选项”3 结果分析P<0.05,拒绝原假设,显著性强。
结果报告,分别给出暴雨前和暴雨后卵量的统计量:暴雨前有13个样本,平均数122.3846,标准差15.95065,方差254.423; 暴雨后有13个样本,平均数104.4615,标准差15.10858,方差228.269;总体26个样本,平均数113.4231,标准差17.75426,方差315.214。
方差分析表,共有六列,第一列说明方差的来源,Between Groups是组间的,Within Groups 组内的,Total 总的。
第二列为平方和,其大小说明了各方差来源作用的大小。
第三列为自由度。
第四列为均方,即平方和除以自由度。
第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性。
第六列是F统计量的显著值,由于这里的显著值0.007小于0.05,所以模型是显著的,降雨对卵量有显著影响。
二单一样本的T检验T检验是检验单个变量的均值与指定的检验值之间是否存在显著差异。
如:研究人员可能想知道一组学生的IQ平均分与100分的差异。
1 分析→比较均值→单一样本的T检验检验值中输入用于比较的均值(一般题目中会提供)。