2.5 关于随机性的游程检验

合集下载

游程检验

游程检验

市场有效性检验游程检验在金融中主要用于检验市场有效性,比如检验证券市场,外汇市场,黄金期货市场等的有效性。

为什么会用游程检验检验市场有效性呢?下面我就从市场有效性的概念做一下解释。

所谓有效市场,就是市场价格波动服从随机游走趋势,市场价格总是能反映可获得的信息。

如果市场中的价格不能充分反映可获得的信息,投资者则可以利用技术分析的方法获得超额利润。

对市场有效性的检验,就是从统计上检验市场价格波动是否服从随机游走趋势,因此可以用游程检验来检验市场有效性。

下面我就检验股票市场有效性来介绍一下游程检验在金融中的应用。

市场有效性按其强弱程度可分为弱式有效、半强势有效、强势有效三种。

要检验市场有效性,必须先检验市场是否具有弱式有效性市场,若无弱式有效性,那就更谈不上强式有效性。

因此对我国市场有效性检验应从弱式有效性检验入手。

在弱式有效市场的假设下,当前的价格充分反映了全部历史时间序列信息都包括在当前的价格变化之中了。

因此,过去、现在和未来的价格变化之间是没有关系的,价格变化是相互独立的,也就是随机的,技术分析交易规则是无效的。

一.检验方法市场弱式有效性检验的检验方法一般包括两种:一是对随机误差项{}ε序列进行相关性检验,考察是否从在序列自相关;二是进行游t程检验(Runs test),考察股票市场是否通过该检验,并据此判断中国市场是否达到了弱式有效有效性。

游程检验可以避免时间序列相关性检验的两个缺点,一是可能受异常值干扰,但在相关系数中不能反映;二是可能收到有限方差存在与否的影响。

本文只对游程检验方法做一下探讨。

Geary(1970)采用游程检验来检验时间序列中的自相关性,以检验这些序列是否是纯随机的。

如果对时间序列进行游程检验后发现,该序列的游程数显著小于纯随机时间序列游程数的数学期望,则说明该时间序列呈现出持续地随趋势变动的特征,容易发生同方向的持续变化,时间序列具有正的自相关性;反之,如果该序列的游程数显著大于纯随机时间序列游程数的数学期望,则说明该时间序列呈现出反转和均值回复的特征,时间序列具有负的自相关性。

游程检验原理

游程检验原理

游程检验原理游程检验是一种用于分析随机数据序列的统计方法,其原理基于游程的概念。

游程指的是在一组数据中连续出现的相同数值的长度,游程检验则是利用这一概念来检验数据序列的随机性和统计特征。

本文将围绕游程检验的原理展开,介绍其基本概念、历史发展、数学基础以及在实际应用中的作用和局限性。

一、基本概念1.1 游程在统计学中,游程是指在一组数据中连续出现的相同数值的长度。

比如在二进制序列中,连续的1或者0构成了一个游程。

游程的长度可以用来度量数据序列中的连续性和重复性,对于随机性的分析具有重要意义。

1.2 游程检验游程检验是利用游程的概念来对数据序列进行统计分析的方法。

通过比较数据序列中实际出现的游程分布与理论上的期望游程分布的差异,可以进行数据序列的随机性检验和统计特征分析。

二、历史发展游程检验最早可以追溯到20世纪初,当时主要用于对随机性序列的分析和密码学的研究。

随着统计学和计算机科学的发展,游程检验逐渐成为了一种重要的随机性分析方法,并在数据挖掘、信号处理、金融工程等领域得到了广泛的应用。

三、数学基础游程检验的数学基础主要建立在概率论和统计学的理论基础之上。

通过计算游程的长度分布、游程的期望值和方差等统计量,可以对数据序列的随机性进行定量的分析。

游程检验还涉及到随机过程、马尔科夫链等概念,需要借助一定的数学工具和模型来进行分析和推断。

四、实际应用4.1 数据质量检验在数据挖掘和机器学习中,游程检验可以用来对数据的随机性和均匀性进行检验,从而评估数据的质量和可靠性。

通过游程检验可以发现数据序列中的随机规律和异常情况,为数据清洗和预处理提供依据。

4.2 信号处理在通信领域和数字信号处理中,游程检验广泛应用于对数字信号序列的随机性和连续性进行分析。

通过游程检验可以评估信号的稳定性和噪声情况,为信号处理算法的优化和改进提供技术支持。

4.3 金融工程在金融市场中,游程检验可以用来对股票价格序列、交易量序列等金融数据进行随机性检验,为交易策略的制定和风险控制提供决策支持。

非参数检验介绍

非参数检验介绍

非参数检验介绍1 关于非参数的一些常识•经典统计的多数检验都假定了总体的背景分布。

•但在总体未知时,如果假定的总体和真实总体不符,那么就不适宜用通常的检验。

•这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。

•无需假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行的检验都称为非参数检验(nonparametric testing)。

1 关于非参数的一些常识•这些非参数检验在总体分布未知时有很大的优越性。

它总是比传统检验安全。

•在总体分布形式已知时,非参数检验不如传统方法效率高。

这是因为非参数方法利用的信息要少些。

往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。

•但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。

是否用非参数统计方法,要根据对总体分布的了解程度来确定。

•这里介绍一些非参数检验。

•关于非参数方法的确切定义并不很明确。

我们就其最广泛的意义来理解。

•在计算中,诸如列联表分析中的许多问题都有精确方法,Monte Carlo 抽样方法和用于大样本的渐近方法等选择。

精确方法比较费时间,后两种要粗糙一些,但要快些。

秩(rank )•非参数检验中秩是最常使用的概念。

什么是一个数据的秩呢?一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。

例如我们有下面数据X i 159183178513719R i75918426310这下面一行(记为R i )就是上面一行数据X i 的秩。

秩(rank )•利用秩的大小进行推断就避免了不知道背景分布的困难。

这也是非参数检验的优点。

•多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。

2 单样本检验2.1单样本中位数(α-分位数)符号检验•我们知道某点为中位数(α-分位数)意味着一个数小于该点的概率应该为0.5(α).•因此,一个观测值小于该点(或与该点之差的符号为负号)的概率为0.5(α)。

自-应用统计分析复习笔记

自-应用统计分析复习笔记

应用统计分析复习笔记BY 东海 2009年12月1日星期二第一章 导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

内容:收集数据(取得数据);处理数据(整理与图表展示);分析数据(利用统计方法分析数据);数据解释(结果的说明);得到结论(从数据分析中得出客观结论)。

2、统计研究的循环过程:实际问题—收集数据—处理数据—分析数据—数据解释—实际问题。

4、描述统计:研究数据收集、整理和描述的统计学分支。

内容:收集数据;整理数据;展示数据;描述性分析。

目的:描述数据特征;找出数据的基本规律。

5、推断统计:研究如何利用样本数据来推断总体特征的统计学分支。

内容:参数估计;假设检验。

目的:对总体特征做出推断。

6、描述统计与推断统计的关系:7、统计数据的类型(1)按计量层次:分类数据、顺序数据、数值型数据(2)按收集方法:观测数据和实验数据(3)按时间状况:截面数据和时间序列数据8、总体:所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。

分为有限总体和无限总体。

样本:从总体中抽取的一部分元素的集合。

构成样本的元素的数目称为样本容量或样本量。

9、参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。

所关心的参数主要有总体均值(μ )、标准差(σ)、总体比例(π)等。

总体参数通常用希腊字母表示。

10、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。

所关心的样本统计量有样本均值(x )、样本标准差(s)、样本比例(p)等。

样本统计量通常用小写英文字母来表示。

变量:说明现象某种特征的概念,如商品销售额、受教育程度、产品的质量等级等。

变量的具体表现称为变量值,即数据变量可以分为:(1)分类变量(说明事物类别的名称)、顺序变量(说明事物有序类别的名称)和数值型变量(说明事物数字特征的名称)。

其中数值型变量又分离散变量(取有限个值)和连续变量(可以取无穷多个值)。

游程检验原假设

游程检验原假设

游程检验原假设全文共四篇示例,供读者参考第一篇示例:游程检验是一种用来检验原假设的统计方法,主要应用于序列数据的分析中。

在统计学中,原假设是一个关于总体参数的陈述,通常是不存在差异或者不存在影响的假设。

游程检验的原理是基于序列数据中出现的游程(连续相同的值),通过计算游程的数量来判断原假设的有效性。

游程检验可以应用于各种领域,如生物学、医学、社会科学等,帮助研究者判断实验结果的显著性和可信度。

在进行游程检验时,首先需要明确原假设和备择假设。

原假设通常是指两组数据之间不存在显著差异或者某种关联,备择假设则是相反的假设。

然后,通过对序列数据进行游程的计算,将数据转化为游程序列,进而计算出游程的数量。

接着,根据游程数量的分布情况和显著性水平,可以对原假设进行拒绝或者接受的决策。

游程检验的优点之一是不需要对数据进行正态分布的假设,因此适用于各种类型的数据。

游程检验还可以有效地检测数据中的规律性和相关性,对于序列数据的分析具有一定的优势。

值得注意的是,在进行游程检验时需要注意数据的质量和样本的大小,样本量过小可能导致检验结果不够可靠。

还需要注意数据的独立性和随机性,确保游程检验结果的有效性和可信度。

游程检验是一种简单而有效的统计方法,适用于序列数据的分析和原假设的检验。

通过对游程的计算和分析,可以帮助研究者更好地理解数据之间的关系和差异,为进一步的研究提供有力的支持。

希望本文能够帮助读者对游程检验有更深入的了解,并在实际研究中加以应用。

第二篇示例:游程检验原假设(Runs test of randomness)是一种用于验证数据序列是否随机的统计检验方法。

在统计学中,随机性是指一个数据序列中的值不能被很容易地预测或解释。

如果一个数据序列是随机的,那么它应该没有明显的模式或规律,而是由各种随机事件所确定。

游程检验原假设是用来检查数据序列是否具有一定的趋势或模式的方法之一。

该检验的原假设是数据序列是随机的,即不存在明显的趋势或模式,数据点的出现是独立的,并且在不同时间或空间上没有相关性。

21广义符号检验和有关的置信区间——03

21广义符号检验和有关的置信区间——03

H 0 :M e M 0 H 1 :M e M 0 H 0 :M e M 0 H 1 :M e M 0
P K s , 其 中 K ~ b n ,0 .5 P K s , 其 中 K ~ b n ,0 .5
双边符号检验问题
H 0:M e M 0 H 1:M e M 0
NA 534.1377 sample estimates: mean of x - y 320
接受H0, 认为两种轮胎无显著性差异.
• 在上面的逻辑推理中,假设分布结构的正态性是否合 理,是 t-检验 运用是否得当的关键
• 显然 3:13 支持的是3700元/平米 不能作为正态分布对 称中心的观点
k 3 , p 值 2 P K k n 1 6 ,p 0 .5 2 i k 0 1 i 6 1 2 1 6 0 .0 2 1 3
在显著性水平0.05下,拒绝原假设 H0. 认为这些数据与中心位置37存在显著差异.
( 1) .在 显 著 性 水 平 为 下 的 检 验 的 拒 绝 域 为
2PKk
其 中k是 满 足 上 式 最 大 的k.
(2).也可以通过计算统计量K的p值作决策: 如果统计量K的值是k,
p值=2PKk
当p时,拒绝零假设
我们可以对例1(楼盘价数据问题)用符号检验法求解 解二: 用符号检验法
以例题1(楼盘价格问题)为例理解“符号检验的基本原理”
如果假设问题的结构是一般连续分布,将 37(百元)理解为总体 的中位数,则假设检验问题表示为:
H 0 :M e 3 7 H 1 :M e 3 7
其中 Me 是总体的中位数。
如果零假设为真,即37是总体的中位数,则数据中应该差 不多各有一半在37的两侧 计算每一个数据与37的差,用 S 表示位于37右边的点的个 数,S 表示位于37左边的点的个数,数据中没有等于37的数, S + S =16

游程检验的原理及应用实例

游程检验的原理及应用实例

游程检验的原理及应用实例1. 游程检验的原理游程检验是一种统计方法,用于分析二进制数据序列中的连续重复的位数。

它基于一种假设,即二进制数据序列中的位是相互独立且随机的。

游程检验的原理包括以下几个步骤:1.将二进制数据序列划分为连续的位段,如0为一段,1为一段。

2.统计每个位段的长度,即连续相同位的个数。

3.根据游程分布,计算期望游程长度和方差。

4.使用统计假设检验方法,比较实际游程长度和期望游程长度的差异。

游程检验原理的基本思想是,如果二进制数据序列是真正随机的,并且没有规律或重复的模式,那么每个位段的长度应该是接近相等的。

如果出现了过于长或过于短的游程,这可能表明数据序列存在某种规律或有问题。

2. 游程检验的应用实例游程检验在许多领域都有广泛的应用。

以下是一些游程检验的应用实例:2.1. 通信系统中的错误检测游程检验可以用于检测通信系统中传输数据的错误。

通过对接收到的数据序列进行游程检验,可以判断其中是否存在连续出现过长或过短的位段,从而提前发现传输错误或异常情况。

2.2. 加密算法的评估游程检验可用于评估加密算法的随机性和安全性。

通过对加密后的数据序列进行游程检验,可以分析其中是否存在重复的位段或规律性,从而评估加密算法的效果和强度。

2.3. 遗传密码分析游程检验可以用于分析DNA序列中的遗传密码。

通过对DNA序列进行游程检验,可以分析其中是否存在过长或过短的碱基序列,从而推测其中的遗传信息和蛋白质编码。

2.4. 随机数生成器的验证游程检验可用于验证随机数生成器的质量和随机性。

通过对随机数序列进行游程检验,可以分析其中是否存在重复的位段或规律性,从而评估随机数生成器的效果和安全性。

2.5. 数据压缩算法的评估游程检验可以用于评估数据压缩算法的效果和压缩率。

通过对压缩后的数据序列进行游程检验,可以分析其中是否存在连续出现过长或过短的位段,从而评估压缩算法的效果和压缩率。

3. 总结游程理论是一种基于统计方法的二进制数据序列分析技术,通过对连续重复的位数进行检验,可以评估数据序列的随机性和规律性。

随机性游程检验

随机性游程检验
如果骰子被证明是公正的,那么赌博游戏被认为是公平 的,参与者可以信赖结果;如果某个数字出现的频率显 著高于预期,则可能存在欺诈或不公正行为,参与者应 采取警惕。
实例三:彩票号码的随机性检验
01
总结词
彩票号码的随机性检验是评估 彩票开奖结果是否遵循随机分 布的一种方法。
02
详细描述
通过分析历史彩票开奖结果, 检验各个奖级的出现频率是否 符合预期的概率分布,从而判 断彩票开奖是否公正。
统计样本序列中连续相同符号的数量(游程)。
步骤3
计算理论上的随机游程分布。
步骤4
比较样本序列的游程分布与理论上的随机游程分布,判断样本序列的随机性。
游程检验的分类
参数游程检验
基于已知的随机过程参数进行检验,适用于已知或可估计参 数的情况。
非参数游程检验
不依赖于任何参数假设,适用于未知参数或难以估计参数的 情况。
随机性游程检验的重要性
在统计学中,随机性游程检验是 检验样本数据是否符合随机过程 的重要手段,有助于判断数据的
真实性和可靠性。
在经济学中,随机性游程检验可 用于检验市场是否有效,判断价 格变动是否遵循随机漫步理论。
在生物学中,随机性游程检验可 用于基因序列分析、蛋白质序列 分析等领域,判断序列的随机性
和周期性。
02
随机性游程检验的基本概念
定义与原理
定义
随机性游程检验是一种统计检验方法 ,用于检验一个样本序列是否符合随 机序列的特性。
原理
基于游程的统计特性,通过比较样本 序列中连续相同符号的数量(游程) 与理论上的随机游程分布,判断样本 序列的随机性。
游程检验的步骤
步骤1
确定样本序列。
步骤2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反之当游程数R较小,则说明两个总体的分布可能不同, 因此是一个左边检验。
查表的 n1=12,n2=10 的下临界值为 7,因此拒绝 H0.
2. 检验单样本的随机性
从生产线上抽取产品检验,是否应采用频繁抽取小样本的 方法。
在一个刚刚建成的制造厂内,质检员需要设计一种抽样方 法,以保证质量检验的可靠性。生产线上抽取的产品可以分成 两类,有瑕疵,无瑕疵。检验费用与受检产品数量有关。一般 情况下,有毛病的产品如果是成群出现的,则要频繁抽取小样 本,进行检验。如果有毛病的产品是随机产生的,则每天以间 隔较长地抽取一个一个典型的序列就是 二元0/1序列出现顺序的随机性问题
在一个二元序列中,0和1交替出现,一个由0或1连续构成 的串称为一个游程(run),一个游程中数据的个数称为游程的长 度。
一个序列里游程个数用R表示, R表示0和1交替轮换的频 繁程度。容易看出, R是序列中0和1交替轮换的总次数加1.
函数 run.test (计算概率 P(R r) ,P(R r) 和 p 值的函数 ) 在输入函数 run.test(x) 之后,输出了 m, n 以及双边精确的和
渐近的 p 值,还输出涉及 p 值的 P(R r) ,P(R r) 的精确值 和渐近值
在输入函数 run.test(x) 之后,输出了 m, n 以及双边精确的和 渐近的 p 值,还输出涉及 p 值的 P(R r) ,P(R r) 的精确值 和渐近值
小,则数据不支持
H

0
若足够大,则不拒绝
H

0
备择假设 H1
序列具有混合的倾向(游程大)
p值
Z 的右尾概率
序列具有聚类的倾向(游程小) Z 的左尾概率
序列是非随机的
Z 较小的尾巴概率的两倍
四、总结 随机性的游程检验
H0 : 有随机性 H1 : 无随机性
检验统计量
K 游程 R
p值
P K k
2.3 关于随机性的游程检验
➢ 在实际中,经常需要考虑一个序列中的数据出现是否与 顺序无关,这关系到数据是否独立. ➢ 几乎所有经典统计方法在理论上都要求样本是随机样本, 即要求重复观察到的一组变量值在统计上相互独立。 ➢ 参数统计很难考察这一问题,但从非参数的角度考察时, 若数据出现趋势,周期性规律,.就不能表示数据是独立的。 这些问题可以转化为 0-1 序列或类型出现顺序的随机性问 题。 ➢ 游程检验就是检验数据出现顺序是否随机,其出发点是 检验样本的独立性。
其中 P(R r) =0.00072,P(R r) =0.99980,而相应的渐近值 分别为 0.000751,0.99925. 双边精确 p 值为0.00144(渐近的 p 值为 0.00150)
因此,可以在水平 0.0015 时,认为该数串不是随机的
(拒绝零假设)
例 2.6 如在工厂的全面质量管理中,生产出来的 20 个工件的某
8 9 10 11 12 13 14
73 75 76 1 11
77 80 80 82 2 221
15 16 17 18 19 20 21 22
82 83 84 1 12
84 86 91 91 93 2 2222
11111,2,1111,222,111,222222 共有6各游程。
如果原假设成立,则两个行业的负债水平的分布是相同 的,将其混合后,应能较为充分、均匀地混合,游程数R应 该比较大
假如我们掷一个硬币,这是一个伯努利试验,将正面向上 记做1,将反面向上记做0,例如我们得到一列这样的结果:
00000001111110000111100
如果称连在一起的0或1为游程,则上面这组数中有3个0游 程,2个1游程,一共是5个游程 (R=5)
这里0的总个数为 m=13,1的总个数为 n=10. 记总的试验 次数为 N,有 N=m+n
一尺寸按顺序为 X1, X 2 ,L , X 20 单位cm
12.27 9.92 10.81 11.79 11.87 10.90 11.22 10.80 10.33 9.30 9.81 8.85 9.32 8.67 9.32 9.53 9.58 8.94 7.89 10.77 人们想知道生产出来的工件尺寸变化是否只是由于随机因素, 还是有其它非随机因素
如果 0/1 序列中0和1出现的顺序规律性不强,随机性强,则 0和1出现不会太集中,也不会太分散。换句话说,可以通过0 和1出现的集中程度度量序列随机性的大小。
若序列随机,则游程的个数不能太多,也不能太少。游程 长度也不应太长或太短。相应地,就会出现游程个数检验和 游程长度检验。
在固定序列长度 m和n时,可以通过游程的个数 R 过多或 过少来定义假设检验的拒绝域。
H0 : 序列是随机的 H1 : 序列具有混合的倾向 H0 : 序列是随机的 H1 : 序列具有成群的倾向
注:
1. 为了对假设作出判定,被收集的样本数据仅需定类尺度 测量,但要求进行有意义的排序,按一定次序排列的样本观 察值能够被变换为两种类型的符号(比如 二元0/1序列)
2. 在H0为真的情况下,两种类型符号出现的可能性相等, 其在序列中是交互的。相对于一定的 m和n,序列游程的总 数应在一个范围内。 ➢ 若游程的总数过少,表明某一游程的长度过长,意味着 许多0 或许多1 连在一起,序列存在成群的倾向; ➢ 若游程总数过多,表明游程长度很短,意味着 0 和1交 替出现得太频繁,序列具有混合的倾向。 ➢ 因此,无论游程的总数 R 过多或过少,都表明序列不是 随机的。
2mn(2mn m n)
m n2 (m n 1)
因此可以用正态分布表得到 p 值和检验结果,
这时,在给定水平 后,可以用近似公式得到拒绝域的临界值 c1 和 c2 ,满足 P(R c1) 及 P(R c2 ) .
三、确定 p值

p
值相对于给定的显著性水平
2.当样本很大时,当数据序列的量很大时,即 n , 在零假设下,根据精确分布的性质可以得到
E(R) 2 mn 1 mn
Var(R)

2mn(2mn m n)
m n2 (m n 1)
于是 Z R E(R) Var(R)
R 2 mn 1
mn
N (0,1)
例 现随机抽了30件产品,按生产线抽取的顺序排列: 0000111111111111110001111111
问:检验瑕疵的产品是随机出现的吗?
解:假设检验
H0 : 序列是随机的 H1 : 序列具有成群的倾向 略
工 64 76 55 82 59 82 70 75 61 64 73 83 业 商 77 80 80 65 93 91 84 91 84 86 业
问:两个行业的负债水平是否有显著性差异 ( 0.05)
解:排序寻找游程 顺序 1 2 3 4 5 6 7 负债率 55 59 61 64 64 65 70 组别 1 1 1 1 1 2 1
解:Step 1. 先找出它们的中位数 X med 9.865,再把大于 X med 的 记做 1,小于的记做 0,于是产生一串 1 和 0: 11111111100000000001
Step 2. R 3, m 10, n 10, P(R 3) 0.00006,
p 值 2 minP(R 3) , P(R 3) 0.00012
然而,在已知 m 和 n 时,游程个数 R 的条件分布就与 p 无关了
假定有 m 个 0 和 n 个 1,m n N,出现任何一种不同结构序列的
可能性是 1

N n


1
N

m

如果游程个数为奇数R 2k+1,这意味着 有 k 1 个1 游程和 k 个 0 游程;或有 k 1 个 0 游程和 k 个1 游程。
二、随机游程的检验
➢ Mood (1940) 提出关于这一问题的检验 ➢ 假设检验:
随机抽取一个样本,其观察值按某种顺序排列,如果 研究所关心的问题是:被有序排列的两种类型符号是否随 机排列,则可以建立双侧备择.
H0 : 数据出现顺序随机 H1 : 数据出现顺序不随机
如果关心的是序列是否具有某种倾向,.则应建立单侧备择
m 和 n 较大时,用近似正态统计量 Z
R 2 mn 1 mn
2mn(2mn m n)
m n2 (m n 1)
对显著性水平 ,如果 p 值 ,拒绝零假设,否则不能拒绝
例2.5 假如我们掷一个硬币,将正面向上记做1,将反面向上 记做0,例如我们得到一列这样的结果:
二、检验统计量
检验统计量为: R 游程个数
例如,对于序列 1100001110110000111100, R=8,游程长度分别为 2,4,3,1,2,4,4,2
极端情况: 000001111111 R = 2 0101010101010 R = 2min(m,n)+1
所以,2 ≤ R ≤ 2min(m,n)+1 极端情况都说明数据不具有随机性。
如果游程数为偶数R 2k,这意味着 0 和1 各有 k 个游程, 于是得到 R 的条件分布为
m 1 n 1
P(R

2k )

2
k
1


k
1
N

n

P(R

2k

1)


m 1
k

1


n
k
1


m 1
00000001111110000111100
假定在 R软件中,x代表上面的数据,则游程个数可由语句 N=length(x); k=1; for (i in 1: (N-1)) if (x[i]!=x[i+1])k=k+1
相关文档
最新文档