1 计数统计量和秩统计量

合集下载

等级资料的秩和检验

等级资料的秩和检验

1012.5
好转 184
44
无效
47
35
25
253 184~436 310.0 57040.0 13640
7750
4
86 437~522 479.5 22536.5 16782.5 1918
合计 382 101
39
522
93270.0 32531.5 10701.5
H
20
多组等级比较的检验假设
H0 :各组总体的等级分布相同; H1 :各组总体的等级分布不同或不全相同。
疗效
例数
等 级 老 复 方 复 方 I 复 方 II
平均 合计 秩次范围
秩次
老复方
秩和 复方 I
复 方 II
(1)
(2)
(3)
(4)
(5)
(6)
(7) (8)=(2)(7) (9) =(3)(7) (10)=(4)(7)
控制
36
4
显 效 115
18
1
41
1~41 21.0
756.0
84
21
9
142 42~183 112.5 12937.5 2025
N=11
13~53
10 ~ 56
7 ~ 59
5

61
间距双侧 单侧
400.10 0.05
460.05 0.025 520.02 0.01 560.01 0.005
11(11+1)/4=33(理论值)
H
33
u 的校正
当重复的秩次较多时,u 需要校正:
Tn(n1)/40.5
u
n(n1)(2n1) (t3j tj)
比“定量”粗,而比一般的“定性”细; 等级间既非等距,亦不能度量。

第三章秩统计量与秩方法-上海交通大学数学系

第三章秩统计量与秩方法-上海交通大学数学系

第三章秩统计量与秩方法王成*/faculty/chengwang/上海交通大学数学系1秩(Rank)的定义Definition1.1(秩)对于互不相等的一组实数x1,...,x n,x k在从小到大的次序x(1)<···<x(n)中所在位置r k称为其秩;对应的对于样本X1,...,X n,R=(R1,...,R n)(1)称为(X1,...,X n)的秩统计量。

Definition1.2(符号秩)对于一组实数x1,...,x n,假定|x1|,...,|x n|互不相等,记ϕi=I(x i>0),R+i为|x i|在|x1|,...,|x n|中的秩,则R+=(ϕ1R+1,...,ϕn R+n)(2)称为(x1,...,x n)的符号秩。

Theorem1.1假定X1,...,X n iid来自于一个连续分布,以R=(R1,...,R n)记样本(X1,...,X n)的秩,则有对称性质,对于(1,...,n)的任意一个置换π(1,...,n),有P(R=π(1,...,n))=1 n! .思考:如果不是连续分布,定理结果会如何?对于符号秩,我们可以想象因为其涉及到符号,对于不同的分布F,ϕ取0或者1的情况完全不同,所以一般的符号秩统计量应该与F密切相关,下面定理考虑了一个特别的分布族。

Theorem1.2若F连续且关于0对称,则ϕ1,|X1|,...,ϕn,|X n|,相互独立。

进一步的ϕ1,...,ϕn,(R+1,...,R+n)相互独立,且P(ϕk=0)=P(ϕk=1)=1/2;P((R+1,...,R+n)=π(1,...,n))=1/n!.*关于讲义中的任何错误或者建议,请联系******************.cn1从定理我们可以看出,符号秩统计量可以用来检验对称性质,例如取W+=n∑i=1ϕi R+i,(3)如果统计量太大或者太小都说明总体分布函数F不关于0对称。

计数统计量和秩统计量 PPT

计数统计量和秩统计量 PPT

+
第三节 秩统计量
定义1.3.1 设 Z1,Z2,,ZN,是来自连续分布 F (z) 的简单随机 样本 Z(1)Z(2)Z(N ),为其次序统计量.定义随机变量
R i r,当 Z i Z (r),i 1 ,2 , ,N
当 R i 唯一确定时,称样本观测值 Z i 有秩 R i . 注意:由于F (z) 为连续分布,因而 R i 不唯一确定的概率为0.
定理1.3.2 R(R 1,R 2,,R N)的边缘分布也是均匀分布, 特别地,一维边缘分布有
Ri r)N 1 当r1,2,,N
0
其他
二维边缘分布有,当 i j 时,有
1 P (R i r,Rj s) N (N1)
当 rs,r,s1,2,,N
0
其他
定理1.3.3对秩统计量 R(R 1,R2,,Rn)有
例1设随机变量 X1,X2,,Xn相互独立同分布,分布为 N(0,2)
参数 0 已知, 2未知。 £ {N(0,2)0}
取统计量 T (X 1 ,X 2 , ,X n )n (X 0 )/S
其中
1
X1 ni n1Xi,Sn1 1i n1(Xi X)22
则T关于£是适应任意分布的.
定义1.1.2 设随机变量 X1,X2,,Xn是来自总体F (x) 的样本, 一切可能的 F (x) 组成分布类£。如果统计量
E(Ri)n2 1,i1,2,,n
va R i)r ((n 1 1 )n (2 1 ),i1 ,2 , ,n
co R i,R v j) ( (n 1 1 )2 ,ij,i,j 1 ,2 , ,n 证明:由 R(R 1,R2,的边,R 缘n)分布也是均匀分布,
P(Ri r)1 n,r1,2,,n

高二数学必修3期末考必备知识点:统计

高二数学必修3期末考必备知识点:统计

高二数学必修 3 期末考必备知识点:统计在中国古代把数学叫算术,又称算学,最后才改为数学。

小编准备了高二数学必修 3 期末考必备知识点,希望你喜爱。

1:简单随机抽样(1)整体和样本①在统计学中 , 把研究对象的全体叫做整体 .②把每个研究对象叫做个体 .③把整体中个体的总数叫做整体容量 . ④为了研究整体的有关性质,一般从整体中随机抽取一部分: x1,x2 , ....,xx 研究,我们称它为样本.此中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。

就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。

特色是:每个样本单位被抽中的可能性同样 (概率相等 ),样本的每个单位完整独立,相互间无必定的关系性和排挤性。

简单随机抽样是其余各样抽样形式的基础。

往常不过在整体单位之间差异程度较小和数量较少时,才采纳这类方法。

(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①整体变异状况 ;②同意偏差范围;③概率保证程度。

(4)抽签法 :①给检核对象集体中的每一个对象编号;②准备抽签的工具,实行抽签 ;③对样本中的每一个个体进行丈量或检查(5)随机数表法:2:系统抽样(1)系统抽样 (等距抽样或机械抽样):把整体的单位进行排序,再计算出抽样距离,而后依据这一固定的抽样距离抽取样本。

第一个样本采纳简单随机抽样的方法抽取。

K( 抽样距离 )=N( 整体规模 )/n(样本规模 )前提条件:整体中个体的摆列关于研究的变量来说,应是随机的,即不存在某种与研究变量有关的规则散布。

能够在调查同意的条件下,从不一样的样本开始抽样,对照几次样本的特色。

假如有显然差异,说明样本在整体中的散布承某种循环性规律,且这类循环和抽样距离重合。

(2)系统抽样,即等距抽样是实质中最为常用的抽样方法之一。

由于它对抽样框的要求较低,实行也比较简单。

统计量的基本概念及其应用

统计量的基本概念及其应用

统计量的基本概念及其应用统计学是指以收集、整理、分析、解释和抽样等方法,研究群体总体特征和个体间关系的一门学科。

而统计量就是指统计学研究中所使用的各种数字指标和计算结果,是对数据的描述和度量。

本文将从统计量的基本概念和应用方面进行讨论。

一、统计量的基本概念1.1 样本与总体在统计学研究中,数据的来源通常是从总体中随机选择一些样本来进行研究。

总体是指具有一定特征的全部个体,如全国所有人口;而样本是指从总体中随机抽取的一部分,如全国人口中的一部分。

1.2 中心趋势指标中心趋势指标用于描述数据分布的中心,通常包括平均数、中位数、众数等指标。

平均数是指数据的算术平均值,是最常见的中心趋势指标;中位数是指数据排序后中间的数值;众数是指数据中出现最频繁的数值。

1.3 离散程度指标离散程度指标用于描述数据的分布程度,通常包括方差、标准差、极差等指标。

方差是指数据离平均数的距离的平方和与数据个数的比值;标准差是方差的正平方根,用于描述数据的离散程度,越大说明数据分布越分散;极差是指数据的最大值与最小值之差。

1.4 偏态和峰态偏态用于描述数据分布的不对称程度,通常包括正偏态和负偏态。

正偏态是指数据分布呈现右偏的形态,即数据的平均数大于中位数;负偏态则是呈现左偏的形态,即数据的平均数小于中位数。

峰态用于描述数据分布的峰度,通常包括正峰态和负峰态。

正峰态是指数据分布的波峰较高,呈现比较尖锐的形态;负峰态则是波峰较平缓的形态。

二、统计量的应用2.1 假设检验假设检验是统计学中常用的应用之一,用于验证某个假设是否成立,如判断一个新的药品是否有效。

在进行假设检验时,需要确定一个零假设和一个替代假设,通过计算统计量的值来决定是否拒绝零假设。

2.2 方差分析方差分析也是统计学中的一种应用,主要用于分析多个样本间的差异,如比较不同地区、不同年龄段和不同性别的人口数据。

在进行方差分析时,通常需要计算F值和P值,以判断不同样本间的方差是否有显著性差异。

统计学知识点(完整)

统计学知识点(完整)

根本统计方法第一章 概论1. 总体〔Population 〕:根据研究目确实定的同质对象的全体〔集合〕;样本〔Sample 〕:从总体中随机抽取的局部具有代表性的研究对象。

2. 参数〔Parameter 〕:反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量〔Statistic 〕:反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。

3. 统计资料分类:定量〔计量〕资料、定性〔计数〕资料、等级资料。

第二章 计量资料统计描述1. 集中趋势:均数〔算术、几何〕、中位数、众数2. 离散趋势:极差、四分位间距〔QR =P 75-P 25〕、标准差〔或方差〕、变异系数〔CV 〕3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。

4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法:P 2.5-P 97.5。

第三章 总体均数估计和假设检验1. 抽样误差〔Sampling Error 〕:由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。

抽样误差不可防止,产生的根本原因是生物个体的变异性。

2. 均数的标准误〔Standard error of Mean, SEM 〕:样本均数的标准差,计算公式:/X σσ=3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。

4. t 分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高;③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。

统计量

统计量将样本加工成统计量要求越简单越好。简单的程度的大小,主要用统计量的维数来衡量。简单地讲, 若统计量T2是由统计量T1加工而来(即T2是T1的函数),则T2比T1简单。在此意义上,最简单的充分统计量叫极 小充分统计量。这是E.L.莱曼和H.谢菲于1950年提出的。前例中的充分统计量都有极小性。
抽样分布
统计量充分性是数理统计的一个重要基本概念,它是R.A.费希尔在1925年引进的,费希尔提出,并由J.奈曼 和P.R.哈尔莫斯在1949年严格证明了一个判定统计量充分性的方法,叫因子分解定理。这个定理适用面广且应用 方便,利用它可以验证很多常见统计量的充分性。例如,若正态总体有已知方差,则样本均值塣是充分统计量。 若正态总体的均值、方差都未知,则样本均值和样本方差S合起来构成充分统计量(塣,S)。一个统计量是否充 分,与总体分布有密切关系。
U 样本矩
次序

设x1,x2,…,xn是一个大小为n的样本,对自然数k,分别称为k阶样本原
统计量
点矩和k阶样本中心矩,统称为样本矩。许多最常用的统计量,都可由样本矩构造。例如,样本均值(即α1) 和样本方差是常用的两个统计量,前者反映总体中心位置的信息,后者反映总体分散情况。还有其他常用的统计 量,如样本标准差,样本变异系数S/塣,样本偏度,样本峰度等都是样本矩的函数。若(x1,Y1), (x2,Y2),…,(xn,Yn)是从二维总体(x,Y)抽出的简单样本,则样本协方差·及样本相关系数也是常用的 统计量,r可用于推断x和Y的相关性。
定义
样本的已知函数;其作用是把样本中有关总体的信息汇集起来;是数理统计学中一个重要的基本概念。统计 量依赖且只依赖于样本x1,x2,…xn;它不含总体分布的任何未知参数。
统计量
从样本推断总体(见统计推断)通常是通过统计量进行的。例如x1,x2,…,xn是从正态总体N(μ,1)(见 正态分布)中抽出的简单随机样本,其中均值(见数学期望)μ是未知的,为了对μ作出推断,计算样本均值。 可以证明,在一定意义下,塣包含样本中有关μ的全部信息,因而能对μ作出良好的推断。这里只依赖于样本 x1,x2,…,xn,是一个统计量。

第2章 计数统计量和秩统计量


符号秩统计量
• 定义:X1,,Xn~F(x), F(x)连续,关于0点对 称,计数统计量i=(Xi),随机变量|X1|,, |Xn|对应的秩向量记为(R1+,, Rn+), Ri+称为 Xi的绝对秩,则iRi+称为Xi的符号秩。
0
绝对值和符号统计量
• 定理1.8: 若X是连续型随机变量,分布关于 0点对称,则|X|与其符号统计量(X)相互独 立。 • 证明:
秩概率分布(IV)
• 证明思路:对(2)展开 要利用公式 需
对(3),利用等式 进行平方和展 开,将(3)中协方差计算公式转化
Wilcoxon统计量
• 检验问题:X1,, Xm~F(x), Y1,, Yn~G(x), F(x), G(x)连续,随机变量Y是否大于随机变 量X。 H1: ,且在 • H0: F(x)=G(x) 某些点不等式严格成立。 • Wilcoxon统计量:将X1, , Xm;Y1,, Yn共 m+n个观测值一起排序,产生秩向量 R=(Q1,, Qm;R1,,Rn). 定义Wilcoxon秩统 计量为
Wilcoxon统计量概率分布(II)
• d的取值问题,最小对于与前n个数,和为 n(n+1)/2, 最大对于与最后n个数,和为 m+n(n+1)/2. • tm,n(d)的计算:看混合样本中最大的样本,其秩为 m+n, 这个样本只有两种可能。如果它属于总体X, 没有被W记入,此时还是在m+n-1个数中选取, 有tm-1,n(d); 如果这个样本属于总体Y,被W记入, 此时只要再选n-1个数使其和为d-m-n即可。故可 以递推计算tm,n(d).
• 证明思路:将Y排序 设它们在混 合样本中的序为 那么我们可以 数出在这些样本前面的X样本的个数。它们 对应于U统计量的定义。

1 计数统计量和秩统计量

X 1 , X 2 ,L, X n 定义1.1 的样本,一 定义1.1 .1 设随机变量 是来自总体 的样本F (x ) , F (x ) 组成分布类£。 £。如果统计量 切可能的 组成分布类£。如果统计量 T ( X 1 , X 2 ,L , X n ) 均有相同的分布,则称T关于£ 对任意的 均有相同的分布,则称T关于£是适应 F (x ) 任意分布的( free) 任意分布的(d-free).
i =1 相互独立同分布, 例3 符号检验 设随机变量 相互独立同分布,分 连续。 1 , X 2 ,L , X n 布为 , 在 连续。假设检验问题 X
B = ∑ Ψi
n
F (正号的个数。在原假设成立时, 中取正号的个数。在原假设成立时, B = ∑ Ψ = ∑ψ ( X )
其中 可能取法的个数。 可能取法的个数。 证明提示
n C n+m n(n + 1) n( n + 1) n( 2m + n + 1) d= , + 1, L , 2 2 2 t m,n (d ) 中取n m 表示从 中取+个数其和恰为d 1,2, L , n n个数其和恰为d的
t m , n ( d ) = t m ,n −1 ( d − m − n ) + t m −1,n ( d )
,则集合
R = ( R1 , R2 , L , R N )
服从均匀分布. 则 R∗ = {( r1 , r2 , L , rN ).( r1 , r2 , L , rN ) 是(, L,N) 服从均匀分布 1 2, 的全排列}
R
证明 P{R = r} = P{( R1 , R2 , L, R N ) = (r1 , r2 , L rN )}

统计量的概念

4.统计量的概念样本是总体的代表和反映,也是统计推断的依据.为了对总体的分布或数字特征进行各种统计推断,还需要对样本作加工处理,把样本中应关心的事物和信息集中起来,针对不同的问题构造出样本的不同函数,这种样本的函数我们称其为统计量.统计量的定义.由样本(X1, X2,…, X n)所确定的函数f(X1, X2,…, X n)称为统计量.若(x1, x2,…, x n)是一个样本观测值,则称f(x1, x2,…, x n)是统计量f(X1, X2,…, X n)的一个观测值.显然,统计量不仅是一个随机变量,而且还不含有未知参数.例3.6.4设(X1,X2,X3)是由服从正态分布N(μ,σ2)的总体X中抽取的一个容量为3的样本,其中μ、σ是未知参数,因此(X1+X2+X3)/3-μ,(X1+X2+X3)/σ都不是统计量,而X1+X2+5,X12+X22都是统计量.设(X1, X2,…, X n)是总体X中的一个样本,下面是数理统计中常用的几个统计量及其观测值:(1)样本均值.;它的观测值为:.(2)样本方差.;它的观测值为.(3)样本标准差.;它的观测值为.例3.6.5 为了了解某一课程自学考试的情况, 现从全体考生中抽查120名学生,记录其成绩如下:试按下列要求进行简单的统计分析.(1)在区间[40,100]之间,将数据分成组距为5分的12组,在此条件下,求频数分布、频率分布、累计频率分布;(2)求样本均值与样本方差;(3)作图:修正后的频率直方图、累计频率直方图.解. (1)根据已知数据,把频数分布、频率分布、累计频率分布列成表如下((除了最后一组外,每组不包括上限). (2)样本均值和样本方差的观测值分别是,(3)根据取值区间及相应频率作修正后的频率直方图和累计频率直方图.有了统计量的概念以后,下面我们再介绍几个在应用中有重要作用的常用的分布.实验题:学习者可以随机抽取某科考试成绩进行如下统计推断.(1) 先把数据分组,在此条件下,求频数分布、频率分布、累计频率分布;(2) 求样本均值与样本方差;(3) 画出频率直方图和累计频率直方图.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
{Tn } N (0,1)
第二节计数统计量 定义1.2.1 设 定义1.2.1 是一个随机变量,对一给定的实数 是一个随机变量, X 随机变量 ,其中 ( X − θ 0 ) θ0 Ψ =ψ
1 t > 0 ψ (t ) = 0 t ≤ 0 X 分段的计数统计量。 分段的计数统计量。 则称随机变量 Ψ 为 按 θ0
= P{( Z 1 , Z 2 ,L, Z N ) = ( Z ( r1 ) , Z ( r2 ) ,L Z ( rN ) )} = P{( Z d1 , Z d 2 ,L, Z d N ) = ( Z (1) , Z ( 2 ) ,L Z ( N ) )} = P{( Z d1 < Z d 2 < L < Z d N )}
,定义
X 1 , X 2 , L , X n X i (i = 1,2, L n ) 定理1.2.1 相互独立。 定理1.2.1 设随机变量 相互独立。 有分布 Fi (x ) 。 Fi (θ 0 ) = p 0 (0 < p 0 < 1) (i = 1,2, L n) 是相互独立同分布的随机变量, 则 是相互独立同分布的随机变量,其共 Ψi = ψ ( X i − θ 的两点分布。 同分布为参数为0 ) 的两点分布。
例1设随机变量 X 1 , X 2 , L , X n 相互独立同分布, 相互独立同分布,分布为 N ( µ 0 , σ 2 ) = { N ( µ 0 , σ 2 ) σ > 0} 已知, 未知。 参数µ 0 已知, 未知。 £ σ2 取统计量 T ( X , X , L , X ) = n ( X − µ ) / S 1 2 n 0 1 其中
证明:Wilcoxon秩统计量和Mann-Whitney统计量有下列关系 证明:Wilcoxon秩统计量和Mann-Whitney统计量有下列关系 秩统计量和Mann
其中 U = ∑∑ψ (Y j − X i )
i =1 j =1
m
n(n + 1) W =U + 2 n
U 证明 : 表示 ( X i , Y j )(i = 1,2,L m, j = 1,2, L,中Y大于X的个 n) 大于X , Y1 , Y2 , L , Yn 数,记 的次序统计量为 (Y(1) , Y( 2 ) , L 对应的秩统计量为 Y( n ) ) ( R(1) , R( 2 ) ,L R( n ) )
{Tn ( X 1 , X 2 , L , X n ), n = 1,2, L}
的样本,一切 , 的样本F (x )
均有相同的极限分布, 对任意的 F (x ) 均有相同的极限分布,则称 渐近适应任意分布的. 渐近适应任意分布的.
关于£ 关于 {Tn } £是
例2设随机变量 相互独立同分布, 相互独立同分布, X 1 , X 2 ,L, X n 分布为 分布类£ 分布类£ (x ) = {期望为 µ,方差为 σ 2 > 0的分布 } F 取统计量 Tn ( X 1 , X 2 , L , X n ) = n ( X − µ ) / σ 关于£ 渐近适应任意分布的统计量. 则 关于£是渐近适应任意分布的统计量.其极限分布为
(1 − p 0 )
由定理1.2.1可知, 由定理1.2.1可知,任一由 1.2.1可知 构成的统计 Ψ1 , Ψ2 , L , Ψn , p0 的分布类是适应任意分布的。 θ 关于一切 分位点为 2 , L的分布类是适应任意分布的。这0 S ( Ψ1 , Ψ , Ψn ) 样的统计量称为计数统计量。 样的统计量称为计数统计量。最常用的一个计数统计量为
X 1 , X 2 ,L , X m
, Y1 , Y2 , L , Yn
R = (Q1 , Q2秩统计量为 Wilcoxon秩统计量为
W = ∑ Ri
i =1
n
定理1.3.4 定理1.3.4 在 为
H 0 : F ( x ) ≡ 下( x ) Wilcoxon秩统计量的分布 G , Wilcoxon秩统计量的分布 P (W = d ) = t m ,n (d )
2 1 n 1 n 2 X = ∑ Xi,S = ∑(X i − X ) n i =1 n − 1 i =1
则T关于£是适应任意分布的. 关于£ 适应任意分布的.
定义1.1.2 定义1.1.2 设随机变量 X 1 , X是来自总体 2 ,L, X n 组成分布类£。如果统计量 F (x ) 可能的 组成分布类£。如果统计量 £。
1 n +1 2 var(Ri ) = E ( R ) − E ( Ri ) = ∑ r ⋅ − ( ) n 2 r =1 1 n(n + 1)(2n + 1) n + 1 2 (n + 1)(n − 1) = −( ) = n 6 2 12
n 2 i 2 2
cov( Ri , R j ) = E[( Ri − E ( Ri ))( R j − E ( R j ))] = ∑ 0 ⋅( r −
由于
# { X i < Y(1) , i = 1,2,L m, } = R(1) − 1
# { X i < Y( j ) , i = 1,2, L m, } = R( j ) − j
# { X i < Y( n ) , i = 1,2, L m, } = R( n ) − n
所以
n
U = ∑∑ψ (Y j − X i ) = ∑ ( R( j ) − j )
,则集合
R = ( R1 , R2 , L , R N )
服从均匀分布. 则 R∗ = {( r1 , r2 , L , rN ).( r1 , r2 , L , rN ) 是(, L,N) 服从均匀分布 1 2, 的全排列}
R
证明 P{R = r} = P{( R1 , R2 , L, R N ) = (r1 , r2 , L rN )}
1 P ( Ri = r ) = N 0 当r = 1,2, L , N 其他
二维边缘分布有, 二维边缘分布有,当 i ≠ j 时,有
1 当r ≠ s, r , s = 1,2, L , N P ( Ri = r , R j = s ) = N ( N − 1) 0 其他
因为
d
( Z d1 , Z d 2 ,L, Z d N ) =( Z 1 , Z 2 ,L, Z N )
所以 P{R = r} = P{( Z d1 < Z d 2 < L < Z d N )} = P{( Z 1 < Z 2 < L < Z N )}
=
1 N!
R = ( R1 , R2 , L , R N ) 的边缘分布也是均匀分布, 定理1.3.2 的边缘分布也是均匀分布, 定理1.3.2 特别地, 特别地,一维边缘分布有
i =1 j =1 j =1 n n n n
m
n
n
U = ∑ ( R( j ) − j ) = ∑ R( j ) − ∑ j = ∑ R j − ∑ j = W −
Wilcoxon秩统计量 Wilcoxon秩统计量 X 1 , X 2,相互独立 ,L , X m 有两个总体, 有两个总体,一个总体的样本为 F (x ) 同分布, 同分布,分布为连续函数 ;一个总体的样本为 Y1 , Y2 , L 相互独立同分布, , Yn ,相互独立同分布,分布为连续函数 ; 问随机变量 G(x) 是否大于随机变量 X Y 检验 H 0 : F ( x ) ≡ G ( x ); H 1 : F ( x ) ≥ G ( x ); 一起排序, 将 一起排序,产生对应的秩
定理1.3.3对秩统计量 定理1.3.3对秩统计量 R = ( R1 , R2 ,L , Rn ) 有 1.3.3
n +1 E ( Ri ) = , i = 1,2,L , n 2 ( n + 1)(n − 1) , i = 1,2,L , n var( Ri ) = 12
(n + 1) cov( Ri , R j ) = − , i ≠ j , i, j = 1,2,L , n 12 证明:由 R = ( R1 , R2 ,L , Rn ) 的边缘分布也是均匀分布,
i =1 相互独立同分布, 例3 符号检验 设随机变量 相互独立同分布,分 连续。 1 , X 2 ,L , X n 布为 , 在 连续。假设检验问题 X
B = ∑ Ψi
n
F (x )
F (x )
x=0
检验统计量可取 n n 中取正号的个数。在原假设成立时, 中取正号的个数。在原假设成立时, B = ∑ Ψ = ∑ψ ( X )
定理1.3.5 定理1.3.5 在 有
H 0 : F ( x ) ≡ G (, Wilcoxon秩统计量的分布 下 x) Wilcoxon秩统计量的分布
E (W ) =
mn(n + m + 1) var(W ) = 12 并且W的分布关于 n(n + m + 1) 对称。(作业) 2
n(n + m + 1) 2
i =1 i i =1 i
1 1 H 0 : F ( 0) = ; H 1 : F ( 0) ≠ ; 2 ,即为 2
X 1 , X 2 ,L , X n
B ~ B ( n,0.5)
第三节 秩统计量
Z 1 , Z 2 ,是来自连续分布 L, Z N , 定义1.3.1 定义1.3.1 设 为其次序统计量. Z (1) ≤ Z ( 2 ) ≤ L 为其次序统计量.定义随机变量 ≤ Z ( N ) ,
r =s
n +1 n +1 1 n +1 n +1 )( s − )+∑ (r − )( s − ) 2 2 2 2 r ≠ s n( n − 1)
相关文档
最新文档