次序统计量及其分布共26页

合集下载

次序统计量及其分布

次序统计量及其分布

, X n )T 的次序统计量,样本的极差定义为 R X ( n ) X (1) max X i min X i
1 i n 1 i n
xi min xi 其观测值为 r x( n ) x(1) max 1 i n 1 i n
4、样本极差的意义 样本极差主要用来描述样本变化幅度以及离散 程度的特征,具有和样本方差类似的含义,但它受 样本异常值的影响较小,同时也容易计算,也可以 作为总体均方差的估计. 在实际中应用比较广泛. 例3(p32例1.20) 从总体中抽取容量为6的样本, 测得样本值为 32, 65, 28, 35, 30, 29 试求,样本中位数、样本均值、样本极差、样本方差、 以及样本标准差。
1、样本中位数 定义 设(X (1) , X ( 2 ) ,
, X ( n ) )T 为样本( X1 , X 2 ,
n为奇数, n为偶数,
, X n )T 的次序统计量,样本的中位数定义为
X n 1 , ( ) 2 X 1 [ X n X n1 ], ( ) 2 (2) 2
说明 (1) 最大次序统计量X ( n )的分布密度为
f X( n ) ( x ) n[ F ( x )]n1 f ( x )
( 2) 最小次序统计量X (1)的分布密度为 f X(1) ( x ) n[1 F ( x )]
n 1
f ( x)
例1(p30例1.18) 设总体X 服从区间 [0,1] 上的均

根据分布函数的定义可得
F( X(1) , X( n ) ) ( x, y ) P{ X (1) x, X ( n) y}
以下分两种情形讨论:
(1)当x y时,

次序统计量及其分布

次序统计量及其分布

N
x1
2
, n[
f
1 (x1
2
)]2
18
例5-3-2: 设总体 X 为柯西分布,其密度函数为
f(x;)(1(1 x ))2, x
其分布函数为
F(x;)1 21arctan(x)
易知,θ是该总体的中位数,即 x ½ = θ.

X1,X2,
,X 是来自该总体的样本,则 n
当样本容量 n 较大时,样本中位数 m 0.5 的渐近分布为
P { T t ( n ) } P { T t ( n ) } 1 P { T t ( n ) } 1

t(n) h t1 (n) (5-3-9)
15
3)对于 F—分布
F(n1,n2)
由于
1 F ~ F(n2,n1)
所以
PF
F
1 (n2,n1)
PF1
F
(n2,n1)
1PF1 F(n2,n1)
p 2 (x ) (2 1 ) 5 ! ( ! 5 2 )! [F (x ) ] 2 1 p (x ) [ 1 F (x ) ] 5 2
2 0 x 3 3 x 2 ( 1 x 3 ) 3 6 0 x 5 ( 1 x 3 ) 3 , 0 x 1
于是
P (x(2)1 2)0 1 260x5(1x3)3dx
h
20
下面就通过一个具体的实例说明之。
例 5-3-4 :表 5—5 是某厂 160 名销售人员某月的销售量数据的有序样本,由该 批数据可计算得到:
xm in45, xm ax319,m 0.5181 , Q 1144,Q 3212
五数概括的图形表示称为箱线图,由箱子和线段组成。图5-11 是该例中样本数据的箱 线图,其作法如下

5.3统计量及其分布

5.3统计量及其分布
535次序统计量及其分布个观测值大排列后得到的第由小到它的取值是样本观测值个次序统计量样本的第称为该的样本是取自总体统计量称为该样本的最大次序统计量称为该样本的最小次序个次序统计量称为该样本的第那么相互独立同分布已知样本分布相同吗独立吗次序统计量定义例536设总体x的分布为仅取012的离散均匀分布分布列为131313现从中抽取容量为3的样本其一切可能取值有2719分布不相同显然二次序统计量的抽样分布则有为样本分布函数为设总体的密度函数为的密度函数为个次序统计量样本第度函数为个次序统计量的联合密练习
102 108 110 113 118 125 则该月这20名青年的平均娱乐支出为
x17 98 4 12 5 9.4 9
20
• 将这20个数据分组可以得到如下频数频率分布: 组序分组区间组中值频数频率
x18 2 39 2 5 12 22 100
20
定理5.3.1 若把样本中的数据与样本均值之差称为偏差,则 样本所有偏差之和为0,即
n
E(x)n 1Ei n1xinn
Va (x)rn 12Va i n1 rxinn 22n2
E
xi
x2
E
xi
2
nx 2
E(xi2 ) nE(x2 )
[E(xi )2 Var(xi )]n[E(x)2 Var(x)]
n2 n 2 n2 n 2
n
(n 1) 2
Es2n1 1E xix2 n1 1(n 1 )22
5.3.4 样本矩及其函数
定义5.3.4 设x1,x2,…,xn是样本,则统计量
ak
1 n
n i1
xi k
称为样本 k阶原点矩
bk
1 n
n i1
(xiቤተ መጻሕፍቲ ባይዱ

次序统计量及其分布

次序统计量及其分布

种,于是,若以 Fk (x) 记 x (k) 的分布函数,则由多 项分布可得
F k(x x ) F k(x )
n ! [F (x )]k 1 [F x x F (x )][1 F (x x )]n k
(k 1 )!(n k)!
.
两边同除以 x , 并令 x→0 , 即有
pk(x) lixm 0F k(x xx )F k(x) n ! [ F ( x ) ] k 1 p ( x ) [ 1 F ( x ) ] n k ( k 1 ) ! ( n k ) !
p ij(y,z)(i 1 )!(jin ! (y)]j i 1
[1F (z)]njf(y)f(z), ayzb
(5-3-6) 证明:对增量 y, z 以及 y < z , 事件
x ( i ) ( y ,y y ] ,x ( j .) ( z ,z z ]
§5.3 次序统计量及其分布
定义
定义 5-3-1: 设 X1,X2,L,Xn 为取自总体X的样本, 将其按大小顺序排序 X (1 ) X (2 ) L X (n )
则称 X(k) 为第 k 个次序统计量( No.k Order Statistic)
特别地,称
X(1) m 1iinnXi
(5-3-1)
为最小顺序统计量(Minimum order Statistic)

X(n) m 1iaxn Xi
(5-3-2)
为最大顺序统计量(Maximum order Statistic) 。
.
例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散均
匀分布,其分布列为
x0 1 2
p
1 3
1 3
1 3

次序统计量及其分布通用课件

次序统计量及其分布通用课件
中心极限定理
在大量独立同分布随机变量的样本中,任意一个样本的平均值(或 中位数)都将趋近于正态分布。
次序统计量
在给定样本中,按照大小排序后得到的顺序统计量。
关系
中心极限定理为次序统计量提供了理论基础,因为次序统计量是样本 中排序后的变量,其分布情况与中心极限定理密切相关。
次序统计量与大数定律的关系
次序统计量在统计学中的重要性
01
02
03
描述数据分布特征
次序统计量可以帮助我们 快速了解数据分布情况, 如数据的最大值、最小值 、中位数等。
进行统计分析
在统计分析中,次序统计 量常被用作描述变量或样 本的特性,如计算相关性 、进行回归分析等。
数据排序与筛选
通过次序统计量可以对数 据进行排序和筛选,以便 更好地理解和处理数据。
计算方法
通过概率密度函数或概率质量函 数积分得到。
03
次序统计量的应用场景
金融数据分析
风险评估
次序统计量可以用于评估投资组合的风险,通过分析历史收益率 数据,确定投资组合在不同市场环境下的风险水平。
市场趋势判断
利用次序统计量对市场数据进行排序,可以判断市场趋势,例如通 过分析股票价格指数的排序来判断市场的整体走势。
次序统计量及其分 布通用课件
目录
• 次序统计量的定义与性质 • 次序统计量的分布 • 次序统计量的应用场景 • 次序统计量的计算方法 • 次序统计量与其他统计量的关系 • 次序统计量在数据分析中的应用
01
次序统计量的定义与性质
次序统计量的定义
定义
次序统计量是指一组数 据中按照大小顺序排列
的统计量。
在数据异常值检测中的应用
总结词
次序统计量在异常值检测中具有重要应用,能够识别出离群 点,帮助分析者了解数据分布和潜在问题。

东南大学概率讲义次序统计量及其分布

东南大学概率讲义次序统计量及其分布
i-1 y 1 y+y j-i-1 z 1 z+z n-j
于是由多项分布得
P ( x( i ) ( y, y y ), x( j ) ( z , z z )) pij ( y , z )yz
n! [ F ( y )]i 1 f ( y )y (i 1)!1!( j i 1)!(n j )! [ F ( z ) F ( y y )] j i 1 f ( z )z[1 F ( z z )]n j
其观测值为 r x( n ) x(1) max xi min xi 1 i n 1 i n
4、样本极差的意义 样本极差主要用来描述样本变化幅度以及离散 程度的特征,具有和样本方差类似的含义,但它受 样本异常值的影响较小,同时也容易计算,也可以 作为总体均方差的估计. 在实际中应用比较广泛.
注意
(1). 中位数比样本均值更为稳健,当二者 相差不大时常采用样本均值表示数据平均, 否则应该用中位数。 • (2). 样本的众数适用于离散的总体 • (3).极差计算简单,但是不如样本标准差稳 健。

• (4).大多数情况下,数据基本上落在“均值 ±2个 标准差”的区间内,否则这个数据就 被认为是异常的大或异常的小。 在绝大多数情况下,一组正常的数据基本 上落在“均值±3个标准差”的区间内。
pn ( x) n [1 F ( x)]
n 1
p( x)
(4)
推论2 :最小次序统计量 x (1) 的概率密度函数为
p1 ( x) n [ F ( x)]n1 p ( x)
(5)
(二)多个次序统计量的联合分布
仅讨论任意二个次序统计量的情形。 定理 2 :设总体 ξ 有密度函数 f (x) , a ≤x ≤b , (同样 可设 a = - ∞, b = +∞ ) 。并且 ξ1 , ξ2 , … , ξn 是取自这 一总体的一个样本,则其任意两个次序统计量 ξ (1) < ξ (2) 的联合分布密度函数为

2.5 次序统计量

2.5 次序统计量

,,
x n
时,定义
X (k )

值 为 x(k) (k 1, 2, , n), 由 此 得 到 的 ( X (1), X (2) , , X (n) ) 称 为
样本X1 , X 2 ,, X n 的次序统计量。
1
显然有
X(1) X(2) X(n)
其中
X (1)
min
1in
Xi
称为最小次序统计量,它的值
9
样本分布函数Fn(x)不仅与样本容量n有关,还与所
得到的样本观察值有关,故它是随机变量.Fn(x)的
图形呈跳跃上升的台阶状, 在x(1), x(2), …, x(n)中的不
重复的值处,跳跃高度为
1 n
;在重复l次的值处,跳
跃高度为 l .图中的曲线是总体X的理论分布函数
n
F(x)的图形.

10
对任意实数 x, Fn x就是事件X x
0,
则经验分布函数 F3( x)的观察值为
1 ,
F3
(
x
)
3 2
,
3
1,
x 1, 1 x 2,
2 x 3, x 3.
7
实例3 设总体 F 具有一个样本值 1, 1, 2, 则经验分布函数F3( x)的观察值为
0,
F3
(
x
)
2 3
,
1,
x 1, 1 x 2, x 2.
8
一般地, 设 x1, x2,, xn 是总体F的一个容量为n 样本值, 先将 x1, x2,, xn 按自小到大的次序排列, 并重新编号, x(1) x(2) x(n) , 则经验分布函数Fn( x)的观察值为
x(1)

2.5 次序统计量

2.5 次序统计量


9
例 设总体F具有一个样本值1, 1, 2,则经验分布函数 F3 ( x )的观察值为 0, 若 x 1 2 F3 ( x ) , 若1 x 2 3 若x 2 1,
10
经验分布函数Fn(x)从样本直观得到描述性分布.
样本直方图可以描述. (2). 经验分布函数的性质 10. 具有通常分布函数的三个性质,图形呈跳跃上升; 20. Fn(x)是一个随机变量;
4
定理
设总体 X 的分布密度为 f(x)(分布函数为 F(x)),
, X ( n ) ) 的联合分布密度为
X 1 , X 2 ,, X n 为其样本,则次序统计量的分布密度为
( X (1) , X (2) ,
n n! f ( yi ), y1 y2 f ( y1 , y2 , , yn ) i 1 0, 其他
这件事情是否是一个玩笑?
14
中位数定义
设 ( X 1 , X 2 , , X n ) 是总体 X 中的样本 , ( X (1) , X (2) , , X ( n ) ) 为其次序统计量,则样本中位数定义为
X n 1 ,n奇 ( ) 2 X 1 [ X n X n 1 ],n偶 ( ) ( ) 2 2 2
vn ( x) Fn ( x) n
为子样的为经验分布函数.
7
设总体 X 的分布函数 F(x)未知, x1 , x2 , , xn 为总体 X 的一个样本观察值,将它们按大小 排列为: x1 x 2
x n ,令
0, 如果x x(1) , k Fn x , 如果x( k ) x x( k 1) , k 1, 2,..., n 1, n 1, 如果x( n ) x .
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
次序统计量及其分布
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·ቤተ መጻሕፍቲ ባይዱ 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯

60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 回头。 ——左
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
相关文档
最新文档