均匀分布U[0, 1] 第i顺序统计量分布 - 描述统计
1.3 顺序统计量

PX (1) u, X ( n ) v Pu X 1 v,, u X n v Pu X 1 v Pu X n v [ F ( v ) F ( u)]n , 若u v, 0 , 若u v ; F ( u, v ) PX (1 ) u, X ( n ) v PX ( n ) v PX (1 ) u, X ( n ) v [ F (v )]n [ F (v ) F ( u )]n , 若u v, n , 若 u v. [ F (v )]
1.3 顺序统计量
§1.3
顺序统计量、经验分布函数和直方图
一、顺序统计量 另一类常见的统计量是顺序统计量. 定义 1 设 X 1 , X 2 ,, X n 是取自总体 X 的样本, X ( i ) 称为 该样本的第 i 个顺序统计量,它的取值是将样本观测值由小 到大排列后得到的第 i 个观测值。x(1) x( 2 ) x( n ) ,X ( i ) 的值是 x ( i ) 。其中 X (1) minX 1 , X 2 ,, X n 称为该样本的最小顺 序统计量,称 X ( n ) maxX 1 , X 2 ,, X n 为该样本的最大顺序统 计量。 我们知道, 在一个样本中, X 1 , X 2 ,, X n 是独立同分布的, 而次序统计量 X (1) , X ( 2) ,, X ( n) 则既不独立,分布也不相同, 看下例。
假设总体 X 在区间[0,2]上服从均匀分布; Fn ( x )
是总体 X 的经验分布函数, 基于来自 X 的容量为 n 的简单随 机样本,求 Fn ( x ) 的概率分布,数学期望和方差. 解 总体 X 的分布函数为
§2-3 顺序统计量,经验分布函数

一.顺序统计量及其分布
例题 1
设总体 X 在 ( 0, ) 上服从均匀分 布,求容量为 2 的样本 ( X1, X2) 的顺序 统计量X (1),X (2) 的联合概率密度,并且
讨论X (1) , X (2) 是否相互独立.
1 f ( x) θ 0
0 xθ 其它
f1, 2 ( x1 , x2 ) 2! f ( x1 ) f ( x2 )
从而是统计量(随机变量)。 (3)当样本容量 n 足够大时,总体的经验分布 函数是它的理论分布函数很好的近似。
样本点:20
样本点:40
样本点:150
三、直方图
三. 直方图
概率密度函数的 估计问题
设 ( x1, x2, …, xn ) 是来自连续型总体
X ~f ( x )的一个样本观测值,试估计未知
§2-3 顺序统计量 经验分布函数
一、顺序统计量及其分布 二、经验分布函数及其性质
三、直方图
一、顺序统计量及其分布
一.顺序统计量及其分布
顺序统计量的定义
设 ( X1, X2, …, Xn ) 是抽自总体 X ~F ( x) 的样本, 将它们按从小到大的次序排列为 X (1)≤X (2) ≤ … ≤X (n) , 则称X (1), X (2) , … ,X (n) 为由样本X1, X2, …, Xn 生成的顺序 统计量, X (k),称为第 k 个顺序统计量. 最大顺序统计量 最小顺序统计量 X (n) = max {X1, X2, …, Xn} X (1) = min {X1, X2, …, Xn}
三. 直方图
概率密度函数 的 估计问题
步骤 1 设 ( x1, x2, …, xn ) 是来自连续型总体 X ~f ( x )的一个样本观测值 ,试估计未知的 概率密度函数 f ( x ) 。
第二讲描述统计

圆形图(饼图)
98年北京城镇居民消费结构
8% 14%
6% 食 品 衣 着 家庭设备 医疗保健 交通和通讯 文化教育 居 住 杂项商品
41%
5% 5% 11% 10%
折线图
图2。5 某市教育系统1995-2000年人员平均工资 和经费投入变化情况(1995年=1) 3 2 1 0 1995 1996 1997 1998 1999 2000 平均工资 经费投入
实验班
83 92 84 84 86 91 76 86 87 87 83 85 89 74 87 78 82 81 88 84 80 78 90 95 91 87 92 81 72 88 79 90 85 79 75 76 77 89 79 85 76 89 86 87 78 82 75 68 84 76 75 72 78 84 74 78 78 79 76 66 87 83 87 73 84 85 65
品 着 备 育 住 健 设 讯 教 保 通 食 衣 居 商 品
四 川 北 京
庭
疗
化
家
医
和
文
交
通
杂
项
VAR00001
12
10
8
6
4
Frequency
2
Std. Dev = 11.81 Mean = 71.1 N = 30.00 45.0 55.0 65.0 75.0 85.0 95.0
0
VAR00001
二、
集中量数
集中量是代表一组数据典型水平或集 中趋势的量。 常用的集中量有平均数、中位数和众 数。
一、平均数
1、算术平均数 2、加权平均数
1、算术平均数 简称为平均数或均数 (Mean)。
中级经济师-经济基础-母题班讲义-17-18、第24章-描述统计1_答案解析

1、下列关于偏态系数的表述错误的是()。
A:偏态系数取决于离差平方的平均数与标准差平方的比值B:偏态系数等于0,说明数据的分布是对称的C:偏态系数为2,说明数据分布为严重右偏D:偏态系数绝对值越大,说明数据分布的偏斜程度越小E:偏态系数为0.8,说明数据分布为中度右偏正确答案:A,D本题考查偏态系数.偏态系数取决于离差三次方的平均数与标准差三次方的比值,A选项错误;偏态系数等于0,说明数据的分布是对称的,B选项正确;偏态系数为大于1,说明数据分布为严重右偏,C选项正确;偏态系数绝对值越大,说明数据分布的偏斜程度越大,D选项错误;偏态系数在0.5-1之间,说明数据分布为中度右偏,E选项正确。
本题选择错误的,故本期正确答案为AD。
2、在某电商网站上,商品甲得到6个评价得分,分别是1、4、4、5、5、5;商品乙得到5个评价得分3、3、3、4、4.关于这两组数据的说法,正确的有()。
A:商品甲的评分中位数高于商品乙B:商品甲的评分众数高于商品乙C:商品甲的评分均值低于商品乙D:商品甲的评分分布离散程度大于商品乙E:商品甲的评分分布是左偏的正确答案:A,B,D,E本题考查偏态系数、离散系数、众数和均值商品甲的评分中位数是(4+5)/2=4.5.商品乙评分中位数是3,所以商品甲的评分中位数高于商品乙。
A正确;商品甲的众数是5,商品乙的众数是3,商品甲的评分众数高于商品乙,B正确;商品甲评分均值=(1+4+4+5+5+5)/6=4;商品乙评分均值=(3+3+3+4+4)/5=3.4.商品甲的评分均值高于商品乙C错误;商品甲评分的方差=【(1-4)2+2×(4-4)2+3×(5-4)2 】/(6-1)=12/5=2.4商品乙评分的方差=【3×(3-3.4)2+2×(4-3.4)2】/(5-1)=1.2/4=0.3商品甲评分的标准差=(2.4)1/2商品乙评分的标准差=(0.3)1/2商品甲评分的离散系数=(2.4)1/2÷4商品乙评分的离散系数=(0.3)1/2÷3.4商品甲的离散系数大于商品乙,所以商品甲评分的离散程度大于商品乙评分的离散程度,D正确;由偏态系数的公式,可得商品甲的评价得分的偏态系数小于0,故商品甲的评价得分分布是左偏的,E正确。
顺序统计量

X1 min X1, X 2 ,, X n :最小顺序统计量, X(n) max X1, X2 ,, Xn :最大顺序统计量
**********************************************************
而计算 X k 的密度函数)
设 X k 的分布函数为 Fk x ,计算 X k 落于 x, x的概率
P Xk x, x x Fk x x Fk x
2
k
n!
1 ! n
k
!
F
x k 1
F
1000 0 0 0 1100 0 0 1 1200 0 0 2
64
32
64
1001 0 0 1 1101 0 1 1 1201 0 1 2
32
16
32
1002 0 0 2 1102 0 1 2 1202 0 2 2
64
32
64
1010 0 0 1 1110 0 1 1 1 210 0 1 2
32
16
第十周 独立随机变量和的分布与顺序统计量
10.4 顺序统计量
顺(次)序统计量
X1, X2,, Xn 独 立 同 分 布 , 分 布 函 数 F x , 将 这 n 个 随 机 变 量 做 升 序 排 列
X1 X2 Xn , X1 , X2 ,, Xn 称为顺(次)序统计量(ordered statistics)。
序排列 X 1 X 2 X n ,求 X k 的分布。
1
(分析:考虑 X k 在 x 点附近的分布规律,x 非
§1.4 顺序统计量的分布

§1.4 顺序统计量≤≤≤=1212(1)(2)()1212()()(1)(2)()12(,,,) (,,,),(,,,)(,,,),(1,2,,), (,,,)(,,1.4.1 ,n n n n n k k n X X X X x x x x x x X X X x x x X x k n X X X X X 设是从总体中抽取的一个样本,是其一个观测值将观测值按由小到大的次序重新排列为一、顺序统计量的定义当取值为时定义取值为由此得到的称为样本 定义(1)(2)()) (,,,)..n n X x x x 的对应的成为其顺序统计量观察值≤≤≤≤===-称为样本的特别地,称为 称为 称为由于每个都是样本的函数,所以都是随机变量第个顺序统计量最小顺序统计量最大顺序统计量. 一般它们不相互独立.设总体的分布为样本极差.例1注:: ()12(1)1()1()()(1)()12(1)(2)():(,,,)min .max .(,,,),,,.k n i i nn i i nn n k n n X X X X X X X X R X X X X X X X k X X X 仅取的离散均匀分布,其分布列为0, 1, 2----=--<<<=-><=-≤-=-+-=---⎰设总体分布为为样本,则的联合密度函数为 令 由可以推出 则该分布参例数为 12(1)()21,()(1)(1)()122(0,1),,,,(,)(,)(1)(),0 1.,001()(1)[3()](1)(1).(1n n n n n n r n R n X U X X X X X f y z n n z y y z R x x R X X R R f r n n y r y dyn n r r n 的贝塔分布.,2)。
顺序统计量

−1 ! − !
−1
1−
−
()
证明: 对任意的实数 x ,考虑次序统计量 x(k) 取值
落在小区间 (x , x + x ] 内这一事件,它等价于
“样本容量为 n 的样本中有 1 个观测值落在区间
(x , x + x ] 之间,而有 k-1 个观测值小于等于 x ,
100
•T1 X i 是不合格品率p的充分统计量
i 1
1 n
( X i )2
•来自正态总体的样本,若总体期望已知,
n i 1
1 n
是总体方差的充分统计量,若总体方差已知,n X i
i 1
•是总体期望的充分统计量。
3、分位数
设(1) ≤ (1) ≤ ⋯ ≤ () 为取自总体 X 的
次序统计量,称 Mp为p分位数。
+1 ,
= ൞1
+
2
若不是整数
+1
,
若是整数
4、四分位数:
① 排序后处于25%和75%位置上的值
25%
25%
QL
25%
QM
② 不受极端值的影响
③ 计算公式
布,
X
0
1
2
设总体 X 的分布如下:
p
1/3 1/3 1/3
现抽取容量为 3 的样本, 共有 27 种可能取值, 列表如下
x1
x2 x3 x(1) x(2) x(3) x1 x2 x3 x(1) x(2) x(3) x1 x2 x3 x(1) x(2) x(3)
0
0
0
0
0
0
1
1
0
顺序统计量的分布理论

Remark 2.2. Equality (2.8) is valid for any distribution function f .
Remark 2.3. If we have tables of the function Ix(k, n − k + 1), it is possible to obtain d.f. Fk:n(x) for arbitrary d.f. F.
Exercise 2.6. Find the joint distribution of two order statistics Xr,n and Xs,n.
Example 2.2. Let us try to find the joint distribution of all elements of the variational series X1,n, X2,n, . . . , Xn,n. It seems that the joint d.f.
Fk:n(x) = P{ at least k variables among X1, X2, . . . , Xn are less or equal x }
n
= ∑ P{ exactly m variables among X1, X2, . . . , Xn are less or equal x } m=k
−
n! 1)!(n
−
k)!
(F
(x))k−1
(1
−
F
(x))n−k
f (x),
where f is a population density function. The joint density function of order statistics