概率论与数理统计 第六章 样本及抽样分布

合集下载

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计(06)第6章  统计量及其抽样分布
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z

概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。

在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。

1、随机样本总体:试验的全部可能的观察值。

=样本空间个体:每⼀个可能观察值。

=样本点容量:总体中所包含的个体的个数。

有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。

所以将不区分总体与相应的随机变量,统称为总体X。

样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。

对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。

则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。

n称为样本的容量。

进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。

2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。

统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。

统计量也是⼀个随机变量。

g(x1,x2,...,xn)是统计量的观测值。

常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。

总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。

第六章 样本及抽样分布1精品PPT课件

第六章  样本及抽样分布1精品PPT课件
一般, 代表总体的指标(如显象管寿命)是一个随机变量 X, 所以总体就是指某个随机变量X 可能取值的全体。
二.样本
1.抽样: 从总体中抽取若干个体的过程。
2.样本: 从总体中抽取若干个体, 观察得随机变量的一组试验 数据(观测值), 样本中所含个体的数量称为样本容量。
从总体中抽取样本, 一般假设满足下述条件: (1) 随机性: 使总体中的每一个个体有同等机会被抽取到; (2) 独立性: 每次抽样的结果既不影响其他各次抽样的结果,
1
f
xn
b
1n
0
a xi b 其他
测试题B答案:
一.填空题。
1. 1)满足X1, X2 , … X n独立且同分布
2. 21) 2 n
n
2.
Xi p i1
n
1 p
n Xi
i1
,
E X p,
p 1 p DX
n
3. 5/8
二.计算题。
解: 因为X1, X2 , … X n来自均匀分布总体 N , 2 ,则X1, X2 , …
3. 简单随机样也本不:受由其随他机各的次, 独结立果的的抽影样响方;法得到的样本, 这 种随机的, 独立的抽样方法称为简单随机抽样。
注: 今后凡是提到抽样与样本, 都是简单随机抽样与简单随 机样本。
由于从总体中抽取容量为n的样本, 即是对代表总体的随 机变量X随机的,独立的进行n次试验, 每次试验结果可以看作 一个随机变量, n 次试验结果就是n个随机变量 X1, X2 , … X n , 它们相互独立且与总体X同分布。
则的联合概率密度为 。
二. 计算题。
1. 设X1, X2 , … X n是来自均匀分布总体U (a , b)的样本, 求样本 (X1, X2 , … X n)的联合概率密度。

第六章样本及样本函数的分布

第六章样本及样本函数的分布

∼ t(n −1). .
Sn
177
概率论与数理统计全程学习指导
∑ = ∑ 【评注】 10
1 统计量 σ 2
n
(X i

μ)2

i =1
(n −1)S2 σ2
1 σ2
n
(X i

X )2
的分布在自由度上是
i =1
∑ ∑ 1
有差别的,这是因为在 σ2
n
(X i

X )2
中有一个约束条件
X
i =1
=1 n
x(1) ≤ x(2) ≤
≤x (k)
,并假设
x( i )
出现的频数为
ni
,那么
x( i )
出现的频率为
i = 1, 2, , k, k ≤ n . 函数
fi
=
ni n

⎧ 0,

∑ Fn (x)
=
⎪ ⎨
i
fj,
⎪ j=1
⎪⎩ 1,
x < x(1),
x(i) ≤ x < x(i+1), i = 1, 2, , k −1, x ≥ x(k).
③ χ2 分布的性质
10 若 χ2 ∼ χ2 (n) ,则 E(χ2 ) = n , D(χ2 ) = 2n ;
20
(可加性)若
χ
2
1

χ2 (n1) ,
χ
2
2

χ2 (n2 )
,且
χ
2
1

χ
2
2
相互独立,则
χ
2
1
+
χ
2

概率论与数理统计第六章样本及抽样分布}第二节:样讲义本分布函数直方图

概率论与数理统计第六章样本及抽样分布}第二节:样讲义本分布函数直方图

其中和式
xi
是对小于或等于
x
x
的一切
x(i)
的频率
fi
求和,
则称 Fn(x)为样本分布函数,经验分布函数。
2. 样本分布函数Fn(x)具有下列性质:
(1) 0 ≤ Fn(x) ≤1 (2) Fn(x)是非减函数
(3 )F n 0 , F n 1
(4) Fn(x)在每个观测值 x(i)处是右连续的, 点 x(i)是 Fn(x)的跳跃间断点, Fn(x)在该点的跃度就等于频率fi
并以各子区间为底, 以 fi /(ti - ti-1)为高作小矩形,
各个小矩形的面积 ∆Si 就等于样本观测值落在该子区间内的频率,
即:
S ititi 1 ti fiti 1fi,l
i1 ,2, ,l.
l
所有小矩形的面积的和: Si fi 1.
i1
i1
这样作出的所有小矩形就构成了直方图。
写出零件质量的频率分布表并作直方图。
解: 因为样本观测中最小值为 237, 最大值为 265, 所以我们把数据的分布区间确定为: (236.5, 266.5)
并把这个区间等分为 10个子区间:
(236.5, 239.5), (239.5, 242.5), …, (263.5, 266.5)
数理统计
由此得到零件质量的频率分布表:
因为样本容量 n充分大时, 随机变量 X的取值落在 各个子区间 (ti-1 - ti)内的频率近似等于其概率, 即:
f i P t i 1 X t i,i 1 ,2 , ,l
所以直方图大致地描述了总体X的概率分布。
例2: 测量100个某种机械零件的质量, 得到样本观测值如下(单位:g):

第六章-样本及抽样分布 - 福州大学

第六章-样本及抽样分布 - 福州大学

( xi ) 2 2 2
( 2 ) e
n 2 2


n
( xi )2
x i
上页
下页
返回
一、基本概念
统计推断:
利用样本的信息对总体的分布或性质作出判断。
利用样本推断总体时,往往不能直接利用样本,而需要 对它进行一定的加工,这样才能有效地利用其中的信息,否 则,样本只是呈现为一堆“杂乱无章”的数据。
相互独立且每一个都是与总体ξ有相同的分布的随机变量, 这n个个体称为总体ξ的一个容量为n的简单随机样本或简 称为样本,n称为样本容量(样本的个数)。 简单随机样本:独立同分布
上页
下页
返回
3、样本值(样本观测值)
从总体ξ中随机抽取的样本 1 , 2 ,, n 是n个随机变量。 当它们被抽取出来后就是具体数值,常记为x1 , x 2 , , x n , 称为
1 n i n i 1
1 n S (i )2 n i 1
2
是取自总体ξ的一个样本,
n 1 2 (2) ES n
2
E ,
D , 则有
2 (1) E , D n
证 (2)
1 S (i n ni 1
2
n
n 2 1 2 2 ( i 2 i ) ) n i 1
n n 2 1 2 ( i 2 i ) n i 1 i 1 i 1 n n 2 1 2 ( i 2 i n ) n i 1 i 1 n n 2 2 2 1 1 2 2 [ i 2n n ] [ i n ] n i 1 n i 1
i 1 n
2、离散型 设总体ξ的分布律为 则样本

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

《概率论与数理统计》第6章 样本及抽样分布

《概率论与数理统计》第6章  样本及抽样分布
从国产轿车中抽5辆 进行耗油量试验 样本容量为5
抽到哪5辆是随机的
对总体X在相同的条件下,进行n次重复、独立 观察,其结果依次记为X1,X2,,Xn .
这样得到的随机变量X1, X2 , Xn是来自总体X 的一个简单随机样本,与总体随机变量具有相同的
分布. n称为这个样本的容量.
一旦取定一组样本X1,… ,Xn ,得到n个具体的数
由定义可见,
1 V n2 F U n1
~F(n2,n1)
若F~F(n1,n2), F的概率密度为
( y)
(
(
n1 2
0
n1 n2 2
) (
)
n2 2
)
(
n1 n2
)
n1 2
(
n1
y) 2
f x
1
1
n1 n2
y
n1 n2 2
y
y 0
0
n2 , n1 20
F分布的性质
n2 25
N(0,1), 则称随机变量:
2
X12
X
2 2
Xn2
所服从的分布为自由度为 n 的 2分布.
记为 2 ~ 2(n)
2分布的密度函数为
f
( x; n)
2n
1 2 (n
2)
n 1 x
x2 e 2
0
其中伽玛函数( x)通过积分
(x) ett x1dt, x 0 0

x0 x0
来定义.
1 n1
n i 1
(Xi
X )2
n
1
1
n
X
2 i
i 1
nX
2
样本标准差
S
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]


z1
z
性质: z1 z
为自由度为(n1, n2)的F-分布: F ~ F ( n1 , n 2 )
18
F-分布的密度函数
n n2 11 n1n2 ( n1 ) 2 n1 n1 n1 2 n1 n2 ( n2 )(n2 x) 1 n2 x 2 x 0 f (x; n1, n2 ) ( 2 ) ( 2 ) 0 x 0
(1) 2 分布
设 X 1 ,......, X n 是来自总体N(0,1)[标准正态 分布]的样本,则统计量
2 X 12 ...... X n2
是服从自由度为n的 2 -分布,记为: 2 ~ 2 (n)
14
2 -的密度函数
n / 2 1 x / 2 1 x e 2n / 2 ( n / 2) f ( x) 0
总体分布函数F(x)相应的统计量 ---经验分布函数 设 X 1 , ........, X n 为总体F的一个样本,定义:
S ( x ) | {i | X i x} | x ( , )
1 n
并定义经验分布函数为: F n ( x )
S (x)
例:总体F具有一个样本值:1, 2,3,则经验分布函数 为: x 1 0 1 1 x 2 3 F3 2 3 2 x 3 12 x3 1
16
t(n)-分布的密度函数及良好性质
h( x )
[( n 1) / 2]
n ( n / 2)
(1 )
x 2 ( n 1) / 2 n
, x
函数性质: (1) 关于x 0对称. (2) lim n h( x)
1 2
e
x2 / 2
.
h(x)
26
f(y)

2

2
0
y
F (m , n) 1 2
F ( m , n ) 2
27

习题: P174-175 1,2,3,4
28
概率论与数理统计
主讲教师:许道云
贵州大学计算机科学与信息学院
Pr[ X x ] p
1
总体、样本、统计量
总体 样本 统计量
X1 X2
X
X3 X4 Xn
Y=g(X1 , X2 ,…… ,Xn)

5 7
2
10
随机样本决定的联合分布函数
X的密度函数和分布函数:
f (x) F (x)
随机样本的密度函数和分布函数:
f
*
( x 1 , ........,
xn )

n
n
f (xi)
i1
F
*
( x 1 , ........,
xn )

F (xi)
i1
思考题: 为什么要这样定义?
11
U / n1 F ( n1 , n2 ) V / n2
4
§3 正态总体样本均值与方差分布
已知: 设总体X的均值为 ,方差为 2 , X 1 , X 2 , ....... , X n 为X的一个样本,则无论 X服从什么样的分布,总有:
E ( X ) , D( X ) 2 / n
] ].
1 ] 1 Pr[ F
1 F1 ( n1 , n2 )
1 F1 ( n1 , n2 )
] .
1 由于 F ~ F (n2 , n1 ), Pr[ F (n2 , n1 ) F (n2 , n1 )] .. 1 故 Pr[ F F (n2 , n1 )] .
以标准正态分布为起点,研究三种特殊组合构 成的统计量的分布 1. (标准)正态分布: X ~ N ( 0 , 1 ) 2. 3. 4.
2 ( n ) 分布:
具有可加性
具有可加性
2 Y X 12 ...... X n , X i ~ N (0,1)
t ( n ) 分布: X ~ N (0,1), Y ~ 2 ( n )
i1
n
n X
2
]
样本k阶(原点)矩: A k 样本k阶(中心)矩:B k
1 n

n
X
i 1
k i
, k 1 , 2 , 3 ,........

i 1
( X i X ) k , k 2, 3, ........
3
四大分布的联系
1. (标准)正态分布: X~N(0,1) 具有可加性 2.
[ X
i1
n
n X
2
]
样本k阶(原点)矩: A k 样本k阶(中心)矩:B k
1 n

n
X
i 1
k i
, k 1 , 2 , 3 ,........

i 1
( X i X ) k , k 2, 3, ........
9
已知总体分布,如何求一个统计量满足一定条件的概率 例:在总体N(100,25)中, 随机抽取一个容量为49的样 本,求样本均值 X 落在98到102之间的概率。 解:总体服从N(100,25), 有: E[X 所求概率为: p Pr[98 X 102]
23
(4) F-分布的分位点
Pr[ F F (n1 , n2 )] 性质: F1 (n1 , n2 )
1 F ( n2 , n1 )
(反对称性)

F (n1 , n2 )
24
F-分布的密度函数及反对称性质
1 函数性质: 如果F ~ F (n1 , n2 ), 则 ~ F (n2 , n1 ). F
P r[ X z ]

2 ( n )
22
(3) t(n)-分布的分位点
Pr[t t (n)] 性质: (1) t1 (n) t (n). (由对称性) (2) 当n 45时, t (n) z (标准正态分布分位点).
h(x)

t ( n )
于是, F1 (1 ( n2 , n1 ), F 1 ( n1 , n2 ) n1 , n2 ) F 例 : F0.95 (12,9)
1 F0.05 (9,12) 1 2.80 0.357.
1 F ( n2 , n1 )
(查表 : F (n, m) (n m))
概率论与数理统计
主讲教师:许道云
贵州大学计算机科学与信息学院
Pr[ X x ] p
1
第六章 样本及抽样分布
§1
随机样本 §2 抽样分布(来自标准正态总体) §3 正态总体样本均值与方差分布
2
数理统计研究方法流程图:
采集数据 抽样
总体X
样本
进行加工
统计量
对统计量 分析
对总体X作 出推断
7
统计量与观察值: (抽样:试验:观察)
随机样本X1 , X2 ,…… ,Xn 的实际测试值是 一组具体实数:x1 ,x2 ,……,xn 。 称为对X1 ,X2 ,……,Xn的观察值(或试验结 果、或样值)。 统计量:g ( X 1 , X 2 , ....... , X n )
2 2 2 g ( X , X , ....... , X ) X X ....... X 如: 1 2 n 1 2 n
n1n2 ( ) n1 n1 n1 n1 n2 ( n2 )(n2 x) 1 n2 x 2 x 0 f (x; n1, n2 ) ( 2 ) ( 2 ) 0 x 0 n1n2 2
n 11 2


25
反对称性证明及换算:
1 1 Pr[ F F1 (n1 , n2 )] Pr[ F 1 1 Pr[ F 1 所以, Pr[ F 1 F1 ( n1 , n2 ) 1 F1 ( n1 , n2 )
观察值:
g(x1, x2 , ......., xn )
相关文档
最新文档