概率论与数理统计第四版第六章PPT课件
合集下载
概率论与数理统计-6

一、统计量
定义1 设X1, X2, …, Xn是总体X的样本,样本函数g(X1, X2, …, Xn)是样 本的实体函数,且不含有任何未知参数,则称这类样本函数g(X1, X2, …, Xn)为统计量。
由于样本具有二重性,统计量作为样本的函数也具有二重性,即对 一次具体的观测或试验,它们都是具体的数值,但当脱离开具体的某 次观测或试验,样本是随机变量,因此统计量也是随机变量。
n i 1
( xi
x )2
1n (
n 1 i1
xi2
nx 2 )
。
(3)样本标准差
S
S2
1 n 1
n i 1
(Xi
X
)2
它的观测值记为 s
s2
1 n 1
n i 1
( xi
x )2
。
(6-5)
(4)样本k阶原点矩
Ak
1 n
n i 1
X
k i
(k
1,2 ,3,
)
它的观测值记为 ak
解 将样本的观察值由小到大排列为 1 2 3 3 4 4 4 5 6 8
所以样本的频率分布如表所示
X
1
2
3
4
5
6
8
fn
0.1
0.1
0.2
0.3
0.1
0.1
0.1
例1 设总体服从泊松分布,容量为10的样本观察值如下:
214 3 5 6 4 8 4 3 试构造样本的分布函数F10(x)。
例1 设随机变量 X ~ (0 ,1) 分布,求D(X)。
解 因为 X ~ (0 ,1)
所以 又
E(X ) p E( X 2 ) 0 (1 p) 12 p p
概率论与数理统计课件(6-10).ppt

1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。
2、不同的置信水平,参数的置信区间不同。
3、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。如果不降低可靠性,而要缩小估计范 围,则必须增大样本容量,增加抽样成本。
点估计值
2
S2
1 n 1
n i 1
( xi
x
)2
例1 一批钢件的20个样品的屈服点(t/cm2)为 4.98 5.11 5.20 5.20 5.11 5.00 5.35 5.61 4.88 5.27 5.38 5.48 5.27 5.23 4.96 5.15 4.77 5.35 5.38 5.54 试估计该批钢件的平均屈服点及其方差。
解 由于 EX 1 2 , DX (2 1)2
2
12
所以由矩法估计,得
X 1 2
2
Sn2
(2 1)2
12
解得 1 X 3Sn 2 X 3Sn
区间长度的矩估计量为 2 1 2 3Sn
例5 对容量为n的子样,求下列密度函数中参数 a的
矩估计量。
f
(x)
2
a2
(a
x),
(0 x a)
令 L( ) f (x1, x2, , xn , ) f (xi , ) i 1
参数的估计量 ˆ,使得样本(X1,X2,…,Xn)落在观测
值 (x1, x2 , , xn ) 的邻域内的概率L()达到最大,即
L(x1, x2, , xn,ˆ) max L(x1, x2, , xn,)
2、不同的置信水平,参数的置信区间不同。
3、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。如果不降低可靠性,而要缩小估计范 围,则必须增大样本容量,增加抽样成本。
点估计值
2
S2
1 n 1
n i 1
( xi
x
)2
例1 一批钢件的20个样品的屈服点(t/cm2)为 4.98 5.11 5.20 5.20 5.11 5.00 5.35 5.61 4.88 5.27 5.38 5.48 5.27 5.23 4.96 5.15 4.77 5.35 5.38 5.54 试估计该批钢件的平均屈服点及其方差。
解 由于 EX 1 2 , DX (2 1)2
2
12
所以由矩法估计,得
X 1 2
2
Sn2
(2 1)2
12
解得 1 X 3Sn 2 X 3Sn
区间长度的矩估计量为 2 1 2 3Sn
例5 对容量为n的子样,求下列密度函数中参数 a的
矩估计量。
f
(x)
2
a2
(a
x),
(0 x a)
令 L( ) f (x1, x2, , xn , ) f (xi , ) i 1
参数的估计量 ˆ,使得样本(X1,X2,…,Xn)落在观测
值 (x1, x2 , , xn ) 的邻域内的概率L()达到最大,即
L(x1, x2, , xn,ˆ) max L(x1, x2, , xn,)
(精选)概率与数理统计第六章

2) 在原假设成立的前提下,选择检验统计量,并确定其分布
常用的统计量的分布为:N (0,1), t 分 布 , 2 分 布 , F 分 布 3)确定拒绝域: 根据小概率原理确定拒绝原假设的区域.
即确定满足 P (拒 绝 H 0|H 0 为 真 )拒绝域W.
4)作出统计推断:计算检验统计量的观测值. 若检验统计量的值落入拒绝域,则拒绝原假设 若检验统计量的值未落入拒绝域,则接受原假设
(2)在原假设 H 0 为真的前提下,确定统计量
UX X30390~N(0,1)
n
25
(3)确定拒绝域 W{Uu0.05}{U1.645}
6.2.2 单个正态总体方差的假设检验
6.1 假设检验的基本概念
例 用某种动物作试验材料,要求动物的平均体重 100g,若 100g 需要再饲养;若 100g则应淘汰.又知动物体重服从正态分布,且由 以往经验知 1.5g ,现从一批待试验的动物中,随机抽取8只,称 得体重(g)为:99.3 98.9 101.5 101.0 99.6 98.7 102.2 100.8
所以
X
~
N
(0,1)
n
6.2.1 单个正态总体均值的假设检验
y 对于给定的显著性水平 ,确定拒绝域W
① H 0 : 0 , H 1 : 0
W{|U|u}
2
2
u
y
2
2
u
2
x
② H 0 : 0 , H 1 : 0
W{Uu}
③ H 0 : 0 , H 1 : 0
W{Uu}
x y
x
6.2.1 单个正态总体均值的假设检验
H0:0100, H1:100
在原假设为真时选统计量
常用的统计量的分布为:N (0,1), t 分 布 , 2 分 布 , F 分 布 3)确定拒绝域: 根据小概率原理确定拒绝原假设的区域.
即确定满足 P (拒 绝 H 0|H 0 为 真 )拒绝域W.
4)作出统计推断:计算检验统计量的观测值. 若检验统计量的值落入拒绝域,则拒绝原假设 若检验统计量的值未落入拒绝域,则接受原假设
(2)在原假设 H 0 为真的前提下,确定统计量
UX X30390~N(0,1)
n
25
(3)确定拒绝域 W{Uu0.05}{U1.645}
6.2.2 单个正态总体方差的假设检验
6.1 假设检验的基本概念
例 用某种动物作试验材料,要求动物的平均体重 100g,若 100g 需要再饲养;若 100g则应淘汰.又知动物体重服从正态分布,且由 以往经验知 1.5g ,现从一批待试验的动物中,随机抽取8只,称 得体重(g)为:99.3 98.9 101.5 101.0 99.6 98.7 102.2 100.8
所以
X
~
N
(0,1)
n
6.2.1 单个正态总体均值的假设检验
y 对于给定的显著性水平 ,确定拒绝域W
① H 0 : 0 , H 1 : 0
W{|U|u}
2
2
u
y
2
2
u
2
x
② H 0 : 0 , H 1 : 0
W{Uu}
③ H 0 : 0 , H 1 : 0
W{Uu}
x y
x
6.2.1 单个正态总体均值的假设检验
H0:0100, H1:100
在原假设为真时选统计量
概率论与数理统计完整ppt课件

化学
在化学领域,概率论与数理统计被用于研究化学反应的速率和化 学物质的分布,如化学反应动力学、量子化学计算等。
生物
在生物学中,概率论与数理统计用于研究生物现象的变异和分布, 如遗传学、生态学、流行病学等。
在工程中的应用
通信工程
01
概率论与数理统计在通信工程中用于信道容量、误码率、调制
解调等方面的研究。
边缘分布
对于n维随机变量(X_1,...,X_n),在概 率论中,分别定义了X_1的边缘分布 、...、X_n的边缘分布。
04
数理统计基础
样本与抽样分布
01
02
03
总体与样本
总体是包含所有可能数据 的数据集合,样本是总体 的一个随机子集。
抽样方法
包括简单随机抽样、分层 抽样、系统抽样等。
样本分布
描述样本数据的分布情况 ,如均值、中位数、标准 差等。
参数估计与置信区间
参数估计
利用样本数据估计总体的 未知参数,如均值、方差 等。
点估计
用样本统计量作为总体参 数的估计值。
置信区间
给出总体参数的一个估计 区间,表示对总体的参数 有一个可信的估计范围。
假设检验与方差分析
假设检验
通过样本数据对总体参数提出 假设,然后根据假设进行检验
01
定义
设E是一个随机试验,X,Y是定义在E上,取值分别为实数的随机变量
。称有序实数对(X,Y)为一个二维随机变量。
02
分布函数
设(X,Y)是一个二维随机变量,对于任意实数x,y,二元函数
F(x,y)=P({X<=x,Y<=y})称为二维随机变量(X,Y)的分布函数。
03
边缘分布
对于二维随机变量(X,Y),在概率论中,分别定义了X的边缘分布和Y的
在化学领域,概率论与数理统计被用于研究化学反应的速率和化 学物质的分布,如化学反应动力学、量子化学计算等。
生物
在生物学中,概率论与数理统计用于研究生物现象的变异和分布, 如遗传学、生态学、流行病学等。
在工程中的应用
通信工程
01
概率论与数理统计在通信工程中用于信道容量、误码率、调制
解调等方面的研究。
边缘分布
对于n维随机变量(X_1,...,X_n),在概 率论中,分别定义了X_1的边缘分布 、...、X_n的边缘分布。
04
数理统计基础
样本与抽样分布
01
02
03
总体与样本
总体是包含所有可能数据 的数据集合,样本是总体 的一个随机子集。
抽样方法
包括简单随机抽样、分层 抽样、系统抽样等。
样本分布
描述样本数据的分布情况 ,如均值、中位数、标准 差等。
参数估计与置信区间
参数估计
利用样本数据估计总体的 未知参数,如均值、方差 等。
点估计
用样本统计量作为总体参 数的估计值。
置信区间
给出总体参数的一个估计 区间,表示对总体的参数 有一个可信的估计范围。
假设检验与方差分析
假设检验
通过样本数据对总体参数提出 假设,然后根据假设进行检验
01
定义
设E是一个随机试验,X,Y是定义在E上,取值分别为实数的随机变量
。称有序实数对(X,Y)为一个二维随机变量。
02
分布函数
设(X,Y)是一个二维随机变量,对于任意实数x,y,二元函数
F(x,y)=P({X<=x,Y<=y})称为二维随机变量(X,Y)的分布函数。
03
边缘分布
对于二维随机变量(X,Y),在概率论中,分别定义了X的边缘分布和Y的
[学习]概率论与数理统计课件第6章
![[学习]概率论与数理统计课件第6章](https://img.taocdn.com/s3/m/76e0b77e83c4bb4cf7ecd199.png)
$(X1, X2,L , Xn ) 来作为参数的估计量,则称为
参数的点估计。
区间估计(interval estimation) :如果构造两个
统计量 µ1(X1, X2,L , Xn ),$2(X1, X2,L , Xn ), 而用 (µ1,µ2 ) 来作为参数可能取值范围的估计,称为
参数的区间估计。
参数的点估计
点估计的方法:数字特征法、矩法、极大似然法。 样本的数字特征法:以样本的数字特征作为相应总体
数字特征的估计量。
以样本均值 X作为总体均值 的点估计量,即
µ
X
1 n
n i 1
Xi
点估计值
µ x 1
n
n
xi
i 1
以样本方差 S 2作为总体方差 2 的点估计量,即
¶ 2
S2
1 n 1
1 1
2 2
0
解得
1 n
n i 1
xi
x
2
1 n
n i 1
( xi
x )2
所以μ,2的极大似然估计量为
ˆ
1 n
n i 1
Xi
X
ˆ 2
1 n
n i 1
(Xi
X )2
与矩估计量 相同
估计量的评选标准
——无偏性、有效性、相合性*、充分性与完备性*
无偏估计量:设 $是 的估计量,如果 E($) , 则称 $是 的无偏估计量(unbiased estimation)
,m)
1 n
n
(Xi
i 1
X )k
(k 1, 2,L , m)
作业 P130 1,2,4 预习 第三节 区间估计
区间估计的思想
参数的点估计。
区间估计(interval estimation) :如果构造两个
统计量 µ1(X1, X2,L , Xn ),$2(X1, X2,L , Xn ), 而用 (µ1,µ2 ) 来作为参数可能取值范围的估计,称为
参数的区间估计。
参数的点估计
点估计的方法:数字特征法、矩法、极大似然法。 样本的数字特征法:以样本的数字特征作为相应总体
数字特征的估计量。
以样本均值 X作为总体均值 的点估计量,即
µ
X
1 n
n i 1
Xi
点估计值
µ x 1
n
n
xi
i 1
以样本方差 S 2作为总体方差 2 的点估计量,即
¶ 2
S2
1 n 1
1 1
2 2
0
解得
1 n
n i 1
xi
x
2
1 n
n i 1
( xi
x )2
所以μ,2的极大似然估计量为
ˆ
1 n
n i 1
Xi
X
ˆ 2
1 n
n i 1
(Xi
X )2
与矩估计量 相同
估计量的评选标准
——无偏性、有效性、相合性*、充分性与完备性*
无偏估计量:设 $是 的估计量,如果 E($) , 则称 $是 的无偏估计量(unbiased estimation)
,m)
1 n
n
(Xi
i 1
X )k
(k 1, 2,L , m)
作业 P130 1,2,4 预习 第三节 区间估计
区间估计的思想
概率论与数理统计-第六章

大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
《概率统计第六章》PPT课件

[t ,) (,t ]
[t ,)
2
H0 H0
2. 检验 (1)
2 1
2 2
H : 2
所机以器接处受于正常Z工作,1状即00态..14。58
10.5 / 15
下可0以.5认16为4
R
H0
0.05
例2 (习题六第9题)设总体
是 的样本,检验 X ~ N (,32 )
(给X出1,判X别规2 ,则:,显X著性25水) 平 X
下
当 C。
H0 : 0时拒绝 H1 。: 试确定常0 数
通常
P{U 1orU 2}
的取值由范临围界,值称确其定为使P拒小{绝概U域率,事记件作发3}生R的 , P{U 4}
(Rejection Region) 0 0.1
U
(4)计算由样本观测值得到的统计量的 值。 若统计量值属于拒绝域,则拒绝原 假设 ; 若统计量值不属于拒绝域,则接受 原假设 。
H0 : p 0.9 H1 : p 0.9
注意
原假设与备择假设的地位不对等:
是受保护的,没有足够的理由不能
否定 ;
拒绝 是有说服力的,而接受 仅是
没有H足0够理由否定
。
H0
H0
H0
H0
3. 假设检验的方法及原理
1)反证法
为了判断 是否真,先假设 真。在
此假设下如果出现不合理结果,则否定
真;若未出现不合理结果,则可认为
H1 : 1 2
2
1 2
成立时
T
X Y
(m
1) S12
(n
1)S
2 2
1 1
mn2
mn
H0
T ~ t(m n 2)
概率第6章 样本及抽样分布PPT课件

Xi
i 1, 2,
,n
显然Y1,Y2, ,Yn相互独立,且Yi N 0,1 i 1, 2,
于是
2
n i 1
(
X
i
)2
n
Yi 2
i 1
2
n
(2)
X1
X2
~
N
(0,
2
2
),
(
X1 X
2 2
2
)2
~
2 (1)
2X3
X4
X5
~
N(0, 6
2 ), (2X3
X4
6 2
X 5 )2
~
[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体X 具有概率密度f(x),
则样本(X1,X2,…,Xn)具有联合密度函数:
n
fn x1, x2, xn f xi
i1
3
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X的样本
1.
样本均值
定理6.4:t n分布的概率密度为:f t, n
n1 2
n
n 2
1
t2 n
n1 2
,
t
对给定的 ,
0
1, 称满足条件
t n
f
t, n dt
的点t
n
为t n分布的上分位数。t分布的上分位数可查t分布表
f (x)
n 10
f x
t1 (n) t (n)
n4
n 1
3 2 1 0 1 2 3
Y1 g1 X1, , X n1 ,Y2 g2 X n11, , X n2 , ,Yk gk X , n1 nk11 , X n