数理统计6

合集下载

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计(06)第6章  统计量及其抽样分布
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z

概率论与数理统计第六章统计量,样本及抽样分布

概率论与数理统计第六章统计量,样本及抽样分布

(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X

2



X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2

概率与数理统计第六章

概率与数理统计第六章

t


W {T t (n 1)}
2021/3/11
t
x 16
6.2.1 单个正态总体均值的假设检验
例6.2 正常人的脉搏平均每分钟72次,某医生测得10例四乙基铅 中毒患者的脉搏数(次/分)如下:54,67,68,78,70,66, 67,70,65,69.已知人的脉搏次数服从正态分布.试问四乙基铅
在取6份水样,测定该有害物质含量,得如下数据: 0.530‰,0.542‰,0.510‰,0.495‰,0.515‰,0.530‰
能否据此抽样结果说明有害物质含量超过了规定? 0.05
练习2 一公司声称某种类型的电池的平均使用寿命至少为21.5小 时,有一实验室检验了该公司制造的6套电池,得到如下的寿命数 据(单位:小时):19 18 22 20 16 25 设电池寿命服202从1/3/正11 态分布,试问这种类型的电池寿命是否低于该18 公
即提出假设: H0 : p 0.02 若 H0 正确,则取到次品为小概率事件.
2021/3/11
在一次试验中, 小概率事件是 几乎不可能发 生的.
小概率原理
2
6.1 假设检验的基本概念
2. 两类错误
犯了“弃真”错误 第一类错误
犯了“纳伪”错误 第二类错误
P(拒绝H0 | H0为真)
P(接受H0 | H0为假)
注意:我们总把含 有“等号”的情形 放在原假设.
在原假设 H0 为真的前提下,确定统计量
U
X 0
~
N (0,1)
n
2021/3/11
因为X
~
N
,
2
n
,
所以
X
~
N (0,1)

数理统计6:泊松分布,泊松分布与指数分布的联系,离散分布参数估计

数理统计6:泊松分布,泊松分布与指数分布的联系,离散分布参数估计

数理统计6:泊松分布,泊松分布与指数分布的联系,离散分布参数估计前两天对两⼤连续型分布:均匀分布和指数分布的点估计进⾏了讨论,导出了我们以后会⽤到的两⼤分布:β分布和Γ分布。

今天,我们将讨论离散分布中的泊松分布。

其实,最简单的离散分布应该是两点分布,但由于在上⼀篇⽂章的最后,提到了Γ分布和泊松分布的联系,因此本⽂从泊松分布出发。

由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:泊松分布简介泊松分布是⼀种离散分布,先给出其概率分布列。

若X∼P(λ),则P(X=k)=λkk!e−λ,k=0,1,⋯它的取值是⽆限可列的。

为什么泊松分布会与指数分布、Γ分布有联系呢?这是因为,它们三个都是随机事件发⽣的⼀种描述。

实际上,指数分布的参数λ是⼀种速率的体现,它刻画了随机事件发⽣的速率。

⽽指数分布随机变量的取值,就代表某⼀事件在⼀定的速率下发⽣的时刻距离计时原点的长度。

Y∼E(λ),就代表Y对应的事件事件的发⽣速率是λ,所以平均发⽣时间就在在1/λ处。

这也可以作为E(Y)=1/λ的⼀种解释。

指数分布具有⽆记忆性,这与随机事件的发⽣相似,即已经发⽣历史事件对未来不产⽣影响,⽤数学语⾔说就是P(Y>s+t|Y>s)=P(Y>t)。

这指的是,如果⼀个事件平均会在s时间后发⽣,但是⽬前经过了t时间还没有发⽣,则事件的平均发⽣时间就移动到t+s时间后。

它不会因为你已经等了t时间,就会更快地发⽣。

⽽如果把n个独⽴同分布于E(λ)指数分布随机变量相加,得到的⾃然就是恰好发⽣k个事件的平均时间,这个时间Z∼Γ(n,λ),本质还是⼀种时间的度量。

但Z就不具有⽆记忆性了,这是因为,经过t时间后可能已经发⽣了n−1个事件就差最后⼀个没有发⽣,也可能⼀个事件都没发⽣还需要n个才能凑齐。

泊松分布则刚好相反,指数分布和Γ分布都是限定了发⽣次数,对发⽣时间作度量;泊松分布则是限定了时间1,求随机事件在这⼀段时间内发⽣的次数服从的概率分布。

概率论与数理统计-6

概率论与数理统计-6

一、统计量
定义1 设X1, X2, …, Xn是总体X的样本,样本函数g(X1, X2, …, Xn)是样 本的实体函数,且不含有任何未知参数,则称这类样本函数g(X1, X2, …, Xn)为统计量。
由于样本具有二重性,统计量作为样本的函数也具有二重性,即对 一次具体的观测或试验,它们都是具体的数值,但当脱离开具体的某 次观测或试验,样本是随机变量,因此统计量也是随机变量。
n i 1
( xi
x )2
1n (
n 1 i1
xi2
nx 2 )

(3)样本标准差
S
S2
1 n 1
n i 1
(Xi
X
)2
它的观测值记为 s
s2
1 n 1
n i 1
( xi
x )2

(6-5)
(4)样本k阶原点矩
Ak
1 n
n i 1
X
k i
(k
1,2 ,3,
)
它的观测值记为 ak
解 将样本的观察值由小到大排列为 1 2 3 3 4 4 4 5 6 8
所以样本的频率分布如表所示
X
1
2
3
4
5
6
8
fn
0.1
0.1
0.2
0.3
0.1
0.1
0.1
例1 设总体服从泊松分布,容量为10的样本观察值如下:
214 3 5 6 4 8 4 3 试构造样本的分布函数F10(x)。
例1 设随机变量 X ~ (0 ,1) 分布,求D(X)。
解 因为 X ~ (0 ,1)
所以 又
E(X ) p E( X 2 ) 0 (1 p) 12 p p

概率论与数理统计-第6章-第4讲-区间估计

概率论与数理统计-第6章-第4讲-区间估计
5
本讲内容
01 置信区间定义 02 求置信区间的步骤 03 几点说明
02 求置信区间的步骤
例 设X1,…Xn 是取自 N (, 2 ) 的样本, 2已知,
求参数 的置信水平为 1 的置信区间.
明确问题:求什么参数的置信区间?置信水平是多少?
解 选 的点估计为 X
寻找未知参数的
取 U X N (0,1) 一个良好估计 n
u
2} 1
1
为什么 这样取?
u
u
2
2
8
02 求置信区间的步骤
从中解得
P{|
X
n
|u2}源自1P{Xn u 2
X
n
u
2}
1
于是所求 的 置信区间为
[X
n u 2 ,
X
n u
2]
也可简记为 X n u 2
从例题的过程,我们归纳出求置信区间的
一般步骤如下:
1
u
u
2
2
9
02 求置信区间的步骤
求置信区间的步骤
10
本讲内容
01 置信区间定义 02 求置信区间的步骤 03 几点说明
03 几点说明
1. 要求 θ 以很大的可能被包含在 [θˆ1, θˆ2 ]
内,P(ˆ1 ˆ2 ) 1 要尽可能大.
即要求估计尽量可靠. 2. 估计的精度要尽可能的高. 如要求区间
长度 θˆ2 θˆ1 尽可能短.
置信度与精度是一对矛盾,当样本容 量固定时,置信度越高,则精度越差.
u
u
2
2
区间的长度为 2u —— 达到最短
2n
14
03 几点说明
特别说明
即使在概率密度不对称的情形,如

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

概率论与数理统计第6章参数估计

概率论与数理统计第6章参数估计
参数估计的形式有两种:点估计与区间估计。
设 x1, x2,…, xn 是来自总体 X 的一个样本,
我们用一个统计量 ˆ ˆ(x1,的,取xn值) 作为 的 估计值, 称为ˆ的点估计(量),简称估计。 在这里如何构造统计量 并没有明ˆ确的规定,
只要它满足一定的合理性即可。这就涉及到 两个问题:
k阶原点矩 k的无偏估计。但对中心矩则不一样, 譬如,由于 E(s *2 ) ,n 样1本2 方差s*2不是总体方差 2
的无偏估计,对此,有n 如下两点说明:
(1) 当样本量趋于无穷时,有E(s*2) 2,
我们称 s*2 为 2的渐近无偏估计。
(2)
若对s*2作如下修正:
s2

个无偏估计为1

2X ,2

n 1 n
Xn
,判别1与2哪个有效 n

2时?
解:Var
1

Var
2X


4 n
2
12

2
3n

f
n

x



nxBiblioteka n1 n 00 x
其它
E
X
2
n

0
nxn1
n
dx

n
n

2
2
于是Var
第六章 参数估计
§6.1 点估计的概念与无偏性 §6.2 矩估计及相合性 §6.3 最大似然估计与EM算法 §6.4 最小方差无偏估计 §6.5 贝叶斯估计 §6.6 区间估计
一般常用 表示参数,参数 所有可能取值
组成的集合称为参数空间,常用表示。参 数估计问题就是根据样本对上述各种未知参 数作出估计。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

水 平
1 2
表头设计
因素 列号 A 1 B 2 A×B 3 C 4 D 5 B×C 6 空列 7
试验结果
A 1 1 2 试 验 号 3 4 5 6 7 8 B 2 A×B 3 1 1 2 2 2 2 1 1 C 4 1(2) 2(3) 1 2 1 2 1 2 D 5 1(1) 2(1.5) 1 2 2 1 2 1 B×C 空列 渗碳 6 1 2 2 1 1 2 2 1 7 1 2 2 1 2 1 1 2 深度 0.85 0.75 1.03 0.98 1.09 1.16 0.81 0.92
步骤6:确定最优方案
A 1 K1j 5.34 K2j 5.73 K3j 5.00 K1j 1.780 K2j 1.910 K3j 1.667 Rj 0.73 因素 A B 2 5.23 5.25 5.59 1.743 1.750 1.863 0.36 B B3 C 3 5.30 5.55 5.22 1.767 1.850 1.740 0.33 C C2 误差列 4 5.30 5.39 5.32 1.787 1.797 1.773 0.07
因素
A 水分(%) 水分 9 10 8 B 粒度(%) 粒度 30 60 80 C 碱度 1.2 1.4 1.6 D 膨润土 1.0 1.5 2.0
水 平
1 2 3
选取正交表:3因素,4水平使用L9(34)
表头
因素 列号 A 水分(%) 水分 1 B 粒度(%) 粒度 2 C 碱度 3 D 膨润土 4
2综合评分法
例3:
因素
A 时间(小时 小时) 时间 小时 2.5 5 1 B 加料中核酸含量 7.5 6.0 9.0 C PH 值 5.0 6.0 9.0 D 加2综合评分法
根据各因素的重要程度给出综合分数 本例题中: 综合分数=4×纯度+1×回收率
A 1 1 2 3 试 验 号 4 5 6 7 8 9
1(25) 1(7.5) 1 1 2(5) 2 2 3(1) 3 3 2(9.0) 3(6.0) 1 2 3 1 2 3
3(9.0) 3(1.2) 2 3 1 3 1 2 3 1 2 2 3 1
A 1 K1j 273.2 K2j 196.6 K3j 205.0 K1j 91.1 K2j 65.5 K3j 68.3 Rj 76.6
步骤4:按试验方案作试验并得到试验结果
A 1 1 2 3 试 验 号 4 5 6 7 8 9 1(460) 1 1 2(490) 2 2 3(520) 3 3 B 2 1(250) 2(270) 3(300) 1 2 3 1 2 3 C 3 1(甲) 2(乙) 3(丙) 2 3 1 3 1 2 空列 4 y1 =1.72 y2 =1.82 y3 =1.80 y4 =1.92 y5 =1.83 y6 =1.98 y7 =1.59 y8 =1.60 y9 =1.80
最小者为 L9(34)
步骤2:表头设计
因素 列号
A 1
B 2
C 3
空列 4
步骤3:明确试验方案
列号 A 1 1 2 3 行 号 4 5 6 7 8 9 1(460) 1 1 2(490) 2 2 3(520) 3 3 B 2 1(250) 2(270) 3(300) 1 2 3 1 2 3 C 3 1(甲) 2(乙) 3(丙) 2 3 1 3 1 2 空列 4
步骤5:引进级差并确定因素的主次顺序
A 1 K1j 5.34 K2j 5.73 K3j 5.00 K1j 1.780 K2j 1.910 K3j 1.667 Rj 0.73 因素 A B 2 5.23 5.25 5.59 1.743 1.750 1.863 0.36 B C 3 5.30 5.55 5.22 1.767 1.850 1.740 0.33 C 误差列 4 5.30 5.39 5.32 1.787 1.797 1.773 0.07
B 2 221.2 206.7 249.9 73.7 68.9 83.9 43.2
C 3 222.9 236.9 218.9 74.3 79.0 72.7 18.0
D 4 260.5 228.6 188.7 86.8 76.2 62.9 71.8
有交互作用的试验及结果的直观分析
L 8(2 ) 两列间交互作用列表
B 2 27.3 20.2 47.6 9.10 6.73 15.87 27.4
C 3 42.9 24.6 27.6 14.30 8.20 9.20 18.3
D 4 32.3 37.0 25.8 10.77 12.33 8.60 11.2
A 1 K1j 9.0 落 下 强 度 K2j 17.5 K3j 25.5 K1j 3.00 K2j 5.83 K3j 8.50 Rj 16.5 3.0 9.5
a1 = K1A − y =1.78 −1.786 = −0.006 a2 = K2A − y =1.91−1.786 = 0.124 a3 = K3A − y =1.667 −1.786 = −0.119 b = K1B − y =1.743 −1.786 = −0.043 1 b2 = K2B − y =1.750 −1.786 = −0.036 b3 = K3B − y =1.863 −1.786 = 0.077 c1 = K1C − y =1.767 −1.786 = −0.019 c2 = K2C − y =1.85 −1.786 = 0.064 c3 = K3C − y =1.74 −1.786 = −0.046
B 2 3 5 6
C 3
D 4 3 5 6 1.00 1.67 2.00 3
2.00 1.67 1.00 3
1.00 1.67 2.00 3
因此,对于不同指标,因素主次关系如下 主——→次 抗压强度: B C A D 落下强度: B C A D 裂纹度: A B C D 最佳选择如下: 对抗压强度: A2B3C1D2 对落下强度: A3B3C2D1 对裂纹度: A2B3C1D1或A2B3C1D1
步骤5:引进级差并确定因素的主次顺序
定义记号: Kij = 第j列上水平号为的各试验结果之和 i 1 Kij = Kij,s为第j列上水平号的出现次数 i s Rj = m Kij ) − m Kij )称为第 列的级差 ax( in( j Rj 也可等于m Kij ) − m Kij ) ax( in(
B 2
C 3 1(5.0) 2(6.0)
D 4 1(1.6) 2(1.4)
试验指标 纯度 17.5 12.0 6.0 8.0 4.5 4.0 8.5 7.0 4.5 回收率 30.0 41.2 60.0 24.2 51.0 58.4 31.0 20.5 73.5 综合评分 100 89.2 84.0 56.2 69.0 74.4 65.0 48.5 91.5
B 2 0.65 0.32 0.33 A×B
A×B 3 0.67 0.30 0.37 B
C 4 0.46 0.51 0.05 B×C D
D 5 0.42 0.55 0.13 A
B×C 6 0.34 0.63 0.29 C
A 1B 2C 2D 1
试验结果分析
因素A、B的水平搭配表: 、 B1 B2 D11=y1+y2=0.15+0.25=0.40 D12=y3+y4=0.03+0.02=0.05 D21=y5+y6=0.09+0.16=0.25 D22=y7+y8=0.19+0.08=0.27
A1 A2
因素B、C的水平搭配表:
B1 B2 C1 C2 D11=y1+y5=0.15+0.09=0.24 D12=y2+y6=0.25+0.16=0.41 D21=y3+y7=0.03+0.19=0.22 D22=y4+y8=0.02+0.08=0.10
1(1.0) 2(1.5)
11.3 4.4 10.8 7.0 7.8 23.6 9.0 8.0 13.2
3(80) 3(1.6) 3(2.0) 2 3 1 3 1 2 3 1 2 2 3 1
2(10) 1 2 2 3(8) 3 3 2 3 1 2 3
A 1 K1j 26.5 抗 压 强 度 K2j 38.4 K3j 30.2 K1j 8.83 K2j 12.80 K3j 10.07 Rj 11.9
A 1
B 2
C 3
D 4 抗压强度 (公斤/个)
试验指标 落下强度 (0.5 米/次) 1.0 3.5 4.5 1.0 1.5 15.0 1.0 4.5 20.0 裂纹 度 2 3 3 2 1 0 2 1 0
1 2 3 试 验 号 4 5 6 7 8 9
1(9) 1 1
1(30) 1(1.2) 2(60) 2(1.4)
yi=|xi-1|
0.15 0.25 0.03 0.02 0.09 0.16 0.19 0.08
1(甲) 1(700) 1 1 1 2(乙) 2 2 2 1 2(800) 2 1 1 2 2
试验结果分析
空列 7 0.52 0.45 0.07
A 1 K 1j K 2j Rj 因素次序 方案 0.45 0.52 0.07
正交试验设计的基本步骤和方法
1明确试验目的,确定考察指标 2挑选因素和水平,制定因素水平表 3选择合适的正交表,进行表头设计 4明确试验方案,进行试验,测定结果 5对试验结果进行统计分析,得出因素的 主次顺序,确定最优或较优方案 6进行验证试验,做进一步分析
多指标问题的直观分析 1综合平衡法
例2:精矿粉造球配方试验
最优方案 A2
步骤7:最优方案的工程平均
定 : 义 KiA = Kij如 第j列 表 素A的话 果 代 因 , KiB, KiC L 样 同 称ai = KiA − y为 素A的第 水平 因 效应 i 显 : 然
相关文档
最新文档