概率统计讲课稿第七章(第一,二节)
概率论第七章 第1节

根据样本概率最大原则,m的估计值为3。
最大似然估计法原理
一般地,不仿设总体X是离散型分布X~p(x,θ),如果 X1,X2,…,Xn是来自这个总体的一个随机样本,x1,x2,…,xn 是这个随机样本的样本值,则这个样本发生的概率为:
记这个概率为θ的函数:
16
最大似然估计法原理
如果在一次抽样中样本值x1,x2,…,xn出现了,我们就认为 它之所以出现是因为它发生的概率最大导致的。因此我们 就选择能使这个概率最大的那个θ作为θ的估计值,这就 是极大似然估计法。 “样本值概率最大原则”
矩估计法理论依据
命题2:设总体X的l=1,2,…,k阶矩存在即E(Xl)=μk,则l阶样 本矩A1,A2,…,Ak的连续函数g(A1,A2,…,Ak)也依概率收敛于总 体矩的连续函数即
根据这两个命题,我们使用如下方法来进行矩估计: (1)用样本矩A1,A2,…,Ak来估计总体矩; (2)用样本矩的连续函数g(A1,A2,…,Ak)来估计总体矩的连续 函数g(μ1,μ2,…,μk)。
砍掉充分小的dxi,记这 个概率为θ的函数:
30
连续型总体中参数 θ的似然函数!
最大似然估计值 最大似然估计量
怎样求最大值点?
基于此通常先取对数,再求最大值点。
化成求 对数似 然函数 的最大 值点!
如果对数似然函数二阶可导,并且概率 密度函数是单峰函数,则驻点就是最大 值点!通过求一阶导数能得驻点:
第七章 参数估计
1、什么是参数估计? 当总体的分布类型已知,但其中仍有未知参数。比如总体 X服从参数μ,σ2的正态分布,但μ,σ2未知。但是我们 能根据来自总体X的一个简单随机样本X1,X2,…,Xn通过适 当的方法对这些未知参数进行估计,得到它的一个近似值 或近似区间。 2、参数估计有哪些形式? (1)点估计:矩估计法、极大似然估计法。 (2)区间估计:正态总体下区间估计法。
概率统计第七章1-2

P(|U|>u1-α/2)=α
φ(x)
U检验
α/2
- u1-αΒιβλιοθήκη 2 u1-α/2接受域α/2
X
否定域
否定域
双侧统计检验
该检验用 u 检验统计量,故称为u 检验。
② H0:μ≤μ0(已知); H1:μ>μ0 (右侧检验) 1) 提出原假设和备择假设: H0:μ≤μ0; H1:μ>μ0, X 0 在H0下有 2) 对统计量: U / n X 0 X , / n / n X 0 X 对给定的α有 { u1 } { u1 } / n / n X 0 X 所以 P( u1 ) P( u1 ) / n / n 3) 故 拒绝条件为U> u1-α
c u u0.05 1.645
由
X 110 4/5
1.645
X 108.648
即区间( ,108.648 ) 为检验的拒绝域 称 X 的取值区间 (108.648,+) 为检验的接受域
四、作出判断
在有了明确的拒绝域后,根据样本观测值 我们可以做出判断: 当 x 108.684 或 u 1.645 时,则拒绝H 0 即接收 H1 ;
H 0 : p 4%
vs
H1 : p 4%
二、选择检验统计量 由样本对原假设进行判断总是通过一 个统计量完成的,该统计量称为检验统计 量。 找出在原假设 H 0 成立条件下,该统计量 所服从的分布。
三、选择显著性水平,给出拒绝域形式 小概率原理中,关于“小概率”的值通常根据实 际问题的要求而定,如取α =0.1,0.05,0.01等, α 为检验的显著性水平(检验水平). 根据所要求的显著性水平α ,描写小概率事件的 统计量的取值范围称为该原假设的拒绝域(否定 域),一般用W表示;一般将 W 称为接受域。 拒绝域的边界称为该假设检验的临界值.
概率论与数理统计第七章-1矩估计法和极大似然估计法

μ1 h1 (θ1 , θ2 , μ j h j (θ1 , θ2 , μk hk (θ1 , θ2 ,
, θk ) , θk ) , θk )
, μk ) , μk ) , μk )
数理统计
从这 k 个方程中解出
θ1 g1 ( μ1 , μ2 , θ j g j ( μ1 , μ2 , θk gk ( μ1 , μ2 ,
数理统计
定义 用样本原点矩估计相应的总体原点矩 ,
用样本原点矩的连续函数估计相应的总体原点矩的 连续函数, 这种参数点估计法称为矩估计法 . 矩估计法的具体做法如下 设总体的分布函数中含有k个未知参数 θ1 , θ2 , 那么它的前k阶矩 μ1 , μ2 ,
, θk ,
, μk , 一般
l xi P{ X xi ;1 , 2 , , k } l E ( X l ) l 1 hl (1 , 2 , , k ) x l p ( x; , , , )dx 1 2 k
2 1
b μ1 3( μ2 μ12 )
于是 a , b 的矩估计量为
总体矩
a A1 3( A2 A12 ) 3 n 2 X ( X X ) , i n i 1
3 n 2 b X ( X X ) n i 1 i
样本矩
数理统计
例2 设总体 X 的均值 μ和方差 σ 2 ( 0) 都存
数理统计
点估计问题的一般提法 设总体 X 的分布函数 F ( x; )的形式为已
知, 是待估参数 . X 1 , X 2 ,, X n 是 X 的一个样 本, x1 , x2 ,, xn 为相应的一个样本值 .
西北工业大学《概率论与数理统计》课件-第七章 假设检验

装糖重总体 X 的均值和标准差,
由长期实践可知, 标准差较稳定, 设 0.015,
则 X ~ N (, 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 ?
解 1º提出两个对立假设
H0 : 0 0.5 和 H1 : 0 . 2º X 是 的无偏估计量,
则我们拒绝 H0,
反之, 如果 u
x
/
0
n
u,则称 x 与0的差异是 2
不显著的, 则我们接受 H0,
上述关于 x 与 0 有无显著差异的判断是在显 著性水平 之下作出的.
2. 检验统计量
用于检验假设的统计量,称为检验统计量.
如:对于例2, 统计量 U X 0 / n
— 检验统计量.
3. 原假设与备择假设
1 假设 H0 : 0, H1 : 0 ;
2º取检验统计量
U X 0 ~ N (0,1), / n
(当H0为真时)
3º给定显著水平 ( 0< ≤ 0.05)
P{ U u }
2
由
(u
2
)
1
2
,查表可得
u
2
.
拒绝域: W1 {( x1, x2,, xn ) u u }, 2
u U ( x1, x2,, xn )
分析:从直观上分析,这批产品不能出厂. 因为抽样得到的次品率: 2 3% 10 然而,由于样本的随机性,如何才能根据抽
样结果判断总体(所有产品)的次品率是否≤3%?
解 用假设检验法,步骤:
1º提出假设 H0: p 0.03 其中 p为总体的次品率.
2º设
Xi
1, 0,
概率统计7章ppt课件

i1
n
n
xi
n xi
p i1 (1 p) i1
n
n
ln L( p) ln( p) xi ln(1 p)(n xi )
i1
i1
n
n
ln L( p) ln( p) xi ln(1 p)(n xi )
i1
i1
d ln L( p) dp
记为
—— 样本的似然函数
满足条件: 为θ的最大似然估计值; 为θ的最大似然估计量;
具体算法:
令
例1 设x1,x2,…,xn是取自总体 X~b(1, p) 的一个
样本值,求参数p的最大似然估计值。
解 P{X x} px (1 p)1x , x 0,1
n
似然函数为: L( p) pxi (1 p)1xi
Fisher
最大似然法的基本思想:
假定一个盒子中有白、黑球共3个,但不知各有几个, 如果有放回的抽取3次球,发现第1,3次是黑球,第2次 是白球,试估计黑球所占的比例?
准备内容: 当总体X是离散型, 分布律改写为:
以泊松分布为例,
⑴ X 为离散型
分布律为
为X 的样本,
,其中θ未知。 为X 的样本值,
解 1 E(X ) (a b) / 2
2
E(X
2)
D( X
)
E2(X
)
(b a)2 12
(a
b)2 4
令
A1 A2
1 2
a (b a)2 12
b 2A1 (a b)2
4
概率论第七章_课件1_

根据大数定律, 样本原点矩Ar作为 X1r,X2r, ,Xnr的算术平均值依概率收敛到均
值 r=E(Xr), 即:
1
n
n i 1
X
r i
P
E(X
r)
r
7-13
例3 设总体 X ~ N ( , 2 ), X1, X2,…, Xn为总体的
P(X x) p(x, ), x u1, u2, ,
X1, X2,…, Xn为总体 X 的样本, x1, x2,…, xn为总体 X 的样本值,
则X1, X2,…, Xn的联合概率分布为:
P( X1 x1, X2 x2 , , Xn xn )
p( x1, ) p( x2 , ) p( xn , )
7-1
第七章
统计 推断
DE 基本 问题
参数估 计问题
7-2
点估计 区间估 计
假设检 验问题
什么是参数估计?
参数是刻画总体某方面的概率特性的数量.
当这个数量是未知的时候,从总体抽出一个 样本,用某种方法对这个未知参数进行估计 就是参数估计.
例如,X ~N ( , 2), 若, 2未知,通过构造样本的函数, 给出它
ˆ1 ˆ1(x1, x2 , , xn )
ˆ2 ˆ2 (x1, x2 , , xn )
——未知参数1,2, ,k
的矩估计值
ˆk ˆk (x1, x2 , , xn )
矩方法的原理解释
∵ X1, X2 , , Xn 是独立同分布的. ∴ X1r,X2r, ,Xnr也是独立同分布的. 于是有:
《概率论与数理统计》第七章

n
n
ln xi
(4)的极大似然估计量为:ˆ
n
n2 i1
lnX
i
2
i1
第七章 参数估计 ‹#›
例 9 设X~b(1,p), X1,X2,…,Xn是来自X的一个样本, 试求参数p的最大似然估计量
解: 设x1, x2,, xn,是相应于样本X1,X2,…,Xn 的一个样本值,X
的分布律为:
(3)以样本各阶矩A1, ,Ak代替总体各阶矩1,
得各参数的矩估计
ˆi gi(A1, ,Ak ), i 1, , k
, k,
第七章 参数估计 ‹#›
注意:
在实际应用时,为求解方便,也可以用
中心矩 i 代替原点矩i,相应地以样本中心矩Bi 估计 i.
(二)最大似然估计法
最(极)大似然估计的原理介绍
第七章
参数估计
目录/Contents
第1章 随机事件与 2 概率
§ 1 点估计
§3
估计量的评选标准
第七章 参数估计 ‹#›
问题的提出:
在实际进行统计时,有不少总体的(我们关心的某 确定指标)概率分布是已知的。比如
例 1 产品寿命服从的分布
X~
f
(
x)
1
x
e
x0
0
其他
但其中有参数是未知的: θ
n
似然函数 L f xi , 。 i 1
, xn ,
极大似然原理:L(ˆ( x1 ,
,
xn
))
max
L(
).
计算简化方法:
在求L 的最大值时,通常转换为求:lnL 的最大值,
lnL 称为对数似然函数.
利用
概率论第七章课件

小概率事件在 一次试验中基 本上不会发生 .
19
得否定域
W: |t |>4.0322
第四步:
将样本值代入算出统计量 t 的实测值, | t |=2.997<4.0322
没有落入 拒绝域
故不能拒绝H0 .
这并不意味着H0一定对,只是差异 还不够显著, 不足以否定H0 .
2
假设检验的内容
参数检验 非参数检验 总体均值, 均值差的检验 总体分布已知, 检验关于未知 总体方差, 方差比的检验 参数的某个假设 分布拟合检验 总体分布未知时的 符号检验 假设检验问题 秩和检验
假设检验的理论依据
假设检验所以可行,其理论背景为 实际推断原理,即“小概率原理”
3
罐装可乐的容量按标准应在 350毫升和360毫升之间. 生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 把每一罐都打开倒入量 杯, 看看容量是否合于标准? 这样做 显然不行!
1 0.083 0.04 12
若不采用假设检验, 按理不能够出厂.
28
例4某厂生产的螺钉,按标准强度为68/mm2, 而实际生产的强度X 服N(,3.62 ).若E(X) ==68,则认为这批螺钉符合要求,否则认为 不符合要求. 现从生产的螺钉中抽取容量 为36的样本,其均值为 x 68.5 ,问原假设 是否正确?
解 假设
H0 : = 68
H1 : 68
29
3.6 若原假设正确, 则 X ~ N (68 , ) 36
2
因而 E ( X ) 68 ,即 X 偏离68不应该太远, 偏离较远是小概率事件,由于
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章统计量及其分布数理统计学的任务在实际问题中,经常遇到要确定一个随机变量的概率分布或它的某些数字特征。
例确定某厂年生产灯泡的次品率。
灯泡的质量通常用寿命这个指标来衡量,若规定,寿命低于1000小时者为次品,那么确定该厂生产灯泡的次品率可以归结为求灯泡的寿命x这个随机变量的分布函数F(x),因为若F(x)已知,则X(FP=<就是所要确定()10001000)的次品率。
如何确定灯泡寿命x的分布函数呢?一个很自然的想法是:把每个灯泡的寿命都测试出来,根据测试的结果,就可以确定x的分布函数。
然而这种做法在实际中是不可行的,因为灯泡的寿命试验具有破坏性,一旦我们获得所有灯泡的寿命数据,这些灯泡也就全部报废了。
因此,在灯泡寿命试验中,一般只能从整批灯泡中选取若干个来进行测试,这样就产生一个问题,如何从试验所得的部分数据推断整批灯泡的寿命x的分布函数呢?例确定某半导体厂生产的三极管的电流放大倍数X的平均值。
这个问题就是确定X的数字特征E(X)。
此时,测试三极管电流放大倍数虽不会遇到上例中的破坏性问题,但想通过逐个测试来计算算术平均值求得E(X)也是不可取的,因为逐个测试需要耗费大量的人力、物力和时间。
因此,在实际工作中,也只能对其中一部分三极管进行测试。
这样又产生与上例相类似的问题,即如何从试验所得到的部分数据来推断三极管电流放大倍数的平均值呢?从以上两例可以看到,在实际问题中经常需要通过试验所得的部分(或局部)数据来推断整体的种种性质(如分布、数字特征等)。
怎样进行合理的推断呢?这就是数理统计所要解决的主要任务。
由于这种从局部观察去推断整体的方法有着普遍的意义,因此数理统计的方法应用非常广泛,目前已应用于教育科学、工程技术、管理科学、自然科学以及社会科学等领域。
例如,教育科学中的教学质量评估、预测以及试卷质量的评价,工业生产中的产品质量控制于抽样检查,气象学中的天气预报,地震学中地震预报,医学中的疾病分析、药品疗效检验,农业生产中的产品估计于种子优选,人口学中的优生学和人口控制等等都渗透了数理统计的方法。
第一节总体与样本在概率论部分,我们初步研究了随机事件的概率、随机变量及其分布。
在实际问题中,随机现象可以用随机变量来描述。
为了较全面的了解随机变量的规律性,就必须知道它的概率分布,或至少要知道它的一些数字特征,如数学期望、方差等。
用什么方法才能确定出这个随机变量的概率分布或数字特征呢?这是我们十分关心的问题,也是我们所要着眼解决的问题。
由于大量的随机实验必能呈现出随机现象的规律性,因此从理论上说,只要对随机现象进行足够多次的观察,它的规律一定能清楚的呈现出来。
但在实际中,我们只能对随机现象进行有限次的观察或实验,以取得有代表性的观察数据,再对这些数据进行分析,从而找出相应的随机变量的概率分布或数字特征。
一、总体与个体概念:在一个统计问题中,我们把研究对象的全体称为总体,而把组成总体的每一个单元称为个体。
(如同集合与元素的概念)。
总体通常用}{eS=Ω或用}={ω表示。
例如,我们要研究某批灯泡的平均寿命(平均耐用实数)时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体。
在研究某钢铁厂某一天生产的10000根钢筋的强度时,这10000根钢筋就组成一个总体,而每一根钢筋就组成一个个体。
在实际中,我们主要关心的常常是研究对象的某个数据指标)(ωX X =(如灯泡的寿命,钢筋的强度),它是一个随机变量。
例如,总体}{ω=Ω表示参加高考的全体考生,)(ωX X =表示考生ω的高考总分数,因此,ω与数量)(ωX 有对应关系。
各种需要转化为考察分数集}|)({Ω∈ωωX .总体}{ω=Ω的某数量指标)(ωX X =,随机变量X 取值的全体}|)({Ω∈ωωX ,从而研究总体的数量指标,只要研究随机变量X 或X 取值的全体}|)({Ω∈ωωX 。
因此,总体通常是指某个随机变量取值的全体,其中每一个体都是一个实数。
以后我们就把总体和数量指标X 可能取值的全体组成的集合等同起来。
随机变量X 的分布就是总体的分布。
总体就是指随机变量X 或X 的取值集合。
二、 样本与样本值数理统计学中我们总是通过观 测和试验以取得信息.我们可从客观存在的总体(母体)中按机会均等的原则随机地抽取一些个体,然后对这些个体进行观测或测试某一指标X 的数值.这种按机会均等的原则选取一些个体进行观测或测试的过程称为随机抽样.从一个总体X 中(它是数值集合}|)({Ω∈ωωX ),随机的抽取n 个个体(有放回的重复的抽样) nn x X x X x X =⋅⋅⋅==)(,,)(,)(2211ωωω, 其中每个ix 是一次抽样观察(记录)值结果。
我们称n x x x ,,,21⋅⋅⋅为总体X 的一组样本观察值,对于某一次抽样结果来说,它是完全确定的一组数。
但由于抽样的随机性,所以它又是随每次抽样观察而改变的。
记),,,(21n ωωωω⋅⋅⋅=→, 令 i i i x X X ==→)()(ωω n i ,,2,1⋅⋅⋅=, 则n X X X ,,,21⋅⋅⋅都是随机变量; 这样每个i x 都可以看作随机变量i X (n i ,,2,1⋅⋅⋅=)所取的观察值。
我们将n X X X ,,,21⋅⋅⋅称为总体X 的样本,样本中个体的数目n 称为样本容量,n x x x ,,,21⋅⋅⋅就是样本n X X X ,,,21⋅⋅⋅的一组观察值,称为样本值。
由于每次抽取是独立重复的(或可以这样认为),所以n X X X ,,,21⋅⋅⋅是相互独立的随机变量,i X 与总体X 有相同的分布.我们把nX X X ,,,21⋅⋅⋅所有可能取值的全体称为样本空间。
由于我们抽取样本的目的是为了对总体X 的某些特性进行估计、推断,因而要求抽取的样本具有:(1)独立性,(2)与总体X 有相同的分布,这样的样本称为简单随机本,获得简单随机样本的方法称为简单随机抽样。
进行重复抽样所得的随机样本,就是简单随机本.今后,如不作特殊声明,所提到的样本都是简单随机样本。
综上所述,所谓总体就是一个随机变量X ,所谓样本就是n 个相互独立且与X 有相同分布的随机变量n X X X ,,,21⋅⋅⋅。
显然,若总体X 具有分布函数)(x F ,设n X X X ,,,21⋅⋅⋅为来自于总体X 的样本,则n X X X ,,,21⋅⋅⋅相互独立, i X 的分布函数)(}{}{)(i i i i i X x F x X P x X P x F i =≤=≤=, ),,,(21nX X X ⋅⋅⋅的分布函数为 )(),,,(121∏==⋅⋅⋅ni i n x F x x x F .例如,设总体X 服从参数为λ的指数分布,⎩⎨⎧≤>-=-0,00,1)(x x e x F x λ ; nX X X ,,,21⋅⋅⋅为来自于总体X 的样本,则),,,(21nX X X ⋅⋅⋅的分布函数为 )(),,,(121∏==⋅⋅⋅ni i n x F x x x F ⎪⎩⎪⎨⎧>⋅⋅⋅>-=∏=-其它,00,,0),1(11n i n x x x e i λ .第二节 样本矩和统计量(对样本的简单加工、以提取信息)一、 样本矩在考查总体信息时,从总体中的到的样本值nx x x ,,,21⋅⋅⋅,是一堆杂乱无章的数据,需要对其研究加工,才能提取出有用的总体信息。
一般的作法是首先对样本进行简单的加工。
设nX X X ,,,21⋅⋅⋅为来自于总体X 的一个样本,称 ∑==ni iX n X 11, (7.1) 为样本均值;212)(11X X n S ini --=∑= , (7.2) 为样本方差;∑==n i kik X n A 11 为样本k 阶矩(或k 阶原点矩);kini k X X n B )(11-=∑= 为样本k 阶中心矩。
显然,样本均值,样本方差,样本k 阶矩,样本k 阶中心矩都是随机变量。
如果n x x x ,,,21⋅⋅⋅是样本nX X X ,,,21⋅⋅⋅的一组观察值(称为样本值),则∑==ni ix n x 11, 212)(11x x n s ini --=∑= , ∑==n i kik x n a 11 , kini k x x n b )(11-=∑=, 分别是X ,2S ,k A ,k B 的观察值。
总体矩:kk kk EX X E EX EX )(,,-===νμμ等称为总体矩。
人们也许会问:样本矩与相应的总体矩有什么关系?可以证明,只要总体的k 阶矩存在,样本k 阶矩依概率收敛于总体的k 阶矩。
例如 )(,∞→−→−n A k P k μ .二、统计量在研究总体的性质时,除了用到样本外,还要用到由样本构造的某种函数。
为了通过样本来了解总体,我们必须对样本进行加工,以提取其中有益的信息。
所谓对样本进行加工,就是针对不同的统计问题构造一个不含未知参数的样本的连续函数,这样的函数在数理统计学中称为统计量。
定义1 设n X X X ,,,21⋅⋅⋅为总体的一个样本,12(,,,)n G y y y ⋅⋅⋅为一个连续函数,则称样本的函数12(,,,)n G X X X ⋅⋅⋅为一个统计量。
显然,12(,,,)n G X X X ⋅⋅⋅是一个随机变量。
如果n x x x ,,,21⋅⋅⋅是样本nX X X ,,,21⋅⋅⋅的观察值(称为样本值), 则12(,,,)n G x x x ⋅⋅⋅是12(,,,)n G X X X ⋅⋅⋅的观察值。
例如∑==ni iX n X 11,211n i i X n =∑是统计量。
若总体),(~2σμN X ,其中2,μσ是未知参数,而nX X X ,,,21⋅⋅⋅为来自X 的样本,则∑==n i i X n X 11,212)(11X X n S i ni --=∑=是统计量。
而X μσ-,211()n i i X n μ=-∑不是统计量。
二、 顺序统计量与经验分布函数设n X X X ,,,21⋅⋅⋅为来自于总体X 的一个样本,n x x x ,,,21⋅⋅⋅(可以有相等的)是样本观察值。
将观察值按大小次序排列,得到 *1x ≤*2x ⋅⋅⋅≤≤*n x 。
我们规定*k X 取值为*k x ,由此得到的**2*1,,,n X X X ⋅⋅⋅, 称为n X X X ,,,21⋅⋅⋅的一组顺序统计量。
显然,有**2*1nX X X ≤⋅⋅⋅≤≤ 且 i n i X X ≤≤=1*1min , in i n X X ≤≤=1*max .令)(i i X x ω=,),,,(21nωωωω⋅⋅⋅=→, 记函数⎪⎪⎪⎩⎪⎪⎪⎨⎧≥-⋅⋅⋅=<≤<≤<==+→**1**2*1*1,1)1,,1(,,1,0),()(n k kn n x x n k x x x n k x x x n x x x F x F ω显然,)(x F n 是一非减右连续函数,且满足,0)(=-∞n F 和1)(=+∞n F , 由此可见,)(x F n是一个分布函数, 称它为总体X 的经验分布函数或样本分布函数。