概率论与数理统计总结之第六章

合集下载

概率论与数理统计 第6章 数理统计基础

概率论与数理统计 第6章  数理统计基础

【质量控制问题】
某食盐厂用包装机包装的食盐,每袋重量500g, 通常在包装机正常的情况下,袋装食盐的重量X服 从正态分布,均值为500g,标准差为25g.为进行 生产质量控制,他们每天从当天的产品中随机抽 出 30 袋进行严格称重,以检验包装机工作是否正 常.某日,该厂随机抽取30袋盐的重量分别为:
475 500 485 454 504 439 492 501 463 461
464 494 512 451 434 511 513 490 521 514
从这些数据看,包装机的工作正常吗?
449 467 499 484 508 478 479 499 529 480
第6章 数理统计基础
6.1 总体和样本
【数理统计简史】
社会统计学派始于 19 世纪末,首创人物是德国 的克尼斯(K. G. A. Knies),他认为统计学是一 个社会科学,是研究社会现象变动原因和规律性 的实质性科学.各国专家学者在社会经济统计指 标的设定与计算、指数的编制、统计调查的组织 和实施、经济社会发展评价和预测等方面取得了 一系列的重要成果.德国统计学家恩格尔 (C.L.E.Engel,1821-1896)提出的“恩格尔”系 数,美国经济学家库兹涅茨和英国经济学家斯通 等人研究的国民收入和国内生产总值的核算方法 等,都是伟大的贡献.
则X1,X2,X3,X4的联合概率密度为:
f ( x1 , x2 , x3 , x4 ) f ( x1 ) f ( x2 ) f ( x3 ) f ( x4 )
2 xi 16e i 1 , xi 0, i 1,2,3,4 其它 0,
4
6.1.2 样本与抽样
6.1.2 样本与抽样
【例 6.1】设总体 X服从均值为 1/2 的指数分布, X1, X2,X3,X4为来自X的样本,求X1,X2,X3,X4的 联合概率密度和联合分布函数.

概率论与数理统计第六章

概率论与数理统计第六章

概率论与数理统计第六章一、估计及其性质“估计”在中文里既可以作名词,也可以作动词。

用英文的话,可以表示成不同的单词:estimate:所谓的“估计”(动词)就是根据样本预测总体分布中的未知参数。

例如,已知总体服从正态分布[公式] ,但总体均值[公式] 未知,我们通过某个函数“估计”总体均值,[公式] 。

estimator:“估计量”(名词)[公式] 实际上是一个统计量,它是通过一个不含未知参数的样本函数计算出来的结果。

一般使用[公式] 表示总体的参数,[公式] 表示参数的估计量。

estimation:“估计法”(名词)表示寻找函数[公式] 的过程,可以理解为一种估计方法。

例如:Maximum Likelihood Estimation,最大似然估计法。

随着样本不同,同一估计法得到的结果可能是不一样的,因此“估计量”也是一个随机变量。

对于同一个参数,有不同的估计方法,而且看起来都是合理的。

如何比较它们的优劣呢?(1)均方误差MSE Mean Square Error评价一个估计量的好坏,很自然地会想到:衡量“估计量”与“真实值”之间的距离,距离越小表示估计量的性能越好。

也就是所谓的“均方误差”函数:[公式] 也就是距离平方的期望值,如果将其进一步展开:[公式]注意:[公式] 和[公式] 均为数值,[公式] 表示参数的真实值,[公式] 表示估计量的数学期望。

由此看见,均方误差由两部分组成:一是估计量的方差(Variances),即[公式] ;二是估计量的系统偏差(Bias)的平方,即[公式] 。

从“马同学”处借来此图,它可以帮助理解“方差”与“偏差”:备注:靶心表示“真实值”,红叉表示“估计值”“方差”衡量估计值的分散程度,“偏差”衡量估计值的期望与真实值的距离。

左上图:估计值落在靶心四周,此时“方差”较大但“偏差”较小;右上图:估计值落在靶心邻近,此时“方差”、“偏差”均较小;左下图:估计值离靶心较远,呈分散状,此时“方差”、“偏差”均较大;右下图:估计值离靶心较远,落点集中,此时“偏差”较大但“方差”较小。

概率论与数理统计 第六章 参数估计

概率论与数理统计 第六章 参数估计

解此方程即可.值得注意的是,由极值的必要条件知极大似 然估计一定是似然方程的解.但似然方程组的解未必是极 大似然估计,严格地讲,对似然方程组的解要经过验证才能 确定是否是极大似然估计.
概率论与数理统计
例6 设总体 X 服从指数分布,它的密度为
x 1 −θ e , x>0 p ( x;θ ) = θ 0, x≤0
概率论与数理统计
例6.1.1 对某型号的20辆汽车记录其每5L汽油的 行驶里程(公里),观测数据如下: 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9 试求总体均值、方差和中位数的估计值.
1 n θˆ = ∑ X i = X n i =1
是来自总体 P(λ ) 的一个子样, 例7 设 X 1,X 2, ,X n) ( ⋯ 求λ 的极大似然估计量. 的观测值. ( ⋯ ( ⋯ 解: 设 x1,x2, ,xn)为子样 X 1,X 2, ,X n) λ x −λ ∵ P( X = x) = e , x! 所以,似然函数为 n n λ x − λ − nλ n λ x L( x; λ ) = ∏ P(X =xi ) = ∏ e =e ∏
求极大似然估计的方法
概率论与数理统计
L 1. 设似然函数 (x;θ)为θ 的连续函数,且关于θ 各分量 的偏导数存在因为lnL与L的最大点相同,而lnL比L使用方便, 所以常常求lnL的最大点.
设θ 是k维的,Θ是R k中的开区域,则由极值的必要条件有
∂ ln L( x,θ ) = 0, i = 1, 2,⋯ , k . ∂θ i
则P( A)的矩估计量为X .

(精选)概率与数理统计第六章

(精选)概率与数理统计第六章
2) 在原假设成立的前提下,选择检验统计量,并确定其分布
常用的统计量的分布为:N (0,1), t 分 布 , 2 分 布 , F 分 布 3)确定拒绝域: 根据小概率原理确定拒绝原假设的区域.
即确定满足 P (拒 绝 H 0|H 0 为 真 )拒绝域W.
4)作出统计推断:计算检验统计量的观测值. 若检验统计量的值落入拒绝域,则拒绝原假设 若检验统计量的值未落入拒绝域,则接受原假设
(2)在原假设 H 0 为真的前提下,确定统计量
UX X30390~N(0,1)
n
25
(3)确定拒绝域 W{Uu0.05}{U1.645}
6.2.2 单个正态总体方差的假设检验
6.1 假设检验的基本概念
例 用某种动物作试验材料,要求动物的平均体重 100g,若 100g 需要再饲养;若 100g则应淘汰.又知动物体重服从正态分布,且由 以往经验知 1.5g ,现从一批待试验的动物中,随机抽取8只,称 得体重(g)为:99.3 98.9 101.5 101.0 99.6 98.7 102.2 100.8
所以
X
~
N
(0,1)
n
6.2.1 单个正态总体均值的假设检验
y 对于给定的显著性水平 ,确定拒绝域W
① H 0 : 0 , H 1 : 0
W{|U|u}
2
2
u

2
2
u
2

② H 0 : 0 , H 1 : 0
W{Uu}
③ H 0 : 0 , H 1 : 0
W{Uu}
x y

6.2.1 单个正态总体均值的假设检验
H0:0100, H1:100
在原假设为真时选统计量

概率论与数理统计第六章样本及抽样分布}第二节:样讲义本分布函数直方图

概率论与数理统计第六章样本及抽样分布}第二节:样讲义本分布函数直方图

其中和式
xi
是对小于或等于
x
x
的一切
x(i)
的频率
fi
求和,
则称 Fn(x)为样本分布函数,经验分布函数。
2. 样本分布函数Fn(x)具有下列性质:
(1) 0 ≤ Fn(x) ≤1 (2) Fn(x)是非减函数
(3 )F n 0 , F n 1
(4) Fn(x)在每个观测值 x(i)处是右连续的, 点 x(i)是 Fn(x)的跳跃间断点, Fn(x)在该点的跃度就等于频率fi
并以各子区间为底, 以 fi /(ti - ti-1)为高作小矩形,
各个小矩形的面积 ∆Si 就等于样本观测值落在该子区间内的频率,
即:
S ititi 1 ti fiti 1fi,l
i1 ,2, ,l.
l
所有小矩形的面积的和: Si fi 1.
i1
i1
这样作出的所有小矩形就构成了直方图。
写出零件质量的频率分布表并作直方图。
解: 因为样本观测中最小值为 237, 最大值为 265, 所以我们把数据的分布区间确定为: (236.5, 266.5)
并把这个区间等分为 10个子区间:
(236.5, 239.5), (239.5, 242.5), …, (263.5, 266.5)
数理统计
由此得到零件质量的频率分布表:
因为样本容量 n充分大时, 随机变量 X的取值落在 各个子区间 (ti-1 - ti)内的频率近似等于其概率, 即:
f i P t i 1 X t i,i 1 ,2 , ,l
所以直方图大致地描述了总体X的概率分布。
例2: 测量100个某种机械零件的质量, 得到样本观测值如下(单位:g):

西北工业大学《概率论与数理统计》课件-第六章 参数估计

西北工业大学《概率论与数理统计》课件-第六章 参数估计
最大概率的思想就是最大似然法的基本思想 .
(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L

ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为

概率论与数理统计第六章样本及抽样分布第一节:总体与样本.ppt

概率论与数理统计第六章样本及抽样分布第一节:总体与样本.ppt

例2: 检验一批灯泡的寿命,从中选择100只,则: 总体: 这批灯泡(有限总体)
个体: 这批灯泡中的每一只 样本: 抽取的100只灯泡 样本容量: 100 样本值: x1, x2,…, x100
数理统计
二、简单随机抽样
数理统计
1. 若从总体 X 中抽取样本 X1, X2,…, Xn,满足: 1) 随机性:总体中每一个个体都有同等机会被选入, 即样本 Xi 与总体 X 有相同的分布; 2) 独立性:样本中每一样品的取值不影响其它样品的取值, 即 X1, X2,…, Xn 相互独立; 这种随机的、独立的抽样方法称为简单随机抽样。 由简单随机抽样得到的样本称为简单随机样本。
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体
一、总体和样本
数理统计
1. 总体——研究对象全体元素组成的集合. 所研究的对象的某个(或某些)数量指标的全体, 它是一个随机变量(或多维随机变量), 记为 X. 总体有三层含义: 研究对象的全体;全部数据; 分布. 2. 个体——组成总体的每一个元素. 即某个数量指标的全体中的一个, 可看作随机变量 X 的某个取值, 用 Xi 表示.
数理统计
第六章 样本及抽样分布
第一节 总体与样本 第二节 样本分布函数 直方图 第三节 样本函数与统计量 第四节 抽样分布
数理统计
数 理 统 计 的 分 类
描述统计学
对随机现象进行观测、试验,以取得有代表性 的观测值,并对已取得的数据进行归纳整理、画 出统计图表,来反映研究对象的数据分布特征.
推断统计学
数理统计方法具有“部分推断整体”的特征 .
数理统计
第一节 总体与样本

概率论与数理统计第6章

概率论与数理统计第6章

以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X

i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 样本及抽样分布 总体与个体:
我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体
设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值
由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为
,,(21*
x x F …)(),1
∏==n
i i n x F x
又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为
,,(21*
x x f …).(),1
∏==n
i i n x f x
设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量
设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:
样本平均值
∑==n
i i X n X 1
1
样本方差
⎪⎭
⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 122212
11)(11
样本标准差
∑=--==n
i i X X n S S 1
22
)(11 样本k 阶(原点)矩
,2,1,11
==∑=k X n A n i k
i k …
样本k 阶中心矩
,3,2,)(11
=-=∑=k X X n B k n
i i k …
经验分布函数
设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。

定义经验分布函数)(x F n 为∞<<-∞=
x x S n
x F n ),(1
)( 一般,设,,21x x …n x ,是总体F 的一个容量为n 的样本值,先将,,21x x …n x ,按自小到大的次序排列,并重新编号,设为()()≤≤21x x …()n x ≤, 则经验分布函数)(x F n 的观察值为 0,若(),1x x < =)(x F n k/n,若()(),1+<≤k k x x x 1,若().n x x ≥
统计量的分布称为抽样分布
几个常用的统计量的分布: 1.2χ分布
设,,21X X ...n X ,是来自总体N (0-1)的样本,则称统计量++=22212X X χ (2)
n
X +服从自由度为n 的2χ分布,记为2χ~)(2n χ,自由度是指上式右端包含的独立变量的个数
)(2n χ分布的概率密度为
=)(y f
,0,)
2/(212
/12/2
/>Γ--y e y n y n n 0,其它
若,,21X X …n X ,相互独立,且i X 服从参数为,2,1(,=i i βα…),n 的Γ分布,则
++21X X …n X +服从参数为βα,1∑=n
i i 的Γ分布,这一性质称为Γ分布的可加性
2χ分布的性质:
1)2χ分布的可加性
设21χ~2212),(χχn ~),(22n χ并且21χ22,χ独立,则有2
221χχ+~).(212n n +χ
2)2χ分布的数学期望和方差
若2χ~)(2n χ,则有.2)(,)(22n D n E ==χχ 证明:事实上,因i X ~N(0,1),故 ,1)()(2==i i X D X E
[]
n i X E X E X D i i i ,^,2,1,213)()()(2
242==-=-= 于是
.
2)()(,
)()(1
21221
2122
n X D X D D n X E X E E n i i n i i n
i i n i i ==⎪⎭⎫
⎝⎛===⎪⎭⎫ ⎝⎛=∑∑∑∑====χχ
3)2χ分布的分位点
对于给定的正数ɑ,0<ɑ<1,称满足条件
⎰∞
==>)
(2
22
)()}({n dy y f n P αχααχχ的点)(2
n α
χ为)(2n χ分布的上ɑ分位点
2.t 分布
设X ~N(0,1),Y ~)(2n χ,且X,Y 独立,则称随机变量n
Y X
t /=

服从自由度为n 的t 分布,记为t ~t(n) t 分布又称学生氏分布
t(n)分布的概率密度函数为
[]∞<<-∞⎪⎪⎭

⎝⎛+Γ+Γ=+-t n t n n n t h n ,1)2/(2/)1()(2
/)1(2π
利用Γ函数的性质可得,2
/221)(lim t n e t h -∞
→=
π
故当n 足够大时t 分布近似于N (0,1)分布,但相对于较小的n,t 分布于N(0,1)分布相差较大
t 分布的分位点
对于给定的ɑ,0<ɑ<1,称满足条件⎰∞==>)
()()}({n t dt t h n t t P ααα的点)(n t α为)
(n t 分布的上ɑ分位点。

由t 分布上ɑ分位点的定义及h(t)图形的对称性知,)()(1n t n t αα-=-
3.F 分布
设U ~V n ),(12χ~),(22n χ且V U ,独立,则称2
1
//n V n U F =服从自由度为),(21n n 的F 分布,记为F ~),(21n n F
),(21n n F 分布的概率密度为
ϕ [][],0,)/(1)2/()2/()(2/)(2
/)(21211
)2/(2/21212111>+ΓΓ++Γ+-y n y n n n y n n n n n n n n ,0其它
F 分布的分位点
对于给定的ɑ。

0<ɑ<1,称满足条件⎰
∞==>)
,(2121)()},({n n F dy y n n F F P ααϕα的点
),(21n n F α为),(21n n F 分布的上ɑ分位点
F 分布的上ɑ分位点有如下重要性质:)
,(1
),(12211n n F n n F αα=-
设总体X (不管服从什么分布,只要均值和方差存在)的均值为μ,方差为2σ,
,,21X X …n X ,是来自X 的一个样本,2,S X 是样本均值和样本方差,则总有
./)(,)(2n X D X E σμ==
而⎥⎦⎤⎢⎣⎡--=⎥⎦⎤⎢⎣
⎡⎪⎭⎫ ⎝⎛--=∑∑==n i i n i i X nE X E n X n X n E S E 1221222
)()(1111)( ,)/()(112
12222σμσμσ=⎥⎦⎤⎢⎣⎡+-+-=∑=n i n n n 即.)(22σ=S E
进而,设X ~N ),(2
σμ,则∑==n
i i X n X 1
1也服从正态分布,于是得到下面的定理:
定理一:
设,,21X X …n X ,是来自正态总体N ),(2σμ的样本,X 是样本均值,则有
X ~)/,(2n N σμ
对于正态总体N ),(2σμ的样本均值X 和样本方差2S ,有以下两个重要定理 定理二:
设,,21X X …n X ,是总体N ),(2σμ的样本,X ,2S 分别是样本均值和样本方差,则有 1.
2
2
)1(σ
S n -~);1(2-n χ
2.X 与2S 独立 定理三:
设,,21X X …n X ,是总体N ),(2σμ的样本,X ,2S 分别是样本均值和样本方差,则有
n
S X /μ
-~)1(-n t 定理四:
设,,21X X …1n X 与,,21Y Y …2,n Y 分别是来自正态总体),(211σμN 和),(2
22σμN 的样
本,且这两个样本相互独立。

设∑∑===
=2
11
2
111,1n i i n i i Y n Y X n X 分别是这两个样本的样
本均值;21
22
22112
1
)(11,)(1121Y Y n S X X n S n i i n i i --=--=∑∑==分别是这两个样本的样本方差,则有
1.22
212
2
21//σσS S ~);1,1(21--n n F 2.当,22
221σσσ==
()()2
121
11n n S Y X +---ω
μμ
~),2(21-+n n t
其中2
212
222112
,2
)1()1(ω
ωωS S n n S n S n S =-+-+-=
[文档可能无法思考全面,请浏览后下载,另外祝您生活愉快,工作顺利,万事如意!]。

相关文档
最新文档