概率论和数理统计 估计量的评选标准和区间估计
概率论与数理统计的考试重难点

概率论与数理统计的考试重难点万学*海文数学教研室——李兰巧2011年的考试大纲已经出炉,11年大纲概率部分和10年完全没有区别,所以考生在复习的时候可以按照既定计划进行复习即可。
概率与数理统计这门课程从试卷本身的难度的话,在三门课程中应该算最低的,但是从每年得分的角度来说,这门课程是三门课中得分率最低的,由于它的概念比较多,式子比较复杂,尤其是统计部分,很多同学在初学的时候都会被吓住,有的会选择放弃学概率。
其实是非常不明智的,因为我总结这门课的最大特点是,题型比较单一,解题手法也比较单一,比如大题基本上就围绕在随机变量函数的分布,随机变量的数字特征,参数的矩估计和最大似然估计这几块。
这在《全国硕士研究生入学统一考试数学120种常考题型精讲》中重点介绍了相关题型,并且给出了独特和详细的求解步骤,考生认真学习后,必能轻松过关。
这门课程,很多同学觉得难,难在两点,一是古典概率,那块儿的计算一不小心就数错了,或者是不知道怎么来数数,其实这个大家放心,考研只会考简单的古典概率的计算,复杂的不会考,所以这部分可以很快通过;二是数理统计部分,这部分式子比较复杂,很多人学到这里就脑袋大,其实不用担心,这部分需要你真正去记忆的很少。
概率论与数理统计一共是八章,前五章是概率论,数学一、数学三都要考的。
数理统计是后面三章,数学一和数学三是要考的,但是估计量的评选标准、置信区间和假设检验只有数学一要求。
作为前面五章的概率论,我简单介绍一下。
第一章随机事件和概率,是后续各章的基础。
它的重点内容主要是事件的关系和运算,古典概型和几何概型,加法公式、减法公式、乘法公式、全概公式和贝叶斯公式。
第一章很少单独命题,经常是结合随机变量来考察的。
09年、10年连续两年利用古典概型结合随机变量已解答题的形式考察了。
第二章一维随机变量及其分布,这部分的重点内容是常见分布,同时它是学习二维随机变量的基础。
近几年考察一维随机变量的题目相对减少,更多的是考察二维随机变量的有关题目第三章二维随机变量,是考试的重点之重点。
高等教育自学考试 概率论与数理统计期末自学 复习重要知识点

概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布): 若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x p p ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)).两点分布的概率分布:{}(1),0,1,...,.k k n kn P x k C p p k n -==-= 二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
概率论与数理统计复习7章

( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
数理统计中的参数估计与置信区间估计

数理统计中的参数估计与置信区间估计数理统计是概率论、数学统计和实证研究的基础,它研究的是通过观测和实验来获取数据,从而对总体的特征进行推断和估计的方法和理论。
在数理统计中,参数估计和置信区间估计是两个重要的概念和方法,用于对总体参数进行推断和估计。
一、参数估计参数估计是指通过样本数据对总体参数进行估计的方法。
总体参数是指总体的某个特征或指标,如均值、方差等。
参数估计可以分为点估计和区间估计两种方法。
1. 点估计点估计是指使用样本数据来估计总体参数的一个具体值,这个估计值被称为点估计量。
常用的点估计量有样本均值、样本方差等。
点估计的目标是使得估计值尽量接近真实的总体参数,即具有无偏性和有效性。
无偏性是指估计值的期望等于真实参数,有效性是指估计值的方差最小。
无偏性是一个重要的性质,它保证了估计值在大样本下趋近于真实值。
有效性则是在无偏估计的前提下,使估计值的方差最小,从而提高估计的准确性。
2. 区间估计区间估计是指通过样本数据得到总体参数的一个范围,这个范围被称为置信区间。
置信区间表示了总体参数的估计精度和可信程度。
在构造置信区间时,需要指定置信水平,常用的置信水平有95%和99%等。
置信水平为95%表示在大量重复抽样中,有95%的置信区间会包含真实的总体参数。
构造置信区间的方法有很多,如正态分布的置信区间、t分布的置信区间等。
不同的方法适用于不同的总体分布和样本信息。
在实际应用中,要根据具体的问题和数据的特点选择合适的置信区间方法。
二、数理统计中的应用参数估计和置信区间估计在数理统计中有广泛的应用,可以用于推断和估计各种领域的问题。
1. 总体均值的估计当我们要估计总体的均值时,可以使用点估计和区间估计的方法。
点估计是通过样本均值来估计总体均值,区间估计则是给出总体均值的一个范围。
2. 总体比例的估计当我们要估计总体的比例时,例如某种特征在总体中出现的比例,也可以使用点估计和区间估计的方法。
点估计是通过样本比例来估计总体比例,区间估计则是给出总体比例的一个范围。
概率论与数理统计-第6章-第4讲-区间估计

本讲内容
01 置信区间定义 02 求置信区间的步骤 03 几点说明
02 求置信区间的步骤
例 设X1,…Xn 是取自 N (, 2 ) 的样本, 2已知,
求参数 的置信水平为 1 的置信区间.
明确问题:求什么参数的置信区间?置信水平是多少?
解 选 的点估计为 X
寻找未知参数的
取 U X N (0,1) 一个良好估计 n
u
2} 1
1
为什么 这样取?
u
u
2
2
8
02 求置信区间的步骤
从中解得
P{|
X
n
|u2}源自1P{Xn u 2
X
n
u
2}
1
于是所求 的 置信区间为
[X
n u 2 ,
X
n u
2]
也可简记为 X n u 2
从例题的过程,我们归纳出求置信区间的
一般步骤如下:
1
u
u
2
2
9
02 求置信区间的步骤
求置信区间的步骤
10
本讲内容
01 置信区间定义 02 求置信区间的步骤 03 几点说明
03 几点说明
1. 要求 θ 以很大的可能被包含在 [θˆ1, θˆ2 ]
内,P(ˆ1 ˆ2 ) 1 要尽可能大.
即要求估计尽量可靠. 2. 估计的精度要尽可能的高. 如要求区间
长度 θˆ2 θˆ1 尽可能短.
置信度与精度是一对矛盾,当样本容 量固定时,置信度越高,则精度越差.
u
u
2
2
区间的长度为 2u —— 达到最短
2n
14
03 几点说明
特别说明
即使在概率密度不对称的情形,如
《概率论与数理统计》学习笔记十一

σ 2 = S2 =
2 1 n Xi − X ) ( ∑ n i =1
n −1 2 ⎛ n −1 2 ⎞ n −1 S ⎟= E (S2 ) = 由于 E σ 2 = E S 2 = E ⎜ σ , n n ⎝ n ⎠
n 3 ⎡ X 2 − nX 2 ⎤ ∑ i ⎥ n⎢ ⎣ i =1 ⎦
3 ( X − X )2 i n∑ i =1
n
在总体 X 为离散型随机变量情形, 求未知参数 θ 的矩估计量的方法和连续型 情形完全相同。 极大似然估计法 直观想法:概率最大的事件最可能出现。 设总体 X 为连续型随机变量,具有密度函数 f ( x;θ ) ,其中 θ 是待估未知参 数,又设 ( x1 ,L , xn ) 是样本 ( X 1 ,L , X n ) 的一个观测值,则样本 ( X 1 ,L , X n ) 落在观
n
(1)
ˆr , 把上式中的 α r 都换成相应的样本矩 M r = 1 ∑ X ir ,便得到参数 θ r 的矩估计量 θ n i =1
概率论与数理统计—学习笔记十一
即
θˆr = hr ( M 1 ,L , M k ) , r = 1, 2,L , k .
(2)
这种求估计量的方法称为矩估计法(简称矩法) ,由矩估计法得出的估计量称为 矩估计量。 例1 设总体 X 在 [ a, b ] 上服从均匀分布,a,b 未知, X 1 ,L , X n 是总体 X 的 一个样本,试求 a,b 矩估计量。 解 X 的概率密度为 1 , a≤ x≤b ⎧ ⎪ f ( x; a, b ) = ⎨ b − a ⎪ 其它 ⎩ 0,
上节介绍了总体参数的常用点估计方法,对同一参数用不同的估计方法可能 得到不同的估计量,哪个估计量更好些呢?下面给出几种评选估计量好坏的标 准。 无偏估计 估计量是样本的函数,是随机变量,对不同的样本观测值,它有不同的估计 值,我们希望估计量的取值在未知参数真值附近摆动,即希望估计量的数学期望 等于未知参数的真值,这就是无偏性的概念。 定义 设 θˆ ( X 1 ,L , X n ) 是未知参数 θ 的估计量,若
参数的矩估计及评价标准
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
衡量点估计量好坏的标准
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
1.无偏性
ˆ ˆ( X1, X 2 ,, X n ) 的数学期望 设参数 的估计量 存在且等于 ,即 ˆ) , E (
则称 ˆ 是 的无偏估计量.
目录 上一页 下一页 返回 结束
概率论与数理统计(第三版)龙永红
复习知识点
1. 事件间的关系与运算,概率的公理化定义, 概率的性质,古典概率,条件概率,乘法公式, 全概率公式、贝叶斯公式,事件的独立性; 书上相关内容,例题1.9,1.11,1.15, 1.16, 1.20 , 1.23, 1.25, 1.26及课后练习P14 4、5, P20 3, P29 9,P35 习题一 7.
ˆ2 有效. ˆ1 比 则称
ˆ) 最小, 则 如果对于给定的样本容量n ,ˆ 的方差 D( 称 ˆ 是 的有效估计量.
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
3.一致性(不作要求)
如果 n 时,ˆn 按概率收敛于 , 即对于任意给定 的正数 ,有
n
ˆn ) 1, lim P(
ˆ( X1 , X 2 ,, X n ) 作为未知参数的估计量; 选择适当的统计量
ˆ( x1 , x2 ,, xn ) 作为未知参数 的估计值. 相应的观测值
概率论与数理统计(第三版)龙永红
目录
上一页
下一页
返回
结束
1.矩估计法
设总体 X 的分布中含有未知参数 1 , 2 ,, m , 假定 总体X 的 1 ,2 , ,m 阶原点矩都存在,
概率论与数理参数估计
概率论与数理参数估计参数估计是概率论与数理统计中的一个重要问题,其目标是根据样本数据推断总体的未知参数。
参数估计分为点估计和区间估计两种方法。
点估计是通过样本计算得到总体未知参数的一个估计值。
常见的点估计方法有最大似然估计和矩估计。
最大似然估计是通过观察到的样本数据,选择使得观察到的样本数据出现的概率最大的未知参数值作为估计值。
矩估计是通过样本的矩(均值、方差等统计量),与总体矩进行对应,建立样本矩与总体矩之间的方程组,并求解未知参数。
这两种方法都可以给出参数的点估计值,但是其性质和效果不尽相同。
最大似然估计具有渐近正态性和不变性,但是可能存在偏差较大的问题;矩估计简单且易于计算,但是可能存在方程组无解的情况。
区间估计是给出参数估计结果的一个范围,表示对未知参数值的不确定性。
常见的区间估计方法有置信区间和预测区间。
置信区间是指给定的置信水平下,总体参数的真值落在一些区间内的概率。
置信区间的计算依赖于样本的分布和样本量。
预测区间是对一个新的观察值进行预测的区间,它比置信区间要宽一些,以充分考虑不确定性。
在参数估计过程中,需要注意样本的选取和样本量的确定。
样本是总体的一个子集,必须能够代表总体的特征才能得到准确的估计结果。
样本量的确定是通过统计方法和实际需求来确定的,要保证估计结果的可靠性。
参数估计在实际应用中有着广泛的应用。
例如,在医学领域中,通过对病人的样本数据进行统计分析,可以推断患者患其中一种疾病的概率,进而进行治疗和预防措施的制定。
在金融领域中,可以通过对股票的历史价格进行统计分析,推断未来股价的变动趋势,从而进行投资决策和风险评估。
在市场调研中,可以通过对消费者的问卷调查数据进行统计分析,推断消费者的偏好和需求,为企业的市场开发和产品设计提供依据。
综上所述,概率论与数理统计中的参数估计是一门重要的学科,通过对样本数据的统计分析,可以推断总体的未知参数,并对不确定性进行评估。
参数估计在实际应用中有着广泛的应用,对于科学研究和决策制定具有重要的意义。
《概率论与数理统计》第七章
n
n
ln xi
(4)的极大似然估计量为:ˆ
n
n2 i1
lnX
i
2
i1
第七章 参数估计 ‹#›
例 9 设X~b(1,p), X1,X2,…,Xn是来自X的一个样本, 试求参数p的最大似然估计量
解: 设x1, x2,, xn,是相应于样本X1,X2,…,Xn 的一个样本值,X
的分布律为:
(3)以样本各阶矩A1, ,Ak代替总体各阶矩1,
得各参数的矩估计
ˆi gi(A1, ,Ak ), i 1, , k
, k,
第七章 参数估计 ‹#›
注意:
在实际应用时,为求解方便,也可以用
中心矩 i 代替原点矩i,相应地以样本中心矩Bi 估计 i.
(二)最大似然估计法
最(极)大似然估计的原理介绍
第七章
参数估计
目录/Contents
第1章 随机事件与 2 概率
§ 1 点估计
§3
估计量的评选标准
第七章 参数估计 ‹#›
问题的提出:
在实际进行统计时,有不少总体的(我们关心的某 确定指标)概率分布是已知的。比如
例 1 产品寿命服从的分布
X~
f
(
x)
1
x
e
x0
0
其他
但其中有参数是未知的: θ
n
似然函数 L f xi , 。 i 1
, xn ,
极大似然原理:L(ˆ( x1 ,
,
xn
))
max
L(
).
计算简化方法:
在求L 的最大值时,通常转换为求:lnL 的最大值,
lnL 称为对数似然函数.
利用
《概率论与数理统计》教学大纲
《概率论与数理统计》教学大纲课程编号:SC2113010课程名称:概率论与数理统计英文名称:Probability and Statistics 学时:46 学分:3课程类型:必修课程性质:公共基础课先修课程:高等数学、线性代数开课学期:第3学期适用专业:工、理(物理,化学)、经管类各专业开课院系:全校各院系(人文学院及数学系除外)一、课程的教学目标概率论与数理统计是研究随机现象统计规律性及对这种客观规律性的观察组织和科学估计与判断的一门数学分支学科。
由于该学科理论严谨,应用广泛,因而已成为现代工程技术与社会经济管理人员必须掌握的一种技术工具及我校理、工、经、管各专业的公共基础课。
通过本课程的学习,要使学生掌握概率统计的基本概念,必要的基础理论,分析思想和常用的计算方法,从而为后继课程的学习和今后从事相关科研活动奠定基础。
二、课程的需求与任务本课程的需求与任务为:(a)为理、工、经、管各专业的后继专业基础课和专业课(如随机过程、随机运筹学、统计信号处理、随机信号分析、统计模式识别、雷达系统仿真与性能评估、统计物理、计量经济学等)提供概念、理论基础和应用方法支持;(b)为今后从事的各种随机动态系统(如通信系统、雷达系统、计算机控制系统等)的规划论证、系统分析、设计、仿真、决策与控制研究提供数学思想和数学方法支持。
三、课程内容及基本要求(一)概率论的基本概念(6学时)内容:随机试验、样本空间与随机事件;频率与概率;古典概型与几何概型;条件概率与独立性。
基本要求:(1)理解样本空间,随机事件的概念,掌握事件的关系与运算。
能熟练运用事件的和,积,差运算表示未知的事件。
(2)了解概率的公理化体系及概率论的发展历史,掌握概率的基本性质。
熟练掌握概率的加法公式。
会计算古典概型和几何概型问题的概率。
(3)了解条件概率的概念,熟练掌握概率的乘法公式、全概率公式和Bayes 公式。
(4)了解事件独立性的概念,掌握用事件独立性进行概率计算。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故
E(S 2 )
1 n1
n(
2
2)
2
n( n
2
)
2
2
说明:
若用样本二阶中心矩 B2作2 的估计量,是有偏估计。这是因为
E(M2 )
E(
n n
1
S2)
n 1 E(S2) n 1 2
n
n
所以,
一般总取
S2
1 n1
n
作( X为i X2)的2 估计量。
13
4、应用举例
请准备好练习本
例2 已知样本值为(3.3,-0.3,-0.6,-0.9),求
(1) 当=3时,正态总体均值的95置信区间; (2) 当未知时,正态总体均值的95置信区间。
解: 由样本值计算可得 x 0.375, s 1.965
(1) 当=3时, 因为 U X / n
含有由2(P而{不12含 有(n其 它1) 未 (n
知参数)的样2 本函数
1)S
2
2
2
(n
1)}
1
2
2 (n 1) 1 2
可得2的(1-)置信区间为
(n 1)S 2
2
(n
1)
,
2
(n 1)S 2
2 1
2
析:要判断两工厂生产质量水平的差异,首先需要比较两总体的均值
的大小,以反映平均质量水平的高低;其次还可以比较总体方差的大 小,以反映质量水平波动的程度。
先估计总体均值差1-2的大小:
虽然未知方差是否相等,但因样本容量较大,故近似地有
( X 1 X 2 ) ( 1 2) ~ N (0,1)
故 P{ Z 0.05 U Z 0.05 } 0.95
2
2
~ N(0,1) P{1.96 X 1.96} 0.95 3/2
P{ X 2.94 X 2.94} 0.95
所以,均值的95置信区间为 ( X 2.94, X 2.94) 代入样本值可得 (2.565, 3.315)
i 1
解: E[c n1 ( X i1 X i )2 ]
? n1
c 2 E[( X i1 X i )2 ]
?
c
n1
[E(
X
i1
X
i
)]2
i 1
i 1
n1
i 1
0
D(Y ) E(Y 2 ) E 2(Y )
c {D( X i1 X i ) [E( X i1 X i )]2
两个总体的情形:
12、22都已知,估计1-2
12、22都未知但大样本时, 可用S12、S22代替它们,近
似的服从N(0,1).
用 ( X Y ) ( 1 2) ~ N (0,1)
2 1
2 2
n1 n2
12
❖ 12、22都未知,但12=22=2,估计1-2
n
, 而 D(Xi)=2, 故随着n 的增大,
X 较单一的Xi 有效得多。
5
3、相合性
若n→∞时,
依概,率就称
是相合ˆ 估计量。
例如 可以证明,样本的k阶矩是总体k阶矩的相合估计量,等等。
通常,人们首先考虑的往往是无偏性和有效性,只有 在n 很大时,才考虑相合性.
仅基于以上常用的评选标准,也可以发现不同的估计法所 构造出的统计量,各有自己的特点。
F
S12
2 2
S22
2 1
~
F (n1
1, n2
1)
知
P{F
1
(n1
1,
n2
1)
F
F
(n1
1, n2
1)}
1
2
2
由此可得12/22的置信区间:
(
S12 S22
F (n1
1 1, n2
, 1)
S12 S22
1 F1 (n1 1, n2
) 1)
(
n
1)
2
2
(n
1)
2
11
3、正态总体均值与方差的置信区间:
单个总体的情形:
(§5 )
2已知,估计
用 U X ~ N(0,1) / n
❖ 2未知,估计
用 V ( X ) n ~ t(n 1).
S
估计2
用
Y
n1
2
S2
~
2 (n 1);
请您注意学习解题过程的写法!
14
(2)当未知时,
由 V ( X ) n ~ t(n 1).
S
知 P{t 0.05 V t 0.05 } 0.95
2
2
查表可得 t 0.05 (4 1) t0.025 (3) 3.182
2
P{3.182 X 3.182} 0.95
i 1
n1
ED( XXii11XXi i))cED[(D(XX(iXi1)i1)1)ED(DX((i )XXi i)0]) i 1
2 2 (n 1)c
n1
要 使 E[c ( X i1 X i )2 ] 2 i 1
应取
c 1 2(n 1)
§2 估计量的评选标准
针对总体的同一个参数,可以用各种不同方法对之 进行估计;根据实际应用的需要,对于这些不同的估计 量,有着不同的选择标准,其中较为基本的评选标准为: 无偏、有效和相合。
1
1、无偏性 设 ˆ ˆ(X1, X2, , Xn ) 为未知参数 的估计量,
若E(ˆ) , 则 称ˆ 是 的 无 偏 估 计 量.
S12 S22 n1 n2
由此可得1-2置信区间:
(X 1 X 2 Z
2
S12 S22 , n1 n2
X 1 X 2 Z
2
S12 S22 ) n1 n2
16
代入样本值可得: (0.034, 0.766 )
这一结果说明什么?
再估计总体方差比12/22的大小:
由
4
2、有效性
若参数 同时有若干个无偏估计量,什么样的会更为理想呢?
当然是取值较为集中的一个更为理想了!
设 均ˆ1为,ˆ2参数 的无偏估计量,
若 D( 1 ) ,D(则 2称) 较 有ˆ1效。ˆ2
如: X 与 Xi (i=1,2,…,n) 都是 的无偏估计量,
但
2
D( X )
2>. 应当尽量选择最有效的(也即长度最短的)。 ---- 故而多用双侧分位点。
9
2、求 的(1-)置信区间的步骤:
回顾引例的分析思路:
从 XN(,0.42)出发,导出
U X
0.4 / 10
~ N (0,1)
一个完全已 知的分布
然后基于U一个N含(0有,1)待,估得参出数的P{ Z 2
这样的当然应该是 不唯一的!
10
例1 已知总体 XN(,2), 与2都未知,样本(X1,X2,…,Xn),求方差2的
(1-)置信区间。
分析: 若估计,则仍可考虑用 U X ~ N (0,1)
/ n
估计2用;
此时,可用
Y
n1
2
S
2
~
2 (n 1);
2
使得 P( 1 2 ) 1 则称随机区间 ( 1, 2 )
为参数 的置信度为100(1-)的置信区间;
(1-)称为置信度(又称置信水平)。
例如:上例所求得的区间(1,2),就是总体均值 的一个置信度为
95的置信区间。
对于给定的样本数据(x1,x2,…,x10),如若 x =2.26 ,则可得总体均
显然,参数的无偏估计量的取值以参数真值为中心左右微小摆动的.
例1:试证样本均值X和样本方差S2分别是总体X的期望和方差2
的无偏估计量。
析:需要证明的是: E( X ) 和 E(S 2 ) 2
也即
E( 1 n
n i 1
Xi
)
和
E( 1 n1
n i 1
(Xi
X
)2 )
值 的一个置信度为95的置信区间: (2.012,2.508)
8
几点说明 ▪置信区间与置信度的含义:
可以理解为:在多次重复抽样时,每次抽样的观察值按此统计 量都能求得一个区间;在这众多的区间中,包含真值的约占
100(1-),而不包含真值的约占100。 ▪ 置信区间的不唯一性; 1>. 结合引例不难看出,对于相同的置信度1-,置信区间并不唯一!
2
E(S2)
E
n
1
1
n i 1
(Xi
X
)2
1 n1
E
n i 1
Xi2
nX
2
1 n1
n i 1
E( X i 2 )
nEX 2 ) n D( X ) E 2( X ) n1
X
0.4 / 10
Z