第九章参数估计习题
参数估计练习题

参数估计练习题一、选择题1. 在统计学中,参数估计通常指的是:A. 估计总体参数的值B. 估计样本的均值C. 估计样本的方差D. 估计样本的中位数2. 下列哪项不是点估计的特点?A. 唯一性B. 精确性C. 随机性D. 简洁性3. 区间估计与点估计的主要区别在于:A. 区间估计提供了一个范围B. 点估计提供了一个范围C. 点估计比区间估计更精确D. 区间估计比点估计更精确4. 以下哪个分布的参数估计通常使用最大似然估计法?A. 正态分布B. 均匀分布C. 二项分布D. 泊松分布5. 以下哪个统计量是正态分布的参数估计?A. 方差B. 均值C. 标准差D. 所有上述选项二、填空题6. 点估计的误差可以通过________来衡量。
7. 区间估计的置信水平为95%,表示我们有95%的把握认为总体参数位于________内。
8. 样本均值的抽样分布服从________分布,当样本量足够大时。
9. 样本方差的抽样分布服从________分布,当样本量足够大时。
10. 正态分布的参数估计中,均值μ的估计量是________。
三、简答题11. 简述点估计与区间估计的区别。
12. 描述最大似然估计法的基本原理。
13. 解释为什么在样本量较大时,样本均值的分布会接近正态分布。
14. 说明在进行区间估计时,置信水平和置信区间宽度之间的关系。
15. 描述如何使用样本数据来估计总体比例。
四、计算题16. 假设有一个样本数据集{2, 4, 6, 8, 10},请计算样本均值和样本方差。
17. 假设你有一个正态分布的样本,样本均值为50,样本标准差为10,样本量为100。
请计算总体均值的95%置信区间。
18. 假设你有一个二项分布的样本,样本量为200,样本比例为0.4。
请使用最大似然估计法估计总体比例。
19. 假设你有一个泊松分布的样本,样本量为100,总观察值为200。
请估计泊松分布的参数λ。
20. 假设你有一个均匀分布的样本,样本最小值为1,样本最大值为10。
参数估计习题参考答案

参数估计习题参考答案班级: __________ 姓名: ______________学号: __________ 得分 ___________、单项选择题:1、关于样本平均数和总体平均数的说法,下列正确的是(A )增加 (B )减小 (C )不变 (D )无法确定4.某班级学生的年龄是右偏的,均值为 20岁,标准差为4.45.如果采用重复抽样的方法从该班抽取容量 为100的样本,那么样本均值的分布为(A )(A )均值为20,标准差为0.445的正态分布(B )均值为20,标准差为4.45的正态分布 (C )均值为20,标准差为0.445的右偏分布(D )均值为20,标准差为4.45的右偏分布5. 区间估计表明的是一个(B )(A )绝对可靠的范围(B )可能的范围 (C )绝对不可靠的范围(D )不可能的范围 6. 在其他条件不变的情形下,未知参数的 1-a 置信区间,(A )C. a 越小长度越小D. a 与长度没有关系7.甲乙是两个无偏估计量,如果甲估计量的方差小于乙估计量的方差,则称(D )(A )甲是充分估计量(B )甲乙一样有效(C )乙比甲有效 (D )甲比乙有效8.设总体服从正态分布,方差未知,在样本容量和置信度保持不变的情形下,根据不同的样本值得到总 体均值的置信区间长度将(D )(A )增加 (B )不变(C )减少 (D )以上都对9 •在其他条件不变的前提下,若要求误差范围缩小 1 / 3,则样本容量(C )(A )增加9倍 (B )增加8倍 (C )为原来的2.25倍 (D )增加2.25倍10设容量为16人的简单随机样本,平均完成工作时间13分钟,总体服从正态分布且标准差为若想对完成工作所需时间构造一个90%置信区间,则 (A)A.应用标准止态概率表查出 z 值B.应用 t-分布表查出t 值C.应用一项分布表查出 p 值D.应用泊松分布表查出 入值11. 100(1- a % 是(C)A.置信限B.置信区间C.置信度D.可靠因素12. 参数估计的类型有(D(A )点估计和无偏估计(B )无偏估计和区间估计 (C )点估计和有效估计(D )点估计和区间估计13、抽样方案中关于样本大小的因素,下列说法错误的是 (C )A 、总体方差大,样本容量也要大B 、要求的可靠程度高,所需样本容量越大(A )前者是一个确定值,后者是随机变量 (B )前者是随机变量,后者是一个确定值 (C )两者都是随机变量(D )两者都是确定值2、通常所说的大样本是指样本容量(A )大于等于30 ( B )小于30(C )大于等于103、从服从正态分布的无限总体中分别抽取容量为4,16, 36标准差将(A )(D )小于10的样本,当样本容量增大时,样本均值的(B )A. a 越大长度越小B. a 越大长度越大 3分钟。
参数估计习题及答案

参数估计习题及答案参数估计在统计学中是一个重要的概念,它涉及到根据样本数据来估计总体参数的过程。
下面,我将提供一些参数估计的习题以及相应的答案,以帮助学生更好地理解这一概念。
习题一:假设有一个班级的学生数学成绩,我们从这个班级中随机抽取了10名学生的成绩,得到样本均值 \(\bar{x} = 85\),样本标准差 \(s = 10\)。
请估计总体均值 \(\mu\)。
答案:根据样本均值 \(\bar{x}\) 来估计总体均值 \(\mu\),我们可以使用以下公式:\[ \hat{\mu} = \bar{x} \]因此,\(\hat{\mu} = 85\)。
习题二:在习题一中,如果我们想要估计总体方差 \(\sigma^2\),我们应该如何操作?答案:总体方差 \(\sigma^2\) 通常使用样本方差 \(s^2\) 来估计,样本方差的计算公式为:\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]其中 \(n\) 是样本大小,\(x_i\) 是第 \(i\) 个观测值。
在这个例子中,\(n = 10\),\(\bar{x} = 85\),\(s = 10\)。
因此,我们可以使用以下公式来估计总体方差:\[ \hat{\sigma}^2 = s^2 = \frac{1}{10-1} \times 10^2 = 100 \]习题三:一个工厂生产的产品长度服从正态分布,样本均值为 \(\bar{x} =50\) 厘米,样本标准差为 \(s = 2\) 厘米。
如果我们知道总体均值\(\mu\) 为 \(50\) 厘米,我们如何估计总体标准差 \(\sigma\)?答案:根据已知的样本均值 \(\bar{x}\) 和样本标准差 \(s\),我们可以使用以下公式来估计总体标准差 \(\sigma\):\[ \hat{\sigma} = s \]因此,\(\hat{\sigma} = 2\) 厘米。
参数估计练习题

参数估计练习题参数估计练习题参数估计是统计学中的一个重要概念,它用于根据样本数据来估计总体参数的值。
在实际应用中,参数估计扮演着至关重要的角色,它可以帮助我们了解总体特征,并做出相应的决策。
本文将介绍一些参数估计的练习题,通过解答这些问题来加深对参数估计的理解。
1. 假设我们有一个服从正态分布的总体,我们希望估计其均值。
我们从该总体中抽取了一个样本,样本容量为n,样本均值为x̄,样本标准差为s。
请问,如何利用这些信息来估计总体均值的值?答:根据中心极限定理,当样本容量足够大时,样本均值的分布将近似于正态分布。
因此,我们可以使用样本均值x̄作为总体均值的估计值。
同时,我们可以计算样本均值的标准误差,即s/√n,来衡量估计的精确程度。
2. 在某个电商平台上,我们想要估计用户对某个产品的满意度。
我们从该平台上随机抽取了100个用户进行调查,他们对该产品的满意度进行了评分,评分范围为1到10。
请问,如何利用这些信息来估计用户对该产品的满意度的平均值?答:我们可以计算样本的平均得分,即样本均值x̄,作为用户对该产品满意度的估计值。
同时,我们可以计算样本均值的标准误差,即样本标准差s/√n,来衡量估计的精确程度。
此外,我们还可以计算样本的置信区间,来估计总体平均得分的范围。
3. 在某个城市的交通调查中,我们想要估计每天通勤时间的均值。
我们从该城市的不同地区随机抽取了100个通勤者,并记录了他们的通勤时间。
请问,如何利用这些信息来估计每天通勤时间的均值?答:我们可以计算样本的平均通勤时间,即样本均值x̄,作为每天通勤时间均值的估计值。
同时,我们可以计算样本均值的标准误差,即样本标准差s/√n,来衡量估计的精确程度。
此外,我们还可以计算样本的置信区间,来估计总体通勤时间均值的范围。
4. 在一项医学研究中,我们想要估计某种药物的治疗效果。
我们从患者中随机抽取了100个人,其中50人接受了药物治疗,另外50人接受了安慰剂。
《参数估计习题》word版

参数估计习题一、填空题1、设总体2(,)X Nμσ,若2σ已知,总体均值μ的置信度为1α-的置信区间为:x x⎛-+⎝,则λ=;2、设由来自正态总体2(,0.9)X N μ的样本容量为9的简单随机样本,得样本均值5x=,则未知参数μ的置信度0.95的置信区间为;3、设12,X X为来自总体2(,)X Nμσ的样本,若1211999CX X+为μ的一个无偏估计,则C=;4、设12,,,nX X X为来自正态总体2(,)Nμσ的样本,,a b为常数,且0a b<<,则随机区间2211()(),n ni ii iX Xb aμμ==⎡⎤--⎢⎥⎣⎦∑∑的长度L的数学期望为;5、设ˆθ是未知参数θ的估计量,若称ˆθ为θ的无偏估计量,则ˆ()Eθ=;6、设12ˆˆ,θθ为总体未知参数θ的两个无偏估计量,若称1ˆθ比2ˆθ更有效,则1ˆ()Dθ1ˆ()Dθ;7、设θ为总体的未知参数,若由样本确定的两个统计量1ˆθ和2ˆθ,且12ˆˆθθ<,对于预先给定的α值(01α<<),满足12ˆˆ{}1Pθθθα<<=-,则称随机区间12ˆˆ(,)θθ为θ的1α-或100(1)%α-置信区间,其中为置信上限,为置信下限,称为置信度;8、设12,,,nX X X为来自正态总体2(,)Nμσ的一个样本,样本均值11niiX Xn==∑是的无偏估计量;9、设12,,,nX X X是取自总体X的一个样本,2()D Xσ=,则2211()1niiS X Xn==--∑为的无偏估计量;10、设12,,,n x x x 是取自总体2(,)XN μσ的一组样本值,则2σ的置信度为(1)α-的置信区间是 。
二、 选择题 1、 设总体2(,)XN μσ,其中2σ已知,则总体均值μ的置信区间长度l 与置信度1α-的关系是( ).1-.1-.1-.A l B l C l D ααα当缩小时,缩短 当缩小时,增大当缩小时,不变 以上说法均错2、 设总体2(,)XN μσ,2σ已知,若样本容量n 和置信度1α-均不变,则对于不同的样本观测值,总体均值μ的置信区间的长度( )....A B C D 变长 变短 不变 不能确定3、 设随机变量12,,,n X X X 相互独立且同分布2(,)XN μσ,11ni i X X n ==∑,2211()1ni i S X X n ==--∑,2()i D X σ=,则2S ( ) 2....A B C D σσμ是的有效估计 是的无偏估计是的无偏估计 不能确定4、设ˆθ是未知参数θ的估计量,如果ˆ()E θθ=,则称ˆθ为θ的( ) ....A B C D 有偏估计量 无偏估计量一致估计量有效估计量5、设总体X 的分布中,未知参数θ的置信度为1α-的置信区间是[]12,T T ,即12()1P T T θα≤≤=-,则下列说法正确的是( )1212121212.[,].[,]..[,]A T T t t ,t t B T T C D T T θθααθθθ∈对,的观测值,必有 以的概率落入区间区间以1-的概率包含 的数学期望E()必属于6、α越小,则1α-就越大,θ落在区间12ˆˆ,θθ⎡⎤⎣⎦内的概率就越大。
参数估计习题解答

参数估计习题与习题解答6.11.从一批电子元件中抽取8个进行寿命测试,得到如下数据(单位:h):1 050, 1 100, 1 130, 1 040, 1 250, 1 300, 1 200, 1 080试对这批元件的平均寿命以及分布的标准差给出矩估计.解:样本均值 75.11438108011301101050=++++=x样本标准差 ∑=-=812)(71i i x x s []22)75.11431080()75.11431050(71-++-=0562.96= 因此,元件的平均寿命和寿命分布的标准差的矩估计分别为1143.75和96.05622. 设总体),0(~θU X ,现从该总体中抽取容量为10的样本,样本值为0.5,1.3,0.6,1.7,2.2,1.2,0.8,1.5,2.0,1.6试对参数θ给出矩估计.解:由于E(X )=2θ,即θ=2E(X ),而样本均值106.13.15.0+++=x =1.34,故θ的矩估计为68.22ˆ==x θ3. 设总体分布列如下,n x x ,1是样本,试求未知参数的矩估计.10,,3,2,)1()1()()2(,1,,2,1,0,1)()1(22<<=--==-===-θθθ k k k X P N N k Nk X P k ;(正整数)是未知参数 解:(1) 总体均值E(X )=21110-=-+++N N N ,解之可得N =2E(X )+1故N 的矩估计量12ˆ+=x N,其中x 为样本均值,若x 2不是整数,可取大于x 2的最小整数代替.2x(2) 总体均值E(X )==---+∞=∑222)1()1(k k k k θθ∑+∞=---222)1)(1(k k k k θθ,由于3222)1)(1(θθ=--∑+∞=-k k k k ,故有E(X )θθθ2232=⨯=,即θ)(2X E =,从而参数的 矩估计为.2ˆx=θ 4.设总体密度函数如下,n x x ,,1 是样本,试求未知参数的矩估计.0,,1),;()4(;0,10,);()3(;0,10,)1();()2(;0,0),(2);()1(12>>=><<=><<+=><<-=---θμθμθθθθθθθθθθθθθμθθx ex p x x x p x x x p x x x p x解:(1) 总体均值E(X )==-⎰dx x x )(22θθθθθθθ31)(222=-⎰dx x x ,即即)(3X E =θ,故参数θ的矩估计为.3ˆx =θ(2)总体均值E(X )=dx x x ⎰+1)1(θθ=21++θθ,所以1E(X)E(X)21--=θ,从而参数θ的矩估计.121ˆ--=x xθ (3)由E(X )=dx x x 11-⎰θθ=1+θθ可得2)(1)(⎪⎪⎭⎫ ⎝⎛-=X E X E θ,由此,参数θ的矩估计.1ˆ2⎪⎭⎫⎝⎛-=x x θ(4)先计算总体均值与方差E(X )=dx ex x θμμθ--∞+⎰1=dt e t tθθ-∞+⎰01+dt e tθμθ-∞+⎰1=μθ+)(2X E =dx exx θμμθ--∞+⎰12=dt e t tθθμ-∞+⎰+1)(02=dt e t tθθ-∞+⎰12+dt e t tθθμ-∞+⎰012+dt e tθθμ-∞+⎰12=.2222μμθθ++V a r(X )=22))(()(X E X E -=2θ由此可以推出)()(,)(X Var X E X Var -==μθ,从而参数μθ,的矩估计为.ˆ,ˆs x s -==μθ 5.设总体为)1,(μN ,先对该总体观测n 次,发现有k 次观测为正,使用频率替换方法求μ的矩估计.解:由题意知,观测为正的频率f =nk,下面计算观测值为正的概率.当总体为N (1,μ)时,P (X >0)=1-P (X <0)=1-P (X -μ<-μ)=)(μΦ其中Φ为标准正态分布的分布函数.利用频率替换概率的方法有n k =Φ)ˆ(μ,这给出参数的矩估计为1ˆk nk u n μ-⎛⎫=Φ= ⎪⎝⎭ 譬如,若设nk=0.281,则由上式知μˆ是标准正态分布的分布的0.281分位数,查表得 =μˆ281.0u =-0.58 6.甲、乙两个校对员彼此独立对同一本书的样稿进行校对,校完后,甲发现a 个错字,乙发现b 个错字,其中共同发现的错字有c 个,试用矩法给出如下两个未知参数的估计: (1) 该书样稿的总错字个数; (2) 未被发现的错字数.解 (1)设该书样稿中总错字的个数为θ,甲校对员识别出错字的概率为1p ,乙校对员识别出错字的概率为2p ,由于甲,乙是彼此独立地进行校对,则同一错字能被识别的概率为21p p ,根据频率替换思想有 ,ˆ,ˆ21θθbpap==由独立性可得矩法方程θθθcb a =⋅,解之得cab =θˆ. (2) 未被发现的错字估计等于总错字数的估计减去甲,乙发现的错字数,即.c b a cab+-- 譬如,若设a =120,b =124,c=80,则该书样稿中错字总数的矩法估计18680124120ˆ=⨯=θ,而未被发现的错字个数的矩法估计为186-120-124+80=22个.7.设总体概率函数如下,n x x ,,1 是样本,试求未知参数得最大似然估计. (1);0,10,);(1><<=-θθθθx xx p(2)0,,);()1(>>=+-c c x xc x p θθθθ已知,θ>1解 (1)似然函数为11(,,)nn L x x θθθ()(),其对数似然函数为()(2ln ln nL θθ=+11)()ln ln n x x ++将()ln L θ关于θ求导并令其为0即得到似然方程1()1()022ln ln ln n L nx x θθθθ∂=+++=∂解之得 211ˆ()ln ni i x n θ-==∑ 由于 43ˆˆ2()022324()24ln ln ln i x i n x L n θθθθθθ∑==-<∂⎛⎫∑-- ⎪∂⎝⎭所以θˆ是 的最大似然估计.(2)似然函数为(1)1()()L n n n c x x θθθθ-+=,其对数似然函数为1()(1)()ln ln ln ln ln n L n n c x x θθθθ=+-++解之可得11)1(ˆ-=∑-=n i i Inc Lnx n θ由于0)(22<-=∂∂θθθnInL ,这说明θˆ是θ的最大似然估计. 8.设总体概率函数如下,n x x ,,1 是样本,试求未知参数的最大似然估计. (1)0,0,,);()1(>>>=+-c x x c x p c cθθθθ已知;(2;0,,1),;(>>=--θμθμθθμx ex p x(3))();(θθk x p =0,)1(,)(1>+<<-θθθθk x k 解:(1)样本n x x ,,1 的似然函数为{(1)(1)1}()()n nc c n xL c x x I θθθ-+>=要使)(θL 达到最大,首先示性函数应为1,其次是ncθ尽可能大.由于c>0,故ncθ是θ的单调增函数,所以 的取值应尽可能大,但示性函数的存在决定了 的取值不能大于(1)x ,由此给出的θ最大似然估计为(1)x(2)此处的似然函数为 μμθθθ>⎭⎬⎫⎩⎨⎧--=∑=)1(1,)(1exp )1()(x x L n i i n其对数似然函数为 1()(,)ln ln nii x L n μθμθθ=-=--∑由于(,)0ln L n θμμμθ∂=>∂所以,),(ln μθL 是μ的单调增函数,要使其最大,μ的取值应该尽可能的大,由于限制(1)x μ<,这给出μ的最大似然估计为(1)ˆx μ=. 将),(ln μθL 关于θ 求导并令其为0得到关于θ 的似然方程12()ln (,)0ni i x L n μθμθθθ=-∂=-+=∂∑ ,解之得 1(1)ˆ()ˆˆnii x xx nμθ=-==-∑. (3)似然函数为{}(1)()(1)()()n n xx k L k I θθθθ-≤≤≤+=.由于()()nL k θθ-=是关于θ的单调递减函数,要使()θL 达到最大,θ应尽可能小,但由限制{}(1)()(1)n x x k θθ≤≤≤+可以得到()(1)1n x x k θ≤≤+,这说明θ不能小于()1n x k +,因而θ的最大似然估计为()ˆ1n x k θ=+.9.设总体概率函数如下,1,,n x x 是样本,试求未知参数的最大似然估计.(1)()0,21;/>=-θθθθex x p ;(2)()2/12/1,1;+<<-=θθθx x p ; (3)()1212211;,,p x x θθθθθθ=<<-.解:(1)不难写出似然函数为 ()112nii nx L eθθθ=-∑⎛⎫= ⎪⎝⎭.对数似然函数为 ()1||ln ln 2nii x L n θθθ==--∑.将之关于θ求导并令其为0得到似然方程()12||ln 0ni i x L n θθθθ=∂-=+=∂∑, 解之可得 1||ˆnii x nθ==∑.而:22ˆˆ20222(||)2||ln ()ini x x L n θθθθθθ==-<∂∑⎛⎫- ⎪∑∂⎝⎭,故θˆ是θ的最大似然估计 (2) 此处的似然函数为 ()(1)()1122n x x L I θθθ⎧⎫-<<<+⎨⎬⎩⎭=.它只有两个取值:0和1,为使得似然函数取1,θ的取值围应是()(1)1122n x x θ-<<+,因而θ的最大似然估计θˆ可取()(1)11(,)22n x x -+中的任意值. (3) 由条件,似然函数为(){}1(1)(2)2211()n x x L I θθθθθ<<<=-.要使()θL 尽量大,首先示性函数应为1,这说明{}1(1)(2)2x x θθ<<<;其次21θθ-要尽量小,综上可知,1θ的最大似然估计应为)1(x ,2θ的最大似然估计应为).(n x10.一地质学家为研究密歇根湖的湖滩地区的岩石成分,随机地自该地区取100个样品,每个样品有10块石子,记录了每个样品中属石灰石的石子数.假设这100次观察相互独立,求这地区石子中石灰石的比例的最大似然估计.该地质学家所得的数据如下解:本题中,总体X 为样品中石灰石的个数,且X 服从参数),10(p 为的二项分布,即.)1(10)(10xx p p x x X p --⎪⎪⎭⎫ ⎝⎛== 又设10021,,,x x x 为样本,则其似然函数为(忽略常数)1001001110100()(1)iii i x x L p pp ==⨯-∑∑=-,对数似然函数为10010011ln ()ln (10100)ln(1)i i i i L p x p x p ===+⨯--∑∑将对数似然函数关于p 求导并令其为0得到似然方程1001001110100ln ()0,1iii i x x L p ppp==⨯-∂=-=∂-∑∑解之得10001001∑==i ixp由于0)1(1000)(ln 2100012100122<----=∂∂∑∑==p x p x p p L i i i i 由二阶导数的性质知,p 的最大似然估计为499.0100049910001001===∑=i ixp 11. 在遗传学研究中经常要从截尾二项分布中抽样,其总体概率函数为.,,2,1,)1(1)1();(m x p p p nm p x X p mn m x =---⎪⎭⎫ ⎝⎛==- 若已知,n x x x m ,,,,221 =是样本,试求p 的最大似然估计.解:当m =2时,该截尾二项分布只能取1与2,不妨设n x x x ,,,21 的样本中有1n 个i x 为1,有n -n 1个2则其似然函数为(忽略常数),)2()1())1(1()1())1(1()1()(1111111222)(2nn n n n n n n n n n n n p p p p p p p p p p p L --=---=---=--- 对数似然函数为).2ln()1ln(ln )()(ln 11p n p n p n n L ---+-=θ将对数似然函数关于p 求导并令其为0得到似然方程.02111=-+---pnp n p n n 解之得.)1(22)(211xx n n n n p -=--=-后一个等式是由于,)(2111-==-+=∑x n n n n xni i所以--=x n n n 21,代入上式即得.12.已知在文学家箫伯纳的A n I nt ellige nt Wo man ’s Guide To Soci a lis m 一书中,一个句子的单词数X 近似地服从对数正态分布,即2ln ~(,)Z X N μδ=.今从该书中随机地取20个句子,这些句子中的单词数分别为52 24 15 67 15 22 63 26 16 32 7 33 28 14 7 29 10 6 59 30 求该书中一个句子单词数均值eX E 22)(σμ+=的最大似然估计.解:正态分布),(2σμN 的参数的最大似然估计分别为样本均值和方差.即20221111ˆˆln 3.0890,(ln 3.0890)0.5081.20 n i i i i x x n μσ=====-=∑∑ 由于最大似然估计具有不变性,因而eX E 22)(σμ+=的最大似然估计为0.50813.08902()28.3053.E X e+==13.设n x x ,1是来自对数级数分布1(),01;1,2,ln(1)kp P X k p k p k==-⨯<<=-的一个样本,求参数p 的矩估计.解:由于.)1ln()1()1ln(1)(11p p p p p k X kP EX k kk ---=--===∑∑+∞=+∞= )1ln()1()1ln(1)(21122p p p kp p k X p k EX k kk ---=--===∑∑+∞=+∞=, 因此有21EX EX p =-,从而得到p 的矩估计2ˆ1i ix p x =-∑∑. 14.一个罐子里装有黑球个百球,有放回地抽取一个容量为n 的样本,其中 有k 个百球,求罐子里黑球和白球数之比R 的最大似然估计.解法1:记p 为罐子中白球的比例,令i x 表示第i 次有放回抽样所得的白球数,则,,,2,1),,1(~n i p b x i =故p 的最大似然估计为ˆpx =. 因为黑球数与白球数比值ppnp p n R -=-=1)1(.根据最大似然估计的不变性,有 xx p p R -=-=11 ,对具体的样本值即n 个抽到k 个白球来讲,R 的最大似然估计为kkn R -= .解法2:设罐子里有白球l 个,则有黑球R l 个,从而罐子中共有(1+R )l 个球,从中有放回的抽一个球为白球的概率为Rl R l +=+11)1(从罐子中有放回的抽 n 个球,可视为从二点分布中抽取一个样本容量为nL(R )=11k R ⎛⎫ ⎪+⎝⎭1n kR R -⎛⎫ ⎪+⎝⎭(1)n k nR R -=+, 其对数似然函数为l n L(R )=(n -k )l nR -n l n (1+R ),将对数似然函数对R 求导,并令其为0,得似然方程01=---RnR k n 解之可得R =1-kn.由于其对数似然函数的二阶导数为 0)1()(ln 2222<----=∂∂R nR k n R R , 所以R =1-kn是R 的最大似然估计. 譬如,在n =10,k =2场合,R 的最大似然估计R =41210=-,即罐中黑球数与白球数之比的最大似然估计为4,若白球1个,黑球为4个;或者白球2个,黑球8个等.15.设1,,m x x 和1,,n y y 分别来自总体N (21,μσ)和N (22,μσ)的两个独立样本.试求212(,,)θμμσ=的最大似然估计.解:合样本的似然函数为2212221111()()22m n i i i i x y μμσσ==⎧⎫----⎨⎬⎩⎭∑∑, 对数似然函数为l n L=-++22ln 2πσn m 2212221111()()22m n i i i i x y μμσσ==⎡⎤----⎢⎥⎣⎦∑∑. 将对数似然函数对2,2,1σμμ分别求导并令其为0,得,1111ˆˆ()0,mi i l x μμμ=∂=-=∂∑ 2212ˆˆ()0ni i ly μμμ=∂=-=∂∑ 212221122411ˆˆˆ,,1ˆˆ[()()]0ˆˆ22m ni i i i lm n x y μμσμμσσσ==∂+=-+-+-=∂∑∑, 由此得到2,2,1σμμ的最大似然估计为12ˆˆ x y μμ==22211()()ˆm niii i x x y y m nσ==-+-=+∑∑.16.某批产品含有N 件,其中M 件为不合格品,现从中随机抽取n 件中有x 件不合格品,则x 服从超几何分布,即⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫ ⎝⎛==n N x n M N x M x X P )(, ),min(,,2,1n M x =假如N 与n 已知,寻求该批产品中不合格品数M 的最大似然估计.解:记未知参数M 的似然函数L(M ,x )=P (X =x ).考察似然比11(1,)1(,)1MN M x n x L M x M N M n xM N M L M x M x N Mxnx由要使似然比(1,)1(,)L M x L M x 得 ,必然导致 (M +1)(N -M -n +x )≥(M +1-x )(N -M )化简此式可得0def (1)1xMN M n,这表明:当0M 为整数和0M M ≤时似然函数L(M ,x )是M 的增函数,即),1(),(),1(),0(00x M L x M L x L x L +≤≤≤≤ ()类似地,要使似然比1),(),1(≤+x M L x M L ,必导致01)1(M N nxM =-+≥.这表明,当0M 为整数且0M M ≥时,似然函数L(M ,x )是M 的减函数,即),(),1,(),(00x M L x M L x M L ≥≥+≥ ()比较(*)和(* *)可知,当0M 是整数时,M 的最大似然估计为0ˆM M=或0M +1,而当0M 不为整数时,M 的最大似然估计为)]1([]1[ˆ0+=+=N nxM M ,其中[a ]为不超过a 的最大整数,综合上述,M 的最大似然估计为⎪⎩⎪⎨⎧++++-+=不为整数时,当为整数时,当或年)1()]1([)1(),1(1)1(ˆN n xN n x N n x N n x N x nM譬如,在N =19,n =15,x =2场合.0M =71)119(*5/21)1(=-+=-+N nx,由于0M 为整数,故M 的最大似然估计为7或8.下面以实际计算加以佐证,几个L(M ,2)=m P (x =2)如下表所示:M 6 7 8 9 10 L(M ,2) 0.3689 0.3973 0.3973 0.3715 0.3251可见M 取7或8可使似然函数达到最大.又如,在N =16,n =5,x =2场合,0M =n x (N +1)-1=52(16+1)-1=5.8(不为整数),这时M 的最大似然估计Mˆ=[0M +1]=[5.8+1]=6.实际计算表明 M 5 6 7 8L(M ,2) 0.3777 0.4121 0.4038 0.359可见M 取6可使似然函数达到最大.§ 6.2 点估计的评价标准容概要1.相合性 设θΘ∈为未知参数,n θˆ=nθˆ(1x ,…,n x )是θ的一个估计量,n 是样本容量,若对任何一个ε>0,有0)|ˆ(|lim =>-∞→εθθnn P ,Θ∈∀θ, 则称nθˆ为参数θ的相合估计. • 相合性本质上就是按概率收敛,它是估计量的一个基本要求,即当样本量不断增大时,相合估计按概率收敛于未知参数;• 矩法估计一般都是相合估计;• 在很一般的条件下,最大似然估计也是相合估计.2.无偏性 设=nθˆ(1x ,…,n x )是θ的一个估计,θ的参数空间为Θ,若对Θ∈∀θ,有 θθ=)ˆ(E则称θˆ是θ的无偏估计,否则称为有偏估计. 假如对任意的Θ∈θ,有θθ=+∞→)ˆ(lim E n ,则称θˆ是θ的渐近无偏估计. 3.有效性 设1ˆθ是2ˆθ的两个无偏估计,如果对任意的Θ∈θ有)ˆ()ˆ(21θθVar Var ≤,且至少有一个Θ∈θ使得上述不等号严格成立,则称1ˆθ比2ˆθ有效.4.均方误差 设θˆ是θ的一个估计(无偏的或有偏的),则称 22ˆˆˆˆ()()()(())MSE E Var E θθθθθθ 为θ的均方误差.均方误差较小意味着:θˆ不仅方差较小,而且偏差)ˆ(θθ-E 也小,所以均方误差是评价估计的最一般标准.•使均方误差一致最小的估计量一般是不存在的,但两个估计好坏可用均方误差评价: •在无偏估计类中使均方误差最小就是使方差最小.习题与解答6.21.总体X~U(,θ2θ),其中0>θ是未知参数,又n x x ,,1 为取自该总体的样本,xˆ为样本均值.(1)证明x 32ˆ=θ是参数θ的无偏估计和相合估计; (2)求θ的最大似然估计,它是无偏估计吗?是相合估计吗?解:(1)总体X~U(,θ2θ),则23)(θ=X E ,12)(2θ=X Var ,从而.12)(,23)(2nX Var x E θθ==于是,θθ==)(32)ˆ(x E E ,这说明x 32=θ是参数θ的无偏估计.进一步 0271294)ˆ(22→=⨯=nn Var θθθ, 这就证明了θˆ也是θ的相合估计. (2)似然函数为)2(1)()()1()(θθθθ<<<=n nx x I L ,显然)(θL 是θ的减函数,且θ的取值围为)1()(2x x n <<θ,因而θ的最大似然函数估计为2ˆ)(n mlex =θ下求mleθˆ的均值与方差,由于n x 的密度函数为 111()()(),nn x nf x n x θθθθθθθ2<<x 故21(1)()021()()()1n n n nnnn E x xx dxtt dtn θθθθθθθθ, 222212()482()()(2)(1)n n nnn n E x xx dxn n θθθθθ22()2Var()(2)(1)n nx nn θ从而:()121ˆ()()22(1)n n E E x n n θθθ所以ˆmleθ不是的无偏估计,但它是的渐近无偏估计和相合估计. 2.设x 1,x 2, x 3,是取自某总体的容量为3的样本,试征下列统计量都是该总体均值的无偏估计,在方差存在时指出哪一个估计的有效性最差?(1)1111123236ˆx x x μ=++ (2)1112123333ˆx x x μ=++ (3)1121123663ˆx x x μ=++解:先求三个统计量的数学期望1111111123123236236ˆE()E E E x x x μμμμμ=++=++= 1111112123123333333ˆE()E E E x x x μμμμμ=++=++= 1121123123123663663ˆE()E E E x x x μμμμμ=++=++=这说明他们都是总体均值的无偏估计,下面求他们的方差,不妨设总体的方差为2.2222711111111234936493618ˆVar()Var()Var()Var()x x x μσσσσ=++=++= 2222111111121239999993ˆVar()Var()Var()Var()x x x μσσσσ=++=++=22221141141312336369363692ˆVar()Var()Var()Var()x x x μσσσσ=++=++=不难看出,213ˆˆˆVar()Var()Var()μμμ<<,从而3ˆμ的有效性最差. 3. 设ˆθ是参数θ的无偏估计,且有ˆVar()0θ>,试征ˆθ2不是参数θ2的无偏估计.证明:由方差的定义可知,22ˆˆˆVar()E()(E())0θθθ=->.由于ˆθ是参数θ的无偏估计,即ˆE()θθ=,因而 2222ˆˆˆˆE()Var()(E())Var()>θθθθθθ=+>+,所以ˆθ2不是参数θ2的无偏估计.4. 设总体X~ N (,2), x 1,x 2,…,x n 是来自该总体的一个样本.试确定常数C,使1211()n i i i C x x -+=-∑为2的无偏估计.解:由于总体X~ N (,2),所以222E(),i x σμ=+ 211E()E()E(),1,2,i i i i x x x x i n μ++===于是111111122221111111E ()E()E()E()2E()i i i n n n n n i i i i i i i i i i C x x C x x C x x x x ++-----++=====⎛⎫⎛⎫-=-=+- ⎪ ⎪⎝⎭⎝⎭∑∑∑∑∑()11122222222111()E()22(1)()2(1)n n n i i i C C n n σμσμμσμμ---===⎛⎫=+++-=-+-- ⎪⎝⎭∑∑∑22(1)C n σ=-可见,要使1211()n i i i C x x -+=-∑为2的无偏估计,只有12(1)C n =-.5. 设从均值为方差为2>0的总体中分别抽取容量为n 1和n 2的两个独立样本,其样本均值分别为12,x x .试证,对任意常数啊a ,b (a +b =1),12Y ax bx =+都是的无偏估计,并确定常数a ,b 使V a r(Z)达到最小.证:由于12,x x 为容量为n 1和n 2的两个独立样本的样本均值,故22121122E()E()()/()/x x x n x n μσσ====,Var ,Var ,因而:12E ()()Y aE x bE x a b μμμ=+=+=.这说明12Y ax bx =+是的无偏估计. 又由a +b =1知,1212(1)Y ax bx ax a x =+=+-,从而()()()()()22222212121222111211a a Var Y a Var x a Var x a a n n n n n n σ⎡⎤-⎛⎫=+-=+=+-+⎢⎥ ⎪⎝⎭⎣⎦求导知,当2112121/1/1/n n a n n n n ==++时,V a r(Y)达到最小,此时212n b n n =+这个结果表明,来自同一总体的两个容量为n 1和n 2的两个独立样本合样本(样本容量为n 1+n 2)的均值112212n x n x x n n +=+是线性无偏估计类12{(1)}U ax a x =+-中方差最小的.6. 设分别来自总体N (1,2),和N (2,2)中抽取容量为n 1和n 2的两个独立样本,其样本方差分别为s 12, s 22.试证,对任意常数啊a ,b (a +b =1),Z=a s 12,+b s 22都是2的无偏估计,并确定常数a ,b 使V a r(Z)达到最小.解:由已知条件有()(),1~1122211--n s n χσ()(),1~1222212--n s n χσ且2221,s s 独立.于是()(),22221σ==s E s E 故()()()()(),222222212221σσσσ=+=+=+=+=b a b a s bE s aE bs as E Z E这证明了2221bs as Z +=是2σ的无偏估计.又 (),121421-=n sVar σ(),122422-=n s Var σ从而 ()()()()2222121s Var a s Var a Z Var -+=()(),1112212242222121σ⎥⎦⎤⎢⎣⎡-+----++=n a n a n n n n因而当21211-+-=n n n a 时,()Z Var 达到最小,此时,21212-+-=n n n b 该无偏估计为 ()().2211122212-+-+-=∑∑==n n y y x xn i n i i iσ这个结果表明,对来自方差相等(不论均值是否相等)的两个正态总体的容量为1n 和2n 的样本,上述2σ是2σ的线性无偏估计类(){}22211s a as U -+=中方差最小7.设有k 台仪器,已知用第i 台仪器测量时,测量值总体的标准差为().,,2,1k i i =σ用这些仪器独立的对某一物理量θ各观察一次,成为θ的无偏估计,且方差达到最小.解:若要使∑==ki ii xa 1θ为θ的无偏估计,即111,kki i n ii i E Ea x a a a θθθθθ则必须有,11=∑=ki ia此时2222111.ki ik k i Var Vara x a a θσσ因此,问题转化为在11=∑=ki ia的条件下,求212i ki i a σ∑=的极小值.令(),1,11221⎪⎭⎫⎝⎛--=∑∑==k i i ki iik a a a a f λσ 由k i a f i ,,2,1,0 ==∂∂和,0=∂∂λf得到2120, (1)1, (2)i i kii a a σλ从(1)中可以得到,22i i a σλ=代入(2)中,解出11221-=⎪⎪⎭⎫ ⎝⎛=∑k i i σλ,从而 2211,1,2,,.1i k ij ja i k σσ8.设n x x ,,1 是来自均匀总体()1,+θθU 的一个样本.(1) 验证()()1,11,13121+-=+-=-=n nx n x x n θθθ都是θ的无偏估计; (2) 比较上述三个估计的有效性.解: 令,θ-=i i x y 则(),1,0~U y i 即12,,,n y y y 是来自()1,0U 的样本,且()()()().,,11θθθ+=+=+=n n y x y x y x于是,我们可将诸估计写成n y y y ,,,21 与θ的函数:123111, , .211nn yy y n n θθθθθθ由此,()()()().121,2111ny Var VarX y E E ===-+=θθθθ又()()()(),1,~,,1~1n Be y n Be y n 这说明()()()()()()()(),21,1,1121++=+=+=n n n y Var n n y E n y E n n 由此可以得到()()()()()().21,,22132++====n n nVar Var E E θθθθθθ综上,321,,θθθ 均是θ的无偏估计,而且2θ与3θ的方差相等,但在比较1θ与2θ的方差是要取决于n 的大小,当71≤≤n 时,1θ 比32,θθ 有效;当8≥n 时,32,θθ比1θ 有效.9.设样本1,,1n x x 来自一个正态总体(),1,1μN 样本2,,1n y y 来自另一个正态总体(),4,2μN 且两个样本独立.(1)求21μμμ+=的矩估计μ;(2)如果21n n n +=固定,试问如何分配1n 和2n 才能使得μ的方差达到最小.解;(1)由题意可知1μ的矩估计为,11n x x x n++= 2μ的矩估计为,212n y y y n +⋯+=因而12μμμ的矩估计.y x -=μ(2)由于1,122~(1/),~(,4/),x N n y N n μμ且两个样本独立,故在n n n =+21的条件下11214141)()()ˆ(n n n n n y Var x Var Var -+=+=+=μdef ).(1n f 使用和本节第5题相同的方法,由12211()14def 0,()df n dn n n n 可解出n n 311=(另一解n n -=1不适合),而,0)(82)(31312112>-+=n n n dn n f d 故n n n n 32,3121==时μˆ的方差达到最小.10.设总体,),/1(~1x Exp X θ…n x 是样本,试证x 和)1(nx 都是θ的无偏估计量,并比较其有效性.解:由指数分布知,,)(,)(2θθ==X Var X E 因而,)(,)(2nx Var x E θθ==这说明x 是θ的无偏估计量.又最小次序统计量)1(x 的密度函数为=)(1x f ,θπθn en-即),/(~)1(θn Exp x 因而有,)()(,)(2)1()1(nx Var n x E θθ==从而,)()1(θ=nx E 即)1(nx 是θ的无偏估计量,且.)(2)1(θ=nx Var注意到当n >1时,),()()1(22nx Var nx Var =<=θθ这说明作为θ的无偏估计,x 比)1(nx更有效.11.设总体为,),(~1x P X λ…n x ,为其样本,试求2λ的无偏估计. 解:此处样本均值x 为参数λ的充分统计量,且(),()E x Var x nλλ,于是,)()()(222λλ+=+=nx E x Var x E因而,)(22λ=-n x x E 从而可得2λ的一个无偏估计为.2nx x - 12.设总体为,),2/1,2/1(~1x U X +-θθ…n x 为样本,证明样本均值x 和样本中程)(21)()1(n x x +都是θ的无偏估计,并比较它们的有效性. 解:由总体),2/1,2/1(~+-θθU X 得,121)(,)(==X Var X E θ因而θ=)(x E ,这首先说明样本均值x =1ˆθ是θ的无偏估计,且nVar 121)ˆ(1=θ. 为求样本中程)(21ˆ)2()1(2x x +=θ的均值与方差,注意到~)21(--=θX Y ),1,0(U 令 ,2,1),2/1(=--=i x y i i θ…,n ,则 .21)(21)(21ˆ)()1()()1(2-++=+=θθn n y y x x 由于),1,(~)(+-i n i Be y i 故,1)(,11)()()1(+=+=n ny E n y E n 从而 .21)(21)ˆ()()1(2θθθ=-++=n y y E E 这就证明了样本中程是θ的无偏估计.又注意到(参见第五章5.3节习题29)),2,1(~)1()(--n Be y y n所以(1)()2()(1)2()(),(1)(2)2(1)(),(1)(2)n n nVar y Var y n n n Var y y n n ==++--=++从而(1)()()()()(1)21(,)[()()()]21.(1)(2)Cov n n n n y y Var y Var y Var y y n n =+--=++于是(1)()(1)()(1)()2211(())[()()2(,)]241221[].4(1)(2)(1)(2)2(1)(2)n n n Var x x Var y Var y Cov y y n n n n n n n +=++=+=++++++在2>n 时,.)2)(1(21121++>n n n 这说明作为θ的无偏估计,在n >2时,样本中程)(21)()1(n x x +比样本均值x 有效. 13.设n x x ,...,1是来自正态总体,N 的一个样本),(2σμ对2σ考虑如下三个估计∑∑∑===-+=-=--=n i i n i i n i i x x n x x n x x n 122312221221)(11ˆ,)(1ˆ,)(11ˆσσσ (1) 哪一个是2σ的无偏估计? (2) 哪一个均方误差最小?解:(1)由于)1(~)(12122--∑=n x x ni i χσ,故有212)1()(σ-=⎥⎦⎤⎢⎣⎡-∑=n x x E n i i ,从而.11)ˆ(,1)ˆ(,)ˆ(223222221σσσσσσ+-=-==n n E n n E E这说明仅有21ˆσ是2σ的无偏估计,而22ˆσ与23ˆσ是2σ的有偏估计. (2) 我们知道,估计的均方误差是估计的方差加上偏差的平方,即.))ˆ(()ˆ()ˆ(2222222σσσσσ-+=-i i i E Var E 而V a r ,)1(2))((412σ-=-∑=n x xni i这给出V a r ,12)ˆ(421-=n σσV a r ,)1(2)ˆ(2422n n σσ-=V a r .)1()1(2)ˆ(2423+-=n n σσ 于是M SE =)ˆ(21σV a r ,12)ˆ(421-=n σσ M SE ,12)1()1(2)ˆ(422224222σσσσσnn n n n n -=--+-=M SE ,)1(2)11()1()1(2)ˆ(4224223σσσσσ+=-+-++-=n n n n n 显然),1(,1212,12122>+>-+>-n n n n n n 所以23ˆσ的均方差最小. 注意,这里23ˆσ是2σ的有偏估计,上述结论表明,在均方误差意义下,有时有偏估计要比无偏估计更优.14. 设n x x ,,1 是来自密度函数为θθθ>=--x ex p x ,);()(的样本,(1) 求θ的最大似然估计1ˆθ,它是否是相合估计?是否是无偏估计? (2) 求θ的矩估计2ˆθ,它是否是相合估计?是否是无偏估?(3) 考虑θ的形如c x c -=)1(ˆθ的估计,求使得cθˆ的均方误差达到最小的c,并将之与21ˆ,ˆθθ的均方误差进行比较.解: (1)似然函数为{}{}{}.exp )()1(11)(θθθθθ>==>--⎭⎬⎫⎩⎨⎧+-==∑∏x n i i ni x x I n x I eL i i显然)(θL 在示性函数为1的条件下是θ的严增函数,因此θ的最大似然估计为.ˆ)1(1x =θ又)1(x 的密度函数为,,)()(θθ>=--x ne x f x n 故,1)()ˆ(0)(1θθθθ+=+==⎰⎰∞+-∞+--ndt ne t dx xneE nt x n 故1ˆθ不是θ的无偏估计,但是θ的渐近无偏估计.由于)()ˆ(1+∞→→n E θθ且 22()2221222ˆ()(2),n x nt E x nedx t t ne dx n nθθθθθθ+∞+∞---==++=++⎰⎰ V a r ,01)1(22)ˆ(22221→=+-++=n n n n θθθθ 这说明1ˆθ是θ的相合估计.(2) 由于,1)(0)(+==⎰+∞--θθdx xe X E x 这给出1-=EX θ,所以θ的矩估计为.1ˆ2-=x θ又,22)(20)(22++==⎰+∞--θθθdx ne x X E x n 所以V a r ,1)(=X 从而有,1)()ˆ(2θθ=-=x E E V a r n 1)ˆ(2=θV a r ),(01)(+∞→→=n nX这说明2ˆθ既是θ的无偏估计,也是相合估计.(3) 对形如c x c -=)1(ˆθ的估计类,其均方误差为M SE =)ˆ(cθ V a r 2)1()1()()θ--+--c Ex c x ,)1(122c n n-+= 因而当n c 10=时,M SE 21)ˆ(0n c =θ达到最小,利用上述结果可以算出 M SE 212)ˆ(n =θ,M SE ,1)ˆ(2n =θ 故有M SE ≤)ˆ(0c θM SE ≤)ˆ(1θM SE )ˆ(2θ,所以在这三个估计中,nx x c 1ˆ)(0-=θ的均方误差最小. 15.设总体),/1(~θExp X n x x ,,1 是样本,θ的矩估计和最大似然估计都是 x ,它也是θ的相合估计和无偏估计,试证明在均方误差准则下存在优于x 的估计(提示:考虑,ˆx a a=θ找均方误差最小者). 证:由于总体),/1(~θ=Exp X 所以,)(θ=x E V a r .)(2nx θ=现考虑形如x a a=θˆ的估计类,其均方误差为M SE .)1())(()()ˆ(22222θθθθ-+=-+=a na x a E x a Var a将上式对a 求导并令其为0,可以得到当10+=n n a 时,M SE )ˆ(aθ最小,且 0221ˆMSE()MSE().1a x n nθθθ=<=+ 这就证明了在均方误差准则下存在一个优于x 的估计.这也说明,有偏估计有时不比无偏估计差.16.设n x x ,,1⋅⋅⋅独立同分布,E 1x =μ,V a r(1x )<+∞,证明∑=∧+=ni i ix n n 1)1(2μ是μ的相和估计.证:由于μμμμ=+⋅+=⋅+=∑=∧2)1()1(2)1(2)(1n n n n i n n E ni∑=∧⋅+=n i i n n Varx Var 12221)1(4)(μ=),(06)12)(1()1(4221+∞→→++⋅+n n n n n n Varx 这就证明了∑=∧+=ni i ix n n 1)1(2μ是μ的相合估计.17.设n x x ⋅⋅⋅,1是取自均匀分布总体)(2,1θθU 的一个样本,若分别取=∧1θ{}n x x ⋅⋅⋅,m in 1和{}n x x ⋅⋅⋅=∧12m ax θ作为21,θθ的估计量,问21,∧∧θθ是否为21,θθ的无偏量估计量?如果不是,如何修正才能获得21,θθ的无偏估计.解:令Y=121θθθ--X ,则Y~U(0,1)记)()1(,n y y ⋅⋅⋅为样本相应的次序统计量,于是有,1,11)()1(+=+=n nEy n Ey n从而,111)(122111++=+-+=∧n n n E θθθθθθ ,11)(121212++=+-+=∧n n n n E θθθθθθ可见21,∧∧θθ不是21,θθ的无偏估计量,由⎩⎨⎧+=++=+,)1(,)1()2(21)1(21Ex n n Ex n n θθθθ 解之得 ⎪⎪⎩⎪⎪⎨⎧--=--=,1,1)1()(2)()1(1n Ex nEx n Ex nEx n n θθ因而1,1)1()(2)()1(1--=--=∧∧n x nx n x nx n n θθ 是21,θθ的无偏估计量.18.设21,x x 独立同分布,其共同的密度函数为.0,0,3);(32><<=θθθθx x x p(1)证明:)(32211x x T +=和{}212,max 67x x T =都是θ的无偏估计; (2)计算1T 和2T 的均方误差并进行比较;(3)证明:在均方误差意义下,在形如{}21,m ax x x c T C =的估计中78T 最优.解:(1)先计算总体均值为θθθ433)(032=⋅=⎰dx x x X E ,故⋅=32)(1T E ,)(2θ=X E 这说明1T 是θ的无偏估计.又总体分布函数为μθμθd x F x ⎰=0323);(,0,)(3θθ<<=x x 记Y={}21,m ax x x ,则密度函数为.0,6);();(2);(65θθθθθ<<==y y y p y F y f于是有 θθθθ=⋅==⎰7667667)(0662dy y T E 这表明2T 也是θ的无便估计.(2)无偏估计的方差就是均方误差,由于,533)(2320221θθθ=⋅=⎰dx x x x E,803)3(543)()()(22221211θθθ=-=-=x E x E x Var故有.30180398)(294)()(22111θθ=⋅=⋅==x Var T Var T MSE 又,436)(206522θθθ=⋅=⎰dy y y Y E ,1963)76(43)EY ()Y (E )Y (22222θθθ=-=-=Var 从而.48119633649)T (Var )T (MSE 2222θθ=⋅== 由于),T (MSE )T (MSE 21>因此在均方差意义下,2T 优于1T .(3)对形如}x ,x {cm ax T 21c =的估计有22243)(,76)θθc T E c T E c c ==(,故22222312()()()2()(1),47c C c c MSE T E T E T E T c c θθθθ+=-=-+=-+因此当1273287c ==时,上述均方误差最小,所以在均方误差意义下,在形如},max {21x x c T c =的估计中,78T 最优.19.设n x x ,......,1是来自均匀分布_),0(θU 的一个样本,对参数θ有如下三个估计)1(3),(21)1(1,2x n x n n x n +=+==∧∧-∧θθθ(1) 验证这些估计的无偏性; (2) 比较这些估计的有效性; (3) 研究这些估计的相合性.解:(1)由于),1,0(~U x i 所以,22)(2)(1θθθ=⋅==x E E又)(n x y =的密度函数为,0,)(1θθ<<=-y ny y p nn所以.11)(1)(10)(2θθθθθθ==+=+=+⎰n nn nn dy y nn n x E n n E类似地,)1(x z =的密度函数为 ,0,)1()(1θθθ<<-=-z znz p n 所以.)2()()2()1()1()1()()1()(10)1(3θθθθθθ=+ΓΓΓ+=-+=+=-⎰n n n n dy y yn n x E n E n由此看出,三个估计321,,θθθ都是θ的无偏估计.(2)分别计算三个估计的方差221()4()4,123Var Var x nnθθθ==⋅=22221222222201(1)1()()[()](),(2)(2)n nn nn Var E E yn n n n n θθθθθθθθθ+++=-=-=-=++⎰2222123330222222()()[()](1)(1)(3)()2(1)(1).(3)22n yVar E E n n y dy n n nn n n n n θθθθθθθθθθθ-=-=+--ΓΓ+=+-=-=Γ+++⎰由于2≥n 时,有11,(2)32nn n n n <<++所以这三个估计中2θ 最有效,1θ 为次,3θ 最差. (3) 由于1θ 与2θ 的方差都随着+∞→n 而趋于零,故1θ 与2θ 都是θ的相合估计,但3θ不是θ的相合估的计.为了证明这一点,我们需要3θ的分布函数,由于)1(x z =的分布函数为.0,)1(1)(θθ<<--=z zz F n于是,)1(3)1(x n +=θ的分布函数为.)1(0,))1(1(1)(θθ+<<+--=n t n tt F n由此可得33()()1()()()()(1)(1)(1)(1)()[].n nP p F F n n e e n e e e θεθθεθεθεθθθεθεθθεθεθεθεθεθθ---+---<=-<<+-+=+--=---++→-→+∞=-在ε充分小时,,2)1(1θεθεθεθεθε=--+≈--e e这是一个很小的数,它与1相差很大,这表明)(3εθθ<- p 不会趋于1,故3θ不是θ的相合估计.20.设n x x ,,1 是来自二点分布),1(p b 的一个样本, (1) 寻求2p 的无偏估计; (2) 寻求)1(p p -的无偏估计; (3) 证明p1的无偏估计不存在. 解:(1)x 是p 的最大似然估计,2x 是2p 的最大似然估计,但不是2p 的无偏估计,这是因为,1)1()]([)()(22222p p nn n p p n p p X E x Var x E ≠-+=+-=+= 由此可见⎢⎣⎡⎥⎦⎤-+=n x x n n p 221是2p 的无偏估计. (2) 2)1(x x x x -=-是)1(p p -的最大似然估计,但不是)1(p p -无偏估计,这是因为),1()1(1))1(()(22p p p p n n p n p p p x x E -≠--=+--=-由此可见)1(1x x n n --是p (p -1)的一个无偏估计,11(,,)3n g x x p()反证法,倘若是的无偏估计,则有pp px x g ni ini inx n x n x x 1)1()(11,1,1=∑-∑==-∑ 或者01)1(),(11111=-∑-∑∑==-+nni ini i x x x n x np p xx g上式是p 的n +1次方程,它最多有n +1个实根,而p 可在(0,1)取无穷多个值,所以不论取什么形式都不能使上述方程在0<p <1上试成立,这表明p1的无偏估计不存在. 21.设n x x ,1是来自均匀分布U ()βα,的一个样本,寻求βα与的无偏估计. 解:容易看出,)()1(n x x 与分别是βα与的最大似然估计,但它们都不是无偏差估计,这是因为均匀分布U ()βα,的分布函数与密度函数分别为⎪⎪⎩⎪⎪⎨⎧⎪⎩⎪⎨⎧<<-=≤<<--≤=.,0,,1)(,1,,,,0)(其它和βααβββααβαx x p x x x a x x F由此可导出次序统计量)()1(n x z x y ==与的密度函数分别为,,)()(1)1()(11βααββαβαβα<<--=----=--y y n y n y p nn n ,,)()(1)()(11βααββαβαβα<<--=---=--z y n z n z p nn n 从而可以分别求出它们的期望,1)()()(1)1(++=--=⎰-n n dy y y nx E n nαββαββα(*).1)()()(1)(++=--=⎰-n an dz a z z nx E n nn βαββα(**) 这表明:)()1(n x x 与不是α与β的无偏估计,但做恰当修改后,可获得α与β的无偏差估计.把(*)与(**)两式相加与相减可得,)()()1(βα+=+n x x E(1)()(1)()11()()()(),11 n n n n E x x E x x n n αβαβ--⎡⎤-=--=-⎢⎥++⎣⎦或 再使用加减消取法,即可得βα与的无偏估计发表为(1)()()(1)ˆˆ,.11n n nx x nx x n n αβ--==--22.设)()1(,n x x 是来自总体分布函数为);(θx F 的一个样本,若1ˆˆ(,,)n x x θθ=是θ的有偏估计,且其期望有如下形式()ˆ(),E nαθθθ=+ (*) 其中θθα仅是)(的函数,而与样本量n 无关.这时,为了减少偏差,常用如下的、“刀切法”:记ˆiθ-是把原样本中的第i 个分量剔除,用留下的容量为n -1的样本得到的类似估计量.即ˆˆiθθ-与的估计公式有相同形式,且()ˆ(),1,2,,.1i E i n n αθθθ-=+=-(1) 证明:新的估计(一切的估计)(1)ˆˆin θθ-=是θ的无偏估计; (2) 用刀切法寻求泊松分布)(λp 中参数平方2λθ=的一阶刀切估计.解:(1)一阶刀切估计(1)ˆθ期望为(1)11ˆˆˆ()()()n i i n E nE E n θθθ-=-=-∑,1)(1)(1∑==⎥⎦⎤⎢⎣⎡-+--⎥⎦⎤⎢⎣⎡+=n i n n n n n θθαθθαθ 所以(1)ˆθθ是的无偏估计. (2) 在泊松分布)(λp 中,样本均值λ是x 的无偏估计,但2ˆx θ=不是2λθ=的无偏估计,这是因为[]2222)()()(λλλ>+=+=nx E x Var x E ,若做简单修改,用n x /代替n /λ,就可以得到2λ的一个无偏估计(2)2ˆ.xx nλ=-现在用“刀切法”寻找2λθ=的一介刀切估计,已知2ˆx θ=是2λθ=的有偏估计,且()ˆ()E nαθθθ=+,其中θθα=)(仅是θ的函数.若剔除样本中第i 个分量,可得。
统计学习题答案参数估计

第5章 参数估计●1。
从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σσ5=0。
7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2σZ 。
96×0。
7906=1。
5496。
●2。
某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差;(5) 如果样本均值为120元,求总体均值95%的置信区间。
解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2σZ 6×2.1429=4.2000. (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1。
96, 这时总体均值的置信区间为α/2σx Z 0±4。
2=124.2115.8可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124。
2)元。
●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.3 3.1 6。
2 5.8 2.3 4。
1 5.4 4。
53。
2 4.4 2.0 5.4 2.6 6。
4 1。
8 3。
5 5。
7 2.32。
1 1。
9 1。
2 5.1 4.34。
2 3.6 0。
8 1.5 4.7 1。
4 1.2 2。
9 3。
5 2。
4 0.5 3.62。
参数估计习题-缩小版

1 假定观测z 0,z 1,…,z N-1是独立同分布的,且在(0,θ)上服从均匀分布,求θ的最大似然估计。
似然估计。
2 给定一独立观测序列z 0,z 1,…,z N-1,其均值为m,方差为σ2,试问:试问:(1) 样本均值样本均值z̅=1N�z iN −1i =0是否是m 的无偏估计?并求的方差。
的无偏估计?并求的方差。
(2) 若方差的估计是若方差的估计是σ�2=1N �(z i N −1i =0−z̅)2σ�2是否是σ2的无偏估计?的无偏估计? 3 设有N 次独立观测zi =A +w i ,i =0,1,…,N −1其中w i ~N (0,σ2),A 在(−A 0,A 0)上服从均匀分布,证明A 的最大后验概率估计为的最大后验概率估计为 Amap �−A 0 z̅<−A 0 z̅ −A 0≤z̅ ≤A 0A 0 z̅>A 0式中,z̅=1N ∑z iN −1i =0. 4 设随机参量θ的后验概率密度为的后验概率密度为P (θ|z )=ε√2πexp �−12(θ−z )2�+1−ε√2πexp [−12(θ+z)2] 式中,ε是任意常数,0<ϵ<1,求θ的最小均方估计和最大后验概率估计。
的最小均方估计和最大后验概率估计。
5 设有N 次观测次观测z i =Ar i +w i ,i =0,1,…,N −1其中,w i是零均值高斯白噪声,方差为σ2,r >0是已知的,求估计A 的CRLB 。
证明有效估计量存在,并求它的方差。
对不同的 r 值,当N →∞时估计的方差会怎样?时估计的方差会怎样?6 设观测的概率密度为p(z|θ),θ为未知常量,待估计量为α=g(g(θθ)证明:估计α的CRLB 为V ar(α�)≥�ðg (θ)ðθ�2−E �ð2lnp (z |θ)ðθ2�7 考虑一个正弦参数的估计问题,假定观测为考虑一个正弦参数的估计问题,假定观测为z [n ]=Acos Acos((2πf 0n +∅)+w [n ],n =0,1,…,N −1 其中,w [n ]为零均值高斯白噪声,方差为σ2,A ,f 0,∅为未知参量,且A >0,0<f 0<1/2,设θ=[A f 0 ∅]T ,证明θ的费希尔信息矩阵为的费希尔信息矩阵为I (θ)=1σ2⎣⎢⎢⎢⎢⎢⎡12N 0002A 2π2�n 2N−1n=0A 2π�n N−1n=00A 2π�nN−1n=012NA 2⎦⎥⎥⎥⎥⎥⎤=1σ2⎣⎢⎢⎡12N00013N (N −1)(2N −1)A 2π213N (N −1)(2N −1)A 2π212N (N −1)A 2π12NA 2⎦⎥⎥⎤8设观测模型为设观测模型为z i =a +w i ,i =0,1,…,N −1 式中,随机变量a 为信号幅值,E [a ]=0,E [a2]=A(A 为已知常数),w i是零均值白噪声,E �w i w j �=σ2δij,E [wi a ]=0,求a 的线性最小均方估计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章参数估计
第一节点估计
点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性)
第二节区间估计
抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大样本总体均值的区间估计
第三节其他类型的置信区间
σ未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区间估计
第四节抽样平均误差
简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均抽样误差·系统抽样的抽样平均误差
第五节样本容量的确定
影响样本容量的因素·抽样条件与样本容量的确定
一、填空
1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和()。
2.对总体均值求置信区间的方法是:从()起向两侧展开一定倍数()的抽样平均误差(),并估计 很可能就包含在这个区间之内。
3.假设在某省抽样调查的1600名城镇待业人员中有1024名青年,则待业人员中青年占比重的0.95 置信区间为()。
4.在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原来的()。
二、单项选择
1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是()估计。
A 有效
B 一致
C 无偏
D 精确
2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个()的估计量。
A 有效
B 一致
C 无偏
D 精确
3.估计量的()指统计量的抽样分布集中在真实参数周围的程度。
A 有效性
B 一致性
C 无偏性
D 精确性
4.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大到原来的()。
A 2倍
B 3倍
C 4倍
D 5倍
5.除抽样误差X σ外,影响允许误差X Δ大小的因素还有( )。
A 总体标准差
B 样本标准差
C 推断估计的把握程度
D 随机因素。
6.在用样本指标推断总体指标时,把握程度越高则( )。
A 误差范围越小
B 误差范围越大
C 抽样平均误差越小
D 抽样平均误差越大
三、多项选择
1.在统计中,为了确定每一种估计究竟如何,就必须掌握以下标准( )。
A 无偏性
B 精确性
C 一致性
D 有效性
E 权变性 2.对于大样本,置信区间的大小主要由( )这两个量所决定。
A Z B
μ C
X
σ D E(X)
3.影响抽样误差的因素有( )。
A 总体标志变异程度
B 样本标志值的大小
C 样本容量
D 抽样方法
E 抽样方式
4.影响样本容量大小的因素有( )。
A 总体标准差大小
B 允许误差的大小
C 置信度
D 抽样方法
E 抽样方式
5.在其他条件不变的情况下,抽样极限误差的大小与置信度的关系是( )。
A 抽样极限误差范围越大,置信度越大
B 成正比关系
C 抽样极限误差范围越小,置信度越小
D 成反比关系
E 抽样极限误差范围越大,置信度越小 6.分层抽样误差的大小主要取决于( )。
A 总体标志值的变异程度
B 各层内标志值的变异程度
C 各层间标志值得变异程度
D 各层样本容量的大小
E 各层样本容量的分配方法 7.在概率度一定的条件下,( )。
A 置信区间越大,应抽取的单位数越多
B 置信区间越小,应抽取的单位数越多
C 抽样估计的效度要求越高,应抽取的单位数越少
D 抽样估计的效度要求越低,应抽取的单位数越少
E 应抽取的单位数也是确定的
四、名词解释
1.点估计 2.区间估计 3.置信区间
五、判断题
1.就参数估计而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。
( ) 2.抽样平均误差X σ可以认为是决定区间估计信度的关键因素。
( ) 3.进行区间估计,置信水平总是预先给定的。
( ) 4.在参数估计中,概率度的大小由显著性水平α所决定,它可以认为是决定区间估计信度的关键因素。
( )
5.可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。
( )
六、计算题
1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:5.23=X (岁),3=S (岁),求置信水平为95%的初婚年龄的置信区间。
(已知t 0。
05(21) =1.721、t 0。
05(20) =1.725、t 0。
025(21) =2.080、t 0,025(20) =2.086)。
2.某工厂妇女从事家务劳动时间服从正态分布N (μ,2
66.0)。
根据36人的随机抽样调查,每天平均从事家务劳动时间X 为:X =2.65小时。
求μ的双侧置信区间(置信度取0.95和0.99两种)。
3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P 的置信区间(置信度为0.95)。
4.某工厂根据200名青年职工的抽样调查,得知其中有60%参加各种形式的业余学习。
求青年职工参加业余学习成数的区间估计。
(置信水平取0.90)
5.电视台要调查电视观众收看电视剧《渴望》的收视率。
问在95%的置信度下,允许误差%5+,问样本容量需要多大才能最大限度地满足调查要求?
试以0.95的置信度估计该企业职工的月平均工资收入所在范围。
7.某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:9.6、10.2、9.8、10.0、10.4、9.8、10.2。
如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛肉干盒平均重量的置信区间是多少?
8.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。
9.如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估计误差不超过6%,试问调查的样本容量应该有多大?
10.若某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03 的95%的置信区间,需要多大样本?若住房拥有者的比例改为0. 5,那么建立总宽度为0.03 的95%的置信区间,又需要多大样本?
11. 已知总体X服从正态分布N(100,32),1X,2X,…n X是正态总体X的样本,X 为样本均值,若概率P{X≤101}≥0.95,问样本容量n至少应取多大?
七、问答题
1.简述统计量成为总体参数的合理估计的三个标准。
2.简述在参数估计中准确性和可靠性的辨正统一的关系。