第八章 参数估计

合集下载

第8章 参数估计

第8章 参数估计

f
x,
x 1 0
求参数 的极大似然估计.
0 x 1,
其它
解 设 X1, X 2 ,L , X n为来自总体的样本, 则似然函数为
L n x1x2L xn 1 ,
取对数后有:
nபைடு நூலகம்
ln L nln 1ln xi, i1
上式对 求导, 并令其为零, 则有
解之得
dln L
d
n
n i1
h X1, X2,L , Xn , 通过样本观测值 x1, x2,L , xn 所对应的估计值
h x1, x2,L , xn
作为总体参数的估) 计值. 记作
h x1, x2,L , xn .
点估计的意义: 在数轴上表示一个点.
区间估计的含义是: 依据样本来估计未知参数的某一 范围.
区间估计的具体实现: 由样本构造两个统计量:
h1 X1, X2,L , Xn , h2 X1, X2,L , Xn ,
再由观测值 x1, x2 ,L , xn 得到具体的区间
h1 x1, x2,L , xn , h2 x1, x2,L , xn ,
以此区间作为未知参数的区间估计.
二、两种常用点估计
下面讨论两种常用的点估计方法: 矩估计和极大似然 估计.
例5 设 X1, X 2 ,L X n 是取自于总体的一个样本, 其中
X : R0, , 因
1
E
X
2
,
因此 21 的矩估计为2 X .
例6 设 X1, X 2 ,L X n 是取自于总体的一个样本, X 的
密度函数为
f
x
1
x
,
0,
求 的矩估计. 这里 1.

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记之南宫帮珍创作第七章第八章参数估计一、思考题1.解释估计量和估计值在参数估计中, 用来估计总体参数的统计量称为估计量.估计量也是随机变量.如样本均值, 样本比例、样本方差等.根据一个具体的样本计算出来的估计量的数值称为估计值. 2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值即是被估计的总体参数.(2)有效性:是指估计量的方差尽可能小.对同一总体参数的两个无偏估计量, 有更小方差的估计量更有效.(3)一致性:是指随着样本量的增年夜, 点估计量的值越来越接近被估总体的参数.3.怎样理解置信区间在区间估计中, 由样本统计量所构造的总体参数的估计区间称为置信区间.置信区间的论述是由区间和置信度两部份组成.有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间), 其实不说明置信度, 也不给出被调查的人数, 这是不负责的暗示.因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的暗示.这样则可以由此推算出置信度(由后面给出的公式), 反之亦然.4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说, 无穷次重复抽样所获得的所有区间中有95%(的区间)包括参数.不要认为由某一样本数据获得总体参数的某一个95%置信区间, 就以为该区间以0.95的概率覆盖总体参数.5.简述样本量与置信水平、总体方差、估计误差的关系.1.估计总体均值时样本量n为其中:2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为▪与置信水平成正比, 在其他条件不变的情况下, 置信水平越年夜, 所需要的样本量越年夜;▪与总体方差成正比, 总体的不同越年夜, 所要求的样本量也越年夜;▪与与总体方差成正比, 样本量与估计误差的平方成反比, 即可以接受的估计误差的平方越年夜, 所需的样本量越小.二、练习题1.从一个标准差为5的总体中采纳重复抽样方法抽出一个样本量为40的样本, 样本均值为25.1)样本均值的抽样标准差即是几多?2)在95%的置信水平下, 估计误差是几多?解: 1)已知σ = 5, n = 40, = 25∵∴2)已知∵2.某快餐店想要估计每位顾客午餐的平均花费金额, 在为期3周的时间里选取49名顾客组成了一个简单随机样本.1)假定总体标准差为15元, 求样本均值的抽样标准误差.2)在95%的置信水平下, 求估计误差.3)如果样本均值为120元, 求总体均值µ的95%的置信区间.解:1)已知σ = 15, n = 49∵∴2)已知∵3)已知 = 120∵ 置信区间为±E3.从一个总体中随机抽取n =100的随机样本, 获得 =104560, 假定总体标准差σ = 85414, 试构建总体均值µ的95%的置信区间.解:已知n =100, =104560, σ = 85414, 1-a=95% ,由于是正态总体, 且总体标准差已知.总体均值m在1-a置信水平下的置信区间为104560 ± 1.96×85414÷√1004.从总体中抽取一个n =100的简单随机样本, 获得 =81, s=12.要求:1)构建µ的90%的置信区间.2)构建µ的95%的置信区间.3)构建µ的99%的置信区间.解:由于是正态总体, 但总体标准差未知.总体均值m在1-a置信水平下的置信区间公式为81±×12÷√100 = 81±×????????4)= 25, σ = 3.5, n =60, 置信水平为95%5)=119, s =23.89, n =75, 置信水平为98%6)=3.149, s =0.974, n =32, 置信水平为90%解:∵∴ 1) 1-a=95% ,其置信区间为:25±1.96×3.5÷√602) 1-a=98% , 则a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知:其置信区间为: 119±2.33×23.89÷√753) 1-a=90%,其置信区间为:3.149±1.65×0.974÷√325.利用下面的信息, 构建总体均值µ的置信区间:1)总体服从正态分布, 且已知σ = 500, n = 15, =8900, 置信水平为95%.解:N=15, 为小样本正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)2)总体不服从正态分布, 且已知σ = 500, n = 35, =8900,置信水平为95%.解:为年夜样本总体非正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)3)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为90%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=90%,1.65.其置信区间为:8900±1.65×500÷√35=(8761 9039)4)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为99%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=99%,2.58.其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)6.某年夜学为了解学生每天上网的时间, 在全校7500名学生中采用重复抽样方法随机抽取36人, 调查他们每天上网的时间, 获得下面的数据(单元:小时)(略).求该校年夜学生平均上网时间的置信区间, 置信水平分别为90%解:先求样本均值:= 3.32再求样本标准差:置信区间公式:7.从一个正态总体中随机抽取样本量为8的样本, 各样本值分别为:10, 8, 12, 15, 6, 13, 5, 11.求总体均值µ的95%置信区间.解:本题为一个小样本正态分布, σ未知.先求样本均值:= 80÷8=10再求样本标准差:于是 , 的置信水平为的置信区间是,已知, n = 8, 则,α/2=0.025, 查自由度为n-1 = 7的分布表得临界值所以, 置信区间为:10±2.45×3.4641÷√78.某居民小区为研究职工上班从家里到单元的距离, 抽取了由16个人组成的一个随机样本, 他们到单元的距离分别是:10, 3,14, 8, 6, 9, 12, 11, 7, 5, 10, 15, 9, 16, 13, 2.假设总体服从正态分布, 求职工上班从家里到单元平均距离的95%的置信区间.解:小样本正态分布, σ未知.已知, n = 16, , 则, α/2=0.025, 查自由度为n-1 = 15的分布表得临界值样本均值再求样本标准差:于是 , 的置信水平为的置信区间是?? ??????????????????±??×??÷√??9.从一批零件是随机抽取????个, 测得其平均长度是??????, 标准差是????.1)求确定该种零件平均长度的????August的置信区间.2)在上面估计中, 你使用了统计中的哪一个重要定理?请解释.解:)??这是一个年夜样天职布.已知N??????, ??????????????, S????????, α?? ????, .其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差, 那么, 不论这个总体的分布如何, 随着样本容量的增加, 样本均值的分布便趋近正态分布.在现实生活中, 一个随机变量服从正态分布未必很多, 可是多个随机变量和的分布趋于正态分布则是普遍存在的.样本均值也是一种随机变量和的分布, 因此在样本容量充沛年夜的条件下, 样本均值也趋近于正态分布, 这为抽样误差的概率估计理论提供了理论基础.10.某企业生产的袋装食品采纳自动打包机包装, 每袋标准重量为100克, 现从某天生产的一批产物中按重复抽样随机抽取50包进行检查, 测得每包重量如下:(略)已知食品包重服从正态分布, 要求:1)确定该种食品平均重量的95%的置信区间.2)如果规定食品重量低于100克属于分歧格, 确定该批食品合格率的95%的置信区间.解:1)本题为一个年夜样本正态分布, σ未知.已知N=50, µ=100, 1-α=0.95, .① 每组组中值分别为97、99、101、103、105, 即此50包样本平均值= (97+99+101+103+105)/5 = 101② 样本标准差为:③其置信区间为:101±1.96×1.666÷√502)∵ 分歧格包数(<100克)为2+3=5包, 5/50 = 10%(分歧格率), 即P = 90%.∴ 该批食品合格率的95%置信区间为:11.假设总体服从正态分布, 利用下面的数据构建总体均值μ的99%的置信区间.(略)解:样本均值样本标准差:尽管总体服从正态分布, 可是样本n=25是小样本, 且总体标准差未知, 应该用T统计量估计.1-α=0.99, 则α=0.01, α/2=0.005, 查自由度为n-1 =24的分布表得临界值的置信水平为的置信区间是,12.一家研究机构想估计在网络公司工作的员工每周加班的平均时间, 为此随机抽取了18个员工, 获得他们每周加班的时间数据如下(单元:小时):(略)假定员工每周加班的时间服从正态分布, 估计网络公司员工平均每周加班时间的90%的置信区间.解:① N = 18 < 30, 为小样本正态分布, σ未知.②样本均值样本标准差:=③ 1-α= 90%, α= 0.1, α/2= 0.05, 则查自由度为n-1 = 17的分布表得临界值④的置信水平为的置信区间是,13.利用下面的样本数据构建总体比例丌的置信区间:1)n =44, p = 0.51 , 置信水平为99%2)n =300, p = 0.82 , 置信水平为95%3)n =1150, p = 0.48, 置信水平为90%解: 1) 1-α= 99%, α= 0.01, α/2= 0.005, 1-α/2= 0.995, 查标准正态分布表, 则2)1-a=95%,3)1-a=90%,分别代入14.在一项家电市场调查中, 随机抽取了200个居民户, 调查他们是否拥有某一品牌的电视机, 其中拥有该品牌电视机的家庭占23%.求总体比例的置信区间, 置信水平分别为90%和95%.解: 1)置信水平90%, 1-a=90%, 1.65, N = 200, P = 23%.代入2)置信水平95%, 1-a=95%, , N = 200, P = 23%.代入15.一位银行的管理人员想估计每位顾客在该银行的月平均存款额.他假设所有顾客月存款额的标准差为1000元, 要求的估计误差在200元以内, 置信水平为99%.应选取多年夜的样本?解:已知 1-α = 99%, 则 2.58.E = 200, σ= 1000元.则N = (²×σ²)÷E²= (2.58²×1000²)÷200²≈167(得数应该是166.41, 不论小数后是几多, 都向上进位取整, 因此至少是167人)16.要估计总体比例丌, 计算下列条件下所需的样本量.1)E=0.02, 丌=0.40, 置信水平96%2)E=0.04, 丌未知, 置信水平95%3)E=0.05, 丌=0.55, 置信水平90%解: 1)已知 1-α = 96%, α/2 =0.02 , 则N = {²×丌(1-丌)}÷E²=2.06²×0.4×0.6÷0.02²≈25472)已知 1-α = 95%, α/2 =0.025 , 则丌未知,则取使丌(1-丌)最年夜时的0.5.N = {²×丌(1-丌)}÷E²=1.96²×0.5×0.5÷0.04²≈601 3)置信水平90%, 1-a=90%, 1.65,N = {²×丌(1-丌)}÷E²=1.65²×0.55×0.45÷0.05²≈27017.某居民小区共有居民500户, 小区管理者准备采纳一项新的供水设施, 想了解居民是否赞成.采用重复抽样方法随机抽取了50户, 其中有32户赞同, 18户反对.1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能到达80%, 估计误差不超越10%, 应抽取几多户进行调查(α=0.05)解:1)已知N=50, P=32/50=0.64, α=0.05, α/2 =0.025 , 则置信区间:P±2)已知丌=0.8 , E = 0.1, α=0.05, α/2 =0.025 , 则N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²≈6218.根据下面的样本结果, 计算总体标准差σ的90%的置信区间:1)=21, S=2, N=502)=1.3, S=0.02, N=153)=167, S=31, N=22解:1)年夜样本, σ未知, 置信水平90%, 1-a=90%,21±1.65×2÷√502)小样本, σ未知, 置信水平90%, 1-a=90%, 则查自由度为n-1 = 14的分布表得临界值, = 1.3±1.761×0.02÷√153) 年夜样本, σ未知, 置信水平90%, 1-a=90%,167±1.65×31÷√2219.题目(略)1)构建第一种排队方式等候时间标准差的95%的置信区间2)构建第二种排队方式等候时间标准差的95%的置信区间3)根据1)和2)的结果, 你认为哪种排队方式更好?解:本题为小样本正态分布, σ未知, 应用公式,置信水平95%, 1-a=95%, 则查自由度为n-1 = 9的分布表得临界值1)= 7.15,其置信区间为7.15±2.31×0.48÷√102)= √0/9 = 0其置信区间为7.15±04)第二种排队方式更好.(19题是对总体方差的估计, 应该用卡方统计量进行估计, 20题是对两个总体参数的估计, 这二种类型老师未讲, 不是本次考试的内容, 不能用Z统计量像估计总体均值和比例那样去估计, 具体内容见书上P188――P194)第九章假设检验一、思考题1.假设检验和参数估计有什么相同点和分歧点?解:参数估计与假设检验是统计推断的两个组成部份.相同点:它们都是利用样本对总体进行某种推断.分歧点:推断的角度分歧.参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数μ在估计前是未知的.而在假设检验中, 则是先对μ的值提出一个假设, 然后利用样本信息去检验这个假设是否成立.2.什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用α暗示, 在假设检验中, 它的含义是当原假设正确时却被拒绝的概率或风险, 即假设检验中犯弃真毛病的概率.它是由人们根据检验的要求确定的.(我理解的统计学意义, 统计显著是统计上专用的判定标准, 指在一定的概率原则下, 可以供认一种趋势或者合理性到达的水平, 到达为统计上水平显著, 达不到为统计上水平不显著)3.什么是假设检验中的两类毛病?解:弃真毛病(α毛病):当原假设为真时拒绝原假设, 所犯的毛病成为第I类毛病, 又称为弃真毛病.犯第I类毛病的概率常记作α.取伪毛病(β毛病):当原假设为假时没有拒绝原假设, 所犯的毛病称为第II类毛病, 又称取伪毛病.犯第II类毛病概率常记作β.发生第I类毛病的概率也常被用于检验结论的可靠性怀抱.假设检验中犯第I类毛病的概率被称为显著性水平, 记作α.4.两类毛病之间存在什么样的数量关系?在样本容量n一定的情况下, 假设检验不能同时做到犯α和β两类毛病的概率都很小.若减小α毛病, 就会增年夜犯β毛病的机会;若减小β毛病, 也会增年夜犯α毛病的机会.要使α和β同时变小只有增年夜样本容量.但样本容量增加要受人力、经费、时间等很多因素的限制, 无限制增加样本容量就会使抽样调查失去意义.因此假设检验需要慎重考虑对两类毛病进行控制的问题.5.解释假设检验中的P值.解:如果原假设为真, 所获得的样本结果会像实际观测结果那么极端或更极真个概率, 称为P值.也称为观察到的显著性水平.P值是反映实际观测到的数据与原假设H0之间纷歧致水平的一个概率值.P值越小, 说明实际观测到的数据与H0之间纷歧致水平就越年夜.6.显著性水平与P值有何区别?解:α(显著性水平)是一个判断的标准(当原假设为真, 却被拒绝的概率), 而P是实际统计量对应分位点的概率值(当原假设为真时, 所获得的样本观察结果或更极端结果呈现的概率).可以通过α计算置信区间, 然后与统计量进行比力判断, 也可以通过统计量计算对应的p值, 然后与α值比力判断.7.假设检验依据的基来源根基理是什么?解:假设检验利用的是小概率原理, 小概率原理是指发生概率很小的随机事件在一次试验中是几乎不成能发生的.根据这一原理, 可以先假设总体参数的某项取值为真, 也就是假设其发生的可能性很年夜, 然后抽取一个样本进行观察, 如果样本信息显示呈现了与事先假设相反的结果且与原假设分歧很年夜, 则说明原来假定的小概率事件在一次实验中发生了, 这是一个违背小概率原理的分歧理现象, 因此有理由怀疑和拒绝原假设;否则不能拒绝原假设.8. 你认为在单侧检验中原假设和备择假设的方向应该如何确定?解: 假设问题有两种情况, 一种是所考察的数值越年夜越好(左单侧检验或下限检验), 临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验), 临界值和拒绝域均在右侧.二、 练习题1. 已知某炼铁厂的含碳量服从正态分布N (4.55, 0.108²), 现在测定了9炉铁水, 其平均含碳量为4.484.如果估计方差没有变动, 可否认为现在生产的铁水平均含碳量为4.55(α=0.05)? 解: 已知μ0=4.55, σ²=0.108², N=9, =4.484,这里采纳双侧检验, 小样本, σ已知, 使用Z 统计.假定现在生产的铁水平均含碳量与以前无显著不同.则, α=0.05, α/2 =0.025 , 查表得临界值为计算检验统计量: = (4.484-4.55)/(0.108/√9) 决策:∵Z 值落入接受域, ∴在=0.05的显著性水平上接受H0. nx Z / σ - =μ0结论:有证据标明现在生产的铁水平均含碳量与以前没有显著不同, 可以认为现在生产的铁水平均含碳量为4.55.2. 一种元件, 要求其使用寿命不得低于700小时.现从一批这种元件中随机抽取36件, 测得其平均寿命为680小时.已知该元件寿命服从正态分布, σ=60小时, 试在显著性水平0.05下确定这批元件是否合格.解: 已知N=36, σ=60, =680, μ0=700这里是年夜样本, σ已知, 左侧检验, 采纳Z 统计量计算. 提出假设:假定使用寿命平均不低于700小时H0:μ≥700H1: μ < 700= 0.05, 左检验临界值为负, 查得临界值: -Z0.05=-1.645计算检验统计量: = (680-700)/(60/√36) = -2决策:∵Z 值落入拒绝域, ∴在=0.05的显著性水平上拒绝H0, 接受H1结论:有证据标明这批灯胆的使用寿命低于700小时, 为分歧格产物.3. 某地域小麦的一般生产水平为亩产250公斤, 其标准差是30公斤.现用一种化肥进行试验, 从25个小区抽样, 平均产量为n x Z / σ - = μ0270公斤.这种化肥是否使小麦明显增产(α=0.05)?解:已知μ0 =250, σ = 30, N=25, =270提出假设:假定这种化肥没使小麦明显增产.即 H0:μ≤250H1: μ>250计算统计量:Z = (结论:Z统计量落入拒绝域, 在α =0.05的显著性水平上, 拒绝H0, 接受H1.决策:有证据标明, 这种化肥可以使小麦明显增产.4.糖厂用自动打包机打包, 每包标准重量是100千克.每天开工后需要检验一次打包机工作是否正常.某日开工后测得9包重量(单元:千克)如下:(略)已知包重服从正态分布, 试检验该日打包机工作是否正常.(α =0.05)= 99.98提出假设, 假设打包机工作正常:即 H0:μ= 100H1: μ≠100计算统计量:决策:有证据标明这天的打包机工作正常.5. 某种年夜量生产的袋装食品, 按规定不得少于250克.今从一批该食品中任意抽取50袋, 发现有6袋低于250克.若规定不符合标准的比例超越5%就不得出厂, 问该批食品能否出厂(=0.05)?H0:丌≤5%H1:丌>5%(因为没有找到丌暗示的公式, 这里用P0暗示丌0)结论:因为Z 值落入拒绝域, 所以在=0.05的显著性水平上, 拒绝H0, 而接受H1.决策:有证据标明该批食品合格率不符合标准, 不能出厂. 6. 某厂家在广告中声称, 该厂生产的汽车轮胎在正常行驶条件下超越目前的平均水平25000公里.对一个由15个轮胎组成的随机样本做了试验, 获得样本均值和标准差分别为27000公里和5000公里.假定轮胎寿命服从正态分布, 问该厂家的广告是否真- = ns x t μ0实(=0.05)?解:N=15,H0:μ0 ≤25000H1:μ >25000结论:因为t 值落入接受域, 所以接受H0, 拒绝H1.决策:有证据标明, 该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性不同, 该厂家广告不真实. 7. 某种电子元件的寿命x (单元:小时)服从正态分布.现测得16只元件的寿命如下:(略).问是否有理由认为元件的平均寿命显著地年夜于225小时(=0.05)? 解:= 241.5,H :μ??> ??创作时间:二零二一年六月三十日 - = ns x t - = ns x tμ0 μ0。

第八章 参数估计

第八章 参数估计
2

σ
即置信区间为[1446.16,2553.84] 显然我们有95%的把我说,总体平均值在1446.16 ~ 2553.84分之间
四、
σ
未知且大样本时总体平均数的区间估计
σ 未知但样本容量 n > 30 即大样本时,可用标准
正态分布近似地当作 t 分布,故此时的总体平均 数置信区间为
x ± zα sx
§8.2 总体平均数的区间估计
一、 样本取自总体方差已知的正态分布
如果总体服从正态分布 N ( µ , σ 2 ) ,且 σ 2 已知时, 且 已知时, 总体平均数的置信区间为: 总体平均数的置信区间为:
x ± z
α
2
σ
x
总体平均数区间估计的步骤: 总体平均数区间估计的步骤:
(1)确定置信水平,即可靠性或把握程度。一般来说对于估 确定置信水平,即可靠性或把握程度。 确定置信水平 计要求比较精确的话,置信程度也要求高些, 计要求比较精确的话,置信程度也要求高些,在社会经济 现象中通常用95% 现象中通常用 %就可以了 (2)根据置信度并利用标准正态分布表确定 z 值 根据置信度并利用标准正态分布表确定
二、 样本取自总体方差已知的非正态分布 在很多情况下,总体为非正态分布, 在很多情况下,总体为非正态分布,但由中心极限 定理, 足够大, 定理,当样本容量 n 足够大,无论总体服从什么分 的抽样分布将近似服从正态分布, 布, x 的抽样分布将近似服从正态分布,故可以用
x ± z α σ x 公式来近似求出总体平均的置信区间。 公式来近似求出总体平均的置信区间。
2
例8 − 2某职业介绍所的职员从某一职业的1000名申请者 中采用不重复抽样方式随机抽取了200名申请者,借此 估计1000名申请者考试的平均成绩,已知由200名申请者 构成的样本平均分 x = 78分,由已往经验已知总体方差 为90,但该职员不知总体服从何种分布,试求µ的90% 的置信区间?

概率论和数理统计(第三学期)第8章参数估计

概率论和数理统计(第三学期)第8章参数估计
n n 1
由契比雪夫不等式,有
P( S 2 ES2
n
n
)
DS
2
n

2 4
2 n 1 2
即 lim P( S 2 ES2 ) 0
n
n
n
(n 1)S 2
E
2
n n 1
ES2 2 n
故 lim P( S 2 2 ) 0
n
n
§8.3 参数的区间估计
定义
设是总体的未知参数,若 (1 1
6
S~2 1 1.20 0.162 0.85 0.162 0.30 0.162 6 0.45 0.162 0.82 0.162 0.12 0.162 1 1.042 0.692 0.142 0.612 0.982 0.282 6 1 2.99 6 0.498 2
n
p xi
1
p
1 xi
xi p i1
1
p
n
n xi
i1
i 1
n
令y xi,得: i 1 ln Lxi , p y ln p n yln1 p
由对数似然方程
d ln L y n y 0 dp p 1 p
解得
p
y n
1 n
n i 1
xi
x
因为这是惟一的解,所 以p的极大似然估计值为
二、顺序统计量法
定义
1
, 2
,
,
为总体
n
的一个样本,将它
们按大小次序排列,取 居中的一个数 (若n为偶
数时,则取居中两数的 平均值)记为~,称~为
样本中位数。

~
k
1
,
1 2
k

第8章参数估计习题解答

第8章参数估计习题解答

∑ ( xi − µ )2
i =1
n
.
23.
设( ( X 1 , X 2 , L , X n ) )是抽自总体 X : N ( µ , σ ) 的随机样本, a , b 为常数,且
2
0<a<b , 则 随 机 区 间 ⎜
nσ 2 nσ 2 − a b
( X i − µ )2 n ( X i − µ )2 ⎞ ⎟ 的长度的数学期望为 ∑ b ,∑ a i =1 ⎝ i =1 ⎠ ⎛
i =1 i =1
.
22. 设 X 1 , X 2 ,L , X n 是来自总体 X 数 L( µ , σ ) =
2
− 1 e ∏ 2π i =1 σ n ( xi − µ )2 2σ
2
N ( µ , σ 2 ) 的样本,则有关于 µ 及 σ 2 的似然函
− n 2 − n 2 − 1 2σ
2
= (2π ) (σ 2 ) e
的分布函数 Φ ( x ) 的函数值:Φ (1.645) = 0.95 ,Φ (1.96) = 0.975 ,Φ (1.282) = 0.90 .则在 显著水平 α = 0.05 , E ( X ) 的置信区间为( A ).
A. (1.216, 2.784) .
B. (1.342,
2.658) .
C. (1.4872,
ˆ = 2X . D. θ 4
7.
设总体 X 的密度函数为 P ( x,
⎧θx θ −1 0 < x < 1 , θ > 0 , ( X 1 , X 2 ,L , X n ) θ) = ⎨ ⎩o 其它
为样本,记 Ak =
1 n k ∑ X i , k = 1,2.3 ,则以下结论中错误的是( A ). n i =1

08.1参数的矩估计方法

08.1参数的矩估计方法


1(1,2 ,L ,k ) B1
2 (1,2 ,L ,k ) B2
LLLLLL
k (1,2 ,L ,k ) Bk
解得µl $l (B1, B2,L , Bk ),l 1, 2,L , k,并以$l作为参数l的
估计量,这种估计量称为矩估计量,矩估 计量的观察值就是矩估计值。
或者
Cl
矩估计法的理论依据: 大数定律
∵ X1, X2 , , Xn 是独立同分布的,
∴ X1k, X2k, , Xnk 也是独立同分布的.
于是有 E(X1k)=E(X2k)==E(Xnk)= E(Xk)=μk .
根据辛钦大数定律, 样本k阶矩Ak依概率收敛于总体k
阶矩μk ,即
Ak
1 n
n i 1
知参数1,2,…,k,即F=F(x;1,2,…,k), 总体X的前k 阶矩l =E(Xl )(l=1,2,…,k)存在, 它们是1,2,…,k的函数
l(1,2,…,k)(l =1,2,…,k)
假设X1,X2,…,Xn是总体X的一个样本,建 立统计量--样本l 阶原点矩Al (l=1,2,…,k),
试对参数给出估计。
1 n
E( X ) n i1 X i
一阶样本原 点矩
E(X 2)
1 n
n i 1
Xi
1 n
n i 1
Xi2
2
2
1 n
n i 1
Xi2
二阶样本原 点矩
解之得:
解之得:
)
1 n
n i 1
Xi
ˆ
2
1 n
n i 1
Xi2
(ˆ )2
从而得, 2
为: ) 1
ni

第八章(第一节矩估计法)

第八章(第一节矩估计法)


1
n
n i1
Xi
替换 E
X

即得 的另一矩估计量为
. ^
1 n
n i 1
Xi
此外还需比较估计的优劣性,
这一点将在下一节将会介绍,这里
不再多说。
为了对参数 和 2 进行估计,
我们从总体中抽取样本 X , X ,, X
1
2
n
(对于一次具体的抽取,他就是具
体的数值 x , x ,, x ,在不致引起混淆
1
2
n
的情况下,今后也用 x , x ,, x 表示随
1
2
n
机变量),根据样本矩在一定程度上
反映了总体矩的特征,自然想到用
样本矩作为总体矩的估计。
解由
x 1 (12.6 13.4 12.8 13.2) 13 ,
4
s 2 1 [(12.6 13)2 (13.4 13)2 (12.8 13)2 (13.2 13)2 ] 0.133 4 1
得 和 2的估计值分别为 13(mm)和
0.133(mm)2 。
例3 设总体 X 的概率密度为
就完全确定了。例如,总体
X ~ N(, 2),但不知道其中参数
和 2的具体数值,我们要想法确定 参数 , 2 。
为了寻求总体的这些参数的值,
我们可对总体进行调查,很自然的
会想到用从总体 X 中抽取得的样本
值 x , x ,, x ,对总体中的未知参数作
1
2
n
出来估计,这类问题就是参数估计。
参数估计主要有参数的点估计 和参数的区间估计。
例 1 某灯泡厂生产一批灯泡,
由于随机因素的影响,每个灯泡的

概率与数理统计初步

概率与数理统计初步

某批 灯泡的寿命
国产轿车每公里
的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体

每一个灯泡就是个体; 从中抽取10个进行试验, 10个灯泡为样本容量.
如果Q(1,2,n )是1,2,n 的函数,而且这个函数 中不含未知参数,则称 Q(1,2,n )是一个样本统计量.
几个常见统计量
这样的方法称为区间估计,[1,2 ]称为的1置信区间
1 和 2分别称为置信下限和置信上限. 显著性水平
1. 已知方差 2 时数学期望 的区间估计
设总体服从正态分布 ~ N(, 2 )
__
考虑统计量 U
n ,可以证明 U ~ N(0,1)
对于给定的置信水平 1
P( U ) () () 2() 1 1
… 知的仅仅是一个 … 或几个参数.
1. 点估计
由于1,2,n是来自总体,而总体的分布为 N(, 2 )
因此每个样本的分布都服从 N(, 2 ) .
结论
__
E( )
1 n
n i 1
E(i )
__
x
1 n
n
i1
xi
为总体均值μ的估计值.
E(S 2 ) D( ) 2
S2
n
1
1
n
i1
(
xi
__
__
x
S
__
,x
n
S n
我们用统计量 χ2
(n
1)S 2
2
做方差的区间估计,则
χ2
的分
布称为自由度为n-1的卡方分布,记为 2 ~ 2 (n 1)
χ 2 分布密度函数下图所示
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1500 1520 1510 1470
解:根据样本数据,计算样本均值=1490 h,样本方差S=24.77 h 根据α =0.05查t分布表得(n-1)=t0.025 (15)=2.131 于是,平均使用寿命的置信区间为:
x tα 2 S 24.77 1490 2.131 n 16 1490 13.2 1476.8, 1503.2
第八章
参数估计
本章内容
第一节 参数估计的一般问题
第二节
第三节
单总体参数的区间估计
样本容量的确定
第一节
参数估计的一般问题
参数估计在统计方法中的地位
统计方法
描述统计 推断统计 参数估计 假设检验
一、抽样推断 (一)抽样推断的概念:按照随机性原则,从研究对象中 抽取一部分进行观察,并根据所得到的观察数据,对研究 对象的数量特征做出具有一定可靠程度的估计和推断,以 达到认识总体的一种统计方法。 (二)抽样推断的特点: 1.样本资料对总体的数量特征作出具有一定可靠性。 2.按照随机性原则从全部总体中抽取样本单位。 3.抽样推断必然会产生抽样误差。
三、总体方差的区间估计
总体方差在(1-α )置信水平下的置信区间为:
n 1 S σ 2 n 1 S 2 2 χ α 2 n 1 χ 1α 2 n 1
2 2
例4:一家食品生产企业以生产袋装食品为主,现从某天生产的一批食 品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布 服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。 表8-7 25袋食品重量
25 1 93.21 2 25 1 93.21
39.3641 12.4011
即:总体方差的置信区间为(56.83,180.39)。
相应地,企业生产的食品总体重量标准差的的置信区间为7.54g~ 13.43 g。
第三节
样本容量的确定
一、估计总体均值时样本容量的确定
x μ t ~ t(n 1) S n
t 分布是类似正态分布的一种对称分布,它通常要比正 态分布平坦和分散。一个特定的分布依赖于称之为自由度的 参数。随着自由度的增大,分布也逐渐趋于正态分布,如图 8-7和图8-8所示:
图8-7
t分布与标准正态分布的比较 图8-8 不同自由度的t分布
• 总体均值 在1-置信水平下的置信区间为:
表8-3
置信水平 90 95 99 α 0.1 0.05 0.01
常用置信水平的值
α/2 0.05 0.025 0.005 Zα/2 1.645 1.96 2.58
点估计值

图8-3 重复构造出置信水平95%,的20个置信区间
三、评估估计量的标准
无偏性:估计量抽样分布的数学期望等于被估计的总体 参数。
5
二、参数估计的一般问题 (一)参数估计(parameter estimation)就是用样本统 计量去估计总体的参数。
1. 估计量:用于估计总体参数的随机变量 • 如样本均值、样本比率、样本方差等 • 样本均值就是总体均值的一个估计量 2. 参数用表示,估计量用 ˆ 表示 3. 估计值:估计参数时计算出来的统计量的具体值 • 如果样本均值 x =5600,则5600就是总体均值 的估计值
解: 已知总体服从正态分布, 且标准差为σ =10, n=25, 置信水平为 1-α =95%,查标准正态分布表得:
Z 2
=1.96
根据样本计算均值,得 x =105.36 g 于是有:
x Zα 2 σ 10 105.36 1.96 n 25 105.36 3.92 101.44,109 .28
S n
S n
非正态分布 大样本(n≥30) 的区间估计 1. 样本比例经标准化后的随机变量则服从正态分布,即:
Z p π π(1 π) n ~ N(0,1)
2. 总体比例在1-置信水平下的置信区间为:
p z α 2 p(1- p) n
式中,1-α 称为置信水平;
• 5.置信下限为105.36-3.78=101.58,置信上限为105.36+3.78= 109.14,即置信区间为(101.58,109.14)g。
(二)小样本的估计方法 总体方差σ 2未知,而且是在小样本的情况下,则需要用 样本方差S2代替σ 2,这时样本均值经过标准化以后的随机变 量则服从自由度为(n-1)的t分布,即:
一旦确定了置信水平(1-α ),Zα/2的值就确定了,对 于给定的的值和总体标准差σ ,就可以确定任一希望的允许 误差所需要的样本容量。令E代表所希望达到的允许误差, 即:
E zα 2
σ
n
由此可以推到出确定样本容量的公式如下:
n
(z α 2 ) σ
2
2
E2
例5:拥有MBA学位的研究生年薪的标准差大约为4000 元, 假定想要估计年薪95%的置信区间,希望允许误差为10000 元,应抽取多大的样本容量? 解:已知 =4000,E=1000,1-=95%, Zα /2=1.96,所以,应抽取的样本容量为:
表8-2
样本统计量和总体参数符号对应关系
总体参数 均值 比例 方差
符号表示 μ π σ
2
样本统计量
x
p S
2
(二)点估计与区间估计
1.点估计 根据样本统计量直接估计出总体参数θ 的值,称为参 数的点估计。常用的方法有两种:矩估计法和极大似然估 计法。 2.区间估计 在点估计的基础上,给出总体参数估计的一个范围。 图8-1给出了区间估计的示意图:
• 3.计算样本标准差,选择的函数为“统计”下的“STDEV”函数。本例 放在G1,得结果9.6545。
• 4.计算允许误差。选择“统计”下的“CONFIDENCE”函数,在出现的 “函数参数”对话框中,“Alpha”一栏填入显著性水平“0.05”, “Standard_dev”一栏填入总体标准差“G1”(大样本情况下,可用样 本标准差代替),“Size”一栏填入样本容量“25”,然后“确定”,在 输出区域内得允许误差“3.784490”(取近似值3.78)。
ˆ P( )
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
ˆ

图8-6 两个无偏点估计量的抽样分布
第二节
单总体参数的区间估计
一、总体均值的区间估计
(一)大样本的估计方法 1.样本均值经过标准化以后的随机变量则服从正态分布,
x μ 即Z ~ N(0, 1) σ n
2.总体均值所在(1-α )置信水平下的置信区间为:
x Z α 2
x Z α 2 σ n
称为置信下限,
σ n
x Z α 2 σ n
称为置信上限。
例1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企 业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产 的一批食品中随机抽取了25 袋,测得每袋重量如表8-3所示。已知产品重量 的分布服从正态分布,且总体标准差为10 g。试估计该批产品平均重量的置 信区间,置信水平为95%。 表8-3
即该批食品平均重量95%的置信区间为101.44~109.28 g。
利用Excel来计算置信区间
• 1.将样本数据输入Excel工作表中A1︰E5
• 2.计算样本均值。点击粘贴函数“fx”,选择“统计”下的“AVERAGE”函 数。在出现的“函数参数”对话框中,“Number1”一栏填入样本数据所在 x 区域A1︰E5,然后“确定”,在输出区域内(本例放置在F1)得结果105.36, 此即样本均值。
ˆ P( )
无偏 有偏
A
B

图8-4 有偏和无偏估计量的例子
ˆ
一致性:随着样本容量的增大,估计量的值越来越接 近被估计的总体参数。
ˆ P( )
较大的样本容量
B A
较小的样本容量

图8-5 两个不同容量样本统计量的抽样分布
ˆ
有效性:对同一总体参数的两个无偏点估计量,有更小 标准差的估计量更有效。
由于1- = 95%,查标准正态分布表可知,Zα /2=1.96。 于是
p zα 2
p(1 p) n 60% (1 60%) 100
60% 1.96 60% 9.604%
50.396%, 69.604%
即该城市家庭中,拥有电脑的比例在置信水平95%下的置信区间为: (50.396%,69.604%)。
E zα 2
π(1 π) n
由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如 下:
n
(zα 2 ) 2 π(1 π) E2
例6:某社区想通过抽样调查了解居民参加体育活动的比率,如果把 误差范围设定在5%,问如果以95%的置信水平进行参数估计,需要 多大的样本? 解:由于1-α =0.95,α =0.05,Zα /2 =1.96。 因为π 的值不知道,取使π (1-π )达到最大值的0.5, 即π 取0.5,于是: (z α 2 ) 2 π(1 π) n E2 2 (1.96) 0.5 (1 0.5) 0.052 384.16 385 故需取385人的样本。
(1.96)2 40002 n 2 E 10002 61.47 62
即应抽取62人作为样本。
(z α 2 ) 2 σ 2
二、估计总体比例时样本容量的确定
一旦确定了置信水平(1-α ),Zα /2的值就确定了。由于总体比例的 值是固定的,所以允许误差由样本容量来确定,样本容量越大允许误差就 越小。估计的精度就越好。因此,对于给定的的 值,就可以确定任一希 望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:
解:根据样本数据计算样本方差:
S2 =93.21; 已知n=25,1-=95% ,查χ 2分布表可得临界值为:
相关文档
最新文档