统计学第6章参数估计
统计学中的参数估计方法

统计学中的参数估计方法统计学中的参数估计方法是研究样本统计量与总体参数之间关系的重要工具。
通过参数估计方法,可以根据样本数据推断总体参数的取值范围,并对统计推断的可靠性进行评估。
本文将介绍几种常用的参数估计方法及其应用。
一、点估计方法点估计方法是指通过样本数据来估计总体参数的具体取值。
最常用的点估计方法是最大似然估计和矩估计。
1. 最大似然估计(Maximum Likelihood Estimation)最大似然估计是指在给定样本的条件下,寻找最大化样本观察值发生的可能性的参数值。
它假设样本是独立同分布的,并假设总体参数的取值满足某种分布。
最大似然估计可以通过求解似然函数的最大值来得到参数的估计值。
2. 矩估计(Method of Moments)矩估计是指利用样本矩与总体矩的对应关系来估计总体参数。
矩估计方法假设总体参数可以通过样本矩的函数来表示,并通过求解总体矩与样本矩的关系式来得到参数的估计值。
二、区间估计方法区间估计是指根据样本数据来估计总体参数的取值范围。
常见的区间估计方法有置信区间估计和预测区间估计。
1. 置信区间估计(Confidence Interval Estimation)置信区间估计是指通过样本数据估计总体参数,并给出一个区间,该区间包含总体参数的真值的概率为预先设定的置信水平。
置信区间估计通常使用标准正态分布、t分布、卡方分布等作为抽样分布进行计算。
2. 预测区间估计(Prediction Interval Estimation)预测区间估计是指根据样本数据估计出的总体参数,并给出一个区间,该区间包含未来单个观测值的概率为预先设定的置信水平。
预测区间估计在预测和判断未来观测值时具有重要的应用价值。
三、贝叶斯估计方法贝叶斯估计方法是一种基于贝叶斯定理的统计推断方法。
贝叶斯估计将先验知识与样本数据相结合,通过计算后验概率分布来估计总体参数的取值。
贝叶斯估计方法的关键是设定先验分布和寻找后验分布。
社会统计学(卢淑华)_第六章

第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q 2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n
样本方差
S 2 的方差
:D2 S
4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
第五节 正态总体的区间估计
一、置信度、置信区间
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为
Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)
置信区间与置信度的关系:
统计学 第 6 章 抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
《医学统计学》第六章+参数估计与假设检验

2、该地所有人收缩压的均数可能在什么范围?
医学统计学(第7版)
三、总体均数的区间估计
(一)σ 已知
➢ 如果变量 X 服从均数为 μ、标准差为 的正态分布,则: z
服从标准正态分布。则:
P X 1.96
X 1.96
0.95
(二)σ 未知
1. t 分布
➢ 事实上,总体标准差 通常是未知的,这时我们可以用其估计量S代替 ,但
在这种情况下,( X ) / ( S /
n)
已不再服从标准正态分布,而是服从著名的 t 分布。
William Gosset
不同自由度的t分布图
医学统计学(第7版)
2. 可信区间的计算
S12 S22
n1 n2
2 ,v
医学统计学(第7版)
例题
➢ 例6-4 评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性,将102名患
者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,
试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准
样本率的标准差称为率的标准误(standard error of rate),可用来描述样
本率抽样误差的大小。率的标准误越小,则率的抽样误差越小,率的标
准误越大,则率的抽样误差越大。公式为:
p
(1 )
n
2. 率的标准误的估计
在一般情况下,总体率 π 往往是未知的,此时可用样本率 P 来估计总体
标准差与标准误的比较
标 准 差
标 准 误
统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。
4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。
统计学参数估计PPT课件

在应用参数估计时,需要注意样本的代表性、数据的准确性和可靠性等问题, 以保证估计的准确性和可靠性。
对未来研究的建议
01
进一步探讨参数估计的理论基础
可以进一步探讨参数估计的理论基础,如大数定律和中心极限定理等,
以更好地理解和掌握参数估计的方法和原理。
02
探索新的估计方法
随着统计学的发展,可以探索新的参数估计方法,以提高估计的准确性
指导决策
评估效果
基于参数估计结果,制定科学合理的 决策。
利用参数估计,评估政策、项目等实 施效果。
预测未来
通过参数估计,预测未来的趋势和变 化。
02
参数估计的基本概念
点估计
定义
点估计是用一个单一的数值来估 计未知参数的值。
举例
在调查某班级学生的平均身高时, 我们可能使用所有学生身高的总 和除以人数来估计平均身高,这 里的总和除以人数就是点估计。
最小二乘法的缺点是假设误差项独立 同分布,且对异常值敏感,可能影响 估计的稳定性。
最小二乘法的优点是简单易行,适用 于线性回归模型,且具有优良的统计 性质。
贝叶斯估计法
贝叶斯估计法是一种基于贝叶 斯定理的参数估计方法,通过 将先验信息与样本数据相结合 来估计参数。
贝叶斯估计法的优点是能够综 合考虑先验信息和样本数据, 给出更加准确的参数估计。
高维数据的参数估计问题
1 2 3
高维数据对参数估计的影响
随着数据维度的增加,参数估计的复杂度和难度 也会相应增加,容易出现维度诅咒等问题。
高维数据参数估计的方法
针对高维数据,可以采用降维、特征选择、贝叶 斯推断等方法进行参数估计,以降低维度对估计 的影响。
统计学-单个样本数据的参数估计
作出决策
将计算得到的检验统计量的值与 拒绝域进行比较,作出是否拒绝 原假设的决策。
结果解释与讨论
结果解释
对点估计、区间估计和假设检验的结果进行解释,说明各项结果 的含义和实际意义。
结果比较与讨论
将不同方法得到的结果进行比较和讨论,分析各种方法的优缺点和 适用范围,以及可能存在的误差和影响因素。
实例意义与启示
实例选择
01
选择某一具体领域的实例,如医学、经济学或社会学等,确保
实例具有代表性和实际意义。
背景介绍
02
简要介绍实例的研究背景、目的和意义,以及相关的统计学概
念和理论。
数据收集
03
说明数据的来源、收集方法和处理过程,包括ຫໍສະໝຸດ 据的类型、样本量、抽样方法等。
点估计和区间估计计算过程展示
选择合适的估计量
根据实例特点和研究目的,选择 合适的估计量,如均值、比例、 方差等。
3
最小二乘法估计的优缺点
优点是计算简便,易于理解和实现;缺点是对于 非线性模型,最小二乘法可能导致有偏估计。
点估计评价标准
无偏性
指估计量在多次重复抽样下的平均值等于被估计参数的真值。无偏性保证了估计量的长期平均性 能。
有效性
指对于同一总体参数的两个无偏点估计量,有更小方差的估计量更有效。有效性反映了估计量的 精度。
假设检验与参数估计关系
01
假设检验用于判断总体参数是否等于某个特定值或属于某个特定区间,而参数 估计则是给出总体参数的一个数值范围或点估计值。
02
假设检验与参数估计都是基于样本数据对总体进行推断的方法,但假设检验更 注重于对总体参数的假设进行判断,而参数估计则更注重于给出总体参数的一 个具体数值范围或点估计值。
统计学第6章习题答案精编版
一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D、绝对包含总体均值或绝对不包含总体均值3、估计量的无偏性是指(B)A、样本估计量的值恰好等于待估的总体参数B、所有可能样本估计值的期望值等于待估总体参数C、估计量与总体参数之间的误差最小D、样本量足够大时估计量等于总体参数4、下面的陈述中正确的是(C)A、95%的置信区间将以95%的概率包含总体参数B、当样本量不变时,置信水平越大得到的置信区间就越窄C、当置信水平不变时,样本量越大得到的置信区间就越窄D、当置信水平不变时,样本量越大得到的置信区间就越宽5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所求置信水平的临界值乘以(A)A、样本均值的标准误差B、样本标准差C、样本方差D、总体标准差6、95%的置信水平是指(B)A、总体参数落在一个特定的样本所构造的区间内的概率为95%B、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为95%C、总体参数落在一个特定的样本所构造的区间内的概率为5%D、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为5%7、一个估计量的有效性是指(D)A、该估计量的期望值等于被估计的总体参数B、该估计量的一个具体数值等于被估计的总体参数C、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C 、一个大样本给出的总体参数的估计区间一定包含总体参数D 、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A )A 、点估计B 、区间估计C 、无偏估计D 、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C )A 、置信区间B 、显著性水平C 、置信水平D 、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C )A 、置信水平确定B 、统计量的抽样标准差确定C 、置信水平和统计量的抽样标准差确定D 、统计量的抽样方差确定13、在置信水平不变的条件下,要缩小置信区间,则(A )A 、需要增加样本量B 、需要减少样本量C 、需要保持样本量不变D 、需要改变统计量的抽样标准差14、估计一个正态总体的方差使用的分布是(C )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是(B )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布16、当正态总体的方差未知,在大样本条件下,估计总体均值使用的分布是(A )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布17、在其他条件不变的条件下,要使估计时所需的样本量小,则应该(A )A 、提高置信水平B 、降低置信水平C 、使置信水平不变D 、使置信水平等于118、使用t 分布估计一个总体均值时,要求(D )A 、总体为正态分布且方差已知B 、总体为非正态分布C 、总体为非正态分布但方差已知D 、正态总体方差未知,且为小样本19、在大样本条件下,总体均值在(1-α)置信水平下的置信区间可以些为(C )A 、n t x σα2±B 、ns t x 2α± C 、n s z x 2α± D 、n s z x 22α±20、正态总体方差已知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(C )A 、n z x 22σα± B 、n s t x 2α±C 、n z x σα2±D 、n t x σα2±21、正态总体方差未知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(B )A 、n s z x 2α±B 、ns t x 2α±C 、n z x σα2±D 、n s z x 22α±22、指出下面的说法哪一个是正确的(A )A 、样本量越大,样本均值的抽样标准差就越小B 、样本量越大,样本均值的抽样标准差就越大C 、样本量越小,样本均值的抽样标准差就越小D 、样本均值的抽样标准差与样本量无关23、抽取一个样本量为100的随机样本,其均值为81=x ,标准差12=s 。
06-医学统计学参数估计
两药平均退热天数之差的95%可信区间为(1.00,1.80) 天。
总体率的估计
总体率的区间估计 • 小样本率的区间估计 在样本例数较小,且样本率接近1或0时,利用二项 分布可估计其总体率的(1-α)可信区间。 当n≤50,样本例数n和阳性例数X≤n/2时,直接查 表得到95%和99%可信区间。
当阳性例数X>n/2时,用n-X查表,获得总体阴性 率可信区间,再用1减去总体阴性率可信区间,既为总 体阳性率可信区间。
t分布
t分布(t-distribution),最早由戈 塞于1908年提出,主要用于总体均数 的区间估计和t检验等。
W. S. Gosset
t分布 若样本含量为n的样本均数 X 服从总体均数为μ 、总体 2 标准差为 x 的正态分布 N (, X ) ,则通过z变换可将其 转换为标准正态分布N(0, 12 ),即z分布。
parameter
统计推断 statistical inference 假设检验 estimation
知总体参数的一个范围。
hypothesis
testing
点估计 欲调查某市2015年7岁正常发育男孩的身高 随机抽取该市9名7岁正常发育男孩,计算得X =121.44cm, S=5.75cm 某市2015年7岁正常发育男孩的平均身高为121.44cm,标准 差为5.75cm
可信区间
• 可信度为95%可信区间的涵义: 若重复100次样本含量相同的抽样,每个样本均按同一 方法构建95%可信区间,则理论上平均有95个可信区间 包含了总体均数,只有5个可信区间未包含。
• 可信区间估计的优劣: • 准确性,反映可信度1-α的大小,其值越接近1越好。 • 精确性,用可信区间的宽度CU-CL衡量,宽度越小 越好。
参数估计的一般步骤
参数估计的一般步骤参数估计是统计学中的一种方法,用于根据样本数据估计总体参数的取值。
它在各个领域都有广泛的应用,例如经济学、医学、社会学等。
本文将介绍参数估计的一般步骤,帮助读者了解如何进行参数估计。
一、确定参数类型在进行参数估计之前,首先需要确定要估计的参数类型。
参数可以是总体均值、总体比例、总体方差等,根据具体问题来确定。
二、选择抽样方法接下来,需要选择合适的抽样方法来获取样本数据。
常用的抽样方法有简单随机抽样、系统抽样、分层抽样等。
选择合适的抽样方法可以保证样本的代表性,从而提高参数估计的准确性。
三、收集样本数据在进行参数估计之前,需要收集样本数据。
收集样本数据时要注意数据的准确性和完整性,避免数据采集过程中的偏差。
四、计算点估计量得到样本数据后,可以计算点估计量来估计总体参数的取值。
点估计量是根据样本数据计算得出的一个具体数值,用来估计总体参数的未知值。
常见的点估计量有样本均值、样本比例等。
五、构建置信区间除了点估计量,还可以构建置信区间来估计总体参数的取值范围。
置信区间是一个区间估计,表示总体参数的真值有一定的概率落在该区间内。
置信区间的计算方法与具体的参数类型有关,可以利用统计学中的分布理论或抽样分布来计算。
六、进行假设检验除了估计总体参数的取值,参数估计还可以用于假设检验。
假设检验是根据样本数据来判断总体参数是否符合某个特定的假设。
在假设检验中,需要先提出原假设和备择假设,然后计算检验统计量,最后根据统计显著性水平来判断是否拒绝原假设。
七、解释结果需要对参数估计的结果进行解释和说明。
解释结果时要清楚、简洁,避免使用过于专业的术语,以便读者能够理解和接受。
参数估计是统计学中重要的内容之一,它可以帮助我们从有限的样本数据中推断总体的特征。
通过合理选择抽样方法、收集准确的样本数据,并运用适当的统计方法,我们可以得到准确可靠的参数估计结果,为实际问题的决策提供科学依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
x Z /2
}1 n
另 E 代表所希望达到的允许误差,则 E Z / 2
n
所以: n
(Z /2 )2
E2
2
样本容量的确 定
总体比率 的置信区间为: p Z / 2
(1 )
n
若 E 代表所希望达到的允许误差,则:
E Z /2
举例:为了研究某地区外资企业职工的月收入情况,从全部职工中任意抽取 400 人, 得知其平均月收入为 2000 元,标准差是 400 元,试估计全部职工的平均月收入的置信区间, 置信水平为 95.45%。
解答:n=400,1 95.45%, Z / 2 2 (查找与1 ( / 2) 相对应的值)(反过来查)
正态变量标准化: x ~ N (0,1) / n
1
Z /2
Z /2
P{Z / 2
x / n
Z /2} 1
P{x Z / 2
n
x Z /2
}1 n
在有些情况下,总体方差 2 未知,可以用 s 2 代替,则置信区间为:
P{x Z / 2
s n
x
Z /2
s }1 n
1.大样本下总体均值的区间估计
解答: Z / 2 2 E=2%
n
(Z /2 )2 (1
E2
)
22
95% 5% 0.02 2
475
注意:p 应取使 p(1-p)最大的 p 值,p=95%.
三、必要抽样数目的影响因素
• 1.总体方差 (2 越大,容量越大)
• 2.允许误差范围(越大,容量越小) • 3.置信度 1(越大,容量越大) • 4.抽样方法(重复抽样大于不重复抽样) • 5.抽样组织方式
二、总体比率的区间估计
大样本条件下,样本比率 p 近似服从正态分布,即:( 为总体比率)
p N ( , (1 ))
n
p N (0,1) (1 )
n
总体比率 的置信区间为:
p Z /2
(1 )
n
当这里 恰好是我们要估计的,所以用样本比率 p 去代替 。
所以置信区间为: p Z / 2
二、点估计与区间估计
• 点估计 • 区间估计
1.点估计point estimation
• 用样本估计量 ˆ 来估计总体参数 。 • 点估计的方法:矩估计法、极大似然估计
法。
2.区间估计interval estimation
区间估计是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
设总体参数为 , L 、U 为样本确定的两个统计量,对于给定的 ( 0 1 ),有:
第六章 参数估计
王新华 武汉工业学院 经管学院
主要内容
• 6.1参数估计的一般问题 • 6.2一个总体参数的区间估计 • 6.3样本容量的确定
重点与难点
• 重点:一个总体参数的区间估计(分几种 情况)
• 难点:区间估计的理解、区间估计的计算
6.1参数估计的一般问题
• 估计量与估计值 • 点估计与区间估计 • 评价估计量的标准
P(L U ) 1
则( L ,U )为参数 的置信水平为1 的置信区间。 为显著性水平。
置信水平(confidence level)表示如果我们构造置信区间的步骤重复多次,置信区间中 包含总体参数真值的次数所占的比率。
三、评价估计量的标准
1.无偏性(unbiasedness) E(ˆ)
2.有效性(efficiency)
假定有两个用于估计总体参数的无偏估计量 ˆ1 、 ˆ2 ,它们的抽样分布的方差分别用 D( ˆ1 )、D(ˆ2 )表示,如果:D(ˆ1 )<D(ˆ2 ),则ˆ1 是比ˆ2 更有效的一个估计量。
3.相合性(consistency)(一致性) 随着样本容量的增大,点估计量的值越来越接近被估总体的参数。(一个大样本给出的 估计量要比一个小样本给出的估计量更接近总体的参数)
p(1 p) n
二、总体比率的区间估计
例如:要了解某校一次四级考试的通过率,随即抽取了 400 名学生,其中 256 人通过, 试以 95%的置信水平估计该校四级通过率的置信区间。
解答:n=400,p=256/400=64%, Z /2 1.96
所以四级通过率的置信区间为:
p Z /2
p(1 p) 64% 1.96 n
一、估计量与估计值
• 所谓参数估计(parameter estimation)就 是用样本统计量去估计总体的参数。例如:
用样本均值 x去估计总体均值 ,用样本方
差 s 2去估计总体方差 2,用样本比率p估计 总体比率P。 • 在参数估计中,总体参数为 ,用来估计总 体参数的统计量的名称,称为估计量 (estimator),用符号 ˆ 表示。用来估计总 体参数时计算出来的估计量的具体数值, 称为估计值。估计值因为样本不同而不同。 (参数一般是固定的,但未知)。
解答: x 21.8, s 0.37
根据 0.05,查 t 分布表 t /2 (n 1) t0.025 (4) 2.7764
则置信区间为: x t / 2
s 21.8 2.7764 0.37 21.8 0.47
n
5
即(21.33,22.27)为平均直径的 95%的置信区间。
再举例:140 页例 5.3
s/ n
1
t / 2
t / 2
P{t / 2
x s/ n
t / 2} 1
P{x t / 2
s n
x
t / 2
s }1 n
2.小样本下总体均值的区间估计
例如:某车间生产的螺杆直径服从正态分布,现随机抽取 5 只,测得直径(单位:毫
米):22.3,21.5,22.0,21.8,21.4。试求平均直径 的 95%的置信区间。
64% 36% 64% 2.4% 400
即(61.6%,66.4%)为四级通过率的 95%的置信区间。 再举例:141 页例 5.4。
6.3样本容量的确定
• 估计总体均值时样本容量的确定 • 估计总体比率时样本容量的确定 • 必要抽样数目的影响因素
一、估计总体均值时样本容量的确定
P{x Z / 2
6.2 一个总体参数的区间估计
• 总体均值的区间估计 • 总体比率的区间估计
一、总体均值的区间估计
• 大样本的估计方法 • 小样本的估计方法
1.大样本下总体均值的区间估计
当总体服从正态分布且 2 已知时,或者总体不是正态分布但为大样本时,样本均值 x
服从或近似服从正态分布,即:
x ~ N(, 2 ) n
(1 )
n
所以: n
(Z / 2 )2 (1
E2
)
一般用 p 来代替
二、估计总体比率时样本容量的确 定
例如:连续三年以来:某灯泡生产企业产品合格率水平分别是 96%、95%、98%,现 要对一大批待销售的灯泡作质量检验,若给定概率是 95.45%,允许误差不超过 2%,问至 少愁多少只灯泡才行?
x 2000 s=400
P{x Z / 2
s n
x
Z /2
s }1 n
即 P{2000 2 400 2000 2 400 } 95.45%
400
400
即 P{1960 2040} 95.45% 再举例:137 页例 5.1、5.2
2.小样本下总体均值的区间估计
如果总体服从正态分布,总体方差 2 未知,在小样本下(n<30),用样本方差去替代 2 , 则: t x ~ t(n 1)