2.3 区间估计
测量不确定度评定与表示

测量不确定度评定与表示1. 引言在测量过程中,无法避免地会产生不确定度。
不确定度是指测量结果和所要求的真实值之间的差异。
在科学研究和工程应用中,评估和表示测量结果的不确定度是十分重要的,因为不正确的评定和表示不确定度可能会引起误导、误判和错误决策。
2. 不确定度评定的基本原理不确定度评定的基本原理可以归纳为以下几点:2.1 测量误差的来源常见的测量误差来源包括系统误差、随机误差和人为误差。
系统误差是指由于测量仪器、环境条件和操作方法等方面引起的误差,是可检验和可纠正的。
随机误差是指由于测量过程中的偶然因素引起的误差,是不可预知和不可消除的。
人为误差是指由于操作人员主观能力和判断产生的误差,可以通过培训和规范化操作来减小。
2.2 不确定度的评定方法不确定度的评定方法主要包括标准不确定度法、扩展不确定度法和仪器不确定度法。
标准不确定度法是指根据测量数据的统计特性确定的测量结果的不确定度,常用的统计方法有标准偏差法和方差法。
扩展不确定度法是指在标准不确定度的基础上,考虑到各种扩展因素进行修正和改进的方法,主要应用于复杂测量方法和环境条件。
仪器不确定度法是指根据仪器精度和仪器特性确定的测量结果的不确定度,常用的方法有精度等级法和重复测量法。
2.3 不确定度的表示方式不确定度的表示方式主要有点估计和区间估计两种。
点估计是指用一个确定的数值来表示测量结果的不确定程度,常用的点估计方法有标准偏差、标准误差和置信区间。
区间估计是指用一个范围来表示测量结果的不确定程度,常用的区间估计方法有置信区间和预测区间。
3. 不确定度评定的具体步骤不确定度评定的具体步骤可以分为以下几个环节:3.1 确定测量目标和测量方法首先需要明确测量的目标和所采用的测量方法。
测量目标是指所要测量的物理量或属性,测量方法是指测量目标的具体实现方式。
3.2 收集和整理测量数据采集和整理测量数据是评定不确定度的基础。
对于连续型变量,可以采用抽样方法获取一定数量的数据样本;对于离散型变量,可以进行事实调查和观察。
分布函数的左闭右开-概述说明以及解释

分布函数的左闭右开-概述说明以及解释1.引言1.1 概述分布函数是概率论和统计学中常用的概念,用于描述随机变量的概率分布情况。
通常情况下,分布函数是在实数轴上定义的,它给出了在给定点之前的所有可能取值的累积概率。
然而,有一种特殊的分布函数形式,被称为"左闭右开"分布函数。
与传统的分布函数不同,左闭右开分布函数在区间的左端点上取得累积概率值,但在区间的右端点上不取得累积概率值。
这种形式的分布函数在统计学和概率论的研究中具有一定的独特性和应用价值。
在本篇文章中,我们将深入讨论左闭右开分布函数的定义、特点和应用。
首先,我们将介绍分布函数的基本概念,并对传统分布函数与左闭右开分布函数进行比较。
接着,我们将详细探讨左闭右开分布函数的特点和性质,以及它与常见分布函数的异同之处。
在了解了左闭右开分布函数的基本概念后,我们将进一步探讨它在实际问题中的应用场景。
通过具体的实例和案例,我们将展示左闭右开分布函数在风险管理、随机模拟等领域中的优势和适用性。
同时,我们也将分析左闭右开分布函数的局限性和不足之处,以及在某些情况下可能存在的误用和风险。
最后,我们将对本文进行总结,并对左闭右开分布函数的特性、优势以及未来发展进行展望。
我们相信,通过对左闭右开分布函数的深入研究和应用,将为统计学和概率论领域的研究者提供一种新的分布函数形式,有助于更好地解决实际问题和提升研究水平。
通过本文的阅读,读者将能够全面了解左闭右开分布函数的概念和特点,并了解它在实际问题中的应用价值。
同时,读者也将对左闭右开分布函数的优势和局限性有更清晰的认识,并能对未来发展进行合理的预测和展望。
下面,我们将首先介绍分布函数的定义和特点。
1.2 文章结构本文将按照以下结构进行阐述和讨论分布函数的左闭右开特性和其应用。
首先,引言将概述本文的主题和目的,为读者提供整体的背景和了解。
在概述中,将介绍分布函数的基本定义和一般特点,并说明为什么我们对左闭右开特性感兴趣。
第二章 简单线性回归模型-参考

33
2.3.1 回归线过样本均值
由 1 Y 2 X ,知:Y 1 2 X 即样本均值点( X , Y ) 满足回归线方程
Y 1 2 X
Y
SRF
( X ,Y )
X
34
2.3.2 残差和为零 ei 0 (Residuals Sum to Zero)
40
2.4.2 无偏性
由2.2.4,知:
2 2 ci u i ,
又 E( u i ) 0 易得: E( 2 ) 2 , E( 1 ) 1
X i 是非随机的,或者虽然 X i 是随机的,
ui 但是与 是不相关的; X i 无测量误差; 变量和函数形式设定正确。
24
假定的两个方面: (2)关于随机扰动项 u i
也称高斯假定、古典假定 假定1 零均值: E (u i / X i ) 0 2 假定2 同方差: Var(u i / X i ) 假定3 无自相关:Cov(ui , u j ) 0, i j 假定4 随机扰动项 u i与 X i 不相关。 即:Cov( X i , ui ) 0. u i 服从正态分布, 假定5 u i ~ N (0, 2 ) 即:
一定方法得出 近似看成是
SRF的参数
总体函数的参数
Yi 1 2 X i ei
SRF1:
PRF2: Yi
1 2 X i ui
(观察参数的对应估计关系)
21
第二节 简单线性回归模型的 最小二乘估计(OLS)
本节主要介绍: 2.1 简单线性回归模型的基本假定 2.2 普通最小二乘法(OLS) 2.3 OLS回归线的性质 2.4 最小二乘估计的统计性质
参数估计实验报告

参数估计实验报告1. 背景参数估计是统计学中的一个重要概念,用于根据样本数据估计总体的未知参数。
在实际研究和应用中,参数估计广泛应用于各种领域,如医学、工程、经济学等。
本次实验目的是通过一个案例来了解参数估计的基本原理和方法。
我们将使用一个假设的数据集,根据样本数据估计总体的未知参数,并分析估计结果的准确性和可靠性。
2. 分析2.1 数据集描述我们使用的数据集是一组某电商平台用户的购买金额数据。
数据集包括1000个样本,每个样本表示一个用户的购买金额。
我们的目标是估计所有用户的平均购买金额。
2.2 参数的选择在本次实验中,我们选择了总体的平均购买金额作为参数进行估计。
平均购买金额是一个重要的指标,能够反映用户的购买行为和消费水平。
2.3 方法选择为了估计总体的平均购买金额,我们采用了两种常见的参数估计方法:点估计和区间估计。
点估计是通过样本数据得到某个具体值作为总体参数的估计值。
在本次实验中,我们选择了样本的平均值作为总体平均购买金额的点估计。
区间估计是通过样本数据得到一个区间范围,包含总体参数的真实值的可能性。
在本次实验中,我们使用了置信区间作为总体平均购买金额的区间估计。
2.4 实验步骤我们按照以下步骤进行参数估计实验:1.导入数据集,查看数据的基本信息。
2.计算样本的平均值作为总体平均购买金额的点估计。
3.计算置信区间,得到总体平均购买金额的区间估计。
4.对估计结果进行分析,评估估计的准确性和可靠性。
3. 结果3.1 数据集描述我们导入数据集,并查看了数据的基本信息。
数据集总共包括1000个样本,每个样本表示一个用户的购买金额。
数据的平均值为100元,标准差为50元。
3.2 点估计我们计算了样本的平均值作为总体平均购买金额的点估计。
通过样本计算得到的平均值为95元。
点估计结果表示,在我们的样本中,用户的平均购买金额大约为95元。
3.3 区间估计我们使用了95%的置信水平计算了总体平均购买金额的置信区间。
第二章 简单随机抽样

第二章简单随机抽样§2.1 引言§2.2 估计量§2.3 样本量的确定§2.4 其他问题§2.1 引言➢简单随机抽样也称为纯随机抽样.从抽样框内的N个抽样单元中随机地、逐个抽取n个单元组成样本,在每次抽选时,总体中每个单元入样的概率都相等,这n个被抽中的单元就构成了简单随机样本。
➢简单随机样本也可以从总体中一次取得全部n 个单元,要求全部可能的样本每种样本被抽得的概率都相等。
➢放回抽样与不放回抽样⏹抽选方法➢抽签法当总体不大时,可以用均匀同质的材料制作N个签,将其充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,接着抽下一个签直到第n个签为止,则这n个签上所示的号码表示入样的单元号。
➢随机数法当总体较大时,抽签法实施起来很困难,这时可以利用随机数表、随机数骰子、计算机产生的伪随机数进行抽样。
※随机数表随机数表是由数字0,1,…,9组成的表,每个数字都有同样的机会被抽中。
常用的做法:根据总体大小N的位数决定在随机数表中随机抽取几列,如N=678,要取n=5的样本,则在随机数表中随机抽取3列,顺序往下,选出头5个001~678之间互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽满n个单元为止。
※随机数骰子随机数骰子是由均匀材料制成的正20面体,面上标有0~9的数字各2个。
我国“运筹”牌随机数骰子一盒有6个不同颜色的骰子,使用时,根据总体大小N的位数,如N=327的位数是3,则将3个不同颜色的骰子放入盒中,并规定每种颜色所代表的位数,如红色代表个位数,蓝色代表十位数,黄色代表百位数等,盖上盒盖,摇动盒子,使骰子充分旋转,然后打开盒盖,读出骰子所表示的数字,重复上述步骤,直到产生n个不同的随机数。
※计算机产生伪随机数不少统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点,但需要注意的事,利用计算机产生的随机数是伪随机数,并不能保证其随机性。
庞皓计量经济学练习题及参考解答第四版

练习题2.1表2.9中是中国历年国内旅游总花费(Y)、国内生产总值(X1)、铁路里程(X2)、公路里程数据(X3)的数据。
表2.7 中国历年国内旅游总花费、国内生产总值、铁路里程、公路里程数据资料来源:中国统计年鉴(1)分别建立线性回归模型,分析中国国内旅游总花费与国内生产总值、铁路里程、公路里程数据的数量关系。
(2)对所建立的回归模型进行检验,对几个模型估计检验结果进行比较。
【练习题2.1参考解答】(1)分别建立亿元线性回归模型建立y与x1的数量关系如下:建立y与x2的数量关系如下:建立y与x3的数量关系如下:(2)对所建立的回归模型进行检验,对几个模型估计检验结果进行比较。
关于中国国内旅游总花费与国内生产总值模型,由上可知,,说明所建模型整体上对样本数据拟合较好。
对于回归系数的t检验:,对斜率系数的显著性检验表明,GDP 对中国国内旅游总花费有显著影响。
同理:关于中国国内旅游总花费与铁路里程模型,由上可知,,说明所建模型整体上对样本数据拟合较好。
对于回归系数的t检验:,对斜率系数的显著性检验表明,铁路里程对中国国内旅游总花费有显著影响。
关于中国国内旅游总花费与公路里程模型,由上可知,,说明所建模型整体上对样本数据拟合较好。
对于回归系数的t检验:,对斜率系数的显著性检验表明,公路里程对中国国内旅游总花费有显著影响。
2.2为了研究浙江省一般预算总收入与地区生产总值的关系,由浙江省统计年鉴得到如表2.8所示的数据。
年份一般预算总收入(亿元)地区生产总值(亿元)年份一般预算总收入(亿元)地区生产总值(亿元)Y X Y X 197827.45123.721998 401.80 5052.62 197925.87157.751999 477.40 5443.92198031.13179.922000 658.42 6141.03 198134.34204.862001 917.76 6898.34 198236.64234.012002 1166.58 8003.67 198341.79257.092003 1468.89 9705.02 198446.67323.252004 1805.16 11648.70 198558.25429.162005 2115.36 13417.68 198668.61502.472006 2567.66 15718.47 198776.36606.992007 3239.89 18753.73 198885.55770.252008 3730.06 21462.69 198998.21849.442009 4122.04 22998.24 1990101.59904.692010 4895.41 27747.65 1991108.941089.332011 5925.00 32363.38 1992118.361375.702012 6408.49 34739.13 1993166.641925.912013 6908.41 37756.58 1994209.392689.282014 7421.70 40173.03 1995 248.50 3557.55 2015 8549.47 42886.49 1996 291.75 4188.53 2016 9225.07 47251.36 1997 340.52 4686.11(1)建立浙江省一般预算收入与全省地区生产总值的计量经济模型,估计模型的参数,检验模型的显著性,用规范的形式写出估计检验结果,并解释所估计参数的经济意义(2)如果2017年,浙江省地区生产总值为52000亿元,比上年增长10%,利用计量经济模型对浙江省2017年的一般预算收入做出点预测和区间预测(3)建立浙江省一般预算收入的对数与地区生产总值对数的计量经济模型,估计模型的参数,检验模型的显著性,并解释所估计参数的经济意义。
实验设计与数据处理L2-有限数据统计处理
(5)格鲁布斯(Grubbs)检验法
步骤:
① 将一组数据由小到大排列,x1,x2……xn-1, xn,求出平均 值 x 与标准偏差s;
② 计算统计量T, (x1为可疑值时);
(xn为可疑值时)或
③ 比较T和Ta,n的大小,若T > Ta,n ,则对应的可疑值舍去, 否则保留。
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
(4)迪克逊检验法(Dixon) 步骤: ① 将一组数据由小到大排列,x1,x2……xn-1, xn,设xn或x1
为可疑值; ② 用不同的公式计算r值(表3-2),并查表得到相应的临界
值; ③ 比较r和r表的大小,若r >r表,则对应的疑值舍去,否则保
留。
2.4 异常样本值的判断和处理 Experiment Design and
这一区间称为置信区间,一般为95%的置信度。
置信区间是一个随机区间 ( , ), 它覆盖未知参
数具有预先给定的概率(置信水平), 即对于任
意的 , 有 P{ } 1 .
Experiment Design and Data Processing
2.2 测量结果的区间估计 Experiment Design and
Data Processing
注意事项
计算平均值及标准偏差s 时,应包括可疑值在内 可疑数据应逐一检验,不能同时检验多个数据
首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数 ,应重新计算平均
值及标准偏差 能适用于试验数据较少时
例3-4
2.4 异常样本值的判断和处理 Experiment Design and
D、对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计 方法。
2.1 线性回归模型概述
△几点注意
– 不线性相关并不意味着不相关; 不线性相关并不意味着不相关; – 有相关关系并不意味着一定有因果关系; 有相关关系并不意味着一定有因果关系; – 相关分析对称地对待任何( 两个 )变量,两 变量, 相关分析对称地对待任何 对称地对待任何 个变量都被看作是随机的;回归分析对变量的 个变量都被看作是随机的;回归分析对变量的 处理方法存在不对称性,即区分因变量( 处理方法存在不对称性,即区分因变量(被解 不对称性 释变量)和自变量(解释变量):前者是随机 释变量)和自变量(解释变量):前者是随机 ): 变量,后者不是。 变量,后者不是。
• 回归与因果关系
– 回归分析研究的一个变量对另一个变量的依 赖关系可以是一种因果关系,但也可能不是 因果关系。 – 统计关系本身不可能意味着任何因果关系
• 回归与相关
– 回归分析和相关分析都是研究变量间关系的统计学 课题 – 两者的主要差别: 两者的主要差别: – ◇回归分析中需要区别自变量和因变量;相关分析 回归分析中需要区别自变量和因变量; 中则不需要区分 – ◇相关分析中所涉及的变量y与x全是随机变量。而 相关分析中所涉及的变量y 全是随机变量。 回归分析中,因变量y是随机变量,自变量x 回归分析中,因变量y是随机变量,自变量x 可以 是随机变量, 是随机变量,也可以是非随机的确定变量 –◇相关分析的研究主要是为刻画两类变量间线性相 ◇ 关的密切程度。而回归分析不仅可以揭示变量X 关的密切程度。而回归分析不仅可以揭示变量X对 变量y的影响大小, 变量y的影响大小,还可以由回归方程进行预测和 控制
描出散点图发现:随着收入的增加,消费 “平均地说”也在增加,且Y的条件均值均落在 平均地说” 平均地说 总体回归线。 一根正斜率的直线上。这条直线称为总体回归线 总体回归线
参数估计2
n
e n
i
x !
i 1 n i 1
ii ) ln L( x1 , x 2 ,..., x n ; ) xi ln n ln xi !
i 1
xi ln L( x1 , x2 ,...,xn ; ) i 1 n 0 iii)令 : 1 n iv)解之得 : xi x为 的极大似然估计值 , n i 1 1 n X i X 为 的极大似然估计量 . n i 1
(1)正态分布N (u, 2 ) (2)指数分布Z ( ) (3)均匀分布U (a, b) (4)二项分布B(n, p) (3)泊松分布 ( ) 试求其中未知参数的矩 估计. 解 : (1)
因为X ~ N ( , 2 ), E ( X ) , D( X ) 2 故有 X ,
注2
若 为 的矩估计量, g ( )为 的连续函数, 亦称g ( )为g ( )
2 2 例如S n 为总体方差D( X )的矩估计量, 则S n S n 为标准差 D( X )
的矩估计量. 的矩估计量.
例1.1
设X 1 , X 2 ,..., X n为来自正态总体 X 的样本, X的分布为
i 1 n n
( X为连续型)
(1.4) (1.5)
或
L( x1 , x2 ,..., xn ) PX i xi ;
i 1
( X为离散型)
达到最大值
L( x1 , x2 ,..., xn ; ) max L( x1 , x2 ,..., xn ; )
(1) 利用求导法求极大然估 计步骤 i )建立似然函数: L( x1 , x 2 ,..., x n ; 1 , 2 ,..., r ) f ( xi ; 1 , 2 ,..., r )
参数估计
•L( θ)=Π f(xi;θ) •MLE就是要求使得似然函数达到极大的θ 作为该参数的估计量,记为ˆ ,并称 ˆ 为参数θ的极大似然估计
统计应用
二战中的经济情报
统计应用
4-2 参数估计
1 参数估计的一般问题 2 一个总体参数的区间估计 3 不同抽样技术的估计(略) 4 样本容量的确定
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 样本容量的确定方法
总体均值的区间估计
(例题分析)
• 【例4.3】某企业生产某种产品的工人有 1000人,某日采用重复抽样从中随机抽取 100人,调查他们的当日产量为35件,产量 的样本标准差为4.5件,试以95.45%的置信 度估计平均产量的抽样极限误差和置信区 间。
总体均值的区间估计
(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量(单位:g)如下表所示。已知产品重量的 分布服从正态分布,且总体标准差为10g。试估计该批产品 平均重量的置信区
统计方法
描述统计
推断统计
参数估计
假设检验
统计推断的过程
总体
样
样本统计量
本
如:样本均值、
比例、方差
1 参数估计的一般问题
1.1 估计量与估计值 1.2 点估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§3 区间估计 问题:未知参数的点估计是取),,,(21nXXXg, 事实上只有
),,,(21nxxxg, 这种估计的近似程
度如何? 3.1 区间估计概述 (1)定义:设母体X的分布函数),(xF形式已知, 其中是未知参数,nXXX,,,21是来自X的一个子样,给定
实数)10(,构造),,,(211nXXX,
),,,(212nXXX
两个统计量,使得
1)},,,(),,,({212211nnXXXXXXP
则称),(21是的置信概率为1的置信区间(confidence interval),1和2分别为置信下限和置信上限(lower, upper confidence limit),1为置信水平(confidence level),12为置信区间长度. 置信水平又称为置信概率或置信度,表示未知参数的真值落入该置信区间的可信程度;置信区间长度体现了估计的精度。 例2.3.1 已知某炼铁厂的铁水含碳量X(%)在正常情况下服从正态分布,且标准差108.0。现测量5炉铁水,其含碳量分别是 4.28,4.40,4.42,4.35,4.37(%) 试以置信概率95%对母体均值作区间估计。 数学模型:设有正态母体),(~2NX,202
已知,从母体中抽得子样值
nxxx,,,21,要求以置信概率)1,0(1对母体均值作区间估计。 解:①的点估计可取为X; ②由抽样分布定理1知
)1,0(~ 0NnXU
(3.1) 称U为枢轴量(pivotal statistic). ③给定置信概率为1)10(,则存在2u,使
1}{2uUP
(3.2) 即
1}{20unXP
亦即 3.3( 1}{0202nuXnuXP
于是,的置信概率为1的置信区间为) ,(0202nuXnuX.
④代入数值:108.00,5n,95.01,则05.0,查表知
96.1025.02uu,又由子样值算得364.4x,
于是,母体均值的置信概率为95%的置信区间是(4.269,4.459). (2)几点说明: ①区间估计的步骤
写出的点估计;找出含有及但不含任何其他未知参数,且分布已知的随机变量作为枢轴量;对于给定置信概率, 写出置信区间表达式;代入数值. ②为何取对称区间 上例中取对称区间22uUu时得
到置信区间) ,(0202nuXnuX长度为
nuL0212;若取不对称区间21uUu,使得1}{21uUuP,可求得置信区间为) ,(0102nuXnuX,置信区间长度为
10201222)(LnunuuL. (图示说明
2122uuu)
③当n取定时,置信概率与置信区间长度的关系 置信概率1越大时,值越小,2u
越大,从而置信区间长度nuL0212越大,参数估计的精度越差。相反,置信概率1越小时,参数估计的精度越高。
④对置信区间与置信概率的进一步解释 上例得到置信区间
) ,(0202nuXnuX,是一个随机区间,随抽样结果的不同而成为不同的数值区间,这些数值区间中有95%包含的真值。或理解为每个这样的数值区间包含的真值的概率为95%。
如抽样获得上例中子样值时,置信区间是(4.269,4.459),此区间包含
的真值的概率为95%,置信区间长度的一半是0.095,表示用364.4x估计的误差范围。
3.2 大子样对母体均值的区间估计 问题: 设母体X的分布是任意的,2)(,)(XDXE
均存在且未知,从母体
X中抽大子样50,,,,21nXXXn,试以概率)1,0(1对母体均值作区间估计。 解:①的点估计可取为X; ②由中心极限定理知
)1,0( ~Nn
X近似
,但其中是未知参数,
注意到2S是2的渐进无偏相合估计量,故在大子样情形,有
)1,0( ~NnSXU近似
以此随机变量作为枢轴量. ③给定置信概率为1)10(,则存在,2u使
1}{ 2uUP
,即 1}{2unSXP 亦即 1}{22nSuXnSuXP 于是,的置信概率为1的置信区间为) ,(22nSuXnSuX. 例2.3.2 从某台机床加工的零件中取出50个,量其长度,并算得8.19x,39.02ns,求的置信概率为%99的置信区间. 解:50n,属大子样情形。给定置信概率1,的置信区间为
),(22unSXunSXnn.
这时01.0,查表知58.2005.02uu,又8.19x,39.02ns,从而62.0nS,于是,母体均值的置信概率为%99的置信区间是)03205719(., .. 例2.3.3 现从一批产品中取100个样品,得次品12个,求次品率p的置信概率为%95的置信区间。 解:设母体X为从这批产品中任取一个所得的次品数,则
当取得正品当取得次品01X,pXE)(,100n
故此问题属大子样情形下对母体均值的区间估计。给定置信概率1,p的置信
区间为),(22unSXunSXnn. 这时100n,05.0,查表知96.1025.02uu,又12.010011001iixx,
106.012.012.0100122100122xxsiin,从而
326.0nS,于是,母体均值p的置信概率为%95的置信区间是)184.0,056.0(.
3.3 正态母体均值的区间估计 例2.3.1中已分析了方差已知时正态母体均值的区间估计,现在考虑方差未知时正态母体均值的区间估计。 问题:母体),(~2NX,2未知,求
的置信概率为1)10(的置信区间。 解: ①的点估计可取为X; ②由抽样分布定理2③知
)1(~*ntnSXTn
以此随机变量为枢轴量. ③给定置信概率为1)10(,则存在)1(2nt,使
1)}1({ 2ntTP,即
1)}1({ 2*ntnSXP
n
亦即 1})1()1({*2*2nSntXnSntXPnn 故的置信概率为1的置信区间为))1( ,)1((*2*2nSntXnSntXnn.
例2.3.4 假设铅的比重测量值),(~2NX,如果测量16次,算得
705.2x,029.0*ns,求铅的比重的
置信概率为%95的置信区间。 解:此问题属于方差未知时对正态母体均值的区间估计。 给定置信概率1,的置信区间
为))1(,)1((*2*2nSntXnSntXnn . 这时,16n,05.0,查表知131.2)15()1(025.02tnt,又705.2x,
029.0*ns,于是母体均值的置信概率为
%95的置信区间是)720.2,690.2(.
3.4 大子样对两母体均值之差的区间估计 问题:设母体iX的分布是任意的,2)(,)(iiiiXDXE均存在且未知,独立地
从两母体中抽取大子样
50,,,,21iiniinXXXi,iX是子样均值,2iS是
子样方差,2,1i. 试以概率)1,0(1对母体均值之差21作区间估计。 解:①21的点估计可取为21XX; ②由中心极限定理知
),(2~iiiinNX近似
由两子样独立性知两子样均值独立,故
),(2221212121~nnNXX近似
)1,0()()( ~2221212121NnnXX近似 但其中2i是未知参数,注意到2iS是2i的渐进无偏相合估计量,故在大子样
情形,有