抽样推断中比例估计的几种方法及比较
抽样与抽样分布

抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
统计抽样的技术与方法

统计抽样的技术与方法统计抽样是在进行统计调查或研究时,从总体中选取部分样本以代表整体情况的一种方法。
抽样的目的是通过对样本的研究来推断和推断总体的性质。
合理的抽样技术和方法对于保证研究结果的可靠性和有效性至关重要。
在选择抽样技术和方法时,需要考虑到样本的代表性、随机性、可重复性等因素。
下面将介绍一些常用的抽样技术和方法。
1. 简单随机抽样:每个个体有相等的机会被选中为样本,抽样过程是完全随机的。
简单随机抽样方法适用于总体较小且各个个体之间没有明显差异的情况。
2. 系统抽样:按照一定的规则从总体中选择样本,例如每隔一定间隔选择一个样本。
系统抽样方法适用于总体有一定的规律性分布的情况。
3. 分层抽样:将总体按照某些特征分成若干层,然后从每一层中分别抽取样本。
分层抽样方法适用于总体有明显的层次结构并且每个层次之间差异较大的情况。
4. 整群抽样:将总体按照某些特征划分为若干群组,然后从每个群组中选择全部个体或者部分个体作为样本。
整群抽样方法适用于总体中群组内差异较小但群组间差异较大的情况。
5. 比例抽样:根据总体中某一特征的比例,从总体中选择样本。
比例抽样方法适用于总体中某一特征比例重要且已知的情况。
6. 整体抽样:将总体中的全部个体作为样本,适用于总体规模较小或者样本数量要求较高的情况。
7. 分级抽样:将总体按照不同级别的特征划分为若干层次,然后从每个层次中选择部分个体作为样本。
分级抽样方法适用于总体差异较大且层次结构明显的情况。
除了以上常用的抽样技术和方法外,还有一些特殊的抽样方法,例如聚类抽样、多阶段抽样、整群分层抽样等,这些方法在特定研究场景下具有一定的应用价值。
在进行抽样时,需要注意样本的大小和选择方法。
样本的大小应该符合统计学要求,即样本越大,估计的准确度越高,但是样本过大将增加调查成本和工作量。
选择方法需要灵活运用,根据研究对象和目的进行选择,确保样本的代表性和可靠性。
总之,抽样技术和方法是统计调查和研究中的重要环节,合理选择抽样技术和方法能够保证研究结果的可靠性和有效性。
统计学中的抽样调查技巧

统计学中的抽样调查技巧引言统计学是一门研究如何收集、整理、分析和解释数据的学科。
在统计学中,抽样调查是一种常用的方法,用于从总体中选取一部分样本,以便对总体进行推断和估计。
本文将探讨统计学中的抽样调查技巧,包括简单随机抽样、分层抽样、系统抽样和整群抽样。
一、简单随机抽样简单随机抽样是一种最常见的抽样方法,它要求每个个体有相同的概率被选中。
这种抽样方法的优点在于简单易行,且能够保证样本的代表性。
例如,我们想要调查某个城市的居民对某个政策的看法,可以使用简单随机抽样的方法,从人口登记册中随机选取一定数量的样本进行调查。
二、分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选取样本。
这种抽样方法能够保证各个层次在样本中的比例与总体中的比例相同,从而提高了样本的代表性。
例如,我们想要调查某个国家的教育水平,可以将总体按照地区、年龄、性别等因素进行分层,然后从每个层次中随机选取样本进行调查。
三、系统抽样系统抽样是指按照一定的规则从总体中选取样本。
例如,我们想要调查某个学校的学生对某门课程的满意度,可以按照学生的学号顺序,每隔一定的间隔选取一个样本进行调查。
这种抽样方法简单且高效,但要注意避免规则性的偏差。
四、整群抽样整群抽样是将总体划分为若干个群组,然后随机选取一部分群组作为样本。
这种抽样方法适用于总体中群组之间差异较小的情况,可以减少调查的成本和工作量。
例如,我们想要调查某个城市的交通状况,可以将城市按照行政区划划分为若干个区域,然后随机选取一部分区域进行调查。
五、抽样调查的注意事项在进行抽样调查时,需要注意以下几点:1. 样本容量的确定:样本容量的确定需要考虑总体的大小、抽样方法和研究目的等因素。
一般来说,样本容量越大,估计结果的准确性越高。
2. 抽样误差的控制:抽样误差是指样本估计值与总体真值之间的差异。
为了控制抽样误差,可以增加样本容量、改进抽样方法或增加调查的精度。
3. 数据收集的方法:数据收集可以通过面对面访谈、电话调查、网络调查等方式进行。
统计学中的抽样与推断

统计学中的抽样与推断在统计学中,抽样与推断是非常重要的概念。
它们涉及到我们如何从一小部分样本中推断出整个总体的特征。
在这篇文章中,我们将讨论抽样的不同方法以及如何使用样本数据进行推断。
一、抽样方法在统计学中,我们通常使用以下三种抽样方法:1. 简单随机抽样这是最基本的抽样方法。
简单随机抽样意味着从总体中随机抽出样本,每个样本被抽样的概率相等。
这种方法可以确保样本的代表性。
例如,如果我们要调查一个城市的人口,我们可以从人口登记簿中随机抽取一定数量的人口作为样本。
2. 分层抽样分层抽样是把总体划分为若干个层次,然后从每个层次中随机抽取样本。
这个方法可以减小代表性偏差。
例如,如果我们要调查一个城市的人口,我们可以按照不同的年龄段对总体进行分层,然后从每个年龄段中随机抽取一定数量的人口作为样本。
3. 系统抽样这是从总体中按照一定的规则抽样。
例如,如果我们要调查一个工厂中的员工,我们可以按照员工的工号顺序每隔一定数量抽取一个员工作为样本。
二、样本统计量的计算在进行统计推断之前,我们需要先计算样本统计量。
样本统计量是样本数据的数量指标,可以代表总体的特征。
常见的样本统计量包括:1. 样本均值样本均值是样本数据的平均值。
它可以代表总体的平均值。
例如,我们可以从一个城市的人口中随机抽取一部分人口,计算他们的平均收入,这个平均收入就是样本均值。
2. 样本标准差样本标准差是样本数据的标准差。
它可以代表总体的方差。
例如,我们可以从一个工厂中随机抽取一部分产品,计算它们的重量,这个重量的标准差就是样本标准差。
三、参数估计我们通常使用抽样中的样本统计量来估计总体参数。
例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。
常见的参数估计方法包括:1. 点估计点估计是用样本统计量来估计总体参数的方法。
例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。
2. 区间估计区间估计是用一个区间来估计总体参数的方法。
抽样估计

假如从中抽取30名,得到样本的平均数、标准差和成数是 x 1554420 x 51814 .00 n 30 2 30名中层干部。 则,样本:抽取到的 ( x x ) s 325009260 / 293347 .72 统计量:根据样本分布计算的综合指标,是样本变量的 n1 函数。 p 19 / 30 0 .63 另注意区分样本容量和样本个数: 样本容量是指一个样本所包含的单位数。 样本个数是指样本的可能数目。
2、样本平均数的标准差(Standard Deviation of x )
设 = 样 本 均 值 分 布 的 标 准 差 ; = 总 体 标 准 差 x
n=样本容量; N=总体单位个数 则,样本均值标准差随总体抽样方法和是否有限有所不同:
2 xΒιβλιοθήκη 不重置抽样时 N n 重置抽样时 ( 无限总体 ) ( 有限总体 ) ( )
0 .3 相 对 0 .2 频 数 0 .1
图4.1 500个 x 的相对频数分布 显然,不同的样本对应着不同的样本统计量,而由于样本 抽取的随机性,样本统计量即为一种随机变量。 一般地,样本统计量的可能取值及其取值概率,形成其概 率分布,统计上称为抽样分布(sampling distribution)。 ▲正是抽样分布及其特征使得用样本统计量估计总体参数 的“精确程度”能够给予概率上的描述。
2 p ~ N ( 0 . 6 ,0 . 089 )
四、正态分布
1、正态分布的密度函数
f( x )
式中 x 为正态分布的平均数, 是它的标准差。这两个 ( x, 2 ) 参数决定正态分布密度函数的形状。也可简记为N 正态分布密度函数有如下特性: (1)对称性。 (2)非负性。 (3)当x处于中心位置是, 密度函数值最大。 (4)在处为密度函数的拐点,越大图形越扁平。 (5)当x ±∞时,密度函数f(x) 0,即曲线向两边下垂, 伸向无穷远处。
统计推断中的抽样分布近似方法

统计推断中的抽样分布近似方法统计推断是统计学的重要分支,用于对总体进行估计和假设检验。
在统计推断过程中,抽样分布近似方法是一种常用的技术,可以通过近似方法进行总体参数的估计和假设检验。
本文将重点介绍统计推断中的抽样分布近似方法。
一、抽样分布统计推断的基础是抽样分布,即在总体中随机选取样本,通过样本的统计量来推断总体的参数。
抽样分布是样本统计量的分布,它反映了样本统计量的变异情况。
二、抽样分布近似方法抽样分布近似方法是一种利用已知的分布函数近似推断抽样分布的方法。
常用的抽样分布近似方法包括正态分布近似、t分布近似和卡方分布近似。
1. 正态分布近似正态分布近似是一种常用的抽样分布近似方法,适用于大样本情况。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布近似服从正态分布,且均值为总体均值,标准差为总体标准差除以样本容量的平方根。
2. t分布近似t分布近似是一种常用的抽样分布近似方法,适用于小样本情况。
当总体服从正态分布且样本容量较小时,使用t分布进行推断更为准确。
t分布的形状与样本容量有关,容量越小,t分布的尖峰越高、厚尾越短。
3. 卡方分布近似卡方分布近似是一种常用的抽样分布近似方法,适用于样本容量较大且总体服从正态分布的情况。
卡方分布近似可以用于对总体方差的估计和假设检验。
三、抽样分布近似方法的应用抽样分布近似方法在统计推断中有广泛的应用。
例如,在进行均值差异的假设检验时,可以利用抽样分布近似方法计算出均值差异的置信区间和p值。
在进行参数的点估计时,也可以利用抽样分布近似方法求出参数的估计值及其置信区间。
此外,抽样分布近似方法还可以应用于总体比例的估计和假设检验、总体方差的估计和假设检验等问题,具有广泛的适用性。
总结:本文主要介绍了统计推断中的抽样分布近似方法。
抽样分布近似方法是统计推断的基础,通过利用已知的分布函数对样本统计量的分布进行近似,从而进行总体参数的估计和假设检验。
常用的抽样分布近似方法包括正态分布近似、t分布近似和卡方分布近似。
统计学原理抽样调查

统计学原理抽样调查统计学原理是一门研究数据收集、整理、分析和解释的学科。
在统计学中,抽样调查是一种常用的数据收集方法。
抽样调查通过抽取一部分个体,称为样本,来推断整个总体的特征。
本文将介绍抽样调查的基本原理、常见的抽样方法以及优缺点。
抽样调查的基本原理是从目标总体中抽取一部分个体进行观察,然后将观察结果推广到整个总体。
抽样调查的目的是基于样本的统计数据,得出对总体特征的推断。
在进行抽样调查时,需要考虑以下几个因素:总体的定义、总体的大小、样本的大小、样本的抽取方法以及调查内容。
总体的定义是指研究的对象。
在抽样调查中,总体可以是人群、组织、产品、地域等。
总体的大小是指总体中所包含的个体数量。
样本的大小是指从总体中选取的个体数量。
合理选择样本大小可以在保证统计推断准确性的基础上节约成本和时间。
样本的抽取方法有多种,常见的抽样方法包括随机抽样、分层抽样、系统抽样和整群抽样等。
随机抽样是指以随机的方式从总体中选取个体。
随机抽样可以保证样本的代表性,即样本能够很好地反映总体的特征。
分层抽样是将总体按照一定的特征分成若干层,然后从每一层中选取样本。
通过分层抽样,可以保证各层样本在总体中的比例与总体的比例基本一致。
系统抽样是指从总体中的其中一位置开始,按照一定的间隔选取样本。
整群抽样是将总体分成若干群,然后从每一群中全面抽取样本。
抽样调查的优点在于相对于全面调查,它能够节约时间和成本。
通过从总体中选取一部分个体进行观察,可以得到与全面调查相似的结果。
此外,抽样调查还可以减少调查工作的复杂性和难度。
抽样调查的缺点是存在一定的抽样误差。
抽样误差是指由于样本的随机性导致的样本结果与总体真实结果之间的差异。
为了降低抽样误差,需要采用合理的抽样方法和样本大小,并进行合适的数据分析。
在抽样调查中,可以通过计算抽样误差的置信区间来评估统计结果的可靠性。
置信区间是指对总体特征的一个区间估计,该区间以样本统计量为中心,上下限由样本误差限定。
统计推断的基本解法

统计推断的基本解法统计推断是统计学的重要分支,用于从样本中推断总体特征。
在统计分析中,我们通常使用一些基础的解法来进行统计推断。
本文将介绍一些常用的基本解法。
点估计点估计是一种基本的统计推断方法,用于估计总体参数的值。
在点估计中,我们通过样本数据得到一个点估计量,作为总体参数的估计值。
例如,常见的点估计方法包括样本均值、样本方差和样本比例等。
区间估计区间估计是一种更精确的统计推断方法,用于估计总体参数的范围。
在区间估计中,我们通过样本数据得到一个区间估计量,包含了总体参数真值的可能范围。
例如,常见的区间估计方法包括置信区间和可信区间等。
假设检验假设检验是一种常用的统计推断方法,用于验证关于总体参数的假设。
在假设检验中,我们首先提出一个原假设和一个备择假设,然后使用样本数据来判断哪个假设更为合理。
例如,常见的假设检验方法包括单样本检验、双样本检验和方差分析等。
相关分析相关分析是一种用于研究变量之间关系的统计推断方法。
在相关分析中,我们通过计算相关系数来衡量变量之间的相关程度。
例如,常见的相关分析方法包括皮尔逊相关系数和斯皮尔曼相关系数等。
回归分析回归分析是一种用于预测和探索变量之间关系的统计推断方法。
在回归分析中,我们使用回归方程来建立变量之间的函数关系,并通过回归系数来解释这种关系。
例如,常见的回归分析方法包括线性回归和逻辑回归等。
综上所述,统计推断的基本解法包括点估计、区间估计、假设检验、相关分析和回归分析等。
这些方法在统计学领域中被广泛应用,帮助我们从样本中推断总体的特征和关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t n-t
已有:
P
(T=k|S)
=
CkCN-k
N+t-n
Σ t n-t CkCN-k
k=t
k=t, t+1, …, N+t-n。
Σ Σ Σ Σ 与第二种情况类似, P T=
N+1 n
t
|S
取到最大
值。
Σ Σ 得: T^4=
N+1 t n
Σ Σ 相应的P^4=
N+1 n
t
/N≈
t n
=p。
3.5 基于模型、 频率学派、 矩估计
服从一定的概率分布。
在只知道总体单元数为N, 没有其他信息的情
况下, T的先验分布为离散均匀分布:
P
(T=k)
=
1 N+1
,
k=0,
1,
2,
…,
N。
这等价于的先验分布也为离散均匀分布:
≈ ≈ P
P=
k N
=
1 N+1
,
k=0,
1,
2,
…,
N。
注: 这不同于 [0, 1] 之间的连续均匀分布。
事件S为 “样本中具有该特征的个数为t”
可见: 基于设计的理念认为总体取值是确定的, 立足于抽样设计, 考察在一定的抽样设计下, 如何 用随机样本去推断确定总体; 基于模型的理念认为 总体取值是随机的, 立足于总体之上 “超总体” 的 模型假定, 考察在一定的模型假定下, 如何用得到 的量去推断未得的量以及未知的参数。
值得注意的是, 两种理念下, 估计量本身的内 涵就不一样, 对估计量期望或方差的解释也不一样。
。
根据全概率公式, 还有:
乙b t t
n-t
P (a≤θ≤b, S) = a Cnθ (1-θ) dθ。
所以, 条件概率:
P
(a≤θ≤b|S)
=
(a≤θ≤b, P (S)
S)
btt
n-t
乙 乙 =
a Cnθ (1-θ)
1tt
dθ
n-t
=
(n+1)
t
Cn
bt
n-t
θ (1-θ) dθ
a
乙0Cnθ (1-θ) dθ
所以, θ 的后验分布密度为:
tt
n-t
f (θ|S) = (n+1) Cnθ (1-θ) 。
根据后验分布进行推断, 以该后验分布的期望
在不放回简单随机抽样下, 采用的简单模型是:
≈1 具有该特征
Yi= 0 不具有
, i=1,2,…,N,
抽样推断中比例估计的几种方法及比较
N
Σ 则 T= Yi; P=T/N i=1
并且, Yi 看作随机变量, 独立同分布, 服从两 点分布:
P (Yi=1) =θ; P (Yi=0) =1-θ。 并有: T 服从二项分布 T~B (N-θ)
作者简介: 艾小青 (1982 年生), 湖南人, 北京工业大学经管学院讲师, 研究方向: 应用统计。
1 引言 在简单随机抽样下, 如何利用样本去估计总体 比例, 本文通过这个简单的问题, 揭示了两大抽样 理念 “基于设计和基于模型”, 两大统计学派 “频率 学派和贝叶斯学派” 和两种主要估计方法 “矩估计 和极大似然估计” 在抽样推断中的应用及特点。 比例相当于目标变量取值为 0 或 1 的均值, 总 体单元数为 N, 总体中具有某特征的个数为 T, 比 例为 P=T/N。 在样本量为的不放回简单随机抽样下, 设样本中具有该特征的个数为 t, 样本比例为 p=t/n。 如何估计总体比例 P 呢, 这个问题看似简单, 却能 带来有益的思考和丰富的信息。 2 相关概念 2.1 抽样中的两种理念 抽样中有两种理念: 基于设计和基于模型。 基于设计: 传统上把总体取值视为固定的, 样 本是随机的, 其随机性是由抽样导致, 并用随机样
本去推断确定总体。 基于模型: 存在一个超总体 (模型), 总体只是
超总体的一个实现 (模型生成), 可见总体取值即是 随机的, 抽样也是随机的, 样本具有双重随机性。 在一定的模型假设下, 揭示样本单元与非样本单元 的联系, 再通过样本数据估计 (也可以说是预测) 非样本数据, 进而得到基于模型下的估计。
可见: PT (t) 随着T的增大先增后减, 在
≤ ≤ T=
N+1 n
t
时达到最大值。
≤ ≤ 得: T^2=
N+1 n
t
,
≤ ≤ 相应的P^2=
N+1 n
t
/N≈
t n
=p。
3.3 基于设计、 贝叶斯学派、 矩估计
总体中具有某特征的个数T有确定的唯一的值,
但却是未知的。 对于参数T, 在我们的主观判断中,
贝叶斯学派: 样本视为固定而参数视为随机,
着眼点在参数空间, 针对参数的分布, 并且遵循的
模式为参数的先验分布 (主观意义) 通过样本信息
加入而改进得参数的后验分布。
两种学派建立在各自的逻辑体系上, 其优劣难
以比较, 取决于具体应用的情况。
2.3 估计中的两种主要方法
估计有两种主要方法: 矩估计和极大似然估计。
t n-t
T=k下,
事件S的概率为P
(S|T=k)
=
CkCN-k
n
,
CN
- 30 -
根据全概率公式, 事件S的概率为:
N
P (S) =ΣP (T=k) P (S|T=k) k=0
N+t-n
Σ =
1
k = t N+1
t n-t
CkCN-k
n
=
N+t-n
Σ 1 n
t n-t
CkCN-k 。
CN N+1CN k = t
的估计也可作为 P 的估计。
抽取样本 S, 得到样本数据, 即得到 i∈S 中随
机变量 Yi 的值, 但得不到 i埸S 中随机变量 Yi 的值。i,
i=1
i∈S
i埸S
Σ Σ 其中 Yi 已知。 Yi 待估计。
i∈S
i埸S
从样本 S 中得到参数 θ 的最小二乘估计是
Σ p=y= Yi/n。 i埸S 中随机变量 Yi 的期望都为 θ, 则 i∈S
得:
P^ 6=
t n
=p,
相 应 的T^ 6=Np。
3.7 基于模型、 贝叶斯学派、 矩估计
模型为: Yi 独立同分布:
P (Yi=1) =θ; P (Yi=0) =1-θ。 在没有其他信息的情况下, 模型参数 θ 的先验
分布为 [0, 1] 之间的连续均匀分布:
θ~R (0, 1), 即 θ 的先验分布概率密度为 1。
T的后验分布为:
P
(T=k|S)
=P
(T=k) P
P (S|T=k) (S)
t n-t
=
CkCN-k
N+t-n
,
Σ t n-t CkCN-k
k=t
k=t, t+1, …, N+t-n
根据后验分布进行推断, 以该后验分布的期望
作为T的估计:
N+t-n
Σ Σ E (T|S) =
t n-t
kCkCN-k
T*P
PT (t) 达到最大值。
PT (t) PT-1 (t)
t n-t
t
n-t
=
CTCN-T
n
/
CT-1
CN-
n
(T-1)
CN
CN
=
T (N-T+1-n+t) (T-t) (N-T+1)
,
PT (t) ≥PT-1 (t) 的充要条件是:
T (N-T+1-n+t) ≥(T-t) (N-T+1)
解得: T≤ N+1 t。 n
矩估计的理论根据是大数定律, 也联系了最小
二乘法的思想, 用各阶样本矩估计相应的总体矩
(或参数)。
极大似然估计的思想简单而深刻: 产生结果
(样本特征) 的原因 (参数) 可能有多个, 找出最有
可能的原因, 该参数下, 出现该样本特征的概率最
大。
极大似然估计一般优于矩估计, 其渐进方差最
小, 但在非参数领域极大似然估计基本不适用。
, i=1,2,…,N。
Ii 为随机变量 , 在 不 放 回 简 单 随 机 抽 样 下 , 有
ΣΣ ΣΣ N
N
E
(Ii)
=
n N
,
所以:
E
(y)
=E
IiYi/n
i=1
= E (Ii)
i=1
N
Σ Yi/n=
n N
i
=
1
Yi/n=Y。
即: E (p) =P。
得: P^ 1=p, 也有 T^ 1=Np。
Σ i埸S 中 Yi 的最优线性无偏估计都为 y= Yii/n=t/n=p。 i∈S
Σ Σ Σ 所以:
T^ = Yi+
i∈S
(N-n)
i
∈
S
Yi/n=
N n
i
∈
S
Yi=Np。
并且: E (T-T) =0。 得: T^ 5=Np, 相应的 P^ 5=p。
3.6 基于模型、 频率学派, 极大似然估计
样本中有特定的 t 个单元具备某特征, 有特定
的 n-t 个单元不具备。
这是已经观测到的事件 S。
并有: P (S) =θt (1-θ) n-t。
把 P ( S) 看 作 关 于 θ 的 函 数 , 坠P ( S) /坠θ =0
时, P (S) =max。
解得:
θ=
t n
。
- 31 -
抽样推断中比例估计的几种方法及比较