参数估计

合集下载

参数估计知识点

参数估计知识点一、知识概述《参数估计》①基本定义：简单说，参数估计就是通过样本数据去猜总体的一些参数。

比如说，想知道全校学生的平均身高，不可能一个一个去量，那就找一部分学生（样本）量出他们的身高，然后根据这部分学生的身高数据来推测全校学生（总体）的平均身高，这个推测的过程就是参数估计。

②重要程度：在统计学里那可相当重要。

就像要了解一个大群体的情况，直接研究整体往往很难，通过参数估计从样本推测整体的情况就变得可行而且高效。

无论是搞市场调查，还是科学研究，这个工具相当好使。

③前置知识：得有点基本的数学知识，像平均数、方差这些概念要能明白，还得对抽样有点概念，知道怎么从一个大群体里抽取样本出来。

④应用价值：在各种实际场景里都有用。

比如企业想了解消费者对产品的满意度，不可能访谈每个消费者，抽样一部分做参数估计就好了。

还有估算农作物亩产量之类的，都可以用到。

二、知识体系①知识图谱：在统计学里，参数估计是推断统计的一部分，是和假设检验等方法相互联系的。

推断统计主要就是根据样本信息推断总体特征，而参数估计是其中很核心的一部分。

②关联知识：和抽样分布密切相关啊。

抽样分布是参数估计的理论基础，如果不知道抽样分布，那参数估计就像无根之木。

还和概率相关，毕竟在样本中各种数值出现是有概率的。

③重难点分析：掌握难度嘛，开始会觉得有点抽象。

关键在于理解样本和总体之间的关系，以及怎么根据不同的条件选择合适的估计方法。

④考点分析：在统计学考试里常考。

考查方式有直接给样本数据让进行参数估计，或者结合其他知识点，像给出抽样分布然后问参数估计的结果之类的。

三、详细讲解【理论概念类】①概念辨析：参数估计就是根据样本统计量去估计总体参数。

总体参数就是描述总体特征的数值，像总体均值、方差之类的。

样本统计量就是从样本里计算出来的值，比如说样本均值、样本方差等。

②特征分析：不确定性算一个特点吧。

毕竟样本不是总体，根据样本做的估计不可能完全精准。

五种估计参数的方法

五种估计参数的方法在统计学和数据分析中，参数估计是一种用于估计总体的未知参数的方法。

参数估计的目标是通过样本数据来推断总体参数的值。

下面将介绍五种常用的参数估计方法。

一、点估计点估计是最常见的参数估计方法之一。

它通过使用样本数据计算出一个单一的数值作为总体参数的估计值。

点估计的核心思想是选择一个最佳的估计量，使得该估计量在某种准则下达到最优。

常见的点估计方法有最大似然估计和矩估计。

最大似然估计（Maximum Likelihood Estimation，简称MLE）是一种常用的点估计方法。

它的核心思想是选择使得样本观测值出现的概率最大的参数值作为估计值。

最大似然估计通常基于对总体分布的假设，通过最大化似然函数来寻找最优参数估计。

矩估计（Method of Moments，简称MoM）是另一种常用的点估计方法。

它的核心思想是使用样本矩和总体矩之间的差异来估计参数值。

矩估计首先计算样本矩，然后通过解方程组来求解参数的估计值。

二、区间估计点估计只给出了一个参数的估计值，而没有给出该估计值的不确定性范围。

为了更全面地描述参数的估计结果，我们需要使用区间估计。

区间估计是指在一定的置信水平下，给出一个区间范围，该范围内包含了真实参数值的可能取值。

常见的区间估计方法有置信区间和预测区间。

置信区间是对总体参数的一个区间估计，表示我们对该参数的估计值的置信程度。

置信区间的计算依赖于样本数据的统计量和分布假设。

一般来说，置信区间的宽度与样本大小和置信水平有关，较大的样本和较高的置信水平可以得到更准确的估计。

预测区间是对未来观测值的一个区间估计，表示我们对未来观测值的可能取值范围的估计。

预测区间的计算依赖于样本数据的统计量、分布假设和预测误差的方差。

与置信区间类似，预测区间的宽度也与样本大小和置信水平有关。

三、贝叶斯估计贝叶斯估计是一种基于贝叶斯理论的参数估计方法。

它将参数看作是一个随机变量，并给出参数的后验分布。

贝叶斯估计的核心思想是根据样本数据和先验知识来更新参数的分布，从而得到参数的后验分布。

第7章参数估计

对于是非标志（即服从两点分布的变量)来说，若将其具体表现分别用1、0数量化，成数就是其平均数是非标志的方差＝P(1-P)
x 1 0
f P 1－p
x
xf f
1 p 0 (1 p) p (1 p)
p
2 (x x)2 f (1 p)2 p (0 p)2 (1 p)
f
p (1 p)
似然函数常简记为L或 L 1,2, ,k
未知参数的函数。
38
若有 ˆi (x1, x2,..., xn ) i 1, 2, k 使得
L x1, x2,..., xn;ˆ1, ˆ 2,
, ˆ k
max L (1 ,2 , ,k )
x1, x2,..., xn; 1, 2,
, k
则 ˆi (X1, X2,..., Xn) 为参数θi的极大似然估计量。
中选出一个使样本观察值出现的概率为最大的 ˆ 作
为θ的估计量。
称 ˆ 为θ 的极大似然估计量。
37
2.似然函数的数学表达式
设X1,X2,…Xn是取自总体X的一个样本，样本的联合密度 (连续型）或联合分布律 (离散型)为 :
f (x; 1，2 , , k )
定义似然函数为：
n
L L x1,..., xn; 1, 2, , k f xi; 1, 2, , k i 1 x1, x2 ,..., xn 给定的样本观察值
§7.1.4抽样误差
1.误差：调查结果与实际值之间的差异抽样调查中的误差
登记性误差(非抽样误差) 误差代表性误差随系机统误误差差（（抽非样抽误样差误）差）
2.抽样误差—由于抽样的随机性而产生的样本指标对总体指标的代表性误差。抽样误差可以计算并加以控制，但不可以避免。

参数估计方法与实例例题和知识点总结

参数估计方法与实例例题和知识点总结一、参数估计的概念参数估计是指根据从总体中抽取的样本估计总体分布中包含的未知参数。

参数通常是描述总体分布的特征值，比如均值、方差、比例等。

二、参数估计的方法（一）点估计点估计就是用样本统计量来估计总体参数，给出一个具体的数值。

常见的点估计方法有矩估计法和最大似然估计法。

1、矩估计法矩估计法的基本思想是用样本矩来估计总体矩。

比如，用样本均值估计总体均值，用样本方差估计总体方差。

2、最大似然估计法最大似然估计法是求使得样本出现的概率最大的参数值。

它基于这样的想法：如果在一次抽样中得到了某个样本，那么这个样本出现概率最大的参数值就是总体参数的估计值。

（二）区间估计区间估计则是给出一个区间，认为总体参数以一定的概率落在这个区间内。

区间估计通常包含置信水平和置信区间两个概念。

置信水平表示区间包含总体参数的可靠程度，常见的置信水平有90%、95%和 99%。

置信区间则是根据样本数据计算得到的一个区间范围。

三、实例例题假设我们要研究某地区成年人的身高情况。

随机抽取了 100 名成年人，他们的身高数据如下（单位：厘米）：165, 170, 172, 168, 175, 180, 160, 178, 176, 169,（一）点估计1、用样本均值估计总体均值：计算这 100 个数据的均值，得到样本均值为 172 厘米。

因此，我们估计该地区成年人的平均身高约为 172 厘米。

2、用样本方差估计总体方差：计算样本方差，得到约为 25 平方厘米。

（二）区间估计假设我们要以 95%的置信水平估计总体均值的置信区间。

首先，根据样本数据计算样本标准差，然后查找标准正态分布表或使用相应的统计软件，得到置信系数。

最终计算出置信区间为（168，176）厘米。

这意味着我们有 95%的把握认为该地区成年人的平均身高在 168 厘米到 176 厘米之间。

四、知识点总结（一）点估计的评价标准1、无偏性：估计量的期望值等于被估计的参数。

参数估计和假设检验

参数估计和假设检验1.参数估计参数估计是指通过样本数据来推断总体参数的过程。

总体参数是指总体的其中一种性质，比如总体均值、总体方差等。

样本数据是从总体中随机抽取的一部分数据，用来代表总体。

参数估计的目标是使用样本数据来估计总体参数的值。

常见的参数估计方法有点估计和区间估计。

（1）点估计点估计是通过一个统计量来估计总体参数的值。

常见的点估计方法有样本均值、样本方差等。

点估计的特点是简单、直观，但是估计值通常是不准确的。

这是因为样本的随机性导致样本统计量有一定的误差。

因此，点估计通常会伴随着误差界限，即估计值的置信区间。

（2）区间估计区间估计是通过一个统计量构建总体参数的估计区间。

常见的区间估计方法有置信区间和可信区间。

置信区间是指当重复抽样时，包含真实总体参数的概率。

置信区间的计算方法是在样本统计量的基础上，加减一个合适的误差界限，得到一个估计区间。

可信区间是指在一次抽样中，包含真实总体参数的概率。

可信区间的计算方法同样是在样本统计量的基础上，加减一个合适的误差界限，得到一个估计区间。

参数估计的应用非常广泛，可以用于各个领域的数据分析和决策。

例如，经济学家可以通过样本数据估计失业率，政治学家可以通过样本数据估计选举结果，医学研究者可以通过样本数据估计药物的疗效等。

2.假设检验假设检验是指通过样本数据来判断总体参数的其中一种假设是否成立。

在假设检验中，我们先提出一个原假设（H0），然后使用样本数据来检验该假设的合理性。

在假设检验中，我们需要确定一个统计量，该统计量在原假设成立时，其分布是已知的。

然后，我们计算该统计量在样本数据下的取值，并通过比较该取值与已知分布的临界值，来判断原假设是否成立。

假设检验包含两种错误，即第一类错误和第二类错误。

第一类错误是指在原假设成立的情况下，拒绝原假设的错误概率。

第二类错误是指在原假设不成立的情况下，接受原假设的错误概率。

常见的假设检验方法有单样本假设检验、双样本假设检验、方差分析等。

参数估计PPT课件

如何根据数据选择合适的模型，以及如何进行有效的假设检验是参数估计面临的重要挑战。
高维数据问题
随着数据维度的增加，参数估计的准确性和稳定性面临更大的挑战。
异方差性和非线性问题
在实际应用中，数据往往存在异方差性和非线性关系，这增加了参数估计的难度。
参数估计的发展趋势与未来研究方向
1 2 3
贝叶斯推断
区间估计是一种统计推断方法，它利用样本信息来估计未知参数的可能取值范围。
区间估计的性质
区间估计给出的是未知参数的一个可能取值范围，而不是一个具体的点估计值。
区间估计的优缺点
优点
区间估计能够给出未知参数的一个可能取值范围，从而为决策者提供更多的信息，有助于理解参数的不确定性。
缺点
由于区间估计给出的范围较宽，可能会引入较大的误差。此外，对于某些复杂模型，构造有效的区间估计可能比较困难。
在贝叶斯估计中，先验分布代表了我们对未知参数的先验知识或信念，而后验分布则是结合先验信息和样本数据后对未知参数的更新信念。
贝叶斯估计的核心思想是将参数看作随机变量，并利用概率论来描述我们对参数的认知不确定性。
贝叶斯估计的优缺点
优点
贝叶斯估计能够综合考虑先验信息和样本数据，给出参数的后验分布，从而为决策提供更全面的信息。此外，贝叶斯估计方法灵活，可以适用于不同类型的数据和问题。
点估计的优缺点
总结词
点估计的优缺点
详细描述
点估计的优点在于它提供了一个简洁的表示未知参数的方法，并且可以利用各种统计方法进行推断和分析。然而，点估计也存在一些缺点，如它可能会受到样本误差的影响，导致估计结果不够准确；另外，当样本容量较小时，点估计的效果可能会较差。
点估计的常见方法：矩估计、最小二乘法等

参数估计的三种方法

参数估计的三种方法参数估计是统计学中的一项重要任务，其目的是通过已知的样本数据来推断未知的总体参数。

常用的参数估计方法包括点估计、区间估计和最大似然估计。

点估计是一种常见的参数估计方法，其目标是通过样本数据估计出总体参数的一个“最佳”的值。

其中最简单的点估计方法是样本均值估计。

假设我们有一个总体，其均值为μ，我们从总体中随机抽取一个样本，并计算出样本的平均值x。

根据大数定律，当样本容量足够大时，样本均值会无偏地估计总体均值，即E(x) = μ。

因此，我们可以用样本的平均值作为总体均值的点估计。

另一个常用的点估计方法是极大似然估计。

极大似然估计的思想是寻找参数值，使得给定观测数据出现的概率最大。

具体来说，我们定义一个参数θ的似然函数L(θ|x)，其中θ是参数，x是观测数据。

极大似然估计即求解使得似然函数取得最大值的θ值。

举个例子，假设我们有一个二项分布的总体，其中参数p表示成功的概率，我们从总体中抽取一个样本，得到x个成功的观测值。

那么，样本观测出现的概率可以表示为二项分布的概率质量函数，即L(p|x) = C(nx, x) * p^x * (1-p)^(n-x)，其中C(nx, x)是组合数。

我们通过求解使得似然函数取得最大值的p值，来估计总体成功的概率。

与点估计相比，区间估计提供了一个更加全面的参数估计结果。

区间估计指的是通过样本数据推断总体参数的一个区间范围。

常用的区间估计方法包括置信区间和预测区间。

置信区间是指通过已知样本数据得到的一个参数估计区间，使得这个估计区间能以一个预先定义的置信水平包含总体参数的真值。

置信水平通常由置信系数（1-α）来表示，其中α为显著性水平。

置信区间的计算方法根据不同的总体分布和参数类型而异。

举个例子，当总体为正态分布且总体方差已知时，可以利用正态分布的性质计算得到一个置信区间。

预测区间是指通过对总体参数的一个估计，再结合对新样本观测的不确定性，得到一个对新样本值的一个区间估计。

统计学第七章参数估计

04
单击添加文本具体内容
参数估计
假设检验
描述统计
推断统计
参数估计在统计方法中的地位
统计方法
统计推断的过程
总体
总体均值、比例、方差等
样本统计量如：样本均值、比例、方差
样本
§7.1 参数估计的一般问题
单击此处添加文本具体内容，简明扼要地阐述你的观点
一、估计量和估计值
参数估计（Parameter Estimation），用样本估计量估计总体估计值。
一个总体参数的区间估计
总体参数
符号表示
样本统计量
均值
比例
方差
第一章节
总体均值的区间估计 (正态总体、２已知，或非正态总体、大样本)
总体均值的区间估计 (大样本)
假定条件总体服从正态分布,且方差(２) 未知如果不是正态分布，可由正态分布来近似 (n 30) 使用正态分布统计量 z 总体均值在1- 置信水平下的置信区间为
(1)估计量：用来估计总体参数的样本统计量。如：样本算术平均数、样本中位数、样本标准差、样本方差等。例如: 样本均值就是总体均值的一个估计量 (2)参数用表示，估计量用表示 (3)估计值：估计参数时计算出来的统计量的具体值如果样本均值 x =80，则80就是的估计值
矩估计法
最小二乘法
换句话说，做出校全体女大学生身高均数为163.0 -- 164.5cm的结论，说对的概率是95%，说错的概率是5%；做出校全体女大学生身高均数为162.7 – 164.7cm的结论，说对的概率是99%，说错的概率是1%。
3、置信区间与置信水平
(1 - ) 区间包含了的区间未包含
a /2
A
B
的抽样分布

参数估计的一般步骤

参数估计的一般步骤参数估计是统计学中的一种方法，用于根据样本数据估计总体参数的取值。

它在各个领域都有广泛的应用，例如经济学、医学、社会学等。

本文将介绍参数估计的一般步骤，帮助读者了解如何进行参数估计。

一、确定参数类型在进行参数估计之前，首先需要确定要估计的参数类型。

参数可以是总体均值、总体比例、总体方差等，根据具体问题来确定。

二、选择抽样方法接下来，需要选择合适的抽样方法来获取样本数据。

常用的抽样方法有简单随机抽样、系统抽样、分层抽样等。

选择合适的抽样方法可以保证样本的代表性，从而提高参数估计的准确性。

三、收集样本数据在进行参数估计之前，需要收集样本数据。

收集样本数据时要注意数据的准确性和完整性，避免数据采集过程中的偏差。

四、计算点估计量得到样本数据后，可以计算点估计量来估计总体参数的取值。

点估计量是根据样本数据计算得出的一个具体数值，用来估计总体参数的未知值。

常见的点估计量有样本均值、样本比例等。

五、构建置信区间除了点估计量，还可以构建置信区间来估计总体参数的取值范围。

置信区间是一个区间估计，表示总体参数的真值有一定的概率落在该区间内。

置信区间的计算方法与具体的参数类型有关，可以利用统计学中的分布理论或抽样分布来计算。

六、进行假设检验除了估计总体参数的取值，参数估计还可以用于假设检验。

假设检验是根据样本数据来判断总体参数是否符合某个特定的假设。

在假设检验中，需要先提出原假设和备择假设，然后计算检验统计量，最后根据统计显著性水平来判断是否拒绝原假设。

七、解释结果需要对参数估计的结果进行解释和说明。

解释结果时要清楚、简洁，避免使用过于专业的术语，以便读者能够理解和接受。

参数估计是统计学中重要的内容之一，它可以帮助我们从有限的样本数据中推断总体的特征。

通过合理选择抽样方法、收集准确的样本数据，并运用适当的统计方法，我们可以得到准确可靠的参数估计结果，为实际问题的决策提供科学依据。

统计学中的参数估计与假设检验

统计学中的参数估计与假设检验统计学是一门研究如何收集、整理、分析和解释数据的学科。

参数估计和假设检验是统计学中两个重要的概念和方法，用于推断总体参数和判断假设是否成立。

本文将详细介绍参数估计与假设检验的基本原理和应用。

一、参数估计参数估计是通过样本数据推断总体的未知参数。

在统计学中，总体是指研究对象的全体，而样本是从总体中抽取的一部分。

参数是总体的特征指标，例如均值、方差、比例等。

参数估计旨在通过样本数据对总体参数进行估计，并给出估计的精度。

参数估计分为点估计和区间估计两种方法。

点估计是通过样本数据计算得到的单个数字，用来估计总体参数的具体数值。

常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。

区间估计是通过样本数据计算得到的一个范围，该范围包含总体参数真值的概率较高。

置信区间是区间估计的一种形式，它可以用来描述估计值的不确定性。

二、假设检验假设检验是用于检验研究问题的特定假设是否成立的一种统计推断方法。

在假设检验中，我们提出一个原假设和一个备择假设，并根据样本数据对两个假设进行比较，进而判断原假设是否应该被拒绝。

原假设通常表示一种无关，即不发生预期效应或差异。

备择假设则表示研究者所期望的效应或差异。

在进行假设检验时，我们首先选择一个适当的统计检验方法，例如t检验、F检验或卡方检验等。

然后，计算出样本数据的检验统计量，并根据相关的分布理论和显著性水平进行推论。

最后，比较检验统计量与临界值，以决定是否拒绝原假设。

三、参数估计与假设检验的应用参数估计和假设检验在实际问题中有广泛的应用。

以医学研究为例，研究人员可能希望通过抽样来估计某种药物的有效剂量，并对药效进行假设检验。

在市场调研中，我们可以使用参数估计和假设检验来推断总体的需求曲线和做出市场预测。

在质量控制中，我们可以利用参数估计和假设检验来判断产品是否符合标准。

四、总结参数估计和假设检验是统计学中重要的方法，可以通过样本数据来推断总体参数和判断假设是否成立。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第九章参数估计
抽样的真正目的在于根据已知的统计量来估计总体参数。

检验特定假设有一定用处，但估计方法的用处更大。

基本上有两种估计，即点估计和区间估计。

第一节点估计
点估计也即点值估计，是以一个最适当的样本统计值来代表总体参数值。

为了确定每一种估计究竟如何，就必须掌握某种标准。

估计量如果具有无偏性、一致性和有效性这三个要求或标准，就可以认为这种统计量是总体参数的合理估计或最佳估计。

1．无偏性
如果统计量的抽样分布的均值恰好等于被估计的参数之值，那么这一估计便可以认为是无偏估计。

换句话说，从最终的结果来看，估计量的期望值就是参数本身。

2．一致性
虽然随机样本和总体之间存在一定的误差，但当样本容量逐渐增加时，统计量越来越接近总体参数，满足这种情况，我们就说该统计量对总体参数是一个一致的估计量。

3．有效性
估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。

总而言之，如果一个估计量满足无偏性、一致性和有效性这三条准则，就可称其为最佳估计量。

第二节区间估计
如果总体均值正好就是样本的均值，这当然非常好。

但如果两者不尽相同，点估计往往会造成一些不必要的误解。

在许多场合，人们宁愿在原来点估计值两边加一个区间，使得我们对参数在预料之中有相当把握。

因此在推论统计中我们更多采用的是区间估计的方法。

所谓区间估计，就是在一定的抽样平均误差内设一个可置信的区间，然后联系到这个区间的精度，将样本的统计值推断为总体的参数值。

1.精确性和可靠性
区间估计的任务是，在点估计值的两侧设置一个区间，使得总体参数被估计到的概率大大增加。

当然，设置一个区间是很容易的，当我们对参数被估计到的信心不足时，我们总可以放宽区间。

如果这个区间的大小不受限制，我们就可以把参数被估计到的信心提高到任何水平。

但是区间加大，估计的效度随之降低。

当我们的信心提高到绝对时，估计的价值也随之丧失贻尽。

这就是说，还存在需要考虑的另一方面——区间估计的精确性问题。

这样一来，我们又宁愿估计区间要尽量小一点，最好就是点估计。

精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。

两者的对立统一，停留在经验描述水平上是无法真正讲清楚的。

这就要从参数估计的角度(而不仅仅是从假设检验的角度)来运用概率论。

2. 抽样平均误差与概率度
区间估计是求所谓置信区间的方法。

置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。

根据中心极限定理，由于抽样平均数的正态分布和第一类错误的危险可以计算的缘故，求置信区间的方法其实很简单。

除了变换一点思路来重温过去的知识，这里不涉及任何新的基本概念。

具体做法是：从点估计值(如样本均值X )起向两侧展开一定倍数（Z ）的抽样平均误差(X σ)，并估计总体参数μ很可能就包含在这个区间之内（参见图9．1）
X -Z
X σ≤μ≤X +Z X σ
由此可见，置信区间的大小主要由Z 和X σ这两个量所决定，并为2Z
X σ。

参数μ的
区间估计就归结为求算Z 和X σ(推而论之，总体均值的区间估计应归结为就各种抽样分布计算概率度和就各种抽样组织方式计算抽样平均误差这两者)。

抽样平均误差X σ可以认为是决定区间估计效度的关键因素。

Z 则可以认为是决定区间估计信度的关键因素。

整体上，Z 和σ的乘积显然就是置信区间之半宽度，用X ∆表示。

为了与抽样平均误差相区别，X ∆被称为抽样极限误差。

抽样极限误差表达了在给定可靠程度的前提下，抽样估计的最大可能范围。

它是效度要求和信度要求的综合表现：置信区间增大，估计的可靠性提高，精确性下降；置信区间减小，估计的可靠性降低，精确性提高。

用置信区间所作的分析和我们的经验认识是一致的。

但不同的是，因为有了Z 和X σ，我们降低了区间估计的任意性。

3. 区间估计的步骤
参数μ的区间估计的步骤具体如下：①首先从总体抽取一个样本，根据收集的样本资料求出它的均值；②根据合乎实际的置信水平查表求得概率度；③根据总体标准差和样本容量求出抽样平均误差；④以样本均值为基难，向两侧展开Z 倍的抽样平均误差的区间，便完成了符合置信水平要求的参数的区间估计。

根据中心极限定理，只要是大样本，样本均值X 的抽样分布就是正态的，于是有
X -2
/αZ n
σ
≤μ≤X
+2
/αZ n
σ
或者 X -2
/αZ n S ≤μ≤X +2/αZ n
S
第三节其他类型的置信区间
1．σ未知，小样本总体均值的区间估计
如果σ未知，要用样本标准差S 代替抽样平均误差中的总体标准差。

此时(n 比较小)不能认为样本均值的抽样分布服从正态分布了，需要改用t 分布。

从而得到总体均值μ的置信区间为
（-X 2
/αt 1-n S
，+X 2
/αt 1
-n S
） 2．总体成数的估计
我们在前面已经指出，成数适用于不同量度层次。

在社会学研究中我们碰到许多定类变量，其估计不是均值，而是比率，这便提出了总体成数的估计问题。

从总体的均值估计过渡到总体的成数估计，其方法和思路完全相同，只要用∧
p 代替X ，
用
n pq 代替n
σ。

于是有（∧
p -2/αZ n pq ，∧
p +2/αZ n
pq
）
3．总体方差的区间估计
总体方差的区间估计，一般都是利用小样本理论来讨论的。

由第八章2
χ分布的性质，
我们知道有
2
2
σ
nS ∽2
χ（n -1）
因此，对于给定的置信水平1-α，总体方差的区间估计为
)22
/2k nS （αχ≤2
σ≤)22/12k nS （αχ-
第四节抽样平均误差
1．简单随机抽祥的抽样误差在回置抽样条件下 X σ＝
n
σ
在不回置抽样条件下 σ＝
n
σ
·
1
--N n
N
2．分层抽样的抽样误差
在回置抽样条件下，分层定比抽样的抽样平均误差的计算公式为
st
σ＝
n
st
σ＝
2
2n
n i
i ∑σ
＝
n
i
i
∑2σ
ω
在不回置抽样条件下，分层定比抽样的抽样平均误差的计算公式为
st
X σ＝n
st
σ·N n
-1＝
∑
⎪⎪⎭
⎫
⎝⎛
-i i i i N n n 12σω
3．整群抽样的抽样误差
对于群规模相等的总体，整群抽样的基本步骤是：①总体划分为R 个群，每个群包含M 个个体，则总体容量N ＝RM ；②从R 个群中随机抽选r 个群，这样总样本容量n ＝r ·M ；③对中选的r 个群的全部个体进行调查，构成我们所需的整群样本。

定比在回置抽样的条件下，整群抽样的抽样平均误差为
ct
X σ＝
r
δ＝r
1∑=-r
i ct i
X X
1
2)(
在不回置抽样的条件下，其抽样平均误差的计算公式为
ct
X σ＝
r
1
∑=-r
i ct i
X X
1
2)(·R
r
-
1 4．等距抽祥的抽样误差
等距抽样的误差公式，一般都以简单随机抽样的误差公式来代替。

一般说来，如果等距
抽样不存在周期误差，这样计算出来的误差会比实际情况大些，也就是误差的估计要保守一些(因为deff 值大于1)。

第五节样本容量的确定
1. 影响样本容量的因素
(1)允许误差范围X ∆，即抽样极限误差。

由于随机因素存在，只要进行抽样，就一定存
在误差。

允许误差范围是由抽样估计的效度要求所决定的。

一般地说，允许误差范围越小，即抽样估计的效度越高，样本容量要求就越大；反之则越小。

因而样本容量与允许误差范围呈相背趋势。

(2)概率度Z 。

概率度是由置信水平（1 -α）所决定的，抽样估计的信度要求越高，样
本容量要求越大；反之，样本容量可以小一些。

(3)被研究总体标志的变异程度σ。

一般来说，如果标志变异程度大，抽样单位数目要求就多；反之就少。

2．确定样本容量
(1)估计总体均值所需的样本容量
就简单随机抽样而言，在回置抽样条件下， n ＝22
2Z ∆σ
在不回置抽样条件下， n ＝2
222
2σ
σZ N NZ +∆ (2)估计总体成数所需的样本容量
在回置抽样的条件下， n ＝22)
1(p
p p Z ∆-
以上是简单随机抽样的样本容量的计算公式，对于其他抽样方法的样本容量问题可根据
上述原理作适当替换即可。

如在分层抽样中，可将上述基本公式中的2
σ改换成2
st
σ，
)1(p p -改换成)1(p p -；在整群抽样中，可将上述基本公式中的2σ改换成2δ，同时将
基本公式中的n 和N 改换为相应的r 和R 即可，其他原理相同。