(标准抽样检验)抽样与参数估计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(标准抽样检验)抽样与

参数估计

抽样与参数估计

推断统计:利用样本统计量对总体某些性质或数量特征进行推断。

从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。

估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。

因此本节内容就是由样本数据对总体参数进行估计,即:

学习目标:了解抽样和抽样分布的基本概念

理解抽样分布与总体分布的关系

了解点估计的概念和估计量的优良标准

掌握总体均值、总体比例和总体方差的区间估计

第一节抽样与抽样分布

回顾相关概念:总体、个体和样本

抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。

总体(Population):调查研究的事物或现象的全体参数

个体(Itemunit):组成总体的每个元素

样本(Sample):从总体中所抽取的部分个体统计量

样本容量(Samplesize):样本中所含个体的数量

一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。

一、抽样方法及抽样分布

1、抽样方法

(1)、概率抽样:根据已知的概率选取样本

①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率)

被抽中。

注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重

复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。

②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样

③、整群抽样:将一组被调查者(群)作为一个抽样单位

④、等距抽样:在样本框中每隔一定距离抽选一个被调查者

(2)非概率抽样:不是完全按随机原则选取样本

①、非随机抽样:由调查人员自由选取被调查者

②、判断抽样:通过某些条件过滤来选择被调查者

(3)、配额抽样:选择一群特定数目、满足特定条件的被调查者

2、抽样分布

一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。

某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。

二、样本均值的抽样分布与中心极限定理

1、样本均值的抽样分布(一个例子)

【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X 1=1、X 2=2、X 3=3、X 4=4。总体的均值、方差及分布如下 均值和方差

现从总体中抽取n =2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表 计算出各样本的均值,如下表。并给出样本均值的抽样分布

所有样本均值的均值和

方差:

式中:M 为样本数目 比较及结论:1.样本均值的均值(数学期望)

等于总体均值

2.样本均值的方差等于总体方差的1/n

2、中心极限定理

当总体服从正态分布N ~(μ,σ2)时,来自该总体的所有容量为n 的样本的均值 也服从正态分布,的数学期望为μ,方差为σ2/n 。即x ~N (μ,σ2/n )

=1n i i

x μ==∑

=1M x n

i i x

中心极限定理:设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(一般,就可以用中心极限定理了),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。即有:

也即有,~

其实,样本均值抽样分布的数字特征一方面与总体分布的均值和方差有关,另一方面也与抽样的方法是重复抽样还是不重复抽样有关。无论是重复抽样或不重复抽样,样本均值的数学期望始终等于总体的均值。但在不重复抽样条件下,样本均值的方差需要用修正系数去修正重复抽样时均值的方差。当很大,而时,其修正系数,可视不重复抽样与重复抽样一致。

ampleproportion p.)

样本比例抽样分布的相关信息,即p的期望值、标准差、抽样分布形状等。

主要应用于分类变量:在经济与商务的许多场合,需要用样本比例p对总体比例P进行统计推断

根据中心极限定理有:当样本容量增大时(大样本:经验上,当下面两个条件(n·p>=5且n(1-p)>=5)满足时,与p相关的样本为大样本),样本比例抽样分布趋向于以样本期望值为中心、以样本方差为方差的正态分布

1、期望值(Expectedvalueof p):E(p)=P

2、标准差(Standarddeviationof p):

重复抽样:不重复抽样:

*四、样本方差的抽样分布

要用样本方差s2去推断总体的方差σ2,必须知道样本方差的分布。

设总体服从正态分布X~N(μ,σ2),X1,X2,…,X n为来自该正态总体的样本,统计证明比值的抽样分布为自由度是(n-1)的分布,即:

~

分布的性质:

(1)、分布的变量始终为正;

(2)、分布的期望为,方差为。

第二节参数估计的基本方法

一、估计量和估计值

参数是总体的数值特征(A parameter isanumericalcharacteristicofapopulation。)

参数估计:就是用样本统计量去估计总体的参数。

估计量()(estimator)用于估计总体某一参数的样本统计量(随机变量)的名称。

相关文档
最新文档