第六章 从样本统计量估计整体参数

合集下载

参数估计基于样本统计量的总体参数的估计方法

参数估计基于样本统计量的总体参数的估计方法

参数估计基于样本统计量的总体参数的估计方法参数估计是统计学中的一项重要工作,其目的是通过样本数据来估计总体的某个特定参数。

这个过程中,我们通常会利用样本统计量来进行估计。

本文将介绍几种常见的参数估计方法,它们基于样本统计量,并且适用于不同类型的总体参数。

一、点估计方法点估计是参数估计中最常用的方法之一,它通过一个单一的数值来估计总体参数。

常见的点估计方法有最大似然估计和矩估计。

1. 最大似然估计(Maximum Likelihood Estimation,MLE)最大似然估计是一种通过优化参数估计值与样本观察值之间的似然函数,来选择最合适的参数值的方法。

似然函数是关于参数的函数,在给定样本情况下,它表示参数取值下观察到该样本的概率。

通过找到使似然函数最大化的参数值,我们就可以得到最大似然估计值。

最大似然估计具有良好的统计性质,例如无偏性、一致性等。

2. 矩估计(Method of Moments)矩估计是通过样本矩与理论矩之间的匹配来进行参数估计的方法。

样本矩是样本的统计特征,如均值、方差等;理论矩是总体分布的特征,它们与总体参数之间存在关系。

通过令样本矩等于理论矩,可以得到参数的估计值。

与最大似然估计相比,矩估计更简单,但在一些情况下可能会存在偏差较大的问题。

二、区间估计方法区间估计是通过一个区间来估计总体参数的取值范围。

这个区间称为置信区间,它表示参数真值落在该区间内的概率。

常见的区间估计方法有置信区间方法和预测区间方法。

1. 置信区间(Confidence Interval)置信区间是用来估计总体参数的取值范围的方法。

置信区间的构造基于样本统计量的分布特性,并且与给定的置信水平相关。

通常情况下,我们使用正态分布或 t 分布来构造置信区间。

置信区间的上下限值表示了参数估计的不确定性范围,置信水平越高,置信区间越宽。

2. 预测区间(Prediction Interval)预测区间与置信区间类似,但其用于预测新的观测值范围。

用样本估计总体ppt课件

用样本估计总体ppt课件
1+2+3
样本容量为n,则 10=0.25,即 n=40.
n
17
4.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示, 则这组数据的中位数和平均数分别是( )
897 9316402 (A)91.5和91.5 (B)91.5和92 (C)91和91.5 (D)92和92
18
【解析】选A.中位数为 1×(91+92)=91.5.平均数为
(i=1,2,3,…,n)是_样__本__数__据__,n是_样__本__容__量___,x 是 _样__本__平__均__数__.
9
判断下面结论是否正确(请在括号中打“√”或“×”). (1)平均数、众数与中位数从不同的角度描述了一组数据的集 中趋势.( ) (2)一组数据的平均数一定大于这组数据中的每个数据.( ) (3)一组数据的方差越大,说明这组数据的波动越大.( ) (4)一组数据的众数可以是一个或几个,那么中位数也具有相 同的结论.( )
优点与缺点
众数通常用于描述变量的 值出现次数最多的数.但显 然它对其他数据信息的忽 视使得无法客观地反映总 体特征
6
数字 特征
中位数
定义与求法
把一组数据按_大__小__顺__ _序__排列,处在_最__中__ _间__位置的一个数据 (或两个数据的平均 数)
优点与缺点
中位数等分样本数据所占 频率,它不受少数几个极 端值的影响,这在某些情 况下是优点,但它对极端 值的不敏感有时也会成为 缺点
5.09>3.72,所以乙同学发挥得更稳定.
15
3.如图是某学校抽取的学生体重的频率分布直方图,已知图中 从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数 为10,则抽取的学生人数为( )
(A)20 (B)30 (C)40 (D)50

教育与心理统计学 第六章 方差分析考研笔记-精品

教育与心理统计学  第六章 方差分析考研笔记-精品

第六章方差分析第一节方差分析概述一.方差分析的定义[用途]定义:用途方差分析也称为变异数分析,是在教育与心理研究中最常用的变量分析方法,其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小,从而确定测量或实验中因素对反应变量是否存在显著影响。

即用于置信度不变情况下的多组平均数之间的差异检验。

它既可以比较两个以上的样本平均数的差异检验,也可以应用于一个因素多种水平以及多个因素有多种水平的数据分析。

二.方差分析的作用方差分析主要应用于两种以上实验处理的数据分析,同时匕徽两个以上的样本平均数,推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。

在这个意义,也可以将其理解为平均数差异显著性检验的扩展。

当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了I型错误的概率,我们可以把方差分析看作t检验的增强版。

方差分析一次检验多组平均数的差异,降低了多次进行两组平均数检验所带来的误差。

在进行方差分析时,设定的假设是综合虚无假设,即假设样本所归属的所有总体的平均数都相等。

如果检验的结果是存在显著性差异,只能说明多组平均数之间存在显著性差异,但是无法确定究竟哪些组之间存在显著性差异,此时需要运用事后检验的方法来确定。

三.方差分析的相关概念一(一)数据的变异(1)变异:统计中的变异是普遍存在的7一般意义上的变异是指标志(包括品质标志和数量标志)在总体单位之间的不同表现。

可变标志的属性或数值表现在总体各单位之间存在的差异,统计上称之为变异,这是广义上的变异,即包括了品质标志和数量标志,有时仅指品质标志和在总体单位之间的不同表现。

注:随机性,即变异性。

(2)组间变异[组间差异]:组间变异表示处理间变异,主要指由于接受不同的实验处理(实验处理效应)而造成的各组之间的变异,可以用两个平均数之间的离差来表示,可将组间离差平方和记为SS AO组间差异可用组间方差来表征,用符号MS B表示。

《用样本估计总体》

《用样本估计总体》

《用样本估计总体》汇报人:2023-12-19•引言•样本的选取•样本的调查与整理目录•样本的描述性统计•样本的推论性统计•样本的优缺点及注意事项01引言本节将介绍如何使用样本数据来估计总体特征的方法。

通过了解样本与总体的关系,我们可以更好地理解数据的分布和规律,为后续的数据分析和决策提供依据。

主题介绍样本估计总体的意义样本估计总体的概念样本具有代表性如果样本是随机抽取的,那么它应该具有总体的代表性,即样本的统计特征应该与总体的统计特征相近。

样本数量对估计精度的影响样本数量越多,估计的精度越高。

因此,在选择样本时,应该尽可能选择更多的数据。

样本是总体的子集样本是从总体中随机抽取的一部分数据,因此它是总体的子集。

样本与总体的关系02样本的选取随机抽样是从总体中抽取若干个样本单位,每个单位被抽取的概率是相同的。

定义特点示例简单易行,每个样本单位被抽中的概率相等,便于进行统计分析。

从100名学生中随机抽取10名学生进行调查。

030201随机抽样系统抽样是将总体分成若干个部分,每个部分抽取一定数量的样本单位。

定义适用于总体容量较大,样本容量较小的场合,且各部分的结构相似。

特点从1000名学生中按学号每隔10名抽取1名学生进行调查。

示例系统抽样分层抽样是将总体分成若干层,从每层中随机抽取一定数量的样本单位。

定义适用于总体内部差异较大的场合,能够提高样本的代表性。

特点从不同年级的学生中按比例抽取一定数量的学生进行调查。

示例分层抽样03样本的调查与整理简单随机抽样按照等概率原则,从全体单位中抽取一部分单位作为样本。

分层抽样将总体分成若干层,然后从每一层中随机抽取一定数量的单位组成样本。

系统抽样将总体中的单位按一定顺序排列,然后按照等间隔的原则抽取一定数量的单位组成样本。

排序整理将调查结果按照一定的顺序进行排列,例如按照收入从低到高或从高到低进行排序。

分类整理将调查结果按照不同的类别进行整理,例如按照性别、年龄、职业等进行分类。

第六章 抽样理论及总体参数的估计 PPT课件

第六章 抽样理论及总体参数的估计 PPT课件

[ ,0.662 ],根据36人的随机抽样调查,样本
体的数量。
样本(Sample)--从总体中抽取的部分个体
样本容量(Sample size)--样本中所含个体的数量。
抽样(Sampling)--为推断总体的某些重要特征,需要从总体 中按一定抽样技术抽取若干个体的过程。
统计量(Statistic)--由样本构造,用来估计总体参数的函数。统 计量是样本的函数,只依赖于样本;统计量不含任何参数。 样本均值、样本方差等都是统计量。
样本
从随机变量X中,随机抽取n个样本元素:x1 、 x2 ……xn 则f(x1 、x2 ……xn )的统计量分布
随机变量是 样本统计量 样本均值, 样本比例,样本方差等
结果来自容量相同的所有可能样本
提供了样本统计量长远而稳定的信息,是进行推断的 理论基础,也是抽样推断科学性的重要依据
样本平均数的抽样分布
(2)当总体的分布不是正态分布时,只要样本容量n足够大时,样本均值 的分布总是近似正态分布,此时要求总体方差2有限。
假定总体均值为,方差为2
n
E X
EX2
...
Xn
1 n
E( X1)
E( X 2 )
...
E(X n )
1 n
(
...
)
n
n
n
D(X
第三节 总体参数的估计
❖ 一、点估计 1.点估计
点估计:当总体参数不清楚时,用一个特定 值(一般用样本统计量)对其进行估计,称 为点估计。
用样本平均数估计总体平均数
样本平均数是总体均值的良好估计。 公式:
X
用样本方差估计总体方差
S 2 n1
(Xi X )2 2

样本统计量估计总体参数的方法

样本统计量估计总体参数的方法

样本统计量估计总体参数的方法嘿,你知道不?样本统计量咋去估计总体参数呢?其实啊,就像从一小堆拼图碎片去猜整个拼图的样子。

先说说步骤呗。

得先有个靠谱的样本,就像在大海里捞珍珠,得捞到好的才行。

然后计算样本的统计量,比如平均数、方差啥的。

这就好比给捞到的珍珠称重量、量大小。

最后用这些样本统计量去估计总体参数,哇,这感觉就像用手里的珍珠去想象一整盒珍珠会是啥样。

那注意事项呢?样本得有代表性啊,不然就像拿着几个颜色奇怪的拼图碎片去猜整幅画,那肯定不靠谱嘛。

而且样本量也不能太小,太小了就跟只有几颗珍珠猜整盒珍珠似的,心里也没底呀。

再讲讲过程中的安全性和稳定性。

这就像走钢丝,得稳稳当当的。

如果样本不靠谱,那估计出来的总体参数就可能差之千里,这多吓人啊!所以得保证样本的质量和数量,这样才能让估计的过程更安全、更稳定。

那应用场景和优势呢?哎呀,那可多了去了。

比如在市场调研中,想知道消费者的喜好,不可能去问所有人吧,那就抽个样本呗。

这样又快又省钱,多好啊!优势就是可以用小部分去推测大部分,就像用一颗星星的光芒去想象整个星空的璀璨。

举个实际案例哈。

有个公司想知道自家产品在市场上的满意度,就抽取了一部分客户做调查。

通过对这些样本客户的反馈进行统计分析,估计出了总体客户的满意度。

结果发现满意度还挺高,这下公司就放心啦,可以继续加大投入生产。

你说这效果好不好?
样本统计量估计总体参数真的超棒。

它就像一把神奇的钥匙,可以打开了解总体的大门。

只要用得好,就能让我们在复杂的世界里找到方向。

统计学总体参数估计

统计学总体参数估计
习题三
配对号
来自总体A 旳样本
来自总体B旳样本
1
2
0
2
5
7
3
10
6
4
8
5
第六章 总体参数估计
第六章 总体参数估计
1、假定条件两个总体服从二项分布能够用正态分布来近似两个样本是独立旳2、两个总体百分比之差P1-P2在1- 置信水平下旳置信区间为
第六章 总体参数估计
【例】在某个电视节目旳收视率调查中,农村随机调查了400人,有32%旳人收看了该节目;城市随机调查了500人,有45%旳人收看了该节目。试以95%旳置信水平估计城市与农村收视率差别旳置信区间
【例】一家瓶装饮料制造商想要估计顾客对一种新型饮料认知旳广告效果。他在广告前和广告后分别从市场营销区各抽选一种消费者随机样本,并问询这些消费者是否据说过这种新型饮料。这位制造商想以10%旳误差范围和95%旳置信水平估计广告前后懂得该新型饮料消费者旳百分比之差,他抽取旳两个样本分别应涉及多少人?(假定两个样本容量相等)
10名学生两套试卷旳得分
学生编号
试卷A
试卷B
差值d
1
78
71
7
2
63
44
19
3
72
61
11
4
89
84
5
6
91
74
17
5
49
51
-2
7
68
55
13
8
76
60
16
9
85
77
8
10
55
39
16
第六章 总体参数估计
解: 根据样本数据计算得
两种试卷所产生旳分数之差旳置信区间为6.33分~15.67分

统计学总体参数估计ppt课件

统计学总体参数估计ppt课件
统计推断的过程
样本
总体
样本统计量 如:样本均值、比例、方差
总体均值、比例、方差等
*
第六章 总体参数估计
第一节 参数估计的一般问题 一、估计量与估计值 用来估计总体参数的统计量的名称,称为估计量,用符号 表示。 用来估计总体参数时计算出来的估计量的具体数值,称为估计值。 (例:样本均值80就是估计值)
第六章 总体参数估计
第一节 参数估计的一般问题 第二节 一个总体参数的区间估计 第三节 两个总体参数的区间估计 第四节 样本容量的确定
*
第六章 总体参数估计
参数估计在统计方法中的地位
参数估计
假设检验
统计方法
描述统计
推断统计
*
第六章 总体参数估计
*
第六章 总体参数估计
第三节 两个总体参数的区间估计 一、两个总体均值之差的区间估计 二、两个总体比例之差的区间估计 三、两个总体方差比的区间估计
*
第六章 总体参数估计
两个总体参数的区间估计
总体参数
符号表示
样本统计量
均值之差
比例之差
方差比
*
第六章 总体参数估计
*
第六章 总体参数估计
例题:一家保险公司收集到由36投保人组成的随机样本,得到每个投保人的年龄数据如表所示。试建立投保人年龄90%的置信区间。样本标准差: 表:36个投保人年龄的数据 S=
23
35
39
27
36
44
36
42
46
43
31
33
42
53
45
54
*
第六章 总体参数估计
【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章从样本统计量估计整体参数学习要点第一节点估计第二节区间估计第三节总体均数的估计第四节其他总体参数的估计本章小结学习要点掌握推断统计的内容和前提条件理解统计估计的原理,掌握统计估计的方法能够运用总体均数估计的方法解决实际问题第一节点估计当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。

由于样本统计量为数轴上的一个点,所以称为“点估计值” 。

科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。

一、什么是推断统计一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。

具有这一特征的统计量就无偏估计值。

例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。

换句话说,样本平均数的平均数将会等于总体平均数。

推断统计就是指由样本资料去推测相应总体情况的理论与方法。

也就是由部分推全体,由已知推未知的过程。

推断统计根据推测的性质不同而分为参数估计和假设检验两方面。

参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。

假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。

在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。

参数检验法在检验时对总体分布和总体参数(μ,2σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的情况。

参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。

二、统计推断的基本问题没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。

殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。

因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。

通常,进行统计推断时应首先考虑以下三个方面的问题。

一是关于统计推断的基本前提。

统计推断的前提是随机抽样。

因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。

随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。

可以说,样本的抽取直接关系着统计研究结果的科学性。

二是样本的规模与样本的代表性。

抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。

一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。

当样本增至包括总体的全部个体(即Nn=)时,抽样的误差为0。

因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性。

值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。

三是统计推断的错误要有一定限度。

统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。

这种错误在统计推断中是不可避免的,也是允许的。

不过这种错误要有一定的限度,超过一定限度的错误是不允许的。

统计推断中允许犯错误的限度是用小概率事件来表示。

第二节区间估计一、参数估计的定义所谓参数估计就是根据样本统计量去估计相应总体的参数。

譬如我们可以根据样本均数(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2σ),根据样本的相关系数(r)去估计总体相关系数(ρ)等等。

二、参数估计的方法参数估计有点估计和区间估计两种。

譬如,某学区期末时抽取所管辖的小学四年级的数学测验成绩,求得平均分70分,标准差10分,于是一个管理者认为全区四年级的数学平均分可能是70分,而另一个管理者则认为全区四年级数学平均分可能性在65~75之间。

因前者是用数轴上的一点做估计,称为点估计。

后者是用数轴上的一段距离做估计,称区间估计。

(一)点估计点估计(point estimation )是在参数估计中直接以样本的统计量(数轴上的一个点)作为总体参数的估计值。

譬如用样本统计量:X ,S 、r 等作为总体参数μ、σ、ρ等的估计值。

但是作为良好点估计的统计量必须具备一定的前提条件。

1.无偏性用统计量估计总体参数必然会存在一定的误差,而恰好相等的情形是极少见的。

当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值时,其偏差为0,即()0=-∑μX这时的统计量被称为无偏估计量(unbiased estimator )。

譬如,根据中心极限定理二有μμ=X ,即样本均数的均数是总体均数的无偏估计量,亦即我们可以用样本均数的均数作为总体均数的点估计值。

假设我们从某市四个区的六岁男童中随机抽取四个样本,对每个样本测量其身高的平均数,再求得四个样本均数的均数为110.70公分,并此值作为该市所有六岁男孩的平均身高就是一个点估计。

如果,()∑-μX 大于0或小于0,那么这时的统计量就为有偏估计量。

作为总体参数的良好估计值是应当具备无偏性的。

当样本容量足够大的时候,用样本均数或样本标准差作为总体相应参数的估计量都可视为无偏估计量。

正因为如此,在大样本统计分析中,常用样本标准差(1-n S )去代替总体标准差(σ)。

当总体分布呈正态时,中数也是总体均数μ的无偏估计量。

然而由于抽样误差的普遍存在,我们不能期待一次抽样就能对总体参数作出精确的估计。

加之点估计不能给出估计误差及其可靠性有关信息,因此采用点估计时应特别注意样本统计量所具有的特性。

2.一致性总体参数的估计量随样本容量的无限增大,应当能越来越接近它所估计的总体参数。

例如正态总体的总体均数为μ,标准差为σ,如果X 是从总体中随机抽取样本获得的平均数,其容量为n ,则当N →∞时,X →μ;1-n S →σ。

这时样本统计量的均数X 就是总体参数μ的一个估计值,或者说X 与μ是一致的。

3.有效性当总体参数的无偏估计量不止一个统计量时,则要分析无偏估计量的变异大小的情况。

无偏估计量变异性小的,有效性较高;无偏估计量变异性大的,则有效性较低。

例如作为总体均数μ的估计值来说,样本均数X 、中数Mdn 和众数Mo 等都是无偏估计量。

这时选谁作为估计值最恰当则要看谁的变异性最小。

在X ,Mdn 和Mo 中只有X 的变异性最小,即X 的方差最小。

所以用统计量——样本均数作为总体参数μ的估计值是最佳选择。

这也同时说明为什么在统计推断中不常使用中数和众数。

4.充分性充分性是指一个容量为n 的样本统计量是否充分地反映了全部n 个数所反映的总体信息。

从X ,Mdn 和Mo 的比较中我们已知,只有在求均数X 时n 个数据全部参与计算,它充分地反映所有数据所要反映的总体信息,而在计算Mdn 和Mo 时只有部分数据参与计算,是用部分数据反映的总体信息。

因此平均数的充分性最高,中数和众数的充分性较低。

同理,在差异量数中方差2S 和标准差S 要比平均差AD 、四分位差Q 更具有充分性。

一个好的点估计应当具备以上四个条件。

但是无论如何,抽样误差总是存在,加上点估计不能提供正确估计的概率,所以应用时受到局限。

例如,我们只能大体上知道样本容量比较大时,多数的X 靠近μ,但是样本容量究竟大到什么程度,“多数”、“靠近”到什么程度,“多数”到底是多少等等都是很模糊的。

点估计的这些不足以及缺陷可以用区间估计的方法来弥补。

第三节 总体均数的估计一、均数估计的标准误均数估计就是用样本均数去估计总体均数。

在用样本均数(X )对总体均数(μ)进行区间估计时,样本均数的标准误(X SE )是衡量抽样误差大小的重要指标,而样本均数的抽样分布则是进行这种估计的理论依据。

(一)标准误的定义式——2σ已知 当总体σ2已知时,根据中心极限定理三有()nSE X X σσ=()nn X ∑-=2μ因为标准误与总体标准差成正比,与样本容量的平方根成反比,所以总体标准差越小,标准误越小;样本容量越大,标准误也越小。

对于一个指定的总体来说,其总体标准差σ是一个确定的数。

因此,在实际工作中,增大样本容量可以减小均数的标准误,这是提高估计精度的重要手段。

对于总体均数μ进行估计时,如果σ已知,那么只需从总体中抽取一个容量为n 的随机样本,就可以求出X SE 而对其区间作出估计,其区间估计公式为X X σμ96.1±=X X σμ58.2±=(二)标准误的近似式——2σ未知在实际工作中,总体方差及总体标准差往往是未知的。

这时我们只能根据样本的标准差去估计总体的标准差。

用样本标准差去估计总体标准差时必须考虑其无偏估计量的问题。

数理统计学已证明样本标准差n S 不是总体标准差σ的无偏估计量。

因此,以n S 作为σ的点估计是不恰当的。

但是样本的无偏标准差1-n S 却是总体标准差σ的无偏估计量,即统计量1-n S 抽样分布的平均数恰好等于σ。

因此,这里的样本无偏标准差定义为()nX X S n ∑-=-21()nn X X∑∑-=22由于1-n S 是σ的无偏估计量,且当n 一定时,1-n S 抽样分布的标准误小于X SE ,所以当n 足够大且一定时,σ≈-1n S 的近似程度高于μ≈X 。

于是,有了样本平均数标准误的近似公式n S SE n X 1-=()()1122--=--=∑∑n n X X nn X X∴1-=n S SE X当总体σ未知时,即可采用这一公式计算均数的标准误。

二、总体均数的估计方法总体均数的估计方法大致有三种,一种以正态分布理论为依据的估计法,称正态估计法。

一种是以t 分布理论为依据的估计方法,称t 分布估计法。

三是以渐近正态分布为依据的估计方法,称近似正态估计法。

三种方法适用于不同的资料形式。

(一)正态估计法正态估计法适用于总体方差σ2已知的数据资料。

其具体应用情形有二,一是总体呈正态时,不论样本容量的大小,样本均数的分布都呈正态分布。

因为,中心极限定理一指出,总体正态时,从总体抽取的容量为n 一切可能样本的均数呈正态分布。

二是总体呈非正态时,只要样本容量大于30,样本均数的分布呈近似正态分布。

因为,中心极限定理一指出,当n 足够大时,无论总体分布形态如何,样本均数的分布服从或接近正态分布。

相关文档
最新文档