抽样分布与参数估计

合集下载

抽样分布与参数估计

抽样分布与参数估计首先，我们来了解什么是抽样分布。

在统计学中，抽样分布是指从总体中多次抽样得到的样本统计量的分布。

假设我们的总体是指所有感兴趣的个体的集合，而样本是从总体中选取的一部分个体。

抽样分布的形状和性质取决于总体的分布和样本的大小。

通过分析抽样分布，可以得到有关总体参数的有用信息。

例如，我们想要知道一些城市成年人的平均年收入。

在实际情况下，我们无法调查每个人的收入情况，因此我们需要从总体中随机抽取一部分个体作为样本，并计算他们的平均年收入。

如果我们多次从总体中抽取样本并计算平均年收入，然后绘制这些平均值的分布图，我们就可以得到平均年收入的抽样分布。

这个抽样分布将给我们提供有关总体平均年收入的估计和推断。

接下来，我们将讨论参数估计。

参数估计是指使用样本数据来估计总体参数的过程。

总体参数是用于描述总体特征的数值，如总体平均值、总体标准差等。

通过从总体中抽取样本，并计算样本统计量，我们可以利用样本统计量来估计总体参数。

常用的参数估计方法有点估计和区间估计。

点估计是指用单个数值来估计总体参数，例如用样本均值来估计总体均值。

点估计给出了一个单一的值，但不能提供关于估计的精度的信息。

因此，我们常常使用区间估计。

区间估计是指给出一个区间，这个区间内有一定的置信水平使得总体参数落在这个区间内的概率最高。

区间估计能够向我们提供关于估计的精确程度的信息。

区间估计依赖于抽样分布的性质。

中心极限定理是制定抽样分布理论的一个重要原则。

根据中心极限定理，当样本容量足够大时，样本均值的抽样分布将近似于正态分布。

这使得我们可以使用正态分布的性质来计算置信区间。

构建置信区间的一种常用方法是使用样本均值的标准误差。

标准误差是样本均值的标准差，它用来衡量样本均值和总体均值之间的误差。

根据正态分布的性质，当样本容量足够大时，样本均值与总体均值之间的误差可以用标准误差来估计。

通过计算标准误差并结合正态分布的性质，我们可以得到样本均值的置信区间。

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是，标准差是，从这个总体中抽出一个容量是 n 的样本，则样本平均数 X 也服从正态分布，其平均数 E( X ) 仍为，其标准
差为。 X 5-19
从正态分布的再生定理可以看出，只要总体变量服从正态分布，则从中抽取的样本，不管n 是多少，样本平均数都服从正态分布。但是在客观实际中，总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题，需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节抽样的基本概念与数学原理
一、有关抽样的基本概念二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
（一）样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明：尽管个别现象受偶然因素影响，有各自不同的表现。但是，对总体的大量观察后进行平均，就能使偶然因素的影响相互抵消，消除由个别偶然因素引起的极端性影响，从而使总体平均数稳定下来，反映出事物变化的一般规律。

抽样分布与参数估计

三、t分布曲线下的面积分布规律
自由度为的t分布曲线
t 分布曲线下的整个面积为1, t 分布曲线下从a到b 的面积为t值分布在此范围内的百分比，即t值落在此范围内的概率P。
双侧：由于t分布以0为中心对称，即 P（t≤- t, ）＝ P（t≥ t, ）＝ /2 于是有P（- t, ≤t≤ t, ）＝1-
sx
u X
X
t X ＝n-1
s X
u分布 t分布
二、t分布图形的特点
• 1. t分布是一簇曲线。 t分布有一个参数，即自由度，与标准差的自由度一致。
• 2. t分布曲线以0为中心，左右对称；越小， t变量值的离散程度越大，曲线越扁平。
• 3. t分布曲线较标准正态曲线要扁平些（高峰低些，两尾部翘得高些），逐渐增大， t分布曲线逐渐的逼近于标准正态曲线，若＝，则t分布曲线和标准正态曲线完全吻合。
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
点值估计
参数估计
假设检验
区间估计
一、基本概念
➢ 参数估计：用样本统计量来估计总体参数。
点值估计：不计抽样误差，直接用样本均数来估计μ。
区间估计：根据抽样误差的规律，按一定的概率估计总体均数的所在范围。统计上习惯用95% 或99%可信区间表示总体均数可能所在范围。
第一节均数的抽样误差第二节 t分布第三节总体均数可信区间的估计
一、抽样研究:从总体中随机抽取部分观察单位构成样本，用样本信息去推断总体特征的研究方法。
统计推断的过程
总体
样
样本统计量
本
例如：样本均
值、比例
二、抽样误差：在抽样研究中，因抽样造成的样本统计量与样本统计量、样本统计量与总体参数的差值。

抽样分布与参数估计

思考题：收视率估计
▪ 某电视台欲在95%的置信度水平下，对电
视节目的收视率作为有效的估计，试考虑样本量应当为多少？
▪ 问题：若确定估计绝对误差为5%，则样
本为385户，是否可行？
▪ 若考虑估计相对误差为10%，则样本量应
当为多少？
统计学原理
其他样本量估计的情况
▪ 估计样本比例时样本量的确定 ▪ 估计两个总体均值之差时样本量的确定 ▪ 估计两个总体比例之差时样本量的确定 ▪ 以上问题，均可通过参数估计的公式进行
o 比例估计时，方差为：p(1-p) o 可知，p(1-p)的最大值为0.25。
统计学原理
比例估计时的样本量推算
在校园内估计学生拥有手机的比例，希望在95%的置信水平下，估计的绝对误差不超过5个百分点(5%)，求样本量
n
1.962
0.052
2
, 取
2
Max
0.25
则有n 385
统计学原理
助记方法
统计学原理
统计学原理
一个总体参数—总体均值
▪ 正态总体，方差已知；
o 或非正态总体，大样本，方差已知。
z x ~ N (0,1) X n
置信区间:
(
x
za
2
X
n
,
x
za
2
X
n
)
注意：Z取a/2的原因在于此时置信区间是最小的。
统计学原理
一个总体参数—总体均值
▪ 正态总体，方差未知
统计学原理
计算结果
▪ 计算样本平均数：X=39.5 ▪ 计算样本标准差：s=7.7736 ▪ 令：总体标准差=样本标准差，计算抽样误差为
1.2956

抽样分布、参数估计和假设检验

抽样分布一、抽样分布的理论及定理（一）抽样分布抽样分布是统计推断的基础，它是指从总体中随机抽取容量为n 的若干个样本，对每一样本可计算其k 统计量，而k 个统计量构成的分布即为抽样分布，也称统计量分布或随机变量函数分布。

（二）中心极限定理中心极限定理是用极限的方法所求的随机变量分布的一系列定理，其内容主要反映在三个方面。

1．如果总体呈正态分布，则从总体中抽取容量为n 的一切可能样本时，其样本均数的分布也呈正态分布；无论总体是否服从正态分布，只要样本容量足够大，样本均数的分布也接近正态分布。

2．从总体中抽取容量为n 的一切可能样本时，所有样本均数的均数（X μ）等于总体均数（μ）即μμ=X3．从总体中抽取容量为n 的一切可能样本时，所有样本均数的标准差（X σ）等于总体标准差除以样本容量的算数平方根，即n X σσ=中心极限定理在统计学中是相当重要的。

因为许多问题都使用正态曲线的方法。

这个定理适于无限总体的抽样，同样也适于有限总体的抽样。

中心极限定理不仅给出了样本均数抽样分布的正态性依据，使得大多数数据分布都能运用正态分布的理论进行分析，而且还给出了推断统计中两个重要参数（即样本均数X μ与样本标准差X σ）的计算方法。

（三）抽样分布中的几个重要概念1．随机样本。

统计学是以概率论为其理论和方法的科学，概率又是研究随机现象的，因此进行统计推断所使用的样本必须为随机样本（random sample ）。

所谓随机样本是指按照概率的规律抽取的样本，2．抽样误差。

从总体中抽取容量为n 的k 个样本时，样本统计量与总体参数之间总会存在一定的差距，而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同，称为抽样误差。

3．标准误。

样本统计量分布的标准差或某统计量在抽样分布上的标准差，符号SE 或Xσ表示。

根据中心极限定理其标准差为n X σσ=正如标准差越小，数据分布越集中，平均数的代表性越好。

统计学第 6 章抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的，或是可以计算出来的当用样本对总体目标量进行估计时，要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本，每个单位入抽样本的概率是相等的最基本的抽样方法，是其它抽样方法的基础特点简单、直观，在抽样框完整时，可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时，不易构造抽样框抽出的单位很分散，给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近，从而提高估计的精度组织实施调查方便既可以对总体参数进行估计，也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列，在规定的范闱内随机地抽取一个单位作为初始单位，然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位，以后依次取r+k,r+2k…等单位优点：操作简便，可提高估计的精度缺点：对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群)，抽样时直接抽取群，然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框，可简化工作量调查的地点相对集中，节省调查费用，方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时，样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布，即把某种样本统计量看作一个随机变量，这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值，样本比例，样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值，样本比例，样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息，是进行推断的理论基础，也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布，也不是样本分布，是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布（例题分析）【例】设一个总体，含有4个元素（个体），即总体单位数N=4。

参数的假设检验抽样分布、参数估计、假设检验(回归分析)

z = -3.162 < 1.64 接受原假设
5% 1.64
假设检验的基本原理
2）相伴概率 P 检验统计量观察值以及所有所有比
它更为极端的可能值出现的概率之和双侧检验：
P = P(Z < -3.162) + P(Z > 3.162) = 0.002
左侧检验：P = P(Z < -3.162) = 0.001
1
t分布两尾概率分位点
P(x t / 2sx x t / 2sx ) 1
参数估计 - 区间估计
正态总体方差的区间估计
(n 1)s2
2
~
2 (n 1)
2分布上尾概率分位点
P(12
2
(n 1)s2
2
2
2)
1
P(
(n 1)s2
12 2
2
(n 1)s
2 2
2
)
1
参数估计 - 区间估计
n
Z x ~ N(0,1) 2 n
中心极限定理
➢ 无论样本所来自的总体是否服从正态分布，只要样本足够大，样本平均数就近似服从正态分布，样本越大，近似程度越好。
➢所需的样本含量随原总体的分布而异，但只要样本含量 30，无论原总体是何分布，都足以满足近似的要求。
➢设原总体的期望为，方差为 2，则样本平均数的期望为，方差为 2 /n。
统计推断概述
抽样分布参数估计简介假设检验的基本原理
抽样分布的概念
样本统计量的概率分布称为抽样分布（sampling distribution）
样本是通过对总体的随机抽样获得的样本统计量是随机变量，有一定的概率分布
简单随机样本

统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章抽样分布与参数估计习题答案一、单选1.B ；2.D ；3.D ；4.C ；5.A ；6.B ；7.C ；8.D ；9.A ；10.A 二、多选1.ADE ；2.ACDE ；3.ABCD ；4.ADE ；5.BCE6.ACD ；7.ACDE ；8.ACE ；9.BCE ；10.ABD 三、计算分析题1、解：n=10，小样本，由EXCEL 计算有：11.6498==S x ；（1）方差已知，由10596.14982⨯±=±nz x σα得，（494.9，501.1）（2）方差未知，由1011.62622.2498)1(2⨯±=-±nS n t x α得，（493.63，502.37）2、n=500为大样本，p=80/500=16%，则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=（14.4%，17.6%） 3、nx σσ=，由于大国抽取的样本容量大，则抽样平均误差小。

4、（1）3.10100103===nS x σ（小时）；=-=-=100)95.01(95.0)1(n p p p σ 2.18%（2）=⨯±=±3.10211202x z x σα（1099.4,1140.6） ⨯±=±2%952p z p σα2.18%=（90.64,99.36）5、为简化起见，按照重复抽样形式计算（1）∑∑=ff s Si22=22.292； 472.010072.4===nS x σ（2）93.0691472.096.1100691002±=⨯±=±nSz x α=（690.07,691.93） 6、由于总体标准差已知，则用标准状态分布统计量估计nz x σα2=∆（1）10160170102022=-===∆αασz nz x则58.12=αz ，有%29.94)58.1(=F α=1-94.29%=5.71%，则概率%58.88%71.5%29.941=-=-=α （2）=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97（个）（3）=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385（个）允许误差缩小一半，样本容量则为原来的4倍。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（二）总体参数与样本统计量 1.总体参数总体分布的数量特征就是总体的参数，也是抽样统计推断的对象。常见的总体参数有：总体的平均数指标，总体成数 (比例)指标，总体分布的方差、标准差等等。它们都是反映总体分布特征的重要指标。 2.样本统计量样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和推断总体的有关参数。常见的样本统计量有：样本平均数，样本比例，样本的方差、标准差。
2.不放回抽样。每次从总体抽取一个单位，记录其标志值后不放回原总体，不参加下一轮抽样。下一次继续从总体中余下的单位中抽取。特点是：第一，n 个单位的样本由 n 次试验结果构成，但由于每次抽出不放回，所以实质上相当于从总体中同时抽取 n 个样本单位。第二，每次试验结果不是独立的，上次中选情况影响下次抽选结果。第三，每个单位在多次(轮)试验中中选的机会是不 N! 等的。如果考虑顺序，其样本可能个数为； ( N n)! N! 如果不考虑顺序，其样本可能个数为。 ( N n)! n!
（三）概率抽样及其组织形式所谓概率抽样，就是要求对总体的每一次观察（每一次抽取）都是一次随机试验，并且有和总体相同的分布。按这样的要求对总体观测（抽取）n次，可得到容量为n的样本。
例5-1
有10个同样的球，分别标有从1至10的号码。（1）
从中有目的地抽出5号球；（2）从中随便地取一个球；（3）把10个球放在袋中，充分混匀，从中抽出一个球，抽取时，要求袋中各个球有相等的被抽中的概率。
1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10
（四）放回抽样与不放回抽样 1.放回抽样。放回抽样的具体做法是：从总体中抽出一个样本单位，记录其标志值后，又将其放回总体中继续参加下一轮单位的抽取。放回抽样的特点是：第一，n个单位的样本是由n次试验的结果构成的。第二，每次试验是独立的，即其试验的结果与前次、后次的结果无关。第三，每次试验是在相同条件下进行的，每个单位在多次试验中选中的机会 (概率)是相同的。在放回抽ห้องสมุดไป่ตู้中，样本可能的个数是Nn，N为总体单位数，n为样本容量。
（五）抽样分布从总体中可以随机地抽取许多样本，由每一个样本都可以计算样本统计量的观测值，所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此，抽样分布也可以称为样本统计量的概率分布。抽样分布可能是精确地服从某种已知分布（所谓已知分布，例如我们在第四章介绍过的各种常见分布），也可能是以某种已知分布为极限分布。在实际应用中，后者更为多见。
10人中有放回抽二人的全部可能样本
3 1,3 (2) 2,3 (2.5) 3,3 (3) 4,3 (3.5) 5,3 (4) 6,3 (4.5) 7,3 (5) 8,3 (5.5) 9,3 (6) 10,3 (6.5)
1 第一次抽取可能被抽中的人员 2 3 4
5
6 7
8
9 10
例5-2
对某公司 10 名推销员用放回抽样方式抽取容量为 n=2
n 的样本（y1，y2），构造统计量 Y ( yi ) / n 。10 名推 i 1
销员任职年限如表 5-2。
表5-2 10名推销员任职年限资料推销员编号任职年限（xi）
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10
第二次抽取可能被抽中的人员 4 5 6 7 1,4 1,5 1,6 1,7 (2.5) (3) (3.5) (4) 2,4 2,5 2,6 2,7 (3) (3.5) (4) (4.5) 3,4 3,5 3,6 3,7 (3.5) (4) (4.5) (5) 4,4 4,5 4,6 4,7 (4) (4.5) (5) (5.5) 5,4 5,5 5,6 5,7 (4.5) (5) (5.5) (6) 6,4 6,5 6,6 6,7 (5) (5.5) (6) (6.5) 7,4 7,5 7,6 7,7 (5.5) (6) (6.5) (7) 8,4 8,5 8,6 8,7 (6) (6.5) (7) (7.5) 9,4 9,5 9,6 9,7 (6.5) (7) (7.5) (8) 10,4 10,5 10,6 10,7 (7) (7.5) (8) (8.5)
表5-3
1 1,1 (1) 2,1 (1.5) 3,1 (2) 4,1 (2.5) 5,1 (3) 6,1 (3.5) 7,1 (4) 8,1 (4.5) 9,1 (5) 10,1 (5.5) 2 1,2 (1.5) 2,2 (2) 3,2 (2.5) 4,2 (3) 5,2 (3.5) 6,2 (4) 7,2 (4.5) 8,2 (5) 9,2 (5.5) 10,2 (6)
第五章抽样分布与参数估计
第一节抽样的基本概念与数学原理
第二节
第三节第四节第五节
抽样分布
参数估计样本容量的确定 Excel在参数估计中的应用
第一节抽样的基本概念与数学原理
一有关抽样的基本概念
二大数定理与中心极限定理
一、有关抽样的基本概念
（一）样本容量与样本个数 1.样本容量样本是从总体中抽出的部分单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。一般地，样本单位数大于30个的样本称为大样本，不超过30个的样本称为小样本。 2.样本个数。样本个数又称样本可能数目，它是指从一个总体中可能抽取多少个样本。
要求：（1）计算样本的可能个数。（2）给出统计量 X 的分布、数学期望和标准差。

解：（1）可能样本数=Nn=102=100 所有可能得到的样本如表 5-3。表中方格内数对是用推销员序号表示的样本的各种配合方式，括号内数字是推销员任职年限的样本均值。（2）用表 5-3 中各样本配合方式的样本均值（括号中数字）数据作成分布数列（表 5-4）便描述了样本平均数这个统计量的分布。
解：显然，（1）和（2）的抽取行为都不是随机试
验。因而不属于概率抽样。只有（3）的抽取行为是随机试验。总体的分布可用表5-1的分布列来描述，而（3）的随机试验中所观测的随机变量也有与表51有相同的分布。所以，（3）的抽取行为是概率抽样。
表5-1 10个球号码的分布号码频率 1 2 3 4 5 6 7 8 9 10

抽样分布与参数估计

抽样分布与参数估计

第5章--抽样分布与参数估计教案资料

抽样分布与参数估计

抽样分布与参数估计

抽样分布、参数估计和假设检验

统计学 第 6 章 抽样与参数估计

参数的假设检验抽样分布、参数估计、假设检验(回归分析)

统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

统计学第 6 章抽样与参数估计