第五章 抽样与抽样分布

合集下载

抽样与抽样分布

抽样与抽样分布

抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。

抽样的目的是通过样本来推断总体的特征和性质。

在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。

一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。

这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。

常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。

2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。

这样可能导致样本的代表性不足,从而产生较大的估计误差。

有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。

二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。

统计量可以是样本均值、样本方差等。

抽样分布的性质对于进行统计推断和假设检验非常重要。

2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。

中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。

3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。

这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。

4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。

通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。

为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。

三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。

以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。

通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。

2. 假设检验假设检验是统计学中常用的推断方法之一。

通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。

统计学之抽样与抽样分布

统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差

有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体

称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。

抽样与抽样分布(试题及答案)

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

)1.抽样推断的主要目的是( )。

A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2.抽样调查中,无法消除的误差是( )。

A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。

3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。

A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。

因为,故。

4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。

A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。

5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。

曾五一 应用统计学 第5章

曾五一 应用统计学 第5章
2
(
)
(
)
2
P =
n1 n
σ 2 ( P ) = P( 1 − P )
二、样本容量与样本个数 1.样本容量。样本集合的大小称为样本容量, 一般用n表示。一般地,样本容量大于30的样 本称为大样本,不超过30的样本称为小样本。 2.样本个数。样本个数又称样本可能数目,它 是指从一个总体中可能抽取多少种样本。样本 个数的多少与抽样方法有关。
Xi = ∑ X ij
j =1 M
M 样本平均是: X=
i =1 j =1
(i = 1,2,L, r )
∑ ∑ X ij rM
r M
= i =1
∑Xi r
r
群间方差是: 2 ∑ (µ i − µ ) 2 δ = R 或者由样本数据估计: −X δ2 r 由于整群抽样都采用不重复抽样的方法,所以样本平均数的标准差是:
四、抽样组织的设计 1.简单随机抽样是基本抽样组织方式 2.类型抽样与整群抽样比较 (1)减小类型抽样中样本平均数标准差的 办法。 (2)减小整群抽样的样本平均数标准差的 办法。
第四节 大数定理与中心极限定理
大数定理:独立同分布的随机变量 X1,X2,…,Xn,…,设它们的平均数 为 µ ,方差为 σ 2 ,即, E ( X i ) = X , σ 2 ( X i ) = σ 2 ,(i=1,2,…)。则对任意的 正数 ε,有: 1 n lim p ∑ X i − µ < ε = 1 n→∞ n i =1
解:样本平均数(平均每次加油量) X = 用样本组间方差代替总体组间方差:
i =1
∑ Xi r
r
=
330 = 33 (公斤) 10
δ2
∑ (X =

第五章抽样与抽样估计

第五章抽样与抽样估计
第五章 抽样与抽样估计
❖ 本章内容:抽样与抽样估计是推 断统计学中最基本的内容。学习本 章了解抽样调查中的基本概念;掌 握样本平均数、样本比例的抽样分 布;掌握抽样估计的基本方法;了 解其他抽样组织方式及其特点。重 点是总体均值、总体比例的区间估 计方法。
2021/3/3
第五章抽样与抽样估计
1
第五章 抽样与抽样估计
2021/3/3
第五章抽样与抽样估计
8
二、常用的抽样方法
❖ 1、简单随机抽样
❖ 其中又可以分为重复抽样和不重复抽样。
❖ (1)重复抽样:又称重置抽样,是指从总 体中抽出一个样本单位,记录其标志值后, 又将其放回总体中继续参加下一轮单位的抽 取。特点是:第一,n个单位的样本是由n次 试验的结果构成的。第二,每次试验是独立 的,即其试验的结果与前次、后次的结果无 关。
2021/3/3
第五章抽样与抽样估计
3
1总体与总体参数
构成总体的个别事物(基本单元)就是总 体单位,也称个体。总体单位的总数称为 总体容量,记作N。
❖ (2)总体参数:抽ห้องสมุดไป่ตู้估计中用来反映总体数量特 征的指标。研究目的确定后,总体确定,总体参 数存在但未知,需要估计。
❖ A、变量总体中各单位可以直接用数量表示,设 各单位变量值为:X1, X2,… XN,则总体参数 有均值,标准差或方差以及总体标志总量,即
各单位不能用数量之间表示,但可以计
算计算总体成数,如前面所学P=N1/ N, Q=N0/N,P+Q=1,则总体参数有均值, 标准差或方差以及具有某一属性的单位
总数,即:
__
X P
P(1P),NP
2021/3/3
第五章抽样与抽样估计

抽样与样本抽样分布

抽样与样本抽样分布

抽样与样本抽样分布抽样是统计学中常用的一种方法,通过从总体中选择一部分个体进行观察和测量,然后根据所得的样本数据来做出对总体的推断和判断。

在抽样的过程中,我们常常会遇到样本抽样分布,它是指当样本容量充分大时,样本统计量的分布情况。

本文将介绍抽样的概念和样本抽样分布的特点。

一、抽样的概念抽样是指从总体中选取一部分个体进行观察和测量,以便推断总体的特征。

在统计学中,总体是指我们所关心的全部个体或事物的集合,而抽样则是从总体中选择的一部分个体,这些个体被称为样本。

抽样的目的是为了在实际调查中减少资源和时间成本,同时能够保证所选样本的代表性和可靠性。

二、样本抽样分布的特点当样本容量充分大时,样本统计量的分布会呈现出一定的规律,这就是样本抽样分布的特点。

样本抽样分布可以用来推断总体参数的概率分布,其中较为常见的是均值和比例的抽样分布。

1. 均值的抽样分布在正态分布的总体中,当样本容量充分大时,样本均值的分布将近似服从正态分布。

这一规律被称为中心极限定理。

具体而言,当总体近似为正态分布时,样本均值的抽样分布也将近似为正态分布。

而当总体不服从正态分布时,样本容量足够大时,样本均值的抽样分布仍然近似服从正态分布,这是由于大样本均值的分布对总体分布的偏离具有一定的抵消作用。

2. 比例的抽样分布对于二分类总体而言,比例的抽样分布可以用二项分布进行描述。

当总体中两个分类的比例已知时,可以通过二项分布来计算样本比例的抽样分布。

当总体比例未知时,可以使用样本比例的点估计和抽样分布来对总体比例进行推断。

在样本容量充分大时,样本比例的抽样分布将近似服从正态分布,这是由于根据中心极限定理,二项分布在大样本下趋近于正态分布。

三、样本抽样分布的应用样本抽样分布是统计学中重要的理论基础,对各个领域的研究和实践具有广泛的应用价值。

以下介绍几个常见的应用场景。

1. 参数估计在进行统计推断时,我们常常需要对总体参数进行估计。

通过样本抽样分布,我们可以对总体参数进行点估计或区间估计,并借助抽样误差进行可靠性评估。

第5章抽样调查及参数估计(练习题)

第5章抽样调查及参数估计(练习题)

第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。

2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。

3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。

4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。

5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。

6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。

7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。

8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。

三、选择题1.抽样调查需要遵守的基本原则是( B )。

A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。

A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。

A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。

A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。

黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】

黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】

N
5
(2)重复抽样的两两样本的平均数如表 5-1 所示。
表 5-1 两两样本的平均数
单位:元
样本值
140
160
180
200
220
140
140
150
160
170
180
160
150
160
170
180
190
180
160
170
180
190
200
200
170
180
190
200
210
220
180
190
200
210
(2)由(1)可得:
P(X a) P( X 40 a 40) 1 ( a 40) 0.05
2
2
2

( a 40) 0.95 2
则 a 40 1.645 ,解得:a=43.29。 2
1/8
圣才电子书 十万种考研考证电子书、题库视频学习平台

5.3 设 X~t(n),写出它的密度函数以及均值和方差。 解:t(n)的密度函数为:
220
由表 5-1 可知,样本均值的分布如表 5-2 所示。
表 5-2 样本均值的分布
样本均值 X (元)Fra bibliotek频数概率
140
1
1/25
150
2
2/25
160
3
3/25
170
4
4/25
3/8
圣才电子书

180
十万种考研考证电子书、题库视频学习平台
5
1/5
190
4
4/25
200
量 n=36 的样本。(1)求样本均值 X 的抽样分布;(2)如果 P( X a) 0.05 ,求 a 的值。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 n lim P X i 1 n n i 1
定律表明:只要随机变量独立同分布,即 使不存在有限方差,其数学期望仍可由n 个随机变量的算术平均值作为其近似值。
6
end
二、中心极限定理
在统计学中,论证随机变量和的极限分 布是正态分布的一系列定理统称为中心 极限定理(central limit theorem)。
26
end
根据样本抽选的方法不同,可分为:
随机起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
半距起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
对称起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
27
end
系统抽样的好处: 1. 可以使抽样过程大大简化,减轻抽 样的工作量; 2. 如果用有关标志排队,还可以缩小 抽样误差,提高抽样推断效果。 按有关标志排队系统抽样,实际上是 一种特殊的分层抽样。
仅适用于规模不大、内部各单位标志值差异 较小的总体
23
end
二、分层抽样
先将总体按某一标志分层,然后从各 层中按随机原则抽取样本单位组成样本。
实质上是分组法与随机原则的结合。 例如,在居民生活水平调查中,先按职业 分类,然后每种职业分别随机抽取部分居 民进行调查。
24
end
样本在各层间的分配方法:
10
end
一、分位数
设X为随机变量,对给定的概率(1>>0), 若实数F满足不等式
P{ X F }
则称F为随机变量X分布概率为的上侧分 位数。 若实数T/2满足不等式 P{| X | T 2 } 则称T/2为随机变量X分布概率为的双侧 分位数。
11
end
标准正态分布的上侧分位数
8
end
棣莫佛—拉普拉斯中心极限定理
定理表明,当n很大,np和n(1-p) (n 是试验的次数,p是试验中事件A发生 的概率)也都不太小时,二项分布可以 用正态分布去近似。
9
end
第三节 由正态分布导出的几个重要分布
由样本统计量对未知总体分布进行 推断,必须知道统计量所服从的分布。 本节介绍几个重要的常用统计量分 布:2分布,t分布, F分布。
37
end
四、样本方差的分布
1. 在重复选取容量为 n 的样本时,由样本方 差的所有可能取值形成的概率分布
2. 对于来自正态总体的简单随机样本,则比 值 ( n 1) s 2
2
的抽样分布服从自由度为 (n-1) 的 2 分布, 2 即 ( n 1) s 2

2
~ ( n 1)
南昌航空大学
1
end
第五章 抽样与抽样分布 第一节 统计量 第二节 大数定律与中心极限定理 第三节 由正态分布导出的几个重 要分布 第四节 常用的抽样方法 第五节 抽样分布
2
end
第一节 统计量
统计量(statistic):描述样本特征的 概括性数字度量,根据样本数据计算的一 个随机变量,是对总体分布特征推断的 工具。
一、抽样分布概念 样本统计量取值的概率分布,叫抽样 分布(sampling distribution)。 是推断统计中用样本推断总体时的重 要理论依据。
31
end
二、样本均值的分布
1. 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的概率分布
2. 推断总体均值的理论基础
32
end
总体服从正态分布 N(μ,σ2) ,该总体的任何容 量的样本均值 x 也服从正态分布, x 的期望 值为μ,方差为σ2/n。即x ~N(μ,σ2/n)
28
end
四、整群抽样
将总体全部单位分为若干“群”,然后以群 作为抽样单位,从总体中抽取若干群作为样 本,并对中选群的所有单位进行全面调查。 例:总体群数R=16
A E I M B F J N C G K O D H L P
样本群数r=4 样本容量
D P I H
n nd n p ni nh
对总体未作任何处理,按随机原则直接从总 体中抽出若干单位构成样本. 抽取样本的具体方法: 直接抽选法 抽签法:将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽选, 签上的号码所对应的单位就是样本单位。 随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
设X1, X2, …Xn为总体X的样本,如果 样本的函数g(X1, X2, …Xn)是一个随机 变量,并且不包含任何未知参数,则 称g(X1, X2, …Xn)为统计量。
3
end
几个常用的统计量:
n 1 1. 样本均值: X X i n i 1
n 1 2 2. 样本方差: S 2 (Xi X ) n 1 i 1
X m F Y n
服从自由度m和n的F分布,记为
F ~ F ( m , n)
20
end
不同自由度的F分布
(1,10)
(5,10) (10,10)
F
右偏分布
21
end
第四节 常用的抽样方法
通常有以下几种抽样方法: 简单随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样
22
end
一、简单随机抽样
end
t分布的性质:
(1)与正态分布一样,是对称的,但比正 态分布要平一些。 (2)自由度充分大时,t分布近似于正态分 布。自由度趋向无穷大时,t分布就是标准 正态分布。
(3)t分布的均值为0,其方差为n/(n-2)。
19
end
F-分布 (F(n), 且X与Y相互独立, 则称
3.样本标准差:
S
1 2 ( X X ) i n 1 i 1
4
end
n
第二节
大数定律与中心极限定理
一、大数定律
大数定律(laws of large numbers) 也称大数法则,它是阐述大量同类随机现 象的平均结果稳定性的规律。
5
end
辛钦大数定理
设随机变量X1, X2, …Xn相互独立,服 从同一分布,且具有数学期望 EXi=(i=1,2,…n) 则对任意0,有
38
end
=10
x 5
n=4
x 2.5
n =16
= 50
总体分布
X
x 50
抽样分布
x
33
end
从均值为,方差为2的一个任意总体中抽取 容量为n的样本,当n(30)充分大时,样本均 值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布
任意 分布 的总 体
x n
2
14
end
不同自由度的2-分布
n=1 n=4 n=10
2
15
end
2-分布性质和特点
1. 变量值始终为正 2. 通常为不对称的右偏分布,随着自由度的 增大逐渐趋于对称 3.期望E(2)=n,方差D(2)=2n(n为自由度) 4. 可加性:若 U 和 V 为两个独立的 2 分布随机 变量,U~2(n1),V~2(n2), 则U+V服从自由度为n1+n2的2分布

0
Z
Z
12
end
标准正态分布的双侧分位数
/ 2
-Z/2
0
/ 2
Z/2
Z
13
end
2-分布 (2-distribution)
设 X1 , X2 , ……Xn 是取自标准正态总 体的样本 ,则随机变量
X
2 i 1
n
2 i
服从具有n个自由度的2分布,记为
~ ( n)
7
end
X
i 1
独立同分布中心极限定理 设X1, X2, …Xn是独立同分布的随机变量序 列,且存在有限的数学期望EXi=和方 差DXi=2 (i=1,2,…n) ,那么当n时 n,
i
~ N ( n , n ) 或X ~ N ( ,
2
2
n)
中心极限定理为均值的抽样推断奠定了理论 基础。不论总体服从何种分布,只要期 望和方差存在,对这一总体进行重复抽 样,当样本量充分大,样本均值就趋于 正态分布。
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
29
end
五、多阶段抽样 某公司要进行全国性的产品售后服务满意度 调查时,通常是先抽几个省,然后从抽中的 省中抽取若干个城市,从抽中的城市中,再 抽取若干个县、村,最后再抽到户,这种抽 样方式就是多阶段抽样。
30
end
第五节 抽样分布
等比例分配法:按各层单位的比例分配样 本单位。
类型抽样的优点: 能提高样本的代表性; 组织起来较为方便;
25
end
三、系统抽样
先将总体各单位按某一标志排队,然后按固 定的顺序和间隔抽取样本单位。又称机械抽 样或等距抽样。
系统抽样是不重复抽样,适合于对单位数不 多且能进行排序的总体抽样。 排序和所研究标志数值大小无关。 按无关标 志排队 如调查居民生活水平时,按姓氏笔 划排队。 按有关标 排序和所研究标志数值大小有密切 志排队 关系。如居民收入调查,按银行存 款多少排序。
n0 p n
n1 或 1 p n
36
end
样本比例的分布
1. 在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的概率分布 2. 当样本容量很大时(np≥5和 n(1p)≥5) ,样本比例的抽样分布可用正态分 布近似,即 3.
(1 ) p ~ N , n
样本均值 的抽样分 布趋于正 态分布
相关文档
最新文档