第五章 抽样分布

合集下载

抽样与抽样分布

抽样与抽样分布

抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。

抽样的目的是通过样本来推断总体的特征和性质。

在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。

一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。

这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。

常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。

2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。

这样可能导致样本的代表性不足,从而产生较大的估计误差。

有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。

二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。

统计量可以是样本均值、样本方差等。

抽样分布的性质对于进行统计推断和假设检验非常重要。

2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。

中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。

3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。

这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。

4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。

通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。

为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。

三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。

以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。

通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。

2. 假设检验假设检验是统计学中常用的推断方法之一。

通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。

chapter5 抽样分布.

chapter5 抽样分布.
并且X1,X2 相互独立,则X1+X2 ~2(n1+n2)
2分布表及有关计算
(1)构成 P{2(n)<λ}=p,已知n,p可查表求得λ;
(2)有关计算
P 2 (n) p



2 p
(n)
上侧分位数
λ
2分布的极限分布
• 2分布的极限分布是正态分布
5.3.2 t分布
f (t)
1、定义 若X~2(n1),Y~2(n2) ,X,Y独立,则
F

X Y
n1 n2
~
F (n1,
n2 )
称为第一自由度为n1 ,第二自由度为n2的F—分布, 其概率密度为
h(
y)


(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1

0,
n2
n1 n2
) y n1 / 2
lim f (t) (t)
1
t2
e 2 , x
n
2

t分布表及有关计算
上侧分位数:
P{t(n)>λ}=p
双侧分位数:
p
P{|t(n)|>λ}=2p,λ=tp(n)
t1 p (n)
t p (n)
t1 p (n) t p (n)
t分布的极限分布是正态分布
5.3.3 F分布
分层抽样的适用情形
分层随机抽样是判断抽样和随机抽样相结合的一种混合型抽样 方法。 分层抽样适宜于由差异较大的单位所组成的总体。它将分组法 与随机原则结合起来,减少了各组内标志值的差异程度,使各组都有 抽取样本单位的机会,有利于提高样本的代表性,能得到比简单抽样 更为准确的结果,因此在实际工作中应用较广泛。

曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

12.样本均值的抽样标准差 x ,( ).
A.随着样本量的增大而变小 B.随着样本量的增大而变大
5 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

C.与样本量的大小无关
D.大于总体标准差
【答案】A
【解析】根据样本均值的抽样分布可知,样本均值抽样分布的标准差 x
D.服从 2 分布
【答案】B
【解析】当 n 比较大时,样本均值的抽样分布近似服从正态分布。题中 n 36 30 为
大样本,因此样本均值的抽样分布近似服从正态分布。
5.估计量的含义是指( )。 A.用来估计总体参数的统计量的名称
2 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

圣才电子书 十万种考研考证电子书、题库视频学习平台

第五章 抽样分布与参数估计
一、单项选择题 1.抽样分布是指( )。 A.一个样本各观测值的分布 B.总体中各观测值的分布 C.样本统计量的分布 D.样本数量的分布 【答案】C 【解析】统计量是样本的函数,它是一个随机变量。样本统计量的分布称为抽样分布。
2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布, 其分布的均值为( )。
A.
B. X C. 2
2 D.
n 【答案】A
【解析】根据中心极限定理,设从均值为 ,方差为 2 的任意一个总体中抽取样本量 为 n 的样本,当 n 充分大时,样本均值的抽样分布近似服从均值为 ,方差为 2 n 的正
n
,样本
量越大,样本均值的抽样标准差就越小。
13.在用正态分布进行置信区间估计时,临界值 1.645 所对应的置信水平是( )。 A.85% B.90% C.95% D.99% 【答案】B 【解析】置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在

抽样与抽样分布(试题及答案)

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

)1.抽样推断的主要目的是( )。

A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2.抽样调查中,无法消除的误差是( )。

A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。

3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。

A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。

因为,故。

4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。

A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。

5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。

第五章 抽样法

第五章 抽样法

抽样的作用

抽样调查能够解决全面调查无法或难以解决的问
题。

抽样调查可以补充和订正全面调查的结果。
抽样调查方法可以用于生产过程中产品质量的检
查和控制。 抽样调查方法可以用于对总体的某种假设进行检 验,以判断这种假设的真伪,决定行动的取舍。

抽样中的几个基本术语
总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素
一、抽样的概念、特点、作用 二、抽样中的基本术语 (一)总体和样本 (二)参数和统计量 (三)样本容量和样本个数 (四)重复抽样和不重复抽样 (五)概率抽样与非概率抽样 (六)抽样框 三、抽样误差
抽样的概念 特点
(一)概念 抽样调查是按照随机原则从全部研究对象中抽取 一部分单位进行观察,并依据获得的数据对全部研 究对象的数量特征做出具有一定可靠性的估计和判 断.达到对现象总体认识的一种方法. (二)特点 它是按照随机原则从总体中抽取样本。 它是由部分推算整体的一种方法。 它是运用概率估计的方法。 抽样误差可事先计算并加以控制。
抽样中的几个基本术语
X
i 1 N
总体均值
X
i
N

X F
i 1 K i
K
i
F
i 1
i
标准差

X
N i 1
i
X
2
N

X
K i 1
i K
X Fi
i
2
F
i 1
抽样中的几个基本术语
总体方差
2
( X i X )2
i 1
N
N

( X i X ) 2 Fi

统计学中的抽样分布基本理论

统计学中的抽样分布基本理论

统计学中的抽样分布基本理论统计学是一门广泛应用于各个领域的学科。

在许多领域都需要数据支撑决策,统计学是收集、分析和解释数据的科学。

而抽样分布的基本理论则是统计学中最为基础且至关重要的概念之一。

什么是抽样分布?抽样分布指的是在总体中选取一定数量样本的情况下,样本所呈现的分布情况。

这个分布被称为抽样分布。

抽样分布正是在原本无法得出准确结果时,在对样本进行检测和分析加以处理得出的模拟分布情况。

抽样分布的定义我们假设样本是从一个总体中随机抽取的,这个总体具有一个概率分布,并且每个样本都独立地从该概率分布中抽取。

根据中心极限定理,当样本数量足够大时,样本均值的分布将会近似正态分布,均值为总体均值,标准差为总体标准差除以样本量的平方根。

这个近似于正态分布的抽样分布称为样本均值的抽样分布。

抽样分布中的t分布因为在实际应用中,样本的真实总体均值和总体标准差都是为了推断或预测总体特征,而在抽样时这些特征是不确定的,所以会有一定误差。

这时我们便需要用到其它类型的抽样分布。

t分布就是这样一种抽样分布方式,它在样本量较小时,比正态分布更适用。

它类似于正态分布,但在小样本情况下,会有更宽的尾部和更高的峰值。

t分布具有参数自由度 (df) ,其在自由度越大时,越接近于正态分布。

当自由度大于30时,两者基本一致。

了解抽样分布形式和方法对于进行更高质量的统计分析意义重大。

在统计中,我们总是使用概率论和数理统计中的一些基本思想来尽可能减少污染。

特别是在数据采集的实际工作中,数据样本的选取是统计分析的重要基础之一,样本均值的分布越正常,那么就可以推断出样本中的点集越正常。

抽样分布是推断总体、检验总体分布、总体均值、总体比率、总体标准差等经典统计问题的基础。

统计学(李荣平)2014-5

统计学(李荣平)2014-5

P{t>tα(n)}= h(t;n)dt
t (n)
的数tα(n)为t(n)分布的上α分为点。 例:查表求:t0.05(8), t0.95(8)
o
t (n)
第一节 抽样分布
(三)F 分布
设 U ~ 2(n1 ),V ~ 2(n2 ), 且设 U,V 独立,则称随机变量
F U / n1 V / n2
保证质量,规定σ≤0.6mm时,认为生产过程处于良好控制
状态。为此,每隔一定时间抽取20个零件作为一个样本,并
计算样本方差S2。若P{S2≥c } ≤0.01(此时σ=0.6mm),
则认为生产过程失去控制,必须停产检查,问:
(1)C为何值时,S2≥c的概率才小于或等于0.01? (2)若取得的一个样本的标准差S=0.84,生产过程是
第五章 抽样分布与参数估计

第一节 抽样分布
要 内
第二节 参数点估计

第三节 区间估计
第一节 抽样分布
一、随机样本
总体与个体:试验全部可能的观测值叫总体;试验的 每一个观测值叫个体。
样本容量与样本个数:样本中包含的单位数叫样本容 量;从一个总体中可能抽取多少个样本叫样本个数。
总体容量:总体中所包含的个体数。 有限总体和无限总体:总体容量可数的称有限总体, 不可数的称无限总体。 重置抽样(重复抽样)和无重置抽样(不重复抽样)
X
1 n
n i 1
Xi
为样本均值;称统计量
S 2
1 n1
n i1
(Xi
X )2
为 样本方差 ,称统计量 S
S2
1n
( X X ) 2 为样本标准差 ;统计量
n 1 i1 i

概率论与数理统计第五章2

概率论与数理统计第五章2
tα (n)
分布的上 分位数或上侧临界值, 的数tα(n)为t分布的上α分位数或上侧临界值, 其几何意义见图5-7. 其几何意义见图
标准正态分布的分位数
在实际问题中, 在实际问题中, α常取0.1、0.05、0.01. 常用到下面几个临界值: 常用到下面几个临界值:
u0.05 =1.645, , u0.05/2=1.96, ,
u0.01 =2.326 u0.01/2=2.575
数理统计中常用的分布除正态分布外, 数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布, 三个非常有用的连续型分布,即
定理5.1 定理5.1
设(X1,X2,…,Xn)为来自正态总体 X~N( ,σ 2)的样本,则 的样本, ~ (1) 样本均值 X与样本方差S 2相互独立; 相互独立; n (2)
(n 1)S
2
σ
2
=
∑(X X)
i =1 i
2
σ
2
~ χ (n 1)
2
(5.8)
与以下补充性质的结论比较: 与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
上侧临界值. 如图. 上侧临界值 如图
概率分布的分位数(分位点) 概率分布的分位数(分位点) 定义 对总体X和给定的α (0<α<1),若存在xα, α 分布的上侧 分位数或 上侧α 使P{X≥xα} =α, 则称xα为X分布的上侧α分位数或 α y α o xα x
P{X≥xα} =α α
∫ xα
其中Sn
(5.10)
=
2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差 分别为两总体的样本方差.
n1 + n2 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算出所有的
2
2值
经济、管理类 基础课程
统计学
均值的标准误
1. 所有可能的样本均值的标准差,测度所 有样本均值的离散程度
2. 小于总体标准差 3. 计算公式为
x n
经济、管理类 基础课程
统计学
两个样本方差比的抽样分布
两个样本方差比的抽样分布 统计学
设X1,X2,… ,Xn1是来自正态总体N~(μ1,σ12 )的 一个样本, Y1 ,Y2 ,… ,Yn2 是来自正态总体 N~(μ2,σ22 ) 的 一 个 样 本 , 且 Xi(i=1,2,… , n1) , Yi(i=1,2, …,n2)相互独立,则
=10
n=4 x 5 n =16 x 2.5
= 50
X
x 50
X
总体分布
抽样分布
经济、管理类 基础课程
中心极限定理
(图示)
统计学
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
t 分布
标准正态分布
t (df = 13)
正态分布
t (df = 5)
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
经济、管理类 基础课程
统计学
第二节 参数估计基本方法
一. 点估计 二. 点估计的优良性准则 三. 区间估计
经济、管理类 基础课程
统计学
参数估计的方法
估 计 方 法



区间估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
统计学
• 1.假定条件
– –
2. 使用正态分布统计量Z x Z ~ N (0,1) n 3. 总体均值 在1-置信水平下的置信区间为 , x Z 2 x Z 2 n n
经济、管理类 基础课程
总体均值的区间估计
.3 .2 P(x)
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和方差 统计学
1.0 1.5 4.0 x 2.5 M 16
i 1
n
经济、管理类 基础课程
x
i 1
n
i
2 x
( xi x ) 2
2. 给出总体参数落在这一区间的概率 3. 例如: 总体均值落在50~70之间,置信度为 95% 样本统计量
置信区间 (点估计)
置信下限
置信上限
经济、管理类 基础课程
置信区间估计
(内容)
置信区间
统计学
均 值 2 已知 2 未知
比例
方差
经济、管理类 基础课程
统计学
落在总体均值某一区间内的 样本
P(x)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
x 2.5
2 x 0.625
样本均值的抽样分布 统计学 与中心极限定理
经济、管理类 基础课程
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所 有容量为n的样本的均值X也服从正态分布,X 的 数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
(1,10) (5,10) (10,10)
经济、管理类 基础课程
F
经济、管理类 基础课程
统计学
T 统计量的分布
经济、管理类 基础课程
统计学
T 统计量的分布
设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12 )的一个 样本, 称 n( X ) 为统计量,它服从自由度为(n-1)的t 分布 T S
(无偏性)
统计学
• 无偏性:估计量的数学期望等于被估计的总体 • 参数
P( X )
无偏 有偏
A
C

X
经济、管理类 基础课程
估计量的优良性准则
(有效性)
有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量
P(X )
均值的抽样分布
统计学
有效性:一个方差较小的无偏估计量称为一个更
B
A
中位数的抽样分布
经济、管理类 基础课程
经济、管理类 基础课程
统计学
1. 2. 3. 4.
学习目标
了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的 区间估计
经济、管理类 基础课程
统计学
第一节 抽样与抽样分布
一. 总体、个体和样本 二. 关于抽样方法 三. 样本均值的分布与中心极限定理 四. 样本方差的分布 五. 两个样本方差比的分布 六. T 统计量的分布

X
经济、管理类 基础课程
估计量的优良性准则
(一致性)
统计学
• 一致性:随着样本容量的增大,估计量越来越 接 • 近被估计的总体参数
较大的样本容量
P(X )
B A
较小的样本容量

X
经济、管理类 基础课程
统计学
区间估计
经济、管理类 基础课程
区间估计
(概念要点)
统计学

1.根据一个样本的观察值给出总体参数的估计 范围
经济、管理类 基础课程
估计量
(概念要点)
用于估计总体某一参数的随机变量
如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均值 x = 3 ,则 3 就是 的估计值
统计学
• 1.
– – –
2. 理论基础是抽样分布
二战中的点估计
经济、管理类 基础课程
估计量的优良性准则
经济、管理类 基础课程
经济、管理类 基础课程
统计学
第三节 总体均值和总体比例 的区间估计
一. 总体均值的区间估计 二. 总体比例的区间估计 三. 样本容量的确定
经济、管理类 基础课程
统计学
总体均值的区间估计
(2已知)
经济、管理类 基础课程
总体均值的置信区间
(2 已知)
总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n 30)
• 所有可能的n = 2 的样本(共16个) • 第一个 • 观察值 • 第二个观察值 • 1 • 2 • 3 • 4
• 1
• 2 • 3 • 4
• 1,1
• 2,1 • 3,1 • 4,1
• 1,2
• 2,2 • 3,2 • 4,2
• 1,3
• 2,3 • 3,3 • 4,3
• 1,4
• 2,4 • 3,4 • 4,4
抽样方法
(概念要点)
简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层的概率选取样本
进行抽样


整群抽样:将一组被调查者(群)作为一个抽样单位
等距抽样:在样本框中每隔一定距离抽选一个被调查
2.

非概率抽样:不是完全按随机原则选取样本
统计学
点估计
经济、管理类 基础课程
点估计
(概念要点)
统计学
1. 从总体中抽取一个样本,根据该样本的统计 量对总体的未知参数作出一个数值点的估计
例如: 用样本均值作为总体未知均值的估计值 就是一个点估计

2. 点估计没有给出估计值接近总体未 知参数程度的信息
3. 点估计的方法有矩估计法、顺序统计量法、 最大似然法、最小二乘法等
(n 1) s 2 ~ (n 1) 2
2
将2(n – 1)称为自由度为(n-1)的卡方分布
经济、管理类 基础课程
统计学
卡方 (2) 分布
选择容量为n 的 不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本


计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者
3.
配额抽样:选择一群特定数目、满足特定条件的被调 查者
经济、管理类 基础课程
统计学
样本均值的抽样分布
经济、管理类 基础课程
抽样分布
(概念要点)
统计学
1. 所有样本指标(如均值、比例、方差等) 所形成的分布称为抽样分布
2. 是一种理论概率分布 3. 随机变量是 样本统计量
– 样本均值, 样本比例等
4. 结果来自容量相同的所有可能样本
经济、管理类 基础课程
样本均值的抽样分布
(一个例子)
统计学
【例】设一个总体,含有4个元素(个体),即总体单 位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下
经济、管理类 基础课程
样本均值的抽样分布
(一个例子)
统计学
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
• 第 • 16个样本的均值(x) 一 • 第二个观察值 个 • 观 • 1 • 2 • 3 • 4 • 1. • 1. • 2. • 2. • 察 1 0 5 0 5 值 • 1. • 2. • 2. • 3. • 2 5 0 5 0 • 2. • 2. • 3. • 3. • 3 0 5 0 5 • 2. • 3. • 3. • 4. • 4 5 0 5 0
相关文档
最新文档