抽样与抽样分布(5)

合集下载

统计学之抽样与抽样分布

统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差

有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体

称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。

抽样检验和抽样分布

抽样检验和抽样分布

占总体单位数N的比例,即:
n n n n 1 2 3 K n
N1 N2 N3
NN K
各类型组应抽取的样本单位数为:
N n
in
n N i N i N
样本比率抽样样本容量:按前面指定的比
例(n/N)从每组的Ni单位中抽取ni个单位 即构成一个抽样总体,其样本容量为:
K
n= n1+ n2+ n3+…+ nk= ni i 1
数μ;
3、样本平均数 x 分布的均方差 x 等于:
当为有限总体无放回抽样时,其样本均值 标准差为:
N
N x
N
N
p
1
p
如果总体为无限总体的或抽取是有放回的
,其样本均值标准差为:
x
N
(二)非正态总体样本平均数 x 的分布及
性质?
1、中心极限定理可以解决上述问题:
一个具有任意函数形式的总体,其样
2、抽样误差:是指由于随机抽样的偶然因 素使样本各单位的结构不足以代表总体 各单位的结构,而引起抽样指标和全及 指标之间的绝对离差。不包含登记性误 差和不遵守随机原则造成的偏差。
影响抽样误差的因素有:总体各单位标 志值的差异程度;样本的单位数;抽样 的方法;抽样调查的组织形式。
第二节 随机抽样设计
样本容量足够大(n=50),据中心极限
定理,x 近似服从正态分布。
(1)
3160
x
800 113.14
x
N
50
x
P x3000 P
x
3000
3160
/ n
113.14
Pz 1.41 0.9207
同理处理(2)和(3)

chapter5 抽样分布.

chapter5 抽样分布.
并且X1,X2 相互独立,则X1+X2 ~2(n1+n2)
2分布表及有关计算
(1)构成 P{2(n)<λ}=p,已知n,p可查表求得λ;
(2)有关计算
P 2 (n) p



2 p
(n)
上侧分位数
λ
2分布的极限分布
• 2分布的极限分布是正态分布
5.3.2 t分布
f (t)
1、定义 若X~2(n1),Y~2(n2) ,X,Y独立,则
F

X Y
n1 n2
~
F (n1,
n2 )
称为第一自由度为n1 ,第二自由度为n2的F—分布, 其概率密度为
h(
y)


(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1

0,
n2
n1 n2
) y n1 / 2
lim f (t) (t)
1
t2
e 2 , x
n
2

t分布表及有关计算
上侧分位数:
P{t(n)>λ}=p
双侧分位数:
p
P{|t(n)|>λ}=2p,λ=tp(n)
t1 p (n)
t p (n)
t1 p (n) t p (n)
t分布的极限分布是正态分布
5.3.3 F分布
分层抽样的适用情形
分层随机抽样是判断抽样和随机抽样相结合的一种混合型抽样 方法。 分层抽样适宜于由差异较大的单位所组成的总体。它将分组法 与随机原则结合起来,减少了各组内标志值的差异程度,使各组都有 抽取样本单位的机会,有利于提高样本的代表性,能得到比简单抽样 更为准确的结果,因此在实际工作中应用较广泛。

统计学 第三章抽样与抽样分布

统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取

统计学抽样与抽样分布

统计学抽样与抽样分布
查费用
3. 需要包含所有低阶段抽样单位的抽样框;同时由于
实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
概率抽样(小结)
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。
n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。
样本分量:其中每一个Xi是一个随机变量,称为样本 分量。
样本观察值:一次抽样中所观察到的样本数据x1、x2、 x3称为样本观察值。 对于某一既定的总体,由于抽样的方式方法不同,样 本容量也可大可小,因而,样本是不确定的、而是可5
一、 几个概念
(二)样本总体与样本指标
样本指标(统计量)。在抽样估计中,用来反 映样本总体数量特征的指标称为样本指标,也 称为样本统计量或估计量,是根据样本资料计 算的、用以估计或推断相应总体指标的综合指 标。
3
总体和参数(续)
通常所要估计的总体指标有
X
NX
一、 几个概念
(二)样本总体与样本指标
样本总体。简称样本(Sample),它是按照随机原则, 从总体中抽取的部分总体单位的集合体 。
样本容量:样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
(二)抽样平均误差(抽样标准误)
抽样平均误差是反映抽样误差一般水平的指标(因为 抽样误差是一个随机变量,它的数值随着可能抽取的 样本不同而或大或小,为了总的衡量样本代表性的高 低,就需要计算抽样误差的一般水平)。通常用样本 估计量的标准差来反映所有可能样本估计值与其中心 值的平均离散程度。

统计学中抽样和抽样分布基础知识

统计学中抽样和抽样分布基础知识
从无限总体的抽样 无限总体的随机样本 如果从一个无限总体中抽取一个容量为n的样本,使得以下条件被满足 抽取的每个个体来自于同一总体 每个个体的抽取是独立的
样本均值的抽样分布
定义:样本均值的所有可能值的概率分布 样本均值的数学期望:对于简单随机样本时,样本均值的数学期望与总体均值相等 样本均值样本中具有感兴趣特征的个体个数/样本容量 样本比率的抽样分布:是样本比率的所有可能值的概率分布
样本比率的数学期望:样本比率的数学期望与总体比率相等 样本比率的标准差
有限总体:有限总体修正系数*无限总体样本比率的标准差 无限总体:根号下p(1-p)/n 样本比率的抽样分布的形态 当样本容量足够大,同时np≥5和n(1-p)大于等于5时,样本比率的抽样分布可以 用正态分布近似
统计学中抽样和抽样分布基础知识
抽样基本属于
抽样总体:抽取样本的总体 抽样框:用于抽选样本的个体清单 参数:总体的数字特征
抽样
从有限总体的抽样 建议采用概率抽样 简单随机样本:从容量为N的有限总体中抽取一个容量为n的样本,如果容量为n 的每一个可能的样本都以相等的概率被抽出,则称该样本为简单随机样本 无放回抽样和有放回抽样 无放回抽样:被抽取对象已经选入样本,不希望该对象被多次选入 有放回抽样:对已经出现过的随机数仍选入样本
点估计
样本统计量:为了估计总体参数,计算样本的特征 抽样总体和目标总体
目标总体是我们想要推断的总体 抽样总体是指实际抽取样本的总体 点估计的性质 无偏性:样本统计量是相应总体参数的无偏估计量 有效性:采用标准误差较小的点估计量,给出的估计值与总体参数更接近 一致性:大样本容量给出的点估计与总体均值更接近
其他抽样方法
分层随机抽样:总体中的个体首先被分成层,总体中的每一个体属于且仅属于某一 层,从每一层抽一个简单随机样本 整群抽样:总体中的个体首先被分成单个组,总体中的每一个个体属于且仅属于某 一群,有群为单位抽取一个简单随机样本 系统抽样:对容量很大的总体,第一个个体为随机抽样,总体个体排列时个体的随 机顺序 方便抽样:非概率抽样 判断抽样:对总体非常了解主观确定总体中认为最具代表性的个体组成样本

抽样与抽样分布(试题及答案)

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

)1.抽样推断的主要目的是( )。

A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2.抽样调查中,无法消除的误差是( )。

A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。

3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。

A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。

因为,故。

4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。

A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。

5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。

第四章 抽样和抽样分布

第四章 抽样和抽样分布
E p P P1 P N n n N 1 P1 P n 1 n N
p
例子:
例:要估计某地区10000名适龄儿童的入学 率,用不重置抽样方法从这个地区抽取400 名儿童,检查有320名儿童入学,求样本入 学率的平均误差。 已知条件:
样本日工资平均数
单位:元
样本变量 34 34
38 42 46 50
38 36
38 40 42 44
42 38
40 42 44 46
46 40
42 44 46 48
50 42
44 46 48 50
34
36 38 40 42
抽样分布为:
Ex

x f
i 1 9
9
i i
样本日平均工资分布
样本日平均工资
三、抽样分布定理
样本平均数的抽样分布定理
(1)正态分布再生定理
X ~ N ( X , 2 ) ,则从这个总体中抽取样本容 总体变量
量为n的样本平均数 x 也服从正态分布,其平均数E ( x ) 仍为 X ,其标准差 ( x ) 。即样本平均数 x 服从正态分布 x ~ N ( X , 2 ) 。
不论总体是何种分布,只要样本的单位数量增 多,则样本平均数就趋于正态分布。
一般认为样本单位数不少于30的是大样本,样 本平均数的抽样分布就接近于正态分布。
总体未 知参数
1. 是一种理论概率分布
2. 样本统计量是随机变量
– 样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远我们稳定的信息, 是进行推断的理论基础,也是抽样推断科 学性的重要依据
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– –
STAT
4. 对于一般正态分布,即X~N(µ , σ),有 对于一般正态分布, ,
P (a≤ X ≤b)= Φ (b) −Φ (a) ≤ = ) ) P (|X| ≤a)= 2Φ (a) −1 = )
b−µ a−µ P(a ≤ X ≤ b) = Φ −Φ σ σ
随机起点 半距起点
STAT
(四)等距抽样(机械抽样或系统抽样) 等距抽样(机械抽样或系统抽样)
对称起点
······
(总体单位按某一标志排序) 总体单位按某一标志排序) 按无关标志排队,其抽样效果相当于简单随机抽样; 简单随机抽样; 按无关标志排队,其抽样效果相当于简单随机抽样 按有关标志排队,其抽样效果相当于类型抽样 类型抽样。 按有关标志排队,其抽样效果相当于类型抽样。
二、抽样组织形式
——对总体单位逐一编号, ——对总体单位逐一编号,然后按随机原 对总体单位逐一编号 则直接从总体中抽出若干单位构成样本 仅适用于规模不大、内部各单位 仅适用于规模不大、 标志值差异较小的总体
STAT
(一)简单随机抽样(单纯随机抽样) 简单随机抽样(单纯随机抽样)
应用
是最简单、最基本、最符合随机原则 是最简单、最基本、
(二)总体参数和样本统计量
STAT
根据全及总体各单位变量值计算的反映 全及总体某数量特征的综合指标, 全及总体某数量特征的综合指标,由于 全及总体唯一确定,故称总体参数。 全及总体唯一确定,故称总体参数。 根据样本总体各单位变量值计算的反映 样本总体某数量特征的综合指标, 样本总体某数量特征的综合指标,由于 样本总体不具唯一性, 样本总体不具唯一性,故称为样本统计 它是一个随机变量。 量,它是一个随机变量。
随机数表法
计算机模拟法
随机数字表
9745238942 1276465909 9874763642 2659305984 676587006 1676587006 0377797684 9877808423 2778006869 2133768790 8262130892 3286548900 8084634212 4332657790 7963645324 9087434329 . . . 3489962435 9866332890 8036522364 7065436387 1327690879 769087 1327690879 9535443208 9535443208 2148990085 7065 7065432549 0656433223 2437909854 2376987667 2137860769 8800523267 4379734343 3874856049 . . . 1287087765 2136217721 9878764346 4890832769 2164896589 6476793243 6476793243 4387005345 2164878454 2176590879 2167608965 3254776907 3243 3243700435 2187799990 1358787008 2125749768 . . . 7077434431 1422890012 0874321123 0437 0437575967 132577995 2132577995 4365789796 4365789796 4358650841 9343252534 4387670769 4637567488 2365879048 8765980234 1268803235 9323314766 2366897431 2366897431 . . . 9424252386 4879903443 2177609554 487975 97544 2148797544 7537697997 1254876987 6743219845 6743219845 3248906034 0765433245 8707867698 7694432767 9094232155 0232337932 0362212379 3478794235 . . .
STAT
又称总体或母体, 又称总体或母体,是统计抽样中所要 了解的研究对象整体。具有唯一性。 了解的研究对象整体。具有唯一性。 又称样本或子样, 又称样本或子样,是指在统计抽样中 按照“等机会原则” 按照“等机会原则”从全及总体中抽 出的部分单位。样本不具唯一性。 出的部分单位。样本不具唯一性。
n≥30称为大样本, n≥30称为大样本,n<30称为小样本.n/N称为抽样比. 称为大样本 30称为小样本.n/N称为抽样比. 称为小样本 称为抽样比
···
k
···
k
等比例抽取
二、抽样组织形式
(三)整群抽样(集团抽样) 整群抽样(集团抽样)
STAT
—— 将总体全部单位分为若干“群”,然后 将总体全部单位分为若干“ 随机抽取一部分“ 随机抽取一部分“群”,被抽中群体的所有单 位构成样本 总体群数R=16 样本群数r=4 例:总体群数R=16 样本群数r=4
(三)重置抽样与不重置抽样
不重置抽样
抽出 个体
STAT
又被称作不重复抽样、不放 又被称作不重复抽样、 回抽样 登记 特征 继续 抽取
特点
总体单位数减少,同一单位只可能被 总体单位数减少, 抽中一次。在连续抽取时, 抽中一次。在连续抽取时,每次抽取 都不是独立进行。 都不是独立进行。
是最为常用的抽样方法, 是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。 体和许多有限总体样本单位的抽样。
总体参数和样本统计量符号
STAT
抽样推断
全及总体
STAT
参数(未知量) 参数(未知量) 统计推断
样本总体
统计量(已知量) 统计量(已知量)
(三)重置抽样与不重置抽样
重置抽样
抽出 个体
STAT
又被称作重复抽样、放回抽样 又被称作重复抽样、 登记 特征 放回 总体 继续 抽取
特点
同一总体单位有可能被重复抽中, 同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行。 而且每次抽取都是独立进行。
二、抽样组织形式
(二)分层随机抽样(类型抽样) 分层随机抽样(类型抽样)
STAT
——将总体全部单位分类,形成若干个类型组, ——将总体全部单位分类,形成若干个类型组, 将总体全部单位分类 然后从各类型中分别抽取样本单位组成样本
N
总体 N
1
n
1
等额抽取
样本
N
N
2
n
n
2
n
能使样本结构更接近于总体结构,提高样本的代 能使样本结构更接近于总体结构, 表性; 表性;能同时推断总体指标和各子总体的指标
例如:在100万户居民中,随机抽取1000户居民进行 万户居民中, 1000户居民进行 例如: 100万户居民中 随机抽取1000
家庭收支情况调查,其中的100万户居民就是全及总体, 家庭收支情况调查,其中的100万户居民就是全及总体, 100万户居民就是全及总体 而被抽中的1000户居民则构成样本总体。 1000户居民则构成样本总体 而被抽中的1000户居民则构成样本总体。
STAT
第二节 常见的概率分布
一、正态分布 TAT
一、正态分布
(一)正态分布的定义及其特征
STAT
f(x) = 随机变量 X 的概率 f (x) 分布密度函数 µ = 总体均值 σ2 = 总体方差 π =3.1416; e = 2.7183
x
正态分布的特征
二、抽样组织形式
(五)多阶段抽样
—— 指分两个或两个以上的阶段来完成抽 取样本单位的过程 在某省100多万农户抽取 多万农户抽取1000户调查 例:在某省100多万农户抽取1000户调查 农户生产性投资情况。 农户生产性投资情况。
第一阶段:从该省所有县中抽取5 第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽 个乡中各抽5 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽 户 个村中各抽10 第四阶段:从被抽中的100个村中各抽10户 样本n=100×10=1000(户 样本n=100×10=1000(户)
随机原则的实现 抽签法
是将总体中每个单位的编号 是将总体中每个单位的编号写在外形完全 编号写在外形完全 一致的签上,将其搅拌均匀, 一致的签上,将其搅拌均匀,从中任意抽 选,签上的号码所对应的单位就是样本单 位。 将总体中每个单位编上号码 将总体中每个单位编上号码,然后使 编上号码, 用随机数表, 用随机数表,查出所要抽取的调查单 位。 是将随机数字编制为程序存储在计算 是将随机数字编制为程序存储在计算 机中,需要时将总体中各单位编上号 随机数字发生器输出随机数 启用随机数字发生器 码,启用随机数字发生器输出随机数 字,然后从总体中找到相应总体单位 形成样本。 形成样本。
的上方, )>0 1. 概率密度函数在x 的上方,即f (x)>0。
STAT
2. 正态曲线的最高点在均值µ,它也是分布的中 位数和众数。 位数和众数。 正态分布是一个分布族, 3. 正态分布是一个分布族 , 每一特定正态分布 来区分。 通过均值µ的标准差σ来区分。 对称, 4. 曲线 f(x) 相对于均值 µ对称 , 尾端向两个方向 无限延伸,且理论上永远不会与横轴相交。 无限延伸,且理论上永远不会与横轴相交。 正态曲线下的总面积等于1 5. 正态曲线下的总面积等于1。 随机变量的概率由曲线下的面积给出。 6. 随机变量的概率由曲线下的面积给出。
第一节 抽样及抽样组织形式
一、抽样的几个基本概念
(一)全及总体和样本总体 (二)总体参数和样本统计量 (三)重置抽样与不重置抽样
STAT
二、抽样组织形式
(一)简单随机抽样 (二)分层随机抽样 (三)整群抽样 (四)等距抽样 (五)多阶段抽样
相关文档
最新文档