抽样和抽样分布课件

合集下载

统计学之抽样与抽样分布

统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差

有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体

称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。

统计学 第三章抽样与抽样分布

统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取

统计学第六章抽样和抽样分布

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

(04)第4章+抽样与抽样分布

(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大

《统计学》第9章 抽样与抽样分布

《统计学》第9章 抽样与抽样分布

二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi

x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1

抽样和抽样分布详解演示文稿

抽样和抽样分布详解演示文稿
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样 五、多阶段抽样
第18页,共83页。
简单随机抽样
(simple random sampling)
——对总体单位逐一编号,然后按随机原则 直接从总体中抽出若干单位构成样本
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式
生产性投资情况。
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
样本n=100×10=1000(户)
第25页,共83页。
抽样组织方式的选择 在实际工作中,选择适当的抽样组织方 式主要应考虑:
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J
LP KO
HI
LP HD
样本容量
n nd np nl nh
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
第24页,共83页。
多阶段抽样
—— 指分两个或两个以上的阶段来完成抽取 样本单位的过程
例:在某省100多万农户抽取1000户调查农户
样本抽样分布特征的证明
设从总体中抽出的样本为x1,x2,x3…xn ,由于是重复抽样, 每个xi都是从总体中随机抽出的,都是与总体同分布的随机
变量,并且是相互独立的。总体的平均数为,方差为 2,则:
E(
x)
E(
x1 +x2
x3 n
xn
)
1 n
[E(x1)+E(x2 )+E(x3)

第三章抽样和抽样分布

第三章抽样和抽样分布
第三章抽样和抽样分布
Probability Sample
• Probability Sample • A probability sample is a sample chosen
by chance. We must know what samples are possible and what chance, or probability, each possible sample has.
第三章抽样和抽样分布
统计应用
“抓阄”征兵计划
➢ 然而结果是,有73个较小的号码被分配给了前半
年的日子,同时有110个较小的号码被分配给了后 半年的日子。换句话说,如果你生于后半年的某 一天,那么,你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人
➢ 在这种情况下,两个数字之间只应该有随机误差,
convenience sampling chooses the individuals
easiest to reach. Here is an example
of convenience sampling.
Both voluntary response samples and
convenience samples produce samples that are almost guaranteed not to represent the entire
被分配的号码较大的人也许永远轮不上到军队服役
➢ 这种抓阄看起来对决定应该被征召入伍是一个相当不错
的方法。然而,在抓阄的第二天,当所有的日子和它们 对应的号码公布以后,统计学家们开始研究这些数据。 经过观察和计算,统计学家们发现了一些规律。例如, 我们本应期望应该有差不多一半的较小的号码(1到183) 被分配给前半年的日子,即从1月份到6月份;另外一半 较小的号码被分配给后半年的日子,从7月到12月份。 由于抓阄的随机性,前半年中可能不会分到正好一半较 小的号码,但是应当接近一半

抽样及抽样分布

抽样及抽样分布

分层抽样 概念:分层抽样又称类型抽样。首先将总体单
位按某一个标志分层;然后在各层按随机抽样的方 法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调
查,所以分层时应该尽量让每层内的变异程度小,
而层间的变异程度大。分层抽样的抽样误差较简单 随机抽样小,样本具有很好的代表性。
抽样平均误差的计算公式:
z
(
X 1
X
)
2
( 1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
如果: X1 和 X2 是两个非正态总体,当和样本容
量足够大,
z
(
X1
X
2
)
(1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
NEXT
二、样本成数及成数差的抽样 分布
成数的概念 样本成数的分布 两个总体样本成数差的分布
,则样本的成数为p n1
n

例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件原则抽100件,其中
有3件不合格品,则样本的成数为p 3% 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改革 方案工人的支持率,产品的正品率等。
假设A、B、C、D、E5位同学的统计学成绩分别为: 80、 86、90、92、96。可计算得总体均值为88.8,总体方 差为29.76。现在随机从中抽容量为2的样本。
重复抽样的所有可能的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85
86 88
样本 (BA)(BB) (BC) (BD)(BE)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 方法:随机数表。
74715 63905 60678 25514 1866 91304 34729 71986 44826 63694 56936 58319 58020 74045 58006 28668 92038 95002 88451 52056 41343 47936 21472 78278 3868 57767 89168 60772 37953 51464 68345 17347 13514 31760 35717 21630 73683 31660 28409 99721 18734 91670 54770 2513 58818 47693 7499 58368 1386 37919
• 例:估计某一快餐店11:30-13:30午饭时间顾客从点餐到 拿到食品的平均时间。
9
自无限总体的抽样
• 因为对于无限总体不可能进行标号排列,所以抽样过程 中不能用随机数。
• 例:当一名顾客出示打折券时,他之后的下一名顾客将 被选入样本。因为顾客出示打折赠品券的是随机而且独 立的,所以厂商的抽样计划满足来自无限总体的简单随 机样本的两个条件。
6
自有限总体的抽样
• 例:人事主管正在制定一项公司2500名管理人员的简报。 假定2500名管理人员已经按照他们在职员文件中的顺序 依次标号(即1,2,3,⋯,2499,2500)
74715 63905 60678 25514 1866 91304 34729 71986 44826 63694 56936 58319 58020 74045 58006 28668 92038 95002 88451 52056 41343 47936 21472 78278 3868 57767 89168 60772 37953 51464 68345 17347 13514 31760 35717 21630 73683 31660 28409 99721 18734 91670 54770 2513 58818 47693 7499 58368 1386 37919
3
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
4
简单随机抽样
• 简单随机样本(有限总体) –随机样本中每个样本点以相等的概率被抽出。
• 随机样本(无限总体) –每个个体来自同一总体。 –各个个体的选择是独立的。
5
自有限总体的抽样
• 每次只选择一个样本点,总体中的每一个体等可能被抽 到。
12
3 抽样和抽样分布
简单随机抽样 点估计与抽样分布
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
13
点估计
由30管理人员组成的简单随机样本的年薪和培训情况
14
点估计
样本均值 样本标准差
样本比率
51814.00美元
点估计的 3347.72美元 统计过程
0.63
15
由30名管理人员组成的简单随机样本的点估计值
400个 样本
支持人数 160
推断
支持该候选人的选民 占全部选民的比例:
160/400=40%
2
抽样估计方法主要用在下列两种情况:
• 对所考查的总体不可能进行全部测度; • 从理论上说可以对所考查的总体进行全部测度,但实践
上由于人力、财力、时间等方面的原因,无法(不划算) 进行全部测度。
抽样估计只得到对总体特征的近似测度,因此,抽 样估计还必须同时考察所得结果的“可能范围” 与“可 靠程度”。
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
1
什么是抽样估计?
• 例1:制造商生产一种被认为寿命更长的新型轮胎。
120个 样本
测试
平均里程 36,500公里
推断
新轮胎 平均寿命: 36,500公里
• 例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民 众占全部登记投票人总数的比例。由于时间及财力的限制:
10
练习
• 假定一个有限总体有350项,用下面五位随机数的后三位, 确定被选入简单随机样本的项的前四位。 98601 73022 83448 34229 27553 84147 93289 14209
11
练习
• 说明下列总体是有限还是无限的。 a. 加利福尼亚州所有登记的选民。 b. 由宾夕法尼亚州阿伦顿TV-M公司工厂生产的所有电 视装置。 c. 某一邮购业务公司处理的所有订单。 d. 所有打入某一地方警察局的紧急电话。 e. Fibercon有限公司在5月17日第二个轮班中制造的所 有部件。
本容量很大时,样本均值的抽样分布可用正态概率分布 近似。
• 大样本条件可假定为简单随机样本样本容量为30或更多 • 当总体为正态概率分布时,对任何样本容量,样本均值
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。
• 放回抽样:一个元素一旦选入样本,仍被放回总体中。 先前被选入的元素可能再次被选,并且在样本中可出现 多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
20
x 的数学期望
• 例:管理人员总体的年薪均值 μ=51800美元。
样本均值所有可能值的均值也等于51800美元。
21
x 的标准差(标准误差)
• 有限总体修正系数
• 经验法则:当n /N≤0.05时,一般可忽略有限总体修正系
数。
4000
22
x 抽样分布的形式
• 中心极限定理 从总体中抽取样本容量为n的简单随机样本,当样
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
18
3 抽样和抽样分布
简单随机抽样 点估计
x 的抽样分布
p 的抽样分布
点估计的性质 其他抽样方法
19
x 的抽样分布
• x抽样分布的性质 – x的均值或数学期望 – x的标准差 – x抽样分布本身的形状或形式
相关文档
最新文档