统计学课件-6 抽样推断
合集下载
统计学第六章抽样推断

尖山一委…
尖山二委
居民一组
居民二
组
…
第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断
《统计抽样推断》课件

实例二:产品质量检测抽样设计
总结词
严谨且准确
VS
详细描述
产品质量检测抽样设计是确保产品质量的 重要环节。通过严谨的抽样设计和统计分 析,能够准确地评估产品的质量状况,及 时发现并解决潜在的质量问题。
实例三:社会现象研究抽样设计
总结词
客观且公正
详细描述
社会现象研究抽样设计在社会科学研究中具 有广泛的应用。通过客观公正的抽样方法, 能够有效地揭示社会现象的内在规律,为政 策制定和社会管理提供科学依据。
02
03
非随机抽样
样本容量
如果样本不是随机抽取的,那么 样本可能不能代表总体,从而导 致抽样误差。
样本容量的大小也会影响抽样误 差,一般来说,样本容量越大, 抽样误差越小。
抽样误差的估计
标准误差
标准误差是衡量抽样误差的一个常用指标,它表示样 本均值的分布情况。
变异系数
变异系数是标准误差与样本均值之比,用于比较不同 样本的标准误差。
《统计抽样推断》ppt课件
目录
• 抽样的基本概念 • 抽样方法 • 样本统计量 • 抽样误差 • 置信区间和假设检验 • 实例分析
01
抽样的基本概念
抽样的定义与目的
定义
抽样是从总体中选取一部分个体进行 研究的过程。
目的
通过对样本的观察和分析,推断总体 的特征和规律。
抽样的分类
随机抽样
按照随机原则从总体中抽取样 本,每个个体被选中的机会相
置信区间
通过置信区间可以估计样本均值与总体均值之间的差 距,从而了解抽样误差的大小。
降低抽样误差的方法
增加样本容量 随机抽样 分层抽样 重复抽样
增加样本容量可以减少抽样误差,因为更多的样本可以提供更 准确的信息。
统计学基础课件(第六章抽样推断)

Fundamentals of Statistics
统计是指这种偶然性代表性误差。 即按随机原则抽样时,在没有登记性误差和系统性误 差的条件下单纯由于不同的随机样本得出不同估计量 而产生的误差。抽样误差是抽样调查所固有的,是无 法避免与消除的,但可以运用数学方法计算其数量界 限,并通过抽样设计程序控制其范围,所以这种抽样 误差也称为可控制误差。 需要指出,抽样误差不是 固定不变的数,它的数值是随样本不同而变化的,所 以它也是随机变量。
重复抽样 AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
N n = 42 =16 (个样本)
Fundamentals of Statistics
统计学基础
第六章 抽样推断
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
Fundamentals of Statistics
Fundamentals of Statistics
统计学基础
第六章 抽样推断
本章主要内容 •抽样推断概述 •抽样误差 •抽样估计的方法 •样本容量的确定
Fundamentals of Statistics
统计学基础
第第一六章节抽样推抽断样推断概述
一、抽样推断的概念和特点 概念
抽样推断是在抽样调查的基础上,用样 本实际资料计算样本指标,并据以推算总 体相应的数量特征的一种统计分析方法。
代表性误差的发生有以下两种情况:
一种是由于违反抽样调查的随机原则,如有意地多选较好的 单位或较坏的单位进行调查。这样做,所据以计算的抽样指标 必然出现偏高或偏低现象,造成系统性的误差。系统性误差和 登记性误差都是不应当发生的,是可以也应该采取措施避免发 生或将其减小到最小限度。
精品课件-统计学原理与应用-第06章 抽样推断

,
在一定的抽样平均误差条件下,概率度t越大,则极限误差△
越大,区间(
,
x)或(xp-△x p,x p+△p)范围越宽,
总体指标落在该区间内的概率(可能性)越大,抽样估计的
可靠程度越高。
三、影响抽样误差大小的因素
1、总体各单位标志值的差异程度 2、样本容量即样本单位数 3、抽样调查的组织方式和抽样方法
【例6-4】要估计某乡粮食亩产量和总产量水平,从8000 亩粮食作物中,用不重复抽样方法抽取400亩,求得平均 亩产为450千克。如果确定抽样极限误差为5千克,这就 要求某乡粮食亩产为450±5千克,即在445千克至455千 克之间,而粮食总产量为8000×(450±5)千克,即在3 560吨至3 640吨之间。
x,p
概率保证程度 F t
2、区间估计的模式 (1)在给定误差范围条件下的区间估计模式
1.抽取样本,计算抽样指标。 2.根据给定的极限误差范围,估计算总体指标的上限和下限。 3.计算概率度,查表求出概率F(t),并对总体参数作出区 间估计。
【例6-8】 【例6-9】
2、区间估计的模式
(2)在给定概率保证程度下的区间估计模式
抽样平均误差:
则:样本成数
p
p1 p
n
0.2 0.8 0.02 400
例题4
一批食品罐头共60000桶,随机抽查300桶,发现有6桶不
合格,求合格品率的抽样平
均误差?
已知: N 60000 n 300 n1 6
p n n1 300 6 0.98
n
300
则:样本合格率
p
二、抽样推断的内容 (一)参数估计 (二)假设检验
三、抽样推断的一些基本概念 (一)总体和样本
《国民经济统计学概论》_第六章_抽样推断

总体未分组: 2 (X X )2 N
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
经济应用统计学-第六章抽样推断

非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。
统计学课件第六章抽样调查PPT课件

特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
统计学课件:抽样推断

3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 抽样推断可以用于工业生产过程的质量控制。 • 利用抽样推断法还可以对于某种总体的假设进行检验,
判断其真伪,以作出正确的决策。
5
6.1.2 抽样推断的基本概念
全及总体和样本总体
全及总体也称母体,简称总体(Population), 是指所要研究对象的全体。
样本总体又称子样,简称样本(Sample)。它 是从全及总体中随机抽取出来的,用以代表全及 总体的部分单位的集合。
抽样误差有实际抽样误差、抽样平均误差和抽样 极限误差三个密切联系而又相互区别的概念
18
6.2 抽样误差总体总体参数样本样本统计量
4
抽样推断的特点
• 建立在随机取样的基础上 • 运用概率估计法 • 存在着可控性误差
统计推断的作用
• 对有些不可能或不必要进行全面调查, 但又需要了解 其全面数量情况的社会经济现象,可以运用抽样推断, 实现调查的目的。
• 抽样调查与全面调查同时进行,可以发挥互相补充和 检查调查质量的作用。
非概率抽样又称非随机抽样,是对总体中每一个 体都给予平等的抽取机会,即每一个体抽中或不 抽取完全由机遇规律来决定,排除人的主观因素 的选择。
10
抽样框与抽样单元
抽样框又称抽样结构,是指包括全部抽样单位的 名单框架 。
• 抽样框的主要形式
✓ 名单抽样框,即列出全部总体单位的名录一览表。 ✓ 区域抽样框,即按地理位置将总体范围划分为若干小区域,
《淮南子·说山训》 偶然的东西是没有根据的,因为它是偶然的; 但同样因为它是偶然的,它又是有根据的。
黑格尔
3
6.1 抽样推断概述
6.1.1 抽样推断的意义及特点
抽样推断的意义
抽样推断是在随机抽样基础上推论有关总体的情 况,即用样本对从中抽取样本的那个总体的数量 特征作出具有一定可靠程度的估计和判断。
14
等距抽样又称机械抽样或系统抽样,它是将总 体各单位按某一标志顺序排列,然后依一定的 间隔抽选样本单位。
整群抽样是先将总体按调查要求分成若干群, 然后以群为单位从总体中随机抽取样本单位, 对抽中的群进行全面调查的抽样组织形式。
多阶段抽样就是在抽选样本时并不是一次直接 从总体中抽取,而是分两个或两个以上的阶段 来进行。
8
样本可能数目又称样本个数,是指从全及总 体中可能抽取或可能构成的样本的数目。
抽样方式 重复抽样
不重复抽 样
1
3
4
是否考虑 顺序
考虑顺序
不考虑顺
2
序
9
概率抽样和非概率抽样
概率抽样又称随机抽样,是对总体中每一个体都 给予平等的抽取机会,即每一个体抽中或不抽取 完全由机遇规律来决定,排除人的主观因素的选 择。
1
第6章 抽样推断
学习目标
了解抽样推断的基本概念 重点掌握单一总体均值及单一总体比率的
区间估计方法。 掌握样本容量的确定方法。 了解两总体均值之差及两总体比例之差的
区间估计方法。 了解正态总体方差及两正态总体方差之比
的区间估计。
2
见一叶落,而知岁之将暮,睹瓶中之冰,而 知天下之寒,以近论远。
15
6.1.4 抽样推断的理论依据
大数法则(Law of Large Numbers)
大数法则证明,如果随机变量总体存在着有限的 平均数和方差,则对于充分大的抽样单位,能以 几乎趋近于1的概率,来期望样本平均数与总体 平均数的绝对离差为任意小,即对于任意的正数 有:
lim P x 1
7
• 根据对样本的要求不同,抽样方法又有考虑 顺序抽样和不考虑顺序抽样两种。 ✓ 考虑顺序抽样,即从总体个单位中抽取个 单位构成样本,不但要考虑样本各单位的 不同性质,而且还要考虑不同性质各单位 的中选顺序。 ✓ 不考虑顺序抽样,即从总体个单位中抽取 个单位构成样本。只考虑样本各单位的组 成成分如何,而不问单位的中选顺序。
统计量和参数
用于描述总体特征的指标,称为总体参数 (Parameter);
用于描述样本的特征的指标,则称为样本统计值 或统计量(Statistic)。
参数 指 标
统计量
总体 样本
12
总体参数与样本统计量的代表符号
项目 单位数 平均数
成数 标准差
方差
总体参数
N P, Q 2
抽样统计量
n
x
p, q
n
16
中心极限定理(central limit theorem)
x
n
一个任意分 布的总体
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
17
抽样误差是指样本指标与被它估计未知的总体 参数(总体特征值)之差。
注意
抽样误差是指由于抽样的随机性而产生的那一部 分误差,不包括登记性误差,也不包括可能发生 的偏差。
全及指标和抽样指标
全及指标是根据全及总体各个单位的标志值或标 志特征计算的、反映总体某种属性的综合指标。
抽样指标是由样本总体各个标志值或标志特征计 算的综合指标。
6
抽样方法和样本可能数目
抽样方法 • 根据取样的方式不同,抽样方式有重置抽样和不 重置抽样两种。 ✓ 重置抽样(duplicate sampling)是从总体 中每抽取一个样本单位后,将它再放回总体内, 使它在下一次抽样中仍有被抽取的机会。 ✓ 不重置抽样(non-repeated sampling) 是从总体中每抽取一个样本单位后,不将其再 放回总体内,因而任何单位一经抽出,就不会 有再被抽取的可能性。
s s2
13
6.1.3 抽样推断的组织形式
简单随机抽样又称纯随机抽样,它是按照随机 原则直接从总体中抽取样本单位。
类型抽样又称分层抽样。它首先把全及总体各 单位按某个标志分成若干个类型组,使各组组 内标志值比较接近,然后分别在各组组内按随 机原则抽取样本单位。
类型抽样具体分为两种方法
• 等比例类型抽样 • 不等比例类型抽样
以小区域为抽样单位。 ✓ 时间表抽样框,即将总体全部单位按时间顺序排列,把总
体的时间过程分为若干个小的时间单位,以此时间单位为 抽样单位。
• 抽样框的要求
✓ 一个理想的抽样框应该与目标总体一致,即应包括全部总 体单位,既不重复也不遗漏;尽可能利用与所研究变量相 关的辅助变量的信息。
11
抽样单元
• 将总体划分为有限个互补重叠又穷尽的部分,每一个 部分称为抽样单元(sampling unit)。
判断其真伪,以作出正确的决策。
5
6.1.2 抽样推断的基本概念
全及总体和样本总体
全及总体也称母体,简称总体(Population), 是指所要研究对象的全体。
样本总体又称子样,简称样本(Sample)。它 是从全及总体中随机抽取出来的,用以代表全及 总体的部分单位的集合。
抽样误差有实际抽样误差、抽样平均误差和抽样 极限误差三个密切联系而又相互区别的概念
18
6.2 抽样误差总体总体参数样本样本统计量
4
抽样推断的特点
• 建立在随机取样的基础上 • 运用概率估计法 • 存在着可控性误差
统计推断的作用
• 对有些不可能或不必要进行全面调查, 但又需要了解 其全面数量情况的社会经济现象,可以运用抽样推断, 实现调查的目的。
• 抽样调查与全面调查同时进行,可以发挥互相补充和 检查调查质量的作用。
非概率抽样又称非随机抽样,是对总体中每一个 体都给予平等的抽取机会,即每一个体抽中或不 抽取完全由机遇规律来决定,排除人的主观因素 的选择。
10
抽样框与抽样单元
抽样框又称抽样结构,是指包括全部抽样单位的 名单框架 。
• 抽样框的主要形式
✓ 名单抽样框,即列出全部总体单位的名录一览表。 ✓ 区域抽样框,即按地理位置将总体范围划分为若干小区域,
《淮南子·说山训》 偶然的东西是没有根据的,因为它是偶然的; 但同样因为它是偶然的,它又是有根据的。
黑格尔
3
6.1 抽样推断概述
6.1.1 抽样推断的意义及特点
抽样推断的意义
抽样推断是在随机抽样基础上推论有关总体的情 况,即用样本对从中抽取样本的那个总体的数量 特征作出具有一定可靠程度的估计和判断。
14
等距抽样又称机械抽样或系统抽样,它是将总 体各单位按某一标志顺序排列,然后依一定的 间隔抽选样本单位。
整群抽样是先将总体按调查要求分成若干群, 然后以群为单位从总体中随机抽取样本单位, 对抽中的群进行全面调查的抽样组织形式。
多阶段抽样就是在抽选样本时并不是一次直接 从总体中抽取,而是分两个或两个以上的阶段 来进行。
8
样本可能数目又称样本个数,是指从全及总 体中可能抽取或可能构成的样本的数目。
抽样方式 重复抽样
不重复抽 样
1
3
4
是否考虑 顺序
考虑顺序
不考虑顺
2
序
9
概率抽样和非概率抽样
概率抽样又称随机抽样,是对总体中每一个体都 给予平等的抽取机会,即每一个体抽中或不抽取 完全由机遇规律来决定,排除人的主观因素的选 择。
1
第6章 抽样推断
学习目标
了解抽样推断的基本概念 重点掌握单一总体均值及单一总体比率的
区间估计方法。 掌握样本容量的确定方法。 了解两总体均值之差及两总体比例之差的
区间估计方法。 了解正态总体方差及两正态总体方差之比
的区间估计。
2
见一叶落,而知岁之将暮,睹瓶中之冰,而 知天下之寒,以近论远。
15
6.1.4 抽样推断的理论依据
大数法则(Law of Large Numbers)
大数法则证明,如果随机变量总体存在着有限的 平均数和方差,则对于充分大的抽样单位,能以 几乎趋近于1的概率,来期望样本平均数与总体 平均数的绝对离差为任意小,即对于任意的正数 有:
lim P x 1
7
• 根据对样本的要求不同,抽样方法又有考虑 顺序抽样和不考虑顺序抽样两种。 ✓ 考虑顺序抽样,即从总体个单位中抽取个 单位构成样本,不但要考虑样本各单位的 不同性质,而且还要考虑不同性质各单位 的中选顺序。 ✓ 不考虑顺序抽样,即从总体个单位中抽取 个单位构成样本。只考虑样本各单位的组 成成分如何,而不问单位的中选顺序。
统计量和参数
用于描述总体特征的指标,称为总体参数 (Parameter);
用于描述样本的特征的指标,则称为样本统计值 或统计量(Statistic)。
参数 指 标
统计量
总体 样本
12
总体参数与样本统计量的代表符号
项目 单位数 平均数
成数 标准差
方差
总体参数
N P, Q 2
抽样统计量
n
x
p, q
n
16
中心极限定理(central limit theorem)
x
n
一个任意分 布的总体
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
17
抽样误差是指样本指标与被它估计未知的总体 参数(总体特征值)之差。
注意
抽样误差是指由于抽样的随机性而产生的那一部 分误差,不包括登记性误差,也不包括可能发生 的偏差。
全及指标和抽样指标
全及指标是根据全及总体各个单位的标志值或标 志特征计算的、反映总体某种属性的综合指标。
抽样指标是由样本总体各个标志值或标志特征计 算的综合指标。
6
抽样方法和样本可能数目
抽样方法 • 根据取样的方式不同,抽样方式有重置抽样和不 重置抽样两种。 ✓ 重置抽样(duplicate sampling)是从总体 中每抽取一个样本单位后,将它再放回总体内, 使它在下一次抽样中仍有被抽取的机会。 ✓ 不重置抽样(non-repeated sampling) 是从总体中每抽取一个样本单位后,不将其再 放回总体内,因而任何单位一经抽出,就不会 有再被抽取的可能性。
s s2
13
6.1.3 抽样推断的组织形式
简单随机抽样又称纯随机抽样,它是按照随机 原则直接从总体中抽取样本单位。
类型抽样又称分层抽样。它首先把全及总体各 单位按某个标志分成若干个类型组,使各组组 内标志值比较接近,然后分别在各组组内按随 机原则抽取样本单位。
类型抽样具体分为两种方法
• 等比例类型抽样 • 不等比例类型抽样
以小区域为抽样单位。 ✓ 时间表抽样框,即将总体全部单位按时间顺序排列,把总
体的时间过程分为若干个小的时间单位,以此时间单位为 抽样单位。
• 抽样框的要求
✓ 一个理想的抽样框应该与目标总体一致,即应包括全部总 体单位,既不重复也不遗漏;尽可能利用与所研究变量相 关的辅助变量的信息。
11
抽样单元
• 将总体划分为有限个互补重叠又穷尽的部分,每一个 部分称为抽样单元(sampling unit)。