抽 样 推 断

合集下载

抽样推断

抽样推断
2 2
(三)成数的区间估计 • ☆总体成数P的置信度为100(1-)%的置信 区间为: 重复抽样:
( x z / 2 m p , x z / 2 m p )
不重复抽样: N n N n ( x z / 2 m p , x z / 2 m p ) N 1 N 1
三、样本容量的确定 (一)确定样本容量的意义 • ☆ 找出在规定误差范围内的最小样本容量, 这样确定的样本容量可以在保证满足误差要求 下使得调查费用最小。
2 NZ / 2 P (1 P ) n 2 N2p Z / 2 P (1 P )
第五节
一、假设检验基本概念
假设检验
(一)假设检验基本原理 假设检验的一般步骤: 第一步:确定原假设和备择假设; 第二步:明确检验统计量; 第三步:根据显著性水平,确定拒绝域; 第四步:计算检验统计量的数值; 第五步:给出判断结论。
第八章
抽样推断
第一节
抽样推断概述
一、抽样推断的概念及特点 • ☆抽样推断的概念: 按随机原则从总体中抽取一部分单位(称为样 本),根据样本的信息对总体的数量特征进行科学 估计与推断的方法称为抽样推断。 • ☆抽样推断的主要特点: 第一、按随机原则抽取调查单位 第二、根据部分推断总体 第三、抽样误差可以估计和控制,推断结果 具有一定的可靠性和准确性。
mx
r R 1
其中 为平均数的群间样本方差,即 x2
1 r ( xi x ) 2 r i 1
2 x
(2)成数的抽样平均误差为:
mp
2 p Rr
r

R 1
2 其中 p 为成数的群间样本方差,即
r 1 2 2 p ( pi p ) r i 1

统计学第六章抽样推断

统计学第六章抽样推断

尖山一委…
尖山二委
居民一组
居民二


第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断

统计学 任务一八 抽样推断

统计学 任务一八 抽样推断

31
抽样平均误差
㈢影响抽样误差的主要因素
1.样本容量n。样本容量大小与抽样误差成反比。当 n=N,无抽样误差。此表明,若条件许可应尽量扩容。
2.总体各单位标志变异程度。如总体标准差σ或总体方 差 。标志变异程度大小与抽样误差成正比。当σ=0, 无抽样误差2 。
3.抽样组织形式。类型抽样和等距抽样的抽样误差较小, 整群抽样误差较大。实践中,可利用抽样误差的大小 来检验组织方式的有效性。
差的影响(对抽中群作全面调查,无抽样误差)。 因此群的划分,要尽量缩小群间的差异,加大群 内的差异。 由于样本单位过分集中在少数样本群,同样条件 下抽样误差较大。欲不扩大误差,则需要增加一 些样本群。
21
抽样组织形式
㈣等距抽样——机械抽样
等距抽样是先将总体单位按某一标志顺序排队,再按固 定顺序和相等距离(间隔k)抽取样本单位。
13
◎抽样方法
2.不重复抽样(不回置抽样)从总体中每次抽 取一个单位进行观察,登记后不再放回总体中, 依此直至抽取n 个单位。
不重复抽样的特点:
⑴ n次抽取实质上等于一次同时抽取n个单位; ⑵ n次抽取相互不独立(对下次抽取有影响); ⑶每个总体单位在各次被抽中的概率不同,即1~n次分
别是1/N,1/N-1,1/N-2,…,1/N-n+1,但在每次抽 取时机会仍然均等; ⑷每个总体单位不会被重复抽中。

(n-1)k nk
22
分任务二 抽样误差
抽样误差的概念 抽样平均误差 抽样极限误差与概率度
一.抽样误差的概念
抽样误差是一种调查误差。如前所述:
调 登记性误差 普遍存在可以防止


系统性误差
差 代表性误差

第5章__抽样推断

第5章__抽样推断

抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x

x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

《国民经济统计学概论》_第六章_抽样推断

《国民经济统计学概论》_第六章_抽样推断
总体未分组: 2 (X X )2 N
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。

统计学第5章抽样推断

统计学第5章抽样推断
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下一页 返回
第一节 抽样推断概述
2.特点 抽样推断具有以下几个特点: (1)以概率论为依据,以大数法则和中心极限定理为基础
早在17世纪到19世纪中叶,大数法则和概率论的原理被引 进到统计的研究领域,就产生了抽样推断的统计研究方法。 正是由于大数法则和概率论研究的重要突破和进展,使抽样 推断获得了充分的数学理论依据,为抽样推断的精确计算和 抽样方法的实际运用提供了现实的可能性。 (2)按随机原则抽取一部分单位进行调查 所谓随机原则也 称机会均等原则,是指在抽取样本单位时,总体中的每一个 单位都有同等被抽中的机会,这样就使得样本单位的选取完 全排除了人的主观意识,从而保证样本对总体的代表性,使 抽样推断更加精确。
返回
教学目标
1.了解抽样推断的概念和特点;掌握抽样推断中的几个基本 概念。
2.掌握抽样误差、抽样平均误差和抽样极限误差的涵义及其 关系;熟练掌握总体指标的抽样种抽样组织形式的 特点。
返回
第一节 抽样推断概述
一、抽样推断的概念和特点
1.概念 抽样推断是统计研究方法中尤为重要的一种。它采取非全面
上一页 下一页 返回
第一节 抽样推断概述
3.样本容量和样本个数 (1)样本容量 是指一个样本所包含的单位数,故也称样本
单位数,通常用n表示。在抽样推断中,为了保证样本的代 表性,一般要求样本容量达到30或超过30,即要达到大样 本。 (2)样本个数 是指一个总体最多可能抽取的样本的数量, 即一个总体一共可以有多少个不同的样本,也称样本数目, 通常用小写的英文字母m表示。样本个数的大小取决于抽样 方法和样本容量的大小。
上一页 下一页 返回
第二节 抽样误差
3.影响抽样误差的主要因素 影响抽样误差的主要因素有以下几个方面: (1)全及总体各单位标志值的变异程度 在其他条件不变的
情况下,抽样误差的大小与标志变异的程度成正比。变异程 度越大,则抽样误差越大;反之抽样误差就越小。这是因为 全及总体标志变异小时,表明各单位的标志值之间的差异也 小,样本指标与总体指标之间的差异也小。如果全及指标的 各部位标志值都相等,即标志变异程度等于零,这时样本指 标和总体指标的差异也不存在了。
上一页 下一页 返回
第一节 抽样推断概述
2.全及指标和样本指标 (1)全及指标 全及指标也称总体参数,它是根据全及总体
中各个单位的标志值或标志特征计算的反映全及总体某种属 性的综合指标。由于全及总体是唯一确定的,根据全及总体 计算的全及指标也是唯一确定的。通常全及指标有总体平均 数和总体标准差。 对于变量总体,总体平均数是指全及总体的标志总量和总体 单位数对比得到的平均数。一般计算公式有两种表示方法:
上一页 下一页 返回
第一节 抽样推断概述
4.重复抽样和不重复抽样 (1)重复抽样 重复抽样也称重置抽样或放回抽样。它是指
从全及总体中抽取样本时,随机抽取一个样本单位,登记其 序号或标志值之后,又将它放回全及总体中去重新抽样,再 从全及总体中随机抽取第二个单位,同样登记其序号或标志 值之后,又把它放回全及总体中去,如此反复抽样、反复放 回,直到抽完n个样本单位为止。 (2)不重复抽样 不重复抽样也称不重置抽样或非回置抽样。 它是指从全及总体的N个单位中随机抽取一个容量为n的样本, 但每次从总体中抽取一个单位登记其序号或标志值之后,不 再放回总体中去重新抽样,如此连续抽n个单位组成样本。 因此,不重复抽样实际上是一次同时从总体中抽取n个单位 组成样本。
第七章 抽样推断
本章概述 教学目标 第一节 抽样推断概述 第二节 抽样误差 第三节 抽样估计和推算 第四节 必要抽样数目的确定方法 第五节 抽样调查的组织形式 第六节 Excel在抽样推断中的应用
本章概述
抽样推断是统计研究中的一种重要方法,是一种非全面调查。 它是按照随机原则,从总体中抽取一部分单位进行调查,并 以其结果对总体某一数量特征做出具有一定可靠程度的估计 和推断的一种统计方法。
相应地总体标准差为:
上一页 下一页 返回
第一节 抽样推断概述
来加以表述,其平均数是指总体中具有某种标志表现的单位 数占总体单位数的比重,称为成数,它是一种特殊的相对数, 通常用大写的英文字母p表示。而总体中不具有某种标志表 现的单位数占总体单位数的比重用Q表示。设总体单位数为 N,具有某种标志表现的单位数为N1,不具有某种标志表现 的单位数为N0,则:
(4)以部分单位的指标数值去推断总体的指标数值 根据这 一特点,可把抽样推断和重点调查、典型调查区分开来。虽 然重点调查也是一种非全面调查,但它不能用来推断总体的 指标数值。典型调查虽然可用来推断总体的数量特征,但这 种推断缺乏科学性。而抽样推断则是采用科学的推断方式, 以部分单位的指标数值去推断总体的指标数值。
上一页 下一页 返回
第一节 抽样推断概述
总体不同,表明总体特征和认识总体的方法也就不同。同一 个总体,有时是变量总体,有时是属性总体,有时两者都是。
(2)样本总体 样本总体也称子体或简称样本,它是指从全 及总体中随机抽取出来用来调查或观察的那部分单位的集合 体。样本总体的单位数通常用小写英文字母,,表示。一般 说来,样本单位达到或超过30个称为大样本,而在30个以 下称为小样本。社会经济现象的抽查推断多取大样本,而自 然实验室观察则往往取小样本。以很小的样本来推断很大的 总体,这是抽样推断的特点。
上一页 下一页 返回
第一节 抽样推断概述
三、抽样推断中的基本概念
1.全及总体和样本总体 (1)全及总体 全及总体也称母体或简称总体,它是指所要
认识对象的全体是由许多具有某种共同性质或特征的单位组 成的。根据总体范围大小的不同,总体可分为无限总体和有 限总体。在抽样推断中,我们研究的一般为有限总体,其单 位数通常用N表示。 根据总体单位标志的性质不同,总体可分为变量总体和属性 总体。反映数量标志的总体称为变量总体,如反映居民收入 水平的总体,反映企业职工工资水平的总体等。反映品质标 志的总体称为属性总体,如反映质量等级的产品总体等。
上一页 下一页 返回
第一节 抽样推断概述
(2)对全面调查的资料进行验证和补充 从某种意义上来说, 抽样推断的数据比全面调查的数据更加准确可靠。一是在抽 样推断中样本是按照随机原则来抽取的,并运用科学的方法 进行估计和推算;二是由于抽样调查的调查单位少,参加调 查的人员往往经过严格的培训,因此发生登记性误差的可能 性较小。
(3)对生产过程中的产品质量进行监测和控制 抽样推断不 但广泛应用于生产结果的核算和估计,而且也比较有效地应 用于对成批或大量连续生产的工业产品在生产过程中进行质 量控制,检查生产过程是否正常,及时提供有关信息,进行 质量控制,保证生产质量稳定。
(4)决定方案的取舍 对总体的某种假设进行检验,并判断 这种假设的真伪,决定方案的取舍。例如,某项新工艺或新 配方在生产中的推广是否具有显著性效果,可以通过抽样推 断来进行假设检验,决定是采用还是放弃。
上一页 下一页 返回
第一节 抽样推断概述
(3)抽样推断的误差可以计算并加以控制 抽样推断虽然存 在着一定的误差,但它与其他统计估算不同,由于样本统计 量的抽样分布可以描述,因此抽样推断的误差范围可以事先 估计,并能够通过一定的方法把它缩小到最低限度,或把它 控制在允许的范围内,从而保证抽样推断的结果达到一定的 可靠程度。
其标准差为:
上一页 下一页 返回
第一节 抽样推断概述
(2)样本指标 样本指标也称样本统计量,它是根据样本总 体中各单位的标志值或标志特征计算的反映样本总体某种属 性的综合指标。由于一个总体可以有多个不同的样本,因此 样本指标不是唯一的,随样本的不同而变化,是随机变量。 但对于某一个具体的样本而言,该样本指标是确定的,可以 计算的,并且可用它来对未知的全及指标作出估计和推断。
下一页 返回
第二节 抽样误差
登记性误差也称调查误差或工作性误差,它是所有统计调查 都可能发生的,是调查过程中由于主客观原因在登记、记录、 汇总和计算上所产生的人为误差。这种误差是完全可以避免 的。系统性的代表性误差是指由于违背抽样调查的随机原则, 有意选择较好或较差的单位进行调查,从而造成样本的结构 不完全等同于总体的结构,即样本的代表性不足所引起的误 差。偶然的代表性误差则是指抽样调查所特有的误差,即抽 样误差。这是由于抽样调查时只抽取一部分单位进行调查, 这必然会损失掉一些信息,或多或少地存在着一些误差,这 种误差是无法避免的,只能加以控制。
调查的形式,按照随机原则,从总体中抽取一部分单位进行 调查,并以其结果对总体某一数量特征做出具有一定可靠程 度的估计和推断。例如我们要了解培华职业学院3 000名女 生的平均身高,对她们一 一进行测量不仅麻烦,而且浪费人 力和物力。为此,我们可以采用抽样推断的方法,随机抽查 其中100名同学的身高,测得其平均身高为160厘米,则可 以用这100名同学的平均身高说明该高校3 000名女生的平 均身高为160厘米。
上一页 下一页 返回
第一节 抽样推断概述
二、抽样推断的意义
抽样推断具有省时省力省费用、估计准确、判断可靠和资料 详细等优点,在社会经济研究中得到了广泛的应用。运用抽 样推断的意义,主要体现为以下几点:
(1)解决了不能或难以进行全面调查的问题 例如,对于无 限总体、动态总体、范围过大或分布很散的有限总体,以及 具有破坏性的产品质量检验等,都不能或难以进行全面调查。 对于这些现象的认识,只有采用抽样推断的方法,才能达到 认识其总体特征的目的。例如灯泡的耐用时间试验,人体自 细胞数量的化验等;又如要了解全国城镇居民的家庭生活状 况,城镇居民收支水平现行结构及社会商品购买力等状况。 从理论上讲,可以每家每户进行调查,但调查的范围太大, 调查单位太多且太分散,实际上难以办到,也没有必要。
跟全及指标相对应,样本指标也可分为样本平均数和样本标 准差。
上一页 下一页 返回
第一节 抽样推断概述
对于变量总体,样本平均数是指抽样总体各单位标志值的平 均数,通常也有两个计算公式:
相关文档
最新文档