统计学原理第六章抽样调查

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

⑵不考虑顺序的不重复抽样:
N! C n! ( N n)!
n N

5 A 254 251 200 5 50 C 50 2 118 760 ( 种) 5! 5 4 3 2 1
四、抽样调查的理论依据(p257-259,了解) 1.大数定律
(1)独立同分布大数定律 (2)贝努大数定律
x p
抽样误差范围的实际意义是要求被估计的 全及指标 X 或P落在抽样指标一定范围内,即
落在 x x 或 p p 的范围内。
3.可信程度 抽样极限误差△=tμ,(t为概率度)
可见,抽样极限误差,即扩大或缩小了以后的 抽样误差范围。

上例五户中抽取二户调查,如采取不考虑顺序的不重复抽 5 4 样方法,则: C 10(种) X 30(元) 21
2 5
抽取样本
10 10 10 10 20 20 20 30 30 40 合 20 30 40 50 30 40 50 40 50 50 计
样本平均数
离差
x X
-15 -10 -5 0 -5 0 5 5 10 15 -
到平均重量x 1002克,合格率p 98%,我们直接推 断全部产品的平均重量X 1002克,合格率P 98%。
1.直接换算法
抽样平均数(成数)×总体单位数=总体标志总量
1.如果采用点估计方法:上例1中:400×10000=400(万千克) 如果用区间估计方法:上例1中该农场小麦总产量的范围 为: t=2: (397.62 ~ 402.38)×10000=397.62 ~ 402.38(万千克) t=3: (396.43 ~ 403.57)×10000=396.43 ~ 403.57(万千克) 2.上例2中,全部一级品数量的范围为: (92.82% ~ 97.18%)×8000=7425.6 ~ 7774.4(件)
三、抽样方法和样本可能数目 抽样方法
根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。 根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考 虑顺序抽样。
样本可能数目(p256-257,了解)
1. 如果是重复抽样:
(1)考虑顺序的重复抽样:B N (样本种数) 例 50 312,500,000种
抽样指标估计总体指标有三个要求:(p272)
只要在样本代表性大,且对全及指标精确 性要求不高的情况下,满足下列三个准则:
无偏性 一致性 有效性 就会得到合理的估计。
二、抽样推断的方法
(一)点估计
就是由样本指标直接代替全及指标,不考虑
任何抽样误差因素。即用x直接代表X,用p 直接代表P。
例 在全部产品中,抽取100件进行仔细检查,得
以上资料编成次数分配表如下:
x
10 15
样本数f (即次数分配)
xX
-20 -15
1 2
20
25 30 35
3
4 5 4
-10
-5 0 5
40
45 50 合计
3
2 1 25
(x X) f f
2
10
15 20 -


∴抽样误差是所有可能出现的样本指标的标 准差。它是由于抽样的随机性而产生的样本 指标与总体指标之间的平均离差。
935 890 45(头) 差错率 45 890 可用5.06%的系数来修正6000农户养猪头数,即: 9000 (1 5.06%) 9455(头) 5.06%
例2
某市房地局,年报工资总额3218.1万元。 现抽查14个单位: 年报:415.03万元 多报:0.44万元 少报:1.47万元 抵冲后 1.47-0.44=1.03(万元)
三、抽样平均误差的意义
1. 在于说明样本指标的代表性大小。 误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。
2. 说明样本指标和总体指标相差的一般范围。 3. 确定抽样单位数多少的计算依据。
四、抽样平均误差的计算
抽样平均误差实际上是样本指标的标准差。 通常用μ表示。
(一)抽样平均数的抽样平均误差
2 ( X x)
抽样平均误差 x
K
K全部可能的样本个数
1. 重复抽样条件下抽样平均数的抽样平均误差
2 抽样平均误差 x
n
n
2. 不重复抽样条件下抽样平均数的抽样平均误差
2 N n 2 n 抽样平均误差 x 1 n N 1 n N 2 N n 2 n n 当 很小时, 1 接近于 1 , 很接近。 与 N n N 1 n N
四、抽样平均误差的计算
(二)抽样成数的抽样平均误差 重复抽样条件下抽样成数的抽样平均误差
抽样平均误差 p
抽样平均误差 p
p (1 p) n
不重复抽样条件下抽样成数的抽样平均误差
p (1 p ) n 1 n N
四、抽样平均误差的计算
计算抽样平均误差时 和p都是全及指标, 一般未知,通常采取四种方法解决:
2. 修正分数法
就是用抽样所得的调查结果同有关资料 对比的系数来修正全面统计资料时采用的一 种方法。
例1
某村6000农户,2005年年末统计养猪头数, 从下往上报的是9000头,现抽10%(600户)的 农户再复查一下,发现有漏报,也有重报。按 600户,原来数字是890头,实际复查为935头, 故总的来说,是少报。
一、全及总体和抽样总体 (二) 抽样总体,简称样本
抽样总体:抽取出来调查观察的单位。 抽样总体的单位数用n表示。 n ≥ 30 大样本 n < 30 小样本
二、 全及指标和抽样指标(总体指标和样本指标) (一)全及指标
全及指标:全及总体的那些指标。
X 1 X 2 ... X N 全及平均数 X N N1 全及成数P N ( X X )2 总体方差 N ( X X )2 总体标准差 N
第二节 抽样调查的基本概念及理论依据
一、全及总体和抽样总体 (一) 全及总体,简称总体
全及总体:所要ห้องสมุดไป่ตู้识对象的全体。 总体单位数用N表示。 全 及总体按其单位标志性质不同分为:变 量总体和属性总体。 变量总体可以用数量标示加以计量。 属性总体用文字描写属性特征。如: 完好、非完好。
第二节 抽样调查的基本概念及理论依据
差错率
1.03
415.03 根据这一系数,再来修正工资总额,则: 年报工资总额 3218.1 (1 0.248%) 3226.09(万元)
0.248%
(二)区间估计
1.区间估计的意义
根据样本指标和抽样误差去推断全 及指标的可能范围,它能说清楚估计的 准确程度和把握程度。
第六章
抽样调查
第一节 抽样调查的意义
一、抽样调查的概念 一般所讲的抽样调查,即指狭义的抽样调
查(随机抽样):按照随机原则从总体中抽取 一部分单位进行观察,并运用数理统计的原 理,以被抽取的那部分单位的数量特征为代 表,对总体作出数量上的推断分析。
二、抽样调查的特点
(一)抽样调查的目的是由部分来推断整体。 (二)抽选部分单位时要遵循随机原则 (三)抽样调查会产生抽样误差,抽样误差 可以计算,并且可以加以控制。
2.中心极限定理(p256-257,了解)
(1)独立同分布中心极限定理 (2)德莫佛-拉普拉斯中心极限定理
第三节 抽样平均误差
一、抽样误差的概念
在统计调查中,调查资料与实际情况不一致, 两者的偏离称为统计误差。
登记误差 系统性误差 统计误差 代表性误差 实际误差 随机误差 抽样平均误差
x X
400 225 100 25 0 225 100 25 0 25 100 25 0
2
接左:
抽取样本
30 30 40 40 40 40 40 50 50 50 50 40 50 10 20 30 40 50 10 20 30 40
样本平均数 x
35 40 25 30 35 40 45 30 35 40 45
抽样误差即指随机误差,这种误差是抽 样调查固有的误差,是无法避免的。
实际误差就是指样本指标和总体指标之间数 量上的差别,即 x X 、 p P 。无法知道。 抽样平均误差是指所用可能出现的样本指标 的标准差。可以计算。
二、影响抽样平均误差的因素
(一) 全及总体标志变异程度。——正比关系
(二)抽样单位数目的多少。——反比关系 (三)抽样的组织方式。
抽取样本
10 10 10 10 10 20 20 20 20 20 30 30 30 10 20 30 40 50 10 20 30 40 50 10 20 30
样本平均数 x 误差 x X
10 15 20 25 30 15 20 25 30 35 20 25 30 -20 -15 -10 -5 0 -15 -10 -5 0 5 -10 -5 0
三、抽样调查的适用范围
抽样调查方法是市场经济国家在调查方法
上的必然选择,和普查相比,它具有准确度高、 成本低、速度快、应用面广等优点。
一般适用于以下范围:
(一)实际工作不可能进行全面调查观察,而又需要 了解其全面资料的事物; (二)虽可进行全面调查观察,但比较困难或并不必 要; (三)和全面调查相比较,抽样调查能节省人力、费 用和时间,而且比较灵活 (四)在有些情况下,抽样调查的结果比全面调查要 准确。 (五)对普查或全面调查统计资料的质量进行检查和 修正; (六)抽样调查方法可以用于工业生产过程中的质量 控制。 (七)利用抽样推断的方法,可以对于某种总体的假 设进行检验,判断这种假设的真伪,以决定取舍。
x
15 20 25 30 25 30 35 35 40 45 -
x X
225 100 25 0 25 0 25 25 100 225 750
2
2 750 ( x-X ) 抽样平均误差( x ) 8.66(元) n 10
第四节 全及指标的推断
一、抽样推断要求
抽样推断就是按照已经抽定的样本指标来估 计总体指标,或其所在的区间范围。
误差 x X
5 10 -5 0 5 10 15 0 5 10 15
x X
25 100 25 0 25 100 225 0 25 100 225
2
50

50

50
-
20
-
400
2 500
抽样平均误差( x )
2 ( x X )
n 2500 10(元) 25 (n为样本配合总数)
n N n
5
(2)不考虑顺序的重复抽样:D C
n N
n N n 1
2. 如果是不重复抽样:
⑴考虑顺序的不重复抽样:
N! A N ( N 1)( N 2)( N n 1) ( N n)!
n N

5 A50 50 49 48 47 46 254 251 200 ( 种)
2.抽样极限误差 抽样极限误差又叫抽样误差范围,也称置信区间,是变 动的抽样指标与确定的全及指标之间的离差的可能范围。
x X
x x x
p P
p p p
x X x p Pp X x Pp 即:全及平均数(成数) 抽样平均数(成数)
2
(二)抽样指标
抽样指标:抽样总体的那些指标。
x1 x2 ... x N 抽样平均数 x N n1 抽样成数p n 2 ( x x ) 样本方差s N 2 ( x x) 样本标准差s N
2
(三)统计抽样过程(图6-1,p255)
所谓推断,就是用抽样指标来推断全及指标。 一是用抽样平均数 x推断全及平均数 X,从而推断 总体标志总量 二是用抽样成数p推断全及成数P,从而推断总体 单位总量
1.用过去调查所得的资料。 2.用样本方差的资料代替总体方差。 3.用小规模调查资料。 4.用估计的材料。 (三)抽样平均误差计算实例(p270-271)

五户家庭三月份购买某商品的支出: 10元, 20元, 30元, 40元, 50元 X 30元 现从五户中抽取二户作调查, 如果为重复抽样(考虑顺序) 52=25(种) 排列组合如下:
相关文档
最新文档