抽样调查第2章 简单随机抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

练习 1 为合理调配电力资源,某市欲了解 5 万户居 民日用电量.用简单随机抽样抽取了300户进行调查, 得到日用电量平均值为9.5kwh,样本方差为206.估 计用电量平均值与该估计的均方偏差.
部分估计
估计总体U中具有某一特征的“子总体”的 数量参数,可令
Yi , 第i个个体具有该特征 Zi 0, 第i个个体不具有该特征
随机数法
65547 38844 76684 79311
95846
05630 36056 53454 05602 58225 79596 69398 56323 77938 29639 61103 34313
75837
54244 02112 43644 11326 78627 95072 04569 62258 11661 91665 91058 65698
如:Y的SLE为y, Y的SLE为y
几个基本定理
定理1 对简单随机抽样,有:
n P{Di 1} , i 1,2, , N N n(n 1) , i j , i, j 1,2, , N P{Di 1, D j 1} N ( N 1)
2
y
i 1
n1
i
N2 n 1 N 2 E( Nz Z ) ( Z Z ) 1 i n N N 1 i 1 均方偏差的估计量为
N2 n 2 N2 n 1 N 2 ( z z ) 1 s 1 i n N n N n 1 i 1 2 n1 n1 N ( N n) 1 2 yi yi n(n 1) i 1 n i 1
则Z Z i即具有该特征的子总体 的总值,对
i 1 N
样本作同样处理,则样 本为 ( z1 , z 2, , z n ) ( y1 , y2 , , yn1 ,0, ,0)
部分估计
按简单估值法, Z的估计量为 N n N Nz zi n i 1 n 该估计的均方偏差为
2
Y
i 1
N
i
0,则:
几个基本定理
( N n)(N 2n) N 3 1 (3) E ( y ) 2 Yi O 2 n N ( N 1)(N 2) i 1 n
3
2 2 N ( N n )[ N ( 6 n 1 ) N 6 n ] 4 (4) E ( y 4 ) Y i 3 n N ( N 1)(N 2)(N 3) i 1
1 n 2 1 (2) var(y ) 1 SY (1 f ) SY2 n N n
抽样理论 核心定理
其中称1-f 为有限总体校正系数 (finite population correction factor, fpc)
抽签法 统计软件抽样 随机数法 其它方法
抽签法
有限总体分布估计
了解有限总体指标量的分布情况,即要估计 总体中具有某种特征的个体所占比例,可令
1,当Yi t; (t Yi ) 0,当Yi t
则有限总体分布可表示 为 1 N F (t ) (t Yi ) N i 1
F (t )是量 (t Yi )的平均值,可用样本 { (t yi ), i 1,2, , n}的均值来估计
使用随机数表
随机数表是数字 0~9 随 机 排 列 而 成 的,这些数字在表 中的一位数、两位 数、三位数等随机 出现并有相同的概 率。
例 : 从 N=345 的 总体中抽取一个 n=15的简单随机 样本。
35161
11756
31582
58790
随机数法
使用计算机随机数 开始抽样 使用随机数骰子
§2.1 简单随机抽样的几个基本定理 §2.2 简单随机抽样的实现 §2.3 简单估值法 §2.4 区间估计与样本量的确定 §2.5 比估计 §2.6 差估计与回归估计
简单随机抽样的含义 定义与符号 几个基本定理
简单随机抽样的含义
“简单”的含 义 有关理论简单,抽样方式单纯、易操作 随机抽样 放回有序、放回无序、 不放回有序、 不放回无序
其他方法
例如:某商店为了解顾客对商店服务的意见,在商 店门口对走出商店的顾客进行调查,按时间顺序每 五分钟抽选一顾客,当调查目标量与顾客离店时间 完全独立时,这种按时间顺序系统抽出的样本可看 作一个简单随机抽样。
估值定理 部分估计 比例估计 有限总体分布估计
估值定理
定理1 设y1 , y2 ,, yn 是总体 U {Y1 , Y2 ,, YN }的
做 N个签,分别编上1到N号,完全均匀 混合后,一次同时抽取 n个签 ,或一次抽 取一个签但不把这个签放回,接着抽第 2 个、第3个、……,直到抽足n个为止。 缺点: (1)实施较麻烦,N较大时更不实用; (2)等概率性很大程度依赖于抽样个体 是否摇匀。
统计软件抽样
例:某校为了解学生身体素质的基本情况, 从全校学生总数 N=1003 人中抽选一个简 单随机样本n=100人进行体检。 开始抽样
D {D1, D2 ,, DN }指示了一个具体样本
Βιβλιοθήκη Baidu
定义与符号
线性估计与非线性估计
不借助任何辅助变量,对总体进行直接估 计,用样本特征的线性组合估计总体特征称为 线性估计;而借助辅助变量,用样本特征的非 线性组合表示总体特征,称为非线性估计。
简单估计
对简单随机抽样的线性估计有“简单线性估 计(Simple linear estimate)”之称,简称简单估计。
n 每一单元的入样概率为 , N n(n 1) 任意两单元同时入样的 概率为 , N ( N 1) Di与Dj不独立
几个基本定理
定理2 对简单随机抽样,有:
n n n E ( Di ) N , var( Di ) N 1 N , i 1,2,, n n n cov( D , D ) 1 , i j, i, j 1,2,, n i j N ( N 1) N
3(n 1)(N n)(N n 1) 1 2 3 Yi O 2 n N ( N 1)(N 2)(N 3) i 1 n
N
2
Y 0不是本质条件,只是为 了使定理形式 较简洁.
几个基本定理
一般情况下 (Y 0)有:
(1) E ( y ) Y ;
例题与练习
例3 从某地区15786位老人中,抽出一个含525位老 人的简单随机样本,调查每位老人的性别及生活能 否自理,结果如下:
性别 能否自理 能
不能


211
31
263
20
(1)估计该地区生活不能自理的老人人数及该估计的 均方偏差; (2)估计该地区生活不能自理的男性老人人数及该估 计的均方偏差;
放回无序、不放回有序通常没有使用价值; “放回有序”又称“放回简单随机抽样 (SRSWR)”,所有可能样本数量最多,但理论结 果简单; “不放回无序”又称“不放回简单随机抽样 (SRSWOR)”,所有可能样本数量最少,操作最 简单; 本书的简单随机抽样指的是SRSWOR.
定义与符号
定义1 从一个单元数为N的总体中逐个抽取单元 且无放回,每次都在所有尚未进入样本的单元中 等概率地抽取直到n个单元抽完,这种抽样称为简 单随机抽样。 定义2 按照从总体的N个单元抽取n个单元的所有 可能不同组合构造所有可能的 CNn 个样本,从 CNn 个样本随机抽取1个,使每个样本被抽中的概率等 于1/ CNn ,这种抽样成为简单随机抽样。 定义3 从总体的N个单元中,一次整批地抽取n 个单元,使任何一个单元被抽中的概率都相等, 任何 n 个不同单元组成的组合被抽中的概率也都 相等,这种抽样称为简单随机抽样。
均方偏差的无偏估计量 为 1 n 2 1 n v( p) 1 s 1 p(1 p) n N n 1 N
思考: 总体具有某特征的个体总数该如何估计?
比例估计
例 2 某大学有 1 万名本科生,现欲估计暑假期间参 加了各类英语培训的学生所占比例,随机抽取了 200名学生调查,得到p=0.35,估计全校参加培训学 生比例P及 该估的标准差。 练习2 利用例1的数据估计该社区人均收入低于500 元的户数N1,并估计其均方偏差。
62180
63447 26619 78740 61996 63434 47269 92933 69507 05977 60829 48817 31262
32361
89809 96244 92558 24476 56074 56088 81257 24726 88443 41925 76031 00327
几个基本定理
定理3
设y1 , y2 , , yn是来自总体{Y1 ,Y2 , ,YN } 的简单随 机样本,Yi有界,即存在一个与N无关的数M, 1 使 | Yi | M (i =1, 2, , N )且Y N
(1) E( y) Y 0;
1 1 2 1 (2) E ( y ) SY O ; n N n
2
例题与练习
例1 调查某一社区居民用于食物消费的支出.若该社 区有居民300户,共1100人.现简单随机抽样调查了 其中的35户,得到 数据如表所示, (1)估计平均每月每户用于食物的支出; (2)若该社区居民总人数未知,估计该社区总人口数 及该估计的标准差. (3) 估计该社区人均月收入低于500的居民总的户月 食物支出及该估计的均方偏差
7 1 2 6 5 4 2 8 5 1 0 6 7 3 8 3 4 9
9
0
顶视图
底视图
随机数法
永久随机数法
抽样者给总体的第 i 个个体赋予一个 [0 , 1] 上的 随机数 Ri , Ri 与第 i 个个体永久对应,抽样设计时, 确定好抽样比f,Ri<f的对应单元入样。
特点: (1)可保证多次抽样中有大量相同单元; (2)缺点是样本量不完全确定
比例估计
估计总体U中具有某一特征的个体单元的比 例,可令 1, 第i个个体具有该特征 Zi 0, 第i个个体不具有该特征 1 N 则P Z i Z N i 1
按照简单估值法, P的无偏估计为 1 n n1 p zi z n i 1 n
比例估计
该估计的均方偏差为 V( p ) 1 n 2 N n 1 S P(1 P) n N n( N 1)
一个样本量为 n的简单随机样本,则样 本均值 1 n 1 y yi 是总体均值 Y n i 1 N
2
Y 的无偏估计 .
i 1 i
N
该估计 y的均方偏差为(无偏时 即为方差) 1 n 2 V ( y ) E ( y Y ) 1 S n N N 1 2 2 其中 S (Yi Y ) . N 1 i 1
估值定理
系 Ny是总体 Y Yi的无偏估计 , 其均方偏差
i 1 N
为 N2 n 2 V ( Ny ) 1 S n N
估值定理
定理2 在简单随机抽样下,样本方差
n 1 2 s2 ( y y ) . i n 1 i 1
是总体方差 S 的无偏估计量 .从而 1 n 2 v ( y ) 1 s n N 是估计量 y的均方偏差 V ( y )的无偏估计 .
定义与符号
易于 易于 操作 操作 易于 揭示 操作 本质
定义1
定义2
易于 综合 操作 两者
定义3
定义与符号
符号
有限总体 {Y1 , Y2 ,, YN } 1 N 1 n 总体均值 Y Yi , 样本均值 y yi N i 1 n i 1
抽样的示性函数
1, 第i个单元 Yi 被抽中 Di 0, 第i个单元 Yi未被抽中
相关文档
最新文档