第八章抽样调查

合集下载

第八章 二阶及多阶抽样课件

第八章 二阶及多阶抽样课件

n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
YˆR M 0
i1 n
Mi
PPT学习交流
2
性质l 对于两阶抽样,有
(1)E(ˆ)E1E2(ˆ)
(2 )V (ˆ) V 1 E 2 (ˆ) E 1 V 2 (ˆ)
式中,E2,V2为在固定初级单元时对第二阶抽样 求均值和方差;E1,V1为对第一阶抽样求均值和 方差。
PPT学习交流
3
8.2 初级单元大小相等时的二阶抽样
9.2.1总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元。 从N个初级单元中按简单随机抽样抽取n个初级单元, 在每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。
142 5[1 ( 51.8 4)2(16.15.8 4)2(1 61.8 4)2(1 31.8 4)2(1.5 31.8 4)2] 5(51)
97.6 72 65
PPT学习交流
21
估计量的标准差为 s(Y ˆPP ) S v(Y ˆPP ) S 97.672 6 9 5.8 88 因此,小区居民数为2146人,在置信度为 95%时,估计的相对误差为

八抽样推断考试习题

八抽样推断考试习题

单项选择題1. 抽样调查的主要目的在于(A. 计算和控制误差B. 了解总体单位情况C .用样本来推断总体 D.对调查单位作深入的研究2. 抽样调查所必须遵循的基本原则是( 人 A.随意原则 B. 可比性原则C .准确性原则 D. 随机氐则3. 无偏性是指( A.抽样指标等于总体指标B. 样本平均数的平均数等于总体平均数C .样本平均数等于总体平均数D.样本成数等于总协成数4. 一致性是指当样本的单位数充分大时,抽样指标( )。

A.小于总体指标B.等于总体指标C .大于总体指标D.充分靠近总体指标5. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )A.前者小于后者B.前者大于后者C.两者相等D.两者不等6. 能够事先加以计算和控制的误差是( A.抽样误差 B.登记误差C .代表性误差 D. 系统性误差7. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样, 但第二个厂工人数比第一个厂工人数整整多一倍。

抽样平均误差( 人A.第一工厂大B. 第二个工厂大C .两工厂一样大 D.无法做出结论8. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。

A.两者相等B.两者不等C .前者小于后者 D.前者大于后者。

9. 反映抽样指标与总体指标之间抽样的可能范围的指标是(第八章 抽样推断两工厂工人工资方差相同,A.抽样平均误差B. 抽样误差系数C.概率度D. 抽样极限逞差.10. 在进行纯随机重复抽样时,为使抽样平均误差减少25%则抽样单位数应()。

A.增加25%B. 增加78%C. 增加1.78%D. 减少25%11. 在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的()倍。

A. 1.03B. 1.05 C . 0.97 D. 95%12. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是(A.抽样单位数为20B. 抽样单位数为40C.抽样单位数为90D.抽样单位数为100 13.通常所说的大样本是指样本容量(人A.小于10B. 不大于10C.小于30D. 不小于3014. 抽样成数指标P值越接近1,则抽样成数平均误差值()A. 越大B越小C越接近0.5 D越接近115. 对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%概率为0.9545,优等生比重的极限抽样误差为()。

随机抽样调研

随机抽样调研

对全面调研统计资料的质量进行检查与修正。
2、随机抽样调查的组织方法



(1)纯随机抽样法
也称简单随机抽样法,就是在总体单位中不进行任 何有目的的选择,完全按随机原则抽选调研单位。 抽签法 乱数表法 实际运用的局限性:这种方法一般必须对总体各个 个体加以编号,而实际所需调查的总体往往是十分庞大 的;对于某些事物无法使用简单随机抽样,如连续不断 生产的大量产品进行质量检验;由于抽出的样本较为分 散,所以调查的人力、物力、费用消耗较大。


注意:A、必须有清楚的分层界限,在划分时不致发生 混淆;B、必须知道各层中的单位数目和比例;C、分 层的数目不宜太多,否则将失去分层的特征,不便在 每层中抽样。 做法: A、等比例分层抽样 按照各层中单位的数目占总体单位数目的比例分配 各层的样本数量。 每层抽取样本数计算公式为: SI=(NI/N)*S 式中:SI表示第I层应抽取的样本数;N表示总体中 含单位总数;NI 表示第I层含单位总数;S表示应抽取 样本总数。



B、不等比例分层抽样(最佳抽样法)
根据各层的标准差的大小来调整各层样本数目的抽 样方法。该方法既考虑到各层在总体中比重的大小,又 考虑了各层标准差的差异程度,有利于降低各层的差异, 以提高样本的可信度。 该方法既考虑到各层在总体中占比例的大小,又考 虑了各层标准差的差异程度,有利于降低各层的差异, 以提高样本的可信程度。 各层样本的计算公式:NI=N*NISI/Σ NISI 式中:NI表示第I层应抽取的样本数;N表示应抽取 的样本数(调查单位数);SI表示第I层的标准差(一 般为已知)。


判断抽样法
也称目的抽样法,是按照调研者的主观经验判断选 定调研单位的一种抽样方法。

08整群抽样

08整群抽样

8.3群大小不等的整群抽样
一、记号
M i 表示群的大小,M 0 M i为总体中小单元的总数。
i 1 N
群和: 第i群的 平均数: 平均
Yi Yij
j 1
Mi
yi yij
j 1
Mi
Yi Yi Mi
yi yi Mi 1 n y yi n i 1
ij
1 Y N 群和: 按小 单元 的均值: Y
估计量 1 ˆ Y Ny N yi n i 1 估计量的理论方差
2 1 N 2 1 f ˆ) N V (Y Yi Y n N 1 i 1 n
估计量的方差估计 ˆ ) N 1 f 1 y y 2 v(Y i n n 1 i 1
n 2
1 f 1 n 2 v (Y ) N yi y 2 nM 0 n 1 i 1
群内方差 群间方差
1 N S M Yi Y N 1 i 1
2 b


2
故 则
2 N ( M 1) S w ( N 1) Sb2 S2 , 若 NM 1 NM , N 1 N , NM 1 2 ( M 1) S w Sb2 2 S M
三、设计效应


2
为对这两个方差作比较,需对( NM 1) S 2作分解:
三、设计效应
Y
N M i 1 j 1
ij
Y
2 w

2
Yij Yi M Yi Y
N M 2 N i 1 j 1 i 1


2

N M 2 1 S yij Yi N ( M 1) i 1 j 1

第八章抽样调查ppt课件全

第八章抽样调查ppt课件全

XP
• 总体比率的方差为: • σ2=P(1-P) • 样本比率也是两个变量(0,1)的平均数
• 其标准差为:
s p(1p)
x
n 1
p
n
• 抽样比率的平均数及标准误差相应为: pP
(8-11)

P(1P)
p
n
(8-12)
• 与抽样平均数分布一样,抽样比率分布的平均数未知,所以同样用 一个样本的比率p来推断总体比率P,在推理上其基本原理和用样 本平均数推断总体平均数是相同的,这里不再赘述。
AN=N(N-1)(N-2)…(N-n+1)=N!/(N-n)!
(8-1)
(2)考虑顺序的重复抽样数目,即通常所说的可重复排列数:
BnN=Nn
(8-2)
(3)不考虑顺序的不重复抽样数目,即通常所说的不重复组合数:
CnN=N(N-1)(N-2)…(N-n+1)/n!=N!/n!(N-n)!
(8-3)
(4)不考虑顺序的重复抽样数目,即通常所说的可重复组合数:
(2) 在实际工作中可以取得全面资料,但不能进行全面调查时, 要运用统计抽样。例如工业上有些产品的质量检查,需要 对产品进行破坏性试验,如灯泡的寿命检查等,只有通过科 学的统计抽样进行检查,才能确定产品的质量
• (3) 对时间序列总体,根据一定顺序的抽查,可以对 生产过程进行控制和检验。例如对工业产品质量 控制就要运用统计抽样来进行。
三、统计抽样的重要作用
(1) 对于那些从理论上讲可以取得全面资料,但实际工作中,没 有必要进行全面调查的事物,运用统计抽样这种非全面调 查的方法同样可以取得资料,从而用更少的人力、时间、 费用达到对总体的认识。例如要了解居民家庭收入情况, 如果对所有的居民家庭收支进行逐户登记,工作量太大,客 观上有困难,事实上也办不到,所以只要抽取若干个具有代 表性居民家庭进行调查,就可以获得满足调查任务要求的 统计资料。

第八章抽样推断作业

第八章抽样推断作业

第八章抽样推断作业
1.某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。

该公司希望有90%的信心视所估计的比例只有2个百分点左右的误差。

为了节约调查费用,样本将尽可能小。

试问样本量应该为多大?
2.某地区对居民用于某类消费品的年支出额进行了一次抽样调查,抽取了400户居民,调查得到的平均每户支出数额为350元,标准差为47元,支出额在600元以上的只有40户。

试以95%的置信度估计:(1)平均每户支出额的区间;(2)支出额在600元以上的户数所占比例的区间。

3.某地区有1000家商店,按大、中、小分为三类,其商店数分别为N 1 =200, N 2=300, N 3 =500.今按比例分配抽取一个容量为n=100的分层随机样本,平均年营业额(单位:万元)分别为1201=y , ,752=y ,403=y 各层的样本方差分别为S 12 =44, S 22 =18, S 32 =5.试求该地区平均每家年营业额的置信度为95%的置信区间。

4.质量监督部门从某厂生产的500箱同类产品中随机抽取了10箱,并对这10箱进行全面检验。

这10箱产品的合格率分别为:85%,90%,90%,92%,92%,96%,96%,95%,95%,95%。

试求该厂这批产品不合格率的置信度为95%的置信区间。

统计学第八章 抽样推断

统计学第八章 抽样推断


和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%

人教版中考数学第一轮复习第八章 统计与概率

人教版中考数学第一轮复习第八章 统计与概率

第八章统计与概率第二十七讲数据的收集与处理【基础知识回顾】一、数据的收集方式。

1、全面调查(普查):是为了一定的目的对考察对象进行的全面调查,其中所要考查对象的称为总体,组成总体的考查对象称为个体2、抽样调查(抽查):是指从总体中抽取对象进行调查,然后根据调查数据推理全体对象的情况,其中,被抽取的那些组成一个样本,样本中的数目叫做样本容量。

【名师提醒:1、对被考查对象进行全面调查还是抽样调查要根据就考查对象的特点而选择,例如:当被考查对象数量有限时可采取,当受条件限制无法对所有个体都进行调查或调查具有破坏性时,应采用,然后用样本估计总体的情况。

2、注意:被考察对象不是笼统的某人某物,而是某人某物的某项指标。

】二、统计图:1、统计图是表示统计数据的图形,是数据及其关系的直观表现的反映,几种常见的统计图有统计图统计图统计图2、频数分布直方图:⑴频数:在统计数据中落在不同小组中的个数,叫做频数⑵频率:=⑶绘制频数直方图的步骤:a:计算与的差,b:决定和c:确定分点d:列出f:画出【名师提醒:1、各类统计图的特点:条形统计图可以反映折线统计图能够显示从扇形统计图能够看出,扇形的圆心角=3600×2、频数分布直方圆中每个长方形的高是所有小长方形高的和为】【典型例题解析】1.以下问题,不适合用全面调查的是()A.了解全班同学每周体育锻炼的时间B.旅客上飞机前的安检C.学校招聘教师,对应聘人员面试D.了解全市中小学生每天的零花钱2.为了估计鱼塘中鱼的条数,养鱼者首先从鱼塘中打捞30条鱼做上标记,然后放归鱼塘,经过一段时间,等有标记的鱼完全混合于鱼群中,再打捞200条鱼,发现其中带标记的鱼有5条,则鱼塘中估计有条鱼.3.2013年3月28日是全国中小学生安全教育日,某学校为加强学生的安全意识,组织了全校1500名学生参加安全知识竞赛,从中抽取了部分学生成绩(得分取正整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题:频率分布表分数段频数频率50.5-60.5 16 0.0860.5-70.5 40 0.270.5-80.5 50 0.2580.5-90.5 m 0.3590.5-100.5 24 n(1)这次抽取了名学生的竞赛成绩进行统计,其中:m= ,n= ;(2)补全频数分布直方图;(3)若成绩在70分以下(含70分)的学生为安全意识不强,有待进一步加强安全教育,则该校安全意识不强的学生约有多少人?第二十八讲数据分析【基础知识回顾】一、数据的代表:1、平均数:⑴算术平均数如果有n个数x1 ,x2 ,x3 …xn那么它们的平均数x=⑵加权平均数:若在一组数据中x1出现f1次,x2出现f2次...... xk出现fk次,则其平均数x= (其中f1+ f2+...... fk=n)2、中位数:将一组数据按大小依次排列,把处在或叫做这组数据的中位数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所谓登记性误差,又称为调查误差或工作误 差,它是指调查人员在调查过ห้องสมุดไป่ตู้中,由于工 作不认真(如粗心大意抄错、写错、写漏等) 或计量工具不准确而形成的调查结果与实际 结果之间的差别。这种误差是可以尽量加以 克服或避免的。
所谓代表性误差,是指根据部分(少数)单 位调查的结果去代表(或推断)全部单位的 数量特征时,两者之间的差别。这种误差通 常是不可避免的.
问1: 在这则笑话中,儿子 采用的是什么调查方式?
问2:这种调查方式好 不好?还可采用什么 方法调查?
要知道一锅汤的味道, 该怎么办呢?
想知道一批导弹的杀伤半径, 采用什么调查方法?为什么?
一、抽样调查的概念与作用
(一)抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是从总体 中按随机原则抽取一部分单位进行观测,并根据这部 分单位的资料推断总体数量特征的一种方法。
x p
s2 n n 1 N 802 450 3.58(元) 1 450 4500 20% (1 20%) 450 1 450 4500
P P 1 n 1 n N
1 1 1 例如: , , , 5000 4999 4998
有序抽样和无序抽样
有序抽样:指每次抽样的先后要进行排序的 抽样方法。有有序重复抽样和有序不重复抽 样。 无序抽样:指每次抽样的先后不进行排序的 抽样方法。有无序重复抽样和无序不重复抽 样。
(1)抽签法(抓阄法)。具体作法是:当给总体各 个单位编号后,把号码写在结构均匀的签(如同 等大小的纸片等)上,将签混合均匀后即可以从 中抽取。抽签法简便易行,然而对于较大的总体 来说,编号、做签条的工作量很大,且不易做到 混合均匀。因此,抽签法的应用有一定的局限性.
M M
2
p
p P 2
为叙述简便起见,假设有10,20,30和40四 个数字组成一个总体,从中随机抽取两个数 字作为样本,求抽样平均误差。
100 25 N 4 采取重复抽样 , 见表7 1 X 400 X 100 25 25 K 16 N 4 全部可能组成样本的标 准差为: x
[例7—3]
某大学有4500名学生,采用不重复简单随机抽样方式 从中抽取10%的学生,调查其每月生活费用支出情况。抽样 结果显示,学生平均每人每月生活费支出350元,标准差80 元,生活费用支出在500元以上的学生占全部学生的20%。 试求抽样平均误差。
N 4500 n 80010% 450 , x 350 s 80, p 20% ,
(二)偏差与随机误差
所谓偏差,是指在随机抽样中调查人员(有 意识地)破坏了随机原则抽样(即不按随机 原则抽样),由此形成的样本指标与总体指 标之间的差别。在抽样调查中,通常所说的 抽样误差是不包括偏差的。 所谓随机误差,是指由于随机抽样的随机性 由此而形成的样本指标与总体指标之间的差 别,通常也叫做抽样误差.
3. 不同的抽样方法——重复抽样>不重复抽样;
4. 不同的抽样组织形式——是等距抽样还是整群抽 样,还是分层抽样或其它形式都会有影响。
(二)计算抽样平均误差的理论公式
根据抽样平均误差的概念可得其一般计算公式:
ˆ
即: x
样本指标 总体指标2
可能组成的样本总数
x X
重复抽样和不重复抽样(重置抽样和不重 置抽样)
重复抽样:也称为重置抽样,是指按照随机 原则,抽取一个登记后,放回去再按随机原 则再抽的抽样方法。
1 1 1 例如: , , , 5000 5000 5000
不重复抽样:也称为不重置抽样,是指抽取 出总体单位后,不再放回去,对剩下的总体 单位继续按随机原则进行抽样的方法。
1.79%
三、抽样平均误差
(四)其他抽样组织方式抽样平均误差的计算方法
1.类型比例抽样平均误差的计算 (1)平均数的抽样平均误差

重复抽样条件下:
x 2
n
不重复抽样条件下:
x
2
n 1 n N
三、抽样平均误差
(2)成数的抽样平均误差 重复抽样条件下:
10,10 10,20 10,30 10,40 20,10 20,20 20,30 20,40 30,10 30,20 30,30 30,40 40,10 40,20 40,30 40,40
样本平均数x
10 15 20 25 15 20 25 30 20 25 30 35 25 30 35 40
离差(x-X)
第七章
抽样调查
知识点回顾
普 查
全面调查 统 计 调查 非全面 调 查
全面报表 抽样调查
重点调查
典型调查
Contents
1 2 3 抽样调查的一般问题 抽样误差 总体指标的推断 必要抽样数目的确定
4
第一节
抽样调查的一般问题
一天,爸爸叫儿子去买一盒火柴。临出门前, 爸爸嘱咐儿子要买能划燃的火柴。儿子拿着钱出门 了,过了好一会儿,儿子才回到家。 “火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
2

( xi X ) 2 N

(x X ) F
i
2
F
2.样本指标
样本指标也称样本统计量或抽样指标, 它是根据抽样总体各单位的标志值或标志特 征计算的综合指标。 由于可以从一个全及总体中抽取许多个
不同的样本,不同的样本其分布结构也会有
差异,抽样指标的数值也就不同,所以抽样
指标的数值不是唯一确定的。
-15 -10 -5 0 -10 -5 0 5 -5 0 5 10 0 5 10 15
离差平方(x-X)2
225 100 25 0 100 25 0 25 25 0 25 100 0 25 100 225
1000
不重复抽样的样本数及相应指标计算表
序号 1 2 3 4 5 6 样本变 量x 10,20 10,30 10,40 20,30 20,40 30,40 样本平均 离差(x-X) 离差平方(x数x X)2 15 -10 100 20 -5 25 25 0 0 25 0 0 30 5 25 35 10 100 250
(三)抽样平均误差的计算方法
1.平均数的抽样平均误差 (1)重复抽样条件下:
x 2
n

n
n


n
(2)不重复抽样条件下:
x 2 N n
n N 1
2
当N很大时,
x
n 1 n N
2.成数的抽样平均误差
(1)重复抽样条件下:
P 85%,
2 P1 P 85% (1 85%) 12.75%,
n 800 10% 80
在重复条件下,采用[公式7—11]:
p
P P 1 n 12.75% 3.99% 80
在不重复条件下,采用[公式7—13]:
p
P P 1 n 1 n N 12.75% 80 3.79% 1 80 800
i

X
x

x
1000 7. 9 1 K 16 采取不重复抽样 见表7 2 ,
x
X

2
x
x
X

2
n CN

250 6 .4 6 16
重复抽样的样本数及相应指标计算表
序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
样本变量x
抽样平均误差的概念
抽样平均误差是指以全部可能样本指标
为变量,以总体指标为平均数计算得到的标 准差,以符号
ˆ
表示,通常以

p

x
代表平均
数的抽样平均误差,以
代表成数的抽样平
均误差,以M代表可能组成的样本总数。
二、影响抽样误差的主要因素
1. 母体(总体)各标志值的变异程度 ——两者成 正比,如果母体(总体)标准值没有差异,则也就没 有抽样误差; 2. 样本容量n ——反比关系;
(5)用于工业生产过程的质量控制
二、抽样调查中的几个基本概念
(一)全及总体和抽样总体 1.全及总体:全及总体简称总体或母体,它是指
所要调查研究对象的全体,用N表示。 2.抽样总体:抽样总体简称样本或子样,它是 指在全及总体中按随机原则抽取的那部分单位所构成 的集合体,用n表示。 n ≥ 30 大样本 n < 30 小样本
ii i ii i
(三)等距抽样

等距抽样也称机械抽样或系统抽样,它是将总
体各单位按某一标志顺序排列,然后按固定顺序和
相等距离或间隔抽取样本单位的抽样组织方式。
抽样距离计算公式为:
k
N n
等距抽样示意图
(四)整群抽样

整群抽样也称集团抽样、区域抽样或分
群随机抽样,它是将总体各单位按时间或空
(二)总体指标和样本指标
1.总体指标 总体指标也称为母体参数或全及指标,它
是根据全及总体各单位的标志值或标志特征计
算的,反映总体某种属性的综合指标。由于全
及总体是唯一确定的,根据全及总体计算的全
及指标也是唯一确定的。
X 总体平均数: X

N
N1 总体成数:P P N 总体方差:
间形式划分成许多群,然后按纯随机抽样或
机械抽样方式从中抽取部分群,对中选群的
所有单位进行全面调查的抽样组织方式。
第二节
抽样误差
一、抽样误差的概念
相关文档
最新文档