分层随机抽样(答案)
9.1.2分层随机抽样课件(人教版)

新知探索
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性
,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合
起来使用.例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他
的抽样方法,有时层内还需要再进行分层,等等.
思考2:如果想要了解某电视节目在你所在的地区(城市、乡镇或村庄)的收视率,
例3.随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层
的样本量为30,样本平均数为8,则该样本的平均数为_____.
答案:6.
20
30
ഥ=
×3+
× 8 = 6.
20 + 30
20 + 30
练习
方法技巧:
进行分层随机抽样的相关计算时,常用到的3个关系
(1)
样本容量
该层抽取的个体数
答案:×,×,×.
)
新知探索
辨析2:某校高三一班有学生54人,二班有学生42人,现在要用分层随机抽样的
方法从两个班抽取16人参加军训表演,则一班和二班分别被抽取的人数是(
A.9,7
答案:A.
B.10,6
C.8,8
D.12,4
).
练习
题型一:分层随机抽样的概念
例1.下列问题中,最适合用分层随机抽样抽取样本的是(
可以计算出男生、女生中分别应抽取的人数为:
326
386
男 =
× 50 ≈ 23,女 =
× 50 ≈ 27.
712
712
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:)如下:
男生
173.0
分层抽样(计算详解)

实验题目:1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及调查的情况:请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。
6.4.2 分层随机抽样的均值与方差

【问题2】在分层随机抽样中各层抽查的个数不一样,如何求样本的平均数呢?
【答案】分层随机抽样的平均数可以先分层求平均数,再求样本的平均数.
02
问题情境
甲、乙两位同学相约晚上在某餐馆吃饭,他们分别在
A,B两个网站查看同一家餐馆的好评率,甲在网站A
查到好评率98%,而乙在网站B查到好评率是85%,综
合考虑这两个网站的信息,应该如何得到这家餐馆的
总好评率?
【解析】好评率是由好评人数除以总评价人数得到的.98%的好评率意味
Байду номын сангаас
着如果有100个人评价,那么其中98人给了好评.
设在网站A评价该餐馆的人数为n1,其中给出好评的人数为m1,在网站B
m1
评价该餐馆的人数为n2,其中给出好评的人数为m2,由题目条件,n
1
m2
55585%.
n2
98%,
问题情境
综合A,B两个网站的信息,这家餐馆的好评率应该为
化简得
其中
0.98n1 0.85n2
n1
n2
0.98
0.85
n1 n2
n1 n2
n1 n2
n1
n2
和
n1 n2 n1 n2
m1 m2
n1 n2
,
分别是各自的权重,总好评率等于相应
的好评率与其权重乘积的和.
所以除非再知道A,B两个网站评价人数的比例关系,否则并
方差为360.那么甲、乙两班全部90名同学的平均成绩和方差分
别是多少?
解
设甲班50名同学的成绩分别为a1,a2,⋯,a50,那么甲班的
平均成绩、权重和方差分别是
2
简单随机抽样系统抽样分层抽样含答案

2.1.1 简单随机抽样、系统抽样、分层抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧ 抽签法随机数法3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.4.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.5.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.6.分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.7.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.一、选择题1.抽签法中确保样本代表性的关键是( )A.制签B.搅拌均匀C.逐一抽取D.抽取不放回答案 B 解析由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B.2.下列抽样实验中,用抽签法方便的有( )A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验答案B解析A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.3.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100答案 D 解析:此问题研究的是运动员的年龄情况,不是运动员,故A、B、C错,故选D.4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310答案A5.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了( )A.抽签法B.随机数表法C.系统抽样D.有放回抽样答案C解析从第1排到第50排每取一个人的间隔人数是相同的,符合系统抽样的定义.6.要从已经编号(1~50)的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是( )A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32答案B解析由题意知分段间隔为10.只有选项B中相邻编号的差为10,选B.7.有40件产品,其中一等品10件,二等品25件,次品5件,现从中抽出8件进行质量分析,问应采取何种抽样方法( )A.抽签法B.随机数表法C.系统抽样D.分层抽样答案D8.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为( )A.70 B.20 C.48 D.2答案B由于70070=10,即每10所学校抽取一所,又因中学200所,所以抽取200÷10=20(所).9.下列问题中,最适合用分层抽样方法抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量D.从50个零件中抽取5个做质量检验答案C解析A的总体容量较大,宜采用系统抽样方法;B的总体容量较小,用简单随机抽样法比较方便;C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样方法;D与B类似.10.要从其中有50个红球的1 000个球中,采用按颜色分层抽样的方法抽取100个进行分析,则应抽取红球的个数为( )A.5个B.10个C.20个D.45个答案A解析由题意知每1000100=10(个)球中抽取一个,现有50个红球,应抽取5010=5(个).11.在简单随机抽样中,某一个个体被抽到的可能性( )A.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性相等C.与第几次抽样有关,最后一次抽到的可能性大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同答案B解析由简单随机抽样的特点知与第n次抽样无关,每次抽到的可能性相等.二、填空题12.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.答案抽签法13.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)答案①③②14.某班级共有学生52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号为________.答案16解析用系统抽样的方法是等距离的.42-29=13,故3+13=16.15.某农场在三种地上种玉米,其中平地210亩,河沟地120亩,山坡地180亩,估计产量时要从中抽取17亩作为样本,则平地、河沟地、山坡地应抽取的亩数分别是________.答案7,4,6解析应抽取的亩数分别为210×17510=7,120×17510=4,180×17510=6.16.将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.答案20解析由题意可设A、B、C中个体数分别为5k,3k,2k,所以C中抽取个体数为2k5k+3k+2k×100=20.17.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.答案88解析在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的.所以,样本容量n=2+3+5+12×16=88.。
第三章分层随机抽样作业答案

P111 3.6 样本量应该满足:
在Nh-1≈Nh的条件下,
而其中每层的吃年夜饭的样本比例的方差的估计值为: p 1 p 1 f N n h hn h h hh v p p 1 p h h h n 1 N n 1 hn h h h
则样本比例的方差的估计值为:
6 2 h 6 2 h
p 1 p h h v p W v p W 1 f s t h h n 1 h 1 h 1 h
把相应的数值代入计算可得方差的估计值为v(pst)=3.9601×10-4,
从而可以得到该估计值的标准差为:s(pst)=0.0199。
(2)样本容量的确定
n2 = 0.2028 × 2568 = 520.7904 ≈ 521
n3 = 0.1625 × 2568 = 417.3000 ≈ 417 n4 = 0.1184 × 2568 = 304.0512 ≈ 304 n5 = 0.1544 × 2568 = 396.4992 ≈ 396 n6 = 0.1529 × 2568 = 392.6472 ≈ 393
P110 3.4 ∵ n0/N=2568/1650000=0.00156<0.05 ∴ 不需要修正 按内曼分配,样本量 n = 2568
w h
W 1 ph ) hp h(
w1= 0.0540/0.2584 = 0.2090
W p (1 p )
h1 h h h
k
w2= 0.0524/0.2584 = 0.2028
P110 3.5 解:总体总共分为10个层,每个层中的样本均值已经知道, 层权也得到,从而可以计算得到该开发区居民购买冷冻 食品的平均支出的估计值为: y st
《分层随机抽样》教学设计、导学案、同步练习

《9.1.2 分层随机抽样》教学设计【教材分析】本节《普通高中课程标准数学教科书-必修二(人教A版)第九章《9.1.2 分层抽样》,本节的主要内容在本章的结构上,通过大背景的“串联”,从大背景中不断提出新问题,从而通过问题链进行探究学习,合理选择抽样方法的必要性并掌握分层抽样方法。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养。
【教学目标与核心素养】1.数学建模:结合实际问题情景,理解分层抽样的必要性和重要性;2.逻辑推理:学会用分层抽样的方法从总体中抽取样本;3.直观想象:对简单随机抽样、分层抽样方法进行比较,揭示其相互关系.4.数学运算:总体平均数的估计方法【教学重点】:理解分层抽样的基本思想和适用情形..【教学难点】:掌握分层抽样的实施步骤,会计算总体平均数.【教学过程】抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,二、问题探究例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法进行改进呢?在对树人中学高一年级学生身高的调查中,采取简单随机抽样的方式抽取了50名学生。
1.抽样调查最核心的问题是什么?2.会不会出现样本中 50 个个体大部分来自高个子或矮个子的情形?3.为什么会出现这种“极端样本”?4.如何避免这种“极端样本”?样本代表性;会;抽样结果的随机性个体差异较大;分组抽样,减少组内差距在树人中学高一年级的 712 名学生中,男生有 326 名、女生有 386 名。
样本量在男生、女生中应如何分配?假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?80604020你认为哪些因素影响学生视力?抽样要考虑哪些因素?分层抽样每一层抽取的样本数=一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified random sampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.×总样本量做一做1.下列问题中,最适合用分层抽样抽取样本的是( )A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量【解析】A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 和D 中总体个体无明显差异且个数较多,适合用系统抽样;B 中总体个体差异明显,适合用分层抽样. 【答案】 B2.某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取________辆、________辆、________辆. 【解析】 三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆).【答案】 6 30 10 1.分层抽样的步骤2.分层抽样的特点有哪些?【提示】 (1)分层抽样适用于已知总体是由差异明显的几部分组成的;(2)分成的各层互不交叉;(3)各层抽取的比例都等于样本容量在总体中的比例,即nN,其中n 为样本容量,N 为总体容量.3. 计算各层所抽取个体的个数时,若N i ·n N的值不是整数怎么办?【提示】 为获取各层的入样数目,需先正确计算出抽样比n N ,若N i ·nN 的值不是整数,可四舍五入取整,也可先将该层等可能地剔除多余的个体. 探究3 分层抽样公平吗?第1层的总体平均数和样本平均数为:第2层的总体平均数和样本平均数为:总体平均数和样本平均数为:由于用第一层的样本平均数 可以估计第1层的总体平均数 ,第二层的样本平均数 可以估计第2层的总体平均数,因此我们可以用估计总体平均数对各层样本平均数加权(层权)求和;分层随机抽样如何估计总体平均数12m...==X X X X M++11Mii XM =∑12...m x x x x m++==11mi i x m =∑12N ...==Y Y Y Y N++11Ni i Y N =∑12...m y y y y n++==11mi i y n =∑11M Niii i X YM X NY M NW X Y M NM N M N M N==++===+++++∑∑11m ni ii i x ymx ny m nx y m nm n m n m nω==++===+++++∑∑x X y Y Mx Ny M Nx y M N M N M N+=++++W 11M Ni ii i x yw m n==+=+∑∑m nx y m n m n=+++=m n m n M N M N +=+M m M N m n =++N n M N m n =++M Nx y M N M N=+++到男生女生平均身高分别为170.2cm和160.8cm。
抽样技术练习题及答案

习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
分层随机抽样 练习(1)(解析版)

9.1.2 分层随机抽样一、选择题1.分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行()A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】C【解析】保证每个个体等可能入样是三种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.故选:C2.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为100、200、300、400件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丁种型号的产品中抽取()件.A.24B.18C.12D.6【答案】A【解析】设应从丁种型号的产品中抽取x件,由分层抽样的基本性质可得60 400100200300400x=+++,解得24x=.故选:A.3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层随机抽样的方法从中抽取20人,各年龄段分别抽取的人数为()A.7,5,8B.9,5,6C.6,5,9D.8,5,7【答案】B【解析】由于样本量与总体个体数之比为2011005=,故各年龄段抽取的人数依次为14595⨯=,12555⨯=,20956--=.故选:B4.已知某地区中小学生人数和近视情况分别如图1和如图2所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A .100,20B .200,20C .100,10D .200,10【答案】B【解析】由题意知,样本容量为()3500450020002%200++⨯=,其中高中生人数为20002%40⨯=,高中生的近视人数为4050%20⨯=,故选B.5.(多选题)我校有高一学生850人,高二学生900人,高三学生1200人,学校团委欲用分层抽样的方法抽取30名学生进行问卷调查,则下列判断错误的是( )A .高一学生被抽到的概率最大B .高二学生被抽到的概率最大C .高三学生被抽到的概率最大D .每名学生被抽到的概率相等 【答案】ABC【解析】由抽样的定义知,无论哪种抽样,样本被抽到的概率都相同,故每名学生被抽到的概率相等,故选ABC .6.(多选题)某单位有老年人28人、中年人54人、青年人81人,为了调查他们的身体状况,从中抽取一个容量为36的样本,则不适合抽取样本的方法是( ) A .随机数表法 B .抽签法C .简单随机抽样D .先从老年人中剔除1人,再用分层抽样【答案】ABC【解析】因为总体是由差异明显的三部分组成,所以考虑用分层抽样. 因为总人数为285481163++=,样本容量为36,由于按36163抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为3621629=. 若从老年人中随机地剔除1人,则老年人应抽取22769⨯=(人),中年人应抽取254129⨯=(人),青年人应抽取281189⨯=(人),从而组成容量为36的样本.二、填空题7.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法分别为_____. 【答案】分层随机抽样、简单随机抽样【解析】由调查①可知个体差异明显,故宜用分层随机抽样;调查②中个体较少,且个体没有明显差异,故宜用简单随机抽样.8.防疫站对学生进行身体健康调查,采用分层抽样法抽取,泗县一中高三有学生1600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有 . 【答案】760【解析】设学校有女生x 人,∵ 对全校男女学生共1600名进行健康调查, 用分层抽样法抽取一个容量为200的样本,∴ 每个个体被抽到的概率是200116008=, 根据抽样过程中每个个体被抽到的概率相等,∵女生比男生少抽了10人,且共抽200人, ∴女生要抽取95人,∴女生共有1957608÷= 9.某高中在校学生2000人.为了响应“阳光体育运动”号召,学校举行了跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如表:其中a :b :2c =:3:5,全校参与登山的人数占总人数的35,为了了解学生对本次活动的满意程度,现用分层抽样方式从中抽取一个100个人的样本进行调查,则高二年级参与跑步的学生中应抽取 人 【答案】12【解析】根据题意可知样本中参与跑步的人数为2100405⨯=人,所以高二年级参与跑步的学生中应抽取的人数为3401210⨯=人. 10.小玲家的鱼塘里养了2500条鲢鱼,按经验,鲢鱼的成活率约为80%.现准备打捞出售,为了估计鱼塘中鲢鱼的总质量,从鱼塘中捕捞了3次进行统计,得到的数据如下表:那么,鱼塘中鲢鱼的总质量约是______kg. 【答案】3600【解析】平均每条鱼的质量为()20 1.610 2.210 1.81.8kg 201010⨯+⨯+⨯=++因为成活的鱼的总数约为2500×80%=2000(条) 所以总质量约是()2000 1.83600kg ⨯= 三、解答题11.举例说明简单随机抽样和分层随机抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等. 【答案】见解析.【解析】袋中有160个小球,其中红球48个,篮球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为2011608=. (2)使用分层随机抽样:四种球的个数比为3:4:1:2.红球应抽320610⨯=个;篮球应抽420810⨯=个;白球应抽120210⨯=个;黄球应抽220410⨯=个. 因为68241486416328====, 所以按颜色区分,每个球被抽到的概率也都是18.所以简单随机抽样和分层随机抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等.12.某单位2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? 【答案】(1) 老年4人,中年12人,青年24人 (2) 用分层抽样(3) 系统抽样【解析】试题分析:(1)用分层抽样方法从老年人、中年人和青年人中抽取对应的人数即可;(2)用分层抽样法从管理层、技术开发部、营销部以及生产部抽取对应的人数即可;(3)用分层抽样方法从老年人、中年人和青年人中抽取对应的人数即可解析:(1)用分层抽样,并按老年4人,中年12人,青年24人抽取.(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
97 7 4 5 4 6 5 5 1
请估计该地区养牛总头数 Y 及其估计量的相 对标准差 s(Yµ) /Yµ 。
8. 一公司希望估计某一个月内由于事故引 起的工时损失。因工人、技术人员及行政管理人 员的事故率不同,故采用分层随机抽样。已知下 列资料:
工 技术人 行政管理
人员
人员
N1 =1 32 =3 S12 6
从商行内抽取由 400 人组成的一个样本,目的是
估计使用某些娱乐设备的人所占的比例。按照粗
略的猜测,这些设备 40%到 50%是由男性使用的,
20%到 30%是由女性使用的,5%到 10%是由管理人
员使用的。请问:
(1)你如何把样本单位分配在这三组人之间?
(2)若真正使用者占的比例分别是 48%,21%
总 1234567891
数
0
1 141 4 8 9 0 1 4 0 1ห้องสมุดไป่ตู้1 0
1 348 04 23
4
2 470 5 1 6 8 8 1 1 1 5 1
5 0427457066
7
804 0
3 255 2 2 1 2 1 1 3 0 6 2
8 2613373 32
8202984
0
4 149 1 3 2 3 3 0 2 7 1 3
好
C. 层数一般以不超过 6 为宜
D. 层数一般以 4 层为最好
E. 应该充分
考虑费用和精度要求等因素来确定层数
6. 下 面 哪 种 样 本 量 分 配 方 式 属 于 奈 曼 分 配 ?
( CD )
A. nh n Nh N
nk NhSh
n
L
NhSh
h1
B. nh NhSh / ch
C.
n
2%。
Wh
层
真 Sh
估计的 Sh
值 (1) (2)
1 0. 30 30 30
2 3 20 20 20
3 0. 10 5 20 6 0. 1
7. 调查某个地区的养牛头数,以村作为抽
样单元。根据村的海拔高度和人口密度划分成四
层,每层抽取 10 个村作为样本单元,经过调查
获得下列数据:
层村
样本村养牛头数
收集到以后才知道
D. 总体规模太大,事先分层太费事
E. 一般场合都可以适用
三、名次解释
1. 分 层 随 机 抽 样
2. 自 加 权
3. 最优分配
四、简答题
1. 简述分层随机抽样相对于简单随机抽样的优
点。
2. 请列举出样本量在各层的三种分配方法,并
说明各种方法的主要思想。
3. 怎样分层能提高精度?
4. 总样本量在各层间分配的方法有哪些?
A、Vopt V prop Vsrs
B、V prop Vopt Vsrs
C、V prop Vopt Vsrs
D、Vsrs V prop Vopt
6、下面哪种样本量分配方式属于比例分配?( A)
A、 nh n Nh N
B、 nh Nh Sh ch
n
L
NhSh ch
h1
C、 nh NhSh
L
NhSh / ch
h1
D. nh WhSh
n
L
Wh Sh
h1
E. nh WhSh / ch
n
L
WhSh / ch
h1
7.事后分层的适用场合有(ABCD )
A. 各层的抽样框无法得到
B. 几个变量都适宜于分层,而要进行事先的多
重交叉分层存在一定困难
C. 一个单位到底属于哪一层要等到样本数据
层,每层取 10 个村作为样本单元,经过调查获
得下列数据
层 村总数 样本村养牛头数
1234567
8 9 10
1 1411
43 84 98 0 10 44 0
2 4705
124 13 0
3 2558
50 147 62 87 84 158 170
4 14997 104 56 160
228 262 110 232 139 178 334
请问:
(1)包含 1000 个住户的样本应该如何在这
两层中分配?
(2) 若调查的目的是估计这两层平均每个
住户拥有财产的差额,样本应如何分配(假定各
层的单位调查费用相等)?
2. 一个县内所有农场按规模大小分层,各
层内平均每个年农场谷物(玉米)的英亩数列在
下表中。
农场规 农场数 平均每一农场的 标准差 Sh
20%(即V ( pprop ) V ( psrs ) =0.8)
(2) 若 P=4% ,其中 W1=0.05 ,P1=45% ;W2=0.2, P2=5%; W3=0.75, P3=1%.则采用按比例分配的分层 抽样比简单随机抽样精度得益有多大?
14. 调查某个地区的养牛头数,以村作为抽
样单元。根据村的海拔高度和人口密度划分成四
th 均为已知数,请证明当总费用固定时,为了使
V
(
yst
)
达到最小值,
nh
必与
(Wh2 t
Sh
2
)2
/
3
成比例。并求出下
h
述条件中,一个含量为 1000 的样本所对应的 nh 。
Wh
Sh
th
层
1 0.4 4
1
2 0.3 5
2
3 0.3 6
4
4. 在一个商行内,62%的雇员是熟练的或不
熟练的男性,31%是办事的女性,7%是管理人员。
现要抽出一个包含 100 个农场的样本,目的是估
计该县平均每个农场的玉米面积,请问:
(1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?
(假定各层的单位调查费用相等)
(3)分别将比例分配、最优分配的精度与简
单随机抽样的精确度比较。
3.设费用函数具有形式C c0 th nh ,其中 c0 及
样本
平原 去年产量 当年产量(百
(百斤)
斤)
1
204
210
2
143
160
3
82
75
4
256
280
5
275
300
6
198
190
山区
样本
去年产量 当年产量(百
(百斤)
斤)
1
137
150
2
189
200
3
119
125
4
63
60
5
103
110
6
107
100
7
159
180
8
63
75
9
87
90
11. 一公司希望估计某一个月内由于事故引
年龄组 层权 层样本 ph
qh
Wh
量 nh
14—25 0.281 400 0.08 0.917
岁 0.322 650 3 0.826
26—40 0.213 600 0.17 0.690
岁 0.814 350 4 0.536
41—60
0.31
岁
0
61 岁
0.46
以上
4
6. 设计某一类商店销售额的调查,n=550,
下:
工人
技术人员
行政管理人员
8,24,0,0, 4,5,0,24, 1,8
16,32,
8,12,3,2,
6,0,16,7, 1,8
4,4,9,5,8,
18,2,0
试估计总的工时损失数并给出它的置信度为
95%的置信区间。
13. 在估计比例问题时:
(1) 假设 P=0.5,W1=W2=0.5,则 P1 和 P2 为何值 时可以使按比例分配的分层抽样精度可以得益
N2 =92 S22 =25
N3 =27 =9 S32
若总样本量 n=30,试用奈曼分配确定各层
的样本量。
9.上题中若实际调查了 18 个工人、10 个技
术人员、2 个行政人员,其损失的工时数如下:
工人 技术人 行政管理人
员
员
8,24,0, 4,5,0, 1,8 0,16,32,24,8,12, 6,0,16, 3,2,1,8 7,4,4, 9,5,8, 18,2,0
分组
(万元)
1—49
18260 100
80
50—99
4315
250
200
100—249 2233
500
600
250—999 1057
1760
1900
1000 人 以 567
2250
2500
上
(1) 若欲抽取 3000 个工厂作样本来估计产值,
试比较下列各种分配的效率:
(2) 按工厂数多少分配样本;
按最优(奈曼)分配。
模(英亩) Nh
玉米面积Yh
0—40 394
5.4
8.3
41—80 461
16.3
13.3
81—120 391
24.3
15.1
121—16 334
34.5
19.8
0
169
42.1
24.5
161—20 113
50.1
26.0
0
148
63.8
35.2
201—24
0
241
总和或 2010
26.3
--
均值
B、 nh n C、 Wh 1 D、 Nh 1
4、在给定费用下估计量的方差V (yst ) 达到最小,
或者对于给定的估计量方差V 使得总费用达到最