1抽样方法(1)简单随机抽样(抽签法

1抽样方法(1)简单随机抽样(抽签法
1抽样方法(1)简单随机抽样(抽签法

统计

1.抽样方法:(1)简单随机抽样(抽签法、随机数表法)常常用于总体个数较少时,它的特征是从总体中逐个抽取;(2)系统抽样也叫等距离抽样,常用于总体个数较多时,它的主要特征是均衡成若干部分,每部分只取一个;(3)分层抽样,主要特征是分层按比例抽样,主要用于总体中有明显差异,它们的共同点:每个个体被抽到

的概率都相等n

N

,体现了抽样的客观性和平等

性。

如(1)某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95。为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,把这种抽样记为A;某中学高中一年级有12名女排运动员,要从中选取3人调查学习负担的情况,把这种抽样记为B,那么完成上述两项调查应分别采用的抽样方法:A为_______,B为_____。(答:分层抽样,简单随机抽样);

(3)某中学有高一学生400人,高二学生300人,高三学生300人,现通过分层抽样抽取一个容量为n的样本,已知每个学生被抽到的概率为0.2,则n= _______(答:200);

(4)容量为100的样本拆分成10组,前7组的频率之和为0.79,而剩下的三组的频数组成等比数列,且其公比不为1,则剩下的三组中频数最大的一组的频率是______(答:0.16);

(5)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本,则某一个体a“第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是______________(答:111

,,

10105

);

2.总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。一般地,样本容量越大,这种估计就越精确。总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图)。

频率分布直方图的特征:

(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。

(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

频率直方图的作法:

(1)算数据极差();

min

max

x

x-

(2)决定组距和组数;

(3)决定分点;

(4)列频率分布表;

(5)画频率直方图。

提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率。组数的决定方法是:设数据总数目为n,50

n时,分为8

~

5组;

100

50≤

~

8组.

如(1)一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2;则样本在区间]

50

,

50

(-上的频率为

A.5%B.25%C.50%D.70%(答:D);

(2)已知样本:10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 ,那么频率为0.3的范围是

A.5.5~7.5 B.7.5~9.5

C.9.5~11.5 D.11.5~13.5(答:B);

(3)观察新生儿的体重,其频率分布直方图如图所示,则新生儿的体重在[2700,3000]的频率

为_______(答:0.3);

(4)如图,是一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是_____(答:120);

(5) 有同一型号的汽车100辆,为了解这种

汽车每蚝油1L所行路程的情况,现从中随即抽出10辆在同一条件下进行蚝油1L所行路程实验,得到如下样本数据(单位:km):13.7,12.7,14.4,13.8,

13.3,12.5,13.5,13.6,13.1,13.4,其分组如下: (2)根据上表,在给定坐标系中画出频率分布直线图,并根据样本估计总体数据落在[12.95,13.95)中的概率;

(3)根据样本,对总体的期望值进行估计 解:(1)频率分布表:

分组

频数 频率 [12.45,12.95) 2 0.2 [12.95,13.45) 3 0.3 [13.45,13.95) 4 0.4 [13.95,14.45)

1

0.1

合计 10 1.0

(2)频率分布直方图:

估计总体数据落在[12.95,13.95)中的概率为0.7

(3)

0.7(0.3) 1.40.80.3(0.5)0.50.60.10.4

1310

x -

+-++++-++++=+

Q =13.4

因此,总体的期望值进行估计约为13.4.

(6)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.

(1) 第二小组的频率是多少?样本容量是多少? (2) 若次数在110以上(含110次)为达标,试估

计该学校全体高一学生的达标率是多少? (3) 在这次测试中,学生跳绳次数的中位数落在哪

个小组内?请说明理由。 分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。

解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,

因此第二小组的频率为:

4

0.0824171593

=+++++

又因为频率=第二小组频数样本容量,

所以

12

1500.08

===第二小组频数样本容量第二小组频率

(2)由图可估计该学校高一学生的达标率约为

171593

100%88%24171593

+++?=+++++

(3)由已知可得各小组的频数依次为6,12,51,

45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。

分组

频数 频率 [12.45,12.95) [12.95,13.45) [13.45,13.95) [13.95,14.45) 合计

10

1.0

90 101112131415

o 0.000.000.010.010.020.020.02频率/组距 0.030.03

3、样本平均数:

121

11()n

n i

i x x x x x n n ==+++=∑L 。

如有一组数据:x 1,x 2,…,x n (x 1≤x 2≤…≤x n ),它们的算术平均值为20,若去掉其中的x n ,余下数据的算术平均值为18,则x n 关于n 的表达式为 (答:218n x n =+)。 4、样本方差:

2222

121[()()()]n s x x x x x x n =-+-++-L 21

1()n i i x x n ==-∑

; 样本标准差

s =。

如(1)甲、乙两名射击运动员参加某大型运

动会的预选赛,他们分别射击了5次,成绩如下表

(

(答:甲);

(2)已知实数)2(,,,21≥n x x x n Λ的期望值为x ,方差为2

S ,∑=-=n i i a x n m 1

2

)

(1,若

x a ≠,则一定有

A .m S >2

B .m S <2

C .m S =2

D .2

S 与m 无法比较大小

(答:B );

(3)某班40人随机平均分成两组,两组学生一

则全班的平均分为_______,方差为______(答:85,51)

提醒:若12,,,n x x x L

的平均数为x ,方差为

2s ,则12,,,n ax b ax b ax b +++L 的平均数

为ax b +,方差为22

a

s

。 如已知数据n x x x ,,,21Λ

的平均数5=x ,方差

42=S ,则数据73,,73,7321+++n x x x Λ的

平均数和标准差分别为

A .15,36

B .22,6

C .15,6

D .22,36

(答:B ) 5.茎叶图

(1) 茎叶图的画法: ①将每个数据分为茎(高位)与叶(低位)两

部分,②将最大茎和最小茎之间的数按大小顺序排成一列,③将各数据的叶依先后次序写在其茎的左(右)两侧.

(2)茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数

据可以随时记录,随时添加,方便记录与表示。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以

上的数据虽然能够记录,但是没有表示两个记录

那么直观,清晰。

6. 独立性检验

独立性检验是检定两个事件间是否独立的统

计方法,是卡方检验的一个应用.

卡方检验是对样本的频数分布所来自的总体

分布是否服从某种理论分布或某种假设分布所作

的假设检验.即根据样本的频数分布来推断总体的

分布,卡方独立性检验的零假设是各事件之间相互

独立.卡方值永远大于零. χ2的两个临界值分别是

3.841,与6.635.2

x ≤3.841时,接受假设即两事件无关.

相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“r

”表示,

其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,改变两变量的地位并不影响相关系数的数值,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关;

回归和相关都是研究两个变量相互关系的分析方法。相关分析研究两个变量之间相关的方向和相关的密切程度。但是相关分析不能指出两变量相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化关系。回归方程则是通过一定的数学方程来反映变量之间相互关系的具体形式,以便从一个已知量来推测另一个未知量。为估算预测提供一个重要的方法。

相关性检验的步骤是:(1)做统计假设:x 与Y 不具备线性相关关系.(2)根据小概率0.05与2n -查出r 的一个临界值.(3)根据样本相关系数公式计算出r 的值.(4)作统计推断:如果

0.05,

r r >表明95%的把握认为x 与Y 之间具备线性相关关

系,如果

0.05,r r ≤接受假设.

提醒:A 与B 有关并不意味着A 的发生必然导致B 的发生.

7.回归分析

回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。在回归分析中,由X 推算Y 与由Y 推算X 的回归方程是不同的,不可混淆:

2

()(),()

i i i

x x y y b a y bx

x x --=

=--∑∑由x 推y 2

()(),()

i

i i

x x y y b a x by y y --=

=--∑∑由y 推x .与相关分析相比,回归分析的特点是:两个变量是不对等的,只能用自变量来估计因变量,而不允许由因变量来推测自变量,必须区分自变量,一般说,事物的原因作自变量X.

回归分析和相关分析是互相补充、密切联系的。相关分析需要回归分析来表明现象数量相关的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切相关,进行回归分析求其相关的具体形式才有意义。

如(1)在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520个女性中6人患色盲,

(1)根据以上的数据建立一个2×2的列联表; (2)若认为“性别与患色盲有关系”,则出错的概率会是多少

(2)假设H :“性别与患色盲没有关系” 先算出K 的观测值:

21000(385144426)27.1448052044956

k ??-?=???=

则有2

(10.808)0.001P K ≥=

即是H 成立的概率不超过0.001, 若认为“性别与患色盲有关系”,则出错的概率为0.001 (2)一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的

(1)画出散点图(2)如果y 对x 有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内? 答案:(2)y=0.7286x-0.8571 (3)x 小于等于14.9013

简单随机抽样(教教案)

2.1.1简单随机抽样 【教学目标】: 1.正确理解随机抽样地概念,会描述抽签法、随机数表法地一般步骤. 2.能够根据样本地具体情况选择适当地方法进行抽样. 【教学重难点】: 教学重点:正确理解简单随机抽样地概念,会描述抽签法及随机数法地步骤,能灵活应用相关知识从总体中抽取样本. 教学难点:简单随机抽样地概念,抽签法及随机数法地步骤. 【教学过程】: 情境导入: 1.根据国务院地决定,我国于2000年11月1日进行了第五次全国人口普查地登记工 作.近千万普查工作人员投入到了艰苦繁重地工作中,结果显示至普查日期为止我国人口总 数为129533万. 上面地例子是一个统计上地典型事例,它用到了什么统计方法?它有什么优缺点?你有什么其他地办法吗?发表一下你地观点? (答:用到了普查地统计方法;优点是全面准确,缺点是工作量大,在绝大部分地统计案例中无法实现(检查具有破坏性);随机抽查地方法.) 2.课本P55阅读 你认为在该故事中预测结果出错地原因是什么? (答:所选样本没有代表性.) 3.假设你作为一名食品卫生工作人员,要对某食品店内地一批小包装饼干进行卫生达 标检验,你准备怎样做? 显然,你只能从中抽取一定数量地饼干作为检验地样本.(为什么?)那么,应当怎样获取样本呢? 新知探究: 一、简单随机抽样地概念: 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内地各个个体被抽到地机会都相等,就把这种抽样方 法叫做简单随机抽样. 思考:简单随机抽样地每个个体入样地可能性为多少?(n/N) 二、抽签法和随机数法: 1、抽签法 一般地,抽签法就是把总体中地N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n地样本. 抽签法地一般步骤: (1)将总体地个体编号; (2)连续抽签获取样本号码. 思考:你认为抽签法有什么优点和缺点;当总体中地个体数很多时,用抽签法方便吗? 解析:操作简便易行,当总体个数较多时工作量大,也很难做到“搅拌均匀” 2、随机数法

常用抽样方法

1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或"差"的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是"同质"的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为"有代表性的样本"。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选"中型城镇"进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先"分层"(事先确定每层的样本量)再"判断"(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点:

调查学生如何进行简单随机抽样

调查学生如何进行简单随机抽样 例、某校有学生1200人,为了调查某种情况打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得? 分析:简单随机抽样分两种:抽签法和随机数表法.尽管此题的总体中的个体数不一定算“较少”,但依题意其操作过程却是保障等概率的. 解:法一:首先,把该校学生都编上:0001,0002,0003,…,1200.如用抽签法,则作1200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌.抽签时,每次从中抽出1个号签,连续抽取50次,就得到一个容量为50的样本. 法二:首先,把该校学生都编上:0001,0002,0003,…,1200如用随机数表法,则可在数表上随机选定一个起始位置(例如,随意投一针,针尖所指数字可作起始位置).假如起始位置是表中的第5行第9列的数字6,从6开始向右连续取数字,以4个数为一组,碰到右边线时向下错一行向左继续取,所得数字如下: 6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3046,1943,6248,3469,0253,7887,3239,7371,28的,3445,9493,4977,2261,8442,…… 所取录的4位数字如果小于或等于1200,则对应此号的学生就是被抽取的个体;如果所取录的4位数字大于1200而小于或等于2400,则减去1200剩余数即是被抽取的;如果大于2400而小于3600,则减去2 400;依些类推.如果遇到相同的,则只留第一次取录的数字,其余的舍去.经过这样处理,被抽取的学生所对应的分别是: 0438,0682,1022,0762,0709,0606,0644,0853,1183,013O,0646,0743,0248,1069,0253,0687,0839,0171,0445,1045,1093,0177,1061,0042,…一直取够50人为止. 说明:规X的,不带主观意向的随机抽样,才能保证公平性、客观性、准确性和可信性.故此,抽样的过程,也反映科学的工作态度和XX的工作作风. 判断抽牌方法是否为简单随机抽样 例人们打桥牌时,将洗好的扑克牌(52X)随机确定一X为起始牌,这时,开始按次序搬牌,对任何一家来说,都是从52X总体中抽取一个13X的样本.问这种抽样方法是否为简单随机抽样? 分析:简单随机抽样的实质是逐个地从总体中随机抽取.而这里只是随机确定了起始X,这时其他各X虽然是逐X起牌的,其实各X在谁手里已被确定,所以,不是简单随机抽样,据其等距起牌的特点,应将其定位在系统抽样. 解:是简单随机抽样,是系统抽样. 说明:逐X随机抽取与逐X起牌不是一回事,其实抓住其“等距”的特点不难发现,属于哪类抽样. 判断是不是系统抽样 例下列抽样中不是系统抽样的是() A.从标有1-15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点

简单随机抽样习题及解答

简单随机抽样习题及解答 一、名词解释 简单随机抽样抽样比设计效应 二、单选题 1、假设根据抽样方差公式确定的初始样本量为400,有效回答率为0.8,那么实际样本量应为:() A 320 B 800 C 400 D 480 答案:B 2、已知某方案的设计效应为0.8,若计算得简单随机抽样的必要样本量为300,则该方案所需样本量为() A 375 B 540 C 240 D 360 答案:C 3、假设根据抽样方差公式确定的初始样本量为400,如现在要将抽样相对误差降低20%,则样本量应为:() A 256 B 320 C 500 D 625 答案:D 三、多选题 1、简单随机抽样的抽样原则有() A 随机抽样原则 B 抽样单元入样概率已知 C 抽样单元入样概率相等 D 随意抽取原则 答案:ABC 2、影响样本容量的因素有: A 总体大小 B 抽样误差 C 总体方差 D 置信水平 答案:ABCD 3、简单随机抽样的实施方法有() A 随机数法 B 抽签法 C 计算机抽取 D 判断抽取 答案:ABC 四、简答题 1、简述样本容量的确定步骤 2、简述预估计总体方差的方法 五、计算 1、某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随

机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。 2、某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,得y=12.5,s2=12.52。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本? (1)该区居民的平均用水量的置信区间: 该区居民的用水总量的95%置信区间:(1181,1319) (2) 35.96)5 .122.052.1296.1()(220=??==Y r S u n α 9643.95100≈=+=N n n n 3. 某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为 名称 粮食 棉花 大豆 变异系数 0.38 0.39 0.44 若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少? (1) ) 04.6,98.3(4356 .036.20125.54356 .0)(1897.0)98 81(86527.1)1()(0125.51?21 ?±==-=-====∑=y s f n s y v y n y Y n i i ) 19.13,81.11(35 .096.15.1235 .0)(1239.0)01.01(100 52.12)1()(5.12?2?±==-=-===y s f n s y v y Y

简单随机抽样方法

2.1.1 简单随机抽样 一、教学目标: 知识与技能: 正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤; 过程与方法: (1)能够从现实生活或其他学科中提出具有一定价值的统计问题; (2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。情感态度与价值观: 通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。 二、教学重点与难点 正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。 三、教学过程 (一)创设情景,揭示课题 假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做? 显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢? (二)探究新知 1、简单随机抽样的概念 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。 简单随机抽样必须具备下列特点: (1)简单随机抽样要求被抽取的样本的总体个数N是有限的。 (2)简单随机样本数n小于等于样本总体的个数N。(n≤N) (3)简单随机样本是从总体中逐个抽取的。 (4)简单随机抽样是一种不放回的抽样。 (5)简单随机抽样的每个个体入样的可能性均为n/N。 让学生做一做,下面抽样的方法是简单的随机抽样吗?为什么?(加深对概念的理解) 1.在某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品, 称其质量是否合格。 2.从50个个体里一次性抽取5个个体作为样本。 3.火箭队共有15名球员,指定个子最高的2名球员参加球迷见面会。 4.一儿童从玩具箱中的20件玩具中随意拿出意见来玩,玩后放回再拿出一件, 连续玩了5件。 2、抽签法和随机数法 (1)、抽签法的定义。 一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

随机抽样知识讲解

随机抽样 【学习目标】 1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法; 2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本; 3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系. 【要点梳理】 要点一、简单随机抽样 简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取. 1、简单随机抽样的概念: 一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 2、简单随机抽样的特点: (1)被抽取样本的总体个数N是有限的; (2)简单随机样本数n小于等于样本总体的个数N; (3)从总体中逐个进行抽取,使抽样便于在实践中操作; (4)它是不放回抽取,这使其具有广泛应用性; (5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性. 3、实施抽样的方法: (1)抽签法: 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.

抽签法的一般步骤: ①将总体中的N个个体编号; ②把这N个号码写在形状、大小相同的号签上; ③将号签放在同一箱中,并搅拌均匀; ④从箱中每次抽取一个号签,连续抽取n次; ⑤将总体中与抽到的号签的编号一致的n个个体取出. (2)随机数表法: 要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性. 随机数表法的步骤: ①将总体的个体编号(每个号码的位数一致); ②在随机数表中任选一个数字作为开始; ③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止. 注意: ①选定开始数字,要保证所选数字的随机性; ②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去. 要点诠释: 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法. 2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不

1简单随机抽样、系统抽样、分层抽样含答案

简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样????? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k); (4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选

简单随机抽样(含答案)

简单随机抽样 一、单选题 1. 抽样比的计算公式为( B )。 A. f= (n-1)/ (N-1) B. f=n/N C. f= (n-1)/N D. f= (N-n)/N 2. 不放回的简单随机抽样指的是哪种情形的随机抽样?(D ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 3. 放回的简答随机抽样指的是哪种情形的随机抽样?( A ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 4. 通常所讨论的简单随机抽样指的是( D )。 A. 放回的简单随机抽样 B. 放回无序随机抽样 C. 不放回有序随机抽样 D. 不放回的简单随机抽样 5. 下面给出的四个式子中,错误的是(D )。 A. ()E y Y = B.()E Ny Y = C.()E p P = D. ?()E R R = 6. 关于简单随机抽样的核心定理,下面表达式正确的是( A )。 A. 21()f V y S n -= B. 2 1()1f V y s n -=- C. 21()V y s n = D. 2 1()f V y s n -= 7. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A. 简单随机抽样的deff=1 B. 分层随机抽样的deff>1 C. 整群随机抽样的deff>1 D. 机械随机抽样的deff ≈1 8. 假设考虑了有效回答率之外所有其他因素的初始样本量为400,而设计有效回答率 为80%,那么样本量应定为( B )。 A. 320 B. 500 C. 400 D. 480 9. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。 A. 375 B. 540 C. 240 D. 360 二、多选题 1. 随机抽样可以分为( ABCD )。 A. 放回有序

简单随机抽样

1. 正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤; 2. 能够从现实生活或其他学科中提出具有一定价值的统计问题; 请同学自主学习P54-57内容,思考回答下列问题: 1.一般地,我们把所考察对象的全体叫,组成总体的每一个称为个体,从总体中抽取的一部分个体叫,样本中所含个体的数目叫。 2.我们常用的抓阄法是不是简单随机抽样?为什么?抽鉴法的概念是什么?从概念、细化出操作步骤是什么? 3.随机数法的概念是什么?怎样利用随机数表产生样本? 4.在使用随机数表产生样本时,往往从0开始终编号,你能说出这样做的好处吗? 二、新课导学 ※探索新知 新知1:简单随机抽样的概念 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。 【说明】简单随机抽样必须具备下列特点: (1)简单随机抽样要求被抽取的样本的总体个数N是有限的。 (2)简单随机样本数n小于等于样本总体的个数N。 (3)简单随机样本是从总体中逐个抽取的。 (4)简单随机抽样是一种不放回的抽样。 (5)简单随机抽样的每个个体入样的可能性均为n/N。 新知2:抽签法和随机数法 抽签法的定义:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。 【说明】抽签法的一般步骤: (1)将总体的个体编号。 (2)连续抽签获取样本号码。 思考:你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?

1抽样方法(1)简单随机抽样(抽签法

统计 1.抽样方法:(1)简单随机抽样(抽签法、随机数表法)常常用于总体个数较少时,它的特征是从总体中逐个抽取;(2)系统抽样也叫等距离抽样,常用于总体个数较多时,它的主要特征是均衡成若干部分,每部分只取一个;(3)分层抽样,主要特征是分层按比例抽样,主要用于总体中有明显差异,它们的共同点:每个个体被抽到 的概率都相等n N ,体现了抽样的客观性和平等 性。 如(1)某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95。为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,把这种抽样记为A;某中学高中一年级有12名女排运动员,要从中选取3人调查学习负担的情况,把这种抽样记为B,那么完成上述两项调查应分别采用的抽样方法:A为_______,B为_____。(答:分层抽样,简单随机抽样); (3)某中学有高一学生400人,高二学生300人,高三学生300人,现通过分层抽样抽取一个容量为n的样本,已知每个学生被抽到的概率为0.2,则n= _______(答:200); (4)容量为100的样本拆分成10组,前7组的频率之和为0.79,而剩下的三组的频数组成等比数列,且其公比不为1,则剩下的三组中频数最大的一组的频率是______(答:0.16); (5)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本,则某一个体a“第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是______________(答:111 ,, 10105 ); 2.总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。一般地,样本容量越大,这种估计就越精确。总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图)。 频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的总体趋势。 (2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 频率直方图的作法: (1)算数据极差(); min max x x- (2)决定组距和组数; (3)决定分点; (4)列频率分布表; (5)画频率直方图。 提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率。组数的决定方法是:设数据总数目为n,50 ≤ n时,分为8 ~ 5组; 100 50≤

简单随机抽样的特点

1、简单随机抽样的特点:总体个数有限;逐个抽取;不放回;每个个体被抽到的机会相等 2、简单随机抽样的实施方法: (1)抽签法:总体容量和样本容量均较小,适合抽签法. (2)随机数法

第二节 (一)用样本的频率分布估计总体分布 1、画频率分布直方图——总体中的个体数取值较多: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。 第三步: 将数据分组 ( 给出组的界限) 第四步: 列频率分布表. (包括分组、频数、频率、频率/组距) 第五步: 画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.) 注意: 2、在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图. 当总体中的个体数很多时,作图时所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 3、茎叶图——总体中的个体数取值很少 优点:(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改. 缺点:不适合样本容量很大或茎、叶不分明的样本数据. (二)用样本的数字特征估计总体的数字特征 1、众数、中位数或平均数 2、标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围. 3、平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度 4、方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差 =第几组频数(1)第几组频率样本容量 4.18.20.5==极差组数=组距(2)纵坐标为: 频率组距

简单随机抽样(答案)

简单随机抽样 一、单选题 1. 抽样比的计算公式为( B )。 A. f= (n-1)/ (N-1) B. f=n/N C. f= (n-1)/N D. f= (N-n)/N 2. 不放回的简单随机抽样指的是哪种情形的随机抽样?(D ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 3. 放回的简答随机抽样指的是哪种情形的随机抽样?( A ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 4. 通常所讨论的简单随机抽样指的是( D )。 A. 放回的简单随机抽样 B. 放回无序随机抽样 C. 不放回有序随机抽样 D. 不放回的简单随机抽样 5. 下面给出的四个式子中,错误的是(D )。 A. ()E y Y = B.()E Ny Y = C.()E p P = D. ?()E R R = 6. 关于简单随机抽样的核心定理,下面表达式正确的是( A )。 A. 21()f V y S n -= B. 2 1()1f V y s n -=- C. 21()V y s n = D. 2 1()f V y s n -= 7. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A. 简单随机抽样的deff=1 B. 分层随机抽样的deff>1 C. 整群随机抽样的deff>1 D. 机械随机抽样的deff ≈1 8. 假设考虑了有效回答率之外所有其他因素的初始样本量为400,而设计有效回答率 为80%,那么样本量应定为( B )。 A. 320 B. 500 C. 400 D. 480 9. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。 A. 375 B. 540 C. 240 D. 360

抽样技术题目

一、 简单随机抽样 1、在简单随机抽样中,试证明比估计R y 是总体均值Y 的渐近无偏估计,并求其方差。 证明:X R Y = X x y X R Y y R = ==∧ ∧ () ?? ??? ????????????????? ????? ? ? ?-+???? ? ?-+???? ?? --=? ????? ? ????? ?????? ? ?-+=???? ??=2 2 11X X x o X X x X X x X y E X X X x X y E X X x y E y E R 由于0?→?-P X x 即0→-X X x 所以() () Y y E X y E X y E R ==??? ? ??= 得证。 ()() 2 22 2 ??? ? ??-=???? ??-=-=R x y E X X R X x y E y E y E y Var R R R () () ?????????? ???????????? ????? ? ? ?-+???? ? ?-+???? ? ?---=?????? ? ?????? ? ???? ??-+-=2 2 2111X X x o X X x X X x X x R y X X x X x R y E X 由于0?→?-P X x 即 0→-X X x 所以() ()() 2 22 2 1Z R S n f x R y Var x R y E X x R y E X y Var -=-=-=??? ? ??-= 其中:RX Y Z -=故() ()()( )[]() 2 222 1 2111X XY Y N i i i R S R RS S n f X R Y RX Y N n f y Var +--=-----=∑= 2、对于简单随机抽样,总体均值Y 的回归估计量定义为:()lr y y X x β=+-,如β为常数(记为0β),证明 201 22200(y )11(y )[()()]11(2) lr N lr i i i x xy E Y f V Y Y X X n N f S S S n βββ==-=-----=+-∑

1简单随机抽样、系统抽样、分层抽样含答案

2.1.1 简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样????? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k); (4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选 用分层抽样的方法. 一、选择题 1.抽签法中确保样本代表性的关键是( ) A .制签 B .搅拌均匀 C .逐一抽取 D .抽取不放回 答案 B 解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B . 2.下列抽样实验中,用抽签法方便的有( ) A .从某厂生产的3 000件产品中抽取600件进行质量检验 B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 D .从某厂生产的3 000件产品中抽取10件进行质量检验 答案 B

《抽样技术》第四版习题答案

第2章 解:这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。 这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。 解: 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布,的的置信区间为。 而中总体的方差是未知的,用样本方差来代替,置信区间为。 由题意知道,,而且样本量为,代入可以求得 。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。 下一步计算样本量。绝对误差限和相对误差限的关系为。 根据置信区间的求解方法可知 根据正态分布的分位数可以知道,所以。也就是。 把代入上式可得,。所以样本量至少为862。 解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为。

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。 解:利用得到的样本,计算得到样本均值为,从而估计小区的平均文化支出为144.5元。总体均值的的置信区间为,用来估计样本均值的方差。 计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。 总体总值估计值的方差为,总体总值的的置信区间为,把 代入,可得粮食总产量的的置信区间为。 解:首先计算简单随机抽样条件下所需要的样本量,把带入公式,最后可得。 如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为。 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。利用去年的化肥总产量,今年的化肥总产量的估计值为吨。 解:本题中,简单估计量的方差的估计值为=37.17。 利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。 文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。 现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。 接下来比较比估计和简单估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。 解:利用简单估计量可得,样本方差为,,样本均值的方差估计值为。 利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。 回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。 回归估计量的方差为,方差的估计值为,代入相应的数值,,显然有。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。 第3章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对

简单随机抽样系统抽样分层抽样含答案

简单随机抽样系统抽样分层抽样含答案 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

2.1.1 简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样??? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);

(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 一、选择题 1.抽签法中确保样本代表性的关键是( ) A.制签B.搅拌均匀C.逐一抽取D.抽取不放回 答案 B 解析由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B. 2.下列抽样实验中,用抽签法方便的有( ) A.从某厂生产的3 000件产品中抽取600件进行质量检验 B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 D.从某厂生产的3 000件产品中抽取10件进行质量检验 答案B 解析A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有

常见的随机抽样方法介绍

抽样方法介绍 朱一军 福建省产品质量检验研究院 、随机方法选择及随机数产生 按照GB/T 10111-2008《随机数的产生及其在产品质量抽 样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大 小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽 样、全数抽样五种方法 )。 随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。 (一)简单随机抽样 (抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总 体中逐个抽取; 优点:操作简便易行 缺点:总体过大不易实行 1.定义: 一般地,设一个总体含有N个个体,从中逐个不放回地抽取 n个个体作为样本(nW N ,如果每次抽取式总体内的各个个体被抽到的机会都相 等,就把这种抽样方法叫做简单随机抽样。 2.简单随机抽样方法 (1)抽签法 一般地,抽签法就是把总体中的N个个体编号,把号码写在 号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取 n次,就得到一个容量为n的样本。

抽签法简单易行,适用于总体中的个数不多时。当总体中 的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大) 2)随机数法 随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。 二)分层抽样 Stratified Random Sampling) 主要特征分层按比例抽 样,主要使用于总体中的个体有明显差异。共同点:每个个体被抽到的概率都相等N/M。 定义 般地,在抽样时,将总体分成互不交叉的层,然后按照 定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 stratified sampling )。 三)系统抽样 当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。 步骤: 般地,假设要从容量为N 的总体中抽取容量为n 的样本, 我们可以按下列步骤进行系统抽样: (1)先将总体的N个个体编号。 (2)确定分段间隔k,对编号 进行分段。当N/n (n是样本

常用的抽样方法总结

常用的抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点: 容易掩盖不可忽略的偏差。 滚雪球抽样(Snowball sampling)

相关文档
最新文档