人教版高中数学必修三 第二章 统计第三章简单随机抽样-知识点

合集下载

随机抽样(必修3)(三种抽样方法)

随机抽样(必修3)(三种抽样方法)

(3)在第1段用简单随机抽样确定第一个个体编 号m(m≤k)
(4)按照一定的规则抽取样本。通常是将m加上 间隔k得到第二个个体编号(m+k),再加k得 到第3个个体编号,依次进行下去,直到获得整 个样本。
思考:
当N/n不是整数时,如何进行 系统抽样?
当N/n不是整数时,令k=[N/n],那先从总 体中用简单随机抽样的方法剔除N-nk个个体, 再将其余的进行编号并均分成n段(可知每段 间隔数为K)。
1分层抽样
(1)定义一:一般地,在抽样时,将总体分成互不交叉 的层,然后按照一定的比例,从各层独立地抽取一定 数量的个体,将各层取出的个体合在一起作为样本, 这种抽样的方法叫分层抽样。
系统抽样(等距抽样)的概念 将总体分成均衡的几部分,然后按照预先定出的
规则,从每一个部分抽取一个个体,得到所需样本的 抽样方法叫做系统抽样。
系统抽样的特点
(1)适用于总体容量较大的情况;
(2)剔除多余个体及第一段抽样都用简单随机抽样, 因而与简单随机抽样有密切联系;
(3)是等可能抽样,每个个体被抽到的可能性都 是n/N;
(4)是不放回的抽样。
合理选择抽样方法
系统抽样 简单 抽签法 随机 抽样 随机数
表法
总体容量
很大
较小
样本容量 较大
较小
较大
较大
下页
练习:要从1002个学生中选 取一个容量为20的样本,试 用系统抽样的方法给出抽样 过程。
2.1.3分层抽样
情景设置
问题1 :要抽样了解某年参加高考学生的语文成绩,我 们可以有以下两种抽样的方式; (1)从所有考生中用简单随机抽样的方法抽取1000份试 卷做调查; (2) 分文科,理科,艺术,体育等科目类的学生适当比例 抽取样本容量为1000的的样本,再做调查.

简单随机抽样-高中数学知识点讲解

简单随机抽样-高中数学知识点讲解

简单随机抽样1.简单随机抽样【知识点的认识】1.定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.特点:(1)有限性:总体个体数有限;(2)逐个性:每次只抽取一个个体;(3)不放回:抽取样本不放回,样本无重复个体;(4)等概率:每个个体被抽到的机会相等.(如果从个体数为N 的总体中抽取一个容量为n 的样本,则每个个体푛被抽取的概率等于푁)3.适用范围:总体中个数较少.4.注意:随机抽样不是随意或随便抽取,随意或随便抽取都会带有主观或客观的影响因素.【常用方法】1.抽签法(抓阄法)一般地,从个体总数为N 的总体中抽取一个容量为k 的样本,步骤为:(1)编号:将总体中所有个体编号(号码可以为 1﹣N);(2)制签:将编号写在形状、大小相同的号签上(可用小球、卡片、纸条等制作);(3)搅匀:将号签放在同一个箱子中进行均匀搅拌;(4)抽签:每次从箱中取出 1 个号签,连续抽取k 次;(5)取样:从总体中取出与抽到号签编号一致的个体.2.随机数表法.○随机数表:由 0﹣9 十个数字所组成,其中的每个数都是用随机方法产生的,这样的表称为随机数表.实现步骤:(1)编号:对总体中所有个体编号(每个号码位数一致);(2)选数:在随机数表中任选一个数作为开始;(3)取数:从选定的起始数沿任意方向取数(不在号码范围内的数、重复出现的数不取),直到取满为止;(4)取样:根据所得的号码从总体中抽取相应个体.【命题方向】以基本题(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考查学生学习基础知识、应用基础知识、解决实际问题的能力.(1)考查简单随机抽样的特点例:用简单随机抽样的方法从含有 100 个个体的总体中依次抽取一个容量为 5 的样本,则个体m 被抽到的概率为()1111A.100B.20C.99D.50分析:依据简单随机抽样方式,总体中的每个个体被抽到的概率都是一样的,再结合容量为 5,可以看成是抽 5 次,从而可求得概率.1解答:一个总体含有 100 个个体,某个个体被抽到的概率为,100∴以简单随机抽样方式从该总体中抽取一个容量为 5 的样本,1则指定的某个个体被抽到的概率为100× 5 =1.20故选:B.点评:不论用哪种抽样方法,不论是“逐个地抽取”,还是“一次性地抽取”,总体中的每个个体被抽到的概率都是一样的,体现了抽样方法具有客观公平性.(2)判断抽样方法是否为简单随机抽样常见与分层抽样、系统抽样对比,注意掌握各种抽样方法的区分.例:下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每 100 万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 2709 的2/ 4B.某车间包装一种产品,在自动包装的传送带上,每隔 30 分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取 2 人、14 人、4 人了解学校机构改革的意见D.用抽签法从 10 件产品中选取 3 件进行质量检验.分析:从所给的四个选项里观察因为抽取的个体间的间隔是固定的;得到A、B 不是简单随机抽样,因为总体的个体有明显的层次,C 不是简单随机抽样,D 是简单随机抽样.解答:A、B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体的个体有明显的层次;D 是简单随机抽样.故选D.点评:本题考查简单随机抽样,考查分层抽样,考查系统抽样,是一个涉及到所学的所有抽样的问题,注意发现各种抽样的特点,分析清楚抽样的区别.(3)考查简单随机抽样的抽样方法操作例:利用随机数表法对一个容量为 500 编号为 000,001,002,…,499 的产品进行抽样检验,抽取一个容量为 10 的样本,若选定从第 12 行第 5 列的数开始向右读数,(下面摘取了随机数表中的第 11 行至第 15 行),根据下图,读出的第 3 个数是()A.841B.114C.014D.146分析:从随机数表 12 行第 5 列数开始向右读,最先读到的 1 个的编号是 389,再向右三位数一读,将符合条件的选出,不符合的舍去,继续向右读取即可.解答:最先读到的 1 个的编号是 389,向右读下一个数是 775,775 它大于 499,故舍去,再下一个数是 841,舍去,再下一个数是 607,舍去,再下一个数是 449,再下一个数是 983.舍去,再下一个数是 114.读出的第 3 个数是 114.故选B.点评:本题主要考查了抽样方法,随机数表的使用,在随机数表中每个数出现在每个位置的概率是一样的,所以每个数被抽到的概率是一样的,属于基础题.。

高中数学高考统计知识点总结

高中数学高考统计知识点总结

第二章:统计 1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本, 每个个体被抽到的机会(概率)均为Nn。

2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。

⑵茎叶图:①茎叶图适用于数据较少的情况, 从中便于看出数据的分布, 以及中位数、众位数等。

②个位数为叶, 十位数为茎, 右侧数据按照从小到大书写, 相同的数据重复写。

3、总体特征数的估计:⑴平均数:nx x x x x n++++=Λ321; 取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ, 则其平均数为n n p x p x p x +++Λ2211; 注意:频率分布表计算平均数要取组中值。

⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小, 说明样本数据越稳定。

平均数反映数据总体水平;方差与标准差反映数据的稳定水平。

⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图, 判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i ni i x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点),(y x 。

第三章:概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果, 用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点: ①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。

新课标高中数学必修3第二章知识点总结

新课标高中数学必修3第二章知识点总结

第二章 统计1.简单随机抽样:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N ≤,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

2.简单随机抽样的特点:①被抽取样本的总体个数较少;②从总体中逐个地抽取;③不放回抽取;④每一次抽取时,总体中各个个体被抽到的可能性相同,在整个抽样过程中各个个体被抽到的机会也都相等(即等可能性)。

从而保证了抽样方法的公平性。

3.两种简单随机抽样方法:①抽签法(抓阄法);②随机数法4.随机数法步骤:①编号;②随机确定开始数字;③从选定的数开始读数;④根据号码得到样本。

5.系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。

6分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。

7.三种抽样方法的比较:1.两种估计方式:①用样本的频率分布估计总体的分布;②用样本的数字特征估计总体的数字特征。

2.分析数据的两种基本方法:①作图②画表格3.频率分布直方图:在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示。

各小长方形的面积的总和等于1【=⨯=频率小长方形的面积组距频率组距】。

4.茎叶图:当样本数据较少时,用茎叶图表示数据的效果较好。

它不但可以保留原始数据,而且能够展示数据的分布情况,给数据的记录和表示都带来了方便。

5.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。

7.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。

6.平均数:如果有n 个数12,,,n x x x ,那么12,,,nx x x x n=叫做这n 个数的平均数。

人教版高二数学必修3统计知识点:简单随机抽样

人教版高二数学必修3统计知识点:简单随机抽样

人教版高二数学必修 3 统计知识点:简单随机抽样数学,是研究数目、构造、变化、空间以及信息等观点的一门学科,查词典数学网为大家介绍了人教版高二数学必修 3 统计知识点,请大家认真阅读,希望你喜爱。

1:简单随机抽样(1)整体和样本①在统计学中 , 把研究对象的全体叫做整体 .②把每个研究对象叫做个体 .③把整体中个体的总数叫做整体容量 .④为了研究整体的相关性质,一般从整体中随机抽取一部分: x1,x2 , ....,xx 研究,我们称它为样本.此中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。

就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。

特色是:每个样本单位被抽中的可能性同样 (概率相等 ),样本的每个单位完整独立,相互间无必定的关系性和排挤性。

简单随机抽样是其余各样抽样形式的基础。

往常不过在整体单位之间差别程度较小和数目较少时,才采纳这类方法。

(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①整体变异状况 ;②同意偏差范围;③概率保证程度。

(4)抽签法 :①给检核对象集体中的每一个对象编号;②准备抽签的工具,实行抽签 ;③对样本中的每一个个体进行丈量或检查唐宋或更早以前,针对“经学”“律学”“算学”和“书学”各科目,其相应教授者称为“博士”,这与现在“博士”含义已经相去甚远。

而对那些特别解说“武事”或解说“经籍”者,又称“讲课老师”。

“教授”和“助教”均原为学官称呼。

前者始于宋,乃“宗学”“律学”“医学”“武学”等科目的解说者;尔后者则于西晋武帝时代即已建立了,主要辅助国子、博士培育生徒。

“助教”在古代不单要作入流的学识,其教书育人的职责也十分清晰。

唐朝国子学、太学等所设之“助教”一席,也是当朝打眼的学官。

至明清两代,只设国子监(国子学)一科的“助教”,其身价不谓显赫,也称得上朝廷要员。

(完整版)人教版高中数学必修3各章知识点总结,推荐文档

(完整版)人教版高中数学必修3各章知识点总结,推荐文档

高中数学必修3知识点第一章算法初步i.i.i 算法的概念算法的特点:(i)有限性:一个算法的步骤序列是有限的,必须在有限操作之后停止,不能是无限的^(2)确定性:算法中的每一步应该是确定的并且能有效地执行且得到确定的结果,而不应当是模棱两可.(3)顺序性与正确性:算法从初始步骤开始,分为若干明确的步骤,每一个步骤只能有一个确定的后继步骤,前一步是后一步的前提,只有执行完前一步才能进行下一步,并且每一步都准确无误,才能完成问题^(4)不唯一性:求解某一个问题的解法不一定是唯一的,对于一个问题可以有不同的算法^(5)普遍性:很多具体的问题,都可以设计合理的算法去解决,如心算、计算器计算都要经过有限、事先设计好的步骤加以解决.1.1.2 程序框图1、程序框图基本概念:(一)程序构图的概念:程序框图又称流程图,是一种用规定的图形、指向线及文字说明来准确、直观地表示算法的图形。

一个程序框图包括以下几部分:表示相应操作的程序框;带箭头的流程线;程序框外必要文字说明。

(二)构成程序框的图形符号及其作用学习这部分知识的时候,要掌握各个图形的形状、作用及使用规则,画程序框图的规则如下:1、使用标准的图形符号。

2、框图一般按从上到下、从左到右的方向画。

3、除判断框外,大多数流程图符号只有一个进入点和一个退出点。

判断框具有超过一个退出点的唯一符号。

4、判断框分两大类,一类判断框“是”与“否”两分支的判断,而且有且仅有两个结果;另一类是多分支判断,有几种不同的结果。

5、在图形符号内描述的语言要非常简练清楚。

(三)、算法的三种基本逻辑结构:顺序结构、条件结构、循环结构。

1、顺序结构:顺序结构是最简单的算法结构,语句与语句之间,框与框之间是按从上到下的顺序进行的,它是由若1个依次执行的处理步骤组成的,它是任何一个算法都离不开的一种基本算法结构。

顺序结构在程序框图中的体现就是用流程线将程序框自上而下地连接起来,按顺序执行算法步骤。

人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测

人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测

人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。

高中数学必修3第二章知识点总结及练习

高中数学必修3第二章知识点总结及练习

高中数学必修3知识点总结第二章统计2.1.1简单随机抽样1.总体和样本:在统计学中, 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

2.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究*******************************************************************************变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。

如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 简单随机抽样第一节 简单随机抽样概述一、简单随机抽样的概念简单随机抽样也叫作纯随机抽样。

其概念可有两种等价的定义方法:定义之一:简单随机抽样就是从总体N 个抽样单元中,一次抽取n 个单元时,使全部可能的)(Nn A 种不同的样本被抽到的概率均相等,即都等于1/A 。

按简单随机抽样,抽到的样本称为简单随机样本。

按上述定义,在抽取简单随机样本之前,应将所有可能的互不相同的样本一一列举出来。

但当N 与n 都比较大时,要列出全部可能的样本是不现实的。

因此,按上述定义进行抽样是不太方便的。

定义之二:简单随机抽样是从总体的N 个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n 次,以抽中的n 个单元组成简单随机样本。

由于定义二无需列举全部可能的样本,故比较便于组织实施。

但按这个定义进行抽样时,仍然需要掌握一个可以赖以实施抽样的抽样框。

二、简单随机抽样的具体实施方法常用的有抽签法和随机数法两种。

(一)抽签法抽签法是先对总体N 个抽样单元分别编上1到N 的号码,再制作与之相对应的N 个号签并充分摇匀后,从中随机地抽取n 个号签(可以是一次抽取n 个号签,也可以一次抽一个号签,连续抽n 次),与抽中号签号码相同的n 个单元即为抽中的单元,由其组成简单随机样本。

抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到等概率。

因此,实际工作中常常使用随机数法。

(二)随机数法随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。

由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。

因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n 比较大时。

1、随机数表及其使用方法随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。

所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。

在编制时,使用一种特制的电器或用计算机,将0至9的10个数字随机地自动摇出,每个摇出的数字就是一个随机数字。

为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。

根据不同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。

目前,世界上已编有许多种随机数表。

其中较大的有兰德公司编制,1955年出版的100万数字随机数表,它按五位一组排列,共有20万组;肯德尔和史密斯编制,1938年出版的10万数字随机数表,它也按五位一组排列,共有25000组。

我国常用的是中国科学院数学研究所概率统计室编印的《常用数理统计表》中的随机数表。

随机数表的用途很多,不仅可以组织等概样本,也可组织不等概样本。

简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。

②设总体容量为N,若N的位数为r,则一定要从r位数中抽取。

遇到1至N的数可直接使用;遇到其它的数不能直接使用。

③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。

可从起点开始向下抽取,也可向右抽取。

但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,中途不能变更。

④在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。

随机数表法一般分下述几步:第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字(或距落点最近的数字)为奇数,则确定起点在第1页;否则,起点在第二页。

第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点的行数。

由于每页只有50行,所以当落点处的两位数大于50时,则取其减去50的差数为行数。

为保证等概性,当落点处的数为“00”时,则行数应取作50。

然后依同样的方法再确定起点的列数。

第三步:确定所抽样本单元的号码。

从上述确定的起点开始向下(或向右),每次取一个r位数。

通常,若所需抽的数是一位数或两位数(即r=1或2),则由起点开始,依次向右抽取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移10位(或r位),再从第一行开始向下继续抽取,直到取足所需的n个r位数为止,以这n个r位数所对应的总体单元组成样本。

然而,按上述步骤抽样,由于每个总体单元只对应一个数字,因此,所读取随机数的放弃比例可能很高,这在大样本时将使抽样过程变得很费事。

为避免这种现象,可以在不违反等概率原则的条件下令每个总体单元同时对应多个数字,以加快抽样的速度。

一般说来,当N为一个r位数字时,要取一个从一到N间的随机数字,可以随机取1至N'的一个数字,其中N'为N的最大r倍的整倍数。

如果N'为kN,总体内每一单元便配上1到N'的k个数,符合随机数字的单元算是中选,此时放弃的随机数字比例便是(10r-N')/10r。

这时的N'也不一定要取r位,如果能取r'位(r'>r),而使N的r'位整位数与N'相差极小即可。

快速抽取的常用方法有:余数法。

如果N是个r位数,由1到N'随机取一个数R,而N'是N的最大r位整倍数,则编号等于R除N所得余数的单元便被选中。

商数法。

如果N是个r位数,由0到N'-1随机取出一个数R而使N'是N的最大整倍数,只要R除k的商是(i-1),则第i个单元便被选中。

其中k=N'/N。

由于k远比N小,所以此法的计算过程较余数法简便。

修正余数法。

如果总体内单元个数N是个r位数,且N'是个不小于N而适于用作除数的较大r位数,而N''为N'的最大r位整倍数,则如果R是用r位随机数字取得的数字,待选单元的号码便会是R除N'的余数,其中只要R不大于N''而余数不是0也不大于N就可以。

在其他情形时,被抽中数字必须放弃而重复进行。

如果N'=N,本法便简化成余数法;如果这时的余数是0,等选单元的号码便选N。

这时的放弃比例是[(N'-N)/10r](N''/N')。

此外也可以用修正商数法或独立选择数位法等以加速抽样。

2、随机数骰子及其使用方法随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上刻有0-9的数字各2个。

每盒骰子由盒体、盒盖、泡沫塑料垫及若干个(通常是3-6个)不同颜色的骰子组成。

使用随机数骰子时可以像普通骰子那样用投掷的方法。

但正规的方法是将一个或n个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打开盒子,读出骰子表示的数字。

一个骰子一次产生一个0-9的随机数。

要产生一个m位数字的随机数,就需要同时使用m个骰子(事先规定好每种颜色所代表的位数,例如红色表示百位数,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用m次(规定第一次产生的数字为最高位数,最后一次产生的数字为最末位即个位数字等)。

特别规定m个骰子的数字(或一个骰子m次产生的数字)都为0时,表示10m。

当使用随机数骰子进行抽样时,特别是如何根据摇随机数骰子方法获得的随机数R0来读取所要求的随机数R有多种方法。

下面是我国国家标准GB10111《利用随机数骰子进行随机抽样的方法》中规定的适用于简单随机抽样的读取随机数的方法。

方法之一:若骰子表示的R0≤N,则取R=R0;若R0>N,则舍弃不用,另行重摇。

重复上述过程,直到取得n个不同的随机数为止。

方法之二:如果骰子表示的R0≤N,则取R=R0;如果R0>N,设R0=K1N+R1(0≤R1<N),当(K1+1)N>10m时,舍弃,重摇。

而当(K1+1)N≤10m时,取R=R1,或R=N(若R1=0)。

重复上述过程,直到获得n个不同的随机数为止。

方法之三:若骰子表示的随机数R0≤N,则取R R0;若R0>N则取一个大于N的适当整数M(一般为方便起见取M=2×10m-1,2.5×10m-1,3×10m-1或5×10m-1等),设R0=K2M+R2(K2为整数,0≤R2<N),则当(K2+1)M>10m时,舍弃,重摇;当(K2+1)M≤10m时,取R=R2或R=N(若R2=0)。

重复上述过程,直到获得n个不同的随机数为止。

例:N=4562,m=4,取M=5000若R0=3150,取R=R0若R0=6897=1×5000+1897, K2=1,( K2+1)M=104则:R2=1897,故取R=R2=1897方法三和方法二都是为提高效率,减少舍弃重摇次数所采取的措施,尤其是方法三在适当选用M时,既方便又快速。

也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽样效果。

表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机抽样。

以下是两个有名的试验:试验一:随意数试验。

让六个人写下100个自己随意想到的三位数,将这些数内的0、1、2、…、9数字列成次数分布表如下(表3.1):表3.1 六个人的0、1、2、…9的次数分布可以看出,六个人都对数字存在偏好,如第一个人更加偏好数字4、3、0;第二个人则偏好数字1、8、4;等等。

这种由于数字偏好所引起的偏估类型可称之为数字偏误。

试验二:着色试验。

让四个人将10×10方格的纸板着色,可供选择的颜色有蓝、绿、红、白和黄色五种,对每一个四分象限来说,规定每种颜色只能在每行和每列出现一次。

每个方格以其所在的列号与行号表示,如(4,6)代表第四列第六行的方格。

请四个人对这100个方格随意选择行列号,而对其着色。

将这些由这四个人着色所得到的资料形成次数分布表如下(表3.2):表3.2 四个人对方格着色的次数分布可见四个人都对颜色存在偏好,如第一个人偏爱绿色,第二个人偏爱蓝色等。

这种由于对颜色偏好所引起的偏估类型,可称之为颜色偏误。

从上述两个试验可以发现,利用人为的随意抽样方法都会产生偏差。

每个试验者均有较为喜欢的数字和颜色,因此,使得样本变成非随机的,进而给抽样估计带来困难。

三、简单随机抽样的方法评估简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估计效率的标准,同时,从理论上讲简单随机抽样在各种抽样技术中是贯彻随机原则最好的一种,并且数学性质很简单,是等概率抽样的特殊类型。

另一方面,因为是等概率抽取样本,所以要求总体在所研究的主要标志上同质性或齐性(共性)较好,也即总体要比较均匀;要求样本容量要比较大,以保证样本对总体具有充分的代表性。

相关文档
最新文档