第五章抽样

第五章抽样
第五章抽样

第五章抽样

通过本章的学习主要了解抽样的概念、程序,抽样方法的特点及运用、范围等基本知识。抽样在社会生活中各个方面都能体现出来,在市场调查、民意测验以至于工业产品检测或者其他的生物医疗实验等都能运用抽样。

第一节抽样的概念与程序

一、为什么要抽样

在宏观的社会研究中为什么实行抽样方法?(简答题)

在社会研究中研究者经常从一个规模很大的研究对象中选出一部分作为研究对象,这个选取过程就是抽样。之所以进行抽样主要是考虑研究成本和研究的可行性。首先,在社会研究中经费是一项硬约束;其次,对于一些太大的总体逐个进行问卷调查也不现实,而借助于抽样,则能够克服以上困难。

根据抽样理论,无论社会研究涉及到的抽样对象有多大规模,只要抽样是按随机原则进行的,则被抽取的少数对象的情况就可以相对精确的代表全体对象的情况。

抽样方法大体可以分为两类:一种是非概率抽样,主要是依据研究者的主观意愿、判断或是否方便等因素来选取对象;另一种是概率抽样,主要是按照随机的原则来选取对象,完全不带有研究者的主观因素。

简述概率抽样与非概率抽样的区别(简答题)

两种方法最大的差别是,在概率抽样中,能够比较精确地估算出抽样误差,这样根据被抽出的少数对象的情况,便可以对全体对象的情况进行推论;而在非概率抽样中,则无法估算抽样误差,因为非概率抽样的代表性只有将抽出的少数对象的情况与全体对象的情况比较后才能得知,所以非概率抽样是无法对全体对象进行推论的。

二、抽样的有关术语

1.总体、样本和元素

抽样是指从总体中按一定方式选取一组元素的过程,由此产生的元素集合称为样本。在抽样的专业化表述中,每个具体的调查对象被称为元素,全体研究对象被称为总体,样本则代表一组元素,即一部分研究对象,它可以是人、学校、组织,也可以是文章、杂志,甚至是歌曲。

总体还可以进一步划分为研究总体和目标总体,其中研究总体是在理论上明确界定的元素的集合体。目标总体有时也称为调查总体,是实际抽取样本的元素集合体,它是排除了研究总体中的一些特例后的总体。

样本中元素个数与总体中元素个数的比率,即样本规模与总体规模的比率称为抽样比率。例如,在一个5万人的总体中,研究者想要抽取150人,这时抽样比率就是150/50000=0.003或0.3%;如果总体为500人,而研究者要抽取100人,则抽样比率就是100/500=0.20或20%。

2.抽样框和抽样单元

研究者在实际抽样时,经常是先找到一份近似涵盖所有总体元素的名单,然后从中抽取部分元素,这份名单被称为抽样框。例如,要调查某大学本科毕业生的就业情况,则抽样框就是该大学全体毕业生的花名册。

美国一份叫《文学摘要》的新闻杂志,在1920年、1924年、1928年和1932年,以邮寄名信片的方式对总统大选进行了民意测验,并准确地预测出这4次选举的结果。当1936年总统大选来临时,杂志仍以同样的方式进行了民意测验,并从寄出的1000万份名信片中,回收了200多万份。测验结果显示,57%的人支持共和党候选人兰登。民主党候选人、在任的总统罗斯福的支持率为43%。然而,两个星期后的选举结果,使杂志的编辑们大跌眼镜,罗斯福以62%的得票率,获得第二届任期。

杂志民意测验失败的原因是什么呢?客观地讲,造成预测错误原因不止一个,但最重要的是抽样框设计中的错误。虽然杂志抽取了数量相当多的选民,但他们的地址与姓名大都取自电话簿与汽车俱乐部会员名单。而1936年美国还处在30年代经济大萧条后期,许多美国人都没有电话和汽车。也就是说,杂志选定的抽样框排除了低收入选民,而这些穷人都支持罗斯福的新政。由此可见,一旦抽样框出现了偏差,无论多大的样本规模,也无法减小抽样误差。

抽样框中的总体元素又被称为抽样单元,有时抽样单元与分析单位是相同的。例如,在某县进行农户生活水平抽样调查,可以先抽取若干个乡组成乡样本,然后从乡样本中,抽取若干个村组成村样本,最后从村样本中抽取若干个农户。这时,抽样单元分别是乡、村和农户三种,分别称为初级抽样单元、次级抽样单元和终极抽样单元。在一次抽样中,抽样框的数目与抽样单元的层次是相对应的,即与乡、村和农户相对应,有三个抽样框:全县所有乡的名单、乡样本中的所有村的名单、村样本中所有农户的名单。

3.参数值、统计值和抽样误差

一般说来,总体的情况或特征是未知的,由参数值来描述;而样本的情况或特征则是已知的,由统计值来描述,参数值与统计值之间的差异就是抽样误差。差异越大,抽样误差就越大,差异越小,抽样误差意味着就越小。

由此可见,抽样误差是衡量样本代表性大小的标准,一般说来,它主要取决于总体的异质性程度和样本规模。一方面,如果样本规模相同,总体异质性程度越高,抽样误差越大,样本代表性越低;反之,总体异质性程度越低,抽样误差也越小,样本代表性也就越高。另一方面,如果总体的异质性程度相同,样本规模越大,抽样误差越小,样本代表性越高;反之,样本规模越小,抽样误差越大,代表性越低。

三、抽样的步骤(简答题)

抽样作为一门严谨、精确的技术,有一套完整的操作程序。它有三个步骤:设计抽样方案、抽取样本和评估样本。

1.设计抽样方案

设计抽样方案包括以下几点内容:首先,要界定总体。其次,介绍抽样框的具体内容。再次,要确定样本所含个体数目。最后,要根据不同的目标总体,选择合适的抽样方法。

2.抽取样本

抽取样本是指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。

3.评估样本

评估样本是指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总体推断的失败。

举例说明如何进行样本评估?

评估样本的方法是先找到一些能够反映总体特征的资料,通常是一些统计数据,与同类指标的样本统计值进行比较。若二者之间差别不大,则可以认定样本的质量较高,反之,若二者差异明显,则样本质量存在问题,需要对其进行修正。一般来说,评估所依据总体统计数据越多,则评估效果越好。

第二节非概率抽样

试述常见的四种非概率抽样方法(论述题)

进行概率抽样的前提是有抽样框,但这个条件有时无法满足,在这种情况下,经常会采用非概率抽样,即放弃随机原则,依据研究者的主观意愿、判断是否方便等因素来抽取样本。

非概率抽样的优缺点是什么?

优点:非概率抽样的成本比较低,操作也比较方便。

缺点:无法预先估计抽样误差,因此,很难对总体情况做出可靠的推断。

一、方便抽样

方便抽样又称偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。

电视台、电台和报纸记者的“街头拦人”调查,采用的就是方便抽样。表面上看,“街头拦人”这种碰到谁就选谁的抽样方法,貌似简单随机抽样,其实这种看法并不正确。方便抽样并没有通过随机过程,使总体中的每一个元素有相等的被抽中概率。那些最先被碰到的、最容易见到的、最方便找到的对象,具有比其他对象大得多的机会被抽中。与“正常”的研究对象相比,那些衣着破烂、年纪太老、不擅言辞的研究对象,很少有机会进入电视镜头。

另一个方便样本的例子是报社要求读者剪下报纸刊登的问卷,填完后寄回去。这里系统偏差是显然

的,因为并不是每个人都看报纸,也不是每个人都对问卷的主题感兴趣,还有人懒得花时间把问卷剪下来,填答后寄回去。当然报社可能有奖励,填答后寄回问卷的人数目也可能很多,但这种方便样本可能仅具有娱乐价值,它可能得到的是扭曲的观点,无法对读者总体做出正确推论。

二、配额抽样

配额抽样首先要根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。例如,研究者想要用配额抽样方法,抽取一个40人规模的样本。他首先决定用性别和年龄作为决定样本配额的参数值,通过查阅相关资料,了解到总体中男女各占50%,30岁以下、30~60岁之间和60岁以上的比例分别为:25%、50%、和25%。

配额抽样的逻辑是通过样本配额,使样本结构尽可能与总体结构保持一致,对总体进行“克隆”。配额抽样有以下两个先天的不足:

首先,为了不偏离总体,配额构成矩阵中的数字必须十分准确,要做到这一点,就必须掌握总体的最新资料,但这不容易做到。对此抽样史上有个很好的例证,盖洛普采用配额抽样,在1936年、1940年和1944年,成功地预测了美国总统选举结果,但在1948年,他没能正确地预测出杜鲁门当选总统。造成预测失败的一个主要原因是,样本配额没能正确地代表所有地理区域和所有实际去投票的选民。

其次,尽管配额方法是一种改进,但最后抽样仍由调查员根据方便原则执行,他们从某些特定的矩阵格子中选择样本时,有很大的随意性。例如,调查员很可能会访问最先遇到的5位30岁以下的男性,而这5人可能恰好是刚从同一公司下班走出来。有些人还可能想被调查而主动去找调查员,因而也干扰了调查员在选择被调查者时的客观性。这些情况都会降低样本的代表性。正是由于最后采用了方便抽样,使配额抽样与分层抽样具有本质的区别,后者依据随机原则抽样,排除了主观因素,被抽中的研究对象即使是身居高楼、家养恶犬的人,调查员也不能图方便而不去拜访。

三、判断抽样

判断抽样又称立意抽样,是指研究者根据其研究的目的或专家的判断来选取样本。这种抽样很大程度上依赖于研究者的主观判断,因此,对研究者个人的研究素质有较高的要求。判断抽样经常被用于以下三种研究场景:

首先,研究者用判断抽样来选择特别能够提供信息的独特个案。

其次,研究者用判断抽样来选取很难以接近的特殊人群。

最后,研究者用判断抽样来选取某种特殊个案类型以便进行深入研究。如选择一些收入高于人均收入的农民,作为研究对象,深入分析他们致富的途径。

四、雪球抽样

雪球抽样也称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累计抽样方法。

为什么雪球抽样适合对具有一定网络联系的总体进行抽样?(简答题)

雪球抽样特别适合用来对成员难以找到的总体进行抽样,如散工、吸毒者、无家可归的流浪者。也可用雪球抽样对具有一定网络联系的总体进行抽样。雪球滚到了大于所需样本规模的这种人群,就可以终止雪球的滚动。

第三节概率抽样

概率抽样是按照随机原则进行的抽样,因此又被称为随机抽样。

试述概率抽样常用的四种方法(论述题)

一、简单随机抽样

简单随机抽样也称纯随机抽样,是指研究者严格按照随机原则来抽取样本。

如何理解随机原则?(简答题)

“随机原则”在数学上是有特定含义的,它意味着在选取对象的过程中,一方面要排除任何事先设定的模式,使每个对象被选中的概率都相等,即要满足等概率要求;另一方面,对象之间相互独立,任何一个对象是否入选样本,与其他对象无关,即要满足独立性要求。

所谓概率抽样是指总体中每个元素都有一定的非零概率被抽中,每个元素被抽中的概率可以相等,也可以不相等,相等称为等概率抽样,不相等称为不等概率抽样。不难看出,随机抽样是一种等概率抽样。

如从某市1300万人口中抽取几个人,在抽取下一个人之前,将上一个放回或不放回总体中,基本不改变其他人被抽中的概率。

当总体数目N不大时,可以用抽签法简单随机抽样。

如果总体数目N很大,可以用随机数法进行简单随机抽样。这种方法的关键是产生随机数,可以用多种工具产生出随机数,最经常用的工具是随机数表,它是由范围在00001~99999内的5位随机数组,按行和列排序构成的。最后产生出来的随机数,决定哪些元素应该被选入样本。

用随机数表产生随机数,需要完成以下几个步骤:

第一,确定选出的随机数的位数。

第二,决定从5位数组中选择哪几位数字。

第三,确定表中选择数字的顺序。

第四,确定开始选择的5位数组起点

第五,处理大于总体规模或重复的随机数。

二、系统抽样

系统抽样又称机械抽样,抽样效果与简单随机抽样相同,但操作起来容易得多。系统抽样的样本元素是按某种确定的规则从总体中抽取的,由于等间距抽取是最常用的规则,故系统抽样经常被称为等距抽样。

系统抽样需要完成三个步骤:

首先,确定开始抽取人选的位置。

其次,计算抽取间距。抽样间距(k)是由总体规模(N)与样本规模(n)之比决定的:

也就是说,抽样间距为6。

最后,确定抽取元素的方法。

三、分层抽样

分层抽样是指研究者先把总体分成若干个同质的层(次级总体),然后用简单随机或系统抽样方法,从每层中抽取样本元素。

与简单随机或系统抽样相比,分层抽样能减少抽样误差,提高样本的代表性。

实际进行分层抽样,需要解决的几个问题?(简答题)

第一,怎样进行分层,或者说根据什么原则确定分层变量。

第二,怎样确定样本比例。在大多数情况下,分层抽样采用等比例方式进行,即要求从各层抽取元素的数量在样本中的比例,与该层在总体中的比例相等。例如,某大学有6748名学生,其中男生3534名,女生3214名,分别占总体的52.4%和47.6%。如果按比例进行分层抽样,抽取一个100人的样本,则样本中男生应为52人,女生应为48人。

第三,确定实际分层抽取样本的方法。在分层抽样中,有两种常见的样本抽取方法:

一种方法是先将所有总体元素按分层变量进行分层,并计算各层在总体中的比例,即比例分层抽样。

试述确定实际分层抽取样本的方法?(简答题)

例如,计划从1000名大学教师中,用分层抽样的方法,抽取一个100名教师的样本,将职称设为分层变量,抽样结果如表所示。

大学教师分层抽样

另一种方法适用于等比例分层抽样,即分层等距抽样。先将所有总体元素按分层变量进行分层,然后将各层的总体元素一层一层地连续排列,最后对连续排列的总体元素进行等距抽样。

四、多段整群抽样

“多段”指的是按总体内的层级关系,抽样分成几个阶段来进行。例如,在一个100万人的城市中抽取2000人进行调查,抽样比例为2%。该城市中的100万户居民分属于1000个居委会。采用多段整群抽样的方法是先从1000个居委会中随机抽取一定比例(如10%)的居委会,然后在下个阶段中再从所抽到的居委会中随机抽取一定的比例(如20%)的居民。这种以群为抽样单元的抽样方法就是整群抽样。

例如:想在某集团军中调查战士的思想情况,假定该军有30000人,抽取1500名战士做调查,可以将连队作为抽样的单位,假定该军有200个连队,每一连有150人,那么从200个连队中随机抽取10个连队,对抽到的连队的所有战士进行调查,可以了解到1500名战士的情况。

一段整群抽样,是直接用被抽中的居委会中的所有居民构成的样本,不再进一步抽样;多段整群抽样则需要在被抽中的群中,进一步抽取样群或元素。整群抽样中的群可以是班级、学校、工厂、公司、街道、居委会和城市等,对群的抽样可采用简单随机、系统或分层抽样方法进行。

实际进行多段整群抽样,需要解决哪些问题?(简答题)

首先,要决定是多抽群,还是多抽群中的元素。假设该城市100万居民,分布在1000个居委会中,样本规模是2000户居民。最极端的考虑是抽一个居委会,从中选2000户居民;或抽1000个居委会,每个居委会抽2个居民。前者省时、省力、省钱,但样本偏离的可能性大。

当样本规模给定后,抽取的群的数量增加了,每个群中被抽取的元素的数量就一定会减少。由此来说,增加群的抽样代表性必然要牺牲元素的抽样代表性,反过来也一样。

其次,处理群大小不等的情况。假设决定从1000个居委会中抽取200个居委会,并从这200个居委会中各抽取10户居民,从而满足2000户样本规模的设计要求。这里需要注意的是,居委会的大小不等,所以样本代表的规模也是不一样的。

第四节样本规模

一、影响样本规模的因素

试述影响样本规模的因素(论述或简答题)

如果先不考虑经费问题,那么样本规模主要取决于抽样精度和总体标准差。一般说来,抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。

(一)抽样精度是指抽样中希望达到的精确度,其实就是能够容忍的抽样误差

在一定精确度要求下,总体越大,则样本也要越大。

(二)对于较大的总体,在确定精度的条件下,总体规模与样本规模之间应该是一种非线性关系,即样本并不按照比例地随着总体增大而增大。

(三)总体标准差是反映总体元素之间异质性程度的指标;一般说来,在给定抽样精度后,总体异质性程度越小,所需样本规模也越小;反之亦然。

二、样本规模的估算方法

在简单随机抽样中,推论总体平均数的样本规模计算公式为:

其中t为置信度所对应的临界值,p 为总体的成数或百分比,

为抽样误差。

假设某市场调查公司接受委托,调查该市居民5年内购买私人轿车的意向。从成本考虑,公司首先要与客户商谈样本规模。客户要求要有95%的把握肯定调查结果是可靠的,同时抽样误差不能超过

3%。由于没有居民总体的构成资料,公司为慎重起见,将成数p定为50%(因为p(1-p)在p=1/2时达到最大值)

以上条件表明,此次抽样的置信度为95%,查正态分布可知t值为 1.96;抽样误差

为0.03。将数据带入样本规模计算公式,可得到:

调查中发现,12%的居民有购买私人轿车的意向,于是公司告知客户,他们有95%的把握确定,该市有9%~ 15%的居民在5年内有购车的打算。

假设该案例中,客户提出的误差要求为2%,其他条件不变。那么调查公司就必须将样本规模从1067人增加到2401人,才能维持以上结论不变。其实,

3%是个普遍被接受的误差范围,因此,在普通调查中,样本规模在1000人左右,就能够满足要求了。

本章作业:

名词解释

1.抽样(87页)

2.非概率抽样(91页)

3.概率抽样(95页)

简答题

1.在社会研究中为什么要实行抽样方法?(86页)

2.简述抽样的步骤?(90页)

3.非概率抽样的优点和不足之处是什么?(91页)

4.试述确定实际分层抽取样本的方法?(101页)

论述题

1.试述影响样本规模的因素?(105页)

第五章抽样练习+答案

第五章抽样 一、单项选择题。 1.电视台、电台和报纸记者的“街头拦人”调查,采用的就是()。 A.偶遇抽样 B.机械抽样 C.配额抽样 D.聚类抽样 2.我们日常生活中经常使用的抓阄、抽签等方法是属于()。 A.等距抽样 B.分层抽样 C.简单随机抽样 D.聚类抽样 3.机械抽样指的是()。 A.立意抽样 B.系统抽样 C.定额抽样 D.方便抽样 二、多项选择题。 1.以下抽样方法中,属于概率抽样的是() A.等概率抽样 B.分层抽样 C.方便抽样 D.定额抽样 E.整群抽样 2.常见的非概率抽样方法有()。 A.方便抽样 B.配额抽样 C.立意抽样 D.雪球抽样 E.等距抽样 3.总体可以进一步划分为()。 A.概率抽样 B.非概率抽样 C.研究总体 D.目标总体 E.总体规模

三、简答题。 1.抽样 2.非概率抽样 3.概率抽样 4.在社会研究中,为什么实行抽样方法? 5.简述抽样的步骤? 6.非概率抽样的优点和不足之处是什么? 7.简述确定实际分层抽取样本的方法? 四、综合题。 1.试述影响样本规模的因素? 答案部分 一、单项选择题。 1. 【正确答案】 A 2. 【正确答案】 C 3. 【正确答案】 B 二、多项选择题。 1. 【正确答案】ABE 2. 【正确答案】ABCD 3. 【正确答案】CD 三、简答题。 1. 【正确答案】抽样是指从总体中按一方式选取一组元素的过程。 2. 【正确答案】非概率抽样,即放弃随机原则,依据研究者的主观意愿、判断或是否方便等因素来抽取样本。

3. 【正确答案】所谓概率抽样是指总体中每个元素都有一定的非零概率被抽中,每个元素被抽中的概率可相等,也可以不相等,相等称为等概率抽样,不相等称为不等概率抽样。 4. 【正确答案】在社会研究中,研究者经常从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程就是抽样。之所以要进行抽样,主要是考虑研究成本和研究的可行性。首先,在社会研究中,经费是一项硬约束;其次,对于一些太大的总体,逐个进行问卷调查也不现实。而借助于抽样则能够克服以上困难。 5. 【正确答案】抽样的步骤有: (1)设计抽样方案 首先,要界定总体。其次,介绍抽样框的具体内容。再次,要确定样本所含个体数目。最后,要根据不同的目标总体,选择合适的抽样方法。 (2)抽取样本 抽取样本是指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。(3)评估样本 评估样本是指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总体推断的失败。一般来说,评估所依据的总体统计数据越多,则评估效果越好。 6. 【正确答案】非概率抽样,即放弃随机原则,依据研究者的主观意愿、判断或是否方便等因素来抽取样本。非概率抽样的成本比较低,操作也比较方便,但无法预先估计抽样误差,因此,很难对总体情况做出可靠的推断。 7. 【正确答案】一种方法是先将所有总体元素按分层变量进行分层,并计算各层在总体的比例,即比例分层抽样。 另一种方法适用于等比例分层抽样。先将所有总体元素按分层变量进行分层,然后将各层的总体元素一层一层地连续排列,最后对连续排列的总体元素进行等距抽样,这种方法被称为分层等距抽样。 四、综合题。 1. 【正确答案】如果先不考虑经费问题,那么样本规模主要取决于抽样精度和总体标准差。一般说来,抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。 首先,抽样精度是指抽样中希望达到的精确度,其实就是能够容忍的抽样误差e。有研究表明,对于较大的总体,在确定精度的条件下,总体规模与样本规模之间应该是一种非线性关系,即样本并不按比例地随着总体增大而增大。 其次,总体标准差是反映总体元素之间异质性程度的指标;一般说来,在给定抽样精度后,总体异质性程度越小,所需样本规模也越小;反之亦然。

统计学习题第五章_抽样与抽样估计答案.doc

第五章抽样与抽样估计复习题 一、填空题 1 、在实际工作中,人们通常把n≥ 30 的样本称为大样本,而把n<30 的样本称为小样本。 2 、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3 、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4 、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5 、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1 、在其它条件不变的情况下,要使抽样平均误差为原来的1/3 ,则样本单位数必须 ((2)) ( 1)增加到原来的 3 倍(2)增加到原来的9 倍 ( 3)增加到原来的 6 倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20 小时抽 1 小时的全部产进行检验,这种方式是((4)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) ( 1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100 次通话中,通话持续平均时间为 3 分钟,均方差为分钟,则概 率为时,通话平均持续时间的抽样极限误差为((2)) ( 1)(2)(3)(4) 6、假定11 亿人口大国和100 万人口小国的居民年龄变异程度相同,现在各自用重复 抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))( 1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1 、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2 、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3 、抽样极限误差((1)(2)( 4))

第五章 抽样分布

第四章抽样与抽样分布 例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果: 例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求: 1)随机抽取一人,收入超过18430元的概率? 2)抽取一个10人样本,平均收入超过18430元的概率? 例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少? 例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少? 例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、

1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表 2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7 例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。 例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少? 四、样本方差的抽样分布 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布: 2χ=2222312( )( )( ).....( )i x x x x μ μ μ μ σ σ σ σ ----++++= 2 2 1 1 () k i i x μσ=-∑ 分子分母同乘n-1,进一步整理得2 χ=2 2 (1)n s σ-~2χ(n-1) 练习题: 1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为? 2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为? 3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是? 4、样本量为10的样本均值方差为12,则总体的方差为? 5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差

第三章 抽样检验(4)计数标准型抽样检验 - 副本

第三章抽样检验(4)计数标准型抽样检验 - 副本

/wEPDwUJOTU4Mj 第三章 3.2计数标准型抽样检验 3.2计数标准型抽样检验 学习目标 1、熟悉计数标准型抽样检验的含义 2、了解计数标准抽样检验的基本原理 3、了解抽样检验中几种主要的随机抽样方法 本节主要考点是熟悉概念和原理。 计数标准型抽样检验就是同时规定对生产方的质量要求和对使用方的质量保护的抽样检验。设计数标准型抽样方案这种抽样方案的oc曲线应通过两点(生产方和使用方风险点),如图3.2-1所示。解释一下。 下面以GB/T13262-2008 下面以gb/t13262-2008《不合格百分数的计数标准型一次抽样检验程序及抽样表》为例,介绍这种抽样方案的抽样程序和抽样表。 一、抽样表的构成 表3.2-1为计算标准型一次抽样表。只要给出p0与p1,就可以从中求出样本量n和接收数。解释一下表格,代表值和区间值。 表3.2-1(p128)不合格百分数的计数标准型一次抽样方案 二、抽样程序 (一)确定质量标准;(二)确定p0、p1值;(三)批的组成;(四)检索抽样方案;(五)抽取样本;(六)检验样本;(七)批的判断;(八)批的处置。 1、关于确定p0、p1值; (1)p0、p1值(p0< p1)s应由供需双方协商确定。 (2)p1的选取,应使p1与p0拉开一定的距离。p1/ p0过小,会增加样本量,

使检验费用增加;但p 1/p 过大,又会放松质量要求,对使用方不利。因此,以 α=0.05,β=0.10的抽样方案中,iec推荐p1=(1.5~3.0) p0,而有些国家则取p1=(4~10)p0。 总之,要综合考虑过程能力,制造成本、产品不合格顾客的损失、质量要求和检验费用。 2、关于样本的抽取方法 2、关于样本的抽取方法 (1)简单随机抽样。指总体中的每个个体都有相同的机会被投到。常采用抽签法、查随机数表法,或掷随机数骰子法。优点:抽样误差小,缺点:比较繁琐。(2)系统抽样法。(等距抽样;机械抽样法) 由于系统抽样法操作简便,实施起来不易出差错,因而在生产现场人们乐于使用它。如在某道工序上定时去抽一件产品进行检验,就可以看做是系统抽样的一个例子。但在总体会出现周期性变化。 (3)分层抽样法(类型抽样法) 它是把一个总体分成若干个子总体(层)然后按规定的比例从各层中抽取样本的方法。优点:样本的代表性好,抽样误差小。缺点是抽样手续比简单随机抽样还要繁琐。 (4)整群抽样法 它是把一个总体分成许多群,然后随机地抽取若干群,并对抽到的群合检。优点:实施方便。缺点:样本的代表性差,抽样误差大。这种方法常用在二序控制中。 [例3.2-1]解释一下 [例3.2-1]解释一下。 假设有某种成品零件分别装在20个零件箱中,每箱各装50个,总共是1000个。如果想从中取100个零件组成样本进行测试研究,那么应该怎样运用上述4种抽样方法呢? ①将20箱零件倒在一起,混合均匀,并将零件从1~1000一一编号,然后用查随机数表或抽签的办法,从中抽出编号毫无规律的100个零件组成样本,这就是简单随机抽样。 ②将20箱零件倒在一起,混合均匀,将零件从1~1000逐一编号,然后用查随机数或抽签的办法先决定起始编号,比如16号,那么后面入选样本的零件编号依次为26,36,46,56,…,906,916,926,…,996,06.于是就由这样100个零件组成样本,这就是系统抽样。 ③对所有20箱零件,每箱都随机抽取出5个零件,共100件组成样本,这就是分层抽样。 ④先从20箱零件随机抽出2箱,然后对这2箱零件进行全数检查,即把这2零件看成是“整群”,由它们组成样本,这就是整群抽样。 3、关于批的处理 3、关于批的处理 (1)判为接收的批即可交付。关于样本中已发现的不合格品是直接接收、退货、还是换成合格品,这要按事先签订的合同来定。

现代市场调查与预测-第五章 抽样技术

第五章抽样设计技术 二、判断题 1、市场调查实践中,常用的典型调查、重点调查其实质属于配额抽样法 的具体应用。(×) 2、对于在母体中,各子体之间有关问题特征差异比较小者,称作母 体幅度大,对于在母体中,各子体之间有关问题特征差异比较大者, 称作母体幅度小(×) 3、随机抽样中每个个体被抽中的概率是人为决定的。(×) 4、应用简单随机抽样必须对总体进行分组、划类和排序等现行工作。(×) 5、简单随机抽样适合于规模不大且总体中各个体之间特征差异较小的总 体抽样。(√) 6、当总体中个体差异较小时,可以适当增加样本比例和数量,按照 简单原则选取样本。(×) 7、应用等距随机抽样,当总体具有某种周期性时,应以该周期长度作为 抽样间距。(×) 8、分层随机抽样适用于总体单位数量较大、总体内各单位之间差异大且分布不均匀的总体。(√) 9、分层比例抽样法适用于各层之间和各层内部子体之间的差异度较 大的情况,各层在母体中的占比例差异过分悬殊的市场母体调查。(×) 10、分层最佳抽样是指分层后,从各层次中按单纯随机原则抽取样本 的数量,依各层次占母体的比例而确定。(×) 11、分层最佳抽样中各层中的样本标准差是样本数和离差平方和的比 例再开方(×) 12、分层随机抽样法实质上是分层与单纯随机抽样的结合。(√) 13、从理论上讲,由于整群抽样的调查单位相对集中,因而调查结果 的准确性较差。( √ ) 14、分群随机抽样要求各群体之间保持异质。(×) 15、分层随机抽样要求各层之间有相同性,各层内部具有差异性,分

群随机抽样要求各群体之间保持差异性,而每一群体内部分子之间则 具有相同性。(×) 16、判断抽样法的理论假定是:认为母体中的每一分子都相同,随意 选取任一个样本都可以取得代表母体特征的结果。(×) 17、配额抽样法是按照随机方法抽取样本,分层抽样则是按照判断抽 样法抽取样本(×) 18、一般说,允许误差愈小,抽样数目愈多。(√) 19、一般来说,预测误差愈小,抽样数目应愈少;抽样误差允许稍大, 抽样数目可以适当增加。(×) 20、要求的概率保证度越大,允许的误差范围就越小。(×) 三、单选题 1、对于企业来讲,要消耗大量人力、物力和财力,不符合经济效益的要求的调查形式是() A、随机抽样 B、非随机抽样 C、典型调查 D、市场普查 2、下列哪项不属于常用的市场调查方式。() A、市场普查 B、市场重点调查 C、市场占有率调查 D、市场个案调查 3、可以获得完整,系统的信息资料的调查方法是(A) A、市场普查 B、抽样调查 C、经常性市场调查 D、定期调查 4、假如现在要调查某校在校大学生上网情况,最合适的抽样框是:(C ) A、某系大学生花名册; B、该校所在城市所有高校名册; C、该校全体大学生花名册; D、某专业学生花名册。 5、对城乡居民进行随机调查,据此推算出某个地区范围内的居民购 买力,这种推算方法称为(C) A、配额测算 B、比例测算 C、抽样测算 D、使用面测算 6、随机抽样最主要的特点是抽取样本时必须遵循() A、系统原则 B、随机原则 C、互斥原则 D、可 比原则 7、采用纯粹偶然的方法从母体中选取样本的抽样方法是(A) A、简单随机抽样 B、分层随机抽样 C、系统抽样 D、任意抽样 8、理论上最符合随机原则的抽样方法是:

第五章 抽样估计学习指导

第五章 抽样估计学习指导 一、判断题×√ 1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( ) 3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( ) 4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( ) 5.抽样成数的特点是,样本成数越大,则成数方差越大.( ) 6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σ μ= 7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )

8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( ) 9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( ) 10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( ) 12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( ) 二.单项选择题 1.抽样调查的主要目的是( ). A.用样本指标来推算总体指标 B.对调查单位做深入研究 C.计算和控制抽样误差 D.广泛运用数学方法 2.抽样调查所必须遵循的基本原则是( ). A.准确性原则 B.随机性原则 C.可靠性原则 D.灵活性原则

第三章 抽样检验(4)计数标准型抽样检验 - 副本

第三章 3.2计数标准型抽样检验 3.2计数标准型抽样检验 学习目标 1、熟悉计数标准型抽样检验的含义 2、了解计数标准抽样检验的基本原理 3、了解抽样检验中几种主要的随机抽样方法 本节主要考点是熟悉概念和原理。 计数标准型抽样检验就是同时规定对生产方的质量要求和对使用方的质量保护的抽样检验。设计数标准型抽样方案这种抽样方案的oc曲线应通过两点(生产方和使用方风险点),如图3.2-1所示。解释一下。 下面以GB/T13262-2008 下面以gb/t13262-2008《不合格百分数的计数标准型一次抽样检验程序及抽样表》为例,介绍这种抽样方案的抽样程序和抽样表。 一、抽样表的构成 表3.2-1为计算标准型一次抽样表。只要给出p0与p1,就可以从中求出样本量n和接收数。解释一下表格,代表值和区间值。 表3.2-1(p128)不合格百分数的计数标准型一次抽样方案 二、抽样程序 (一)确定质量标准;(二)确定p0、p1值;(三)批的组成;(四)检索抽样方案;(五)抽取样本;(六)检验样本;(七)批的判断;(八)批的处置。 1、关于确定p0、p1值; (1)p0、p1值(p0< p1)s应由供需双方协商确定。 (2)p1的选取,应使p1与p0拉开一定的距离。p1/ p0过小,会增加样本量, 使检验费用增加;但p 1/p 过大,又会放松质量要求,对使用方不利。因此,以 α=0.05,β=0.10的抽样方案中,iec推荐p1=(1.5~3.0) p0,而有些国家则取p1=(4~10)p0。

总之,要综合考虑过程能力,制造成本、产品不合格顾客的损失、质量要求和检验费用。 2、关于样本的抽取方法 2、关于样本的抽取方法 (1)简单随机抽样。指总体中的每个个体都有相同的机会被投到。常采用抽签法、查随机数表法,或掷随机数骰子法。优点:抽样误差小,缺点:比较繁琐。(2)系统抽样法。(等距抽样;机械抽样法) 由于系统抽样法操作简便,实施起来不易出差错,因而在生产现场人们乐于使用它。如在某道工序上定时去抽一件产品进行检验,就可以看做是系统抽样的一个例子。但在总体会出现周期性变化。 (3)分层抽样法(类型抽样法) 它是把一个总体分成若干个子总体(层)然后按规定的比例从各层中抽取样本的方法。优点:样本的代表性好,抽样误差小。缺点是抽样手续比简单随机抽样还要繁琐。 (4)整群抽样法 它是把一个总体分成许多群,然后随机地抽取若干群,并对抽到的群合检。优点:实施方便。缺点:样本的代表性差,抽样误差大。这种方法常用在二序控制中。[例3.2-1]解释一下 [例3.2-1]解释一下。 假设有某种成品零件分别装在20个零件箱中,每箱各装50个,总共是1000个。如果想从中取100个零件组成样本进行测试研究,那么应该怎样运用上述4种抽样方法呢? ①将20箱零件倒在一起,混合均匀,并将零件从1~1000一一编号,然后用查随机数表或抽签的办法,从中抽出编号毫无规律的100个零件组成样本,这就是简单随机抽样。 ②将20箱零件倒在一起,混合均匀,将零件从1~1000逐一编号,然后用查随机数或抽签的办法先决定起始编号,比如16号,那么后面入选样本的零件编号依次为26,36,46,56,…,906,916,926,…,996,06.于是就由这样100个零件组成样本,这就是系统抽样。 ③对所有20箱零件,每箱都随机抽取出5个零件,共100件组成样本,这就是分层抽样。 ④先从20箱零件随机抽出2箱,然后对这2箱零件进行全数检查,即把这2零件看成是“整群”,由它们组成样本,这就是整群抽样。 3、关于批的处理 3、关于批的处理 (1)判为接收的批即可交付。关于样本中已发现的不合格品是直接接收、退货、还是换成合格品,这要按事先签订的合同来定。 (2)对于判为不接收的批,全部退货。但是,也可以有条件地接收,不过这要由事先签订的合同定。 3.3 计数调整型抽样检验及GB/T2828.1的使用 3.3 计数调整型抽样检验及gb/t2828.1的使用

现代市场调查与预测 第五章抽样技术

第五章抽样设计技术 、判断题 1、市场调查实践中,常用的典型调查、重点调查其实质属于配额抽样法的具体应用。(X) 2、对于在母体中,各子体之间有关问题特征差异比较小者,称作母体幅度大,对于在母体中,各子体之间有关问题特征差异比较大者,称作母体幅度小(X ) 3 、随机抽样中每个个体被抽中的概率是人为决定的。(X ) 4、应用简单随机抽样必须对总体进行分组、划类和排序等现行工作。(X ) 5、简单随机抽样适合于规模不大且总体中各个体之间特征差异较小的总体抽样。(V ) 6、当总体中个体差异较小时,可以适当增加样本比例和数量,按照简单原则选取样本。(X) 7、应用等距随机抽样,当总体具有某种周期性时,应以该周期长度作为抽样间距。(X) 8、分层随机抽样适用于总体单位数量较大、总体内各单位之间差异大且分布不均匀的总体。(V) 9、分层比例抽样法适用于各层之间和各层内部子体之间的差异度较大的情况,各层在母体 中的占比例差异过分悬殊的市场母体调查。(X ) 10、分层最佳抽样是指分层后,从各层次中按单纯随机原则抽取样本的数量,依各层次占母体的比例而确定。(X ) 11、分层最佳抽样中各层中的样本标准差是样本数和离差平方和的比例再开方(X) 12、分层随机抽样法实质上是分层与单纯随机抽样的结合。(V ) 13、从理论上讲,由于整群抽样的调查单位相对集中,因而调查结果的准确性较差。(V ) 14、分群随机抽样要求各群体之间保持异质。(X) 15、分层随机抽样要求各层之间有相同性,各层内部具有差异性,分群随机抽样要求各群体 之间保持差异性,而每一群体内部分子之间则具有相同性。(X) 16、判断抽样法的理论假定是:认为母体中的每一分子都相同,随意选取任一个样本都可以 取得代表母体特征的结果。(X) 17、配额抽样法是按照随机方法抽取样本,分层抽样则是按照判断抽样法抽取样本(X) 18、一般说,允许误差愈小,抽样数目愈多。(V) 19、一般来说,预测误差愈小,抽样数目应愈少;抽样误差允许稍大,抽样数目可以适当增 加。(X ) 20 、要求的概率保证度越大,允许的误差范围就越小。(X )三、单选题 1、对于企业来讲,要消耗大量人力、物力和财力,不符合经济效益的要求的调查形式是()

第三章抽样检验.doc

第三章抽样检验 大纲要求与内容提要 一、基本概念 1、掌握抽样检验、计数检验、计量 检验、单位产品、(检验)批、 不合格、不合格品、批质量、过 程平均、接收质量限及极限质量 的概念 1.1抽样检验(p130) ——按照规定的抽样方案,随机从一批 或一个过程中抽取少量个体(作为样 本)进行的检查,根据样本检验结果判 定一批产品或一个过程是否可以被接 收。 1.2计数检验(pp.130-131) ——包括计件和计点抽样检验。 计件抽样检验——根据被检样本中的

不合格产品数,推断整批产品的接收与 否。 计点抽样检验——根据被检样本中的 产品包含的不合格数,推断整批产品的 接收与否。 1.3计量检验(p131) ——通过被检样本中的产品质量特性的 具体数值并与标准进行比较,进而推断 整批产品的接收与否。 1.4单位产品(p131) ——为实施抽样检验需要而划分的基 本产品单位。……在抽样标准中定义为 可单独描述和考察的事物。…… 1.5(检验)批(p131) ——提交检验的一批产品,亦为检验对 象而汇集的一批产品。 ——它应由同型号、同等级和同种类 (尺寸、特性、成分等),且生产条件 和生产时间基本相同的单位产品组成。 ——又分为孤立批和连续批:

孤立批——指脱离已生产或汇集的批 而不属于当前检验批系列的批; 连批批——指待检批可利用最近已检 批所提供质量信息的连续提交检验批。 1.6批量(p131) ——检验批中单位产品的数量,常用N 表示。 1.7不合格(p132) ——单位产品的任一质量特性不满足规范要求。常据不合格的严重程度必要时将其由重到轻分类为A、B、C类不合格。1.8不合格品(p132) ——具有一个或一个以上不合格的单位产品。对应于不合格分类而为A、B、C类不合格品。 1.9批质量(p132) ——单个提交检验批产品的质量。由于质量特性值——计数值、计量值的属性不同而对之表示方法有别。 a.计数值有:

第5章抽样与参数统计。分析

第五章抽样与参数估计 学习内容 一、抽样推断概述 二、抽样分布及其应用 三、常见的抽样分布 四、参数估计 五、区间估计的计算 学习目标 1. 了解抽样和抽样分布的基本概念。 2. 理解抽样分布与总体分布的关系。 3. 了解点估计的概念和估计量的优良标准。 4. 掌握总体均值、总体比例和总体方差的区间估计。 一、抽样推断概述 ①推断统计的内容 ②抽样推断的过程 统计推断的基本假定 a)总体看作是一个随机变量X,其概率分布为f(x)。 b)样本看作是n个独立的随机变量(X1, X2, …, X n),每个都具有与总体X相同的分布。 c)样本中每个个体必须取自同一总体, X1, X2, …, X n相互独立。

统计推断涉及的概念 参数与统计量 –参数:描述总体分布特征的量,如平均数μ,标准差σ。 –统计量:由样本观察值算出的量,如,S2,S。 –统计量是随机变量。 ③抽样分布及其形成过程 抽样分布(概念要点) 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布。 抽样分布是一种理论概率的分布。 抽样分布的结果来自容量相同的所有可能样本。 单选题 样本平均数和总体平均数() – A、前者是一个确定值,后者是随机变量 – B、前者是随机变量,后者是一个确定值 – C、两者都是随机变量 – D、两者都是确定值 ④抽样推断的理论基础 (1)大数定律 a)大数定律在统计中是指一切关于大量随机现象之平均结果稳定性的定理。 –尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋 于稳定。 b)为整个推断统计提供了最基本的理论依据。 猜硬币赌局 赌局1:–掷10次硬币,赌正面朝上的频率为0.4到0.6次。 赌局2:–掷100次硬币,赌正面朝上的频率0.4到0.6次。 赌局3:–掷1000次硬币,赌正面朝上的频率0.4到0.6次。

(抽样检验)第三章抽样检验最全版

(抽样检验)第三章抽样检 验

第三章抽样检验 大纲要求和内容提要 壹、基本概念 1、掌握抽样检验、计数检验、计量检 验、单位产品、(检验)批、不合 格、不合格品、批质量、过程平 均、接收质量限及极限质量的概 念 1.1抽样检验(p130) ——按照规定的抽样方案,随机从壹批或壹个过程中抽取少量个体(作为样本)进 行的检查,根据样本检验结果判定壹批 产品或壹个过程是否能够被接收。1.2计数检验(pp.130-131)——包括计件和计点抽样检验。

计件抽样检验——根据被检样本中的 不合格产品数,推断整批产品的接收和 否。 计点抽样检验——根据被检样本中的产品包含的不合格数,推断整批产品的接收 和否。 1.3计量检验(p131) ——通过被检样本中的产品质量特性的 具体数值且和标准进行比较,进而推断 整批产品的接收和否。 1.4单位产品(p131) ——为实施抽样检验需要而划分的基本产品单位。……在抽样标准中定义为可单 独描述和考察的事物。……

1.5(检验)批(p131) ——提交检验的壹批产品,亦为检验对象而汇集的壹批产品。 ——它应由同型号、同等级和同种类(尺寸、特性、成分等),且生产条件和生产时间 基本相同的单位产品组成。 ——又分为孤立批和连续批: 孤立批——指脱离已生产或汇集的批而不属于当前检验批系列的批; 连批批——指待检批可利用最近已检批所提供质量信息的连续提交检验批。1.6批量(p131) ——检验批中单位产品的数量,常用N 表示。

1.7不合格(p132) ——单位产品的任壹质量特性不满足规范要求。常据不合格的严重程度必要时将其由重到轻分类为A、B、C类不合格。 1.8不合格品(p132) ——具有壹个或壹个之上不合格的单位产品。对应于不合格分类而为A、B、C类不合格品。 1.9批质量(p132) ——单个提交检验批产品的质量。由于质量特性值——计数值、计量值的属性不同而对之表示方法有别。 a.计数值有: i)批不合格品率(计件)——批的不合格品 数D除以批量N:P=D/N,

第 5 章 抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

第三章 抽样检验(3)抽样检验

第三章抽样检验 第三章 抽样检验 oc曲线的性质 (1)抽样特性曲线和抽样方案是一一对应关系,也就是说有一个抽样方案就有对应的一条oc曲线;相反,有一条抽样特性曲线,就有与之对应的一个抽检方案。 (2)oc曲线是一条通过(0,1)和(1,0)两点的连续曲线。(3)oc曲线是一条严格单调下降的函数曲线,即对于 p1l(p2)。 既然改变参数,方案对应的oc曲线就随之改变,其检查效果也就不同,那么什么样的方案检查效果好,其oc曲线应具有什么形状呢?下面就来讨论这一问题。 (1)理想方案的特性曲线 (1)理想方案的特性曲线 在进行产品质量检查时,总是首先对产品批不合格品率规定一个值p0来作为判断标准,即当批不合格品率 。其抽样特性曲线

为两段水平线,如下图所示: 错检或漏检的,所以,理想方案只是理论上存在的。 (2)线性抽检方案的OC曲线 (2)线性抽检方案的oc曲线 所谓线性方案就是(1|0)方案,因为oc曲线是一条直线而得名的,如下图所示, 由上图可见,线性抽检方案是从产品批中随机地抽取1个产品进行检查,若这个产品不合格,则判产品为批不合格品。这个方案的抽样特性函数为:因为它和理想方案的差距太大,所以,这种方案的检查效果是很差的。 理想方案虽然不存在, 理想方案虽然不存在,但这并不妨碍把它作为评价抽检方案优劣的依据,一个抽检方案的oc曲线和理想方案的oc曲线接近程度就是评价方案检查效果的准则。 为了衡量这种接近程度,通常是首先规定两个参数p0和

p1(p0

第五章抽样推断习题答

第五章抽样推断习题 一、一、单项选择题: 1、抽样推断的主要目的是(③)。 ①对调查单位作深入研究②计算和控制抽样误差 ③用样本指标来推算总体指标④广泛运用数学方法 2、抽样调查与典型调查的主要区别是(④)。 ①所研究的总体不同②调查对象不同 ③调查对象的代表性不同④调查单位的选取方式不同 3、样本是指(④)。 ①任何一个总体②任何一个被抽中的调查单位 ③抽样单元④由被抽中的调查单位所形成的总体 4、抽样误差是指(③)。 ①在调查过程中由于观察、测量等差错所引起的误差 ②在调查中违反随机原则出现的系统误差 ③随机抽样而产生的代表性误差④人为原因所造成的误差 5、抽样极限误差是(②)。 ①随机误差②抽样估计所允许的误差的上下界限 ③最小抽样误差④最大抽样误差 6、抽样平均误差就是(④)。 ①样本的标准差②总体的标准差 ③随机误差④样本指标的标准差 7、抽样估计的可靠性和精确度(②)。 ①是一致的②是矛盾的 ③成正比④无关系 8、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应(①)。 ①增加8倍②增加9倍 ③增加1.25倍④增加2.25倍 9、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是(②)。 ①最小的n值②最大的n值 ③中间的n值④第一个计算出来的n值 10、抽样时需要遵循随机原则的原因是(③)。

①可以防止一些工作中的失误②能使样本与总体有相同的分布 ③能使样本与总体有相似或相同的分布④可使单位调查费用降低 二、多项选择题: 1、抽样推断的优点(①②③④)。 ①时效性强②更经济③能够控制抽样估计的误差 ④适用范围广⑤无调查误差 2、抽样推断适用于(①②③④⑤)。 ①具有破坏性的场合②用于时效性要求强的场合 ③对于大规模总体和无限总体的场合进行调查 ④用于对全面调查的结果进行核查和修正 ⑤不必要进行全面调查,但又需要知道总体的全面情况时 3、抽样推断中哪些误差是可以避免的(①②④)。 ①调查性误差②因抽样破坏随机原则而造成的系统性偏差 ③抽样误差④因抽样破坏随机原则而造成的方向性偏差 4、区间估计的要素是(①③④)。 ①点估计值②样本的分布③估计的可靠度 ④抽样极限误差⑤总体的分布形式 5、影响必要样本容量的因素主要有(①②③⑤)。 ①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样 ④样本的差异程度⑤估计的可靠度 三、填空题 1、抽样推断就是根据()的信息去研究总体的特征。 2、样本单位选取方法可分为()和()。 3、对于简单随机抽样,总体中的每个单位被抽中的概率为()。 4、区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。 四、简答题 1、什么是抽样推断?抽样推断有哪几方面的特点? 2、抽样推断与典型调查相比有何不同? 五、计算题 1、为检查某批电子元件的质量,随机抽取1%的产品,将测得结果整理成如下表的形式:

第三章抽样检验练习题

知识点题型层次难度题目答案判断掌握*ISO国际标准化组织对质量的定义为:“反映实体满足规定需要能力的特性总和。”错判断了解狭义的质量是指产品符合满足社会一定需要而规定的的技术条件的总和。对 单选了解广义的质量概念包括: A、产品质量和服务质量; B、综合质量和全面质量;C、产品质量和工作质量; D、工作质量和服务质量C 判断熟悉对于消费者而言,单位产品质量就是他们心目中的质量,他们希望购置的商品符合产品质量标准。对 判断熟悉批量产品质量可以批量产品中的不合格品数量和比率或某个质量特性值来表示。对 多选熟悉以下哪些是质量特性:A、纯度;B、强度;C、不合格品率;D、返修率;E、包装方法ABCDE 多选熟悉以下哪些是计数型的质量特性:A、含氮量;B、破损数;C、废品数;D、速度;E、疵点数BCE 多选熟悉以下哪些是计数型的质量特性:A、含氮量;B、破损数;C、废品数;D、速度;E、疵点数AD 判断掌握计量型的质量特性值是连续变化的,可以用连续的尺度来衡量。对 单选以下关于计数型的质量特性值说法哪一个是正确的:A、只能用离散的尺度来衡量;B、是连续变化的; C、可以出现小数; D、可以用仪表、量具来测量A 判断掌握以计件或计点来衡量产品质量的方法叫做衡量产品质量的计量方法。错单选以下哪个是计点型的质量特性:A、废品数;B、一等品数;C、气孔数;D、破损数C 单选以下哪个不是计件型的质量特性:A、一等品数;B、废品数;C、划痕数;D、合格品数C 判断掌握质量指标是指用来定量评价质量的质量特性值。它与质量标准有一定的相关性,但不是一个概念。错 多选熟悉以下哪些是批的质量指标:A、某个质量指标的平均值;B、不合格品率;C、某个质量指标的含量;D、 某个质量指标的均方差;E、某个质量指标的变异系数ABDE 判断掌握产品的质量评定是在检验基础上对产品质量的评价。对判断*抽样检验标准是为了检验产品质量是否达到质量标准的判定规则,是质量标准的基础。错判断质量检验是对产品质量的一种测定、比较及判断的活动。对判断检验后把产品分为一级品、二级品、三级品的检验是计量检验的方法。错判断计量检验比计数检验能够提供更多的产品质量信息。对判断在相同的置信水平下进行批质量估计,计数检验所需的样本量要少于计量检验所需的样本量。错判断在计量检验中,误差的测定容易进行。对

相关文档
最新文档