现场调查中的抽样方法
现场调查中的抽样方法

01定义02特点抽样方法是指从总体中随机选取部分个体作为样本,通过对样本的调查来推断总体特征的统计方法。
抽样方法具有随机性、高效性和经济性等特点,能够以较小的样本量获得总体的代表性信息,提高调查的效率和准确性。
定义与特点从总体中随机选取个体,每个个体被选中的概率相等。
简单随机抽样将总体按照某种特征分成若干层,然后在每层中随机抽取一定比例的个体。
分层随机抽样将总体按照某种顺序排列,然后按照固定间隔选取个体,间隔可以是固定的数值或与总体大小有关的比例。
系统抽样将总体分成若干群组,然后随机选取部分群组进行调查。
整群抽样抽样方法的种类01提高调查效率通过抽样方法,可以以较小的样本量获得总体的代表性信息,提高调查的效率和准确性。
02降低调查成本抽样方法能够以较小的成本获得总体的代表性信息,相对于全面调查而言,降低了调查的成本。
03适用于复杂总体对于一些结构复杂、不易全面调查的总体,抽样方法能够更好地适应并推断总体特征。
抽样方法的重要性简单随机抽样是一种基本的抽样方法,其基本思想是从总体中随机抽取样本,使得每一个样本在抽屉中都有相等的可能性。
1. 确定总体和样本数量;2. 使用随机数字表或计算机软件生成随机数;3. 将生成的随机数与总体中的个体一一对应,选择中选的个体作为样本。
定义与操作方法操作方法定义1. 操作简单,易于实施;2. 每个个体都有相等的被抽选机会;3. 在总体较小时,抽样效果较好。
缺点1. 当总体较大时,抽样效率较低;2. 可能存在抽样误差,使得样本不能很好地代表总体;3. 对于某些特殊分布,如偏态分布,抽样效果不佳。
优点优点与缺点VS适用于总体规模较小,且个体特征较为均匀的情况,如对某小区居民的调查。
当总体规模较大,或者个体特征差异较大时,简单随机抽样的效果可能会受到影响。
使用场景限制使用场景与限制定义与操作方法系统抽样是将总体分成若干个部分,按照一定顺序,间隔一定的距离,从总体中抽取样本的方法。
抽样技术期末知识点(附考点大题)

抽样期末知识点汇总一.绪论(一)抽样调查抽样调查是指非全面调查的总称。
只要是从研究的对象中抽取部分单位加以调查,用来说明全体,就统称为抽样调查。
(广义)选样方法:非概率抽样&概率抽样1.非概率抽样抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样(盖洛普民意测验、自愿样本原因:(1)受客观条件限制,无法进行严格的随机抽样。
(2)为了快速获得调查结果。
(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等。
(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。
优点:成本低,而且容易完成;缺点:不能对估计的精度作出客观、准确的说明。
2.概率抽样(狭义抽样调查)按照概率统计的原理,从研究的总体中按随机原则来抽选样本,通过对样本的调查获取数据,以此来对总体的特征作出估计推断;对推断中可能出现的抽样误差可以从概率的意义上加以控制。
特点:(1)对于一个具体的调查,要求总体中的每一个单元都有一个已知的非零概率被抽中。
(2)抽取样本的方法必须是随机的。
(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。
(4)能够以一定的概率控制抽样误差的范围。
概率抽样:等概率抽样&不等概率抽样(二)抽样调查的常用概念1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成,组成总体的各个个体称作总体单元或单位。
2.抽样总体:指从中抽取样本的总体。
3.抽样框:抽样总体的具体表现。
通常抽样框是一份包含所有抽样单元的名单。
4.总体参数:总体的特征。
5. 统计量(估计量):样本观察值的函数。
6.抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。
7.非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。
8.抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。
9. 抽样标准误(S ),抽样方差(V ),V=S 210.偏差:样本估计量的数学期望与总体真值间的离差,ˆˆE()-()ˆB θθθ=。
常用的抽样方法

精品课件
二、估计比例用的3种改进模型
1、模型I 把问题 B改为一个完全无关、答案 为“是”的概率是已知值的问题
将沃纳模型中与敏感性问题相对的具有特
征A的问题改为一个与敏感性问题不相关的
其它问题。
A
B
精品课件
例14-2: 欲调查某地已婚育龄妇女有无婚前
性行为的比例。
问题A:婚前有过性行为? 回答: ①是 ②否 问题B:你生日(月+日)除以3余数是0吗? 回答: ①是 ②否
(2)问卷中设A、B两个问题。 (3)备有一个口袋,里面装有黑白两种颜色的 球(也可用围棋的黑子和白子),两种球的比例不是 1:1,例如可以是60%和40%。
精品课件
(4)调查对象在填写答案前,先随机抽取一个球 (球的颜色对调查员保密),据球的颜色决定回 答两个问题中的哪一个。
(5)由于调查员不知道某一对象抽取的球是什么颜 色的,所以无法知道某一对象回答的是问题A还 是问题B,也无法知道调查对象的“秘密”。
随机化回答是指在调查中使用特定的随机化装置, 使得被调查者以预定的概率来回答敏感性问题。这一技术的 宗旨就是最大限度地为被调查者保守秘密,从而取得被调查 者的信任。
RRT技术的基本原理在于当被调查者确信调查者及 其他人无法从被调查者的回答中获知他们的真实行为时,能 更加真实地对敏感问题进行回答。并且RRT技术保护调查对 象的个人隐私,能充分得到调查对象的配合,最终可显著降 低无应答率和误答率,得到高质量的调查结果。
常用的抽样方法
精品课件
一、单纯随机抽样(simple random sampling)
1、抽样方法
根据研究目的选定总体,首先对总体中所有 的观察单位编号,遵循随机原则,采用不放回抽取 方法,从总体中随机抽取一定数量观察单位组成样 本。
采样的方法

采样的方法采样是指从总体中选取一部分作为研究对象的过程,是统计调查和研究的基础。
采样的方法有很多种,不同的研究对象和研究目的需要选择不同的采样方法。
下面将介绍几种常见的采样方法。
一、随机抽样。
随机抽样是一种简单随机抽样方法,它是根据概率的原理,以等概率的方式从总体中抽取样本的方法。
在进行随机抽样时,需要先确定总体的大小,然后使用随机数表或随机数发生器来进行抽样。
随机抽样能够保证样本的代表性和客观性,是一种常用的采样方法。
二、分层抽样。
分层抽样是将总体按照某种特征分成若干层,然后从每一层中分别进行随机抽样,最后将各层的样本合并在一起,形成最终的样本。
分层抽样能够保证每一层在样本中的代表性,适用于总体的特征较为复杂的情况。
三、整群抽样。
整群抽样是将总体按照某种特征划分成若干个群体,然后从这些群体中随机抽取若干个群体作为样本。
整群抽样适用于总体中群体之间差异较大的情况,能够减少样本的数量和调查成本。
四、方便抽样。
方便抽样是指根据研究者的方便性和可及性来选择样本的方法,这种方法的优点是简单方便,但是样本的代表性和客观性较差,容易产生偏差,因此在科学研究中往往不推荐使用。
五、系统抽样。
系统抽样是指按照一定的规律从总体中抽取样本的方法,比如每隔若干个单位抽取一个样本。
系统抽样能够保证样本的代表性和客观性,适用于总体中单位排列有序的情况。
六、多阶段抽样。
多阶段抽样是将总体按照一定的层次结构进行多次抽样的方法,适用于总体较大、分布较广的情况。
多阶段抽样能够减少调查成本,但是也容易引入抽样误差。
以上是几种常见的采样方法,不同的研究对象和研究目的需要选择适合的采样方法,以保证研究结果的准确性和可靠性。
在进行采样时,需要注意样本的代表性、客观性和随机性,避免产生偏差,从而得到科学、可靠的研究结论。
有效的样本选择和调查方法

有效的样本选择和调查方法在进行研究和调查时,样本选择和调查方法的有效性至关重要。
通过选取适当的样本和采用科学的调查方法,可以保证研究结果的准确性和可靠性。
本文将介绍一些有效的样本选择和调查方法,以帮助研究人员在实践中做出正确的选择。
一、样本选择1. 随机抽样:随机抽样是最常用的样本选择方法之一。
在随机抽样中,每个个体都有相同的概率被选择为样本,从而避免了样本的偏倚。
常见的随机抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 方便抽样:方便抽样是一种快捷但不够科学的样本选择方法。
在方便抽样中,研究者根据自己的方便选择样本,容易导致样本的不代表性。
因此,在研究设计中,我们应尽量避免使用方便抽样。
3. 整群抽样:整群抽样是在随机抽样的基础上,将人群按照某种特征划分为不同的群体,然后在随机选择的群体中进行样本抽取。
这种方法可以更好地保证样本的多样性和代表性。
二、调查方法1. 问卷调查:问卷调查是一种常见的数据收集方法,通过给受访者提供问题,以书面或电子形式进行回答。
问卷调查可以收集大量的数据,并且具有匿名性、效率高等优点。
2. 访谈调查:访谈调查是研究人员直接与受访者进行面对面的交流和询问。
访谈调查可以获取更为深入和详细的信息,但需要投入较多的时间和人力资源。
3. 实地观察:实地观察是指研究人员亲自前往研究对象所在的实际环境进行观察和记录。
实地观察可以提供客观的现场数据,但需要注意观察者的主观偏差。
4. 实验研究:实验研究是通过在受控条件下操作变量,以验证假设和因果关系的研究方法。
实验研究可以获得较高的内部有效性,但在一定程度上可能失去了外部有效性。
5. 文献综述:文献综述是通过收集、整理和分析已有的研究文献,总结和归纳研究现状和成果的方法。
文献综述可以帮助研究者系统地了解和梳理相关领域的知识,但可能受限于文献的完整性和真实性。
最后,为了保证研究的有效性和可靠性,研究人员在进行样本选择和调查时应严格按照科学的方法进行。
现场调查中常用抽样方法

现场调查抽样技术新疆医科大学公共卫生学院流行病学与卫生统计学教研室王倩1概述2现场调查常用概率抽样几种非概率抽样3第一节概述分析性研究病例对照研究抽样调查流行病学观察法描述性研究普查现况调查:又称现况研,横断面研究或患病率研究。
是通过对特定时点(或期间)和特定范围人群中的疾病或健康状况和有关因素的分布状况的资料收集、描述,从而为进一步的研究提供病因线索。
例如:2010年卫生部组织开展了全国第五次结核病流行病学抽样调查,目的是为了获得全国结核病的患病率。
●时序上属横断面研究,一般不设立对照组●不能得出因果关系的结论●一般不用于病程比较短的疾病●描述特定时间疾病或健康状态的三间分布●发现疾病的病因●适用于疾病的二级预防●评价疾病的防治效果●用于疾病的监测●为研究和决策提供基础性资料●1996年全国11省市4万人群(20-74岁)居民平均糖尿病患病率为3.62%。
●标化患病率大城市(4.58%),中小城市(3.37%),富裕县镇(3.29%),贫困县农村(2.83%)●我国1型糖尿病发病率存在民族差异,哈萨克族(3.06/10万人年)最高,满足(0.25/10人万年)1986-1990年对北京的106,385人次女性进行了乳腺癌的普查,检查出乳腺癌87例,后来在全国各地相继开展了乳腺癌的普查,发现了大量的早期患者,并进行了早期的治疗,降低疾病的负担。
根据设计研究对象的范围分为:普查抽样调查即全面调查,是指在特定时点或时期内、特定范围内的全部人群(总体)作为研究对象的调查。
通过随机抽样的方法,选择一个代表性样本进行调查,以样本的统计量来估计总体参数所在范围。
●优点:1.调查对象为全体人群,不存在抽样误差2.调查多种疾病与健康状态的分布情况3.发现全部病例,实现“三早”●缺点:1.不适用于患病率低且无简便易行诊断手段的疾病2.工作量大,不易细致,存在漏查3.调查人员多,难保证调查质量4.耗费人力、物力,费用较高●优点:1.调查节省时间、人力和物力资源2.调查范围小,工作易于做得细致●缺点:1.设计、实施和资料分析都比普查复杂2.不适用于研究对象或研究因素变异过大3.不适用于患病率太低的疾病4.需要样本量抽样比>75%,不如进行普查●抽样调查作为普查的补充●用抽样调查对全面统计资料进行评估和修正●利用抽样调查进行深层次分析●利用抽样调查,提前获得总体目标量的估计●普查为抽样框提供资料●全国普查每次都需要投入大量人力、财力,不可能经常进行,但会在两次普查之间进行抽样调查。
抽样方法有些抽样方法大全
抽样方法有些抽样方法大全抽样方法是指从总体中选取一部分样本进行调查或研究的方法。
抽样方法的选择对于研究结果的可靠性和推广性有着重要的影响。
下面是一些常用的抽样方法:1. 简单随机抽样(Simple Random Sampling):在总体中的每个个体具有相同的被选中的机会,通过随机抽取样本来代表总体。
2. 分层抽样(Stratified Sampling):将总体分成若干层次,每一层次中的个体具有相似的特征,然后从每个层次中随机抽取样本。
3. 整群抽样(Cluster Sampling):将总体划分为若干个群组,然后通过随机抽取部分群组来代表总体,然后在所选的群组中进行全面调查。
4. 系统抽样(Systematic Sampling):根据固定的抽样间隔,从总体中随机选择一个起始点,然后按照固定的间隔依次选取样本。
5. 多阶段抽样(Multistage Sampling):将总体分层和分群组,然后通过多个抽样阶段来实现抽样,通常用于大规模调查。
6. 比率抽样(Ratio Sampling):根据总体中的其中一特征的比例,确定样本的大小。
例如,如果总体中男性比例是60%,则样本中男性比例也应该是60%。
7. 效应抽样(Convenience Sampling):根据研究者的方便或可获得性,选择样本。
这种方法容易产生偏差,结果可能无法推广到整个总体。
8. 整齐抽样(Quota Sampling):根据总体中一些特征的比例,确定样本的大小。
例如,如果总体中男性比例是60%,则样本中男性数量也应该是60%。
9. 小组抽样(Snowball Sampling):从已经选择的样本中获取参与者的指引,逐渐扩大样本规模,并在招募新样本时依靠参与者的推荐。
10. 专家抽样(Expert Sampling):指选择一些具有特定知识、经验或技能的专家作为样本,以获取专业领域的意见或建议。
以上是一些常用的抽样方法,每种方法都有其适用的场景和限制,研究者需要根据研究目的、总体特征、样本大小和可行性等因素综合考虑选择最合适的抽样方法。
抽样检查的四种方案包括
抽样检查的四种方案包括抽样检查的四种方案包括:一、简单随机抽样(Simple Random Sampling)简单随机抽样是最基本的一种抽样方案。
在这种方案下,每个个体都有相等的机会被选入样本。
抽样过程是完全随机的,不受人为干预。
这种抽样方案适用于总体规模较小且各个个体之间相互独立的情况。
通过简单随机抽样,可以保证样本的代表性,从而推断总体的特征。
二、系统抽样(Systematic Sampling)系统抽样是按照一定规律从总体中抽取样本的一种抽样方法。
具体操作是首先从总体中随机选择一个个体作为起始点,然后按照相同的间隔依次选取样本。
例如,若总体中有N个个体,要选取n个样本,那么每隔N/n个个体选取一个样本。
系统抽样相比简单随机抽样更加节约时间和成本,同时样本的代表性也能够得到一定程度的保证。
三、整群抽样(Cluster Sampling)在整群抽样中,将总体按照某种特征分为多个互不重叠的群体或区域,然后从这些群体中随机选择几个作为样本。
这种抽样方案适用于总体分布不均匀且群体内部具有相似特征的情况。
通过整群抽样,可以降低抽样的时间和成本,同时有效地保证样本的代表性。
四、分层抽样(Stratified Sampling)分层抽样是根据总体的某些特征将总体分为多个层次,然后分别从每个层次中抽取样本。
这种抽样方案考虑到了总体的特征差异,可以在保证样本的代表性的同时,更加准确地研究每个子总体的特征。
分层抽样适用于总体内部的特征差异较大,且需要对各个子总体进行详细研究的情况。
根据具体的研究对象和需求,可以选择适合的抽样方案。
以上介绍的四种方案是常用的抽样方法,每一种都有其适用的场合。
在进行抽样检查时,需要根据特定的情况灵活选择抽样方案,以确保得到准确可靠的结果。
随机抽样的常用的四种方法分析一览表精编版
系统抽样systematic sampling(顺序抽样、等距抽样、机械抽样、SYS抽样)
分层抽样stratified sampling(分类抽样、类型抽样)
整群抽样cluster sampling(聚类抽样、集团/集体抽样)
优点
方法简单
操作简便
样品代表性好
抽样实施方便
总体容量较小时简单易行,抽样误差小
实施起来不易出差错,能保证被抽取到的样本单位在全总体中均匀分布,因而在生产现场经常使用(如IPQC每隔1.5小时去抽取一件产品进行检验)
分层抽样能使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的抽样方法,抽样误差比较小
1)抽样手续简便,子样的代表性差。2)抽样误差大;分群原则:群与群之间的差异要小,群内个体差异要大;3)整群抽样的样本要么整群抽取,要么整群不被抽取
相互 联系
在起始部分抽样时采用简单随机抽样
在各层抽样时采用简单随机抽样或系统抽样
如果把每一个群看作一个单位,则整群抽样可以被理解为是一种特殊的简单随机抽样
适用 范围(场合)
适用于总体中个体数较少,抽取的样本容量也较小的抽样类型。
在实际工作中,真正做到总体中的每个个体被抽到的机会完全一样是不容易的,这往往上由各种客观条件和主观心理等许多因素综合影响造成的
总体中的个体数较多,但在总体会发生周期性变化的场合,不宜使用这种抽样法
1)总体由差异明显的几部分组成
3抽取到的样本单位在全总体中均匀分布因而在生产现场经常使用如ipqc每隔15小时去抽取一件产品进行检验分层抽样能使样本具有较强的代表性而且在各层抽样时又可灵活地选用不同的抽样方法抽样误差比较小生产过程越稳定群间质量波动越小采用整群随机抽样的效果越好缺点当总体量很大时采用抽签法制签工作量很大且很难混合均匀由于系统抽样的抽样起点一旦被确定后整个样本也就完全被确定因此这种抽样方法容易出现大的偏差当总体含有一个周期性变化而抽样间隔又同这个周期相吻合时就不能保证样本的随机性
第5章 市场调查的抽样技术
二、抽样调查的特点
抽样调查数据之所以能用来代表和推算总体,主要是因 为抽样调查本身具有其他非全面调查所不具备的特点, 主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个 单位被抽取的机会是均等的,因此,能够保证被抽中的 单位在总体中的均匀分布,不致出现倾向性误差,代表 性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用 整个“代表团”来代表总体,而不是用随意挑选的个别 单位代表总体。
二、系统抽样技术
系统抽样又称机械抽样或等距抽样,是指先将总 体各个单位按某一标志值的大小排列,再分成若 干个组,每个组的样本数基本相等,依照时间或 空间上相等的间隔来抽取调查单位。
抽样间隔(样本距离) =总体单位数/样本单位 数
系统抽样的步骤: 第一步:将总体中每一个个体按顺序排列并加以编号 第二步:计算抽样距离 第三步:抽取第一个样本 第四步:抽取所有的样本 系统抽样优缺点 优点:
即应包括全部总体单位。 例如:名单抽样框、区域抽样框、时间表抽样框 抽样单元:构成抽样框的基本元素。 抽样单元可以分级:初级单元、二级单元、三级单元等。 例如:抽取学校、抽取班级、抽取学生 (五)抽样误差和非抽样误差
抽样误差:指在遵守随机原则条件下,样本指标与总体指标之间的差异,是抽样 调查中不可避免的误差。
域之内
(3)群内差异大,而群间差异小
五、几种概率抽样方案的选择和比较
抽样技术
优点
缺点
简单随机抽样
易理解;结果可投影,可推广 到总体
抽样框难于构制;费用高; 精度低;不一定能保证代表
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 缺点:
– 当抽样单位的排列有周期趋势时,抽样结果可能有偏 差
精品课件
在农村某地区开展儿童维生素D缺乏调查
根据样本量估算,需要抽取该社区1/10的儿童采血检测; 每个家庭有门牌号,从1-2000号,单号一排,双号一排。调查 者首先用随机数字表从1-10中选一个数字,然后用系统随机方 法抽取该街道的1/10有儿童的家庭。
• 调查3-6月份的各级医院的处方用药情况, 如何抽样?
精品课件
处方:分层多阶段抽样
抽取市(县)、乡镇及村级医疗机构
➢ 市、县级医院:8所全部调查 ➢ 乡镇医院:171所中随机抽取30所 ➢ 村诊所:在抽中的30个乡镇医院所在乡镇中,分别随机
抽取1-2个村卫生室,共40所
抽取各医院2008年3-6月治疗发热儿童的用药处方
• 问:人群总吸烟率是多少?
– 直接算法:总吸烟率 = (55+50)/(100+1000) = 9.5%
– 正确算法:男4000抽100,每人代表40人(W=40)
女6000抽1000,每人代表6人(W=6)
= 25%
总吸烟率 = (55*40+50*6)/(100*40+1000*6)
精品课件
调查的分类
•这一抽样方法有什么潜在问题?
精品课件
分层抽样
按影响较大的某种特征将总体分成若干组(统计上 叫做”层”),再从每一层内随机抽取一定数量的
观 察单位
• 分层变量最好是层间差别大,层内差别小
• 层内样本量分配
– 按比例分配
– 等额分配 – 最优分配
层层1 1
总总体体 层层2 2
层层3 3
• 按照性别分层,男生和女生 • 每层中随机抽取100名学生
1487 要
304 1688……
94
710
76
注 意 : 8400 以 上 的 数 字 不
精品课件
2100个数
1, 2100
2,
3, 4,……
2101,2102,2103,2104,……4200
4201,4202,4203,4204,……6300
6301,6302,6303,6304,……8400
有目的地选定典型的人、单位进行调查,对事 物特征作深入了解。
没有随机原则,不能估计总体参数,只能对总体 特征作经验推论,不属于统计推断的范畴
精品课件
抽样调查
抽样调查:从总体中抽取一定数量的观察 单位组成样本,根据样本信息来了解总体 特征。
精品课件
基本概念
• 总体:根据研究目的确定的同质观察单位的全体 • 样本:从总体中随机抽取的部分观察单位的总和 • 抽样的目的:用样本信息推断总体特征 • 抽样误差: 由抽样造成的样本信息偏离总体参数 • 可计算总体参数的95%可信区间
精品课件
• 第1阶段:50个班级中随机抽取20个班级 • 第2阶段:每个抽中班级中随机抽取3个小组 • 第3阶段:每个小组中随机抽取4名学生
初级抽样单位:班级 二级抽样单位:班级里的小组 三级抽样单位:学生
精品课件
阜阳市各级医疗机构治疗发热 儿童用药现况调查
精品课件
• 2008年安徽省阜阳市发生EV71手足口病疫情
精品课件
– 第1阶段为初级抽样单位PSU(primary sampling unit) – 第2阶段为二级抽样单位SSU(second sampling unit) – 第3阶段为三级抽样单位TSU(tertiary sampling unit)
初级抽样单位多,调查结果抽样误差小,精度高 建议不少于10-15个
分层抽样 < 系统抽样 < 单纯随机抽样 < 整群抽样
精品课件
设计效力(Design Effect):样本量不变时, 实际抽样方法的方差与单纯随机抽样的方差 的比值
Ratio of actual variance to variance assuming SRS, given same n
DE一般为1.3-3
抽取的Cluster越少,抽样误差越大
• 数理统计推理和中心极限定理表明,从正态总体中随机抽取例数为n的样本, 样本均数服从正态分布
• 对样本均数这个正态变量采用u=(样本均数-总体均数)/σ变换,变换为标 准正态分布N(0.1),即u分布。
• 实际工作中σ往往是s来估计的,这时就是t变换了,其结果就是t分布
抽取1-2个村卫生室,共40所
抽取到医院的儿科医生全部调查
精品课件
某市医务人员甲型H1N1 流感疫苗接种意愿调查
精品课件
背景
• 2009年甲型H1N1流感大流行,防控工作再次成为 全球关注焦点
• 流感疫苗----有效防控流感的手段
精品课件
WHO和我国准备为医务人员优先接种甲型H1N1 疫苗
• 医务人员是特殊群体,非常重要:
三级
18 14400
二级
25 10000
一级
45
2700
合计
88 27100
如何抽样?
精品课件
采用分层二阶段抽样方法
• 第一阶段:先抽医院 • 第二阶段:再抽取医护人员
第一阶段抽取多少医院合适?
精品课件
• 抽取5家? • 抽取10家? • 抽取20家? • 抽取30家? • 抽取50家?
精品课件
精品课件
单纯随机抽样 Simple random sampling (SRS)
将总体的全部观察单位编号,再用随机数字等方法
随机抽取部分观察单位组成样本
例:某中学2100名学生,随机抽200人估计近视率
• 先将所有学生编号:1,2,3,4…,2100
• 查 随 机 数 字 表 6394 0710 6376 3587 0304 7988……
– 3月1日至5月9日共报告6049病例 – 99%的为14岁以下儿童 – 大多数病例以急性发热起病
• EV71重症危险因素研究发现
– 首诊在村级医疗机构 – 氨基比林和激素类药物
精品课件
调查目的
• 了解阜阳市各级医疗机构治疗发热儿童的用药现 状
• 发现存在的问题及影响因素 • 为规范发热儿童用药提供依据
精品课件
• 95%可信区间:以样本信息推论总体时,计算出的 可信区间有95%的概率覆盖总体参数。
高血压患病率为20%(15%-28%) 高血压患病率为1况调查:在沿海地区、山区、平 原地区各随机抽取1个村庄,每个村中再随机抽取100户家 庭,每个家庭的全部成员作为调查对象。
精品课件
分层抽样
• 优点:
– 减少抽样误差,分层后增加层内同质性 – 便于对不同的层采取不同的抽样方法,如城乡分层 – 还可对不同层独立进行分析(各层要满足样本量)
精品课件
整群抽样
先将总体分成若干个群,每个群包括若干观察单位, 再随机抽取k个群,每个群的全部观察单位组成样 本
Population of L strata, stratum l contains nl units
Population of C clusters
Take SRS in every stratum
Take SRS of clusters, sample 精品课件 every unit in chosen clusters
整群抽样
群间差异越小、抽取的“群”越多,精度越高,样 本量确定后,宜增加“群”数而减少群内的观察数 • 学校共有70个班(各个班级情况相似时比较好)
➢ 市、县级医院:每月随机抽取8张,共32张 ➢ 乡镇医院:每月随机抽取4张,共16张 ➢ 村卫生室:每月随机抽取2张,共8张
精品课件
医生:分层多阶段抽样
抽取市(县)、乡镇及村级医疗机构
市、县级医院:8所全部调查 乡镇医院:171所中随机抽取30所 村诊所:在抽中的30个乡镇医院所在乡镇中,分别随机
8401,8402,8403,8404,…9999…10500
1600个数
500个数
精品课件
单纯随机抽样
• 优点:均数(或率)及标准误的计算简单 • 缺点:总体例数多时,需有全部名单,编号
精品课件
系统抽样
将全部观察单位根据某一顺序编号,计算抽样间隔,随机 抽第k号(小于抽样间隔)观察单位,然后依次用相等间 隔抽取观察单位组成样本
精品课件
多阶段抽样
• 单阶段抽样:四种基本抽样方法都是通过一次抽样产生一个 完整的样本
• 多阶段抽样:总体大,情况复杂,分布广,可分若干阶段进 行抽样,每个阶段可用上述四种方法中任意一种进行抽样
• 例:在某省进行某项调查:
o 第一阶段:用系统抽样法随机抽取30个县 o 第二阶段:用SRS法每县抽取10个自然村 o 第三阶段:用SRS法每村抽取10名村民
• 普查(全面调查) • 典型调查(案例调查) • 抽样调查
精品课件
普查 Census
• 人群中每个人都调查 • 没有抽样误差 • 人群很小时可以使用 • 人群数很大时耗费人、财、物力,质量不易控制,
非抽样误差大 • 不适于患病率低和诊断技术比较复杂的疾病 • 无应答率常常较高
精品课件
典型调查(案例调查)
• 在某地区的医院进行医院感染情况的抽样调查,抽中40所 医院。实施过程中,有些医院不配合。可根据医院特征 (如同级、同类、病床数)替换愿意配合的医院。
精品课件
• 调查某地区腹泻患病率,采用多阶段抽样方法。第1阶段: 兼顾地理位置、经济水平、人口数量、工作基础和意愿, 选择A县、B县,C区和D县作为调查点;第2阶段……
两类抽样方法
• 非概率抽样:无法确定被调查对象的概率,无法 推断总体,常用于探索性研究
– 碰巧抽样或方便抽样:超市里走出的前10个人