概率抽样也称随机抽样

合集下载

2013年暨南大学432统计学[专业硕士]考研真题及详解【圣才出品】

2013年暨南大学432统计学[专业硕士]考研真题及详解【圣才出品】

2013年暨南大学432统计学[专业硕士]考研真题及详解一、统计学原理(共75分)(一)简答题(每题10分,共30分)1.简述概率抽样与非概率抽样。

答:(1)概率抽样①定义:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

在概率抽样中,每个单位被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。

②常用的概率抽样方式:简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样。

③概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,可以对估计的精度提出要求,计算出满足特定精度要求的样本量。

④概率抽样的技术含量比较高,无论是抽选样本还是对调查数据进行分析,都要求有较高的统计学专业知识,调查的成本比非概率抽样高。

(2)非概率抽样①定义:非概率抽样是相对于概率抽样而言的,抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

②常用的非概率抽样的方式:方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。

③非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。

也适合市场调查中的概念测试,如产品包装测试、广告测试等。

④非概率抽样的特点是操作简便、时效快、成本低,对于抽样中的统计学专业技术要求不是很高。

2.简述假设检验的基本步骤。

答:假设检验的基本步骤为:(1)根据所研究问题的要求提出原假设H0和备择假设H1,确定显著性水平。

显著性水平为犯第一类错误的概率;(2)根据已知条件确定合适的检验统计量,并确定统计量的分布,根据样本信息计算检验统计量的观测值;(3)根据计算的统计量,查阅相应的统计表,确定p值,将p值与显著性水平α比较,若p≤α,则拒绝H0,接受H1;若p>α,则不拒绝H0。

卫生管理(正高)题库

卫生管理(正高)题库

卫生管理(正高)1、[多选题]反映门诊服务利用的指标有A.就诊率B.来就诊率C.患者就诊百分数D.每人每年平均就诊次数E.来住院率[参考答案]A,B,C,D[答案解析][难易程度]一般2、[多选题]关于社区卫生服务和区域卫生规划的关系,下列叙述正确的是A.发展区域卫生规划是实施社区卫生服务的基础B.区域卫生规划和社区卫生服务均符合卫生资源合理配置的要求C.区域卫生规划是以居民的主要卫生问题为规划依据,社区卫生服务是以居民的卫生需求为根据D.发展社区卫生服务可以使区域卫生规划更符合成本效益E.社区卫生服务以社区为范围[参考答案]B,C,D,E[答案解析][难易程度]一般3、[多选题]关于卫生服务研究,下列叙述正确的是A.卫生服务研究是以卫生服务的供方、需方和第三方作为研究对象的B.卫生服务研究的方法主要是综合评价法C.卫生服务研究可分为卫生系统研究、卫生工作研究、防治效果研究及行为医学研究等D.卫生服务研究的目的是将有限的卫生资源更好地分配和利用E.向居民提供预防、保健、医疗、康复、健康促进等卫生服务[参考答案]A,C,D,E[答案解析][难易程度]一般4、[多选题]关于需要、需求、利用,下列叙述不正确的是A.卫生服务需要都能转化成卫生服务需求B.卫生服务利用不能直接用于评价卫生服务的效果C.卫生服务利用主要取决于卫生服务需求D.卫生服务需要主要反映了居民对健康的一种主观愿望E.卫生服务需要包括个人觉察到的需要和由医疗卫生专业人员判定的需要[参考答案]A,C,D[答案解析][难易程度]一般5、[多选题]初级卫生保健的基本原则A.社会公正B.社区参与C.成本效果和成本效益D.部门间协作行动E.预防为主[参考答案]A,B,C,D,E[答案解析][难易程度]一般6、[多选题]常用的卫生政策分析方法有A.利益相关集团分析B.政策图解法C.政策网络分析D.场力分析法E.SWOT分析[参考答案]A,B,C,D,E[答案解析][难易程度]一般7、[多选题]健康危险因素的分类A.环境危险因素:自然环境和社会环境危险因素B.心理、行为危险因素C.生物遗传危险因素D.医疗卫生服务中的危险因素E.经济因素[参考答案]A,B,C,D,E[答案解析][难易程度]一般8、[多选题]研究疾病分布的意义有A.获得与病因假设有关的资料B.判断疾病的传染性C.获得与流行因素有关的资料D.掌握疾病流行规律和特点E.可为分析流行病学研究提供基础信息[参考答案]A,C,D,E[答案解析][难易程度]一般9、[多选题]生命质量评价的应用包括A.人群健康状况的评定B.疾病负担的评估C.临床疗效的评价D.健康影响因素及防治重点的选择E.其他领域的应用:如保险业等[参考答案]A,B,C,D,E[答案解析][难易程度]一般10、[多选题]卫生费用评价指标有A.卫生费用占有国民生产总值百分比B.人均卫生费用C.卫生各部门的投资比例D.门诊和住院费用构成E.医疗、卫生防疫和妇幼卫生费用的比例[参考答案]A,B,C,D,E[答案解析][难易程度]一般11、[多选题]健康相关生命质量评价包括A.基础病理研究B.生理状态C.心理状态D.社会功能状态E.主观判断与满意度[参考答案]B,C,D,E[答案解析][难易程度]一般12、[多选题]文化影响健康的特征是A.积累性B.无形性C.本源性D.软约束E.稳定性[参考答案]B,C,D,E[答案解析][难易程度]一般13、[多选题]危害健康的行为有A.合理营养B.吸烟C.规律生活D.性行为E.精神过度紧张[参考答案]B,E[答案解析][难易程度]一般14、[多选题]社会经济发展对健康也产生了不利的一面,主要表现在A.环境污染和破坏严重B.不良行为和心理压力突出C.人口数量过多和增长过快,对人类的健康也会产生负面影响D.社会负性事件增多E.社会流动人口增加,不利于计划免疫、传染病控制和妇幼保健工作[参考答案]A,B,D,E[答案解析][难易程度]一般15、[多选题]人口数量与健康之间的关系A.一定的人口规模和数量是社会存在和发展的最基本要素B.人口数量过多和增长过快,对人类的健康也会产生负面影响C.加重社会负担,影响人群生活质量D.加重教育及卫生事业负担,影响人口质量E.加重环境污染和破坏[参考答案]A,B,C,D,E[答案解析][难易程度]一般16、[多选题]调查表的结构主要包括哪几个方面A.说明(指导语)B.资料的登记C.调查项目D.编码E.结尾与备查项目[参考答案]A,C,D,E[答案解析][难易程度]一般17、[多选题]调查表的设计包括哪些步骤A.明确研究目的B.建立问题库C.设计调查表初稿D.初稿修改(试用和修改)E.效度和信度检验[参考答案]A,B,C,D,E[答案解析][难易程度]一般18、[多选题]问题设计的常见错误A.双重装填B.含糊不清C.抽象的问题D.诱导性的问题E.敏感性的问题[参考答案]A,B,C,D,E[答案解析][难易程度]一般19、[多选题]问卷中问题的排列应遵循的原则A.先排列容易回答的,无反感的问题B.先排列封闭式问题,后开放式问题C.按照一定的逻辑顺序排列D.检验信度的问题需要分隔开来E.先排列开放式问题,后排列封闭式问题[参考答案]A,B,C,D[答案解析][难易程度]一般20、[多选题]课题评价的原则是A.需要性原则B.创造性原则C.科学性原则D.可行性原则E.分层抽样[参考答案]A,B,C,D[答案解析][难易程度]一般21、[多选题]下列属于概率抽样的是A.系统抽样B.机械抽样C.分层抽样D.整群抽样E.定额抽样[参考答案]A,C,D[答案解析]概率抽样也称随机抽样,方式有以下几种:一、简单随机抽样。

统计学重点

统计学重点

第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。

第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。

每个单位被抽中的概率是已知的,或是可以计算出来的。

当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。

2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。

(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。

概率抽样的名词解释

概率抽样的名词解释

概率抽样的名词解释概率抽样是一种统计学方法,旨在通过随机抽样来代表总体,从而进行统计推断。

它是基于概率理论的框架下进行的一种抽样方法。

本文将对概率抽样的定义、原理、常见的抽样方法以及其在实际应用中的重要性进行深入阐述。

一、概率抽样的定义和原理概率抽样是指在进行样本抽取时,通过使用概率理论和统计学原理,按照一定的随机性进行抽样的方法。

其目的是保证抽出的样本对于总体的代表性,从而可以通过对样本的研究状况,推断出总体的特征。

概率抽样的基本原理是每个个体被抽中的概率是已知的,并且每个个体被抽中是相互独立的。

二、常见的抽样方法1. 简单随机抽样:该方法是一种基本的抽取方法,以随机的方式从总体中抽取相同大小的样本。

简单随机抽样可以保证样本具有较高的代表性,但是在复杂的总体中抽取时有一定的困难。

2. 系统抽样:该方法是将总体中的个体按照一定顺序排列,并根据所设定的抽样间隔,从排列中按照固定规则抽取样本。

系统抽样相对简单,并且适用于总体中个体的数量是已知的情况。

3. 分层抽样:该方法将总体按照某些特征划分为多个层次,然后在每个层次中进行简单随机抽样。

分层抽样能够更好地保证样本的代表性,尤其适用于总体的特征分布不均匀的情况。

4. 整群抽样:该方法将总体划分为多个相似的群体,然后仅随机抽取部分群体进行研究。

整群抽样适用于群体内个体的特征相似、群体间特征差异较大的情况。

三、概率抽样在实际应用中的重要性概率抽样在实际应用中具有重要的意义。

首先,通过概率抽样得到的样本可以准确地代表总体,从而使得对总体特征的推断具有可靠性。

其次,概率抽样能够提供精确的抽样误差估计,帮助研究人员评估样本的可靠性。

此外,概率抽样还可以为后续的数据分析提供基础,如建立回归模型、计算置信区间等。

然而,概率抽样也存在一些限制和挑战。

首先,进行概率抽样需要对总体有一定的了解和描述,而在实际应用中,总体的特征可能是复杂而多样的,这给抽样带来困难。

其次,概率抽样可能会因为抽样误差、非响应率等问题导致样本的偏倚。

中级经济师-经济基础知识-基础练习题-第二十五章抽样调查-二、几种基本概率抽样方法

中级经济师-经济基础知识-基础练习题-第二十五章抽样调查-二、几种基本概率抽样方法

中级经济师-经济基础知识-基础练习题-第二十五章抽样调查-二、几种基本概率抽样方法[单选题]1.某单位共有职工1500人,其中管理人员300人,其余为普通员工,现采取分层抽样法抽取容量为200的(江南博哥)样本调查员工薪酬,那么管理人员、普通员工抽取的人数分别为()A.50,150B.40,160C.100,100D.60,140正确答案:B参考解析:先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。

如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。

样本量占总体容量的比=200÷1500。

所以,抽取管理人员数量=(200÷1500)×300=40人,抽取普通员工数量=(200÷1500)×1200=160人[单选题]5.最基本的随机抽样方法是()。

A.分层抽样B.简单随机抽样C.系统抽样D.整群抽样正确答案:B参考解析:本题考查简单随机抽样。

简单随机抽样是最基本的随机抽样方法。

[单选题]6.某校高三年级学生共1000人参加考试,将1000份试卷编好号码后,从中随机抽取30份计算平均成绩,此种抽样方法为()。

A.简单随机抽样B.系统随机抽样C.分层随机抽样D.整群抽样正确答案:A参考解析:本题考查简单随机抽样。

简单随机抽样分为有放回简单随机抽样和不放回简单随机抽样。

本题所述是不放回简单随机抽样。

[单选题]7.对农作物单位面积产量进行调查,按平原、丘陵、山区分组来抽选样本单位,然后在不同的组内独立、随机地抽取样本,此种抽样方法为()。

A.整群抽样B.分层抽样C.多阶段抽样D.简单随机抽样正确答案:B参考解析:本题考查分层抽样。

分层抽样是先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本。

[单选题]8.在大规模的抽样调查中,很有必要采用的调查方法是()。

A.分层抽样B.系统抽样C.整群抽样D.多阶段抽样正确答案:D参考解析:本题考查多阶段抽样。

统计学题库(3))贵州财经大学

统计学题库(3))贵州财经大学

简答题1.什么是描述统计?什么是推断统计?①描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

②推断统计是研究如何利用样本数据来推断总体特征的统计方法。

2.举例说明离散型变量和连续型变量?①离散型变量是只能取可数值的变量,它只能去有限个值,而且其取值都是以整位数断开,可以一一列举,如企业数,产品数量。

②连续型变量是可以在一个或多个中间取任何值的变量,它的取值是连续不断的,不能一一列举,如年龄,温度,零件尺寸的误差。

3.什么叫概率抽样?它具有哪些特点?概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会呗选入样本。

特点:①抽样时是按一定的概率以随机原则抽取样的。

②每个单位被抽中的概率是已知的,或是可以计算出来的。

③当样本对总体目标进行估计时,要考虑到每个样本单位被抽中的概率。

4.概率抽样方式有哪几种?非概率抽样可归纳为哪几种?概率抽样:简单随机抽样,分层抽样,整群抽样,系统抽样,多阶段抽样。

非概率抽样:方便抽样,判断抽样。

自愿抽样,滚雪球抽样。

配额抽样。

5.数据的预处理包括哪些内容?①数据审核就是检查数据中是否有错误。

②数据筛选是根据需要找出符合特定条件的某类数据。

③数据排序是指按一定的顺序,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。

6.制作统计表应该注意哪些问题?①要合理安排统计表的结构。

②表头一般应包括表号总标题和表中数据等内容。

③表中的上下两天横线一般用粗线,中间其他线要用细线。

④在使用统计表时,必要时可在表达下方注释,特别注意注明数据来源。

7.简述众数中位数和平均数的特点和应用场合。

①众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;优点:不受极值的影响。

缺点:具有不唯一性;只有数据量较大时才有效果②中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。

《抽样技术复习题》

《抽样技术复习题》

《抽样技术》期末复习1、设计效应(Deff )答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y)=,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差.设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。

如果deff 〈 1,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果deff > 1,则所考虑的抽样设计比比简单随机抽样的效率低。

deff 对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量n '比较容易得到,如果可以估计复杂抽样的deff ,那么复杂抽样所需的样本量为:n = n deff '⨯。

2、概率抽样答:概率抽样也称随机抽样。

概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。

具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。

(2)每个单元被抽中的概率是已知的,或是可以计算出来的.(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。

也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关.概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。

从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目.因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本.3、非抽样误差答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。

同抽样误差相比,非抽样误差有如下特点:(1)非抽样误差不是由于抽样的随机性带来的,所以在抽样调查中,它不可能随着样本量的增大而减小。

(2)在抽样调查中,由于非抽样误差的影响,往往造成估计量的有偏。

抽样方法

抽样方法
广东商学院华商学院经济系
模拟市场调查大赛
4、滚雪球抽样
(1)定义:先选择一组调查单位,对其实施调查 之后,再请他们提供另外一些属于研究总体的调 查对象,调查人员根据所提供的线索,进行此后 的调查。这个过程持续下去,就会形成滚雪球效 应。 (2)特点: ①适合于对稀少群体和特定群体研究; ②优点:容易找到那些属于特定群体的被调查者, 调查的成本也比较低。
“随机数表”
(5)例题:从班上50个同学中抽取10个同学参加 某项活动,采用“随机数表法”进行抽样。
广东商学院华商学院经济系
模拟市场调查大赛
2、分层抽样(stratified sampling)、
在上面的例题中,“从班上50个同学中抽取10个同学 参加某项活动”,若班男生30人,女生20人,按照性别 之比,在抽取的10个同学中,应该男生6人,女生4人, 如此才能保证男女生性别上的公平。但在实际操作中,采 用简单随机抽样进行抽样,得到的样本,男女生之比会出 现偏离3:2的情况,即会出现性别上不公平的现象,因此 我们需要对简单随机抽样进行改进,得到分层抽样。
模拟市场调查大赛
抽样方法
主讲 石立
广东商学院华商学院经济系
模拟市场调查大赛
调查数据往往是通过从总体中抽取样本进行 调查,抽取样本的方法直接影响着样本的可信度, 常用的抽样方法有两大类,各五种方法:
一、概率抽样:简单随机抽样;分层抽样; 整群抽样;系统抽样;多阶段抽样 二、非概率抽样:方便抽样;判断抽样;自 愿样本;滚雪球抽样;配额抽样
广东商学院华商学院经济系
模拟市场调查大赛
2、判断抽样
(1)定义:研究人员根据经验、判断和对研究对 象的了解,有目的选择一些单位作为样本。 (2)特点: ①判断抽样是主观的,样本选择的好坏取决于调研 者的判断、经验、专业程度和创造性; ②抽样成本比较低,容易操作 ③样本是人为确定的,没有依据随机的原则,调查 结果不能用于对推断总体
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概率抽样也称随机抽样1.概率抽样也称随机抽样2.特点按一定的概率以随机原则抽取样本●抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样1.从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的2.最基本的抽样方法,是其它抽样方法的基础3.特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便4.局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样1.将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差系统抽样1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难多阶段抽样1.先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查二阶抽样中群是初级抽样单位,第二阶段抽取的是最终抽样单位。

将该方法推广,使抽样的阶段数增多,就称为多阶段抽样2.具有整群抽样的优点,保证样本相对集中,节约调查费用3.需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开4.在大规模的抽样调查中,是经常被采用的方法非概率抽样1.相对于概率抽样而言2.抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查3.有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式方便抽样1.调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查2.优点:容易实施,调查的成本低3.缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体判断抽样1.研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本有重点抽样,典型抽样,代表抽样等方式2.判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性3.抽样成本比较低,容易操作4.样本是人为确定的,没有依据随机的原则,调查结果不能用于推断总体自愿样本1.被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本2.自愿样本与抽样的随机性无关样本是有偏的不能依据样本的信息推断总体滚雪球抽样1.先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。

这个过程持续下去,就会形成滚雪球效应2.适合于对稀少群体和特定群体研究3.优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低配额抽样1.先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位2.操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似3.抽取具体样本单位时,不是依据随机原则,属于非概率抽样概率抽样与非概率抽样的比较1.概率抽样依据随机原则抽选样本样本统计量的理论分布存在可根据调查的结果推断总体2.非概率抽样不是依据随机原则抽选样本样本统计量的分布是不确定的无法使用样本的结果推断总体抽样误差1.由于抽样的随机性所带来的误差2.所有样本可能的结果与总体真值之间的平均性差异3.影响抽样误差的大小的因素样本量的大小总体的变异性非抽样误差1.相对抽样误差而言2.除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异3.存在于所有的调查之中概率抽样,非概率抽样,全面性调查4.有抽样框误差、回答误差、无回答误差、调查员误差、测量误差误差的控制1.抽样误差可计算和控制2.非抽样误差的控制调查员的挑选调查员的培训督导员的调查专业水平调查过程控制●调查结果进行检验、评估●现场调查人员进行奖惩的制度分类数据的图示—饼图1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题3.绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定环形图1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究4.用于展示分类和顺序数据数值型数据的整理与展示组中值= (下限值+上限值)/2分组数据—直方图1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图分组数据—直方图(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据未分组数据—茎叶图1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数字6. 茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据未分组数据—箱线图1.用于显示未分组的原始数据的分布2.由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数M e和两个四分位数(下四分位数Q L和上四分位数Q U)连接两个四分位数画出箱子,再将两个极值点与箱子相连接该箱线图也称为Median/Quart./Range箱线图时间序列数据—线图1.表示时间序列数据趋势的图形2.时间一般绘在横轴,数据绘在纵轴3.图形的长宽比例大致为10 : 73.一般情况下,纵轴数据下端应从“0”开始,以便于比较。

数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断多变量数据—雷达图1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度众数1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据中位数1.排序后处于中间位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据4.各变量值与中位数的离差绝对值之和最小,即四分位数1.排序后处于25%和75%位置上的值2.不受极端值的影响3.计算公式平均数1.也称为均值2.集中趋势的最常用测度值3.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.有简单平均数和加权平均数之分6.根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为?x简单平均数设一组数据为:x1 ,x2 ,… ,x n (总体数据x N)离中趋势1.数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值极差1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布R = max(x i) - min(x i)平均差1.各变量值与其平均数离差绝对值的平均数2.能全面反映一组数据的离散程度3.数学性质较差,实际中应用较少方差和标准差1.数据离散程度的最常用测度值2.反映了各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差(标准差),记为σ2(σ);根据样本数据计算的,称为样本方差(标准差),记为s2(s)样本方差和标准差。

相关文档
最新文档