第二章 统计数据的整理

第二章 统计数据的整理
第二章 统计数据的整理

第二章统计数据的整理

【学习目标】

本章主要介绍有关统计数据整理的基础知识,包括数据整理的含义及其重要性、数据整理的内容、数据分组的意义、分组的类型和方法、经济统计中的常用分类、分配数列的含义和类型、一些分配数列中的概念、变量数列的编制方法、统计表的构成和编制、各种统计图的绘制等,这些内容对以后学习统计数据的描述有着重要的作用。学习时要求掌握统计数据整理的最基本理论,在此基础上熟练掌握主要的整理操作方法,能够根据不同的统计原始数据编制相应的分配数列,并能根据所编制的数列编制恰当的统计表和绘制适当的统计图。

【重点难点】

1.数据整理的内容

2.数据分组的类型和方法

3.经济统计中的常用分类

4.变量数列的编制方法

5.统计表的编制

6.各种统计图的绘制

【学习内容】

第一节统计整理的意义和内容

一、统计数据整理的意义

统计数据整理,就是根据统计研究的任务与要求,将调查所得到的大量原始资料进行科学的加工、分类、汇总,使之条理化、系统化,得出能够反映总体综合特征的统计资料的工作过程。大量数据收集上来以后,并不能直接用来分析,因为这些数据间的差异仍然体现为一种原始的无序的状态,只有经过整理后我们才能找出现象的规律性。例如,通过人口普查,可以取得每个人的性别、年龄、民族、文化程度和婚姻状况等个体资料,这仅说明单个人的具体情况,然而,通过对普查人口资料的整理,就可以得到全国及各地区的人口总数、人口性别结构、民族构成、年龄结构等反映全国人口综合特征的统计资料,达到对全国人口的全

面、系统的认识。

统计数据的整理工作在统计工作过程中具有十分重要的地位,它实现了从调查得到的大量个别单位的标志表现向说明总体数量特征的指标数值的过渡,是人们对社会经济现象从感性认识上升到理性认识的连接点。同时,统计整理又是统计分析的前提,如果不对统计资料进行整理,就得不到必要的统计分组和变量数列,也得不到科学合理的统计图表,就无法计算统计分析指标,也就谈不上进一步的统计分析了。可见,统计数据整理既是统计调查的继续和深化,同时又是统计分析的基础和前提,具有承前启后的作用。如果这一步工作搞不好,将会使调查来的丰富、完备的资料失去价值,从而也不能达到统计工作的目的和完成统计工作的任务。

二、统计数据整理的内容

统计数据整理的内容主要包括以下几个方面:

(一)统计数据的预处理——调查资料的审核

为了确保统计工作的质量,在统计调查资料汇总整理前,首先要做好原始资料的审核和检查工作。因为资料一经汇总,原始资料中的差错就会被掩盖起来,会影响到整个统计工作的质量,故在整理之前必须对调查资料作严格审查。对原始资料的审核主要包括以下三个方面:

1.及时性

审核资料的及时性,是检查资料是否符合调查方案规定的时间以及资料是否按规定的时间报送等。任何单位的资料不能及时取得,都将会影响整个统计工作的进程,对于某些时效性较强的问题,如果统计数据过于滞后,就失去了研究的意义。

2.完整性

审核资料的完整性,一是检查调查表是否都已收齐;二是要检查调查表中所填写的项目有无遗漏,是否齐全等。对于不完整的资料,应采取适当的措施加以补救,避免出现大的数据偏差。

3.正确性

审核资料是否正确是审核资料的重点。审核办法主要有以下两种:一是逻辑检查法。即检查调查资料各项目之间的关系是否合乎逻辑,有无不合理或相互矛盾的现象。例如,人口调查中,少年儿童年龄段的居民不应有婚姻情况,人口数量不应小于家庭户数;工业调查中,工业总产值应大于工业净产值,全年产值应大于每个季度的产值,等等。二是计算检查法。即检查资料的统计口径和范围、计算方法和计量单位是否符合要求;统计数字有无差错;有关指标间的平衡关系是否得到保持等。例如,审核中要注意各单项之和是否等于小计,小计

之和是否等于合计,各横行纵栏的合计有无错误等。

通过审核发现错误以后,要分别不同情况及时纠正和处理。对弄虚作假、虚报瞒报、伪造篡改统计资料的,要按《统计法》严肃处理。统计资料的审核是一项严肃细致的工作,一定要认真对待,不可草率从事。

(二)统计数据的分组和汇总

这是整个统计整理工作的核心内容,如何对调查资料进行科学分组,我们将在本章第二节中详细介绍。按分组要求进行汇总,即通过计算机或手工将原始资料的各种标志值汇总、计量,得出总体指标。统计汇总有逐级汇总和集中汇总两种基本组织形式。

(三)编制统计表和绘制统计图

根据现象之间的内在联系和统计分析的要求,将总体有关数量关系编制在一张表上,就形成了统计表,统计表使统计资料的表现更加明白、清晰。统计图是表现统计资料的另一种更直观、更形象的手段。有关统计表和统计图的详细内容,我们将在本章第四节中介绍。

第二节统计分组

一、统计数据分组的涵义

统计分组是按照某种标志将统计总体划分为若干个组成部分的一种统计方法。总体的组成部分称为“组”。统计分组的基本作用,在于使数据资料条理化。合理的分组将总体划分为组间差异较大、组内差异较小或没有差异的若干部分,这就便于进一步的分析研究。例如,在人口统计中,我们除了掌握全部人口的总数量外,还要按照性别、年龄、民族等标志把人口总体区分为各种不同的组,汇总计算各组的各种标志值,来丰富、完善我们对人口总体的认识。统计分组可以反映总体的分布特征,说明总体的结构,使我们对总体的认识深化,更好地揭示事物的本质和规律。

统计分组在整个统计工作中占有十分重要的地位。它不仅是统计整理的基础,而且是统计分析的基本方法。

二、统计数据分组的类型

(一)字符型分组和数值型分组

1.字符型分组

字符型分组是指选择反映事物属性差异的品质标志作为分组标志进行分组,并在该品质标志的变异范围内划定各组的界限,将总体划分为若干个性质不同的组成部分。例如,人口按性别、民族、职业、文化程度等分组;企业按所有制形式、隶属关系、地区、规模等分组

都是字符型分组。

2.数值型分组

数值型分组是指选择反映事物数量差异的数量标志作为分组标志进行分组,在数量标志的差异范围内划定各组界限,从而将总体分为性质不同的若干个组成部分。如企业按职工人数、计划完成百分比、资金利税率分组;学生按身高或学习成绩分组;职工按工资、年龄分组等等,都是按数量标志分组。按数量标志分组的目的并不是单纯确定各组的数量差别,而是通过数量变化来区分各组的不同类型和性质。

(二)简单分组、复合分组和分组体系

在统计整理中,为了全面认识被研究对象总体的数量特征,常常需要运用多个分组标志对总体进行分组,形成一系列相互联系、相互补充的统计分组体系。统计分组体系有平行分组体系和复合分组体系两种重要形式。

1.简单分组与平行分组体系

对总体只按一个分组标志进行分组称为简单分组。简单分组只反映现象在某一标志特征方面的差异情况。

同一总体选择两个或两个以上标志分别进行简单分组,平行排列起来,即成为平行分组体系。例如,对国民收入积累额的研究,可以进行以下平行分组,形成分组体系。

国民收入积累额

(1)按用途分:

生产性

非生产性

(2)按性质分:

固定资产

流动资产

平行分组体系中,各个分组都是彼此独立的,没有相互包含关系。它们各有侧重,相互补充,形成对总体全貌的完整认识。

2.复合分组与复合分组体系

对同一个总体选择两个或两个以上的标志重叠或交叉起来进行分组,叫复合分组。复合分组的结果即形成复合分组体系。

按多个标志分组和分组的层叠(或交叉)形成是复合分组体系的两个基本特点。具体地说,复合分组就是先按某一主要标志将总体分为若干组,再按其他有关辅助标志,对各组进行更细的分组,从而形成一种具有许多层次的分组组合形式。例如,对国民收入积累额的研

究,可以作如下复合分组:

国民收入积累额:

按用途分按性质分

固定资产

生产性

流动资产

固定资产

非生产性

流动资产

通过复合分组,可以从多角度对现象总体内部差别进行描述,反映问题全面深入。进行复合分组时,首先应合理安排好各个分组标志的主次关系,以及由此决定的分组层次。这样,才能做到主次分明,层次清楚。另外,分组标志不宜太多,因为复合分组体系的总组数是各分组标志所分组的乘积,每增加一个分组标志,就会增加一个分组层次,组数也会成倍增加,从而使资料显得冗长、繁琐。一般以两个分组标志为宜,最多不要超过三个分组标志层叠分组。

在实际工作中,平行分组体系和复合分组体系常常是结合运用的。

三、统计分组的原则和方法

统计分组的关键问题是正确选择分组标志和划分各组的界限,它们不仅直接影响统计分组的科学性和统计资料整理的准确性,而且也影响统计分组结果的真实性。

(一)统计数据分组的原则

科学的统计分组,应遵循以下几项原则:

1.必须坚持组内统计资料的同质性和组间资料的差异性,这是统计分组的一个基本原则。

2.必须遵循穷举性和互斥性原则。所谓穷举性,是指每一个总体单位都能归到某一组;而互斥性是指每一个总体单位只能归属于一组,不能同时归属于两个或两个以上的组。

(二)分组标志的选择

正确地选择分组标志是统计分组的核心。分组标志就是作为分组依据的标志。分组标志一经选定,就突出了总体在此标志下的性质差异,同时也将总体在其他标志下的性质差异给掩盖了。分组标志选择的是否恰当,关系到能否正确反映总体的数量特征及其变化规律,对同一总体采用不同的标志分组,其结果也不相同。如果分组标志选择不恰当,不但不能显示

出所研究总体的基本特征,而且可能歪曲事物的本来面目,得出错误的结论。

分组标志的选择应根据统计研究的目的和任务,结合现象所处的具体历史条件和经济条件,选择能够反映事物本质特征或主要特征的标志分组。

(三)分组界限的划分

分组标志确定以后,区分各组性质差别界限是十分重要的,各组之间界限的划分正确与否,直接影响统计分析结果的真实性。

对于字符型分组,各组之间界限的划分在许多情况下是比较简单的,作为分组标志的品质标志一经确定,组的名称和组数也就确定了,不存在组与组之间界限难以划分的困难。如人的性别、民族分组等。但有些品质标志的涵义抽象繁杂,各组间性质差异不太明确,从这一组到另一组存在各种过渡状况,边缘不清,这种分组比较复杂。例如,国民经济的行业分类中,由于各部门都是在社会分工发展过程中逐渐形成的,工业首先从农业中分离出来,随后又从工业中分离出来了一些其他物质生产部门和非物质生产部门,这是一个由量变到质变的渐进过程,因此,工业与农业,工业与其他物质生产部门之间也必然存在着一些过渡形态。这些过渡状态是划归工业,还是划归其他物质生产部门,就是一个很复杂的物质分类问题。在实际工作中,为了使这些复杂的分类在全国有个统一的分类标准,国家统计局及中央有关部门,统一制定有关各种分类目录与规定标准,如《国民经济分类目录》、《大中小型工业企业划分标准》、《工业部门分类目录》、《工业产品目录》等等,供全国各地区、各部门、各单位分类时使用。完善统计分类目录,做到分类标准化是统计工作现代化的重要标志。

数值型分组,由于作为分组标志的数量标志的变异表现为许多不同的变量值,这些单个的变量值只能反映现象数量上的差异,不能明确地反映现象性质上的区别,达不到统计研究的目的,因此分组的关键是掌握决定事物质的差异的数量界限。划分数量界限时,通常要考虑到每组的数量界限与事物本质特征的联系,以及进一步计算分析的需要,一般来说,组数不宜太多或太少,太多或太少均不能反映被研究对象的特点。关于这方面的具体划分办法,将在本章第三节中作详细介绍。

四、社会经济统计中的常用分类

(一)经济类型分类

经济类型分类是以生产资料的所有制性质和国家的有关法规作为划分的依据,我国国家统计局1998年9月新颁布的《关于统计上划分经济成分的规定》中,为了反映我国经济中所有制成分的构成情况,为宏观决策和管理提供依据,将我国国民经济的所有制构成类型划分为两大类五小类。

1.公有经济(包括国有经济和集体经济)

2.非公有经济(包括私有经济、港澳台经济和外商经济)。

其中,公有经济是指资产归国家或公民集体所有的经济成分,包括国有经济和集体经济。国有经济是指资产归国家所有的经济成分;集体经济是指资产归公民集体所有的经济成分。非公有经济是指资产归我国内地公民私人所有或归外商、港澳台商所有的经济成分,包括私有经济、港澳台经济和外商经济。私有经济是指资产归我国内地公民私人所有的经济成分;港澳台经济是指资产归港澳台商所有的经济成分;外商经济是指资产归外商所有的经济成分。

新的经济成分类型的划分办法,在我国坚持党的十五大提出的以公有制为主体,多种经济成分共同发展的决策下,为观察我国经济结构变化提供了一个更为准确、全面的工具,也为我国社会主义市场经济体制的建立提供了一个重要基础。人们可以更为清楚地认识我们所处的经济社会的构成和性质,宏观决策就有了更准确全面的依据。

(二)三次产业分类

三次产业分类是目前世界上许多国家使用较多的一种产业结构划分方法,用以研究三次产业的内部结构、比例关系及其发展变化情况,反映社会分工及社会经济活动发展的不同阶段,也是我国国民经济核算的基础,其划分方法为:

第一产业:农业,包括种植业、林业、牧业和渔业等。

第二产业:工业(包括采掘业、制造业、自来水、电力、蒸汽、热水、煤气等供应业)和建筑业。

第三产业:除上述第一、二产业以外的其他各业。

根据我国的实际情况,第三产业可分为两大部分:一是流通部门;二是服务部门。具体又可分为四个层次。

第一层次:流通部门,包括交通运输业、邮电通讯业、商业饮食业、物资供销和仓储业。

第二层次:为生产和生活服务的部门,包括金融、保险业,地质普查业,房地产业,公用事业,居民服务业、旅游业,咨询信息服务业和各类技术服务业等。

第三层次:为提高科学文化水平和居民素质服务的部门,包括教育、文化、广播电视事业,科学研究事业,卫生、体育和社会福利事业等。

第四层次:为社会公共需要服务的部门,包括国家机关、党政机关、社会团体,以及军队和警察等。

(三)行业分类

行业分类又称产业分类或部门分类,它是按主要产品同质性原则对基层单位进行部门分类,将国民经济划分成各个行业,以便搜集这些行业的资料,研究国民经济的产业结构、比

例关系及其发展变化情况。在新国民经济核算体系中,它是核算国民生产总值,编制投入产出表及经济循环帐户中的产业部门生产帐户的依据。目前,我国新的行业分类共分16个门类、92个大类、368个中类、848个小类。其16个门类为:

1.农、林、牧、渔业;

2.采掘业;

3.制造业;

4.电力、煤气及水的生产和供应业;

5.建筑业;

6.地质勘探业、水利管理业;

7.交通运输、仓储及邮电通信业;

8.批发与零售贸易、餐饮业;

9.金融、保险业;

10.房地产业;

11.社会服务业;

12.卫生、体育和社会福利业;

13.教育、文化艺术及广播电影电视业;

14.科学研究和综合技术服务业;

15.国家机关、党政机关和社会团体;

16.其他行业。

(四)机构部门分类

这是新国民经济核算体系中部门分类的另一种重要的分类。机构部门分类是根据机构单位的性质进行的分类。机构单位是指那些有权拥有和处理、承担负债,能够从事经济活动并与其他经济实体进行交易的经济实体单位。根据我国目前的实际情况,独立核算单位可视同为机构单位。我国新国民经济核算体系中,在编制资金流量表、资产负债表和经济循环帐户时,都需采用机构部门分类。根据实际情况,将机构单位具体划分为以下五大部门:1.企业部门(非金融企业部门)。由除金融企业以外的所有常住独立核算企业组成,包括各种经济类型的企业,但不含个体经营单位,因为个体经营单位在资产负债、财务收支方面很难独立于居民户的消费活动。

2.金融部门(金融企业)。由从事金融活动的所有常住独立核算企业组成。包括中国人民银行、各商业银行、信用社、保险公司、信托投资公司等。

3.行政事业单位。由独立核算行政事业单位(包括政党和社会团体)组成。

4.财政部门。仅指国家行使财政收支管理的职能,包括中央财政和地方财政。这是为核算经济运行中国家财政在集中资金和分配资金方面与各机构部门之间往来关系而设的虚拟部门,不是指经济实体。作为经济实体的各级财政机构则属于行政事业部门。

5.居民部门。由所有常住居民住户组成,其中包括为住户所有的个体经营单位。

以上每个机构部门都可根据需要再细分为若干个子部门。如金融部门可以细分为银行、保险公司、信托投资公司等。

第三节分配数列

一、分配数列及其构成要素

(一)分配数列的概念

在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分配数列或分布数列。分配数列实质上是把总体单位数按组进行分配,所以又称为次数分配数列或次数分布数列。

分配数列在统计研究中具有重要的意义,它是统计整理结果的一种重要表现形式,也是统计分析的一种重要方法。它表明总体单位分布的特征和结构状况,并在这一基础上进一步研究标志的构成、平均水平及变动的规律性。

(二)分配数列的构成要素

分配数列由两个要素构成:一个是总体按某标志所分的组;一个是各组所占的总体单位数,称为次数或频数。各组次数与总体总次数的比率称为频率。如表1—2—1所示,它表明我国第五次人口普查时,大陆人口在性别上的分布情况。

表1—2—1 中国(大陆)人口性别构成情况表

(2000年11月1日)

根据表1—2—1的资料我们可以看出,各组的频率大于0,所有组的频率总和等于1或100%。

在变量数列中,频率越大表明该组标志值对于总体水平所起的作用也越大;反之,频率

越小,表明该组标志值对于总体水平所起的作用越小。频率表明对应组标志值的作用强度,也表明各组标志值出现的概率的大小。按顺序列出各组变量值和相应的频率,称为变量分布,也称统计分布。在本节的最后我们将介绍几种常见变量分布类型。

有时为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计有由低到高累计和由高到低累计的方法。由低到高累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下所有数值所占的比重;由高到低累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上所有数值所占的比重。

二、分配数列的种类

根据分组标志的形式不同,分配数列可分为品质分配数列和变量分配数列两种。

(一)品质分配数列

按品质标志分组形成的分配数列叫品质分配数列,简称品质数列。如表1—2—1所示分配数列,即为品质分配数列。

(二)变量分配数列

按数量标志分组形成的分配数列称为变量分配数列,简称变量数列。如人口按年龄分组、职工按工资分组、工业企业按增加值分组等形成的数列都是变量数列。

变量数列反映了总体在一定时期内量的状态及量变过程,按照变量值在各组是否存在变动范围,又可分为单项数列和组距数列两种。

1.单项数列

单项数列是指以一个变量值为一组,按顺序排列而形成的分配数列。如表1—2—2所示,即为单项数列。

表1—2—2 1998年北京市家庭户型资料

一般地,只有离散型随机变量在取值不多且变量值的变动范围不大时,才适合编制单项数列。如表1—2—2中,由于家庭的人口数取值数量有限,且每一个取值都能代表一种类型,

因而可以采用单项数列来反映其分布。当变量值变动幅度很大时,如果仍采用单项数列,就势必会出现次数太多,不便于分析问题,也难以反映总体的分布趋势,这时就需要采用组距数列。

2.组距数列

组距数列是指以一定范围的变量值为一组,按顺序排列而形成的数列。如表1—2—3所示,即为组距数列。

组距数列每组的变量组值采取“由多少至多少”的形式来表示,没有具体的变量值。

当某一离散型随机变量值较多或变量值的差异很大时,宜编制组距数列;当分组变量为连续型随机变量时,一般应编制组距数列,因为只有采用组距式分组,才能保证所有可能出现的变量值无一遗漏地包括在内。但是,有些变量本质上是连续型的,而在实践中常常用整数计量,如年龄用“岁”,体重用“公斤”计量等,这时可按离散型随机变量处理,因此,当连续型随机变量当作离散型随机变量看待时,可以编制单项数列或组距数列。

三、变量数列的编制

(一)单项数列的编制

单项数列的编制是把所有变量值按大小排序,并按组归类排列,再把各组单位数经综合后填入相应的各组次数栏中即可。

(二)组距数列的编制

组距数列的编制有如下步骤:

1.将原始资料按其数值大小排列

只有把得到的原始资料按其数值大小排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。

2.确定全距

全距是变量值中最大值和最小值的差数(或距离),又称极差,一般用符号R表示。

R=最大变量值—最小变量值

确定全距,主要是确定变量值的变动范围和变动幅度。

3.确定组距和组数

组距是每组最大值和最小值的差数(或距离),一般用符号d 表示。

组距的大小和组数的多少,是互为条件和互相制约的。对一个具体的分组对象而言,其全距一定,组距大,组数就少;组距小,组数就多。那么,在组距数列中,究竟分多少个组,组距多大为好,美国学者斯特基斯于1926年提出了一种计算组数的公式,在总体单位数不是较少或较多时,可供参考使用。他是把二项展开式的各项系数之和作为总体单位数N,把二项展开式的项数当作组数m ,有N=x 2(其中,x =m -1),则x =lg N /lg2,因为m =x +1,所以组数为:

m =1+

+

=12

lg lg N N

N lg 322.3130103

.0lg +=

在实际工作中,我们一般是先确定组距,再根据全距和组距确定组数。确定组距时,除了要考虑组距的大小,还要明确整个组距数列是采用等距还是异距分组。所谓等距分组是各组的组距都相等,这种分组一般用于变量的变动比较均匀或情况比较稳定的现象。所谓异距分组是指各组的组距不都相等,又称不等距分组。这种分组主要是在有些现象的变量分布很不均匀,存在明显的偏斜,或现象的变量变异范围很大,组与组间的性质变化是由变量值的非均匀增长造成的情况下采用。如人口按年龄分组,大城市商场按营业额分组等,一般都采用异距分组。

在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组内统计资料的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。在实际应用中,组距最好是5或10的整数倍。

在等距分组条件下:组数=全距/组距 4.确定组限和组限的表示方法

组限是各组变量值的极端值,是组与组间的分界点。其中,各组的最小变量值称为下限,最大变量值称为上限。显然,组距=上限-下限。

组限要根据变量的性质来确定,如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,即每组都有下限和上限的分组方法;反之,如果变量值相对比较分散,为了不出现空白组,更好地反映总体的分布情况,则应采用开口式,即最小组只有上限,用“××以下”表示,最大组只有下限,用“××以上”表示的分组方法。在采用闭口式时,应做到最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。

组限的表示方法有两种:一种是用重叠组限来表示;另一种是用不重叠组限来表示。所谓重叠组限是指低一组的上限与高一组的下限用同一数值表示的组限。所谓不重叠组限是指

低一组的上限与高一组的下限分别用两个不同的数值表示的组限。连续型变量由于其变量值不能一一列举,任何两个具体数值之间都有无穷多个数值,其组限只能用重叠组限来表示,如表1—2—3中的组限。而对于离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法。如企业按工人人数分组,可以采用不重叠组限表示为:

99以下 100-499 500-999 1000以上

也可以采用重叠组限表示为: 100以下 100-500 500-1000 1000以上

采用不重叠组限表示法时,组距的计算是变量值高一组的下限与本组下限之差。如上例中100-499这一组,其组距应是500-100=400,而非499-100=399。这是因为400这个组距即包括100这个变量值,也包括499这个变量值。

采用重叠组限时,习惯上规定各组不包括其上限的单位,即所谓“上组限不在内”的原则。如表1—2—3中,完成计划正好为100%的企业应统计到第三组(100-110)中。

在组距分组资料的情况下,计算平均指标时需要利用组中值作为各组标志值的代表值来计算。所谓组中值,就是每组上限与下限的中点值。其计算公式为:

闭口组的组中值=

2

下限

上限+

只有上限的开口组组中值=2相邻组组距

上限-

只有下限的开口组组中值=2

相邻组组距

下限+

5.编制变量数列

经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中,有时还应根据需要计算各组的频率,也列入表中,组距数列的编制就完成了。

四、几种概率分布类型

概率是用以衡量随机事件发生可能性大小的一种度量(数值)。

一个试验,如果它满足以下三个条件:一是试验可以在相同的条件下重复进行;二是试

验的所有可能结果是明确可知的,并且不止一个;三是每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果。就称这样的试验是一个随机试验。若一个随机试验全部可能出现的基本结果有n 种,则称该试验是由n 个基本事件构成,我们所关心的事件A是由其中m (m ≤n )个基本事件构成的,事件A发生的概率为

n

m ,记为:

n

m A P =

)(

概率的取值范围与频率一样,介于0与1之间。

对于一个随机事件来说,它发生可能性大小的度量是由其自身决定的,并且是客观存在的。就好比一根木棒有长度,一块土地有面积一样。实践表明,如果我们重复进行某一随机试验,随着试验次数的增多,事件A出现的频率会逐渐稳定于某一个常数,这个常数就是事件A在一次试验中发生的概率。频率与概率之间关系的实质,就象用尺或仪器测量长度一样,给定一根木棒,谁都不会怀疑它有自身的客观长度,至于长度是多少,我们可以用尺或仪器去测量,不论尺或仪器有多么精确,测得的数值总是稳定在木棒真实的长度附近,我们也总是把测得的数值当作木棒真实的长度。

(一)离散型随机变量的分布

离散型随机变量的概率分布由离散型随机变量x 的取值i x (=i 1,2,3,…,n )及其相应的概率P (i x )组成。统计学中,又称P (x )为x 的概率密度函数。显然,离散型随机变量的概率密度函数P (x )满足以下两个条件:(1)0≤P (i x )≤1;(2)∑P (i x )=1。

常用的离散型随机变量概率分布主要有二项分布、几何分布、超几何分布和Poisson 分布等。

1.二项分布

贝努里试验——如果随机试验只有两种可能结果:A 与A (A 是A 的对立事件),其中A 出现的概率为P (A )=p ,A 出现的概率为P (A )=1-p=q ,则称此实验为贝努里试验。

n 重贝努里试验——将贝努里实验在相同的条件下重复独立地进行n 次的试验。 二项分布是重复抽样的概率分布。在n 重贝努里试验中,事件A 出现的次数,即样本中包含A 事件的个数x 是一个离散型随机变量。那么,在上述的n 次试验中,A 事件恰好发生k 次,即变量x 取值为k 的概率为:

P (x=k )=k n C k n k q p - k =0,1,2,3,…,n

由于这一分布的概率与二项式n q p )(+的展开式各项相同,所以称为二项分布,记作:x~b (k ;n ,p )。

二项分布具有以下特点:(1)二项分布的概率随x 的增加而逐渐变大,达到最大值后,又随x 的增加而逐渐变小。(2)当P (A )=P (A )=0.5时,二项分布完全对称,整个分布呈一钟形。随着n 的不断增加,趋于一条光滑曲线,即正态分布曲线。(3)若P (A )≠P (A ),则概率分布不对称而向左右偏斜。但当实验次数n 足够大时,概率分布不断趋于正态分布。

2.几何分布

在n 重贝努里实验中,实验进行到第x 次事件A 才发生的概率为: P (x=k )=p 1-k q k =1,2,3,…,n

由于这一分布的概率p 1

-k q 与几何级数∑∞

=-1

1i k pq 的一般项相同,所以称为几何分布,

记作:x ~g (k ;p )。

3.超几何分布

例子:设有一批产品共N 件,其中有M 件次品,从中任取n 件,以x 表示n 件中的次品数,则P (x=k )=

n

N k

n M

N k

M C

C C --? k =0,1,2,3,…,min{n,M }

以上式为分布列的概率分布称为超几何分布,记作:x~H (k ;n ,M ,N )。 4.Poisson 分布

设随机变量x 的概率分布为: P (x=k )=

λ

λ

-e

k k

!

k=0,1,2,3,…

其中λ>0为常数,则称x 服从参数为λ的Poisson 分布,记作:x~P (k ;λ)。 Poisson 定理:设随机变量数列{n x }(n =1,2,3,…)服从二项分布,若当∞→n 时,n n p λ→(λ>0为常数),则有λ

λ

-∞

→=

e

k p n k b k

n n !

),;(lim k =0,1,2,…

定理表明,若事件A 发生的次数x~b (k ;n ,p ),当n 充分大,而每次试验中事件A 发生概率p 很小时,x 近似地服从参数为λ的Poisson 分布。根据此定理,可以在符合上述定理的条件下,利用查Poisson 分布表的方法简化二项分布的计算。利用Poisson 分布,

可以描绘大量重复试验中稀有事件出现的频数k =0,1,2,…的概率分布情况。例如,飞机被子弹击中的次数;纱锭的纱线被扯断的次数;大量产品中不合格品的数量;一年中出现暴雨的次数;一页书中出现的印刷错误次数;数字通讯中传输数字时发生误码的个数等等,都相当近似地服从Poisson 分布。

(二)连续型随机变量的分布

连续随机变量的概率是用分布函数F (x )来表示的。分布函数F (x )的定义为: F (x )=?

-=

≤x

dt t f x X P )()( f (x )>0,且1)(=?

+∞

-dx x f -∞<x <+∞

式中,f (x )称为F (x )的密度函数。

在连续分布的情况下,P (X=x )=0,P (a ≤X ≤b )是以f (x )及x=a ,x=b 与x 轴所围的面积表示的,可以用式子表示为:

P (a ≤X ≤b )=?b

a dx x f )(=F (

b )-F (a )

用图形表示就是图1—2—1中阴影部分的面积。

图1—2—1

显然,连续型随机变量的密度函数是其分布函数的导函数。即)()(x F x f '= 1.正态分布

在连续型随机变量中,最重要最常用的是具有钟形概率分布的随机变量,如图1—2—2所示。

图1—2—2

这样的随机变量人们称它为正态随机变量,相应的概率分布称为正态分布。由于高斯在研究误差理论时曾用它来刻划误差,因此又称高斯分布。

正态分布的定义:如果随机变量X 的概率密度为22

2)(21

)(σ

μπ

σ--=

x e

x f

-∞<x <+∞,则称X 服从正态分布,记作:X~N (μ,2σ),其中μ∈(-∞,+∞),σ

>0。μ称为随机变量X 的数学期望,也叫均值,σ称为随机变量X 的标准差,它们是正态分布的两个参数。

正态分布的特点:(1)f (x )≥0,即整个概率密度曲线都在x 轴的上方;(2)曲线f (x )关于x=μ对称,并在x=μ处达到最大值;(3)σ决定曲线的陡缓,σ越大,曲线越平缓,变量发散程度越大,σ越小,曲线越陡峭,变量发散程度越小。(4)当x →±∞时,曲线以x 轴为渐近线。

2.标准正态分布

当μ=0,σ=1时的正态分布称为标准正态分布。记作:x~N (0,1)。 此时,其密度函数为:2

2

21)(x

e

x -

=

π

? -∞<x <+∞

分布函数为:?

?

--

-=

=

Φx

t

x

dt e

dt t x 2

2

21)()(π

?

标准正态分布的分布函数值(概率)可以通过查正态分布查对表查得,而普通正态分布则可以通过如下变换,转换成标准正态分布:

设x~ N (μ,2σ),则σ

μ

-=x U ~N (0,1)。

3.2χ(卡方)分布

2

χ分布是分别由海尔墨特和卡·皮尔生于1875年和1900年导出的,它是从正态分

布派生出来的一个分布,在统计学中占有重要地位。

设随机变量X~N (0,1),n 个随机变量(1X ,2X ,3X ,…,n X )是X 的一个样本,且1X ,2X ,3X ,…,n X 相互独立,则2

χ=∑==

++++n

i i

n

X X

X X X 1

2223

22

2

1

也是一

个随机变量,它的分布称为自由度为n 的2χ分布,记作:2χ~2χ(n )。所谓自由度是指不受任何约束,可以自由变动的变量的个数。

2

χ分布的分布函数比较复杂,

其密度函数曲线与自由度n 有关,如图1—2—3所示。

图1—2—3

从图1—2—3中可以看出,随着自由度k 的增大,图形渐渐接近正态分布曲线。 4.t 分布

设X 、Y 为两个独立的随机变量,X~N (0,1),Y ~2χ(n ),则称随机变量t =n

Y X 服

从自由度为n 的t 分布,记作:t ~t (n )。

t 分布的概率密度曲线与标准正态分布的概率密度曲线很相似。当自由度n <30时,t 分布比正态分布随机变量的变动范围稍微大一些,如图1—2—4所示;当n ≥30时,t 分布与正态分布几乎没有区别,所以当自由度n 很大时,t 分布近似于N (0,1)。

图1—2—4

5.F分布

设X 、Y 为两个独立的随机变量,X ~2

χ(1n ),Y ~2

χ(2n ),则称随机变量F =

2

1n Y

n X 服

从第一自由度为1n ,第二自由度为2n 的F 分布,记作:F~F (1n ,2n )。

F 分布的概率密度曲线与1n ,2n 有关,如图1—2—5所示。

x

图1—2—5

第四节 统计表和统计图

统计资料的表现形式主要有统计表、统计图和统计分析报告。其中,统计图表是最常用的形式。 一、统计表

将统计整理的结果,按一定的顺序排列在表格上,这种表现统计资料的表格叫统计表。广义的统计表包括统计工作各个阶段中所用的一切表格。包括统计调查表、统计整理表、统计分析计算表等。

统计表以表格、数字为语言,清晰明了地说明社会经济现象,既科学,又实用,既简练,

又美观。它能使大量的统计数字系统化、条理化,便于对客观现象的各个角度进行对照比较、分析现象或过程的内在联系。统计表还易于检查和改正统计数字的错误,以及便于统计资料的积累与保管,因而在实际工作中被广泛采用。

(一)统计表的构成

1.从外形上看,统计表主要由总标题、横行标题、纵栏标题和指标数值四部分组成。

如表1—2—4所示。

总标题

值(主词)(宾词)

总标题是统计表的名称,用以概括说明统计表的内容,一般写在表的上端中央。

横行标题是横行的名称,用来说明统计资料反映的总体及其分组名称,它代表统计表所要说明的对象,一般写在表的左方。

纵栏标题是纵栏的名称,用来说明各组统计指标的名称,一般写在表的上方。

指标数值列在各横行标题和各纵栏标题的交叉处,是用来说明总体及其组成部分数量特征的各种统计数字。

此外,有些统计表在表的下端还列有补充资料、注解、附记、资料来源、某些指标的计算方法、填表说明、填表单位、填表人等表脚。

2.从内容上看,统计表由主词和宾词两部分组成。如表1—2—4所示。

主词是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部。主词一般列在横行标题的位置。

宾词是说明总体的统计指标,包括指标名称和指标数值两部分。

主词和宾词的位置不是固定不变的,而是可以互换的,特别是主词分组太多时,为了将统计表设计得更为合理、清晰,往往将一些分组移到宾词栏中。

(二)统计表的种类

广义的统计表按用途可分为:调查表、汇总表或整理表、分析表等。一般来讲,统计表是指狭义上的统计表,即专门用于统计整理或分析的表。按分组程度不同,统计表分为以下三类:

统计学第二章 统计数据的收集、整理与显示试题及答案

第二章统计数据的收集、整理与显示 二、单项选择题 1、人口普查的调查单位是(C )。 A、每一户 B、所有的户 C、每一个人 D、所有的人 2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 3、下列调查中,调查单位与填报单位一致的是(D )。 A、企业设备调查 B、人口普查 C、农村耕畜调查 D、工业企业生产经营现状调查 4、抽样调查与重点调查的主要区别是(D )。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。 A、简单随机抽样 B、等距抽样 C、整群抽样 D、类型抽样 6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。 A、全部网点 B、每个网点 C、所有从业人员 D、每个从业人员 7、调查时限是指(B )。 A、调查资料所属的时间 B、进行调查工作的期限 C、调查工作登记的时间 D、调查资料的报送时间 8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。 A、该市全部商业企业 B、该市全部商业企业的职工 C、该市每一个商业企业 D、该市商业企业的每一名职工 9、作为一个调查单位(D )。 A、只能调查一个统计标志 B、只能调查一个统计指标 C、可以调查多个统计指标 D、可以调查多个统计标志 10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。 A、一天 B、一个月 C、一年 D、一年零一个月 11、统计分组对总体而言是( B ) A、将总体区分为性质相同的若干部分 B、将总体区分为性质不同的若干部分 C、将总体单位区分为性质相同的若干部分 D、将总体单位区分为性质不相同的若干部分 12、按某一标志分组的结果表现为( B )

第2章统计数据的描述

第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频数)频率% A1414 B2121 C3232 D1818

E1515 合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。即得到如下的条形图: 700716728719685709691684705718 706715712722691708690692707701 708729694681695685706661735665 668710693697674658698666696698 706692691747699682698700710722 694690736689696651673749708727 688689683685702741698713676702 701671718707683717733712683692 693697664681721720677679695691 713699725726704729703696717688 (1)利用计算机对上面的数据进行排序;

统计学第二章数据收集、整理与显示

第二章数据搜集、整理与显示 Ⅰ.学习目的 本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求: 1.了解统计数据的类型及其搜集方法; 2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合; 3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。 Ⅱ.课程内容要点 第一节数据的搜集 一、数据搜集 数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。 数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。 数据的计量尺度有四种 定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。 定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度。定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。 定距尺度是对事物类别或次序之间间距进行的一种测度。定距尺度不仅

能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。 定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。 从不同方面数据划分为不同类型。 根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。 根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。 根据数据的搜集方法,可以将数据分为观察数据和实验数据。 根据数据的来源渠道,可以将数据分为直接数据和间接数据。 二、数据搜集的方法 数据搜集的方法有直接观察法、报告法(通讯法)、采访法、登记法和实验设计调查法。 三、统计调查的形式 普查是一种非经常性的全面调查,通过普查可以掌握大量、详细、全面的资料。 统计报表制度是依照国家有关法规自上而下地统一布置,按照统一的表式、统一的项目、统一的报送时间和程序,自下而上地逐级地定期地提供统计资料的一种调查方式。 抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出科学推断。 重点调查是在调查对象中,只选择一部分重点单位进行的非全面调查。重点调查的前提是必须存在重点单位。 典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。典型调查有解剖麻雀型和划类选典型两种类型。

统计学第二章数据的搜集

1 了解某年全国规模以上工业企业生产和销售情况,则调查对象为( )。 A、工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:D 我的答案:D得分:4.0分 2 了解某年全国规模以上工业企业生产和销售情况,则调查单位为( )。 A、每一个规模以上工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:A 我的答案:A得分:4.0分 3 统计调查可以收集的资料是( )。 A、数字资料 B、原始资料和次级资料 C、只能是原始资料 D、不能是次级资料 正确答案:B 我的答案:B得分:4.0分 4 按调查的组织形式分,统计调查可分为( )。 A、全面调查和非全面调查 B、连续调查和不连续调查 C、统计报表和专门调查 D、重点调查和典型调查 正确答案:C 我的答案:A得分:0.0分 5 乡镇企业局为总结推广先进管理经验,选择几个先进乡镇企业调查,这种调查为( )。 A、抽样调查 B、典型调查 C、重点调查 D、普查 正确答案:B 我的答案:B得分:4.0分 6 调查几个铁路枢纽,了解我国铁路货运量的基本情况和问题,这种调查方式属于( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 正确答案:C 我的答案:C得分:4.0分 7

抽样调查和重点调查的主要区别是( )。 A、原始资料来源不同 B、取得资料的方法不同 C、调查的单位数多少不同 D、抽取调查单位的方式方法不同 正确答案:D 我的答案:D得分:4.0分 8 经常性调查与一次性调查的划分,是以( )。 A、调查组织划分的 B、最后取得的资料是否全面来划分的 C、调查对象所包括的单位是否完全划分的 D、调查登记的时间是否连续来划分的 正确答案:D 我的答案:D得分:4.0分 9 重点调查的重点单位是指( )。 A、标志值很大的单位 B、这些单位的单位总量占总体全部单位总量的绝大比重 C、这些单位的标志总量占总体标志总量的绝大比重 D、经济发展战略中的重点部门 正确答案:C 我的答案:C得分:4.0分 10 在统计调查中,总体单位和调查单位( )。 A、是一致的 B、是不一致的 C、是一致或不一致的 D、一般是一致的 正确答案:C 我的答案:C得分:4.0分 二.多选题(共5题,20.0分) 1 统计调查( )。 A、取得的有原始资料和次级资料 B、调查中首先考虑的是取得第一手资料 C、调查的主要要求是经济性 D、可分为全面调查与非全面调查 正确答案:AD 我的答案:得分:0.0分 2 统计调查的要求是( )。 A、准确性 B、全面性 C、具体性 D、及时性 正确答案:ABD 我的答案:ABD得分:4.0分 3 普查属于( )。

统计学 第2章 统计数据的描述

第2章统计数据的描述 练习: 2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的 等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业, 105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 2.3某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 2.4为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果 如下: 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701

第二章 统计数据的描述

第二章统计数据的描述 一、填空题: 1.统计分组有等距分组与异距分组两大类。 2. 频率是每组数据出现的次数与全部次数之和的比值。 3. 统计分组的关键在于确定组数和组距。 4. 统计表从形式上看,主要由表头(总标题)、横行标题、纵栏标题和数字资料(指标数值)四部分组成。 5. 均值是测度集中趋势最主要的测度指标,标准差是测度离散趋势最主要的测度指标。 6.当平均水平和计量单位不同时,需要用变异系数(离散系数)来测度数据之间的离散程度。 7.众数是一组数据中出现次数最多的变量值。 8.对于一组数据来说,四分位数有 3 个。 二、单项选择题: 1. 次数是分配数列组成的基本要素之一,它是指( B )。 A、各组单位占总体单位的比重 B、分布在各组的个体单位数 C、数量标志在各组的划分 D、以上都不对 2. 某连续变量数列,其末组为600以上。又如其邻近组的组中值为560,则末组的组中值为 ( D )。 A、620 B、610 C、630 D、640 3. 变量数列中各组频率的总和应该是( B )。 A、小于1 B、等于1 C、大于1 D、不等于1 4. 某连续变量数列,其首组为500以下。又如其邻近组的组中值为520,则首组的组中值为 ( C )。 A、460 B、470 C、480 D、490 5. 在下列两两组合的指标中,哪一组的两个指标完全不受极端数值的影响(D ) A、算术平均数和调和平均数 B、几何平均数和众数 C、调和平均数和众数 D、众数和中位数 6. 在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距应取(D )

A、9.3 B、9 C、6 D、10 7. 一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤.据此数据可以推断( B) 用变异系数算 A、男生体重的差异较大 B、女生体重的差异较大 C、男生和女生的体重差异相同 D、无法确定 8. 某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12.据此数据计算的结果是( A ) 众数12 中位数12 平均数12 A、均值=中位数=众数 B、众数>中位数>均值 C、中位数>均值>众数 D、均值>中位数>众数 9. 按连续型变量分组,最后一组为开口组,下限值为2000。已知相邻组的组距为500,则最后一组组中值为(B ) A、2500 B、2250 C、2100 D、2200 10. 下列数据是某班所有学生的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69,77,66,87,85,95,86,78,86,45,87,92,73,82。这些成绩的极差是(B) A、78 B、50 C、45 D、40 11. 下列关于众数的叙述中,不正确的是( C ) A、一组数据可能存在多个众数 B、一组数据可能没有众数 C、一组数据的众数是唯一的 D、众数不受极端数值的影响 三、多项选择题: 1. 下列分组哪些是按品质标志分组?(BCDE ) A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按所有制分组 E、人口按地区分组 F、职工按收入水平分组 2. 下列分组哪些是按数量标志分组(AF )。 A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按所有志分组 E、人口按地区分组 F、职工按收入水平分组 3. 下列哪些属于离散程度的测度指标(BDE )。 A、几何平均数 B、极差 C、中位数 D、方差 E、离散系数 4. 下列哪些属于集中趋势的测度指标(AC )。

第二章 统计数据的搜集习题

第二章统计数据的搜集 练习题 一、填空题 1.常用的统计调查方式主要有、、、、等。 2.典型调查有两类:一是;二是。 3.统计调查按调查对象包括的范围不同可分为、。 4.确定调查对象时,还必须确定两种单位,即和。 5.重点调查是在调查对象中选择一部分进行调查的一种调查。 6.询问调查具体包括、、、、、等。 7.访问调查的方式有、。 8.邮寄调查的问卷发放方式有、、三种。 9.根据观察者是否使用科学的观察仪器,观察可分为和。 10.调查表一般由、和三部分组成。 11.就一般的统计数据而言,其质量评价标准为、、、、、。 二、单项选择题 1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。 A普查B典型调查C抽样调查D重点调查 2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。 A统计报表B重点调查C全面调查D抽样调查 3.人口普查规定统一的标准时间是为了( )。 A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便 4.以下哪种场合宜采用标准式访问( )。 A居民入户调查B座谈会C当事人或知情者个别采访D观察法 5.某地进行国有商业企业经营情况调查,则调查对象是( )。 A该地所有商业企业B该地所有国有商业企业 C该地每一国有商业企业D该地每一商业企业 6.以下哪种调查的报告单位与调查单位是一致的( )。 A 工业普查B工业设备调查C职工调查D未安装设备调查 7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。 A原始资料来源于基层单位,次级资料来源于上级单位 B次级资料是由原始资料加工整理而成 C原始资料与次级资料之间无必然联系 D原始资料与次级资料没有区别 8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。 A单一表和复合表B单一表和一览表

统计数据的整理和显示习题

第三章统计数据的整理和显示习题 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2);(3)。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题 1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( ) A简单表B简单分组表C复合分组表D汇总表 9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( )

统计数据的整理

第三章统计数据的整理 一、填空题 1、综合平均 2、简单分组复合分组 3、统计分组的关键在于分组标志的选择 4、人口按性别民族职业分组属于按品质标志分组人口按年龄,工资分组属于按数量标志分组 5、统计复合分组表:是指主词按两个或两个以上标志进行层叠分组的统计表 6、可量性综合性 7、简单分组复合分组 8、百分数或倍数复名数 9、调查单位报告单位 10 、总体单位总量总体标志总量 二、简答题 1、统计资料整理的一般程序:编制整理纲要、统计资料的审核、统计资料的分类汇总、编制统计表。 2、统计分组有何作用:区分事物的性质,反映总体的内部结构,描述统计变量的分布状况研究现象之间的依存关系。 3、统计分组:根据统计研究的目的和被研究现象的本质特征,将统计总体按照一定的标志划分为若干性质不同的部分或组。 4、数量指标是用绝对数形式表现的,用来反映总体规模大小、数量多少的统计指标,其数值大小一般随总体范围的大小而增减。质量指标是说明总体内部数量关系和总体单位水平的统计指标,其数值大小不随总体范围的大小而增减。 5、比例相对指标有反映总体结构的作用,与结构相对指标有密切联系。所不同的是二者对比方法的不同,说明问题的点不同,比例相对指标反映的比例关系是一种结构性比例,一般侧重有一个经验数据。(2)强度相对指标也反映一种比例关系,相对比例相对指标而言,它所反映的是一种依存性比例而非结构性比例,不存在经验数据。 6、编制数量指标指数和质量指标指数应遵循的一般原则是:数量指标指数要使用基期的质量指标作为同度量因素,而质量指标指数要使用报告期的数量指标作为同度量因素,称之为“数基质报”原则。 三、计算题 1、 某公司日商品销售额分组

第二章 统计数据收集与整理

第二章
第二章 统计数据的初步整理
教学要点: 第一节 统计调查方案设计 第二节 统计分组 第三节 统计图表

第二章
第一节 统计调查方案设计
一、统计调查的组织形式 二、统计数据搜集的方法 三、统计调查方案设计 四、统计调查的要求

第二章
一 统 计 调 查 组 织 形 式
全面调查
(1)普查(general survey) (2)统计报表(Statistical report forms)
非全面调查
(1)抽样调查(Sampling survey) (2)重点调查(Key-point investigation) (3)典型调查(Model survey)
划类选典式(representation) 解剖麻雀式(typical survey)

第二章
二 统 计 数 据 搜 集 的 方 法
数据搜集方法有询问调查和观察实验两大类。 询问调查 (1)访问调查(如 Delghi法) (2)邮寄调查 (3)电话调查 (4)电脑、报刊等 媒体辅助调查 (5)座谈会 (6)个别深度访问 观察与实验 (1)观察法 调查人员边观察边 记录以收集信息的 方法。 (2)实验法 在设定的条件下, 对调查对象进行实 验取得所需资料的 方法。

第二章
三 统 计 调 查 方 案 设 计
1.确定调查目的 2.确定调查对象和调查单位 3.确定调查纲要及指标体系,统一 指标口径 4.确定调查项目拟定调查表
项目少而精,规范,以数字信息为主。 单一表 一览表
5.确定调查时间和调查期限 6.制定调查的组织实施计划

第二章 统计数据的描述

第二章统计数据的描述 一、单项选择题 1.当数据呈对称分布或接近对称分布时,应选择( )作为集中趋势的代表值。 A .众数 B .均值 C .中位数 D .几何平均数 2.( )是用来对两组数据的差异程度进行相对比较的。 A .标准差 B .离散系数 C .平均差 D .全距 3.由组距数列确定众数时,如果众数相邻两组的次数相等时,则( )。 A .众数为零 B .众数就是那个最大的变量值 C .众数组的组中值就是众数 D .众数就是当中那一组的变量值 4.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为( ) A 24 B 25 C 26 D 27 5.两组数据相比较( )。 A.标准差大的离散程度也就大 B.标准差大的离散程度就小 C .离散系数大的离散程度也就大 D.离散系数大的离散程度就小 6.某连续变量分为5组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,则( ) A.50在第一组,70在第四组 B.60在第三组,80在第五组 C.70在第三组,80在第五组 D.80在第四组,50在第二组 7.若某总体次数分布呈左偏分布,则成立的有()。 A.x >e M >o M B.x o M >e M D.以上都不对 8.统计分组的依据是() A.标志 B.指标 C.标志值 D.变量值 9.统计分组的关键在于() A.正确选择分组标志 B.正确划分各组界限 C.正确确定组数和组限 D.正确选择分布数列种类 10.在全距一定的情况下,组距的大小与组数的多少成() A.正比B.反比C.无比例关系D.有时成正比有时成反比 11.按某一标志分组的结果表现为() A.组内同质性,组间同质性 B.组内同质性,组间差异性 C.组间差异性,组间同质性 D.组间差异性,组间差异性 12.不能全面反映总体各单位标志值变异程度的标志变异指标是() A.全距B.平均差C.标准差 D.标准差系数 13.某单位职工最大年龄与最小年龄之差称为该单位职工年龄的 ( ) A.标 志 B.全距 C.平均差 D.众 数 14.某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( )。 A. 10% B. 7.1% C. 7% D. 11%

第二章 统计资料的搜集与整理习题

第二章统计资料的搜集与整理习题 一、填空: 1.统计数据收集是根据统计研究预定的目的和任务,运用科学的,有计划、有组织地反映客观现实的统计资料的过程。答案:调查方法,收集 2. 搜集统计数据的方法有:(1)直接观察法,(2),(3)(4)。答案:报告法,采访法,登记法 3. 统计调查按搜集资料的组织方式不同,可以分为普 查、、、。抽样调查,重点调查,统计报表制度 4.我国现行的统计调查体系是:以必要的周期性的普查为基础,经常性的为主体,同时辅之以、科学推算和部分全面报表综合运用的统计调查方法体系。答案:抽样调查,重点调查 (2),(3)(4)5.统计调查的方案一般包括如下几项内容:(1)明确调查目的, (5)(6)(7)。答案:确定调查对象和调查单位,设计调查项目,设计调查表格和问卷,确定调查时间,确定调查的组织实施计划,调查报告的撰写6.数据整理是对统计调查所搜集到的各种数据进行,或是对已有的综合统计资料进行再整理。答案:分类和汇总 7.数据整理的程序包括:(1)统计资料的审核,(2),(3)或绘制统计图,(4)统计资料的积累、保管和公布。答案:资料的分组和汇总,编制统计表 8.根据统计研究的目的和客观现象的内在特点,按(或几个标志)把被研究的总体划分为若干个的组,称为统计分组。答案:某个标志,不同性质 9.统计分组,必须遵循两个原则:和。答案:穷尽原则,互斥原则 10.统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为的那一组内,即所谓“上限在不内”原则。答案:下限值 11. 统计分组必须先对所研究现象的作出全面、深刻的分析,确定所研究现象的属性及其内部差别,而后才能够选择出反映事物本质特征的分组标志。答案:本质 二、单选题 1.统计调查对象是() A.总体各单位标志值 B.总体单位 C.现象总体 D.统计指标答案:C 2.我国统计调查体系中,作为“主体”的是() A.经常性抽样调查 B.必要的统计报表 C.重点调查及估计推算 D.周期性普查答案:A 3.要对某企业生产设备的实际生产能力进行调查,则该企业的“生产设备”是() A.调查对象 B.调查单位 C.调查项目 D.报告单位答案:A 4.对银行职工进行调查,调查对象是() A.所有银行

统计学数据处理的基本思路

统计学数据处理的基本思路 数据的整理是数据收集与数据分析之间的中间环节数据整理是对收集来的数据进行加工整理使之符合统计分析的需要。如对数据进行图表显示,以发现数据中的基本规律。数据整理的中心任务就是分组与编制频数分布表。 而数据处理的主要步骤又包括以下几点:数据的预处理,数据的分组,数据的整理与显示,统计表。 数据整理是所以步骤的第一步,也最为重要。统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上启下的作用。 其中,在数据的预处理中,把混在原始数据中的“异常数据”排除、把真正有用的“信息”提取出来。因此,对异常数据的剔除就显得尤为重要,其中又包含多种方法,主要有1、根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。2、给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。 比如,在对一个班的同学的身高做调查的时候,可以依据常识,在列表中对那些明显不符合的数据做剔除处理,即身高中出现2米多的数据,依常识不可能。 再则,预处理完毕后,则需要对数据进行分组。通过分类发现数据内部的特点。例如,在对全班身高进行整理后得到数据,可以对之进行不同的分组,如分男女生,如分不同高度段等等。通过分组发现数据内部结构的特点。即有所谓的类型分组,分析分组,结构分组等等。 第三,就是数据的整理与显示。包括的重点有:1、频数(落在各类别中的数据个数。)2、频率(某一类别数据的频数占总体单位个数的比重。)3、频数分布(把频数以表格形式全部列出就是~绘制频数分布表的演示操作(调用Excel文件:分类数据的整理)4、比例(各类数据与全部数据之比)5、百分数(把比例基数100化比率:各类数据间的比值)。 这些处理是下一步的前提与基础,为绘图做准备,比如在对全班身高完成分组后,可以依据一定的需要,对其进行整理与显示,如要研究男女身高的差异,可以分别理出男女身高的平均数,频数,频率,频数分布,比例,百分比等等数据。然后根据需要对其进行显示。 最后一步,就是绘图。其中不同的需要目的需要不同的图形予以显示。图形主要有条形图,直方图,饼状图,折线图等等。以条形图为例,长度表示各类频数的多少,而宽度则一般固定。用于显示各数据直观上的绝对多少。其他图形依然。 所以,综上述,基本思路即包括数据的预处理,数据的分组,数据的整理与显示以及绘图。(由于不会word绘图功能,故相关事例绘图滤去)

统计数据的整理[1]

统计数据的整理 一、统计整理 (一)定义:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。对已整理过的资料(包括历史资料)进行再加工也属于统计整理。(二)意义: 1、通过统计调查可以取得第一手资料,但这种资料只能反映总体各单位的具体情况,是分散、零碎、表面的。要说明总体情况,揭示出总体的内在特征,还需要对这些资料进行加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。 2、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。统计调查所搜集到的资料,只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识社会的过程中,实现由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。 3、统计整理还是积累历史资料的必要手段。统计研究中经常要用动态分析,这就需要有长期累积的历史资料,而根据积累资料的要求,对已有的统计资料进行筛选,以及按历史的口径对现有的统计资料重新调整、分类和汇总等,都必须通过统计整理工作来完成。 (三)程序: 1、设计整理方案: 分组和分组体系; 统计指标 2、对搜集到的资料进行审核:对调查资料进行审核是统计整理的第一步,包括以下内容: (1)完整性和及时性 完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。 及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。(2)审核资料的正确性: 审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种: ①逻辑检查: 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。 例:一张调查表中,年龄是9岁,职业是教师,其中必有一个是错误的。 若在某行业的报表中,企业规模为大型,而职工人数则是100人,这其中也必有一错。 其次,是检查各项目之间有无相互矛盾的地方。 例:企业的净产值大于同期总产值就是明显的逻辑错误。 ②计算检查: 即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。 例:各分项之和 = 总计 各比例之和 = 100%

第二章 统计数据的描述习题及答案

第一章统计数据的描述习题及答案 1.简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。 2.为什么要计算离散系数? 答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。 3.某百货公司6月份各天的销售额数据如下(单位:万元): 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值: 或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数: 由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而: 同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而: (2)未分组数据的标准差计算公式为:

第二章、统计数据的搜集与整理

第二章、统计数据的搜集与整理 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1.在某市工业设备普查中,调查单位是()。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 该市全部工业企业中的每一台工业生产设备 2.某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商场、超市随机调查了200名顾客。该公司采用的调查方法是()。 A. 直接观察法 B. 报告法 C. 访问法 D.很难判断 3.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调查组织方式是()。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 4. 统计资料按数量标志分组后,处于每组两端的数值叫()。 A. 组距 B. 组数 C. 组限 D. 组中值 5. 统计表中的主词是指()。 A. 统计表的横行标题 B. 统计表的纵栏标题 C. 统计表所要说明的总体 D. 说明总体的统计指标 6.某电视台要对一知名栏目的收视情况进行调查,宜采用() A.普查 B.重点调查 C.抽样调查 D.典型调查 7.在全距一定的情况下,若编制等距变量数列,则组距的大小与组数的多少()。 A.成反比 B.成正比 C. 有时成正比有时成反比 D. 无关系 8.统计表的宾词是()。 A.说明总体的统计指标 B.总体单位的名称 C.统计表的类型 D.说明总体的性质 9.调查单位是() A.调查研究的总体或调查范围 B.调查项目的承担者或载体 C.填报单位 D.调查对象 10.按“上组限不在内”原则,凡遇到某标志值刚好等于相邻组上、下限时,一般是() A.将此值归入上限所在组 B. 将此值归入下限所在组 C.将此值归入上限所在组或下限所在组均可 D.另设一组

最新第二章 统计数据的搜集习题

第二章统计数据的搜集习题 一、填空题 1.常用的统计调查方式主要有、、、、等。 2.典型调查有两类:一是;二是。 3.统计调查按调查对象包括的范围不同可分为、。 4.确定调查对象时,还必须确定两种单位,即和。 5.重点调查是在调查对象中选择一部分进行调查的一种调查。 6.询问调查具体包括、、、等。 7.访问调查的方式有、。 8.邮寄调查的问卷发放方式有、、三种。 9.根据观察者是否使用科学的观察仪器,观察可分为和。 10.调查表一般由、和三部分组成。 11.就一般的统计数据而言,其质量评价标准为、、、、、。 二、单项选择题 1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。 A普查B典型调查C抽样调查D重点调查 2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。 A统计报表B重点调查C全面调查D抽样调查 3.人口普查规定统一的标准时间是为了( )。 A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便 4.以下哪种场合宜采用标准式访问( )。 A居民入户调查B座谈会C当事人或知情者个别采访D观察法 5.某地进行国有商业企业经营情况调查,则调查对象是( )。 A该地所有商业企业B该地所有国有商业企业 C该地每一国有商业企业D该地每一商业企业 6.以下哪种调查的报告单位与调查单位是一致的( )。 A 工业普查B工业设备调查C职工调查D未安装设备调查 7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。 A原始资料来源于基层单位,次级资料来源于上级单位 B次级资料是由原始资料加工整理而成 C原始资料与次级资料之间无必然联系 D原始资料与次级资料没有区别 8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。 A单一表和复合表B单一表和一览表 C简单表和复合表D简单表和一览表 9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。这种调查方式是( )。 A典型调查B重点调查C抽样调查D普查 10.统计调查的基本任务是取得原始统计资料,所谓原始统计资料是( ) A统计部门掌握的资料B对历史统计资料进行整理后取得的资料 C直接向调查单位进行登记所取得的资料D统计年鉴或统计公报上发布的资料

第二章 统计数据的搜集

第二章统计数据的搜集 第一节统计数据的来源 统计数据是研究实际问题必不可少的重要资料。从统计数据本身的来源看,统计数据都来源于直接的调查或实验。但从使用者的角度看,统计数据主要来源于两种渠道:一是直接的调查和科学实验,这是统计数据的直接来源,称之为第一手或直接的统计数据;二是别人调查或实验的数据,这是统计数据的间接来源,称之为第二手或间接的统计数据。本节从使用者的角度讲述统计数据的搜集方法。 一、统计直接调查 统计直接调查即为取得统计数据而专门组织的调查。其中有统计部门进行的统计调查,也有其他部门或机构为特定目的而进行的调查,如市场调查。统计直接调查是统计数据的主要来源,也是获得直接统计数据的重要手段。实际中常用的统计直接调查方式主要有普查、抽样调查、重点调查、典型调查、统计报表等。 (一)普查 普查是为某一特定目的而专门组织的一次性全面调查,如人口普查、农业普查、工业普查、第三产业普查、基本单位普查等。世界各国一般都定期进行各种普查,以便掌握有关国情、国力的基本统计数据。它主要是用以搜集某些不能或不宜用定期的全面统计报表搜集的统计资料。普查是适合于特定目的、特定对象的一种调查方法,主要用于搜集处于某一时点状态上的社会经济现象的数量,目的是掌握客观现象总体的基本面貌,为国家制定有关政策或措施提供依据。 普查作为一种特殊的调查方式,具有以下几个特点: 第一,普查是不连续的定期调查。由于调查涉及面广、调查单位多、需耗费大量的人力、物力、财力和时间,一般需要间隔较长的时间进行一次,比如每隔10年进行一次。如我国的人口普查从1953年到2000年共进行了五次。今后,我国的普查将规范化、制度化,即每逢末尾数字为“0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢“1”或“6”的年份进行基本单位普查。 第二,普查一般需要规定统一的标准时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。普查的标准时间是指普查资料的所属时间。如我国第一到第四次人口普查的标准时间定为普查年份的7月1日0时,第五次全国人口普查的标准时间为2000年11月1日0时,第一次农业普查的标准时间定为普查年份的1月I日O时。标准时间一般定为调查对象比较集中,变动相对较小的时间上。 第三,普查的数据一般比较准确,规范化程度也比较高,能掌握大量、详细、全面的统计资料。因此它可以为抽样调查或其他调查提供基本的依据。 第四,普查的使用范围比较狭窄,只能调查一些最基本及特定的现象。 普查的组织形式有两种,一种是通过组织普查机构,配备一定数量的普查人员,对调查单位直接进行登记,如我国人口普查就是采用这种形式。另一种是利用调查单位的原始记录和核算资料结合清库盘点,由调查单位自行填报调查表格,如我国物资库存普查就是采用这种形式。 (二)抽样调查 抽样调查是实际中应用最广泛的一种调查方法,这里指的是概率抽样,它是从调查对象中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。抽样调查具有以下几个特点: 1.经济性。这是抽样调查的一个最显著优点。由于调查的样本单位通常是总体单位中的

相关文档
最新文档