第十二章研究资料的审核、整理与统计分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十二章研究资料的审核、整理与统计分析

第一节资料的审核与整理

一、资料审核的概念和原则

1.资料审核的概念

资料审核是指在着手整理调查资料之前,对原始资料进行审查与核实的工作过程,目的是保证资料的客观性、准确性和完整性,为资料的整理打下坚实的基础。

2.资料审核的原则

资料审核工作一般应按照以下一些原则进行:

(1)真实性原则。对收集到的资料要根据实践经验和常识进行辨别,看其是否真实可靠的反映了调查对象的客观情况。

(2)标准性原则。在较大规模的调查中,对于需要相互比较的材料要审核其所涉及的事实是不是具有可比性。

(3)准确性原则。要对资料进行逻辑检查,检查资料中有无不合理和相互矛盾的地方。例如,某人年龄栏内填写的是23岁,而工龄栏内填写的是18年,这显然是不合逻辑的。

(4)完整性原则。要检查调查资料是不是按照提纲或统计表格的要求收集齐全。如果资料残缺不全,就会降低甚至失去研究的价值。

二、资料的整理

1.资料整理的概念和原则

资料的整理是根据研究目的将经过审核的资料进行分类汇总,使资料更加条理化和系统化,为进一步深入分析提供条件。

资料整理应遵循三条原则:

(1)条理化。条理化是指对资料进行分类从而为进一步的分析创造条件。

(2)系统化。系统化是指从整体上考察现有资料满足研究目的的程度如何,有没有必要吸收补充其他资料。

(3)统计汇总。统计汇总是指将调查得到的各种数据进行初步的统计整理,以把握其总体上的数量特征。

2.分类与分组

从严格的意义讲,分类和分组都是一种定性分类方法,即根据研究对象的某些特征将其区分为不同种类。分类适用于全部调查资料,分组只限于数量化的统计资料,习惯上将后者称为统计分组或称为统计分类。就调查过程而言,调查资料的分类有两种,即前分类和后分类。前分类就是在设计调查提纲、调查表格或问卷时,按照事物或现象的类别设计指标,然后再按分类指标收集、整理资料。后分类,是指在调查资料收集起来以后,再根据资料的性质、内容或特征而将它们分别集合成类。如文献调查的资料、非结构观察、座谈会的纪录、问卷调查中开放性回答等。

(1)分类的类型及意义。分类的方法有两种,即现象分类方法和本质分类方法。本质分类法也被称为科学分类法。

(2)选择和确定分类标准的原则。分类的关键在于选择和确定分类标志。

①分类标志的类别。分类标志可以分为品质标志和数量标志。按品质标志分类就是选择反映事物属性差异的品质标志为分类标准。

②选择分类标志的原则。要选择正确的分类标志,必须遵循四条原则:

第一,从研究目的出发选择标志。

第二,从反映事物本质的需要去选择标志。

第三,根据具体的历史条件去选择标志。分类标志要随历史条件的变化而变化。第四,分组标志的确立必须坚持穷尽性和互斥性的原则。穷尽性是指分组标志的确定必须使所有个案的特征表现都找到归属组,无一例外,也就是要将所有可能的类别都要列出。在研究我国宗教信仰时,只分佛教、基督教、伊斯兰教这三大类。互斥性是指分组标志应该互斥,要使每个个案的特征表现只能分配到一组之内,不能同时在几个组内出现。

第二节资料汇总

一、计算机汇总的步骤

计算机汇总大致分为四个步骤:编码、登录、录入和程序编制。

1.编码

编码是将问卷中的信息数字化,转换成统计软件和统计程序能够识别的数字,这项工作是一种信息代换的过程。

2.登录

登录是将编好码的问卷资料过录到资料卡片上去,以便于将它们输入到计算机的软盘或硬盘等存储设备上去。

3.录入

录入是将登录在资料卡片上的数据录入到计算机的存储设备上,其工作性质同登录相同。

4.程序编制

要用计算机汇总资料就必须给计算机输入一种指令,指挥计算机进行工作,这种指令就是程序。

二、一个资料汇总的实例

我们结合一个例子来说明资料汇总的具体技术。

某部门为了了解老干部和老知识分子的状况,曾对本系统60岁以上的成员做过一次普查。下面,我们摘选该调查表的一部分。

这个调查共提出了60个问题,收集了50000份问卷,由于工作量太大,所以应采用计算机整理。

1.编制编码手册

上面列出六个问题可以分为两种类型,一是开放性问题(1、2、3题),二是封闭式问题(4、5、6题)。比如业务专长这个问题,通阅后归纳出了29个类别共250多种专长,那么就用数码的前两位代表类别,后一位代表该类别中的不同专业。如规定“文学”类别编码是00,其中“文学概论”的编码是001,“外国文学”是006,还可以规定“国际贸易”是089。

编码手册包含4个主要项目:

(1)第一列“列”中的数字符号代表着固定格式的电子数据库中数据矩阵中列的序号。

(2)问题号码。编码手册上的问题号码和问卷或调查表上的题号应该一致。

(3)项目名称。

(4)编码的内容说明。

2.根据编码手册做卷面资料登录

3.调查资料的计算机录入

(1)固定格式录入

例如“性别”是1位数,“月收入”是4位数等。

按照固定格式录入数据最大的好处是资料录入员可以集中精力敲击键盘,不必去考虑每个数据应该对应哪个变量,这样可以提高录入的速度。但缺点是必须先将调查数据转化为固定的格式,并且卷面登录和计算机录入时都要严格注意每个变量上数码的位数和位置,不能有一点差错。

(2)自由格式录入

自由格式录入是指以一个个的变量值为单位直接将数据录入到计算机电子表格中。自由格式录入最大的好处是在录入时比较直观,只需要将每个变量的数值录入到相应的位置上,而不用将每个变量都先转化成标准化的数码格式并准确对位。并且由于数据比较直观,在录入时一旦键盘敲击错误也容易发现。在输入数据时,一旦输入的数码不符合预先设计的位数或可取值范围,计算机马上就可以识别并显示错误。

4.向计算机发布指令,通过计算机整理资料

如果在建立数据库结构中已经把各个变量的具体内容输入了,就可得出表12—3。

表12—3 某单位职工居住面积情况

三、统计表

资料整理的结果可以用不同形式表现,但统计表是应用最广泛的形式。广义的统计表包括调查工作中所用的一切表格。

1.统计表的意义和结构

资料通过统计汇总,按照一定的目的,在表格上表现出来,这种表格就叫做统计表。统计表的意义是:

(1)能有条理、有系统地排列统计资料,使人们在阅读时一目了然。

(2)能合理地、科学地组织统计资料,使人们在阅读时便于对照比较。

从外表形式上看,统计表由总标题、横行标题、纵栏标题、指标数值四部分组成。从内容上看,统计表由主词和宾词两部分构成。

2.统计表的种类

统计表按总体分组的情况可以分为简单表、分组表和复合表。

(1)简单表。

相关文档
最新文档