第八章资料处理史亚蕾
妇幼卫生概论复习资料(三)全篇

妇幼卫生概论复习资料(三)第八章妇幼卫生信息管理第一节妇幼卫生信息及信息管理系统一、妇幼卫生信息【妇幼卫生信息】广义的妇幼卫生信息是指与妇幼卫生工作直接相关联的各种社会经济信息、科学技术信息、文化教育信息以及妇女儿童健康状况信息等。
狭义的妇幼卫生信息是反映与妇幼卫生相关的医疗卫生机构及相关领域的各种活动发生、发展、变化情况及其影响因素的量化和抽象的数据、情报等。
具体来说包括健康与疾病,影响健康的各种因素,卫生服务活动信息,疾病筛查、诊断、治疗和处置信息,卫生资源配置和利用信息等。
妇幼卫生信息的种类:数据信息、文字信息、声音信息、图像信息妇幼卫生信息的特点:广泛性、普遍性、客观性、动态性、针对性、专业性、复杂性、可传递性妇幼卫生信息的来源:经常性资料、一时性资料二、妇幼卫生信息管理及其意义【妇幼卫生信息管理】是对妇幼卫生信息资源和相关信息活动的管理,是妇幼卫生工作中对信息的组织和控制过程,主旨是为领导决策提供准确、及时、全面的信息资料。
管理的意义和作用:1.妇幼卫生信息是国家和各级地方部门制定社会济发展和妇幼卫生计划的依据。
2.妇幼卫生信息管理是妇幼卫生工作的重要手段。
3.妇幼卫生信息是沟通相关各级组织,连接各项工作的纽带。
三、妇幼卫生信息管理应该注意的问题:1、确保信息真实性。
信息是决策的基础,信息的真实性直接关系到卫生决策的成败;信息的真实性也关系到信息的价值,真实性越强,信息的利用价值越高。
保证信息的真实性,最关键的是提高信息工作人员的素质,培养他们严肃认真的工作态度和负责的精神。
另外对信息的处理不能凭主观臆想,应真实客观描述。
2、强调信息时效性。
信息处理的过程要经过收集、传递、加工整理,最后得以分析利用。
从收集信息到使用信息的时间越短,时效性越强。
只有及时掌握信息,才能使人们的主观认识跟上客观发展,才能做出迅速判断和正确决策,从而使工作具有主动性。
保证信息的时效性,首先要保证信息输送渠道的畅通,并不断提高和时刻保持信息工作的效率。
社会调查方法_风笑天_第八章资料的处理

资料审核工作的内容:一是检查出问卷资料中的问题;二是
重新向被调查者核实。
资料审核的方法:
1、边调查边审核 2 、系统审核
思考:对上述
两种审核方法进行比较
一、资料的审核与复查
• 资料的复查:
研究者在调查资料收回后,又由其他人对所调查的样本中的 一部分个案进行第二次调查,以检查和审核第一次调查的质量 。
三、数据清理
2、逻辑一致性清理
相倚问题与逻辑一致性 逻辑非一致性错误举例(P.160) 逻辑一致清理的方法:
IF命令 COMPUTE命令
3、数据质量抽查
• 数据中可能存在的一种特殊的错误 • 数据质量抽查方法
四、统计表与统计图
1、统计表的构成与制作 • 统计表的构成 • 统计表制作的原则与注意事项
数据录入的方法:
◇常用统计软件:SPSS、
SAS、SYSTAT等
◇SPSS数据录入方法 ◇数据输入工作要求
三、数据清理
1、有效范围清理
数据中的某些数值超出了编码值的范围 这种错误发生的情况有: • 原始数据本身的问题 • 编码的错误 • 录入人员的错误
检查的方法
在SPSS软件中执行一条统计各统计变量频数分布的命令,当我 们发现频数分布表中的变量的取值超出了编码手册所规定的赋 值范围,就需要将这些问卷找出同原始问卷核对
四、统计表与统计图
2、统计图 a.条形图 b.园形图
%
80 60 40 20 0 1 2 3 4 5 6 独身子 女 非独生 子女
图8-4 样本中各年级独生子女比重分布图
乡人口 镇人口 市人口
图8-5 1990年全国人口构成图
四、统计表与统计图
2、统计图 c.折线图
Java语言程序设计(第3版)(2018年清华大学出版社出版

作者简介
沈泽刚,1964年生,男,汉族,渤海大学信息科学与技术学院副教授、硕士生导师,研究方向为计算机应用 技术。
谢谢观看
2018年4月1ห้องสมุดไป่ตู้,该教材由清华大学出版社出版。
内容简介
全书共18章,主要内容如下:
第1章介绍Java语言的起源和发展、Java开发环境的构建、简单Java程序的开发和运行、程序设计风格与文 档以及集成开发环境Eclipse的使用。
第2章介绍数据类型、常用运算符、表达式以及数据类型的转换等。
第3章介绍程序的流程控制结构,包括选择结构和循环结构。重点介绍if结构、switch结构、while循环、 do-while循环以及for循环结构。
Java语言程序设计(第3版)(2018 年清华大学出版社出版
2018年清华大学出版社出版的图书
01 成书过程
03 教材目录 05 教材特色
目录
02 内容简介 04 教学资源 06 作者简介
《Java语言程序设计(第3版)》是由沈泽刚主编,2018年清华大学出版社出版的21世纪高等学校计算机类 课程创新规划教材。该教材可作为高等院校计算机专业或相关专业的“Java程序设计”或“面向对象程序设计” 课程的教材,也可作为Java认证考试及编程爱好者的参考资料。
第7章介绍类的继承与多态,其中包括继承性、封装性、多态性以及对象转换等。
第8章介绍Java常用核心类,包括Object类、Math类、基本数据类型包装类等,另外介绍了Java8新增的日 期-时间API相关的类。
教材目录
(注:目录排版顺序为从左列至右列 )
教学资源
该教材有配套教材——《Java语言程序设计(第3版)学习指导与习题解析》,书中提供了学习指导、实训 任务及编程练习的参考答案。
文献管理与信息分析复习

文献管理与信息分析复习第一章科研工作者的信息修炼第一课时加速发展的社会第二课时信息社会发生的变化第三课时问题解决模式第四课时什么是科研第五课时信息社会的必备信息技能第六课时本课程的具体内容(第七课时如何学习这门课第二章搜索引擎与网络学习第一课时搜索引擎出现的历史必然性第二课时搜索引擎的工作原理第三课时常用搜索引擎的简介第四课时利用搜索引擎解决问题的思路第五课时本地文件搜索工具everything第三章数据库资源的发展趋势和利用(英文数据库部分):第一课时文献数据库简介第二课时WOS数据库简介第三课时Scopus数据库简介第四课时Google Scholar^使用简介第五课时英文文献数据库小结第四章中文数据库及中文信息资源第一课时中文文献资源简介#第二课时中国知网的介绍与使用第三课时万方数据知识服务平台简介第四课时维普数据库介绍第五课时超星发现平台介绍第六课时小结第五章 RSS—同步追踪世界最新资讯第一课时RSS介绍第二课时以更广的视角看更远的未来第三课时RSS简介及其使用第四课时鲜果阅读器简介第五课时移动端阅读简介第六课时RSS小结-第六章个人知识管理第一课时个人知识管理介绍第二课时为知笔记简介第三课时为知笔记使用详解第四课时小结第七章手把手教你用Endnote X7第一课时文献管理软件简介@第二课时Endnote X7的功能演示第三课时Endnote X7的使用入门(step by step )第四课时Endnote X7的具体功能介绍第五课时个人的Endnote使用介绍第八章 HistCite—快速定位核心文献第一课时Histcite简介第二课时常规的文献筛选方法第三课时Histcite的使用步骤}第四课时Histcite的分忻原理第五课时Histcite的使用步骤详解第六课时个人的Histcite使用介绍第九章思维导图及其在科研中的应用第一课时思维导图简介第二课时思维导图软件的使用方法第三课时思维导图软件应用示例@第十章团队协作及移动办公第一课时团队协作及移动办公简介第二课时如何实现团队协作办公第三课时移动办公工具选择题单选题:当池塘里的荷花开满一半时,需要多少天呢A、15天;B、24天; C' 28天; D、29天;参考答案:D、,单选题:以下哪种软件可以帮我们追踪到最新资讯A、Endnote ;B、RSS;C、思维导图;D、Wiz笔记;参考答案:B多选题:Endnote X7的墓本功能包括:A、在线检索文献;B、批量下载文献信息;C、编辑参考文献格式;D、管理文献;参考答案:A、B、C、D、多选题:在Endnote X7中插入参考文献,有以下哪几种方法:A、endnote中选择,并直接插入;B、在word中通过查找插入;C、拷贝粘贴;D、直接拖动插入;'参考答案:A、B、C、D、单选题:我们看到在Scopus中可以使用国家(地区)进行文献的筛选,那么WOS中是否也可以根据国家(地区)来进行文献筛选呢A、可以;B、不可以;C、近几年的文献可以;D、仅专利文献可以;参考答案:A、单选题:在使用Histcite导入文件时,若出现以下错误:Line: ”FN Thomson Reuters Web of Science"; Size: KB (147049 bytes) Format: Unknown.此时的解决方法是:A、重新下载数据;B、将TN Thomson Reuters Web of Science"中的Science 换成Knowledge ;C、下版最新版软件;D、更换下载文件的浏览器;参考答案:B、单选题:思维导图作为一种信息展示方式,其特点在于A、一页页依次排列来展示信息;B、用一张张图来展示信息;C、以发散性结构在一张图上展示所有信息;D、不清楚;参考答案:C'多选题:MindManager的墓本使用需要掌握三个快捷键和鼠标,这三个快捷键是A、insert;B、delete ; C'shift; D、enter ;参考答案:A、B、D、多选题:MindManager文件的节点中,可以插入下面哪些信息A、附件;B、网址;C、关联和边框;D、图片;参考答案:A、B、C、D、多选题:为知笔记具有以下哪些特点A、使用简单;B、跨平台;C、支持多终端同步; D 、多人协作参考答案:A、B、C、D多选题:罗老师刚刚绐大家推荐了哪几款工具A、wiz笔记;B、email客户揣;C、有道云笔记;D、快盘参考答案:A、B、D、。
《R语言》课程教学大纲

《R语言》课程教学大纲总主编刘鹏张燕主编程显毅刘颖朱倩适合专业:数据科学与大数据技术专业课程编号:先修课程:数理统计、数据库、大数据导论学分: 4 总学时: 64一、课程性质、目的与要求课程性质:专业必修课。
课程目的:本课程是各专业想了解大数据分析技术的学生必修的一门基础课程,具有很强的实践性和应用性。
它以《数理统计》、《大数据导论》为基础,主要培养学生大数据分析和计算机编程基本思想和基本技能,为后续的数据挖掘应用性课程和数据产品开发课程的学习打好编程基础。
课程要求:本课程设置的目的是通过对R语言的语法规则、数据结构、数据清晰、数据变换、数据整合、数据可视化、数据建模构的学习,较好地训练学生利用计算机解决对数据进行分析和展现,使学生具有数据分析和数据展现的能力,为培养学生有较强数据开发能力打下良好基础。
二、教学内容理论总学时:32学时第1章绪论 1学时基本要求:(1)了解R语言特点和优势。
(2)理解数学思维的基本原理。
(3)掌握统计思维的基本原理。
(4)理解逻辑思维的基本原理。
重点:树立正确的思维观。
难点:逻辑思维。
第2章 R语言入门 1学时基本要求:(1)理解R语言工作空间,环境变量的显示、保存和删除。
(2)了解R包的作用。
(3)能够安装R语言开发环境。
(4)能够编辑和运行R脚本。
(5)R语言基本语法。
重点:R语言脚本编辑和运行。
难点:R包。
第3章数据类型 4学时基本要求:(1)掌握向量的产生、引用、合并等操作,包括x:y,seq(),c(),rnorm()。
(2)掌握矩阵的产生、引用、合并、转换等操作。
(3)理解数据的产生、引用、转换等操作。
(4)熟练掌握数据框的产生、引用、转换等操作。
(5)理解列表的产生、引用、转换等操作。
(6)掌握因子的作用、定义和转换。
(7)熟练掌握常量和变量。
(8)基本掌握字符串处理函数。
(9)掌握常用数据类型转换函数。
重点:数据框和向量的应用。
难点:列表和因子的应用。
《档案管理概论》(肖秋惠编著)课后思考题及答案(参考)

《档案管理概论》(肖秋惠)课后思考题答案第一章(一)试述档案管理工作的性质和特点——P5答:1、档案管理工作的性质:(1)在宏观上,档案管理工作是国家科学文化事业体系的组成部分;(2)在微观上,档案管理工作是机关、团各项管理工作的组成部分,具有辅助管理的性质;(3)档案作为一种原始文献,蕴藏了大量的原始信息,这使档案和档案工作成为文献信息管理系统的重要组成部分。
2、档案管理工作的特点:(1)档案资源积累的缓慢性;(2)档案管理过程的阶段性;(3)档案管理活动对档案形成者的依附性;(4)档案管理工作对社会的相对封闭性。
答:档案管理工作的基本内容一般包括以下8项:收集、整理、鉴定、保管、统计、检索、编纂和利用工作。
其中,档案的收集、整理、鉴定、保管、统计工作是档案管理的基础业务工作,主要是针对档案实体的管理,对档案实体进行有序组织、排列和统计,建立数量充足、种类齐全、载体多样的馆藏体系,为档案的利用服务奠定档案资源基础。
档案的检索、编纂和利用工作是在档案实体管理的基础上,对档案信息进行的组织、加工和提供利用,属于档案信息管理工作,主要目的是提供档案为社会利用需求服务。
随着档案管理现代化的发展和档案利用工作的加强,档案编目检索工作和档案编纂工作逐渐成为相对独立的档案业务工作,这使档案管理工作的内容结构发生了变化。
(三)档案管理工作应遵循的基本原则是什么完成——P8答:(1)确立了档案工作的组织原则和管理体制——统一领导、分级管理国家全部档案;(2)提出了档案管理的基本要求——维护档案的完整与安全;(3)体现了档案工作的根本目的——便于社会各方面的利用。
(四)列举各种档案管理机构及其职能——P10答:(1)档案室。
性质:档案室是机关的内部组织机构,是保存档案的过渡性机构,档案室的主要任务是服务于本机关。
作用:是机关内具有参谋和咨询作用的部门,为机关职能活动提供档案信息支持;是全国档案工作的基础。
档案室是国家档案资源不断补充和积累的源泉。
数据库系统教程课后习题答案(部分)--何玉洁 李宝安

第一部分基础理论第1章数据库概述1.试说明数据、数据库、数据库管理系统和数据库系统的概念。
数据:描述事务的符号记录数据库:存储数据的仓库数据库管理系统:用于管理和维护数据的系统软件数据库系统:计算机中引入数据库后的系统,包括数据库,数据库管理系统,应用程序,数据库管理员2.数据管理技术的发展主要经历了哪几个阶段?两个阶段,文件管理和数据库管理9.数据独立性指的是什么?应用程序不因数据的物理表示方式和访问技术改变而改变,分为逻辑独立性和物理独立性。
物理独立性是指当数据的存储结构或存储位置发生变化时,不影响应用程序的特性;逻辑独立性是指当表达现实世界的信息内容发生变化时,不影响应用程序的特性。
10.数据库系统由哪几部分组成?由数据库、数据库管理系统、应用程序、数据库管理员组成。
第2章数据模型与数据库系统的结构4.说明实体一联系模型中的实体、属性和联系的概念。
实体是具有公共性质的并可相互区分的现实世界对象的集合。
属性是实体所具有的特征或性质。
联系是实体之间的关联关系。
6.数据库系统包含哪三级模式?试分别说明每一级模式的作用。
外模式、模式和内模式。
外模式:是对现实系统中用户感兴趣的整体数据结构的局部描述,用于满足不同用户对数据的需求,保证数据安全。
模式:是数据库中全体数据的逻辑结构和特征的描述,它满足所有用户对数据的需求。
内模式:是对整个数据库的底层表示,它描述了数据的存储结构。
7.数据库管理系统提供的两级映像的作用是什么?它带来了哪些功能?两级映像是外模式/模式映像和模式/内模式映像。
外模式/模式映像保证了当模式发生变化时可以保证外模式不变,从而使用户的应用程序不需要修改,保证了程序与数据的逻辑独立性。
模式/内模式映像保证了当内模式发生变化,比如存储位置或存储文件名改变,可以保持模式不变,保证了程序与数据的物理独立性。
两级印象保证了应用程序的稳定性。
第3章关系数据库1.试述关系模型的三个组成部分。
数据结构、关系操作集合、关系完整性约束2.解释下列术语的含义:(3)候选码当一个属性或属性集的值能够唯一标识一个关系的元组,而又不包含多余的元素,则称该属性或属性集为候选码。
《信息组织》马张华考前复习要点

《信息组织》复习要点第一章导言第一节信息组织的必要性1.信息组织:根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当方式加以提供的活动。
2.信息资源:通常指一切以记录形式存在的信息载体,只是比较而言,更侧重于对新型媒体形式的强调。
(可以是图书、期刊、报纸、论文,也可以是网络上的电子资源)3.信息检索:根据检索需要,从检索系统中检出相应信息资源的过程。
4. 信息组织与信息检索有什么关系?(1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。
第二节信息组织的形式和检索途径1.文献组织的基本排列方式:一般有两种基本排列方式,其一为:(固定排列法)和(按一定意义的次序排列。
)(固定排列法,如档案、博物馆的收藏、光盘、录音带、缩微品。
按一定意义的次序排列包括按题名字顺排序,按责任者排序等,如图书、期刊等, )2. 按照检索工具的对象和特点,可以分为(文献目录)、(索引)、(机读数据库)、(网络搜索引擎)四种类型。
3. 按照标识特征,检索工具可以分哪两种基本类型?(1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。
常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。
(2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有(分类法)、(主题法)。
4.按照系统中所用的标识是否进行控制,检索工具可以分为(受控检索系统)与(自然语言检索系统)。
5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。
6.检索工具还可以按照采用的形式,分为卡片式、书本式、缩微式、电子方式等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、数据录入 经过前述的资料转换处理,调查所收回的问卷中的一个个具体答案都已成功地、系统地转换成了 由0-9这10个阿拉伯数字构成的数码,接下来的任务就是将这些数码输入计算机内,以便进行统 计分析了。这就是数据录入的工作
数据录入的方式主要有两种: 一种是直接从问卷上将编好码的数据输入计算机; 另一种是先将问卷上编好码的数据转录到专门的登录表上,然后再从登录表上将数据输入计算机。 登录表的横栏为问题及变量名,且都有给定的栏码,纵栏为不同的个案记录数据
(1)条形图 条形图又称矩形图,它是以宽度相等、长度不等的长条来表示不同的统计数字,如表示频数或百 分比的多少等等
简单条形图
复杂条形图:
(2)圆形图 又称扇形图,它是以圆内不同扇形面积的大小来表示总体中不同部分所占的比重,形象地反映总 体的内部结构。由于一个圆的圆心角度数为360,用360乘以每一部分所占的百分比,即可得出该 部分的圆心角度 角度数为 数,再在圆中按这些角度画出各个不同的扇形
第四节 统计表与统计图
1、统计表的构成与制作 (1)统计表的构成 从统计表的结构上看,通常都由表号、总标题、横行标题、纵栏标题、数字注释和资料来源等要 素所构成 表号:表的序号,位于表顶端左角。其作用是便于指示和查找
总标题:是表的名称,它位于表的顶端,紧接在表号后面。 横行标题:是横行的名称,又称横标目。它位于表的左侧,对于频数统计表来说,横行标题一般 用来统计所要说明的主题;而对于交互分类统计表来说,则表示其中一个变量类别
2、资料的复查 定义:指的是研究者在调查资料收回后,又由其他人对所调查的样本中的一部分个案进行第二次
调查,以检查和核实第一次调查的质量 基本做法:从原来的调查员所调查过的样本中,随机抽取5%-15%的个案重新进行调查 调查内容:一方面核实原来的调查员是否真的对个案进行过调查;另一方面可将两次调查的结果
(2)统计表的制作 统计表制作原则是:科学、规范、简明、实用、美观。具地说,在制作统计表时,应注意以下几 个方面: 首先,表的标题要简短明了, 其次,表的纵栏标题与横行标题要准确反映变量取值的含义,
第三,表中的数据资料必须注明计量单位,
第四,对于一般频数分布表,则应列出合计栏,以便获得整体情况的资料。总计或合计栏往往放 在表的最下一格;对于交互分类表,则将各种专门的统计量放在表的最下面一格
比如,一项对青年夫妇进行的社会调查中,有这样一对相倚问题。其过滤性问题是: “你们有孩 子吗?”答案为“有(编码为 1”和“没有(编码为2 。而后续性问题是: “请问你们的孩子今 年多大了?”那么,对于那些在前一问题中的回答“没有”的人(即编码为2的人),在后一问题 中的回答应该是空白(即为缺省值,用0表示 )。如果在这些人中,有的人的第二个答案上出现了 4、6等数字,则这些个案的数据就可能有毛病
要检查出所有不符合要求的超出有效范围的编码值,我们只需在计算机上用SPSS软件(或其他软 件)执行一条统计各变量频数分布的命令,计算机很快就给出下列形式的结果:
找有问题的个案的方法同样离不开计算机及SPSS软件的运用。在SPSS软件中,我们先打开数据文 件,然后执行“查找数据”命令。选择数据中的A5栏,让计算机逐个查找在这一变量栏中编码值 为6的那9个个案。再根据这9个个案的编号找出原始问卷,进行核对
3、数据质量抽查 采用随机抽样的方法,从样本的全部个案中,抽取一部分个案,进行校对工作。用这一部分个案 校对的结果,来估计和评价全部数据的质量。根据样本中个案数目的多少,以及每份问卷中变量 数和总字符数的多少,研究者往往抽取2%-5%的个案进行校对
一项调查样本规模为1000个个案,一份问卷的字符数(数据的个数)为200。研究者从中随机抽取 3%的个案(即30份问卷)进行对照检查,结果发现有2个字符输入错误,这样可知错误率在0.03% 左右。也就是说在总共20万个数据中,大约有60个左右的错误。
它是通过上下变化的线段来反映所研究现象随时间变化的过程和发展趋势的图形,包括单式曲线 图和复式曲线图。
谢谢大家!
携手共进,齐创精品工程
Thank You
世界触手可及
1、有效范围清理 对于问卷中的任何一个变量来说,它的有效的编码值往往都有某种范围,而当数据中的数字超出 了这一范围时,可以肯定这个数字一定是错误的
当然,这种错误数字的出现可以发生在资料处理的每一个阶段。 首先,发生在原始问卷中的回答上; 其次,发生在编码员对问卷的编码结果上; 第三,发生在计算机录入员输入数据的过程中。
如果原始问卷上的回答是2,而编码为6,则是编码员的错误,将数据中的这个6改为2即可; 如果原始问卷上是2,编码也是2,则是录入员的错误,也直接将数据改正即可; 如果核对时,发现是原始问卷中的填答错误,则只能将该个案在这一变量上的回答记为0(即无回 答),作为缺省值处理
2、逻辑一致性清理 其基本思路是依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的 合理性。
目前运用较普遍的统计分析软件主要有SPSS,SAS等,尤其是SPSS应用更为广泛。 从目前情况看,研究者主要采用两种方法来输入数据。一种方法是直接在SPSS软件上输入数据。 另一类是采用比较专门的数据库管理软件,如FOXBASE,Exc输入比较直观,打开SPSS后,显示的是一个数据录入窗口,每一个纵栏表示一个变量, 每一横行代表一个个案。 输入前需要定义变量,做法是先用鼠标点击表下面的Variable view,进入到到变量定义窗口 (横行上面分别为变量名、变量类型、变量宽度、小数点位数、变量标签等、纵栏的1、2、3等 表示个案)再用鼠标点击表下方Data view,返回数据录入窗口。
③每个输入人员独立完成各自所输的那一部分问卷,不同输入人员的问卷相互之间,以及同一个 输入人员已输和未输的问卷之间,千万不要混淆搞乱,以免造成漏输或重复输入,影响数据质量。 ④在每个输入人员完成各自所负责的问卷输入任务后,由研究者把他们的数据合起来形成一个总 的数据文件,以供统计分析时调用。
第三节 数据清理
资
料
的
审
核
检查出文件资料中存在的问题
工
作
重新向被调查者核实
资料审核有两种不同的做法: 一种是实地审核; 另一种是系统审核或集中审核
实地审核:在调查的过程中进行,即边调查边审核 优点:特别及时,且效果较好; 缺点:要求调查工作的组织和安排要特别仔细,调查员个人处理各种情况的能力要比较强
集中审核:先将调查资料全部收集回来,然后再集中时间进行审核 优点:调查工作便于统一组织安排和管理,审核工作也可以统一在研究者的指导下进行,审核的标 准比较一致,检查的质量也相对好一些; 缺点:整个调查工作的周期则会相对拉长,少数个案的重新询问和核实工作有时因时间相隔较长或 调查地点较远而无法落实。
最后,各种表格均应以横线为主,能够不用竖线则尽量不用。即便需要用竖线的表格,也应是开 口式的,即表的左右两端不划竖线 在不致混淆的情况下,也可将其竖线去掉,成为以下形式
而交互分类表则可制成以下表8-7形式 除表的最上面一条横线与最下面一条横线用粗线外,其余横线均用细线
2、统计图 统计图具有直观、形象、一目了然、通俗易懂的特点,它主要用于调查资料初级统计结果的描述, 特别适合于对调查总体的内部构成进行描述,对不同现象的分布进行比较以及对现象变化的趋势 进行展示等。 统计图主要有条形图、圆形图和折线图三种
纵栏标题:是纵栏的名称,又称纵标目,位于表的最上一格。对于一般的频数统计表,它指示调 查指标或统计指标的名称;而对于交互分类表来说,它也是表示其中的一个变量的类别 数字:是统计表的实质性内容,是对调查资料进行统计汇总、整理和计算的结果体现。它位于由 横行标题与纵栏标题所包围的范围中。
注释或资料来源是对表中资料的一种说明,位于表的下端。
在编码手册中,研究者要将需要编码的项目和问题一一列出,逐一规定它们的代码、宽度、栏码、 简要名称、答案赋值方式及其他特殊规定等等。整个编码手册的格式要规范统一,指示要明确, 且容易理解,便于操作。
“项目名称”所列的是问卷中的问题或有关项目; “变量名”则是调查问卷中所实际测量的一个变量; “含义”是简要地指出该变量的内涵,它往往是变量的核心内容的反映; “答案赋值”一项十分关键,它可以说是编码手册的真正内容。在这一栏中,研究者要详细地标 明每一种答案的赋值安排,以及某些特殊形式的答案赋值方法
①挑选和培训输入人员。数据输入人员应该是熟悉计算机操作,熟悉调查问卷的人,通常可从大 学生调查员中挑选。对选出的录入人员要进行一定的培训,熟悉输入方式和具体软件,并合理分 工和加强管理。
②统一规定数据输入格式和数据文件名。由于多人输入,每个输入人员应采取统一的输入格式, 并各自规定自己存放数据的文件名,以防与他人输入的数据格式不同或发生混淆和丢失。尤其是 输入格式一旦确定,每个输入人员都必须严格遵守执行,否则以后很难处理,这一点十分关键。
第八章资料处理史亚蕾
调查资料的整理的主要内容
1
原始资料的审核和复查
2
资料转化与录入
3
数据清理
4
统计表与统计图
第一节 原始资料的审核与复查 1、资料的审核
定义:它是指研究者对调查所收集回的原始资料(主要是问卷)进行初步的审查和核实,校正错 填、误填的答案,剔除乱填、空白和严重缺答的废卷
目的:使得原始资料具有较好的准确性、完整性和真实性,从而为后续资料整理录入与统计分析 工作打下较好的基础。
进行对比,以检查第一次调查的质量
通过审核和复查,研究者可以发现并纠正原始资料中所存在的一些错误,可以剔除一些无法进行 再调查但又有明显错误的问卷,还可以普遍了解整个资料收集工作的质量,从而对资料的真实性 和准确性具有更大的信心。
第二节 资料转换与录入
1、问卷资料转换 编码手册:为了减少资料转换工作中的误差,保证数据的质量,研究者需要编制一份编码手册(也 称编码簿)发给从事问卷资料转换工作的人员,以便他们按编码手册的要求,统一进行资料转换工 作