数值型数据库的意思
事实和数据型数据库

第八章事实和数值型数据库第一节事实和数值型数据库概述在现代化图书馆的电子资源建设中,各种类型数据库的发展已经为图书馆的服务手段带来了飞跃性的变革。
数据库从存储的内容上可分为目录文摘数据库、全文数据库、事实型数据库、数值型数据库。
在图书馆电子资源建设的初期,二次文献数据库曾发挥了全面快速检索文献的作用,是电子资源的主要组成部分。
但随着文献信息的日益膨胀,面对INTERNET 网络信息的纷繁庞杂,用户越来越需要准确、真实、适用、具体、能够直接回答问题的针对性强的信息。
因此以一次信息(包括全文、事实、图形、数值信息)为主的源数据库已经成为数据库发展的主流,并将成为图书馆电子资源的发展重点。
以上几章中着重介绍了学术性文献库,在本章中我们将就另外两种目前具有重要的发展前途的数值型数据库及事实型数据库做一个概述性的介绍。
3.1事实数据库的发展历史如果从利用计算机作数据处理的角度来讲,则处理事实数据要比处理书目数据早得多。
但作为数据集合的数据库来讲,书目数据库的发展要比事实数据库的发展早一些。
最早的数据库是50年代的存于磁带上的书目库。
第一个事实数据库产生于1967年,是由美国Data 公司根据与俄亥俄律师协会的合同建立的俄亥俄法律法令全文库,收录有全美50个州的法律法令。
1968年,美国的Data Resource Inc公司成为第一家重要的数值数据库服务公司。
在70年代初期,事实数据库发展比较缓慢,其速度远远不及文献数据库的发展速度。
但由于事实数据库直接向用户提供原始情报,或经过加工存贮的“纯情报”,比如商业经济方面的数值数据库,直接向用户提供物价、产品规格、产值等方面的数据。
因此,越来越深受用户的欢迎。
自70年代中期以后,事实数据库迅速发展,没过多久其速度便赶上和超过了文献数据库的发展。
据统计,在1975年,欧洲只有51个事实数据库。
但到1985年,则猛增到1063个,平均每两年增加一倍。
1983年,世界数据库的总数为1845个,比1975年增加了38倍。
中文数据库介绍与运用

CNKI系列数据库
CNKI 简介: CNKI工程,即中国知识基础 设施工程(China National Knowledge Infrastructure) ,是采用现代信息技术, 建设适合于我国的可以进行知识整合、生 产、网络化传播扩散和互动式交流合作的 一种社会化知识基础设施的国家级大规模 信息化工程。
图:CAJ浏览器
二、维普全文数据库
图:检索界面
1、特点简介
维普数据库包含1989年以来各学科8000多种期刊 文献,并以每年150万篇的速度递增。 按照《中国图书馆分类法》进行分类,所有文献 被分为8个专辑:社会科学、自然科学、工程技术、 农业科学、医药卫生、经济管理、教育科学和图 书情报。
选定专辑后即可输入检索词,当然也可先输入 检索词再选定范围。输入检索词后如图5所示。
第三步:检索
三、高级检索
高级检索的功能与初级检索相同,只是屏幕上列有多个
检索框和字段的下拉式菜单供选择。多个检索框之间的逻 辑关系默认为“AND”,也可选择“OR” “NOT”。
在高级检索中,直接显示检索结果的全字段记录。并提
全文下载方式:系统提供CAJ和PDF两种格 式全文供读者自由选择下载。CAJ格式全文 浏览器为CAJViewer 。使用前要先下载和 安装浏览器。
图:检索界面
2、 检索方法
CNKI主要提供学科浏览和检索两种方式使 用数据库。检索方式又分为初级检索和高 级检索两种模式。
1、导航区及其作用
1. 在分类检索中,可以通过导航逐步缩小范围,最后 检索出某一知识单元中的文章。例如:利用学科专业导 航,理工A——数学——数学概论――数学史和数学范 畴,可以直接检出其中的文章,如图所示
EPS数据平台与同类数据库对比分析

EPS数据平台与同类数据库比照分析EPS数据平台作为国内首家“专业数据+预测分析''平台,一直专心致力于统计数据库产品的研发。
凭借公司专业的数据、信息、软件服务资源,现己建立起来一套集丰富的数值型数据资源和强大的分析预测系统为一体的覆盖多学科,面向多领域的综合性信息服务平台。
在与全国众多高校的老师和教授交流过程中我们发现。
对于高校而言,在教师教学和课题研究过程中以及在学生论文撰写过程中,两大类数据库能为他们提供很大的帮助作用。
第一类为全文类数据库:即汇集各个领域的论文、期刊、研究成果、学术专著。
第二类为数值型数据库:即拥有领域覆盖面广、指标体系细化、历史数据完整、数据来源权威、更新及时准确的一系列专业数据库。
EPS数据平台在以满足客户和市场需求为经营宗旨的理念下,经过几年的开展,积累了大量的专业数据并建立了稳定的数据获取体系。
在业内己经得到广泛的认可,在全国拥有近300家客户,业己成为各高校第二类数据库产品的主要供应商。
就数值型数据库而言,EPS数据平台与同类数据库相比有以下区别:1、单个数据库质量优势EPS数据平台每个数据库的数据含量及其内容可以极大的满足用户需求。
以EPS数据平台的“中国宏观经济数据库”为例:这一个数据库就包含了9个子库。
而在其“年度分地区"这•个子库中就包含了20个方面的统计数据。
可以覆盖其他同类数据库所拥有的大局部年、季、月度数据,单个库的数据规模庞大,性价比高。
目前,EPS数据平台线上一共有44个数据库,其中绝大局部数据库都包含数后不等的子库。
2、覆盖区域的优势:IT前国内统计数据库产品其区域覆盖基本只细分到省一级,即31个省自治区直辖市。
而EPS数据平台有很多数据库除了拥有省级数据以外,还包含400多个地级市和2000 多个县级市数据。
甚至在一些特定的数据库中(如地区贸易数据库),地区进行了更深层次的划分。
除了收录全国各省市贸易数据外,还收录了中国各经济特区、保税区、出口加工区、保税物流园区、保税港区、综合保税区等方面的贸易数据,大大满足了师生课题研究的需要。
数据库管理系统基础知识

(3)在数据表中,字段必须先定义后赋值,然后才可以使用。
(4)字段变量名由汉字、字母、数字和下划线组成,必须以 字母或汉字开头。 (5)字段变的数据类型有13种,与前面的数据类型相同。
2. 内存变量
(1)内存变量:存在于内存中的变量,常被用来存储所需 要的常数、中间结果或最终结果。变量名由汉字、字母、数 字和下划线组成,必须由字母或汉字开头。 (2)当内存变量名与字段变量名相同时,字段名优先于内 存变量名,使用时可以在内存变量名前加上“M->”以示区 别,但赋值时不能使用该前缀。 1)建立内存变量文件 格式:STORE <表达式> TO <内存变量名表>
说明:释放指定的内存变量,但不清除系统内存变量;
量。
示例:RELEASE ALL RELEASE X,Y,Z
RELEASE ALL LIKE A*
3.系统内存变量
系统内存变量是系统已经定义好的一些变量,通常以下划 线开头。
2.2.3 数组
(1)数组变量:一组变量的集合,这些变量的数据类型可 以不同,每个数组元素都可以通过一个数值下标被引用, 相当于一个内存变量。
第2章 数据库管理系统基础知识
2.1 数据类型 2.2 数据存储 2.3 运算符及表达式 2.4 函数 2.5 命令 退出
2.1 数据类型
1. 字符型数据
2. 数值型数据 3. 整型数据 4. 浮点型数据 5. 双精度符型数据 6. 货币型数据 7. 逻辑型数据
8. 日期型数据
9. 日期时间型数据 10. 备注型数据 11. 通用型数据 12. 字符型数据(二进制) 13. 备注型数据(二进制) 退出
格式:RESTORE FROM <内存变量文件名>/FROM MEMO <备 注型字段名> [ADDITIVE]
二、数据库型检索工具及使用

5
3.数值型数据库 3.数值型数据库
概念:是一种以自然数值形式表示,计算机可读的数 概念:是一种以自然数值形式表示, 据集合。专门提供各类统计数字等数值型数据, 据集合。专门提供各类统计数字等数值型数据,有的 附少量的文字。 附少量的文字。 功能:在商业领域和经济领域中, 功能:在商业领域和经济领域中,能提供特定产品的 价格趋势、工农业增长率的数值信息;在科技领域, 价格趋势、工农业增长率的数值信息;在科技领域, 它能提供物质的物理化学性质、结构、 它能提供物质的物理化学性质、结构、频谱等实验数 据。
2/22/2004 信息检索与利用
4
2.指南型数据库(directory database)
美国男女科学家数据库 收录情况: 收录情况:一般是有关 人物、机构、研究项目、 人物、机构、研究项目、 美国出版与发行商名录 成果、产品等信息, 成果、产品等信息,提 马圭斯名人录 供读者的是一个事实。 供读者的是一个事实。 美国社团大全 如: 世界厂商名录数据库 中国企业、 中国企业、公司及产品 世界公司厂商名录数据 数据库 库 中国企业及广告数据库 世界公司产品信息网
2/22/2004
信息检索与利用
6
3.1典型数值型数据库 3.1典型数值型数据库
中国国家统计局信息网(http://): 中国国家统计局信息网(http://): 是我国国家级统计网站,可查询国家及各省市、 是我国国家级统计网站,可查询国家及各省市、各部委的 统计数据、统计分析、法规等资料信息。 统计数据、统计分析、法规等资料信息。 联合国粮农组织的统计数据库(http://): 联合国粮农组织的统计数据库(http://): 简称(FAOSTAT) 是一个多语种数据库, 简称(FAOSTAT),是一个多语种数据库,拥有世界各国在农 业、林业、渔业以及营养等领域的统计数据100多万条。 林业、渔业以及营养等领域的统计数据100多万条。 100多万条 联合统计司数据库(http:///depts/unsd): 联合统计司数据库(http:///depts/unsd): (http (USND)
二、计算机信息检索

文献型数据库
文献型数据库又叫书目型数据库, 记录文档中主要存入的是原始文献 的书目。包括原始文献的篇名、作者 、文献出处、文摘、关键词,以及主 要用于查询各种文献资料的书目性 线索、文摘等。
数值型数据库
数值型数据库的记录包括各种调查 数据或统计数据。它是一种以自然数 值形式表示、计算机可读的数据集合, 这些数据是从文献中分析、概括、提 取出来,或以调研、观测及统计工作 中直接获得的数据。
数据库
数据库是计算机信息检索的重要组成部分。 它是以二进制代码形式在计算机存贮设备上 (如磁带、磁盘和光盘等)合理存放的相关 数据的信息集合,通常由存贮信息记录及其 索引的若干文档组成。
目前,大多数计算机信息检索系统都存有 四种类型的数据库:
–
文献型数据库
–
数值型数据库
–
词典型数据库
–
全文型数据库
国际联机信息检索的优点
检索范围广 数据库种类多、数量大 检索速度快 检索途径多,检索效果好 具有灵活的服务方式和输出方式 检索全面
世界著名的国际联机检索系统
DIALOG系统
DIALOG系统又称DIALOG对话系统,因研究 人机对话检索方式而得名。它是目前世界上 最大的国际联机检索系统,也是我国信息用 户使用最多的系统。1963年系统创建初期, 曾是美国洛克希德导弹和空间公司下属的一 个情报科学实验室。1972年,DIALOG系统开 始成为国际联机检索系统,正式对外开展联 机文献检索服务业务。
一是传统信息检索向全文文本、多媒体、多
载体、多原理等新型信息检索发展,在深度上 提高信息检索和信息组织能力,如探索自动抽 词、自动索引、自动检索、自动文摘、自动翻 译等;
二是信息资源的网络化和分布化,面向 Internet 中浩瀚无垠的资源,在广度上提高 管理和组织信息的能力。
计算机检索基础

3、事实型数据库: 事实型数据库是以事物发展过程中产 生的事实性信息为存贮内容的数据库。如 自然资源数据库、人口数据库、名人数据 库和机构名录数据库等。
这类数据库除存贮基本事实数据外, 也存贮数学运算和逻辑运算规则,能同时 提供文本信息和数值数据。用户只要通过 人物、机构或事物名称及有关事项进行检 索,就可获得特定的事实或数值信息。
(心脏瓣膜疾病OR心力衰竭)AND手术并发症
(2)位置算符检索
位置算符 是指表示词与词之间位置关系的算 符,又称邻近度算符。常用位置算符有 near、 with、(nW)、(W)等 。 作用:是限制词与词之间的位置关系,弥补 布尔逻辑算符只是定性规定检索词的范围,更加 明确检索词之间的逻辑关系,缩小检索范围,提 高检索的查准率。
(二)计算机信息检索系统的构成
计算机信息检索系统通常由计算 机硬件、检索软件、数据库和通信网 络等组成。其中数据库是计算机信息 检索系统的核心。数据库的质量直接 影响计算机信息检索系统的功能和效 率。对数据库的了解是掌握计算机信 息检索技术的前提。
(三)数据库的概念与结构
数据库是指在计算机存贮设备上 按一定方式存贮的相互关联的文献 信息集合,它可以由一个或多个文 档(File)组成。 文献信息数据库主要由文档、记 录、字段三个层次构成。
三、检索策略的编制与调整
检索策略 是指为实现检索目标而制定的全 盘计划和方案,是对整个检索过程的谋划和指导。 由于计算机信息检索是由计算机程序来控制和执 行检索匹配操作,检索者与具体的检索过程是分 离的,因此,事前制定适宜的检索策略,是成功 检索的关键。 广义的检索策略包括信息需求分析、选择数 据库、确定检索途径和标识、编制检索表达式并 准备多种检索方案和步骤等。 狭义的检索策略包括确定检索词和根据需要 运用各种运算符编制检索表达式的构思过程。
文献信息检索系统的分类

文献信息检索系统的分类文献信息检索系统的核心是数据库,而数据库本身又常以收录内容及功能的不同划分为如下几种类型。
1.书目型数据库(bibliographic database)主要是指二次文献数据库,包括各种机读版的题录型、文摘型的数据库。
如《中国生物医学文献数据库》(SinoMed)、MEDLINE等。
它们提供了可满足用户多种信息检索需求的有关文献的各种特征,如文献的篇名、著者、出处(包括刊名、年、卷、期、页码)、摘要、收藏单位等。
不仅可以告知用户其所需文献的线索一题录(包括篇名、著者、出处),更可以提供整篇文献内容浓缩的替代品一文摘。
因此,这是文献检索中最常用的一种数据库。
2.事实数值型数据库( fact-date database)主要为用户提供有关事物、人物、机构等方面的事实性信息和数值型数据。
例如万方数据资源系统中的事实型数据库《中国科研机构数据库》《中国科技信息机构数据库》《中国高等院校及中等专业学校数据库》,美国国立癌症研究所的关于癌症治疗信息的医生咨询数据库(PDQ),反映药物处方信息的《医师案头参考书》(Physicians'Desk Reference, PDR)等。
电子化的参考工具书,如词典、百科全书指南等也属于事实型数据库的范畴。
3.全文型数据库(full-text database)是将文献全文的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。
全文型数据库对文献的字、词、句,乃至段落等进行更深层次的编辑加工,允许用户采用自然词语以及截词、邻近算符等匹配方法,方便快速地查到所需的文献,并能直接获取文献原文。
例如CNKI的学术文献总库、万方数据资源系统中的数字化期刊、EIsevier Science电子期刊全文库。
因此,全文型数据库是集文献线索的查询和文献全文的提供于一体,实现了毕其功于一役的一站式信息服务。
4.知识型数据库(knowledge database)一种疾病,不仅有一个概念性的界定,而且涉及病因、病理、诊断、治疗等相关知识;一种药物,不仅有其化学结构上的名称或命名,而且有药理作用、药效动力、副作用、适应证、使用方法等相关知识; -项检查,不仅有其概要性描述,而且涉及原理、检测值的解释、临床意义、操作方法、正常值范围、适用范围等一系列相关知识。