事实型数据库资源浅析
事实和数据型数据库

第八章事实和数值型数据库第一节事实和数值型数据库概述在现代化图书馆的电子资源建设中,各种类型数据库的发展已经为图书馆的服务手段带来了飞跃性的变革。
数据库从存储的内容上可分为目录文摘数据库、全文数据库、事实型数据库、数值型数据库。
在图书馆电子资源建设的初期,二次文献数据库曾发挥了全面快速检索文献的作用,是电子资源的主要组成部分。
但随着文献信息的日益膨胀,面对INTERNET 网络信息的纷繁庞杂,用户越来越需要准确、真实、适用、具体、能够直接回答问题的针对性强的信息。
因此以一次信息(包括全文、事实、图形、数值信息)为主的源数据库已经成为数据库发展的主流,并将成为图书馆电子资源的发展重点。
以上几章中着重介绍了学术性文献库,在本章中我们将就另外两种目前具有重要的发展前途的数值型数据库及事实型数据库做一个概述性的介绍。
3.1事实数据库的发展历史如果从利用计算机作数据处理的角度来讲,则处理事实数据要比处理书目数据早得多。
但作为数据集合的数据库来讲,书目数据库的发展要比事实数据库的发展早一些。
最早的数据库是50年代的存于磁带上的书目库。
第一个事实数据库产生于1967年,是由美国Data 公司根据与俄亥俄律师协会的合同建立的俄亥俄法律法令全文库,收录有全美50个州的法律法令。
1968年,美国的Data Resource Inc公司成为第一家重要的数值数据库服务公司。
在70年代初期,事实数据库发展比较缓慢,其速度远远不及文献数据库的发展速度。
但由于事实数据库直接向用户提供原始情报,或经过加工存贮的“纯情报”,比如商业经济方面的数值数据库,直接向用户提供物价、产品规格、产值等方面的数据。
因此,越来越深受用户的欢迎。
自70年代中期以后,事实数据库迅速发展,没过多久其速度便赶上和超过了文献数据库的发展。
据统计,在1975年,欧洲只有51个事实数据库。
但到1985年,则猛增到1063个,平均每两年增加一倍。
1983年,世界数据库的总数为1845个,比1975年增加了38倍。
第五讲:事实和数值型数据库

搜数网的数据来源于国家及各省市地方统计局 的统计年鉴及海关统计、经济统计快报、中国 人民银行统计季报等月度及季度统计资料,其 中部分数据可追溯至1949年,以及部分海外地 区的统计数据。所有搜数网输出的统计表格皆 附有数据来源及出处,保证数据的严谨及权威。 并发用户数:5个
咨讯行、中经网、国研网的一般检索方式
人物传记资源中心
Biography Resource Center
包括一百多万个人物的传记,内容涵盖文学、 科学、政治、政府、历史、多文化研究、商业、 娱乐、体育、艺术和当今事件等等。此数据库 把80个最常被参考的Gale著名传记数据库与 280种以上的全文刊物结合,可供查询知名人 物的详细资料。 /itweb/wuhan
中国汽车行业季度分析报告
4.中国经济信息网专题资料库
《中经网》是由国家信息中心制作的以提 供经济信息为主的专业性信息服务网络。 提供的信息形式多样,有视频、文字、图 片、数据、图表等多种形式,且其内容涵 盖面较广,有对各行各业的现状、动态、 发展等的全方位的报道与分析。
网址: /index/index/index.as p
同时链接地图、国旗及各国统计资料), Related Website (相关参考网络资源, 提供20万个以上经过百科全书编者评 审的优质网站链接),Britannica Spotlights (不列颠百科 独家收录的特殊主题深度介绍),Timelines (大事纪年 表,主题涵盖建筑、科技、生态、艺术等),还有150种 经过筛选的在线杂志和期刊。 Encyclopedia Britannica Online 在保留原百科全书质量 和特点的基础上,又增加了许多新的功能,如按主题字顺 排列的浏览功能,强大的检索功能,可检索词条达到98, 000个。 大英百科全书网络版每周更新一次。
第六章__事实数据信息检索.

第二节 印刷型参考工具书简介
• 一、类型和作用
• (一)词、字典 • 词、字典是字、词或词语的某些成分、根据 一定编纂目的加以处理和编排,供人们查考的工 具书。就广义而言,词典分为语文词典和知识词 典(学科词典)两大类,前者词语的语言方面的 知识或本身的意义,后者提供词语的学科方面的 知识、即解释在专科领域内词语所代表的事物和 概念,作一定广度和深度的叙述。
• (四)手册
• 手册(Handbook, Manual)是一种便捷式参考书 (Ready Reference Book), 它的信息、知识密集,是些经常要查阅、 参考的资料和数据。手册内容及时修订,编排合理,使用 方便。科技手册是参考工具书中的一大门类,其内容广泛、 种类各异,。它有综合性手册和专业性手册之分,以专业 性为主。专业性手册包括:数据型手册、知识型手册、设 计手册以及产品手册等。数据型手册提供各种常数、参数、 计算公式、曲线、图表、图示、线路图等,是一种简明、 实用的检索工具。知识型手册以文字叙述为主, 阐述科学原 理、专业技术、物化性能等学科知识,也配有适当公式和 图表,它们既可检索,也可阅读。设计手册为科技人员、 专业设计人员提供所需知识和数据,是他们在工作中经常 使用的工具。产品手册具有产品说明书作用,介绍产品名 称 、 技 术 指 标 、 标 准 、 生 产 厂 商 等 。
• 类书与百科全书的区别
• 将类书视为古代百科全书未尝不可,但不能与现代百科全书相提 并论,正如西方现代百科全书与古代百科全书也远不是一回事了。 类书与百科全书相比,不同之处具体表现在下列方面: 一是编纂方式不同。类书是辑录原始资料,重在资料性,是原始 资料的汇集。百科全书是根据已有的资料进行加工整理,是对已有知 识的加工、整理和浓缩,反映了编纂者本人的知识水平。 二是编排方式不同。类书是根据原始资料分类进行编排,通过分 类编排反映原始资料之间的内部联系。百科全书则是以条目的字顺进 行编排,条目之间通过索引反映内部之间的联系。 三是内容有别。类书一般侧重于文史资料,而百科全书以反映人 类全部知识为己任,对自然科学方面的知识更为重视。 四是后期工作不同。类书编纂完成以后,一般很少进行补充或修 订。而百科全书有连续修订制度,一般每隔5到10年要进行一次全面 修订,保证知识的准确性。 此外,百科全书有完备的索引体系、部分条目有参考书目指引读 者进一步阅读等,也是类书不具备的。因此从根本上讲,类书与百科 全书不是同一种工具书。
医学专题事实型数据库的探讨

传学方 面不符台上述结构 , 因为其 C 4 化学本质 的研究 , I4 ) 决
定抗 原 C) I 4的功能。因此 , 4 可以通过 3 指标组合并 结合 个 相关 医学知识必要的逻 辑词语来 探讨 某一研究 领域的 现状 和热点 。细节问题可 通过具 体 主题词 来解决 。这样 就可 以 较 理想地反 映某一主题各方面研究 的结 构和变化 , 为专业 研
s n i e h Ⅱ , 址 扯u n 锄 d fⅡe fc a a 螂 棚 et .tea 憎 t a 8a d h m so I 柚 a t l b d u d
s 3  ̄t e ̄ - s m s0l h 0 盯 1 o t eme ed ̄ t a 【 k峙 i hn r u e t l te d i I珊 t fh .1 a ul 切 髓 n C ia ae p t南 a d. I
研究 I辛 I
彦 缸 细|牯甜分子 皿 咐 文献计量研 究[ ]见 A. 张
荫昌 中 日 肿宿学术会议 论文 汇编 [ ]沈 期: C. 中国医科大学第
一
临床学院肿瘤所 , 0 .6 . 2 11 0 4 雷. 专题 文献高额主题词的共词聚类 分析[ ]情报理 沦与 J
实型敷据库提 出了建议 。
关键词 : 医学; 专题数据库 ; 实 事 型数据库构建
中圈分类号 : n 9 2
M e ka fcu ld 舡 d l a t a a 由螂
文献标识码 : A
:姐 t vs g e n ee a  ̄
文章编号 : 17 — 92 ∞0 )2— 呻3 0 6 1 38 ( 20 0 — 4
维普资讯
中华医学 图书情报杂志 20 年 3月第 1 卷第 2 02 1 期
浅析万方、维普、CNKI三大全文数据库

浅析万方、维普、CNKI三大全文数据库万方、维普和CNKI都是中国知名的全文数据库,它们的出现为学术研究和科研工作提供了很大的便利,同时也成为了各大高校、研究机构必备的数字化资源。
本文将对这三个数据库进行简要分析比较。
一、万方数据库万方数据库成立于1993年,是一家专业的学术论文数据库出版商。
初期,万方的数据仅仅是在一些学术刊物上进行索引和收集。
后来,万方开始充分利用其兽医信息库、地学文献库、中药文献库等多个专门领域的数据库,推出了“万方数据”全文数据库,覆盖几乎所有领域的学术文献,以满足读者和作者的需求。
目前,万方全文数据库中约有5600多万条记录,包括7388种学术期刊、3515种会议录、2200种博硕论文等,内容涉及自然科学、社会科学、医药卫生、农业、工程技术等各个领域。
其中,自然科学领域的文献比较丰富,覆盖率也较高。
对于一般读者来说,万方文献库的检索界面使用简单,检索速度快,而且用户可以通过“文献下载券”来下载文献。
二、维普数据库维普数据库成立于2000年,是一家高质量的综合性数字化出版服务商。
维普的业务有期刊出版、数字图书出版、学术搜索引擎、学术知识服务平台等。
其中,维普期刊数据库是其主要业务之一。
目前,维普数据库收录学术期刊近三千种,覆盖几乎所有领域。
其中,社会科学和人文科学领域占维普数据库期刊总量的较大份额,自然科学和医学领域则相对较少。
维普数据库的文章多数是付费的,不过有一些优质文章对于普通用户免费开放,并且下载速度也较快。
三、中国知网(CNKI)中国知网,成立于1999年,是中国最大的数字图书馆之一,是中国科技文献数据库的重要组成部分。
知网数据库已发布刊物功能、学位论文功能、会议论文功能、专利功能、标准功能。
CNKI数据库的内容涉及自然科学、社会科学、农业、医药卫生、工程技术等各个领域。
目前,CNKI数据库中拥有数以千计的学术刊物,包括科技论文、会议论文、专业报纸和行业文摘等,而此外还有大量的博士和硕士论文。
数据与事实型数据库的概念

数据型数据库和事实型数据库是两种不同类型的数据库概念。
1.数据型数据库:数据型数据库主要用于存储和管理结构化数据,这些数据以表格形式
组织,采用行和列的结构。
数据型数据库通常使用关系型数据库管理系统(RDBMS),如MySQL、Oracle等。
它们适用于需要对数据进行复杂查询、事务管理和数据完整性保证的场景。
数据型数据库强调数据的一致性和准确性,支持事务处理和数据关系建立。
2.事实型数据库:事实型数据库主要用于存储和分析大量的历史数据,以支持数据分析
和决策支持系统。
事实型数据库采用星型或雪花型模式来组织数据,其中一个中心表包含了主要的事实数据,而其他维度表则包含与该事实数据相关的维度信息。
事实型数据库通常用于数据仓库和商业智能系统中,用于快速查询和分析大量数据,并生成报表和数据分析结果。
总之,数据型数据库主要用于存储和管理结构化数据,强调数据的一致性和准确性,适用于复杂查询和事务处理;而事实型数据库主要用于存储和分析大量的历史数据,以支持数据分析和决策支持系统,适用于快速查询和分析大量数据的场景。
两者在数据组织结构和使用目的上有所不同。
事实数据型资源及特种文献检索

国外的网上法律信息资源
用Yahoo!如查找美国法律方面的信息,在
Government——Law下列出了美国38个法律问题 的超文本栏目等
二、经济信息的检索
(一)公司及产品信息的检索 公司:国内外企业名录 产品信息:产品年鉴、文摘、报告、样本 集、产品目录、产品及价格数据库。 大量产品信息也收录在企业名录中, 可以从其产品索引进行查找。
• 手工:报纸;信息机构发行的市场研究 和预测资料 • 网络:方便快捷 如搜狐“工商经济/分类广告/供求”; “易购网”: () “中华商网”: (/sell-buy/index)
2、国际市场价格信息的查找
• 国际联机检索 • 网络查找 1、利用搜索引擎,进入公司或商店的网站; 2、用布尔检索直接键入“产品名称 and price”; 3、在引擎框内键入“prices information” ,然 后在购物分类(shopping)中寻找所需商品。
(三)供求和交易信息的查找
(1)《中国大百科全书》 中国大百科全书》 新不列颠百科全书》 (2)《新不列颠百科全书》 (New Encyclopedia Britannica ) (3)《麦格劳-希尔科学技术百科全书》 ) 麦格劳-希尔科学技术百科全书》 网上百科全书: 网上百科全书: 北京百科全书网( 北京百科全书网():了解北京知识 了解北京知识
2、外国产品信息的检索
了解外国产品的作用: 了解外国产品的作用:
• 产品升级换代的依据和目标 • 引进技术和设备的参考和比较 • 市场行情分析的依据,提高我国产品在 国际市场上的竞争能力 • 了解外国企业的指南
外国产品信息
• 三大工具: 之一——<<托马斯美国制造商名录>> (Thomas Register of American Manufacturers, Thomas Pub.Co.,1906- Annual),收录 约15万家企业和12万余种产品的信息, 是印刷版名录中篇幅最大的一种。 网络版也已推出:
第五讲 事实数据型文献

事实数据型文献信息的检索利用
中国工具书资源全文数据库
以条目型数据为主体、检索为主要功能的全文检索
型数据库产品。收录国内的精品工具书2000种,包 括字典、词典、百科全书、书目、索引、手册、名 录、表谱、图录、文摘、政书、类书等各种类型工 具书资源,涉及理工、文学、哲学、历史、地理等 各个学科领域,适用于各类专业人员对专业知识的 检索与引证,同时也适用于普通用户的学习与参考。
书生之家数字图书馆
共购买12万种
分类方式:书生分类 中图法分类 使用方式: 无并发用户和册数限制 可连续打印 复制 下载并运行书生阅读器(reader) 镜像:http://202.195.72.31 登录后方能正常检索、浏览和阅读
(用户名和密码是系统默认的,用户无需更改)
书生之家数字图书馆
用户登录区,默认 用户名、密码,无 需更改
首先下载、安 装阅读器(新版 本)
显示中图法类目
书生分类区
书生之家数字图书馆
登录之后 所现界面
目前所购买主题13个
1993年北京世纪超星信息技术发展有限公司成立,
致力于纸张图文资料数字化技术及相关应用与推广, 是国内最重要的集ISP与ICP于一身的数字化信息中 心。
2000年1月超星数字图书馆在互联网上正式开通; 网址:/ 国家“863”计划中国数字图书馆示范工程
超星数字图书馆主站网简介
主站网:/ (会员用户) 特点:旧书居多,社科为主 文件较大 。
或
不受并发用户的限制,不受借阅册数的限制。
现在正在改进:注意吸纳新书 缩小数据量
改进文件存储格式,
超星数字图书馆江苏高校镜像站介绍
方正Apabi检索使用方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
事实型数据库资源浅析
张冬梅
摘 要: 数据库是图书馆最主要的电子资源。
与文献型数据库一样,事实型数据库也应该是图书馆数据库资源的一部分。
本文通过对图书馆的调查统计,分析了我国图书馆事实型数据库资源的现状与存在的问题,同时对如何评价事实型数据库提出了自己的观点。
关键词:事实型数据库 电子资源
1概述
数据库发展到今天,数量和各类已经非常庞大。
但迄今为止,对数据库的分类方法并没有统一。
各类数据库的标准化格式不健全,因此难以针对不同分头方法作出评价。
以Carlos Cuadrar的分类为出发点,他将数据库分类为 A.Reference Database(参照数据库)Bibliographic(文献型数据库)Referral(指示型数据库);B.Source Database(源数据库)Numeric(数值型数据库)Textual-Numeric(文本数值型数据库)Full-text(全文型数据库)Software(软件型数据库)。
我们会发现,这些数据库都有一个共同的特点,就是它们包含的信息都是用户直接可用的数值、文本或事实。
因为,笔者认为,数据库从内容上划分,分为文献型数据库和事实型数据库比较合适。
文献型数据库,包括目录文摘型文献数据库、全文型文献数据库。
这类数据库的学术性比较强,是科学研究成果的集合,是科研工作者进一步开展科研的基础;事实型数据库,包括数值数据库、知识数据库、法律法规数据库、新闻报道数据库、名录数据库、图像数据库、多媒体数据库、软件数据库等。
这类数据库专业性、时效性、应用性比较强,可以为科研工作提供支持、也可以为日常生活提供便利。
2事实数据库简介
2.1数据库类型
2.1.1数值数据库:存贮的数据是某种事实、知识的集合主要包括数字数据,如统计数据、科学实验数据、科学测量数据等。
如:中国科学计量指标数据库。
2.1.2事实数据库:存贮在计算机中的相互关联的数据集合。
收录人物、机构、事务等在现象、情况、过程之类的事实性数据,如机构名录、大事记等。
如万方中国科研机构数据库。
事实型数据库所包括的信息数据类型较多,如经贸信息、统计数据、企业基本信息及产品信息等相关信息均可划分到此种类型数据库中。
2.2检索类型
事实型信息检索(Fact Retrieval)、数值型信息检索(Data Retrieval)和文献型信息检索(Document Retrieval)三种。
事实型和数值型信息检索的内容主要是日常生活和工作中遇到的一些疑难问题,如字词、事件、事实、人物、机构名称,年代日期、公式、常数、规格、方法等。
这是一种确定性的检索,要么是有,要么是无;要么是对,要么是错。
2.3数据来源
2.3.1专门出版机构如中国统计出版社
2.3.2政府部门如国家统计局、省市统计局
2.3.3工具书如字典、词典、百科全书、年鉴、统计年鉴、手册、名录、大全、产品目录、样本、图集、图谱、法律条文等。
2.3.4企业如具体企业中负责数据统计的部门
3.事实数据库特征分析
通过使用,笔者发现事实型数据库区别于全文型数据库的特点在于以下方面:
3.1在以图书馆为代表的教学科研机构当中,事实类数据库的购买比例相对较低。
原因具体在于:事实型数据库产品比较全文型数据库数量较少;在内容的稳定性、规范性、学术性上较全文数据库弱;科研工作者使用事实型数据库的频率不及使用文献型数据库的频率高。
同时,事实型数据库本身也存在一些问题,比如:事实型数据库开发较难、产品质量良莠不齐;一些事实型数据库更新不及时、数据连贯性和准确性差、收录不够全面等等,这些问题都是可能制约事实型数据库实用性的因素。
3.2事实型数据库的专业性较强。
事实型数据库收录的内容一般不可能涵盖所有专业,往往是某一个专业、某一个行业,甚至某一个更小领域的相关信息。
例如:各种各样的商情数据库、行业或地区企业名录、法律法规数据库、医药数据库等等。
事实型数据库应该具有某一个领域的百科全书的功能,所以事实型数据库应该避免面面俱到,要有重点、有特色。
图书馆往往也根据主要服务对象的专业来选择订购事实型数据库。
3.3 事实型数据库的质量有待提高。
事实型数据库的质量一方面在于收录的内容,另一方面在于检索的平台。
事实型数据库的内容形式多样,有统计数据、企业名录、新闻报道等,如何将它们有序地组织起来,并且为用户提供方便的检索平台,是事实型数据库质量的关键。
目前,我国图书馆有一部分事实型数据库是由国内数据库商开发的,这些数据库重点收集我国相关行业的信息、数据、分析报告,在内容上具有一定的特色。
但往往由于数据库更新不及时、数据不连贯、检索点单一等原因使其内容上的特色不能很好地体现。
3.4 事实型数据库的相关版权问题。
通常情况下,文献型数据库的开发只要获得收录期刊、图书、论文等的版权人许可并支付一定报酬就可以了。
但事实型数据库的版权问题就复杂很多。
一方面,事实型数据库的内容丰富、种类繁多、信息来源广泛。
要妥善解决数据库收录的依法授权问题,可能要涉及很多权利人,例如:期刊杂志社、新闻媒体、科研院所、各行业统计机构、个体著作权人等等。
另外,如何判断哪些内容需要授权,哪些内容不需要授权,也是数据库收录中应该重视的问题。
另一方面,事实型数据库的很多内容本身是不构成版权保护的,例如:各种公开的政府统计数据、经济报告等。
这些信息的收集和组织过程中开发者投入了大量的成本,如何保护开发者的利益,这也是事实型数据库开发者最关心的版权问题。
4免费事实数据库推介
4.1黄页、白页:
中华大黄页
中国电信黄页 /
中国网上114/
美国机构名录 /
康帕斯世界企业、产品名录 /kinl/zh/
加拿大高校名录 http://oraweb.aucc.ca/showdcu.html
全球高校名录 /
4.2百科全书
国家百科全书 /
北京百科全书 http://beijing-book.db6 /
市场经济百科全书 /
4.3年鉴
中国年鉴信息网 /
国家统计局 http:∥
年鉴篇名数据库 /newpages/database/zgnj.htm
4.4字典、词典
词霸在线
粤语审音配词库 .hk/Lexis/lexi-can/
当代汉英词典 .hk/Lexis/lexi-can/
汉语大词典 /hd20/
4.5物化性质
化学元素特性 /
物理学参考数据 /PhysRefData/
医药药品信息 /medlineplus/
参考文献:
1.叶继元著.信息检索导论.北京:电子工业出版社,2003:125
2.蔡绍莹.事实型数据库初探.情报学报.1990(5):360-370
3. 何玮,雷春炳.医学专题事实型数据库的探讨.中华医学图书情报杂志,2002(2):3-6。