第5章第1节-数字化报刊资源及其检索系统
出版专业职业资格考试(中级)——《数字出版基础》笔记

数字出版基础笔记第一章数字出版概述第一节数字出版的概念2005年举办的“第一届中国数字出版博览会”标志着我国出版业驶入了数字出版的快车道。
一、数字出版的概念及其演变(一)数字出版的定义工作定义:指利用数字技术今夕内容编辑加工,并通过网络传播数字内容产品的一种新型出版方式,其主要特征为内容生产数字化、管理过程数字化、产品形态数字化和传播渠道数字化。
主要形态:电子图书、数字期刊、数字报纸、数字音乐、网络动漫、网络游戏、网络原创文学、网络地图、网络教育出版物、数据库出版物、手机出版物等。
数字技术是指借助一定的设备将图、文、声、像等各种信息转化为计算机系统能够识别的二进制数字“0”“1”后进行采集、加工、存储、传送、传播、还原的技术。
注意:数字技术如果只用于出版的某些业务环节,并不能被称为数字出版。
按需印刷,可将其视为数字出版的一个环节。
(二)电子出版的含义《电子出版物管理规定》的定义:以数字代码方式,将有知识性、思想性内容的信息编辑加工后存储在固定物理形态的磁、光、电等介质删个,通过电子阅读、显示、播放设备读取使用的大众传播媒体,包括只读光盘(CD-ROM、DVD-ROM等)、一次写入光盘(CD-R、DVD-R 等)、可擦写光盘(CD-RW、DVD-RW等)、软磁盘、硬磁盘、集成电路等,以及总署认定的其他媒体形态。
2008年发布的ISO9707标准中,对电子出版物的解释是:以数字形式出版并通过互联网访问或物理形态承载的文献,包括电子书、数字期刊和数据库。
(三)网络出版的含义《互联网出版管理暂行规定》中的界定:指互联网信息服务提供者将自己创作或他人创作的作品经过选择和编辑加工,登载在互联网上或者通过互联网发送到用户端,供公众浏览、阅读、使用或者下载的在线传播行为。
1.互联网出版是数字出版活动的形式之一。
与其他出版形式的区别:从根本上说,只是在于A.出版物的载体形式、B.物质生产方式和C.将出版物提供给消费者的方式不同。
中国报纸资源全文数据库

中国报纸资源全文数据库/portal/cumtb/index.do说明:校园网ip的用户直接登录地址即可使用,无需登录;如果使用收藏等个性功能可自助注册用户登录。
机构代码为:cumtb简介:中国报纸资源全文数据库是方正阿帕比技术有限公司联合全国各大报社开发的以国内报纸资源为主体的全文数据库系统,是国内首个整报完整收录的报纸全文数据库!也是国内首个集文章内容全文检索和在线报纸原版翻阅为一体的报纸全文数据库!该数据库不仅通过适合报纸资源的专业分类体系和检索方法为用户提供全国各大权威报纸内容级查询、检索服务,还将提供原版原式的报纸浏览和基于报纸资源的其它增值服务。
目前已经入库285种,每月新上架25~30种,覆盖了60%以上的报业集团报纸,如经济日报、解放日报、新民晚报、北京晚报等。
中国报纸资源全文数据库收录的报纸均获得了报社等出版机构的正式授权,没有任何版权风险。
中国工具书资源全文数据库/cumtb说明:校园网ip的用户直接登录地址即可使用,无需登录;如果使用收藏等个性功能可自助注册用户登录。
机构代码为:cumtb简介:“中国工具书资源全文数据库”是一个以条目型数据为主体、检索为主要功能的数据库产品,旨在成为以专业、权威工具书资源为主体的全文检索型数据库产品。
该数据库适用于各类专业人员对专业知识的检索与引证,同时也适用于普通用户的学习与参考。
该产品目前精选收录国内各大出版社出版的精品工具书资源2000余种,其中包括像《辞海》、《汉语大词典》、《中国大百科全书》等在国内公认的精品工具书。
中国年鉴资源全文数据库/cumtb说明:校园网ip的用户直接登录地址即可使用,无需登录;如果使用收藏等个性功能可自助注册用户登录。
机构代码为:cumtb简介:中国年鉴资源全文数据库是由北京方正阿帕比技术有限公司与中国出版工作者协会年鉴工作委员会共同发起,得到中国年鉴界公认并积极参与的中国主流专业的年鉴全文数据库。
所收录的年鉴覆盖了我国国民经济及社会发展的各个领域和地区,已形成较权威的中和反映我国国情地情的信息资源体系。
文献信息检索

第一章概说1、文献信息资源,在载体形式上,包括纸质文献和电子资源。
2、一次文献是依据作者本人的研究或研制成果创作的文献,即通常所说的“原始文献”、“第一手资源”。
一次文献在形态上具有多样性,在内容上具有原创性,在出处上具有分散性。
3、二次文献是按一定的方法对一次文献进行整理加工,以使之有序化而形成的文献,主要包括目录、索引、文摘等。
二次文献通常又被称为“检索性文献”、“线索性文献”。
4、三次文献是对大量相关文献进行综合分析而形成的评述研究性文献,如综述、述评等。
三次文献在内容上具有综合性,在功效上具有参考性。
5、传统的文献检索工具体系由印刷版工具书构成。
6、电子化的检索工具是以数据库的形式出现的,数据库类型有数值型数据库、事实型数据库、文献型数据库。
7、部首法首创于东汉时期著名学者许慎的《说文解字》。
8、在现有的电子版检索工具中,检索词主要有两大类:字段词和任意词以数值型数据库、事实型数据库和书目数据库出现的电子版检索工具,检索词是字段词。
以全文数据库出现的电子版检索工具,检索词可以是“任意词”。
9、“循环衍生法”包括定义衍生法、语素衍生法、语境衍生法。
10、现有的中文电子版检索工具一般都设有高级检索功能,较多地使用的检索技术是布尔逻辑检索、截词检索和位置检索,体现出的检索特点是组配检索、模糊检索和限定检索。
11、逻辑“与”(and)符号表示为“*”。
表示“同时包含”关系。
逻辑“或”(or)符号表示为“+”。
表示“分别包含”关系。
逻辑“非”(not)符号表示为“-”。
表示“排除其他”关系。
12、中文检索引擎的检索方式主要有两种:一是分类方式,二是关键词方式。
13、文献信息资源的引证标注有3种情况:注释、引文出处、参考文献。
14、文后参考文献著录的国家标准是1987年5月《文后参考文献著录规则》15、文后参考文献列表可以采用“顺序编码制”,也可以采用“著者——出版年制”。
16、《中国学术期刑(光盘版)检索与评价数据规范》(CAJ-CD规范)用单字母方式标识纸张型参考文献类型,如专著—M、论文集—C、报纸文章—N 、期刊文章—J、学位论文—D、报告—R;用双字母方式标识电子型参考文献和非纸张型载体的电子文献,如数据库—DB,磁带—MT、光盘—CD、联机网络—OL 。
河南省图书馆电子资源使用说明书

一、河南数字图书馆使用方法(1)点击河南省图书馆网站: 进入河南省图书馆主页面。
(2)在用户登录处填写用户名和密码进入用户登录。
(3)在用户登录成功后,点击“馆外读者入口”或“河南数字图书馆“蓝色部分。
馆外用户:即河南数字图书馆的所有持证读者,当读者在公网比如自己家中上网时,读者可根据读者证号在河南数字图书馆图书馆首页登录,平台根据读者来源到河南数字图书馆自动化管理系统读者库中查询,通过后读者可使用河南数字图书馆的数字资源。
馆内用户:即在河南省图书馆和各地市公共图书馆内上网的读者,通过建立的河南省公共图书馆局域网IP地址列表,采用IP地址认证的方式,IP地址范围内的上网用户可以自动登录。
(4)进入河南数字图书馆页面。
(5)通过相应的登录方式进入资源列表页面后,可采取两种检索方式对数据库进行使用。
一是可通过“一键检索”跨库检索,所有数据库检索到的不同载体资源将会列表显示。
二是可根据自己想要查找的内容进入相应数据库,根据每个数据库的检索方式进行检索、浏览、下载。
在使用数据库时,部分数据库需通过相应的专门阅读器进行阅读,如果用户电脑没有安装相应的阅读器,请根据提示,下载安装后即可阅览。
二、河南数字图书馆数据库使用指南2.1 博看畅销期刊数据库博看畅销期刊数据库作为目前全球第一中文报刊网,收录了3000多种40000多本畅销期刊杂志,我们经常订阅的杂志几乎都囊括其中。
博看网内容丰富,涵盖面广,每天更新70-100本杂志,每年可以增加20000本以上。
新刊上线时间基本上与纸版杂志上市时间同步。
所有的过刊仍然都保存,可以采取与现刊同样的方式阅读。
博看网除了有原文原貌的多媒体版,还提供电子版、语音版、下载版等多种阅读方式以满足不同读者的需求。
博看数据库的阅读界面像一本翻开的杂志,在当前页面上左击鼠标可放大阅读,再左击鼠标又缩回到原来的比例;在界面左侧右击往前翻页,右侧右击往后翻页;在放大的界面翻页亦是如此。
放大阅读前,在阅读界面右上方,有“单页放大”框,在这种状态下点击左键,可以单页放大;点击“单页放大”,更换为“双页放大”,这时再点击左键放大,即可同时放大两页阅读。
教科版高中信息技术基础全册ppt课件

不合适
不合适
合适
不合适
电视
报纸
电话 拨打121查询
网络
天气晴好
信息获取的一般过程
确定信息需求(明确目的)
报纸
网络 分析信息来源(分析途径)
确定信息获取的方法 (确定方法)
评价信息
从商业间谍中学习信息的获取
实例:日本人最先判断出了大庆油田
背景:据报载,20世纪60年代,中国大庆油田还处于保 密时期。日本人认为了解大庆的情况十分重要。因为中 国到底有没有油田?在哪里?有多大规模?这一切关系 到日本的出口贸易。于是他们确定了目标信息,大庆油 田及其产油量和规模。日本人当年最先判断出大庆油田 的情况,以至于在后来与中国谈判购买设备时占了先机。
IT(Information
Technology)信息技术
信息技术概念的不同角度的描述
1.信息技术是指有关信息的收集、识别、提取、变 换、存储、处理、检索、分析和利用等的技术。
2.信息技术是指利用计算机和现代通讯手段获取、 传递、存储、处理、显示信息和分配信息的技术。
3.信息技术是指研究信息如何产生、获取、传输、 变换、识别和应用的科学技术。
温故
C 下面叙述正确的是( )
A.因特网给我们带来了大量的信息,这些信息都是可信的,可以 直接使用 B.在因特网上,可以使用搜索引擎查找我们所需要的一切信息 C.有效获取信息后,要对其进行分类、整理和保存 D.保存在计算机中的信息是永远不会丢失和损坏的
人们对“红灯停,绿灯行”的理解,主要突出反映了信息的
●《人民日报》上一幅有钻台手柄的照片。
王进喜制服井喷,用身体搅拌水泥的图片。
王 进 喜 手 拿 钻 台 手 柄 的 照 片 。
数据库检索与网络检索(第2篇)

第四章
电子图书及报纸的检索与利用
(四)电子图书的作用 1.电子对图书馆资源建设的价值 作为馆藏资源的一部分 与纸质馆藏形成互补 2.电子图书对读者的利用价值 解决纸质图书的复本少的问题 方便检索和下载 (五)电子图书的发展趋势
第四章
电子图书及报纸的检索与利用
二、国内主要的数字图书馆介绍
(一)超星数字图书馆 本馆镜像:http://192.168.103.57:8000/ 中心网站:/ (二)书生数字图书馆 中心网站:/ (三)方正(Apabi)数字图书馆 中心网站:/
1.清华同方CNKI数据库
1.2《 1.2《中国优秀硕士学位论文全文数据库 》
简 介:《中国优秀硕士学位论文全文数据库》简称 CMFD,是国内内容最全、 质量最高、出版周期最短、数据最规范、最实用的硕士学位论文全文数据库。 出版内容:覆盖基础科学、工程技术、农业、哲学、医学、哲学、人文、社会 科学等各个领域。截止至2010年10月,收录来自561家培养单位的优秀硕士学位 论文107多万篇。 资源特色:重点收录985、211高校、中国科学院、社会科学院等重点院校高校 的优秀硕士论文、重要特色学科如通信、军事学、中医药等专业的优秀硕士论 文。 专辑专题:产品分为十大专辑:基础科学、工程科技Ⅰ、工程科技Ⅱ、农业科 技、医药卫生科技、哲学与人文科学、社会科学Ⅰ、社会科学Ⅱ、信息科技、 经济与管理科学。十大专辑下分为168个专题。 •收录年限:从1984年至今的硕士学位论文。 产品形式:WEB版(网上包库)、镜像站版、光盘版、流量计费。 出版时间: 1、中心网站版、网络镜像版,每工作日出版,法定节假日(春节 假日一般为15天,每年假日前10天公布起止日期)除外。 2、镜像版、光盘版,每月10日出版。
第二节
电子支付的概念

网上购物使用电子钱包,需要在电子钱包服务系统 中进行。电子商务活动中的电子钱包软件通常都是免 费提供的。用户可直接使用与自己银行账号相连接的 电子商务系统服务器上的电子钱包软件,也可以通过 各种保密方式利用互联网上的电子钱包软件。目前世 界上有VisaCash和Mondex两大电子钱包服务系统,其 他 电 子 钱 包 服 务 系 统 还 有 Master Card、Cash EuroPay的Clip和比利时的Proton等。
5.3.1 电子现金的属性
电子现金是纸币现金的电子化,它具有以下4个属性 1)货币价值 电子现金必须有一定的现金、银行授权的信用或银行 证明的现金支票进行支持。 2)可交换性 电子现金可以与纸币、商品或服务、网上银行卡、银 行账户存储金额、支票或负债等进行互换。 3)可存储性 可存储性将允许用户在家庭、办公室或途中对存储在 一个计算机的外存、IC卡,或者其他更易于传输的标准 或特殊用途的设备中的电子现金进行存储和检索。 4)重复性 必须防止电子现金的重复使用。
2)电子钱包的起源 英国西敏寺(National-Westminster)银行开发的 电子钱包Mondex是世界上最早的电子钱包系统,于 I995年7月首先在有“英国的硅谷”之称的斯温顿 (Swindon)市试用。被广泛应用于超级市场、酒吧、 珠宝店、宠物商店、餐饮店、食品店、停车场、电 话间和公共交通车辆之中。这是由于电子钱包使用 起来十分简单,只要把Mondex卡插入终端,三五秒 钟之后,卡和收据条便从设备付出,一笔交易即告 结束,读取器将从Mondex卡中所有的钱款中扣除掉 本次交易的花销。Mondex卡终端支付只是电子钱包 的早期应用,从形式上看,它与智能卡十分相似。 而今天电子商务中的电子钱包则已完全摆脱了实物 形态,成为真正的虚拟钱包了。
文献信息检索实用教程 第三版 第5章 电子信息资源与数字图书馆

第5章 电子信息资 源与数字图书馆
5. 2 电子信息资源的类型、特点及检索流程
第5章 电子信息资 源与数字图书馆
5. 2 电子信息资源的类型、特点及检索流程
5.2.2 电子信息资源的特点
1.组织形式变化 多样
2.信息资源数字 化
4.数据结构具有 3.内容丰富多样 通用性、开放性、
动态性
5.电子信息资源 体积小,数量巨
随着现代计算机技术、现代通信技术和存储介质的发展.电子信息资源已经成为信息时代的一 个标志。电子信息资源是以数字化的形式.把文字、图形、图像、声音、动imp等多种形式的信息存 放在光、电、磁等非印刷型介质上.以电信号、光信号的形式传输.并通过网络通信、计算机终端等 方式再现的一种信息资源。简单地说.电子信息资源就是电子化的信息资源.其实质是机读型信息资 源。
(2)
源数据库
①事实数据库。 ②全文数据库。 ③网络数据库。 ④特色文献数据库。 ③资源共享平台。
第5章 电子信息资 源与数字图书馆
5.数据库的构成
5. 3 电子信息数据库
书目数据库的结 构
数值数据库的 结构
全文数据库的 结构
指南数据库的 结构
第5章 电子信息资 源与数字图书馆
5. 4 数字图书馆
如今,我国已建成世界上最大的IPv6 示范网络.中小容量IPv6路由器的开发已领先国外。其中, IPv6源地址认证和下一代互联网过渡等核心技术已走在世界前列,奠定了末来网络更大规模发展 的基础。
截至2012年年底.全国已有200多个联机检索终端.提供与20多个国际联机信息检索系统的连接 与信息检索服务。建成并开通了中国科技网(CSTNET)、中国教育和科研计算机网(CERNET)、中 国公用计算机互联网(CHINANET)和国家公用经济信息通信网(CHINAGBN)四大互联网.并建成中 国高等教育文献保障系统(CALIS)和中国数字图书馆即中国知网(CNKI) 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章报刊资源与论文资料的查考第一节数字化报刊资源及其检索系统20世纪90年代中期以来,中国报刊资源及其检索工具数字化、网络化的进展迅速。
具体表现,一方面是一些传统的、影响大的印刷版报刊资源检索工具大都实现了数字化、网络化,形成了电子版与印刷版并存的局面;另一方面,出现了一批脱离印刷形态而基于计算机和网络环境的报刊资源检索系统。
到目前为止,查考20世纪80年代以后的中国报刊资源,完全或主要依靠电子版检索工具已经基本上可以满足需要。
一、中国期刊全文数据库(CJFD)清华大学开发研制的“中国期刊全文数据库”是目前国内有代表性的报刊资源检索系统之一。
该系统1996年开始投入使用,目前有光盘版(简称“CAJ—CD”)和网络版(简称“中国期刊网”)两种形式。
全文数据库收录国内6000多种核心与专业特色中英文期刊的全文。
到2004年初,已经积累了1994年至今的全文文献800多万篇,题录1500万余条,分9大专辑,126个专题文献数据库,被称为是“目前世界上最大的连续动态更新的中国期刊全文数据库”。
全文数据库的网络版通过CNKI知识网络服务平台系统建立了中国期刊网镜像站点,经过授权后,为通过互联网的使用者提供网上检索服务。
网络版数据每日更新。
全文数据库的光盘版每月每专辑出版一期(文史哲双月出版),与印刷版期刊基本同步发行,被称为是“当今世界上最大的集成化全文电子期刊”。
中国期刊全文数据库划分的9个专辑是:·理工A辑(数理科学)·理工B辑(化学化工能源与材料)·理工C辑(一般工业技术)·农业辑·医药卫生辑·文史哲辑·经济政治与法律辑·教育与社会科学辑·电子技术及信息科学辑中国期刊全文数据库网络版的基本使用方法是:论文资料检索→论文资料下载→使用专用阅读器阅览。
数据库的主要功能包括:(1)基本检索以字段词作为检索词进行检索。
该数据库系统目前为文献确立的字段包括:·篇名·作者·关键词·机构·中文摘要·引文·基金·全文·中文刊名·ISSN ·年·期·主题词在进行基本检索时,可以作两方面的限定:一是检索时限限定(1994年~目前),二是检索结果的排序方式限定。
排序方式有3种:一是不限定排序方式,二是限定按相关度排序,三是限定按文献的发表时间排序。
三是每页记录条数的限定,即对显示界面容纳内容的限定。
检索结果可以直接显示的,首先是命中文献的题名列表;点击题名,可以直接显示文献的内容提要。
若要阅读全文,需要点击文献提要栏内的“下载”标记,将文献下载保存到计算机磁盘,在计算机已安装专用阅读器阅读“Cajviewer”的情况下(专用阅读器可以随时下载安装),便可即时阅读。
例如,查考张岱年先生发表的有关“国学研究方法”的论文,基本过程如图5.1.1。
(2)类聚检索数据库中与命中文献有相关关系论文的链接检索。
包括:·同类文献。
数据库中与命中文献性质相同的论文。
·引用文献。
命中文献引用过的数据库中的文献。
·被引用文献。
命中文献被数据库中的文献引用的情况。
图5.1.2是《经济全球化与中国文化发展的道路》一文的同类文献检索结果。
类聚检索功能的设立,为相关文献源的拓展和文献的定量分析提供了方便。
(3)二次检索以字段词在检索结果中进行再次检索。
在上面的图 5.1.1中,以作者“张岱年”、时间“1994~2004”为检索条件,命中结果有91篇文献。
在这一结果中,以“国学”为篇名字段词进行二次检索,命中的结果缩小为3篇。
查准率大为提高。
(4)高级检索该系统的“高级检索”即布尔逻辑检索,可以进行不同字段检索词的逻辑“与”、逻辑“或“、逻辑“非”的组配检索。
图5.1.3以相同的字段检索词进行了不同的逻辑组配,检索结果不一样。
(5)全文检索以任意词为检索词对数据库中所有文献全文的检索。
全文检索可以在基本检索界面内进行,也可以将检索条件组配起来在“高级检索”界面内进行。
图5.1.4是将全文任意词“天人合一”、“机构”字段词“北京大学”和“中文刊名”字段词“北京大学学报”以逻辑“与”组配以后进行检索。
图5.1.3(6)检索词字典在高级检索界面提供作者、关键词、机构、基金、中文刊名、主题词6个检索词字典。
检索词字典是具有检索功能的检索词列表。
它将数据库收录的文献的相关字段按一定顺序加以排列,并具有快速检索和自动添加到检索界面的功能。
使用检索词字典,便于浏览数据库包含的相关检索词,也便于准确选择、快速添加需要的检索词。
如图5.1.5 是在“关键词”检索词字典中检索与“信息检索”相关的关键词。
如果确定用于检索的关键词是“社科信息检索”,只要点击该词,则自动切换到高级检索界面,并且检索词被自动添加到相应的文本框内。
图5.1.4图5.1.5二、中文科技期刊全文数据库这是国内另一个有代表性的大规模数字化期刊全文检索系统。
由重庆维普资讯公司开发,习惯上简称为“重庆维普”。
重庆维普资讯有限公司是科技部西南信息中心下属的一家大型的专业化数据公司,是我国较早开展中文资源数据库研制开发的单位之一。
早在1989年,重庆维普就开发出了软盘版的“中文科技期刊数据库”,90年代初,实现了产品的光盘化,90年代末又推出了网络版产品。
目前,数据库产品有有全文版、文摘版和引文版3种。
中文科技期刊全文数据库入库期刊达8000多种,涉及的时限从1989年开始至今,积累的数字化期刊文献近800万篇。
数据库覆盖的学科范围,分为自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报7个专辑,27个专题。
专题细目如下:该数据库的主要特点是,入库期刊数量多,时间跨度长;覆盖的学科范围以自然科学、工程技术、管理学科为主;不能提供全文数据的资源较同类数据库相对较少。
数据库的使用方法和“中国期刊网”基本相同,也是需要安装专用阅读器才能进行全文阅读。
数据库的主要功能和使用方法如下:(1)分类检索该数据库有比较强大的分类检索功能。
分类表镶嵌于数据库首页。
点击类目名称,分类体系逐层展开,直至相应的篇目列表。
(2)高级检索即不同检索字段的逻辑组配检索。
可选字段共有9个,分别是:关键词、刊名、作者、第一作者、机构、题名、文摘、分类号和任意字段。
同时可以进行检索限定,包括学科范围限定、期刊范围限定(“全部期刊”、“重要期刊”或“核心期刊”)、查找时限限定。
高级检索是该数据库的主要检索途径。
(3)传统检索在中文科技期刊全文数据库中,所谓“传统检索”实际上是一个具有综合检索功能的界面,如图5.1.6。
在这个界面中,单个检索词的简单检索、多个检索词的逻辑组配检索、二次检索等都可以进行,也可以进行期刊范围、检索时限的限定。
值得注意的是以下3种检索方法。
·整刊检索即以刊物为单位,查考该刊物每一期所发表的文章。
通过点击“中刊库分类导航”和“中刊库刊名导航”列表,都可以实现这一功能。
这一功能,为了解某一刊物的整体面貌提供了方便。
·关键词字段的同义词扩展。
在“检索入口”选择“关键词”字段的前提下,选中“同义词”选项,如果数据库的同义词表中有该检索词的同义词,就会自动显示,供选择添加。
如图5.1.7,输入的关键词是“电脑”,显示的同义词是“计算机”、“微电脑”,选择添加“计算机”,查考结果就是数据库中所有关键词包含了“电脑”和“计算机”的文献。
关键词的同义词扩展,是实现智能化检索的重要手段,对确保查全率有重要意义。
图5.1.6·作者字段的同姓名区分。
这一功能的原理与同义词扩展类似,是用来对数据库中涉及的同姓名作者加以区分的。
在“检索入口”选择“作者”或“第一作者”的前提下,选中“同名作者”选项,如果输入的作者有同名,系统自动显示同名作者列表,以供选择。
如图5.1.8,是名为“张红”的同姓名作者列表。
通过列表提供的作者单位信息,就可以准确地选择目标作者。
这一功能对缩小检索范围、提高查准率有重要意义。
图5.1.8三、CGRS全文检索系统天宇资讯开发的“CGRS全文检索系统”是以中国人民大学书报资料中心编辑的《复印报刊资料》和《报刊资料索引》为主要内容的网络版报刊资源检索系统,习惯上简称为“人大报刊检索系统”。
复印报刊资料是一种在国内人文社科领域影响较大的报刊资源检索工具。
目前选收范围为全国3000多种公开出版发行的报刊,划分为100多个专题。
印刷版按专题主要以月刊和双月刊的周期出版。
《复印报刊资料》的内容是分专题选录报刊论文的原文和篇目出处。
“原文”部分,全文影印各专题范围内的重要论文和重要动态,提供经过选择的原始文献。
选择的基本标准是:含有新观点、新材料、新方法,或具有一定的代表性;反映学术研究或实际工作部门的现状、成就及其发展。
“篇目”部分,全面汇集专题范围内报刊资料的篇目出处,提供的是经过编辑的二次文献。
与同类印刷版检索工具相比,《复印报刊资料》具有鲜明的特点。
在内容上,偏重选收学术性、理论性的资料信息;在编辑形式上,一次文献和二次文献相结合,对研究需求的满足程度较高;专题划分精细,具有较强的针对性。
目前,被《复印报刊资料》全文选收,已经成了国内学术界评价论文质量的基本指标之一。
报刊资料索引是一种以年度为单位分类揭示报刊论文资料出处的线索型检索工具。
它和《复印报刊资料》关系密切——包括了《复印报刊资料》全年各期全文复印及仅列论文篇目出处的全部篇目;但又不完全相同——《报刊资料索引》还收录了《复印报刊资料》限于篇幅而未能反映的篇目。
所以,《报刊资料索引》所揭示的篇目总数大于《复印报刊资料》年度各期篇目之和。
印刷版的《报刊资料索引》按学科、专题分7册编辑出版,另有著者索引1册。
网络版“CGRS全文检索系统”中的“人大全文数据库”是《复印报刊资料》的数字化形式,截至2004年初,收录1995年~2003年间的全文文献近20多万篇;“人大索引类”数据库是《报刊资料索引》的数字化形式,截至2004年初,收录1978年~2002年间的论文题录280多万条。
除上述两部分主体内容外,该系统平台还包括了如下几种数据库:·中国法律法规数据库,收录法律、法规、规范性文件5万多件;·诉讼法索引及全文数据库,收录文献2万多篇;·民事诉讼法学数据库,收录文献600多篇;·中国法律年鉴1987—2002年卷全文数据库;·《文史哲》杂志1951—2002年全文数据库。
CGRS全文检索系统的基本查询是以任意词作检索词进行全文检索,检索的对象数据库可以根据需要选定。
图5.1.9是基本查询的一个过程。