第4章 国内常用信息检索工具(系统)概述

合集下载

信息检索

信息检索

2、 报刊 报刊是一种以印刷形式或其它形式逐次刊行的,通常 有数字或年月日顺序编号的,并打算无限期地连续出 版下去的出版物。 报刊特点:数量大、品种多、内容丰富多样;出版周 期短,报道速度较快;发行、流通广泛、连续性强, 伴随着相应的学科领域发展而发展。 在检索工具的文摘中,往往有卷、期、页的标志(如 Vol. 10, No. 2, 201-209 )
信息检索(Information Retrieval):是指将信息按一 定的方式组织、存储起来,并根据用户的需要找出有 关信息的过程。它的全称又叫做“信息存储与检索” (Information Storage and Retrieval),这是广义的 信息检索。狭义的信息检索仅指该过程的后半部分, 从信息集合中找出所需信息的过程。
4、一、二、三次文献之间的关系 一次文献带有创造性;二次文献是在一次文献基础上 形成的,具有选择性、浓缩性;三次文献是在一、二 次文献基础上经过分析、提炼、总结形成的,具有概 括性。从一次文献到三次文献,是一个由分散到集中、 由无序到有序的过程。
三、按信息的表现形式划分
1、 文献型信息源 存储语言文字形式信息的各种载体的集合。 2、 非文献型信息源 数值型信息源、 声像型信息源、 多媒体信息源、 实物及口头信息源。
三、文献
1.文献的含义 在《文献情报术语国际标准(草案)》 (ISO/DIS5127)中对文献是这样定义的,即“为 了把人类知识传播开来和继承下去,人们用文字、 图形、符号、声频、视频等手段将其记录下来,或 写在纸上,或晒在蓝图上,或摄制在感光片上,或 录到唱片上,或存储在磁盘上。这种附着在各种载 体上的记录统称为文献”。 在《信息与文献术语》(GB/T4894— 2009)中对文献是这样定义的,即“文献,在 文献工作过程中作为一个单位的记录信息或实物对 象”。这里文献工作指的是为了存储、分类检索、 利用或传递而对记录信息所进行的连续和系统的汇 编和处理。

常用的中文信息检索系统

常用的中文信息检索系统

学术搜索
谷歌学术搜索是专门为学术研究人员提供的 搜索服务,能够方便地查找学术文献。
必应搜索引擎
微软旗下
必应是微软公司推出的搜索引擎,与 Windows操作系统深度集成。
搜索技术
必应的搜索技术也非常先进,能够提 供高质量的搜索结果和快速的响应速 度。
多元化服务
除了网页搜索外,必应还提供图片、 视频、新闻、学术等多元化搜索服务。
移动端信息检索的优化与创新
移动设备特性
移动设备屏幕尺寸有限、计 算能力相对较弱,需要针对 这些特性对信息检索系统进 行优化。
ቤተ መጻሕፍቲ ባይዱ
语音搜索
利用语音识别技术,用户可 以通过语音输入查询请求, 提高移动设备上信息检索的 便捷性。
位置感知服务
结合移动设备的定位功能, 可以提供基于位置的信息检 索服务,如附近的餐厅、景 点等。
概率模型
03
基于概率统计的检索模型,通过计算文档与查询相关的概率来
排序文档。
中文分词技术
基于词典的分词方法
利用预先构建的词典,将待分词的文本与词典中的词条进行匹配, 实现分词。
基于统计的分词方法
利用机器学习等统计方法,对待分词的文本进行建模,通过训练得 到分词模型。
基于深度学习的分词方法
利用神经网络等深度学习技术,对大量文本进行训练,得到分词模 型。
对于某些非通用语言,相关语料库和训练 数据相对匮乏,制约了跨语言信息检索技 术的发展。
机器翻译技术
多语言嵌入表示
随着机器翻译技术的不断进步,可以将不 同语言的文档翻译成同一种语言,便于进 行统一的信息检索和处理。
通过学习多语言的嵌入表示,可以实现不 同语言之间的语义对齐和匹配,为跨语言 信息检索提供有力支持。

第四章中文检索工具体系

第四章中文检索工具体系

第四章中文手工检索工具体系第一节中文检索工具一、中文检索工具概述浩如烟海的文献资料,按其编排特点和人们的使用习惯,大体可分为两类:一类是为获取知识或者欣赏而从头到尾细细阅读;另一类是为了释疑解难或查考特定的资料,才去翻阅或引用。

前者即为普通图书,后者便是工具书。

工具书是根据一定的查阅需要,系统汇集相关的知识资料或文献信息,按便于检索的方法编排的图书(文献)。

通常包括检索工具书(即是专门提供文献出处和内容线索的工具书,如书目、索引、文摘等)和参考工具书(是专供解疑答难,查找某一方面专题知识或有关信息用的工具书,包括字典、词典、百科全书、类书、政书、年鉴、手册、综述、名录、表谱、图录等)两大类。

本章将主要介绍这两大类工具书。

我们先介绍中文检索工具。

一个国家科技文献检索刊物体系建立与完善程度是衡量该国科技情报工作水平高低的标准之一。

每个国家都根据本国的实际需要,用本民族的语言,有选择有重点地搜集、整理、报道国内外的科技文献,编制各种类型的检索工具,使之成为本国广大科技工作者获得所需信息的重要手段。

为了适应我国科学技术事业发展的需要,满足广大读者快速利用文献的要求,我国编了各种中文检索工具,形成了中文检索工具体系。

我国的科技文献检索刊物体系的建立,经历了一个从无到有、从翻译引进到自编的发展过程。

解放以前,文摘刊物已经出现。

解放后,我国的检索刊物获得了较快的发展。

1956年,中国科学技术情报研究所(1992年改名为中国科学技术信息研究所)成立,标志着我国检索刊物的编辑出版工作开始走上了有领导、有组织、有计划的发展道路。

同年,由该所翻译出版了前苏联的许多文摘性检索刊物,到1961年,翻译出版的前苏联文摘增加到50种(分册),约占前苏联出版的文摘杂志的二分之一。

1961年以后,我国的检索刊物逐渐减少引进成分,从以翻译为主向“混编本”、“自编本”过渡,出版了《中国机械文摘》等检索刊物,使我国的检索刊物得到了快速发展。

国内外常用信息检索工具与检索服务系统介绍

国内外常用信息检索工具与检索服务系统介绍
书目数据库检索系统 概念:指存储某些或某一个领域的二次文献
(如文摘、题录等)书目数据的一类数据 库,属于参考数据库的一种。 特点: 历史悠久,20世纪60年代末开始发展,是 机读数据库先驱。 数据量大,连续性与累计性强。 使用上无限制,开放性比较好。 记录结构简单固定,标准化程度高。
搜索引擎的原理主要是通过网络搜索软件或多种人工方式将www站点上大量网站的页面信息搜集传输到本地经过加工处理建成索引数据库或目录指南从而能够对用户提出的各种查询请求做出响应并提供用户所需要的信息即
国内外常用信息检索工具 与检索服务系统介绍
赵玉冬 信息咨询部 njzhaoyudong163
国内外常用信息检索工具与检索 服务系统介绍
机读数据库检索服务系统
—1.书目数据库检索系统
EI数据库治疗囊括了世界范围内工程领域的众 多分支学科,如:土木工程、能源、环境、 地理和生物工程,电气、电子和控制工程、 机械、自动化、核能和航空工程,计算机、 人工智能和工业机器人,化学,矿业、金属 和燃料工程等。
数据来源主要是2600种期刊,、技术报告、 会议论文和会议录,22%为会议文献。该数 据库对检索全世界范围内工程与技术文献、 跟踪与评价技术新成果非常有用。系统提供 的检索方式有多种,相应的检索功能也非常 完备。
机读数据库检索服务系统
—1.书目数据库检索系统
社会科学引文索引(SSCI),SocialScience Citation Index
– 由美国ISI(Institute of Scientific Information)公司 出版和提供服务,目前所收录数据的最早回溯年 为1956年。
– SSCI收录全球1800多种主要的社会科学期刊论文, 同时也收录Science Citation Index Expanded所收录 的期刊当中涉及社会科学研究的论文—有些论文 同时被SCI和SSCI收录(如心理学,环境等),涉 及50多个领域。

第四章 中文信息检索工具

第四章 中文信息检索工具

二、期刊信息检索
(1)中文科技期刊数据库(维普) (2)中国学术期刊全文数据库(CNKI) (3)数字化期刊(万方) (4) Fulink期刊频道 (5)全国报刊索引 p157 (6)国家科技图书文献中心 (7)人大《人大复印报刊资料全文数据库》

三、科技报告
1、中国科技成果数据库(万方)P149 2、国家科技成果数据库(CNKI) P132 3、全国科技成果交易数据库 P149(万方) 北京市科技情报所出版

六、专利
1、中国国家知识产权局中国专利数据库 (/) 2、万方科技信息子系统中的中国专利数 据库 3、中国专利全文数据库(CNKI) 4、国家科技图书文献中心的中外专利系 列数据库 5 、 FULINK

七、标准




1、FULINK 2、万方标准文献数据库 3、中国知网国家标准全文数据库 4、网上查询 ( 1 )国家标准查询网 http://cx. spsp. gov. cn/index. aspx (可获全文) ( 2 )国家标准化管理委员会标准文献检索 (目录查询地址)
/SACSearch/outlinetemplet/gjbzcx. jsp
中文信息检索工具

Biblioteka 一、图书信息检索(一)书目信息检索常用工具
1.《全国新书目》半月刊,用于查找我国新近出 版图书信息。 2.《新华书目报》创刊于1964年,是目前全国唯 一一份出版行业信息工具报,具有书目征订的作 用。 3、馆藏书目数据库OPAC(联机公共查询目录)


(二)数字图书馆 超星数字图书馆P167 方正Apabi数字图书馆P175 书生之家数字图书馆P178 中国数字图书馆(中数图) Fulink平台

信息检索第四章 工具书概述

信息检索第四章 工具书概述

第四章工具书概述4.1工具书及其概念1、检索工具概述(1)检索工具的定义、特点检索工具是指用以存储、报道和检索文献的工具。

因此,它具有存储和检索的功能。

一般必须具备四个条件:①必须详细著录文献的外部特征和内容特征;②必须具有既定的检索标识,如主题词、分类号、著者姓名和文献序号等;③必须根据标识的顺序,系统地、科学地排列文献,使其成为一个有机的整体;④能够提供多种检索途径。

(2)什么是工具书?(定义见课件)2、工具书的特点:工具书的功用:它以其高密度的知识性、高精度的资料性、高效率的检索性和高频率的查考性成为人们学习和工作必备的工具。

总的来说它的功用是:指示读书门径,解决疑难问题,提供参考文献,节省时间精力。

3、工具书的类型:(1)检索工具的类型根据不同的划分标准可以分为不同的类型。

按收录的范围分:综合性、专业性、单一性型;按出版与载体形式分:印刷型(又分期刊、单卷和附录)、卡片型、磁带型、光盘型和缩微型;按著录方式分:目录、题录、文摘(这是最常见的划分方式);按检索方式分:手检、机检;按编著方式分:书目、索引、文摘、辞书、年鉴、百科全书。

在这里,为了便于掌握应用,我们依据检索工具的出版形式、汇编内容和所完成的检索类型,把检索工具书分成两大类型:提供知识的参考性工具书和提供文献线索的检索性工具书。

(2)参考工具书及类型:参考性工具书包括辞书、类书、政书、百科全书、年鉴、手册、表谱、图录、名录等。

(3)检索工具书及类型:检索性工具书包括书目、索引、文摘等。

(4)参考工具书与检索工具书的区别:二者既有联系又有区别:内容都是知识的高度浓缩和积累,但检索性工具书是对文献的特征做简赅(gāi该)的记载,属于二次文献的范畴,而参考性工具书则主要对知识进行精要的说明,属于三次文献的范畴;二者多是以纸张为载体的出版物,但前者多为期刊形式,出版周期短,及时性较强,而后者主要是图书形式或年鉴一类连续出版型的,出版周期长,稳定性较强;二者都是以供人查寻为目的,但前者提供的情报只是有关文献的线索,必须根据这些线索再查原谅,而后者提供的情势是具体的事实和数据,检索的结果可以直接利用。

第4章 国内常用信息检索工具(系统)

第4章 国内常用信息检索工具(系统)

4.1 文献检索-其他文献
还有很多其他文献形式,如科技报告和标准
文献也是文献检索的主要对象 学位论文、会议文献、专利文献、标准文献 和科技报告统称特种文献 这些文献的查找多有专门的数据库产品,同 时权威机构的信息也非常重要
4.1 文献检索-标准文献
标准是由主管部门批准,以特定形式发布作为共同遵 守的准则和依据 标准文献包括标准、技术规范、操作规程和法规等文 件 中国标准分为国家标准、行业标准、地方标准和企业 标准 标准文献的查找: 检索工具有《中华人民共和国国家标准目录总汇》等 系统:万方中外标准数据库;知网中国标准数据库; 中国标准服务网等
4.1 文献检索-图书检索



商业性目录:在版目录(Books-in-Print)、书商目录、发行 目录、征订目录,它主要是比较及时地预告正在付印的和现 期发行的书刊的最新情况,大多由出版社和书店编辑,种类 繁多,数量很大 馆藏书目 OPAC(第三代,联机公共目录查询系统) 各图书馆馆藏书目 图书搜索引擎(如google) 图书检索需注意的问题:当不确定检索图书题名时,适合使 用模糊检索;当检索结果过多时,要灵活使用类检索作为辅 助筛选条件(熟悉中图法);注意主题在图书检索中的应用
4.2 常用系统-中国知网重要报纸数据库简介
收录2000年以来中国国内重要报纸刊载的学
术性、资料性文献的连续动态更新的数据库 收录国内公开发行的414种重要报纸 提供报纸导航
4.2 常用系统-中国知网专利、标准、古籍
中国知网收录专利、标准和古籍类数据库
4.2 常用系统-中国知网年鉴全文数据库简介
4.1 文献检索-专利简介
专利有三层含义 第一层含义是从法律角度说的,指的是专利权,即 专利权人在法律规定的有效期限内,对其发明成果 所享有的独占权或垄断权; 第二层含义是从技术角度说的,指的是受专利法保 护的发明创造,简称“专利技术”; 第三层含义是从文献角度说的,指的是记载发明的 技术内容及其相关法律事项的专利文献 在我国,专利主要有三种类型:发明、实用新型和 外观设计。

信息检索第四章参考工具书概述

信息检索第四章参考工具书概述

第四章参考工具书概述4.1参考工具书的概念和特点一、参考工具书的概念参考工具书:根据特定的需要,广泛汇集有关的知识资料或文献信息,按便于检索的方法编排,以备查考的工具性图书。

二、我国工具书的产生与发展起源于先秦时代,汉代是工具是正式产生并奠定基础的时期,明清时期是古代工具书大集成时期。

近代以来①工具书的内容:从集中古代典籍的整理和诠释转为注意记述一些新事物②2、编排特殊,便于查检:工具书具有科学的编排形式和高效率的检索方法。

把大量知识信息组织成大小不等的单元,并且有严密的结构体系以覆盖有关的知识领域和文献范围,以简驭繁逻辑性组织性强。

工具书的排检方法有部首法笔画法笔顺法号码法等。

3、准确可靠,权威性强:①收录确定可靠公认权威观点概念②论述精炼出处详明③及时修订再版以更新补充新内容4.2参考工具书的种类与排检方法一、参考工具书的种类二、参考工具书的结构参考工具书的结构:参考工具书的整体构成形式和各部分的基本体制,大体上由序和跋(前言和后记)、凡例或说明、正文、辅助索引、附录补遗五部分构成。

三、参考工具书的排检方法排与检是相互联系的,对工具书的编纂者来说是编排方法对工具书的使用者来说是检索方法,所以统称为排检方法。

(一)按字顺排列:按工具书的字形或读音将工具书中的条目加以编排包括形序法和音序法。

1、形序法:根据汉字形体结构的特点加以排列的方法。

(1)部首法:根据汉字形体结构的特点,利用其偏旁的同一性来编排条目的方法。

是我国(3)笔顺法:利用汉字的笔顺作为排检方法。

汉字的基本笔形是点横竖撇捺,两种或两种以上基本笔形连用又组成复杂的折笔。

现在笔顺法作为笔画法的补充。

优点:使用简单缺点:①书写习惯不同笔画和起笔有时很难确定②现行工具书中某些字的笔顺有分歧使用笔顺法应掌握汉字的一半规律。

(4)号码法:是形序法的一种变形。

把汉字分成若干种笔形,用阿拉伯数字作为代码,然后把每个字的笔形代码连接为号码,再依号码大小排列。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.1 文献检索-查找学位论文
综合性检索系统 中国学位论文文摘数据库(万方) 中国优秀博/硕士论文全文数国家科技图书文献中心中文学位论文查询 国家图书馆学位论文检索 /. 各高校图书馆 台湾地区部分高校学位论文查:/ 香港大学学位论文在线 http://sunzi1.lib.hku.hk/hkuto/index.jsp
第4章 国内常用信息检索工具/系统
文献检索
常用信息检索系统 数据与事实检索
4.1 文献检索-基础
文献检索是相关性检索
本节的介绍涉及国内主要文献检索系统,这
些系统有些是综合型的,有些是专题型的。 但常用的检索系统放在第2节介绍
4.1 文献检索-问题提出
问题的提出 已知图书的作者或者作者姓名中的部分,如何查找 该图书 已知书名或者书名中的部分词组,如何查找该图书 如何查找某一主题的图书 如何按照学科分类查找图书 如何识别某篇参考文献是图书 常见的图书检索途径?
4.1 文献检索-报刊检索
你知道的查找报刊信息的方法?




综合性:中国知网、万方、维普、科技图书文 献中心等 专门报刊检索工具:《全国报刊索引》、《人 大复印报刊资料》《全国期刊联合目录》 报刊自行创建的检索系统:如《人民日报》光 盘检索系统、《长江日报》等;另有台湾地区 的新闻智慧网(10大报纸)、台湾时报等。 专业领域的期刊检索:分散在专业领域的检索 系统中
4.1 文献检索-全国报刊索引
《全国报刊索引》:由上海图书馆编辑出版, 一种题录类综合性的检索工具,月刊分为:哲 学社会科学版和自然科学版两种。目前提供网 络版检索 《全国报刊索引》综合数据库从1993年开始 编辑发行 为了全面报道国内中文报刊资源,2004年起 推出了《全国报刊索引数据库-目次库》,收 录各类报刊近万种,几乎包括了国内(包括港 台地区)所有的中文报刊资源

4.1 文献检索-书刊常见检索途径
题名:书名、刊名、篇名等
责任者:著者、译者、编者等 主题:分类号、主题词等 标识号:国际标准书号ISBN、国际标准刊号
ISSN、中国统一书刊号、标准出版物号、专 利号、索取号等 出版信息:出版地、出版者
4.1 文献检索-图书检索


《全国总书目》和《全国新书目》 《全国总书目》:了解我国出版物状况的权威渠道。 01-03年随印刷版附送光盘,04年后提供网络查询 《全国新书目》半月刊:及时报道全国每月新出版 的图书,与《全国总书目》的区别表现在前者是及 时报道,后者是累积本
4.1 文献检索-学位论文简介
学位论文是高等学校和研究机构的毕业生为
取得学位资格撰写的学术性研究论文。美国 将学位论文称为Dissertation 根据授予学位级别论 文有较高的学术参考价值 如何查找学位论文?学位论文的一般检索途 径?

4.1 文献检索-会议文献简介
会议文献是指国内外各种学术会议上宣读或
交流的论文、报告、会议记录等文献资料。 广义的会议文献包括征稿信息、会议论文、 会议期间的文件、讨论稿、征求意见稿等 狭义的会议文献仅指会议录上发表的文献 会议文献多以会议录、图书、期刊、科技报 告、声像资料等形式发行

4.1 文献检索-人大报刊复印资料






《人大复印报刊资料》:由人大书报资料中心聘请100多 位专家、学者、教授从全国公开出版的4000多种核心期 刊、报纸中精选出的社会科学、人文科学文献 筛选标准: 内容具有一定的学术价值、应用价值 含有新观点、新材料、新方法、或具有一定的代表性 能反映学术研究或实际工作部门的现状、成就及其新发 展的学术资料。 人大复印报刊资料数据库分“全文”和“索引”两个部 分 按照类别组织,分为教育类(包括文化、教育、体育)、 文史类(包括语言、文学、艺术、历史、地理及其它)、 经济类(单独)、政治类(包括马列、哲学、社科总论、 政治、法律)等
4.1 文献检索-会议信息的获取

可以通过中国学术会议在线网 获取中文会议信息 专业网站和机构了解会议召开计划 通过搜索引擎查找
4.1 文献检索-查找会议文献



综合性检索系统 中国学术会议论文全文数据库(万方) 中国重要会议论文全文数据库(CNKI) 中国科技图书情报中心会议论文文摘库(可通过文献传递服 务获取全文) 馆藏资源 通过搜索引擎获得免费会议文献 会议文献检索时需注意的问题:有些会议论文以书的形式发 表,有些以刊的形式发,在馆藏目录检索时应选择书刊两种 类型;尽量使用模糊检索;检索设定的时间最好和会议时间 有间隔
4.1 文献检索-中文电子图书


能够提供全文的图书查询: 方正电子图书(apabi) 超星数字图书馆 书生之家 中国数字图书馆电子图书 读秀学术搜索 网上专门的电子图书网站,例如网络电子全文图书的购买 及试读
4.1 文献检索-图书检索



商业性目录:在版目录(Books-in-Print)、书商目录、发行 目录、征订目录,它主要是比较及时地预告正在付印的和现 期发行的书刊的最新情况,大多由出版社和书店编辑,种类 繁多,数量很大 馆藏书目 OPAC(第三代,联机公共目录查询系统) 各图书馆馆藏书目 图书搜索引擎(如google) 图书检索需注意的问题:当不确定检索图书题名时,适合使 用模糊检索;当检索结果过多时,要灵活使用类检索作为辅 助筛选条件(熟悉中图法);注意主题在图书检索中的应用
相关文档
最新文档