信息检索的种类
信息检索的基本知识

⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识
信息检索按检索对象可分为

信息检索按检索对象可分为:1)文献检索(包括题录、文摘和全文);2)数据检索(包括数据、表格、公式等);3)事实检索(以某一客观事实为检索对象,查找某一事物发生时的时间、地点及过程的检索)?定题服务(意义)文献分类:一)按出版形式可分为:1)图书(50页以上的印刷方式或其他方式或单独刊物的出版物,eg:专著、汇编书、多卷书、丛书等;正式出版的图书都会有一个国际标准书号ISBN); 2)期刊:每一种期刊都有一个连续出版物编号或称国际标准刊号ISSN【附:?维普——期刊;CNKI,万方——期刊、学位论文、报纸、图书】二)按载体形式分类:1)印刷型文献/纸质型文献;2)机读型文献——1、缩微型(缩微胶卷、缩微平片),2、视听型文献(录像带、VCD、英语磁带等),3、数字化文献(光盘、磁带、数据流带等)印刷型和数字化型是主要的文献载体形式文献的级别:1)一级文献(原始文献,一般指作者的原始创作,eg数据库提供的原文,专著、期刊论文、学位论文、研究报告、会议论文、专利文献等)2)二次文献(统称检索工具,文献检索的主要工具和手段(题录、目录、索引、文摘等)3)三次文献(年鉴、进展、述评、综述等)【灰色文献/零次文献——未公开的最原始的文献】检索工具的种类——按著录格式分类:1)目录,即书目(典藏目录、联合目录);2)索引(题录,即概要,指检索工具所著录的篇目、著者、出处、语种等,但不包括文摘);3)文摘信息组织:主题词组织法——美国国立医学图书馆编制的医学主题词表MeSH是目前最权威、最常用的标准主题词表(Pubmed、中国生物医学文献数据库均采用);《中国图书馆分类法》即《中图法》是目前国内常用的体系分类语言。
截词检索:*代表一或多个字符;?代表任意一个字符;2)字段限制检索:制定检索提问在特定字段中出现,只有在指定的字段中出现与检索提问相同的记录才能被检索出来。
Eg.“提问”【字段名】;如、HIF U 【TIAB】获得信息——每条列表对应一个网页且应包含以下三个要素:标题,URL—检索出的每一条信息的地址、网址,摘要第一个搜索导航工具——雅虎——目录式(1)引号可以避免搜索引擎拆分关键词(2)《》百度的特殊用法:书名号会出现在搜索结果中;不会被拆分百度、google常用语法:1)filetype——特定文档类型的搜索。
信息检索复习题

信息检索复习题第1章信息:狭义是指适用通信、存储或处理的形式来表示的知识或消息,即用语言、文字、数字、符号、图像、声音、情景、表情、状态等方式传达的内容。
信息资源是企业生产及管理过程中所涉及的一切文件、资料、图表和数据等信息的总称。
信息资源与企业的人力、财力、物力和自然资源一样同为企业的重要资源,而且是企业发展的战略资源。
文献:是记录知识的一切载体,是指将知识、信息、利用文字、符号、图像、音频等技术手段记录在一定的物质载体上。
文献的三个基本属性:即文献的知识性、记录性和物质性。
它具有储存知识、传递和交流信息的功能。
文献的类型:1、按照文献的载体形态来划分:分为印刷型、微缩型、声像型和电子型。
2、按文献的出版形式划分:分为图书、期刊、会议文献、科技报告、学位论文、技术标准、专利文献。
在正式出版图书封底都有一个ISBN叫国际标准书号。
在正式出版期刊封面都有一个ISSN叫国际标准编码。
特种文献又称丛刊,或不定期的连续出版物,是出版形式比较特殊的一种文献类型。
P5科技报告:记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告、报告文献。
会议文献:在学术会议上宣读和交流的论文、报告及其他有关资料,会议文献多数以会议录的形式出现,特点:传递情报比较及时,内容新颖,专业型和针对性强,种类繁多,出版形式多样,会议文献分为:会前、会中和会后3中。
政府出版物:各国政府及其所属机构出版的,有官方性质的文献,又称官方出版物,是指有政府机关负责编辑印刷的,并通过各种渠道发送或出售的文字、图片、及磁带、软件等。
其他类型资料:包括产品样品、档案文献、灰色文献和视听资料等。
按照文献产生的次序与被加工整理的深度划分:可将文献分为零次文献、一次文献、二次文献、三次文献。
一次文献:是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也称原始文献,其所记载的知识信息比较新颖、具体、详尽。
信息检索:是指信息按照一定的方式组织起来,并根据信息用户的需要找出有关信息过程和技术,狭义的信息检索是指信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程。
信息检索

中文书本式的检索工具
《国内总书目》--《全国新书目》《科技新 书目》:查找国内出版的图书目录 《外文新书通报》:查找国外新书目录 《全国报刊索引》:查找国内期刊论文的工 具 科技 文献书目型数据库检索系统 事实型数据库检索系统 数值型数据库检索系统 全文数据库检索系统
“逻辑或”的组配种类
同义词 同一个人多个姓名 通用的英文缩写 化学物名称 Eg:CAD
逻辑非
用于排除含有不需要概念的信息,可缩小所 检索信息的范围。 逻辑运算符:“NOT”、“-” 逻辑表达式:“A NOT B ”“A-B” 语义表示:被检索文献中含有A而不含有B
4字段(限制)检索
在检索系统中,数据库设置的可供检索的字 段通常有两种: 表达文献主体内容特征的基本字段 表达文献外部特征的辅助字段 基本字段包括篇目(TI)、文摘 (AB)…… 辅助字段包括作者(AU)、语种 (LA)……
4字段(限制)检索
为了缩小检索范围,可利用字段代码来限制检索词 出现的字段,以提高检索速度和命中率。 如: economic models in ti(表示只在题 目字段中查找文献) economic models in de(只在主题词中 查找) economic models in ab(只在文摘中查 找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献)
位置算符检索即运用位置算符表示两个检索 词间的位置。 如果说布尔逻辑算符是表示两个概念之间的 逻辑关系的话,位置算符表示的是两个概念 在信息中实际物理位置关系。
检索时会经常遇到这样的问题?
信息检索

中国数字图书馆 中国数字图书馆有限责任公司,隶属于中国 国家图书馆 / 检索方式:初级检索、高级检索和分类检索
二、期刊信息检索 1、综合性数据库 (1)中文科技期刊数据库(维普) (2)中国学术期刊全文数据库(CNKI) (3)数字化期刊(万方) (4)Fulink期刊频道 (5)全国报刊索引 2、专业性数据库 (1)中国农业科技文献数据库(万方)P79 (2)中国生物学文献数据库P82 (3)中国农业知识仓库(CNKI)P87
参考工具书是指根据一定的社会需要,广泛汇集 某一领域或专题的较为成熟的知识信息,并以特 定的编排形式和检索方法,为人们提供快速查阅 某方面基本知识或信息的特定图书。 相比一般图书而言,具有查考性、易检性、概括 性、权威性、完备性、资料性、稳定性、系统性 等特点
参考工具书排检法:形序排检法、音序排检法、 字母顺序、主题排检法、分类排检法和自然顺序 (时序、地序)排检法
4、手册 《农药残留检测与质量控制手册》、《蔬菜病虫害防 治实用手册 》、《肥料实用手册 》、《食品添加剂 手册 》 5、名录 人名录、地名录和机构名录 《中国当代名人录》、《中国地名录》、《中国农业 科学研究机构名录》
6、图录 《中国动物图谱》 7、表谱 年表、历表和专门性表谱 《中华人民共和国大事记》、 《两千年中西历对照 表》、 《周恩来年谱》
(四)专利P143 1、中华人民共和国国家知识产权局中国专利数据库 ( / ) 2、万方科技信息子系统中的中国专利数据库 3、中国专利全文数据库(CNKI) 4、国家科技图书文献中心的中外专利系列数据库 5、FULINK
(五)标准 1、FULINK 2、万方标准文献数据库 3、中国知网国家标准全文数据库 4、网上查询 (1)国家标准查询网 /index.aspx(可获全文) (2)国家标准化管理委员会标准文献检索 /SACSearch/outlinetemplet /gjbzcx.jsp(目录查询地址)
第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网
它
7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;
信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
信息检索

一、信息的定义1、定义不同的学科、从不同的的角度对信息有不同的解释。
广义的说,信息就是消息。
一切事物的存在都有消息。
2、信息的类型及特征(1)可识别性信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。
不同的信息源有不同的识别方法。
(2)可存储性信息是可以通过各种方法存储的。
(3)可扩充性信息随着时间的变化,将不断扩充。
(4)可压缩性人们对信息进行加工、整理、概括、归纳就可使之精练,从而浓缩。
2、信息的类型及特征(5)可传递性信息的可传递性是信息的本质等征。
(6)可转换性信息是可以由一种形态转换成另一种形态。
(7)特定范围有效性信息在特定的范围内是有效的,否则是无效的。
二、知识1、定义:是人类对信息、对客观事物规律的认识,它是人们在社会实践中积累起来的经验。
人们对事物由表及里、由现象到本质、由感性到理性的认识深化,便形成了知识。
知识是信息内容的组成部分。
2、知识的基本属性实践性规律性渗透性继承性实践性社会实践是一切知识产生的基础和检验知识的标准,科学知识对时间有重大指导作用.规律性人们对时间的认识是一个无限的过程,人们获得知识在一个层面上揭示了事物及其运动的规律性。
渗透性随着知识门类的增多,各种知识可以相互渗透,形成许多新的门类,形成科学知识的网终结够体系。
继承性每一次新知识的产生,既使原有知识的深化和发展,又是更新的知识产生的基础和前提。
知识被记录或被物化为劳动产品后,可以世代相传和利用。
三、情报1、概念情报是指被传递的知识或事实,是知识的激活,是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研,生产中的具体问题所需要的特定知识和信息.情报是活化了的知识,即被利用的知识.2、情报的基本属性知识性与信息性:情报必须具有实质内容,凡人们需要的各种知识或信息都可成为情报的内容。
针对性:任何知识和信息,人们不利用、不知道其存在,就不能成为情报。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索的种类
信息检索是指使用计算机技术,通过输入关键词等方式,获取网络中
的相关文本、数据和图像等信息的过程。
信息检索由于其重要性和广
泛应用,已经发展出了多种检索分类。
本文将介绍信息检索的五种分类。
1. 文本检索
文本检索是信息检索中最常见的形式。
这种检索是指用户输入关键词,然后计算机返回文本文件中包含这些关键词的所有文件。
文本检索可
以通过基本类型、布尔运算符或者向量空间模型(VSM)等方法进行操作,其有利于搜索具有某些特定主题的文档,是最基本的信息检索。
2. 图像检索
图像检索是指使用图像描述或样本图片查询相关图片的过程。
图像检
索非常重要,因为纯文本检索无法满足人们对照片和其他图像的搜索
需求。
图像检索可能涉及到基于颜色、文本、纹理、形状等方面的各
种特征,并选择相应的图像来用于搜索。
3. 音频检索
音频检索是指使用计算机技术检索音频文件,包括闻起来很棒的歌曲
和其他类型的声音剪辑。
音频检索算法通常分为两种类型:基于内容
的检索和基于元数据的检索。
此外,用户也可以从网络信息库中搜索
他们想要的音频,比如在一些音乐网站上搜索本地或全球性的音频。
4. 视频检索
视频检索是一种查询视频文件的方法,可以检索包含关键字的视频文件。
与图像检索类似,视频检索的算法通常需要基于视觉、颜色、文本、音频等多种特征进行,从而能够实现更准确的检索。
5. 数据库检索
数据库检索是指通过结构化查询语言(SQL)搜索关系数据库中的记录。
这种检索可以是基于关键词、數值等方式搜索数据,也可以是基于特
定的数据库软件检索;除此之外,还可以实现通过网络收集的信息库
上进行搜索。
总之,信息检索是现代计算机和网络技术中的一个重要组成部分,随
着信息存储和收集的不断增加,信息检索的重要性也在不断提高。
越
来越多的互联网用户对信息检索进行了更为广泛的尝试,从而开拓了
新的检索领域和方法。