第1章 网络信息检索基础知识

合集下载

信息检索与利用第一章-精选文档

信息检索与利用第一章-精选文档

2.文献的构成 文献的四要素:知识信息、物质载体、符号系统、 记录方式。 构成文献的四个基本要素: (1)构成文献内核的知识信息。 (2)负载知识信息的物质载体。 (3)记录知识信息的符号系统。 (4)记载知识信息的记录方式。 其中: a.知识决定文献的内容, b.载体决定文献的形态, c.记录则是构成文献的手段。
基本内容
• • • • • • • 1.信息资源概述 2.信息检索概念 3.信息检索技术与程序 4.常用中文检索系统 5.常用外文检索系统 6.特种文献信息的检索 7.文献信息的利用
第一章
信息资源概述
第一节 信息素质教育 第二节 信息资源的概念 第三节 信息资源的构成
第一节
信息素质教育
一、信息素质及其内涵
客观事物--->感性认识--->知识
2.知识的属性主要有
意识性、信息性、规律性、 实践性、继承性、渗透性。
3.知识可分为四大类
(l)知道是什么的知识(Know-what),是指关于事实方面的知识,这类知 识通常被近似地称为信息。 (2)知道为什么的知识(Know-why),是指自然原理和规律方面的科学理 论,这类知识的生产往往是由专门的研究机构形成的。 (3)知道怎么做的知识(Know-how),是指技艺或能力方面的知识,被称 为技术诀窍或专有技术。许多企业的技术情报和商业秘密被归人这一 类信息。 (4)知道是谁的知识(Know-who),是指谁知道和谁知道如何做某些事的 信息,这在社会高度分工的经济时代中显得尤为重要,这类知识比任
信息检索与利用
图书馆教研室
教学目的和任务
• • • • • • • 1.了解文献信息的基本知识; 2.了解信息类型和信息源分布; 3.掌握信息检索的基本原理和方法; 4.熟练使用本领域常用检索工具; 5.掌握网络学术资源的检索方法; 6.掌握获取全文的方法; 7.学会分析、整理、正确使用信息的方 法。

网络信息资源开发练习题第1章 信息资源检索基础知识

网络信息资源开发练习题第1章 信息资源检索基础知识

第1章信息资源检索基础知识第一部分选择题一、单项选择题。

在每小题列出的备选项中只有一项是最符合题目要求的,请将其选出。

1.文献的三个基本属性是知识性、物质性和(D)A.符号性B.交流性C.传递性D.记录性2.在信息概念的诸多层次中,最重要的两个层次是从客体出发的本体论层次和从主体出发的(B)A.客观论层次B.认识论层次C.主观论层次3.通常依据信息表达形式和所依附的载体将信息资源分为口语信息资源、体语信息资源、文献信息资源和(A)A.实物信息资源B.记录型信息资源C.多媒体信息资源D.样本信息资源4.一般是以纸张为存储载体,以印刷技术为主要记录手段,如油印、胶印、复印、激光打印等的文献信息资源是(D)A.书写型信息资源B.记录型信息资源C.声像型信息资源D.印刷型信息资源5.属于一次信息资源的是( A )A.期刊论文B.百科全书C.综述D.文摘6.文献检索工具可以进一步细分为四种检索工具:目录、文摘、索引和 ( B )A.书目B.题录C.摘要D.年鉴7.在布尔检索法中,“A or B”表示査找出( C )A.含有检索词 A同时含有检索词 B的文献B.含有检索词 A而不含检索词 B的文献C.含有 A、B之一或同时包含 AB两词的文献D.含有检索词 B而不含检索词 A的文献8.使用国家图书馆的高级检索方式,检索式“主题=(民用飞机)”的含义是(A)A.检索主题词字段含有民用飞机的记录B.检索作者字段含有民用飞机的记录C.检索标题字段含有民用飞机的记录D.检索关键词字段含有民用飞机的记录9.以刊载新闻为主的出版周期最短的定期连续性出版物是(B)A.图书B.报纸C.期刊D.会议论文10.用来组配检索词的并列关系的组配运算符是(A)A.逻辑“与”B.逻辑“或”C.逻辑“非”D.以上均不是11.以磁性材料为载体,以磁录技术为主要记录手段而形成的,如磁带、磁盘、光盘等的文献信息资源是( C )A.多媒体信息资源B.记录型信息资源C.声像型信息资源D.机读型信息资源12.二次检索指的是(C )A.第二次检索B.检索了一次之后,结果不满意,再检索一次C.在上一次检索的结果集上进行优化的检索D.与上一次检索的结果进行对比,得到的检索13.检索语言中,用未经规范化处理的自然语言词汇表达的是( D )A.标题词B.主题词C.叙词D.关键词14.检索有关“飞机”、“车辆”、“轮船”等文献,从理论上说主题词应该是( D )A.“飞机”、“车辆”、“轮船”任意一个B.“交通工具”C.“飞机”、“车辆”、“轮船”三者D.这三个词的任意一个加上“交通工具”15.位置检索主要有词位置检索、同字段检索和 ( A )A.同句检索B.F算符检索C.L算符检索D.X算符检索16.没有经过规范化处理的自然语言,通常从文献的题名、摘要或正文中直接抽取出来,能够揭示信息内容特征的具有检索意义的词汇是 ( A )A.关键词B.叙词C.单元词D.标题词17.由政府部门及其所设立的专门机构发布、出版的文献信息资料是 ( B )A.档案文献B.政府出版物C.标准文献D.科技报告18.只检索最新的信息,检索的时间跨度小,非常适合于信息跟踪,便于及时了解有关主题领域的最新发展动态的检索是 ( B )A.回溯检索B.定题检索C.计算机检索D.事实检索19.检索效果是指检索服务的有效程度,其中由检索系统完成其功能的能力确定,主要表征检索系统的性能和服务质量的是 ( C )A.服务效果B.经济效果C.技术效果D.功能效果20.对于信息检索用户来说,影响查全率和查准率的因素中不包括( D )A.检索词使用不当B.检索系统选择不恰当C.检索课题要求不明确D.检索系统内信息存储不全面21.能够反映事物之间的相关和从属派生等关系,便于用户按学科门类进行族性检索的检索语言是 ( D )A.主题语言B.代码语言C.引文语言D.分类语言23.在检索时如果检索工具不全或者检索系统收录内容不完整,为了扩大信息线索,此时可以借助于(D)A.顺查法B.倒查法C.抽查法D.回溯法24.按照标引的工作方式分类,标引可以分为人工标引、计算机辅助标引和(A)。

文献检索复习资料

文献检索复习资料

第一章网络信息概述一. 基本概念1信息狭义:信号和消息广义:是物质的存在方式和运动方式的体现,是物质的一种客观存在,它反映了物质客体及其相互作用、相互联系过程中表现出来的种种状态与特征。

2 知识按照表述方法可以分为两类:显性知识和隐性知识显性知识,又称可编码的知识,是记录于一定物质载体上的知识,可以看得见,摸得着的,可以通过正常的语言方式传播的知识。

以文字、语言、图像的形式保存下来,如专利、商标、计划、软件设计报告等等。

显性知识是可以编码和表述的,有载体的。

隐性知识又可称为不可编码的知识,是存储在人们大脑里的经历、经验、技巧、体会、感悟、智能等尚未公开的秘密知识,就是你看不见、摸不着,只可意会不可言传,难以直接交流和表达出来的知识。

隐性知识的特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握3文献是记录有知识的一切载体。

精确描述:凡是用文字、图形、代码、符号、音频、视频等方式记载在一定载体上的每一件记录,均称为“文献”。

构成文献要素有三,知识、记录与载体方式。

4情报是人们在一定时间内为一定目的而传递的有使用价值的知识或信息。

钱学森:“情报是激活了的知识”情报是对特定的人而言的,对需要它的人而言是情报,对不需要的人而言它只是信息与知识。

知识与信息转化为情报必须经过传递、只有将特定的知识与信息传递到特定需要的人那里,它们才能成为情报。

传递是情报的一个基本特征。

二. 网络信息的特性1 性质客观性寄附性传递性共享性衍生性时效性2 特点数量大来源广语种多多媒体传播快跨国界内容杂更新快三. 网络信息的资源1 知识信息网站教育和科技部门网站,如:学校、科研单位、学术团体、政府部门等。

2 文献信息网站出版和收藏文献网站。

有数字图书馆,如:超星、书生之家等;数字平台,如:中国知网、万方、维普等。

四. 网络信息的检索主要信息网站种类:政府网站(.gov)免费教育机构(.edu)科研部门(.ac)商业网站(.com)收费社会组织(.org)互联网络(.net)五.图书馆印刷型文献:图书、期刊、工具书、报纸电子型文献:随书光盘、电子期刊数据库、电子图书及其他数据库1. 按文献内容性质划分(不同加工深度)零次文献(Zeroth Litterature) 是指非正式出版或非正式渠道交流的文献,未公开于社会,只为个人或某一团体所用。

信息检索基础知识

信息检索基础知识
文献加工困难,阅读不方便。
例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:

【信息检索与利用考试题纲】信息检索与利用考试

【信息检索与利用考试题纲】信息检索与利用考试

【信息检索与利用考试题纲】信息检索与利用考试信息检索与利用考试题纲考试时间:11月5日,共90分钟考试形式:闭卷考试题型、题量、分值介绍:一、单项选择题﹙共8题,每题2分,共16分﹚二、不定项选择题(共6题,每题3分,共18分)三、判断题(共6题,每题1分,共6分)四、名词解释题(共4题,每题4分,共16分)五、简答题(共4题,每题6分,共24分)六、论述题(共2题,每题10分,共20分)第1章:检索基础知识文献,是用特定符号记录知识的一切载体的总称。

1.1信息概述文献的类型大致可以分为图书、期刊、研究报告、专利文献、科技报告、学位论文、会议文献、标准文献、科技档案、产品技术、政府出版物、报纸、声像资料、电子出版物、网络出版物、移动阅读设备等。

1.2文献检索的基本原理1.2.1检索工具的类型1.目录2.题录3.文摘4.索引5.搜索引擎1.2.2检索语言1.2.3文献检索的途径1.题名检索途径2.著者检索途径3.分类检索途径4.主题检索途径.1.2.4文献检索的步骤1.分析研究课题,明确检索要求、时间、范围2.确定检索策略(1)选择检索工具(2)确定检索途径(3)优选检索方法(4)制定、调整检索策略3.查找文献线索4.索取原始文献信息第2章:网络信息资源检索2.1网路信息检索技术信息检索技术是指应用于信息检索过程的原理、方法、策略、设备条件和检索手段等因素的总称。

2.1.1布尔逻辑检索技术布尔逻辑运算符有3种,逻辑与(AND)逻辑或(OR)逻辑非(NOT)。

2.2网络搜索引擎1.搜索引擎的工作原理搜索引擎的工作主要由两部分组成:信息收集处理和信息检索输出。

2.搜索引擎的分类(1)目录式搜索引擎(2)机器人搜索引擎(3)元搜索引擎2.2.2 常用的搜索引擎1.目录型搜索引擎(1)中文yahoo!(.yahoo..)(2)新浪搜索引擎(.sina..)2.机器人搜索引擎(1)Google搜索引擎(.google.)举例说明:例如用Google搜索引擎检索关于产品设计的幻灯片,可在高级检索页面中“包含以下全部的字词”栏键入“产品设计”,在“文件格式”栏选择“PPT”,同时为了缩小检索范围,可把检索结果限定在网页标题中执行检索。

信息检索教程第1章 概论

信息检索教程第1章  概论
三次文献也称参考性文献,是在一、二次 文献的基础上,经过综合分析而编写,采用科 学的方法对文献的内容进行深度的加工、编写 而形成的文献,是知识高度浓缩、重组的结果, 这些文献具有较高的实用价值。
三次文献的主要特点如下。
(1)综合性 (2)针对性 (3)价值性
5.三个级次文献的关系
文献经过作者的创作,文献工作者 的整理、加工和压缩,文献研究者的综 合、分析和创造,使文献从一次文献到 二次文献,再演化为三次文献,使文献 的形式和内容由分散到集中,由无序到 有序,由博而精地对知识信息进行不同 层次的加工过程,这就是文献的链式结 构。 其文献系统结构如图1-3所示。
零次文献主要特点如下。
(1)客观性 (2)分散性 (3)不成熟性
零次文献的类型包括:口头交谈、 参观展览、参加报告会、听取经验交流 演讲、实验的原始记录、工程草图等。
2.一次文献
一次文献是人们直接以自己的生产、科 研、社会活动等实践经验为依据生产出来的 文献,也常被称为原始文献,其所记载的知 识信息比较新颖、具体、详尽。
2.文献的要素
根据文献的定义可看出,文献是由 知识内容、物质载体、记录符号、记录 手段4个基本要素构成的。
3.文献的特征
(1)知识性 (2)传递性 (3)物质载体性 (4)人工记载性 (5)再生性与积累性
1.1.5 信息、知识、情报与文献的关系
信息、知识、情报、文献4个概念既有 区别又有联系。它们的转换过程如图1-1所 示。 这几个基本概念之间的关系如图1-2所 示。
图1-1 信息、知识与情报转换框图
图1-2 几个基本概念之间的关系
1.2 文献信息源的类型特点
1.2.1 按文献的加工深度来划分
依据文献传递知识、信息的质和量 的不同以及加工层次的不同,人们将文 献划分为零次文献、一次文献、二次文 献及三次文献。

信息检索

信息检索
? 狭义的网络信息检索——指网络搜寻——利用相应的检索工具或检索系统,运用科学的方法,从有序的信息集合中查出所需信息的过程。
5.信息检索新策略
? 目前综合性搜索引擎的特点是查找范围很广而深度和专业性不够。
? 实行“元搜索”,即利用元搜索引擎先对综合性搜索引擎进行主题相关的检索,分析返回页面,下载结果URL,将得到的页面进行分析、存储、提取,得到一个庞大的初始结果集。再利用这个结果集对超链进行一定的分析判断后,按照传统的沿链递归方法“爬行”,对结果集进行扩展。利用这种检索策略,既需要掌握知名综合性搜索引擎的使用方法,又需要了解专业引擎和元搜索引擎的特点。
? 智能代理是在人工智能技术上发展起来的,常见的应用功能有资源挖掘、资源集成(沟通网络上不同物理位置的分布资源)和资源定制。
? 检索领域中的智能代理的研究就是要Agent去模仿人在信息检索中的行为(思考、比较、甄别、去重、判断、评估等等),并主动完成一系列高级、复杂的自动处理任务,而不是机械、被动地代理用户完成任务。
主题目录方式:主题目录方式的优点是可通过浏览的方式层层遍历,找到所需要的信息线索,再通过信息线索链接到相应的网络信息资源。该方式具有系统性、可扩充性、结构清晰、使用方便的优点,但更适合于建立专业性网络信息资源体系。
超媒体方式:超媒体技术是超文本与多媒体技术的结合,它将文字、表格、声音、图像、视频等多媒体信息以超文本组织起来,使用户可以通过高度链接的网络结构在各种信息库中自由航行,找到所需信息。
10.跨语言检索技术
? 跨语言信息检索是指使用一种语种的提问查询不同语种的检索技术,例如,输入的是中文的提问式,信息检索系统将返回英文、法文或其他语种描述的相关信息。结果信息资料可以是文本信息,也可以是以其他形式存在的信息。目前研究的较多的是文本信息与语音信息的跨语言信息检索。

信息检索复习课件

信息检索复习课件

信息检索(第二篇)天津理工大学信息检索教研中心第一章信息检索基本知识介绍信息检索的基本知识,主要是让大家了解一些文献、信息、检索等常识,初步建立起信息意识。

♦第一节信息的基本知识♦第二节检索的基本知识第一章信息检索基本知识第一节信息的基本知识这一节的中心内容包括:信息、知识、情报信息与文献科技文献种类及特点第一章信息检索基本知识三者的关系信息与知识、文献的关系•信息是知识的基础,知识是信息的核心。

•文献是传播知识与信息的主要手段和途径。

•知识、载体、记录是构成文献的三要素。

•文献是获取信息的重要来源;信息与情报的关系•情报包含于信息,是信息的一部分。

信息知识情报文献第一章信息检索基本知识科技文献种类及特点依出版类型划分•图书、连续出版物、特种文献(科技报告、会议论文、学位论文、专利文献、标准文献、政府出版物、档案、产品样本等)依文献内容加工深度划分•零次文献、一次文献、二次文献、三次文献依文献载体划分•印刷型、缩微型、电子型、声像型(作业10练习总结的一个方面)各种信息源的特点♦书:系统、全面(历史悠久,多用于学习参考)♦刊:动态、量大、内容新、影响广(研究价值高,利用率高)♦报告:新颖、专深、具体(情报价值高、获取成本高)♦会议录:专业、及时、可靠(与科技期刊相似,利用率仅次期刊)♦学位论文:独创性强、水平参差♦专利:新颖、具体、题材广(经济和技术价值不容忽视)♦标准:系统性、指令(指导)性、时效性(可关注阶段性技术底线)♦政府出版物:权威性♦(Internet:综合性、交互性、包容性、即时性)♦一次文献:原始文献,新颖、具体。

如期刊、专利等♦二次文献:工具文献,汇集性、检索性。

如目录、题录、索引等♦三次文献:综述性文献,参考性、可检索性。

如年鉴、手册等♦零次文献:未公开文献,原始、详尽、具体。

如手稿、记录等(所用的方法:比较与分类,归纳与演绎)第二节检索的基本知识这一节的中心内容包括:信息检索检索语言检索工具检索方法、途径和步骤信息检索♦按存储和检索的内容划分–文献检索(过程、方法和策略)–资料检索(数据、数值检索)–事实检索–多媒体检索♦按检索手段划分–手工检索–计算机检索检索工具♦检索工具的形式–按加工程度划分•目录、题录、索引、文摘–参考工具书•百科全书、年鉴、手册、名录、字典、词(辞)典–按收录范围划分•综合性检索工具、专业性检索工具、单一性检索工具♦检索工具的内容结构–编辑使用说明、正文部分、索引部分、附录部分(产品说明书、网站帮助等可以参考此内容结构)检索工具的特点♦目录:以单位出版物为著录对象,按“种”为单位记录与报道。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 4.计算机信息检索系统类型
– 脱机检索系统
– 联机检索系统
– 光盘检索系统
– 网络检索系统
1.2.4 数据库
• 1. 数据库的结构
• 2. 数据库的分类
• 1. 数据库的结构
(1)字段(Field)
(2)记录(Record)
(3)文档(File)
① 顺排文档(Sequential File)
Retrieval)
1.2.2 信息检索的类型
• 3.按检索要求划分
(1)特性检索
(2)族性检索
1.2.2 信息检索的类型
• 4.按检索的时间跨度划分
(1)定题检索(Selective Dissemination of Information,SDI)
(2)回溯检索(Retrospective Searching,RS)
第1章 网络信息检索基础知识
第1章 网络信息检索基础知识
• 1.1 信息资源概述
• 1.2 信息资源检索
• 1.3 信息检索语言
• 1.4 信息检索技术 • 1.5 信息资源检索的方法、途径和步骤 • 1.6 信息资源检索效果的评价
1.1 信息资源概述
• 1.1.1 信息、知识、情报、文献之间的关系
1.4 信息检索技术
• 1.4.1 传统的信息检索技术
• 1.4.2 新型的网络信息检索技术
1.4.1 传统的信息检索技术
1. 布尔逻辑检索
2. 截词检索
3. 位置检索
4. 限制检索 5. 加权检索
• 1. 布尔逻辑检索
布尔逻辑检索是采用布尔代数中的布尔逻辑关系运算符 来表达检索词与检索词之间的逻辑关系的检索方法。
• 1. 信息检索语言
信息检索语言(Information Retrieval Language), 又称为标引语言、索引语言等,是应文献信息的加 工、存储和检索的共同需要而发展起来的专门语言, 是用于描述检索系统中信息的内容、外部特征及其
相互关系和表达信息用户需求提问的概念标识体系。
• 2. 信息检索语言的功能
采用单一的方法对固定存储形式进行检索的系统。
• 3.计算机信息检索系统
计算机信息检索系统主要是由计算机硬件及软件系
统、数据通信网络、数据库、检索终端设备和各类
检索应用软件等组成。从广义来讲,计算机信息检
索系统是由计算机技术、电子技术、远程通信技术
等构成的用于信息存储和检索的系统,它包括信息
存储和信息检索两个环节。
① 逻辑“或”,是用于表示并列关系的一种组配,表示相同 概念的词之间的关系,用OR或“+”算符表示。
② 逻辑“与”,是用于表示交叉关系或限定关系的一种组配,
用AND或“*”算符表示。 ③ 逻辑“非”,是用于在检索范围中排除不需要的概念或排
除影响检索结果的概念,用NOT或“-”算符表示。
• 2. 截词检索
• (2)同句检索
– 同句检索要求参加检索运算的两个词必须在同 一自然句或者全文数据库的一个段落中出现, 检索词的先后顺序和插入词的个数不受限制。 同句检索中用到的位置算符主要是(S),是 “Subfield”的缩写。
– (nW)算符的含义是允许在连接的两个检索词之间最 多夹入n个其它单元词,包括冠词、介词和连接词,如 an、in、by、of、the、to、with等,且两个检索词的顺 序不允许改变。 – 例如,“VISUAL(W)FOXPRO”可以检出 VISUALFOXPRO或VISUAL FOXPRO;
• ② (N)算符与(nN)算符。
资料(Geography)、机构指南(Directory)、统计 资料(Statistics)、字词典(Dictionary)等多种类 型。
• 2.机械式信息检索系统
机械式信息检索系统改进了信息的存储和检索方
式,通过机械动作的控制,借助机械信息处理机
的数据识别功能代替部分人脑,促进了信息检索
的自动化。但它并没有发展信息检索语言,只是
• 2.按照组配方式划分
(1)先组式语言(Pre-coordination Language)
(2)后组式语言(Post-coordination Language
1.3.2 信息检索语言的类型
• 3.按照规范化程度划分
(1)自然语言(Natural Language)
(2)人工语言(Artificial Language)
截词检索指在检索式中使用专门的截词符号表示检索词的 某一部分允许有一定的词形变化,用检索词的词干或不完 整的词形查找信息的一种检索方法,并认为凡满足这个词 局部中的所有字符的文献都为命中文献。
– 按截断位置划分,可分为后截断、中截断和前截断; – 按截断字符数量划分,可分为有限截断和无限截断。有限截 断是指说明具体截去字符的数量,通常用“?”表示;而无
② 倒排文档(Inverted File)
• 2. 数据库的分类
(1)参考数据库(Reference Database)
① 书目数据库(Bibliographic Database) ② 文摘数据库(Abstract Database) ③索引数据库(Index Database)
(2)源数据库(Source Database)
• 1.按检索对象的内容划分
(1)文献检索(Document Retrieval)
(2)数据检索(Numeric Retrieval)
(3)事实检索(Fact Retrieval)
1.2.2 信息检索的类型
• 2.按检索方式划分
(1)手工信息检索(Manual Retrieval)
(2)计算机信息检索(Computer Information
① 数值型数据库(Numeric Database) ② 事实型数据库(Fact Database)
③ 全文型数据库(Full-text Database)
1.3 信息检索语言
• 1.3.1 信息检索语言
• 1.3.2 信息检索语言的类型
1.3.1 信息检索语言
• 1. 信息检索语言
• 2. 信息检索语言的功能
等几个级别。
• (1)词位置检索
词位置检索主要是利用位置逻辑算符限定检索词之间 的位置来反映要检索的信息概念。常用的词位置算符 有(W)与(nW)、(N)与(nN)、(X)与(nX) 三类。
• ① (W)算符与(nW)算符。
– (W)算符是“With”的缩写,表示在此算符两侧的 检索词必须按输入时的前后顺序排列,词序不能颠倒, 且所连接的词之间除了可以有一个空格、一个标点符 号或一个连接号外,不得夹有任何其它单词或者字母;
• (2)中截断
中截断是把截词符号放置在一个检索词的中间。一般地, 中截断只允许有限截断。中截断主要解决一些英文单词拼 写不同,单复数形式不同的词的输入。 – 例如,输入“b?t”,可以检索出含有词bit、but、bat
的文献。
• (3)前截断
前截断是将截词符号放置在一个字符串左方,以表示其左 方的有限或无限个字符不影响该字符串检索,是一种后方 一致的检索。这种检索方法在各种词头有变化的复合词的 检索中应用比较多,有助于提高查全率。
(2)事实与数据检索工具
(1)文献检索工具
① 目录(Catalog)
② 题录(Bibliography)
③ 文摘(Abstract)
④ 索引(Index)
(2)事实与数据检索工具
包括百科全书(Encyclopedia)、年鉴(Almanac)、
传记资料(Biography)、手册(Handbook)、地理
1.2.2 信息检索的类型
• 5.按检索对象的信息表现形式划分
(1)文本检索(Text Retrieval)
(2)多媒体检索(Multimedia Retrieval)
(3)超文本检索(Hyper Text Retrieval)
(4)超媒体检索(Hyper Media Retrieval)
1.2.3 信息检索系统
限截断是指不说明具体截去字符的数量,通常用“*”表示。
• (1)后截断
后截断也称右截断,是最常用的截词检索技术,是将截词 符号放置在一个字符串右方,以表示其右的有限或无限个 字符将不影响该字符串的检索,是一种前方一致的检索。 这种方法可以省略输入各种词尾有变化的检索词的麻烦,
有助于提高查全率。
– 例如,输入“educat*”,能检索出含有educationale、 ducator、educators、educated、education等词的文献。
• ③ (X)算符与(nX)算符。
– (X)算符要求其两侧的检索词完全一致,并以指定的 顺序相邻,且中间不允许插入任何其它单词或字母。 它常用来限定两个相同且必须相邻的词; – (nX)算符要求其两侧的检索词完全一致,并以指定
的顺序相邻,两个检索词之间最多可以插入n个单元词。
– 例如,“side(1X)side”可以检索到含有side by side 的文献。
(1)零次文献
(2)一次文献(Primary Literature)
(3)二次文献(Secondary Literature)
(4)三次文献(Tertiary Literature)
1.1.4 主要的一次文献信息源
文献信息源类型 科技图书 科技期刊、报纸 专利文献 会议文献 科技报告 文献信息源类型 学位论文 标准文献 政府出版物 产品资料 档案文献
(3)代码语言
• (2)主题语言(Subject Language)
① 标题词语言(Heading Language)
② 单元词语言(Uniterm Language)
③ 叙词语言(Descriptor Language)
④ 关键词语言(Keyword Language)
相关文档
最新文档