信息检索教程第4章 信息检索服务

合集下载

第4章 信息检索技术

第4章  信息检索技术

如:?经济 则数据库中含有经济、工业经济、农业经济 等方面的文献均为命中文献。
3、中截断 (通用字符法或屏蔽)
是把截断符号置于一个检索词的中间,对词中 间出现变化的字符数加以限定。一般中截断仅允许 有限截断。
应用:用于英美单词的不同拼写方式或单复数的 特殊变化。
例如: defence defense
作用:扩大检索范围,增加命中文献量;提高检 索结果的查全率。3、逻辑“非”———————————————A
逻辑运算符: 逻辑表达式为: B
“not”或“-” A not B 或 A-B
其含义为:检索记录中含有检索词A,但不能
含有检索词B的文献,才算命中文献。
例如,在EI COMPENDEX(1998)文档中 检索提问式 SS PATENT NOT GERMAN 所得结果为: S1 S2 S3 110 325 108 PATENT GERMAN PATENT NOT GERMAN
1. 后截断 将截词符号放在一个字符串的右方,满足截词符左 方所有字符的记录都为命中记录。 无限截断:是在检索词词干后面加一个截词符,表 示不限制词尾可变化的字符位数,即查找词干相同的所有 词。例: comput* 表示允许其后可带有任何字符且数 量不限,相当于查找compute、 computed、 computes、 computing、 computer、 computers、computerize、 computerized、computation、 computations、 computational、 computationally 等词。
主题字段 (基本字段)
标题、叙词、关键词、文摘、 分类号等
字段 非主题字段 (辅助字段)
作者、作者工作单位、连续 出版物编号、使用语言、出版 者等

现代信息检索简明教程第四章PPT课件

现代信息检索简明教程第四章PPT课件

16
第三节 国内主要联机检索系统简介
一、万方数据资源系统 (一) 万方数据资源系统简介
万方数据资源系统 () 已相继推出4大类13个系列的科技和工商类数据库,上网 的数据库有百余个,上网的科技期刊 1000 多种,总记录 量达600万条以上,累计出版50余种CD-ROM光盘,在国内
外拥有用户万余家。
17
(二) 主要数据库产品介绍
(1) 中国企业、公司及产品数据库(CECDB中文版)
(2) 中国科学技术成果数据库(CSTAD) (3) 中国科技文献数据库(CSTDB)
(4) 中国学术会议论文数据库(CACP)
(5) 中国学位论文数据库(CDDB) (6) 中国化工产品供需厂商数据库(CPEDB) (7) 中国科技论文与引文分析数据库(CSTPC) (8) 《中国信息导报》(1979-1997年)光盘珍藏版

20
四、维普数据资讯系统检索

重庆维普资讯有限公司是科学技术部西南信息中心下属的 一家大型专业化数据公司,是中文期刊数据库建设事业的 奠基者。 目前国内常用的中国科技期刊全文数据库、中国科技期刊 引文数据库均为维普公司开发。维普系统也提供多种服务

方式,如网上包库、镜像站点及光盘服务等。
21

DIALOG系统工作时间很长,仅在北京时间星期 天下午6时至星期一凌晨2时停止开放,其他时间 均提供服务。
15
ቤተ መጻሕፍቲ ባይዱ
(二) OCLC FirstSearch
OCLC (Online Computer Library Center),即联 机计算机图书中心, OCLC 创建于 1967 年,是世界上 最大的文献信息服务机构之一。 使用 OCLC 产品和服务的用户已有 70 多个国家和地 区的38000多个图书馆和教育科研机构。 FirstSearch 系统可检索 70 多个数据库,其中的 30多个数据库可提供全文检索服务,总计包括7500 多 种期刊的联机全文和3 000多种期刊的联机电子映象, 达900多万篇全文文章。

网络信息资源检索4

网络信息资源检索4
现在大多数网络检索工具都是采用一种称为 Robot(又称为:Spider, Worms,Wanders等)的 网络自动跟踪索引程序。它实际上是一个在网络上检 索文件且自动跟踪该文件的超文本结构并循环检索被 参照的所有文件的软件。不同的自动索引软件所采用 的标引、搜索策略不同,自动索引软件搜寻、标引网 页的方式对信息检索的质量有直接影响。
第四章 Internet信息检索 1 2 3 4 网络信息检索的一般方法 网络信息检索工具 相关网络信息检索技术 搜索引擎及其原理
1 网络信息检索的一般方法
1.1 浏览
1.2 通过网络资源指南来查找信息 1.3 利用搜索引擎进行信息检索
1.1 浏览

(1)偶然发现。
这是在因特网上发现、检索信息的原始方法。
等功能。
2 网络信息检索工具
网络信息检索工具是指在因特网上提 供信息检索服务的计算机系统,其检索的 对象是存在于因特网信息空间中各种类型 的网络信息资源。
近来具一般是由自动索引程序、 数据库和检索代理软件组成的。
自动索引程序
即在日常的网络阅读、漫游过程中,意外发现一些
有用信息。这种方式的目的性不是很强,其不可预 见性、偶然性使检索过程具有某种探索宝藏的意味, 也许会充满乐趣,但也可能一无所获。

(2)顺“链”而行。
指用户在阅读超文本文档时,利用文档中的链接从一网
页转向另一相关网页。有些类似于传统文献检索中的“追溯 检索”,即根据文献后所附的参考文献目录去追溯相关文献, 一轮一轮地不断扩大检索范围。这种方式可以在很短的时间 内获得大量相关信息,但也有可能在“顺链而行”中偏离了
3、提供检索服务 用户输入关键词进行检索,搜索引擎从 索引数据库中找到匹配该关键词的网页;为 了用户便于判断,除了网页标题和URL外, 还会提供一段来自网页的摘要以及其他信息。

信息检索技术第4章专利与标准文献检索简明教程PPT课件

信息检索技术第4章专利与标准文献检索简明教程PPT课件

第4章 专利与标准文献检索 2)中国专利分类表 中国国家知识产权局是我国专利法的最高执行机构,负责我国专利的申 请、审批及专利文献的出版、发行及报道工作。国家知识产权局出版的专 利文献除利用IPC进行分类外,还同时给出相应的中国专利范畴分类号。中 国专利范畴分类表共设有33个大类、230多个小类。 3)检索途径 印刷型的专利文献检索费时、费力、效率较低。现在通常利用光盘检索、 联机检索以及网络专利信息的检索。不论哪种形式,查找专利的途径基本 相同,主要有号码途径、名称途径、主题途径、分类途径和优先项途径。 4)专利文献结构 专利说明书记载了发明成果的详细内容,是专利文献的核心部分。20世纪 50年代后,各国的专利说明书正逐渐趋向统一化。一份专利文献通常包含 三部分: 专利文献的分类方法及检索途径 1)国际专利分类法 国际专利分类(IPC)系统于1968年诞生于欧洲。世界知识产权组织 (WIPO)是管理国际分类法的唯一机构,分别用英文、法文两种文字出版, 每5年修订一次。与其他文献的不同之处是专利文献按分类方式进行标引。 其分类方法从上到下依次是:部、大类、小类、主组和分组。专利文献共 分8个部、118个大类、620个小类,类目总数达6.4万个。
第4章 专利与标准文献检索 3. 专利申请的条件 1) 新颖性 新颖性指发明在申请专利前,世界上既没有相同的发明,又无相同的 声明,即该发明未在国内外公开出版,未曾公开使用或以其他形式为公众 所知。公知公用是能否申请专利的标准。 2) 先进性 先进性指发明或设计比现有技术水平先进,有突出的、实质性的创新, 对于本技术领域的专业技术人员来说非显而易见或不是很容易设计出来, 因而是先进的。 3) 实用性 实用性指发明具有明显的实用特点,能够在工农业生产和科研上制造 使用,并产生积极的社会效果。对于科学发现、智力活动的规则和方法、 疾病的诊断和治疗方法、动物和植物品种、用原子核变换方法获得的物质 《专利法》第25条规定不授予专利权。

第4章信息检索语言、途径、方法和步骤

第4章信息检索语言、途径、方法和步骤

第4章信息检索语言及其途径、方法和步骤重点与难点:信息检索语言职能,信息检索途径与方法1 信息检索语言及其职能1.1 信息检索语言信息检索语言是根据信息检索需要创建的一种人工语言,又称信息检索标识。

如果从反映信息特征的角度来看,那些代表了信息外表特征的著者姓名、题名、报告号、标准号、专利等信息检索标识和代表了信息内容特征的类号、叙词、标题词和关键词都是信息检索语言。

但从信息检索标识规范化的角度来看,信息检索语言可分为自然语言检索标识和规范语言检索标识。

前者包括著者姓名、题名、会议名称、机构号、标牌号、专利号和关键词,后者则指分类号、类名、标题词和叙词。

规范化检索语言是存取信息的依据。

在编制检索工具时,标引人员要对各种信息进行内容分析,把它们所包含的内容要点都分析出来,使之形成若干能代表信息内容的概念,并用规范化的语言如叙词、标题词或分类号把这些概念标示出来,纳入检索系统中。

当检索时,检索人员也要对提问进行主题分析,使之形成能代表信息需求的概念,并把这些概念转换成系统能接受的语言,然后才能从系统中得到用这些规范化语言所标引的信息。

因此,将信息需求者的自然语言转化成系统规范化的信息检索语言,对信息检索的成功至关重要。

1.2 信息检索语言的职能信息检索语言的职能主要包括以下三个方面:(1)信息检索语言可以表示文献内容、数据或其他信息形式。

(2)有专用概念表示用户的信息提问。

(3)能够指示计算机执行查询与检索。

2 文献信息检索的途径在进行文献检索时,人们可以利用文献存贮时按其内容特征或外部特征进行排序的方法进行检索。

文献的内容特征是指文献所论及的事物、所提出的问题,涉及的基本概念,即主题以及文献内容所属的学科范围。

文献的外部特征是指题名、作者、作者单位以及某种特殊文献具体的标识。

2.1 内容特征途径(1)主题途径这是根据文献内容的主题特征进行检索的途径。

(2)分类检索这是一种按照文献资料所属学科(专业)类别进行检索的途径。

第四章 计算机信息检索

第四章 计算机信息检索

(2)确定检索词之间的相互关系 并列关系 、交叉关系、排除关系等。 (3)选择相应的逻辑运算符链接检索词 大学生心理测试与智力测试: 大学生 AND (心理测试 OR 智力测试) 国外煤矿瓦斯检测与监测: 煤矿 AND (瓦斯检测 OR 瓦斯监测) NOT 中国
2.
截词符
也称统配符(wild card), 用来对检索词(干)进行扩 展。用“?”或“*”号表示。 (1)后方截词:可分为无限截词和有限截词 ①无限定性截词 是在一个词尾加一个 ? 号,表示在其后可添加任 意多个字符,这些字符都被作为检索词进行检索。 如:smok? 它将对若干词进行检索,包括:smoke, smoky, smoked, smoker, smokes, smokers, smoking, smokeless等等。
(1)后缀式 后缀式(suffix code), 是将字段代码放在检索 词之后,并用/号连接, 如: 后缀代码: /TI 表示 Title (篇名) /AB 表示 Abstract(文摘) /DE 表示 Descriptor (叙词,规范词) /ID 表示 Identifier (标识词,专用词) 如:electron/ti 表示electron一词须出现在篇名 字段, electron/ti,ab 表示electron 一词须出现在 篇名或文摘字段。
这里用A和B分别代表两个检索词,它们的逻辑关系由 下表和图说明。
三种逻辑关系(阴影部分为命中)
注:英文数据库通常用字母,中文数据库要用符号
布尔运算逻辑表达式的制定
布尔逻辑运算的优点在于它能将复杂的检索提问按 其概念组配的逻辑关系描述出来。布尔逻辑运算可 以组合在一起表达一个复杂的检索提问。具体的制 定如下: (1)提取检索词 如:“大学生心理测试与智力测试” 检索词为大学生、心理测试、智力测试; 如:“国外煤矿的瓦斯检测与监测” 检索词为煤矿、瓦斯检测、瓦斯监测

信息检索课件第4章

信息检索课件第4章
3 词干处理
将单词转化为其词干形式,以匹配更多的相关文档。
常见的信息检索算法
1
TF-IDF
基于词频和文档频率计算匹配的相关程度。
2
PageRank
评估网页的重要性,通过链接分析产生排名。
3
BM25
改进的TF-IDF,解决了词频过度调整的问题。
布尔检索模型及其优缺点
优点
• 简单 • 可靠 • 易于理解
PageRank
通过网页之间的链接关系来确 定网页的重要性和排名。
HITS
通过分析网页的链接和内容, 确定网页和链接的权重和重要 性。
BM25F
结合文档的内容和链接关系, 综合计算关键词匹配的重要性 和文档的相关性。
搜索引擎的优化技巧
1 关键词研究
2 网页结构优化
3 用户体验优化
依据用户需求和搜索习惯, 调整关键词的数量和选择, 提高匹配准确性和页面排 名。
信息检索系统的组成
服务器端
负责索引存储的数据和响应用户请求。
客户端
提供用户接口,用于输入查询、展现搜索结果和相 应操作。
数据存储
存储检索所需的数据,包括文本、图像和视频等。
信息检索中的数据预处理
1 分词
将文档和查询分成单独的词或短语,提高匹配的召回率。
2 去除停用词
去除出现频率高但信息含量低的词,例如“a”和“the”等。
调整页面结构和元素标记, 提高网页质量和展现效果, 提高页面自然排名。
提高页面响应速度,提供 简洁明了的内容和导航, 提高用户留存率和转化率。
信息检索中的未来发展趋势与关键技术
未来发展趋势
人工智能和自然语言处理将推动信息检索领域的快 速发展。

第四章文献信息检索

第四章文献信息检索

第4章 文献信息检索
4.2.3
国际性期刊检索系统 1.期刊出版信息查询 (1)《乌利希国际期刊指南》 是著名的综合性国际在版期刊目录指南,它有 选择地报道世界各国期刊及其他连续出版物的出 版和销售情况,共有8万家出版商的出版物被收 录。除期刊外,它还包括年鉴、会议录等连续出 版物。自1974年以来停刊的47000种期刊也被收 录。 (2)Publist( ) 是一个基于因特网的国际性连续出版物指南。 数据来源于《乌利希国际期刊指南》。可免费检 索15万种期刊等连续出版物的出版信息。
第4章 文献信息检索
3.图书信息的检索 检索图书是人们经常性的查找需求,一般利用 上述各类型目录可以解决大部分的查找问题。关 键是要根据具体需求,选择合适的检索工具。另 外还应了解书目的检索途径,一般将检索途径划 分为两类:一类是从文献的形式特征进行检索, 主要包括文献的题名(书名、刊名、会议名等)、 责任者(著者、编者、译者、机关团体等)、号 码(国际标准书号ISBN、国际标准刊号ISSN、中 国刊号CN、中国书号,专利号等)、出版者等; 另一类是从文献的内容特征进行的检索,它包括 分类检索和主题检索(关键词等)。从文献的内 容特征进行的检索是书目检索的重要途径。
第4章 文献信息检索
对于图书的出版、发行单位而言,有如下特点: ① 出版速度更快 ② 发行成本低廉 ③ 可以实行按需印刷 ④ 不再以纸张为载体,减少了木材消费,更为 环保 ⑤ 可提供个性化的服务,读者可根据自己的喜 好组合搭配购买 电子图书也具有一定的局限性,需要借助计算 机等电子设备和相关的软件程序才能阅读,这对 它的普及和使用有一些制约作用。
第4章 文献信息检索 3.中国期刊检索系统 (1)中国期刊网(CNKI知识网站)简介 该数据库的文献全文以CAJ格式输出,阅读时需要特 定的阅读软件,可以在其主页上直接下载该浏览器软件 (CajViewer.zap),下)万方数据资源系统的数字化期刊子系统 该系统的数据库检索有两种方式:收费检索针对授权 用户,检索时需要输入用户名及口令,可以浏览、检索、 显示数据库中的全部信息;免费检索针对非授权用户, 浏览与检索功能同授权用户,但显示的检索结果信息不 完全,只有文献题目、关键词及分类号等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)方法性咨询。即解决读者在查找文 献过程中,因不熟悉检索方法而遇到的 困难。 (3)专题性或情报性咨询。即围绕读者 提出的某一特定问题,查找有关文献、 文献线索及动态进展性情报。
ቤተ መጻሕፍቲ ባይዱ
4.1.2 图书馆信息咨询服务内容
目前我国高校图书馆的信息咨询服 务主要在以下几个方面开展工作。
1.参考咨询服务
4.定题服务
定题服务也称定题信息服务、SDI服务, 即Selective Dissemination of Information Service。 它是一种根据读者需求,一次性或定期 不断地将符合需求的最新信息传送给读者的 服务模式。
为节省用户查询、检索所需文献信 息的时间,便于用户随时跟踪本研究领 域或本行业的最新发展动态,图书馆利 用馆内外传统文献资源、电子网络资源 等开展针对用户提出的特定课题的定题 文献资源报道服务。
② 电子邮件(E-mail)及Web表单。基 于电子邮件及Web表单的参考咨询服务 是虚拟参考咨询服务中最简单和最流行 的形式。
③ 实时虚拟参考咨询。虚拟咨询台(Virtual Reference Desk)即实时在线的虚拟服务,这 是一种交互式的服务。
2.新书通报服务
新书通报,即报道图书馆新入藏文献 的书目索引,是图书馆为了推荐馆藏,将 到馆新书目录选择部分或者全部推荐给读 者。
(3)虚拟参考咨询。虚拟参考咨询是图 书馆利用现有的网络平台推出的一种参 考咨询服务形式。
① 常见问题解答(Frequently Asked Questions,FAQ)。FAQ是一种解答式 服务,它是图书馆根据长期参考工作实 践经验和对用户的调查,将用户最可能 问到的或实际问到的一些问题及其答案 编辑成网页,并在图书馆Web站点主页 的显要位置建立链接。
2.咨询服务的类型
按照读者所提出的咨询问题的内容性 质,可以把咨询分为3种类型。 (1)事实性或知识性咨询。读者在研究、 教学和学习过程中遇到疑难问题,需要通 过文献查明某一事物的实质性内容,如人 物、事件、产品、数据、历史年代等即属 此类咨询。
这类咨询的特点,一是范围广,涉 及科学、技术、社会、文化、生活等各 个方面。 二是特指性强,读者往往需要关于 某一事实的具体信息。 三是答案要具体,要能够切实解决 读者的问题。
第4章 信息检索服务
4.1
图书馆信息咨询服务简介
图书馆信息查询系统
4.2
4.3
网络搜索引擎 其他服务
4.4
4.1 图书馆信息咨询服务简介
信息咨询服务是以信息媒体中的信 息资源为工作对象,结合特定用户的信 息需求,以信息开发为手段,对信息进 行分析、综合、浓缩、转换与创新等一 系列工作的总称,是图书馆读者服务工 作的一种形式和重要组成部分。
(3)商业经济信息检索服务:提供国内外公 司的名录、产品、经营范围、雇员人数、财 政状况、销售额等信息检索服务;提供国内 外机械、电子、计算机、化工、石油、建筑、 医疗设备等各行业的产品及其供货商的信息 检索服务;提供市场趋势、经济发展、经济 统计、经济预测及国际贸易等经济信息检索 服务。
(1)文献检索服务:针对自然科学、社 会科学及人文科学各个学科、各种目的 的研究课题,以描述课题的主题词、关 键词作为检索入口,从开题立项、研究 中期,直到成果验收,开展全程的文献 检索服务。
(2)文献收录及被引用检索服务:通过作者 姓名、作者单位、文献篇名、期刊名称、会 议名称、会议时间、会议地点、发表时间等 途径,查找文献被SCI、SSCI、EI、CPCIS/SSH、CSCD、CSSCI等数据库收录和引用 的情况,并依据检索结果出具检索证明。
参考咨询服务主要负责解答读者在 利用图书馆过程中产生的各种问题,内 容涉及馆藏资源及其利用、文献查找途 径及查找中遇到的问题、图书馆的各项 服务与规则等,目的在于帮助读者更有 效地利用图书馆。
提供咨询服务的方式包括以下几种。 (1)口头咨询。图书馆一般设有总咨询台, 接受读者的当面咨询。 (2)电话咨询。图书馆电话咨询服务是通过 电话这个媒介直接或间接与读者沟通并提供 服务的举措。
4.1.1 图书馆信息咨询服务的特点与类型
咨询服务是以文献为依据,针对读者 提出的疑难问题,利用各种参考工具、检 索工具及有关文献,为读者检索、揭示、 提供文献及文献知识或文献线索,以解答 读者问题的一种服务方式。
1.咨询服务的特点
(1)读者主体性。 (2)咨询范围的广泛性。 (3)解答咨询的复杂性。 (4)咨询答案的针对性。
文献传递是将用户所需的文献复制 品以有效的方式和合理的费用,直接或 间接传递给用户的一种非返还式的文献 提供服务,它具有快速、高效、简便的 特点。
文献传递服务包括本馆文献提供和外 馆文献提供两部分。 本馆文献提供是指为校外读者复印、 传递本馆收藏的各种原文文献。
外馆文献提供是指为校内外读者向国内 其他高等院校图书馆或文献提供机构(如国 家图书馆、北京大学图书馆等)、国外的高 等院校图书馆或文献机构(如美国博硕士论 文数据库(PQDD)、美国俄亥俄州的联机 图书馆中心(OCLC))等请求提供原文文 献复制及原文传递服务。
新书通报根据载体形式可以分为纸质 新书通报和电子新书通报。 纸质新书通报是利用印刷的方式,将 新书目录打印出来,向读者进行推荐。 电子新书通报是指利用网络平台,通 过电子的方式向读者推荐新书。
3.馆际互借与文献传递
馆际互借(Interlibrary Loan)就是对 于本馆没有的文献,在本馆读者需要时,根 据馆际互借制度、协议、办法和收费标准, 从外馆借入;反之,在外馆向本馆提出馆际 互借请求时,借出本馆所拥有的文献,满足 外馆的文献需求。
5.科技查新
科技查新简称“查新”,是指以具备 一定信息资源基础与相应查新咨询资质人 员的查新站为委托方,在科研立项、新产 品开发、专利申请和科技成果鉴定等方面 提供鉴证的一种深层次的信息咨询服务工 作。
6.代查代检
代查代检是图书馆以其丰富的网络 资源、数据库资源及国内外联机数据库 系统为支持,根据各类读者或用户的检 索要求,提供多种用途和多种形式的信 息检索服务。
相关文档
最新文档