信息检索模型的概述

提纲

信息检索模型的概述

布尔模型

向量空间模型(VSM)

扩展的布尔模型

潜在语义索引模型(LSI)

概率模型

基于统计语言模型的信息检索模型 基于本体论的信息检索模型

信息检索模型的概述

什么是模型?

模型是采用数学工具,对现实世界某种事物或某种运动的抽象描述

面对相同的输入,模型的输出应能够无限地逼近现实世界的输出

举例:天气的预测模型

模型和实现的区别

一个模型可以用多种方法实现

例如:布尔模型可以用倒排文档(inverted file)实

现,也可以用B-tree实现

信息检索模型

四元组[D, Q, F, R(q i, d j)]

D: 文档集的机内表示

Q: 用户需求的机内表示

F: 文档表示、查询表示和它们之间的关系的模型框

架(Frame)

R(q i, d j): 给query q i和document d j评分

信息检索模型决定于:

从什么样的视角去看待查询式和文档

基于什么样的理论去看待查询式和文档的关系

如何计算查询式和文档之间的相似度

模型分类

布尔模型(Boolean Model)

布尔模型

文档表示

一个文档被表示为关键词的集合

查询式表示

查询式(Queries)被表示为关键词的布尔组合,用“与或非”连接起来,并用括弧指示优先次序

匹配

一个文档当且仅当它能够满足布尔查询式时,才将其检索出来

不同的系统可以使用:

不同的去除停用词(stopword removal)策略和stemming策略 索引中不同类型的辅助信息

不同的实现方法

强调

到目前为止,布尔模型是最常用的检索模型,因为:

由于查询简单,因此容易理解

通过使用复杂的布尔表达式,可以很方便地控制查

询结果

相当有效的实现方法

相当于识别包含了一个某个特定term的文档

经过某种训练的用户可以容易地写出布尔查询式

布尔模型可以通过扩展来包含排序的功能,即“扩展的布尔模型”

问题

布尔模型被认为是功能最弱的方式,其主要问题在于不支持部分匹配,而完全匹配会导致太多或者太少的结果文档被返回

非常刚性: “与”意味着全部; “或”意味着任何一个

如果“我想要n个词中m个词同时出现的文档”,怎么表示?

不可能企望用户自己规定m值

系统可以从m=n开始,然后逐渐减少m,但很麻烦

很难表示用户复杂的需求

很难控制被检索的文档数量

原则上讲,所有被匹配的文档都将被返回

很难对输出进行排序

不考虑索引词的权重,所有文档都以相同的方式和查询相匹配

很难进行自动的相关反馈

如果一篇文档被用户确认为相关或者不相关,怎样相应地修改查询式呢?

向量空间模型

统计模型

基于关键词(一个文本由一个关键词列表组成)

根据关键词的出现频率计算相似度

例如:文档的统计特性

用户规定一个词项(term)集合,可以给每个词项附加权重

未加权的词项:Q=?database; text; information ?

加权的词项: Q = ?database 0.5; text 0.8; information 0.2 ? 查询式中没有布尔条件

根据相似度对输出结果进行排序

支持自动的相关反馈

有用的词项被添加到原始的查询式中

例如:Q ??database; text; information; document?

统计模型中的问题

怎样确定文档中哪些词是重要的词?

怎样确定一个词在某个文档中或在整个文档集中的重要程度?

怎样确定一个文档和一个查询式之间的相似度?

在WWW中,什么是文档集(collection),链

接、文档结构以及其它形式特征(如字体、颜色等)对统计模型有何影响?

向量空间模型

若干独立的词项被选作索引项(index terms) or词表vocabulary 索引项代表了一个应用中的重要词项

计算机科学图书馆中的索引项应该是哪些呢?

体系结构

总线

计算机

数据库

….

XML

计算机科学

文档集

文档集中的索引项

向量空间模型

向量空间模型

实际上,这些词项是相互关联的 当你在一个文档中看到“计算机”, 非常有可

能同时看到“科学”

当你在一个文档中看到“计算机”,有中等的

可能性同时看到“商务”

当你在一个文档中看到“商务”,只有很少的

机会同时看到“科学”

向量空间模型

2个索引项构成一个二维空间,一个文档可能包含0, 1 或2个索引项

d i= ?0, 0 ?(一个索引项也不包含)

d j= ?0, 0.7 ?(包含其中一个索引项)

d k= ?1, 2 ?(包含两个索引项)

类似的,3个索引项构成一个三维空间,n个索引项构成n维空间

一个文档或查询式可以表示为n个元素的线性组合

图示

文档集

相似度计算

相似度是一个函数,它给出两个向量之间的相似程度 查询式和文档都是向量,各类相似度存在于:

两个文档之间

两个查询式之间

一个查询式和一个文档之间

人们曾提出大量的相似度计算方法,因为最佳的相似度计算方法并不存在。

通过计算查询式和文档之间的相似度,可以: 可以根据预定的重要程度对检索出来的文档进行排序

通过强制设定某个阈值,控制被检索出来的文档的数量

检索结果可以被用于相关反馈中,以便对原始的查询式进行修正。(例如:将文档向量和查询式向量进行结合)

相似度度量–内积(Inner Product)

文档D 和查询式Q 可以通过内积进行计算:

sim ( D , Q ) = (d ik ?q k )

d ik 是文档d i 中的词项k 的权重,q k 是查询式Q 中词项k 的权重

对于二值向量, 内积是查询式中的词项和文档中的词项相互匹配的数量

对于加权向量, 内积是查询式和文档中相互匹配的词项的权重乘积之和

k t

=∑1

检索语言的分类

检索语言的分类:按照揭示和反映信息内外部特征的不同,检索语言可划分为:分类语言:以数字、字母(或字母与数字结合)为检索标识,作为有关类目的代号。 主题语言:分为标题词语言、叙词语言和关键词语言; 名称语言:以人名、地名、机构名、篇名、书名等为检索标识; 代号语言:以文献特有的顺序号(如专利号、标准号、合同号等)为检索标识 邻近位置算符(W)W是with的缩写。(W)算符也可以简写为()算符,A(W)B,表示A紧挨着B,顺序不能颠倒。A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。 邻词位置算符(nw)A(nw)B,表示两个词的次序不变,其间可以插入n个词。 句子位置算符(S)S是sentence的缩写。A(s)B表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。 字段位置符(F)F是field的缩写。A(F)B,表示A和B 必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti 要求Rice和Genetics必在同时出现在篇名之中。 记录位置算符(C)C是citation的缩写。A(C)B 其作用等同于A and B,均表示A和B 同时出现在同一记录内,但词序不限,也不要求在同一字段内。 截词符号 常用的有“?”、“$”和“*”等,绝大部分数据库无限截词符用“*”,少数用“?”或者“$” 截词类型 (1)后截断,前方一致。如:“comput*”表示computer、computers、computing等。(2)前截断,后方一致。如:“*computer”表示minicomputer、microcomputer等。(3)中截断,中间一致。如:“*comput*”表示minicomputer、microcomputers等。 1 .括号改变运算顺序。 2 .引号引号内的检索项以整体形式出现。精确匹配: “”和《》号,给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 3 .个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词必须出现。 【实例】在某些搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。 1. 直接法(1)顺查法(2)倒查法(3)抽查法 2. 追溯法

信息组织与检索

《信息组织与检索》 一.名词解释 二.1. 一次文献:即原始文献。它是作者以生产或科研为依据而创作的原始文献。如专着、期刊论 文、学位论文等。 三.2. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、 数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 四.3. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为 着录的基本单位,记录图书、期刊、资料等的名称、着者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 五.4.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要 而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 六.5. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。 6、文献信息资源 文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。 7、信息检索语言 信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。 8、竞争情报 竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。 9、INTERNET(因特网) Internet:因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。 因特网,源自英文的Internet,它的含义从广义上来说就是是“联接网络的网络”。这种将计算机网络互相联接在一起的方法称为网络互联。作为专有名词,它所指的是全球公有、使用TCP/IP这套通讯协议的一个计算机系统,这个系统所提供的信息与服务,以及系统的用户。因此,世界上这个最大的互联网络也被简称为“互联网”(the Internet)。 二. 判断题(对的打“√” ,错的打“×” ) 1.??通过BA、ISTP、Kluwer online、Springer Link 数据库都能检索到外文期刊论文全文。(×) 2.??在重庆维普数据库检索系统中能查到企业名录。???????????????? (×) 3.??利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印刷型图书和期刊。(∨) 4.??截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(∨) 5.??联合目录可以帮助读者确定其所需要的文献收藏在那个情报机构。(∨) 6.??综述因附有大量参考文献,所以是二次文献。(×) 7.??通过“万方数据资源系统”可以查找标准文献的全文。(∨) 三. 填空题 1.按文献载体形式划分,文献可分为印刷型、缩微型、声像型、和电子型。

信息检索题库

第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D )。A、AD(军事系统)B、PB (行政系统) C、NASA(航空与宇航系统) D、DOE(原子能与能源管理系统) 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文 3、(A )是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B )A、科技报告B、政府出版物 C、标准文献 D、档案文献 5、年鉴属于下列哪一类别(D )A、零次信息B、一次信息C、二次信息D、三次信息 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书(三次信息) C、综述(三次信息) D、文摘(二次信息) 7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述 8、以下各项属于二次信息的是(A )A、索引B、期刊(一次信息) C、学位论文D、百科全书 二、多选 9、二次信息主要包括(CD )等。A、手册B、年鉴C、目录D、题录 10、信息的属性包括(ABCD )A、客观性B、时效性C、传递性D、共享性 11、信息素质的内涵主要包括(ABC )。A、信息意识素质B、信息能力素质C、信息道德素质 D、信息职业素质 12、以下类型的信息属于三次信息的是(BC )。A、目录B、词典C、百科全书D、科技报告 附加: I)信息道德规范信息行为,主要包括(ABC)。A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息 II)根据信息的载体和表达方式的不同,信息源可分为(ACD)。A、语言信息源B、二次信息C、实物信息源D、文献信息源 III)文献的基本要素有(AC)。A、有一定的知识内容B、一定要记录在纸张上C、一种物质载体D、存在大脑中即可 三、判断

计算机信息检索02139自考资料

第一章信息检索概述 1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.根据检索手段的不同,信息检索可以分为手工检索、光盘检索、联机检索和网络检索。 3.信息检索的基本原理 通过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 4.信息检索语言 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三 者统称为计算机信息检索。 6.与手工检索相比,计算机信息检索的特点表现在: (1)速度快、效率高,仅几分钟就可以从成千上万条记录中找到所需信息; (2)检索范围广,可以迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都可以成为信息源; (3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就可以在任何地方借助 光盘和通信网络查询所需信息。 7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和 抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。 信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。 8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。 9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。 10.数据库由字段、记录和文档构成。 11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。 12.信息检索系统评价的核心是检索性能评价。 13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一 步完善检索工作的过程。 评价检索效果的最主要的指标:查全率和查准率。 14.查全率 查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 15.查准率 查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 第二章网络信息检索的方法与技术 1.布尔逻辑检索的主要运算符 布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。 它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”后面的检索词。 2.邻近检索 邻近检索是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。 3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索” 4.截词检索 是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 常用的截词检索方法有前截词、中间截词和后截词。 5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限制 检索。 6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、 下位词进行检索,以达到扩大检索范围、避免漏检的目的。

网络信息检索.

网络信息检索——搜索引擎篇 摘要:概述网络信息检索,主要针对搜索引擎进行比较,参考一些文献来对将来的搜索引擎进行合理的展望。 关键字:网络信息检索搜索引擎发展趋势实时搜索 网络信息检索概述 网络信息检索是指能够通过网络接受用户的查询指令,并向用户提供符合其查询要求的网络信息资源的过程。可以把网络信息检索理解为见多对象为网络信息的信息检索。(西安电子科技大学出版社《网络信息检索》 搜索引擎概述 网络信息检索的应用有搜索引擎,多媒体信息检索,话题识别与跟踪,信息过滤,问题回答五个方面。本文主要讲述搜索引擎的相关内容。 本文所称的搜索引擎是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询做出响应,提供用户所需的信息。用户的查询途径主要包括自由词全文检索、主题词检索、分类检索及其它特殊信息的检索(企业、人名、电话黄页等。 著名搜索引擎Google,百度,yahoo中国 Google是一家美国上市公司(公有股份公司,于1998年9月7日以私有股份公司的形式创立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googolplex”,它位于加利福尼亚山景城。Google 创始人Larry Page 和Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。Google 目前被公认为是全球规模最大的搜索引擎。

百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎。它拥有目前世界上最大的中文信息库,总量达到1亿2千万以上,并且还在以每天几十万页的速度快速增长。2000年1月,百度公司在中国成立了他的全资子公司百度网络技术(北京有限公司。随后于同年10月成立了深圳分公司。2011年6月又在上海成立了上海办事处。2005年百度在美国的纳斯达克上市,省委当年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。 Yahoo中国是网站分类目录的领头军,它以分类目录,网站检索为主,附带网页全文检索,也是目前最重要的搜索服务网站。雅虎有中文,英文等十余种语 言版本,每一版的内容互不一样。可以说,每一种不同的版本都是一种不同的,相对独立的搜索引擎。 他们各自信息搜集方式的比较 百度是最典型的一种自动搜索引擎,google是一般典型的自动搜索引擎。他们由一个成为蜘蛛的机器人程序,由四部分组成的自动索引。该搜索引擎的有点事信息量过大,更新及时,不需要人的干预,缺点是搜到信息过多,许多无用信息需要用户行结果中筛选。 Yahoo属于分类搜索引擎。Yahoo并不是单纯地提供所有网站网页的全文检索服务,而是将其收集到的网站及网页分门别类加以索引和文摘(由人工完成,以一个分层的线性目录来为用户提供按图索骥式的服务。该类搜索引擎因加入了人的智力,所以信息准确,导航质量非常高,不足之处是需要人的介入,维护量大,信息量少,信息更新不及时。 综合各个方面(本文只比较搜寻信息方式的不同,其他方面不加赘述,三大搜索引擎各具千秋。从实用性来说,google的检索功能强大、灵活,尤其是支持多种字段检索以及网页的推荐功能,并可以安用户的习惯设置检索界面;百度收录的中文信息覆盖面广、数量大,更新快,注重服务的本地化;雅虎作为指南型分类检索工具,在相对查全率方面具有优势。我们可以根据各自的生活、工作、学习的需要,选择一种适

网络信息检索

网络信息检索课程教学研究 资环学院09生师彭秀欣 摘要:随着计算机技术、通讯技术、网络技术的迅猛发展,网络信息检索已成为当今信息社会主要检索信息技术对于传统的基础教育影响越来越大,基于网络的教育教学资源剧增,成为高校文献检索课的教学重点。本文分析了《网络信息检索技术》课程的教学现状及未来发展。关键词:改革、现状、网络,优化、发展。 正文:21世纪是一个信息化、网络化的世纪,展现在我们面前的是一个以网络信息技术为核心技术的新的发展时代。网络信息技术已经渗透到社会生活的各个方面,它不仅带来信息传递和利用方式的改变,而且为人们获取和传播信息提供了方便快捷的新途径。利用计算机从网上获取信息已成为当今信息社会的主要检索方式,是当代大学生必须具备的一种素质。网络信息检索技术的发展已向文献检索课提出了严峻的挑战。引进网络信息检索新内容,并逐步建立起以网络信息资源及其检索为核心的新体系。如何利用网络信息资源已成为大学生急需学习的内容,所以,网络信息检索应成为高校文献检索课的重点,网络信息资源极其丰富、种类繁多,但由于信息过于庞大和分散,且变化十分快,给网络信息检索带来了不便,也增加了教学难度。 网络信息检索的教学目的:是要求学生具备利用计算机网络多途径获取各种专业信息的能力,增强学生的网络信息意识。网络信息检索的教学应围绕这个教学目的,紧扣网络信息资源的实用性,针对各学科专业的实际需要,选用重要而实用的核心资源。信息检索课教学的重要作用 信息检索课是一门实践性很强的课程,其检索技能的提高主要是靠对信息检索方法与技能的掌握,并通过举一反三的训练,增强学生对信息检索、获取、分析和评价的能力, 教学内容包括:Internet概述(Internet的起源与发展、Internet在中国、Internet的连接方式、TCP/IP、Internet的域名等);Internet的网络功能(E-mail、Telnet、FTP、Gopher、NetNews、BBS、WWW及其浏览器等)。这一部分教学的目的在于使学生了解和学会网络信息检索的基础知识及基本技能。

情报检索语言

虚拟现实(VR)就是利用计算机和其它的专用硬件和软件产生一种境界的仿真,参与者可以通过视觉、听觉和触觉等感觉与仿真的内容交互操作,达到一种“真实”的感觉,所以有人也称其为“灵境”。 信息构建就是为用户提供序化、优化及美化的信息。它需要借助一切信息组织、信息呈现的技术和方法,如图形设计、可用性工程、用户经验、人机交互、图书馆学信息科学中的主题法分类法等的理论方法,在用户需求分析的基础上,对信息进行组织、布局、优化,如设计导航系统、标签系统、索引和检索系统,以及内容布局等。 超文本是一种新型的信息组织技术,它以结点为单位,结点与结点之间通过表示它们之间关系的链加以连接,构成表达特定内容的信息网络。 数据仓库是支持决策过程的、面向主题的、集成化的、稳定的、不同时间的数据集合。这个定义体现了数据仓库作为信息组织技术和工具的鲜明特征,如主题性、有序性等。 自动归类是指计算机通过词频统计、语法分析和语义分析等途径得到代表文献内容的类主题词,然后按照某一分类表将文献划分到某个类目的过程。 自动标引是以计算机代替人工,自动生成表达信息记录内容特征的主题、分类或其它有意义的标识,它是标引技术与计算机结合的产物,是信息组织自动化的基础。 数据管理就是对数据进行分类、组织、编码、存贮、检索和维护。 数据库(Database,DB)是存储在一起的相关数据的集合。 主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的这些语词能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。 主题词分为单元词、标题词、关键词和叙词,标题词是先组式语言,即在主题标引前,其概念已组配好;单元词和叙词是后组式的语言,即只在正式标引式才将概念加以组配,显然它的适用能力比先组式语言强;而关键词是不受控制的语词,是一种接近自然语言的一种主题语言。 组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。组配时主要使用比号组配法和比孔组配法两种方法 关键词是指在文献的标题、摘要或正文中出现的、对表达文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。 关键词法原理的应用,常有三种形式,即题外关键词索引、题内关键词索引和单纯关键词索引 条形码是由一组粗细不一、相互平行的黑白条符组成并按一定编码规则组织起来,用来表示字母、数字、甚至汉字等信息。 信息编码是指用一个或一组按特定规则排列起来的符号来表达信息的过程,它实质上包含两个环节,一是信息的代码化;二是代码的组织。

信息检索第六章计算机信息检索概

第六章计算机信息检索概述 6.1计算机信息检索的含义和特点 一、计算机信息检索的含义 计算机信息检索:人们根据特定的信息需要,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。包括信息存储过程和信息检索过程。 二、计算机信息检索发展简史 1、脱机批处理检索:20世纪五六十年代是脱机批处理检索的试验和实用化阶段。这一时期,计算机尚未连接通信网和远程终端装置,主要利用计算机进行现刊文献的定题检索和回溯检索。当时的信息检索是脱机批处理检索,即用户向计算机操作人员提问,操作人员对提问内容进行主题分析,编写提问式输入计算机建立用户提问档,按提问档定期对新到的文献进行批量检索,并及时通知用户。同时这一阶段开始利用计算机编辑出版检索性刊物。 2、联机检索阶段:20世纪60-80年代是联机检索的试验和实用化阶段。第三代集成电路计算机,存储介质,存储容量,数据库管理,通信技术的发展为联机检索提供了技术支持。随着国际联机检索系统的发展,信息检索在这一阶段实现了远程实时检索。 3、光盘检索阶段:20世纪80年代以来,新型信息载体激光光盘在信息检索领域得到广泛应用。光盘检索操作方便,不受通信线路影响。早期是单机驱动器和单用户,为解决多用户同时检索的要求,出现了复合式驱动器,自动换盘机,光盘网络技术。 4、网络化联机检索阶段:20世纪80年代以来,随着TCP/IP协议的普遍采用,美国国家科学基金会的接入,计算机检索发展到了今天的网络化联机检索阶段。互联网具有广泛性方便性的特点,使许多联机检索系统纷纷上网,除保留原来服务项目和内容外,还增加了许多新的动态信息服务。同时以搜索引擎为核心的网上搜索技术也日益发展,成为当前最具有普遍意义的信息检索形式。 三、计算机信息检索的分类(不同标准不同类型) 1、根据所检索数据库的形式:①书目检索:查出某一主题的文献条目的检索,包括题录检索,文摘检索等②数据检索:查出有关数据的检索,以求得某一问题量化的准确数值,包括统计数据和科学数据③事实检索:查出有关事件或实在情报,以求得对某一问题的解答。④全文检索:直接利用原始文献建库进行的检索。 2、根据计算机检索服务方式:①定题检索:根据用户检索课题内容,定期从新到资料库中为用户提问进行计算机检索的服务方式。特点:定期性新颖性批处理性②回溯检索:指追索过去的信息,也可用于查找最新信息,能适应多数用户的查询需要。可用于申请专利的新颖性,科研立项的查新,撰写论文和编写教材的信息收集。③日常检索:用户根据自己的信息需求,直接利用终端检索,检索系统即使提供用户所需的信息。 3、根据检索方式:①脱机检索:成批处理检索提问的计算机检索方式,计算机检索的初期类型②联机检索:利用检索终端和通信线路,直接查询检索系统数据库的计算机检索方式③光盘检索:以光盘数据库为基础的一种独立的计算机检索,包括单机光盘检索和光盘网络检索④网络检索:利用检索工具在互联网上进行信息存取的行为,目前主要利用的信息检索系统是搜索引擎。 四、计算机信息检索的特点 手工检索:人们长期以来采用的文献信息检索的传统方法,人们借助简单的机械工具,直接凭头脑进行判断,对记录在普通载体上的资料进行相应的检索。 优点:①直观性强②灵活性高③费用比较低

关于网络信息检索论文

关于网络信息检索论文 信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面我为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。 浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1、信息检索概述 信息检索(InformationRetrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2、网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,

不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3、网络信息检索的现行模式 3.1网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。 3.2网络搜索引擎检索 搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查

信息检索复习资料

一、名词解释 1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。 5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。 6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。 7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。 8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。 9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。 10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。 11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。 12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。 13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。 14.手册——是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。 15.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。 16.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。 17.文献综述——是一种文献信息调研报告,又是学术论文的一种形式。它是通过全面系统的搜集某一特定研究领域的全部或大部分相关文献资料,并经过阅读、理解、分析、比较、归纳的基础上,对该课题的发展过程、发展趋势及存在的问题等,进行全面介绍、综合分析和评论而形成一种不同于一般论文的文体。 18.开放存取——又称开放访问,是国际学术界、出版界、图书情报界利用互联网进行学术信息和科研成果自由传播、免费利用的行动. 19. 一次文献:即原始文献。是作者以生产或科研为依据创作的原始文献。如专著、期刊论文、学位论文等。 20.技术档案指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 21.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 22.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 23.追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。这种附着在各种载体上的记录统称为文献。 2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。 3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。信息是物质存在的方式、形式和运动规律的表征。人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。 4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。 5、信息资源的构成可从不同的层次和角度来划分: 一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技 报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。 二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次 文献。(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。例如词典、手册、百科全书、年鉴、各种教科书及综述等。 三、按信息的表现形式划分:(1)文献型信息源;(2)非文献型信息源。非文献型信息 源包括电子信息源、数值型信息源、声像型信息源、多媒体信息源以及实例与口头信息源。 6、信息出版类型:是指记录有知识的文献出版类型。 7、信息检索:是指将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。它的全过程又称为信息存储与检索。 8、信息检索的基本原理:对信息集合与需求集合的匹配与选择。 9、信息检索的基本方式可分为传统信息检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。 10、信息检索的研究范围包括一切与信息存储与检索有关的系统、过程、理论和方法。 11、计算机信息检索系统根据内容不同可划分为:联机检索系统、光盘检索系统和网络检索系统。 12、检索工具按用途可分为两大类:指示型检索工具(二次文献)和提供具体信息的参考型检索工具(三次文献)。 13、检索工具按编著方式可分为:(1)目录型检索工具。目录主要报道实有的文献或收藏文献的情况,以一个完整的出版单位作为著录的基本单位。此类检索工具对于查找、索取原始文献具有重要作用;(2)题录型检索工具。题录是用来描述某一文献的外表特征并由一组著录项目构成的一条文献记录。题录实质上是一种不含文摘正文的文摘款目,在揭示文献内容的深度方面,题录比目录做得深入一些,但又比文摘款目浅;(3)文摘型检索工具。文摘是指对文献的内容简洁而又正确的摘录,供人们浏览和查用,使读者能以较少的时间和精力掌

检索语言

一、名词解释 查全率 是指系统在进行某一检索时 检出的相关文献量与系统文献库中相关文献总量的比率 它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。 检索语言 是根据信息检索的需要创造出来的一种人工语言 是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 标题词法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。标题词指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。 信息素质:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。 二、简答题 1.简述检索语言的基本功能 答: 1) 对文献的信息内容(及某些外表特征)加以标引的功能。要求利用检索语言能够正确标引文献信息内容及其外表特征。 2) 集中文献的功能。对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率。 3) 信息组织的功能。对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索。 4) 一致性功能。便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性。 5) 获得最高查全率和查准率的功能。保证检索者在按不同需要检索文献时,都能获得最高的查全率和查准率。 6) 桥梁和纽带功能。在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,以提高信息检索的准确性。2.分类检索语言的作用 答: ①这是进行分类标引和组织分类检索工具的规范。②它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。③它是检索者从分类途径检索文献资料的指南。④它是文献工作者工作中常用的参考手册。 三、文献信息检索

浅谈网络信息检索的现状及其发展趋势

浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1.信息检索概述 信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2.网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3.网络信息检索的现行模式 3.1 网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文

网络信息检索(新媒体)

西安欧亚学院 《网络信息检索》 课程大纲 适用专业:网络与新媒体专业 编制单位:网络与新媒体课程中心编制日期:2014年11月 文化传媒学院制 -1-

《网络信息检索》课程大纲 课程类别专业选修课课程代码1D216220 适用专业网络与新媒体学时学分32/2 编制人余君制定日期2014年11月审定组(人)审定日期 一、课程概述 1、课程描述: 《网络信息检索》是网络与新媒体专业的一门专业选修课程。当今社会,信息成为人类赖以生存和发展的重要资源,面对浩瀚且杂乱无序的信息海洋,为使我校大学生能够迅速及时地查询所需信息,确保我校各类国际引进课程的教学效果和教育教学方式方法改革的实施,增强学生的国际网络使用及信息检索能力,促进我校大学生地知识更新、终身学习和知识再创造,学校作为通识必修课程在全校新生开设本门课程,具有重要的意义。 本门课程主要针对大学生的特定需求,培养大学生了解各种信息资源的特点、掌握各种分类信息资源的检索工具、方法、途径、检索技巧等,进而掌握现代信息检索技术,使之能够熟练运用各种信息检索工具,获取所需要的信息,增强学生获取、评价和利用专业文献信息的能力,形成良好的信息素养,为促进学生开展自主、探究式学习,造就创新型人才起到重要作用。 2、设计思路 本门课程课堂教学的设计思路是准备采取讲练结合,以练习为主的教学模式,按照三个“三分之一”的比例设计课程并组织教学,三分之一的教学内容采取讲授方式组织教学,三分之一的内容以边讲边练的方式组织教学,三分之一的内容以训练方式组织教学。这种教学方式充分体现学校目前倡导的新课程改革精神,突出学生学习的主体地位,变传统的教师知识独白式地传递信息为学生自己去解析和吸收信息的教学模式。本课程 -2-

信息检索习题及答案

注意: 1、通读教材,根据页码提示完成下列题目。 2、最后一次上机课在线测试,范围不超出如下题 目。 第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D)。A、AD B、PB C、NASA D、DOE{第7页} 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文{第6页} 3、(A)是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献{第6页} 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B ) A、科技报告 B、政府出版物 C、标准文献 D、档案文献{第8页} 5、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息{第7页} (一次信息:图书、期刊论文、科技报告、会议论文、专利说明书及科技日记、杂记、实践记录) 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书C、综述D、文摘{第4页} 7、下列文献中属于一次信息的是(A )A、专利说明书B、百

科全书C、目录D、综述{第4页} 8、以下各项属于二次信息的是(A)A、索引B、期刊C、学位论文D、百科全书{第4页} (二次信息;目录、题录、文摘、索引、书目对一次信息有指引和报道作用) 二、多选 9、二次信息主要包括()等。A、手册B、年鉴C、目录D、题录{第4页} 10、信息的属性包括()A、客观性B、时效性C、传递性D、共享性{第3页} 11、信息素质的内涵主要包括()。A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页} 12、以下类型的信息属于三次信息的是()。A、目录B、词典C、百科全书D、科技报告{第4页} 附加: I)信息道德规范信息行为,主要包括()。A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息(第10页)II)根据信息的载体和表达方式的不同,信息源可分为()。A、语言信息源B、二次信息C、实物信息源D、文献信息源(第4页) III)文献的基本要素有()。A、有一定的知识内容B、一定要记

网络信息检索2013--B

中国矿业大学信电学院2013年 “院长杯”科技文化节 网络信息检索试题【B卷】 说明:1.本考试为闭卷考试,请考生遵守考试纪律,独立完成。 2.本次考试为上机考试,满分100分,考试时间为120分钟,未在22日下午4:30—6:30按要求提交试卷的考试成绩无效,请考生合理把握考试时间。在试卷得分相同时,由参赛者上传作答试题的先后顺序确定获奖的高低等次。 3.参赛者须完整、准确地填写相关信息,并按竞赛通知的要求作答、上传试题。(注:选择题、判断题的答案填在前面的表格里;填空题的答案填在空白处的横线上;简答题以及实践题答在每一道小题的后面。填写位置有误或格式错误,该题以零分计入成绩) 姓名班级学号分数 第一部分理论题(共50分) 一、单项选择题(每小题1分,共10分) (注:请在答题栏相应位置填写答案) 1、检索最新的学术动态方面的信息,最好用哪种检索工具书?( ) A、手册 B、年鉴 C、期刊 D、书目

2、FTP可以实现资源共享,它提供了一个免费的公共帐号()。 A、System B、administrator C、Anonymous D、必须事先申请 3、哪个数据库是我国第一个连续出版的大规模集成化、多功能的学术期刊全文文献检索系统?( ) A、CNKI B、维普科技期刊数据库 C、人大复印资料数据库 D、百度 4、按照使用地区来划分,标准的不包括以下哪种类型?( ) A、国际标准 B、国家标准 C、地区标准 D、行业标准 5、按照传递媒介来划分,下列哪项不属于情报的类型?() A、文字情报 B、战术情报 C、实物情报 D、声像情报 6、信息检索根据检索对象不同一般分为( )。 A、二次检索、高级检索、文献检索 B、分类检索、主题检索 C、计算机检索、手工检索 D、数据检索、事实检索、文献检索 7、我如果想查广东古代各市、县发生的大事,从2008年起查,要用哪种检索方法?( ) A、顺查法 B、倒查法 C、循环法 D、抽查法 8、关于WWW的说法,不正确的是()。 A、需要Web浏览器访问信息 B、采用HTML协议进行通信控制 C、可以访问多媒体信息 D、必须通过拨号网络连接方式访问 9、以下不属于三次文献的是( )。 A、综述 B、索引 C、手册 D、年鉴 10、题录Piterniek A B. Functions and capabilities of online searching systems: a checklist[C].Online Review,1989,13(6):466-469.是哪种信息类型的著录格式()。 A、期刊 B、图书 C、会议记录 D、学位论文 二、填空题(每小题2分,共20分)

相关文档
最新文档