计算机信息检索考试大纲

计算机信息检索考试大纲
计算机信息检索考试大纲

2014年情报学专业硕士研究生考试

《计算机信息检索》考试大纲

导言:《计算机信息检索》考试科目是情报学专业硕士研究生入学考试中的专业课考试科目。该科目主要考察考生对情报学专业领域的基本知识、基本理论和基本方法的掌握情况,考察考生是否能够灵活运用这些知识、理论和方法分析解决相关的专业问题,并要求考生对于现实状况有一定程度的理解和了解,能运用基本理论与方法分析解决一些现实问题。《计算机情报检索》考试科目的内容共包括信息检索基础知识、模型与原理、信息检索系统及其构成、信息检索技术与方法、Web与搜索引擎、用户研究、信息搜索方法等部分。考生可以参考任何覆盖考试大纲内容的教材、参考资料等进行复习。

《计算机信息检索》考试大纲

一、信息检索基础

(一)信息检索的基本概念

(二)信息检索的研究对象与研究方法

(三)信息检索相关学科及领域

(四)信息检索的发展历史、现状及趋势

二、信息检索数学模型与原理

(一)布尔检索模型

(二)向量空间模型

(三)经典概率模型

三、信息检索系统及其构成

(一)信息检索系统的定义与类型

(二)信息检索系统的基本结构

(三)信息检索系统的功能模块

四、文本信息检索技术

(一)文本信息的基本特征

(二)文本信息检索技术

五、Web与搜索引擎

(一)Web基础知识

(二)搜索引擎工作原理

(三)一般搜索引擎关键技术

(四)元搜索引擎关键技术

六、用户与界面设计

(一)用户信息需求分析

(二)用户信息行为模型与特征

(三)用户界面设计

(四)界面可用性

七、信息搜索方法

(一)信息搜索策略

(二)检索提问式的构造与调整

(三)信息搜索的步骤

八、常用数据库与搜索引擎

(一)书目数据库

(二)全文数据库

(三)事实与数值型数据库

(四)综合性独立搜索引擎

(五)元搜索引擎

九、信息检索系统评估

(一)信息检索系统评估基本概念

(二)信息检索系统评估理论

(三)信息检索系统评估方法

(四)信息检索系统评估实验

十、与计算机信息检索及信息检索系统相关的现实问题

2.4《网络大数据库的信息检索》教学设计课题

信息技术说课稿 说课题目:《网络数据库的信息检索》 年级:高一年级教科书:《信息技术基础》 说课老师:王琳蝉 工作单位:屯昌县红旗中学 一、说教材: 1、教材地位和作用 本节容是教育科学《信息技术基础》教材第二章第四节“网络数据库的信息检索”的容。本节教材分三部分构成,一是概述,教材通过一个简单的实例来体验从网络数据库获取信息的一般过程,目的是为学习网络数据库的基本知识做准备性的铺垫。二是多样化的网络数据库,教材对这部分容介绍比较多,意在让学生充分体验网络数据库的多样性和学会对各数据库信息的获取方法。三是网络数据库评价,在本章的最后重点安排了网络数据库的评价,目的是进一步提醒教师,在信息获取活动中,要培养学生及时、科学地评价信息的习惯,这是提高获取信息资源质量的关键,也是积累信息获取经验的关键一环。在本课教材访问丰富多彩的数据库这个模块中,应适当引导学生对资源进行点评,引导学生探索数据库这一现代信息管理手段的特点,为第七章中数据库知识的学习打下基础。 2、学生状况分析 ⑴虽然学生在初中有信息课,但是作为副科没有参加升学考试,所以学生在课堂上多数的时间是玩游戏、聊天,没有纠正学习这门课程的学习态度。初中学生上了高中后,其信息技术意识层次不齐,这就要教师有计划培养学生的信息技术意识。 ⑵经过半个学期的学习,高一学生自觉性有所提高一般具备了一定的网络操作技能,这样对于本节课的学习已经有了相关知识上的准备。 3、教学目标 (1)知识与技能目标: ①学生了解网络数据库 ②学会简单的信息检索 ③体会到网络数据库的重要作用 ④运用网络数据库检索获取需要的信息容

(2)能力目标: ①培养学生利用网络数据库提高信息获取的能力 ②引导学生着重从资源获取的角度来审视数据库的价值 (3) 情感与价值观目标: ①在同学的互助下交流合作中,培养合作意识和合作精神 ②培养学生遵守网络道德,规、合法地获取网络资源 4、教学重点与难点: 学习重点:网络数据库的理解、网络数据库的多样性、网络数据库信息的检索 学习难点:对网络数据库信息的检索、学生要用科学的评价方式判断所得信息的准确性 二、说教学 教学过程实质上是学生主动学习的过程,强调激发学生的兴趣,力求形成学生强烈的学习动机和乐学、善学的学习态度。本节是采用任务驱动法导入新课,采取合作探究法解决提出的任务,对于同学们的作答采取了赏识教育法树立大家的自信心。再利用提问启发法去发现新的问题,从而导入本节的容。在新课网络数据库简介中,我采用了列举法和图表法加深对网络数据库概念的理解。网络数据库信息检索的一般过程和数字城市的介绍上都分别用了演示学习法,演示具体的各个操作步骤。网络数据库信息检索的一般过程和教育资源库的使用,都采取小组分工制合作探究法解决提出的任务。 三、说学法 教学指导在于提高学生的个性发展和全面发展。通过本节教学,主要使学生掌握以下几种学习方法: ①培养学生利用教材、网络自主学习的能力 ②培养学生动手操作能力 四、教学过程 1、导入新课 首先复习旧知识,使用任务驱动法导入新课

计算机信息检索重点

信息检索 数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。一般指原始,未处理过的数据。 信息(Information):1. 物质存在的一种方式。一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。 2. 是事物运动的状态与方式的反映。 知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。 B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的 有组织的陈述。提供某种经过思考的判断和某种实验的结果。 (信息是知识的原材料,知识是信息加工的抽象化产物。) 情报(Information):钱学森:“情报是活化了的、激活了的知识”。可以理解为是指传递着的有特定效用的知识或信息。 三要素:知识性、传递性、效用性 文献(Literature):记录有知识的一切载体。 三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。)、知识(反映了文献的信息内容。)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技 术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。) 文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价 信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检 索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机 检索 21世纪,网络兴盛-----网络检索 第一章信息检索原理 一、信息检索的含义(掌握) 广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。 二、信息检索的类型 (一、)以检索内容划分(重点) 1.文献信息检索 凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。其检索的结果是文献信息 2.数据信息检索(Data Retrieval) 凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。其检索结果为数据信息。 3.事实信息检索(Fact Retrieval) 凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。其检索结果是基本事实。 文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。 (二、)以信息存储和检索的方式和技术划分(掌握) 1.手工检索(Manual Retrieval) 手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。其使用的检索工具主要是书本型、卡

中国科学院大学计算机领域信息检索期末考试答案

域信息检索与利用实用技巧 任课老师:李玲 试题专用纸 1、简答题:您在学习和研究过程中遇到下列问题时,常用哪些方法来解决? (10题,3分/小题,共30分) (1)查找期刊时,您常用的方法? 答: 中文期刊一般用:中国知网、万方数据库、维普数据库等; 外文期刊一般用:ACM、IEEE、Elsevier ScienceDirect、SpringerLink、Science Online 、Taylor & Francis Online Journals 、Cambridge Journal等; 可通过国科大图书馆进入上述网站首页,输入所需检索的期刊信息,如期刊名 称、作者、发表年份等信息进行查询。 (2)查找中国科学院学位论文时,您常用的方法? 答: 进入“中国科学院大学”首页→点击右下方“图书馆”→点击进入“中科院学位论文数据库”→进入检索界面,输入所需检索的论文信息,如:论文名称、作者、指导老师等。 (3)查找各国专利以及专利的被引用情况时, 您常用的方法? 答:进入国家知识产权局官网“https://www.360docs.net/doc/8f8211350.html,”,输入所需检索专利的发明名称、申请号、申请人(三者至少必填其一)进行检索,查看专利被引用情况。 (4)查找SCI期刊的影响因子,您常用的方法? 答:通过国科大图书馆点击“ISI-SCIE”进入web of science平台查询界面,输入期刊的关键词、作者等信息,可通过“AND”进行多个关键词组合以缩小查询范围。 (5)查找标准文献时,有哪些注意事项? 答:合理选择标准数据库(如中文期刊会议类检索工具选用CNKI、维普、万方等,查询专利选用国家知识产权局等数据库); 注意文献的发表时间(如利用CNKI科技类期刊数据库查询只能查询1994年之后发表的文献,维普中文科技期刊库可查询1984年之后发表的文献) 使用多个精确的关键字组合,以减小检索范围。 (6)文献管理时,您常用的方法? 答:使用EndNote文献管理工具,进行分类管理方便后期查询。

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

计算机信息检索实验报告(6个)

实验一网上中文搜索引擎及其使用 一、实验心得 在电脑已经成为生活必备品的现在,日常搜索是一件很平常的事情。俗话说,天天百度知识丰富。当然,我国国内主要的搜索引擎除了百度,还有谷歌、雅虎、搜狗、网易、新浪。 一般来说,百度和谷歌是最多人用的。不同的搜索引擎,不同的搜索方法,得到搜索结果的速度和准确度也不一样。所以我觉得学习计算机信息检索的主要目的就是更好地提高自己搜索的速度和准确度。 在这次实验当中,我们主要学习和掌握以下搜索技巧的运用。「“”」的基本用法、「+」或「空格」的基本用法、「+」的基本用法、「-」的基本用法、「OR」的基本用法、「site」的基本用法、「inurl」的基本用法、「intitle」的基本用法、「filetype」的基本用法。比起以前直接把整个问题打上去然后从网页中寻找满意的答案,灵活使用这些搜索技巧可以更快地找到准确率高的答案。这些技巧在现实生活中具有高度的可操作性和便捷性。 二、实验结果 (一)请使用Google或百度搜索引擎完成以下知识测验:(请将检索结果复制到题干之后,并把所有有关的网页都下载到你的作业文件夹中,以作为本作业评分的依据。) 1.谁根据小仲马的《茶花女》改编了同名歌剧( B ) https://www.360docs.net/doc/8f8211350.html,/b/7602599.html A.奥斯汀 B.威尔第 C.福楼拜 2."生存还是死亡,这是一个问题。"出自莎士比亚的哪部作品?( A )https://www.360docs.net/doc/8f8211350.html,/question/25934693.html A.《哈姆雷特》 B.《李尔王》 C.《麦克白》 3."侦探福尔摩斯"第一次出现是在下列哪部作品中: ( A ) https://www.360docs.net/doc/8f8211350.html,/question/1306083005651.html A.《血字的研究》 B.《东方快车谋杀案》 C.《尼罗河上的惨案》 D.《难逃一生》 4.李清照词中名句"寻寻觅觅,冷冷清清,凄凄惨惨戚戚"的词牌名是: ( D ) https://www.360docs.net/doc/8f8211350.html,/wenda/thread?tid=7c29ad4f072df739&hl=cn A.醉花阴 B.一剪梅 C.如梦令 D.声声慢 (二)请在网上寻找如下列图片。 1.寻找如下图所示世界名画《蒙娜丽莎》的指定图片和介绍她被偷的文章 提示:可试用以下检索词:Mona Lisa Louvre museum stolen 蒙娜丽莎 500岁蒙娜丽莎被偷卢浮宫 图片网址: https://www.360docs.net/doc/8f8211350.html,/i?ct=503316480&z=0&tn=baiduimagedetail&word=Mo na+Lisa+Louvre+museum+stolen&in=31376&cl=2&lm=-1&pn=10&rn=1&di=101230 20660&ln=1&fr=&ic=0&s=&se=&sme=0&tab=&width=&height=&face=0&fb=0 文章地址:https://www.360docs.net/doc/8f8211350.html,/hualang-1534-7665506.shtml

计算机信息检索02139自考资料

第一章信息检索概述 1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.根据检索手段的不同,信息检索可以分为手工检索、光盘检索、联机检索和网络检索。 3.信息检索的基本原理 通过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 4.信息检索语言 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三 者统称为计算机信息检索。 6.与手工检索相比,计算机信息检索的特点表现在: (1)速度快、效率高,仅几分钟就可以从成千上万条记录中找到所需信息; (2)检索范围广,可以迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都可以成为信息源; (3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就可以在任何地方借助 光盘和通信网络查询所需信息。 7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和 抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。 信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。 8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。 9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。 10.数据库由字段、记录和文档构成。 11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。 12.信息检索系统评价的核心是检索性能评价。 13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一 步完善检索工作的过程。 评价检索效果的最主要的指标:查全率和查准率。 14.查全率 查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 15.查准率 查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 第二章网络信息检索的方法与技术 1.布尔逻辑检索的主要运算符 布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。 它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”后面的检索词。 2.邻近检索 邻近检索是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。 3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索” 4.截词检索 是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 常用的截词检索方法有前截词、中间截词和后截词。 5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限制 检索。 6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、 下位词进行检索,以达到扩大检索范围、避免漏检的目的。

网络数据库的信息检索教案

《网络数据库的信息检索》教学设计 一、教材内容分析 本节内容是教育科学出版社《信息技术基础》教材第二章第四节“网络数据库的信息检索”的内容。本节教材分三部分构成,一是概述,教材通过一个简单的实例来体验从网络数据库获取信息的一般过程,目的是为学习网络数据库的基本知识做准备性的铺垫。二是多样化的网络数据库,教材对这部分内容介绍比较多,意在让学生充分体验网络数据库的多样性和学会对各数据库信息的获取方法。三是网络数据库评价,在本章的最后重点安排了网络数据库的评价,目的是进一步提醒教师,在信息获取活动中,要培养学生及时、科学地评价信息的习惯,这是提高获取信息资源质量的关键,也是积累信息获取经验的关键一环。在本课教材访问丰富多彩的数据库这个模块中,应适当引导学生对资源进行点评,引导学生探索数据库这一现代信息管理手段的特点,为数据库知识的学习打下基础。 二、学生情况分析 学生已具备了一定的网络操作技能,对本节课的学习已经有了相关知识上的准备。在前面的课中,学生在不经意中已经使用到了网络数据库,比如小说网、音乐网等等,只是自己不知道而已。本节课选用有较强的代表性而学生一般都没有使用过的网络数据库。 三、教学目标分析 (1)知识与技能目标:

了解网络数据库;学会简单的信息检索;运用网络数据库检索获取需要的信息内容 (2)能力目标: ①培养学生利用网络数据库提高信息获取的能力 ②引导学生着重从资源获取的角度来审视数据库的价值 (3) 情感与价值观目标: ①在同学的互助下交流合作中,培养合作意识和合作精神 ②培养学生遵守网络道德,规范、合法地获取网络资源 四、重难点分析 重点:理解网络数据库、网络数据库的多样性、网络数据库信息的检索难点:对网络数据库信息的检索、评价 五、教学策略设计 教学过程实质上是学生主动学习的过程,强调激发学生的兴趣,力求形成学生强烈的学习动机和乐学、善学的学习态度。本节是采用情景设置法,从“神奇的化学实验——大象牙膏”入手,吸引学生的学习兴趣,引导学生进入欢快的化学学习之旅。然后设置疑问:你能帮化学教师搜索到不同版本的教学资料吗?进而导入本节的内容——利用网络数据库来解决问题。在进行网络数据库新课内容时,通过设计自主学习、合作探究、任务驱动及成果展现四个大环节,让学生去认识、感受、体验、评价网络数据库。使学生对网络数据库信息检索这一重难点从感性认识提升到理性理解,从而实现本节课的学习目标。 六、教学资源与媒体准备

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

信息检索第六章计算机信息检索概

第六章计算机信息检索概述 6.1计算机信息检索的含义和特点 一、计算机信息检索的含义 计算机信息检索:人们根据特定的信息需要,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。包括信息存储过程和信息检索过程。 二、计算机信息检索发展简史 1、脱机批处理检索:20世纪五六十年代是脱机批处理检索的试验和实用化阶段。这一时期,计算机尚未连接通信网和远程终端装置,主要利用计算机进行现刊文献的定题检索和回溯检索。当时的信息检索是脱机批处理检索,即用户向计算机操作人员提问,操作人员对提问内容进行主题分析,编写提问式输入计算机建立用户提问档,按提问档定期对新到的文献进行批量检索,并及时通知用户。同时这一阶段开始利用计算机编辑出版检索性刊物。 2、联机检索阶段:20世纪60-80年代是联机检索的试验和实用化阶段。第三代集成电路计算机,存储介质,存储容量,数据库管理,通信技术的发展为联机检索提供了技术支持。随着国际联机检索系统的发展,信息检索在这一阶段实现了远程实时检索。 3、光盘检索阶段:20世纪80年代以来,新型信息载体激光光盘在信息检索领域得到广泛应用。光盘检索操作方便,不受通信线路影响。早期是单机驱动器和单用户,为解决多用户同时检索的要求,出现了复合式驱动器,自动换盘机,光盘网络技术。 4、网络化联机检索阶段:20世纪80年代以来,随着TCP/IP协议的普遍采用,美国国家科学基金会的接入,计算机检索发展到了今天的网络化联机检索阶段。互联网具有广泛性方便性的特点,使许多联机检索系统纷纷上网,除保留原来服务项目和内容外,还增加了许多新的动态信息服务。同时以搜索引擎为核心的网上搜索技术也日益发展,成为当前最具有普遍意义的信息检索形式。 三、计算机信息检索的分类(不同标准不同类型) 1、根据所检索数据库的形式:①书目检索:查出某一主题的文献条目的检索,包括题录检索,文摘检索等②数据检索:查出有关数据的检索,以求得某一问题量化的准确数值,包括统计数据和科学数据③事实检索:查出有关事件或实在情报,以求得对某一问题的解答。④全文检索:直接利用原始文献建库进行的检索。 2、根据计算机检索服务方式:①定题检索:根据用户检索课题内容,定期从新到资料库中为用户提问进行计算机检索的服务方式。特点:定期性新颖性批处理性②回溯检索:指追索过去的信息,也可用于查找最新信息,能适应多数用户的查询需要。可用于申请专利的新颖性,科研立项的查新,撰写论文和编写教材的信息收集。③日常检索:用户根据自己的信息需求,直接利用终端检索,检索系统即使提供用户所需的信息。 3、根据检索方式:①脱机检索:成批处理检索提问的计算机检索方式,计算机检索的初期类型②联机检索:利用检索终端和通信线路,直接查询检索系统数据库的计算机检索方式③光盘检索:以光盘数据库为基础的一种独立的计算机检索,包括单机光盘检索和光盘网络检索④网络检索:利用检索工具在互联网上进行信息存取的行为,目前主要利用的信息检索系统是搜索引擎。 四、计算机信息检索的特点 手工检索:人们长期以来采用的文献信息检索的传统方法,人们借助简单的机械工具,直接凭头脑进行判断,对记录在普通载体上的资料进行相应的检索。 优点:①直观性强②灵活性高③费用比较低

相关文档
最新文档