网络信息检索—样本试卷
网络信息检索与利用参考试题与答案

网络信息检索与利用一、名词解释题:网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。
www:信息检索数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。
它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。
查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。
关键词:关键词又称自由词,它属于自言语言范畴。
关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。
以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。
布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。
搜索引擎:是一个可以用文件名查找文件的系统。
元搜索引擎:是一种基于搜索引擎的网络检索工具。
它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。
在进行检索时调用一个或者多个独立搜索引擎的数据库。
桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。
All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。
联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。
参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。
网络信息检索-多选

网络信息检索题库二、多选题1、信息素养包含()等方面选项A.信息意识选项B.信息观念选项C.信息能力选项D.信息道德答案ABCD 2、培养学生养成良好的信息素养,主要在以下()哪几个方面进行选项A.信息意识选项B.信息观念选项C.信息能力选项D.信息道德答案ABCD 3、培养信息素养的意义()选项A.良好的信息素养是获取知识的捷径选项B.良好的信息素养是科学研究的向导选项C.良好的信息素养是终身教育的基础选项D.良好的信息素养只是对信息管理专业的要求答案ABC4、关于信息的类型的说法正确的是()选项A.按照信息处理级别来划分,可以分为:零次信息、一次信息、二次信息、三次信息选项B.一次信息是指非正式出版物或非正式渠道交流的信息选项C.一次信息是信息的主体,是最基本的信息源选项D.书目、索引、文摘、题录等各种检索工具都属于二次信息答案ACD5、信息的载体类型主要有以下()几种选项A.图书型选项B.缩微型选项C.声像型选项D.电子型答案BCD6、以下()文献属于特种文献选项A.图书选项B.技术档案选项C.政府出版物选项D.标准文献答案BCD7、信息是依赖于以下哪几个方面()而加以传递的选项A.信息源选项B.信息类型选项C.信息传播途径选项D.信息接受者答案ACD 8、现实信息资源主要包括()选项A.口头选项B.实物选项C.文献选项D.管理理念答案ABC9、传统的信息资源主要分为哪几种()类型选项A.潜在选项B.现实选项C.口头选项D.实物答案AB10、非知识性资源主要包括()选项A.信息垃圾选项B.信息噪音选项C.信息污染选项D.危害信息安全的内容答案ABCD11、网络信息资源的特点包括()选项A.信息共享程度高选项B.信息数量巨大而庞杂选项C.质量良莠不齐选项D.信息数量巨大而庞杂答案ABCD12、按照网络信息资源的生产途径和发布范围可以将网络信息资源划分为()选项A.知识性资源选项B.商用信息资源选项C.网络公开学术资源选项D.特色资源答案BCD13、以下哪些资源属于半正式出版物()选项A.商用信息资源选项B.微信息选项C.网络公开学术资源选项D.特色资源答案CD14、有关Telnet信息资源说法错误的是()选项A.Telnet 使用户可以在本地计算机上注册到远程计算机中的资源选项B.Telnet 远程登录必须有用户名和密码才能登陆选项C.这种资源对于每一个Internet 用户都是开放的选项D.使用Telnet ,用户可以与全世界许多信息中心、图书馆及其他信息资源联系答案BC15、关于FTP说法正确的是()选项A.FTP是指超文本传输协议选项B.FTP 信息资源是指利用FTP可以获取的信息资源选项C.FTP允许从远程计算机上获取、下载文件,但不可以将文件从本地计算机拷贝传输到远程计算机选项D.FTP是目前Internet 上获取免费软件和共享软件资源不可缺少的工具答案BCD 16、以下说法错误的是()选项A.使用E-mail发送邮件时,只能同时给一个人发送选项B.E-mail只能发送文本信息选项C.Gopher服务器中的所有信息都以目录或文件的形式表达,并基于菜单提供服务选项D.用户服务组是一种常见的信息资源答案ABD17、网络显性信息资源的一次组织管理模式主要有()选项A.自由文本方式选项B.主题树方式选项C.数据库方式选项选项D.超媒体方式答案ABCD18、关于网络信息资源管理的文件方式说法正确的是()选项A.文件方式是最原始的信息组织管理模式选项B.适合于存储结构化信息选项C.适合于存储非结构化信息选项D.在这种方式中,网络信息的存取是以文件为基本单元的答案ACD19、著名的搜索引擎有()选项A.Google 选项B.百度选项C.新浪选项D.搜狐答案ABCD20、搜索引擎在组织管理网络显性信息资源方面的优势包括()选项A.将信息组织为一个网状结构,信息节点之间互相链接和调用选项B.查找信息时,检索结果的返回速度快,有较高的检全率选项C.搜索引擎中将元数据以数据库的方式进行组织,有些大型数据库,为了提高检索速度,还采用了多级索引的结构选项D.搜索引擎在一定程度上实现了对网络信息的控制答案BCD21、关于元搜索引擎以下说法正确的是()选项A.元搜索引擎,它是将多个搜索引擎集成在一起,提供一个统一的检索界面选项B.将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果选项C.往往准确性要更好,检索速度也较快选项D.百度、Google是元搜索引擎的代表答案ABC22、以下说法正确的是()选项A.对网络显性信息资源的管理,目前基本上处于初级阶段,是基于分类法和主题法进行的组织管理选项B.对网络显性信息管理的高级阶段,还需要借助于专家系统、智能系统、数据仓库技术的发展选项C.未来搜索引擎的发展趋势是智能搜索引擎选项D.智能搜索引擎以一定的知识库技术为基础,具有很高的自然语言理解与知识处理能力答案ABCD23、以下哪些资源属于网络隐性信息资源()选项A.BBS 选项B.新闻组选项C.贴吧选项D.博客答案ABCD24、网络信息资源评价的标准主要有()选项A.目的选项B.范围选项C.内容选项D.图形和多媒体设计答案ABCD25、对网络信息资源进行内容评价时主要围绕哪些方面进行()选项A.准确性选项B.链接选项C.新颖性选项D.信息的展示与设计答案ABC 26、对网络信息资源进行可操作性评价时主要围绕哪些方面进行()选项A.交互性选项B.检索能力选项C.连接性选项D.用户友好性答案ABCD 27、在网络中获取信息的费用包含()选项A.连通费用选项B.电子期刊的订购费选项C.硬件购置费选项D.数据库的检索使用费答案ABD28、用户可以通过以下哪些途径对网络信息资源做出初步的评价()选项A.阅读帮助文件选项B.查看网页内容的更新周期选项C.发现有无空链、死链、错链等选项D.查看该网站首页描述答案ABCD29、有关网络信息检索的概念正确的说法有()。
网络信息检索 试卷答案.docx

管理学院夜大课程试卷班级:信管系专升本10级课程名称:《网络信息检索》姓名:学号:一、 简答题(每题10分,共30分)1、 谈谈你对网络信息检索工具发展趋势的理解。
(1)、人性化&定制化 (2) 、多媒体信息检索技术(3) 、智能化信息检索代理(4) 、高效的信息组织(5) 、用户界面设计2、 举例说明,检索策略所使用的基本逻辑符号有哪几种,分别具有什么作用。
(1) 、或(OR )含有两个或多个关键词中的任一即命中结果(2) 、与(AND )同时含有两个或多个关键词即可命中结果(3) 、非(NOT )在含有某一个或多个关键词的同时排除某一关键词,即可命中结果。
3、 网络资源目录与搜索引擎,各有什么特点。
(1) 、网络资源目录的优势(2)、搜索引擎的优势 二、 图例题(三选二,共30分)B 信息检索(1)、信息需求(2)、检索式表达(3)、技术处理(4)、检索匹配(5)、结果呈现(6)、1、根据图示,解释信息检索的主要过程。
A 信息组织(1)、网页抓取(2)、文档分析(3)、建立索引(4)、文档表示(生成数据,存储数 据库)(5)、归类和聚类二次检索2、根据图示,阐述元搜索引擎的工作原理。
用户(1)、接受用户的原始查询;(2)、把原始查询分别转换为各个成员搜索引擎能够接受的形式;(3)、向成员搜索引擎发送查询;(4)、收集各个搜索引擎的原始查询结果;(5)、对原始查询结果进行合成,形成最终结果;(6)、把最终查询结果递交给用户。
3、试分析基于内容的图像检索的工作原理。
A数据库生成(1)、数据搜集(2)、特征提取(3)、数据库资源组织与整理B数据库查询(1)、信息需求(2)、信息需求表达(3)、检索式分析(4)、搜索引擎检索与匹配(5)、返回结果(6)、二次检索三、论述题(二选一,共20分)1、举例说明,网络信息检索的方法有哪些,分别有什么特点?A基于浏览的检索方式(1)、不依靠任何检索工具的浏览延伸已有信息范围;跟踪新信息;网上信息调研;好奇心驱使;消遣性浏览;享受浏览经验等(2)、借助检索工具的浏览(网络资源目录,Yahoo!)(3)、基于浏览的检索方式的特点优点:针对具体任务找寻相关信息,信息清晰化&意外性&突破性&实用性缺点:浪费时间,检全率差,信息迷航问题B基于关键词的检索方式(1)、基于关键词的检索工具(搜索引擎&元搜索引擎)(2)、基于关键词检索的特点优:简单易行;时效性高;检全率高;文献、用户保障性缺:相关关系差;查准率低;标引不一致2、列出你认为最有价值的搜索引擎的名称和网址,并说明选择理由。
网络信息检索期末考试试卷2014春

2013-2014第二学期《网络信息检索》试卷(A)
学院(系):学号:姓名:
1.利用某一个通用搜索引擎查找你所在学科(专业)的中英文搜索引擎,并填写下表。
(20
分)
2.分别选择上题中找出的中英文搜索引擎各一个,查找一个你感兴趣的专业问题,并填写下
3. 利用Web of Knowledge查找2013年发表的题名中含有你感兴趣的某一主题的英文论文。
要求写出该主题的中、英文名称, 检索方式(普通检索、引文检索、高级检索)、检索式、检索结果数量、最相关的前2篇期刊论文的作者、论文题名、发表刊物及其卷期号和页码。
(10分)
4.利用SCIE查找2010年发表在Science杂志中的关于你感兴趣的某一主题的某篇论文被引用情况。
要求写出该论文的题名与作者、检索方式(普通检索、引文检索、高级检索)、检索式、被引次数、最新的2篇引用该文的期刊论文的作者、论文题名、发表刊物及其卷期号和页码。
(10分)
5.推荐1-2个你经常使用的网站或工具,并对其优缺点进行评价(10分)
6.登录爱课程网“资源共享课程”频道、实名注册,学习一个你感兴趣的内容,并发表评论(15分)。
7. 学习本课程的收获、意见与建议(15分)。
网络信息检索 课程试卷

管理学院夜大课程试卷
班级:信管系专升本10级
课程名称:《网络信息检索》
姓名:
学号:
一、简答题(每题10分,共30分)
1、举例说明,检索策略所使用的基本逻辑符号有哪几种,分别具有什么作用。
2、网络资源目录与搜索引擎,各有什么特点。
3、谈谈你对网络信息检索工具发展趋势的理解。
二、图例题(三选二,每题15分,共30分)
1、根据图示,解释信息检索的主要过程。
2、根据图示,阐述元搜索引擎的工作原理。
3、试分析基于内容的图像检索的工作原理。
三、论述题(二选一,共20分)
1、举例说明,网络信息检索的方法有哪些,分别有什么特点?
2、列出你认为最有价值的搜索引擎的名称和网址,并说明选择理由。
四、实践题(二选一,共20分)
1、利用“CNKI(中国知网)中国学术期刊全文数据库”检索关于图书馆“信息服务”与“社交网络”的相关文章,并记录相关题录。
检索入口:
检索途径:
检索词:
分组分析方法:
排序标准:
检出文献题录(列出3条密切相关的题录)
2、运用Google学术搜索,检索主题为图书馆“信息服务”和“社交网络”方面的学术论文,限制时间为2011年,并记录相关题录。
检索入口:
检索途径:
检索词:
检出文献题录(列出3条密切相关的题录)。
网络信息检索试题及答案1

第一部分1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C)特征。
A、差异性B、传递性C、时效性D、共享性2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B):A、信息意识B、信息心理C、信息能力D、信息道德3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。
A、获取知识的捷径B、科学研究的向导C、终身教育的基础D、创新知识的源泉4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。
A、灰色信息B、原始信息C、检索性信息D、参考性信息5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。
A、印刷型B、电子型C、声像型D、微缩型6、谈谈你对“信息”的理解。
特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。
7、下列文献哪个是二次文献?(A)A.文摘B.会议文献C.辞典D.百科全书8、“文章草稿”、“私人笔记”及“会议记录”属于(A)。
A.零次文献B.一次文献C.二次文献D.三次文献9、下列选项中哪一项属于“国内统一刊号”(C)。
A.ISBN7-04-014623-1B.ISSN0254-416411-2127/TPD.0254-4164/TP10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C)参考文献的著录条目描述。
萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19)[2002-04-15].http:∥www.….htm.A、标准文献B、期刊(杂志)C、电子文献D、会议文献11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B)参考文献的著录条目描述。
网络信息检索期末试卷及答案2套

《网络信息检索》期末试卷(A 卷)适用班级: 班一、填空题(每空1分,共25分)1.搜索引擎的主要检索方式______和_______。
2.商品信息构成的因素有______、_______、______、______、_______ 。
3.网络信息资源的类型有______、______、_______、______、______、_______ 。
4.布尔逻辑运算符有 ______、______、_______三种。
5.我国经济信息网站的类型_________、__________、__________、__________。
6.申请专利的三个条件______、______、_______。
7.标准文献按照成熟程度划分为________、__________。
二、判断题,正确的划√,错误的划× (每题3分,共9分)1.标准文献的主要特点是有固定的代号金额专门的编写格式。
( ) 2.科技文献检索的方法有两个,分别是常用法和追溯法。
( ) 3.逻辑非用于组配具有同义或同族概念的检索词。
( ) 三、名词解释(每空5分,共20分) 1.布尔逻辑检索2.漏检率3.字段限定检索4.标准文献四、简答(每题8分,共16分) 1.简述影响检索效果的因素2.科技文献检索的步骤五、综合题(每题15分,共30分)2.查找“洪银兴”先生在国研网上的所有文章。
(附检索的步骤截图)《网络信息检索》期末试卷(B 卷)适用班级: 班一、填空题(每空1.5分,共30分)1.常用的搜索引擎有______、______、_______。
2. 网络信息资源的类型有______、______、_______、______、______、_______ 。
3.布尔逻辑运算符有 ______、______、_______三种。
4. _________是在计算机存储设备上上按一定的方式存储的相互关联的数据集合。
5.我国经济信息网站的类型_________、__________、__________、__________。
信息检索试题

第一套《信息检索》考试卷(A)一、名词解释1.信息资源2.信息检索3.著录法4.关键词标引5.知识发现二、填空1.按组织方式分,信息检索有()、()、超媒体检索。
2.信息检索策略有两种方式即()和()。
3.表示主体的检索词有标题词、()、()关键词。
4.常用的逻辑运算符有:()、 OR或+、()。
5.信息检索工具常用的排检方法有字序法、()。
6.中国特有的工具书是()、()。
三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型工具书和参考型工具书的使用。
2、如何利用检索工具查找历史类文献?第一套《信息检索》考试卷(A)答案一、名词解释(30%)1.信息资源。
是人类存储在载体(包括大脑)上的已知或未知的可利用的资源。
信息中的载体信息和主题信息资源的最基本的组成部分。
2.信息检索。
是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。
3.著录法。
是对信息与文献的形式特征和内容特征进行分析、选择和记录的方法。
4.关键词标引。
使用非规范化的自然语言——关键词来表达文献或信息资源主题内容的过程。
5.知识发现。
是从数据中发现有用知识的整个过程,使多个步骤相互连接,反复进行人机交互的过程。
二、填空(20%)1.按组织方式分,信息检索有全文检索、超文本检索、超媒体检索。
2.信息检索策略有两种方式即手工检索策略和计算机检索策略。
3.表示主体的检索词有标题词、单元词、叙次、关键词。
4.常用的逻辑运算符有:AND或*, OR或+, NOT或-。
5.信息检索工具常用的排检方法有字序法、类序法。
6.中国特有的工具书是类书,政书。
三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语言研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。
2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应用领域的数据库(统计数据库、工程数据库、空间数据库;新一代数据库(分布式数据库、多媒体数据库、面象对象数据库、实时数据库等)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Examination Paper Page 1 total 8
Integrity for examination, serious consequences for cheating! SCUT FINAL EXAMINATION Examination Paper A Attention:1. Please fill in the information inside the sealed line before the exam 2. Write down your answers directly in this paper (or in an answer sheet) 3. Examination form: open-book (closed-book) 4. This paper contains three section, 100 points in total. There are 120 minutes for the exam. Section one two Three four five Total Score Marker Section One: Individual multiple-choice (3 points per problem, 30%) Problem 1 2 3 4 5 6 7 8 9 10 answer 1. Convert the Boolean Query Expresstion: q=)(321kkkto Disjunctive Normal Form (析取范式): A.(1,1,1) ∨(1,0,0) ∨(1,1,0) B.(0,1,1) ∨(0,1,0) ∨(0,0,1) C.(1,1,1) ∨(1,0,0) ∨(1,0,1) D.(1,0,1) ∨(1,1,0) ∨(1,0,0) 2. When crawler is gathering pages, which of the following factors has nothing to do with the quality of a page? A.Depth-first or breadth-first search strategy B.PageRank of pages C.Depth to crawl D.Content type of pages 3. Document d and query q can be express as a vector: d= (1, 1, 1, 0, 1, 1, 0),q= (1, 0, 1, 0, 0, 1, 1), use inner product and cosine method to calculate the similarity between d and q respectively are: A.3,20/3B.3,5/3C.5/3,3 D.20/3,3 4. The text pre-processing of a search engine mainly includes: A.Tokenization、Remove stop words、Stemming、Inverted index _____________________NameStudentNo.SchoolSpecialty
SeatNO.
(Mustnotwriteanswersinsidethesealedline)…………………………………………The………………………………………………Sealing………………………………………line…………………
…
………………
ccac Examination Paper Page 2 total 8
B.Noise Reduction in Web Pages、Remove stop words、Stemming、Inverted index C.Noise Reduction in Web Pages、Tokenization、Remove stop words、Stemming D.Tokenization、Remove stop words、Stemming、Keywords extraction
5. The features of Web typically include: A.Zipf law、Small world theory (小世界理论)、Bow-tie Structure (蝴蝶结结构) B.Heaps law、Power Law distribution、Bow-tie Structure C.Zipf law、Small world theory、Heaps law D.Power Law distribution (幂律分布)、Small world theory、Bow-tie Structure
6. If you need to emphasize thatrecall is more important than precision and the E measure is:
Where parameter in E should be: A. = 1 B. >1 C. <1 D. =0
7. The edit distance (编辑距离) and Longest Common Subsequence (最长共有子序列) between “misspelled” and “misinterpreted” are respectively:A.8,mis B.8,mispeed C.11,mispeed D.11,mis
8. If the precision of a classification algorithm on two data sets with size of 100 and 1000 respectively are 0.8、0.9, the macro average precision and micro average precision of the algorithm are: A.0.85,0.81 B.0.85,0.89 C.0.81,0.85 D.0.89,0.85
9. If the content of a site’s robot.txt is: User-agent: GoogleBot Disabllow: /private It means that: A.Does not allow GoogleBot to crawl the files or directories under the /private directory B.Only allow GoogleBot to crawl the files or directories under the /private directory C.Does not allow GoogleBot to crawl the files or directories outside the /private directory D.Only allow GoogleBot to crawl the files or directories outside the /private directory
RPPRE22)1(db
ba
b Examination Paper Page 3 total 8
10. Which of the following interpretation to the damping coefficient (阻尼因子) d of PageRank algorithm is correct? A.d is the probability that users stop clicking and randomly surf to another page B.1- d is the probability that users stop clicking and randomly surf to another page C.d is the probability to prevent users from clicking links D.1- d is the probability that users randomly click the links
Section two: Answer questions (8 points per problem, 40%) 1. An English word list that contains 100,000 words, assuming that zipf constant k = 0.1 (1)How many words that appear 20 times ? (2)If the most commonly used m words’ frequency exceed the frequency of all words more than 20%, what is the smallest m?
2. What is the essentially difference between Global Automatic Analysis (全局自动分析) and Local Automatic Analysis (局部自动分析)?
b