信息检索考试重点
网络信息检索考试试题

网络信息检索考试试题一、单选题(每题 2 分,共 30 分)1、以下不属于网络信息检索特点的是()A 检索范围广B 检索速度快C 检索结果准确性高D 检索方式灵活多样2、在搜索引擎中输入“filetype:pdf 人工智能”,其作用是()A 搜索关于人工智能的 PDF 文档B 搜索关于人工智能的网页C 搜索关于人工智能的图片D 搜索关于人工智能的新闻3、以下哪种搜索引擎语法可以用于排除特定关键词的搜索结果()A +BCD ?4、要查找关于“新能源汽车发展趋势”的最新研究报告,最合适的检索工具是()A 百度B 中国知网C 谷歌D 新浪5、以下不属于网络信息检索工具的是()A 目录式搜索引擎B 元搜索引擎C 博客D 全文搜索引擎6、在网络信息检索中,布尔逻辑运算符“AND”的作用是()A 扩大检索范围B 缩小检索范围C 改变检索顺序D 提高检索精度7、以下哪个不是常用的学术数据库()A Web of ScienceB ElsevierC 抖音D Springer8、利用搜索引擎检索时,如果希望检索结果中出现的关键词尽可能是连在一起的短语,应该使用()A 双引号B 书名号C 括号D 冒号9、要查找某一作者在特定期刊上发表的论文,应使用的检索字段是()A 作者B 期刊名C 标题D 关键词10、以下哪种检索方式可以提高查全率()A 精确检索B 模糊检索C 字段检索D 限制检索11、网络信息检索的基本步骤不包括()A 分析检索需求B 选择检索工具C 实施检索操作D 撰写研究报告12、以下哪个不是网络信息资源的评价指标()A 准确性B 权威性C 美观性D 时效性13、以下关于网络信息检索的说法,错误的是()A 不同的检索工具可能会得到不同的检索结果B 检索结果的数量越多越好C 要对检索结果进行筛选和评估D 检索策略需要根据检索情况不断调整14、以下哪种数据库主要收录专利文献()A 万方数据B 中国国家知识产权局专利数据库C 维普数据库D 中国期刊网15、要查找关于“大数据在医疗领域的应用”的学位论文,应选择的检索工具是()A 百度学术B 万方学位论文数据库C 中国知网学位论文数据库D 以上均可二、多选题(每题 3 分,共 30 分)1、网络信息检索的技巧包括()A 合理选择关键词B 运用布尔逻辑运算符C 利用高级搜索选项D 查看检索结果的相关推荐2、以下属于目录式搜索引擎的有()A 雅虎B 搜狐C 新浪D 网易3、网络信息资源的类型包括()A 网页B 数据库C 电子图书D 在线论坛4、影响网络信息检索效果的因素有()A 关键词的选择B 检索工具的性能C 网络速度D 用户的检索技能5、以下属于学术搜索引擎的有()A Google ScholarB 百度学术C 微软学术D 必应学术6、网络信息资源评价的方法有()A 查看网站的域名和主办者B 查看网页的更新时间C 参考他人的评价D 对信息内容进行分析7、以下哪些是常见的网络数据库()A 中国知网B 万方数据库C 维普数据库D EBSCO 数据库8、提高网络信息检索效率的方法有()A 制定合理的检索策略B 积累检索经验C 学会使用多种检索工具D 关注检索工具的更新和改进9、以下关于元搜索引擎的说法,正确的有()A 可以同时检索多个搜索引擎B 检索结果的准确性较高C 没有自己的数据库D 能够整合不同搜索引擎的结果10、在进行网络信息检索时,需要遵循的道德规范有()A 尊重知识产权B 不传播有害信息C 不恶意攻击他人网站D 合理使用网络资源三、判断题(每题 2 分,共 20 分)1、网络信息检索就是在互联网上查找信息。
信息检索考试重点

1. 按物质载体和记录形式划分,信息可分为印刷型、缩微型、声像型、机读型和手写型。
2. 文献是指“记录有知识的一切载体”,情报是“作为交流对象的有用知识”3. 内容、符号系统、物质载体、记录方式是构成文献的四个基本要素。
4. 按出版形式和内容的不同,信息可分为图书、期刊、报纸和特种信息。
特种信息也叫做灰色信息,包括:专利信息、学位论文、标准信息、会议信息、科技报告、政府出版物、产品样本资料和档案。
5. ISBN是国际标准书号,由13位数字组成,分成四段:组号(国家、区域、语言的代号);出版者号;书序号;检验码。
ISSN号是国际标准出版物号,由8位数字组成,分两段:分序号、校验码。
6. 图书按用途可分为3种类型:阅读用书,参考工具书,检索用书7. 按检索方法划分,检索工具可分为手工检索工具、计算机和网络检索工具。
8. 知识产权范围主要包括专利权、著作权和商标权9. 知识产权具有两大功能:保持功能和公开功能10. 广义的检索包括信息的存储和检索两个过程。
11. 检索方法分为常规法、引文法(追溯法和检索引文法)和交替法三种12. 检索途径可以分为主题途径、分类途径、责任者/著者途径、号码及其它途径13. 手工检索工具中的著录项目在数据库中称为字段,字段的集合称为记录。
14. 文献数据库内英文段码Abstract对应的中文段码名称是文摘。
Keyword对应的中文段码名称是关键词。
15. 按国际上通用的分类法,数据库分为参考数据库、源数据库和混合型数据库。
16. 中国现行主要的图书分类方法是《中国图书馆分类法》,它属于体系分类语言。
17. 《中图法》第四版将图书分为5部,22大类,L.M.W.Y没有,计算机属于TP类, 属于二级类目。
18. 索书号主要由分类号和著者号组成。
19. 在因特网中,政府机构和商业组织的二级域名分别是GOV、COM。
域名.hk所指的国家或地区是香港;.org的含义是非营利组织.20. 公告号为8510961的专利是发明专利,专利号为200420011414.6的专利是实用新型专利;申请号为99322746.5的专利是外观设计专利。
(完整版)信息检索考试重点

新
hing at a time and All things in their being are good for somethin
(二)
1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一 般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以 编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1 详解词典○2 专门词典。 词典从语种文别角度分为:○1 单语言辞典○2 多语言辞典。 从词量规模角度:○1 大型词典○2 中型词典○3 小型词典。 从收录内容角度:○1 百科全书○2 语文词典○3 专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学 和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个 门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)
【云南大学】信息检索期末复习重点

【云南大学】信息检索期末复习重点第一篇:【云南大学】信息检索期末复习重点云南大学信息检索重点第一章一、检索策略定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。
二、检全率与检准率1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100%2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100% 影响检出文献的检索效果的质量。
三、检索模型1.布尔检索模型(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。
(2)优点:简单、易理解、易实现、能处理结构化提问(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。
尤其是对复杂的检索课题,不易套用布尔检索模型。
B.易造成零输出或过量输出。
检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。
C.无差别的组配元,不能区分各组配元的重要程度。
D.匹配标准存在某些不合理的地方。
由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。
E.检索结果不能按照重要性排序输出。
2.向量检索模型(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。
(2)优点:A.采用自动标引技术维文献提供标引词B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。
C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。
D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。
E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。
信息检索重点总结及题型

信息检索考试内容:1名词解释(5题,共15分)2填空(40分)3简答(难,拉分题,35分)4著录格式(10分)书本基础知识:第一章:1 信息:是事物属性的再现,是由事物发出的消息、指令、数据等所包含的内容,广泛地存在于自然界和人类社会中。
2 知识:人们对客观事物运动规律的认识,是经过人脑加工处理过的系统化了的信息。
知识是人类经验和智慧的总结,是人们科学地认识世界、改造世界的力量。
3 情报:指传递着的有特定效用的知识。
是人们为了解决某个具体问题所需的新的知识信息。
基本属性:知识性、传递性和效用性。
信息>知识>情报。
4文献:记录有知识的一切载体。
文献的三要素:知识、载体、记录方式。
5科技文献:记录有科学技术信息或知识的一切载体。
科技文献的类型:按照载体形式划分:①印刷型文献②微缩型③声像型④电子型按照出版形式划分:图书/期刊/会议文献/科技报告/专利文献/学位论文/技术标准/政府出版物/产品样品和说明书/技术档案/报纸。
按照加工层次分:①一次文献:作者以本人的研究成果为基本素材而创作(或撰写)的文献。
包括:期刊论文、专利说明书、会议论文、科技报告、学位论文。
②二次文献:是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
包括:目录、题录、文摘、索引、各种数目数据库。
③三次文献:是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
如综述、述评、词典、手册、百科全书、年鉴、指南数据库、专著、教科书、论文丛集、文献指南、数目的目录。
6图书的主要外部特征是:书名、著者、出版社名称、出版地点、出版时间、图书总页数、国际标准书号(ISBN)。
国际标准书号具有唯一性。
①ISBN(International Standard Book Number)由10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号如:7-302-02372-7,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为02372、该书的校验码为7 。
信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。
这种附着在各种载体上的记录统称为文献。
2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。
3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。
信息是物质存在的方式、形式和运动规律的表征。
人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。
如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。
由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。
5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。
二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。
(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。
例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。
按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。
二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。
信息检索重点

一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
信息检索考试复习内容

一、逻辑算符、检索式l布尔逻辑算符:and 、or、 not(含义)1.逻辑“与”(AND 或 *) 用于表达两个或两个以上检索词(关键词、主题词)之间的相交关系或限定关系运算。
逻辑与检索能增强检索的专指性,使检索范围缩小。
2.逻辑“或”(OR或 + )用于表达两个或两个以上检索词(关键词、主题词)之间的并列关系。
运算逻辑或检索扩大了检索范围,提高检索信息的查全率。
此算符适于连接有同义关系或相关关系的词。
3.逻辑“非”(NOT或-)用于表达两个或两个以上检索词(关键词、主题词)之间中排除不需要的检索词(关键词、主题词)运算,可以缩小检索范围,增强检索的准确性。
此运算适于排除那些含有某个指定检索词(关键词、主题词)的记录。
但如果使用不当,将会排除有用文献,从而导致漏检。
检索式举例:题目:第三方物流信息管理系统检索式:第三方*物流*信息*管理*系统(and)检索入口:题目或关键词l截词检索:是一种常用的检索技术,尤其是在西文文献的检索中,使用更为广泛。
截词检索方式可分为三种,即:后截断、前截断、中间截断。
按截断的字符的数量上看,又可分有限截断与无限截断两种。
通常用* 表示无限截词。
用?表示有限截词。
后截断:是最常用的一种检索技术,将截词放在一个字符串之后,以表示其后有限或无限个字符不影响之前的检索字符串的检索结果。
如biolog*,可检索biologcal biologist biology等词, physic ??,可检索 physical、physicst等词。
、前截词将截词符号置于一个字符串的前方以表示其之前有限或无限个字符不影响之后的检索字符串的检索结果如*physics,可检索 physics、astrophysics、biophysics、chemiphysics、geophysics 等词。
中截词又称“ 内嵌字符截断” 。
将检索字符置于一个检索词中间,而不影响前后字符串的检索结果。
如:organi?ation可检索 organization、organisation。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
名词解释4*4’1.信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。
2.信息检索广义的信息检索全称是“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
3.登记性目录(概念)也叫国家书目,它是出版物国家登记制度的产物,反映国家出版的全部图书,实际上也反映了一个国家的文化、科学和出版业的水平。
4.联合目录(概念)汇总若干个单位馆藏而形成的目录,是馆藏目录的放大。
5.年鉴(概念)年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资料和重要信息,并按年度出版的连续性出版物。
6.OPAC(公共联机书目查询系统)利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式,通过联机查找为读者提供馆藏文献的线索。
7.引文索引(概念)根据美国科学信息研究所(Institute for Scientific Information,简称ISI)的定义:对于文献A和B:若文献B提到或引用了文献A,则A是B的引文。
这里,文献A被文献B 提到或引用,A是被引用文献或参考文献。
同时由于B引用了A,故B又称为引用文献。
8.垂直搜索引擎(概念)也被称为专业搜索引擎,或主题搜索引擎。
它专门收录某一方面、某一行业或某一主题内的信息,专为查询某一个学科或某一主题的信息提供检索服务,在解决某些实际查询问题的时候比综合搜索引擎更有效。
简答4*9’信息素质包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。
第二,掌握了主要的信息源和信息工具的知识及技能。
第三,能够分析评价选择相关信息。
第四,利用信息的目的是为了有效地解决具体问题。
信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。
信息素质涵义:1)信息意识(前提)信息意识是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。
信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。
2)信息知识(基础)信息知识是关于信息的特点、性质、运动规律、信息方法与技术、信息系统的有关知识。
3)信息能力(核心)信息能力是人们获取、分析、加工、传递、创造信息等能力的综合。
包括:信息查询与获取能力、信息交流与传播能力、信息组织与整合能力、信息利用能力、信息评价能力等.信息能力是提高信息素质的关键所在。
4)信息道德(准则)信息道德是指在信息活动中调节和控制信息生产者、信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。
具体:遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。
联合目录(作用)a.把分散在各地、各单位的文献,从目录上联成一休,充分发挥合作馆藏的力量;b.便于开展文献资源采购协调;c.便于开展馆际互借和复印;d.按检索结果查找原文、获取原文的范围更大。
目录与题录、索引的区别“目录”是以一个完较的出版单元或收藏单元作为著录的基本单位的。
“题录”是以一个内容上相对独立的文献单元(如一篇文章或一本书的某一部分,也可以是一个完整的出版物)作为著录的基本单位。
“索引”则是以一个完整的出版物中的某一部分(如期刊中的某一篇文章、会议录中的某一篇论文或图书中的某一章等)、某一观点、某一知识单元作为著录的基本单位。
查全率与查准率(文字+图)图书特点:内容比较系统、全面所载信息成熟、可靠编辑出版时间长传递信息的速度比较慢(电子图书的出版发行可弥补)由于图书的综合性,使它成为积累和传递信息和知识的重要信息源。
图书的适用性:它可以指引人们比较全面地了解某一领域内的历史、发展现状和趋势。
系统地学习知识;了解关于某知识领域的概要;查找某一问题的具体答案。
期刊特点:规模大,品种多,内容丰富多彩出版周期短,报道速度快,内容新颖发行面广,流通渠道多,影响大期刊的适用性:当做学术研究时,了解与自己的课题相关的研究状况,查找必要的参考文献;了解某学科/领域的水平动态。
期刊作用:期刊已成为传播和交流信息,尤其是科技信息的主要工具。
期刊也起着记录、公开前沿信息的作用,成为展示原始性第一手资料和原创性观点和成果的平台。
论述3*16’文献信息链:文字+图从人类整个知识体系的行程来看,现存文献中的知识来自于研究组织通过观察、实验而获得的发现与数据,它们被记录在实验室笔记或日记里,是具有第一手意义的文献信息。
这就是文献信息流的起点。
当研究组织或个人将研究成果以期刊论文、会议文献、发明专利、科技报告等公开出版物形式发表时,即构成文献信息链的重要组成部分,这就是一次文献信息流。
一次文献信息流发展壮大后,难以被掌握和利用,于是文献信息服务机构对其进行书目控制和重新组织,这样,文献信息流开始进入有序化阶段。
这一阶段由“替代”、“改组”、“综合”三个环节构成。
1)替代。
描述文献特征,对一次文献信息进行不同程度的提炼或压缩,形成目录、文摘、索引等二次文献信息。
从文献信息流的运动角度看,替代是文献信息流的流量、流向得到测度并合理调节。
2)改组。
从一次文献信息中提取数据、事实和有关结论,按照易于查阅的提醒重新组合,其改组的结果,产生了手册、名录、辞典、目录等类型的文献信息。
其目的是使一次文献更容易被理解和使用。
3)综合。
利用二次文献对一次文献所包含的知识加以综合并融入到现有知识体系中,成为整个知识体系的有机组成部分,产生的主要成果是不断再版的百科全书、专著、教科书及综述、评论性文章。
文献信息流的继续演变,是对二次文献信息流的书目控制或改组,即进入“二次替代”过程,其成果是“书目之书目”、“文献指南”之类的工具。
这类文献在利用文献信息的过程中起到导航作用。
由此可见,文献信息流是一个以研究活动为起点,按顺时针的线性顺序移动,是一次、二次、三次文献信息的演变过程。
对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。
信息检索的原理:文字+图检索工具的体系结构:(查看word)每一部分说明)检索工具的体系结构(1)编辑说明与凡例(2)分类表与主题表(3)正文(4)辅助索引(5)资料来源目录与附录检索工具的体系结构(1)编辑说明与凡例编辑说明与凡例通常放在检索工具的开头部分。
编辑说明一般向用户揭示该检索工具的编辑目的、收录范围、选材原则、适用对象、出版沿革、总体结构、各部分的用途及用法等。
编辑说明的作用是向用户介绍该检索工具的概貌,以便用户确认该工具是否适合自己。
凡例对用户检索起具体的指导作用,通常以简洁的文字和示例详细介绍检索工具的编排体例、著录格式、著录项目和查找方法等,使用户对该检索工具有进一步的认识,了解各方面的特征,掌握其使用方法。
(2)分类表与主题表分类表和主题表是编制和使用检索工具必不可少的辅助工具。
分类表主要用于文献款目的编排和浏览。
分类表的详表单独出版,分类编排文献款目的检索工具往往有分类表的简表,放在每期的前面,并与目次页结合在一起。
主题表有两个作用:一是像分类表那样,用于文献款目的编排和浏览,但这仅指按主题编排文献款目的检索;二是用于主题标引和检索,为检索工具和用户提供允许使用的主题词及其参照系统,保证标引的一致性以及标引与检索的一致性。
(3)正文正文是检索工具的主体,它由大量的文献款目按一定顺序编排而成。
文献款目是正文的基本构成单元(文摘型检索工具还附有摘要)。
文献款目由书目数据组成,揭示文献的外部特征和内容特征。
因此,从正文内部讲,其主要作用有两个:一是为用户判断检中文献是否符合自己的要求的依据,以便决定取舍;二是为用户提供获取所需原始文献的线索。
(4)辅助索引设置辅助索引的目的就是为了给用户提供更多的检索途径,提高检索效率。
辅助索引是从正文中抽出检索标识以及有检索意义的外部特征和内容特征,如主题词、作者、各种号码等,编织成各种索引,每个索引款目都要注明一个或多个正文地址,从而指回正文的对应位置。
辅助索引是相对于正文而言的,但其作用却不可低估。
从检索的意义上讲,检索工具的作用主要是通过其各种索引实现的。
(5)资料来源目录与附录资料来源目录式检索工具所摘录文献出处的目录,一般是指来源期刊,也叫引用期刊目录或来源出版物目录。
文献款目中所著录的来源出处比较简略,而且刊名常常使用缩略语。
来源期刊目录详细说明一种来源期刊的名称、全称、代码、编辑出版机构、出版沿革、出版周期等,供用户全面了解来源期刊的全貌,并把刊名简称还原成全称。
附录主要包括专业术语缩略语表、字母音译对照表、期刊代码表等,便于用户正确识别检索工具正文中的缩略语、代码、音译名等。
信息检索的一般程序(文字+图)搜索引擎的工作原理包括三个过程:1. 在互联网上发现、搜集网页信息。
利用能够从互联网上自动搜集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL链接行走;重复这一过程,把爬过的所有网页资源收集起来。
2. 对所搜集的信息进行页面分析和处理,提取和组织页面文件所包含的信息,并建立信息索引库。
由索引建立程序对搜集的网页进行分析,根据一定的特征提取算法提取网页资源对象的特征信息,主要包括:网页URL、编码类型、页面结构特征、页面内容包含的关键词、关键词位置、生成时间、大小、与其他网页的链接关系等元数据信息。
3. 根据资源对象的索引信息,进行信息检索和检索结果集排序等操作。
信息检索程序根据用户输入的查询关键词,从索引数据库中快速检索出相关信息对象,并对检索出的结果提供多种排序操作,最终将排序后的结果返回给用户。