信息存储与检索
信息检索名词解释

1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。
狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。
相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。
其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。
如期刊论文、科技报告、专利说明书、会议论文、学位论文等。
体现创作性。
其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):就是检索工具。
是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。
如文摘,目录、索引等。
它有存贮、检索、报道的功能。
体现高度的浓缩性。
其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。
二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。
三次文献是情报研究的产物和成果。
具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。
信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
信息检索知识点

信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
信息检索概念及分类

信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。
狭义的信息检索仅指信息查询(Information Search)。
即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。
广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。
又称信息的存储与检索。
一般情况下,信息检索指的就是广义的信息检索。
二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
(三)按检索途径划分:
直接检索
间接检索。
信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。
A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
信息检索

专业科训信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。
信息检索有广义和狭义的之分。
广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。
一·按存储与检索对象划分,信息检索可以分为:1·文献检索·2数据检索 3·事实检索以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
二·按存储的载体和实现查找的技术手段为标准划分:1·手工检索 2·机械检索 3·计算机检索其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
按检索途径划分:(1)直接检索,(2)间接检索三·检索方法信息检索方法包括:普通法、追溯法和分段法。
1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。
运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。
普通法又可分为顺检法和倒检法。
顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性效果较好。
信息检索-简答题(整理)较全版本

四、简答1. 简述信息组织、存储与检索的关系。
答:信息组织、存储与检索三者是不可分割的。
信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。
信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。
所以,三者是不可分割的。
2. 简述信息存储的含义及作用。
答:信息存储是指通过多种形式记录和排序信息的过程。
它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。
存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的内容与形式特征,然后按特征序化成各类信息集合并组织成系统。
信息存储部分是揭示信息特征、整序信息、建设系统的过程。
只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。
因此,信息存储是基础,信息检索是目的。
3.文献的概念及分类4.什么是文献类型标识符,在什么情况下使用如何使用答:文献类型标识符:标识各种文献类型的符号。
使用范围:仅在含有各种文献类型的目录及其他检索工具中使用。
使用方法:著录在正题名后面,并用中括号“[ ]”括起来。
5.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。
它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。
6.信息检索语言7.追溯法:8.文献信息资源9.信息的概念是什么信息有哪些特征10.影响查全率和查准率的因素有哪些11试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。
《信息学概论》第3章_信息组织、存储与检索

3.1 信息组织概述
(2) 耗散结构理论 Dissipative Structure
7
Ilya Prigogine 1969。耗散结构理论主要讨论一个系统从混 。 沌向有序转化的机理、条件和规律, 沌向有序转化的机理、条件和规律,研究耗散结构的性质及 其形成、稳定和演化的规律。它指出, 其形成、稳定和演化的规律。它指出,一个远离平衡态的开 放系统,当某个变量变化到一定的临界值时, 放系统,当某个变量变化到一定的临界值时,会通过涨落发 生突变,即发生非平衡相变。原来的混沌无序状态就有可能 生突变,即发生非平衡相变。 转变为一种空间、时间、功能有序的新状态。 转变为一种空间、时间、功能有序的新状态。这种在远离平 衡态的非线性区形成的宏观有序结构, 衡态的非线性区形成的宏观有序结构,需要与外界不断交换 物质和能量才能保持一定的稳定性, 物质和能量才能保持一定的稳定性,或不再因外界的微小扰 动而消失。 动而消失。这种需要耗散物质和能量才能维持其有序性的结 构称为耗散结构。 构称为耗散结构。
3.1 信息组织概述
14
信息学研究信息系统由旧结构不断演变为新结构这一过程的 规律性, 规律性,而协同理论正是以不同学科中现象复杂多样但宏观 质变行为却遵从共同规律的系统为研究对象。 质变行为却遵从共同规律的系统为研究对象。这就提供了运 用协同理论方法研究信息学问题的可能性。 用协同理论方法研究信息学问题的可能性。这种研究的优越 性还在于,信息系统是随时间变化的动态的开放系统, 性还在于,信息系统是随时间变化的动态的开放系统,其内 部存在着众多相互作用的子系统,运用协同理论无需从微观 部存在着众多相互作用的子系统, 上具体掌握其中每一个子系统的细节, 上具体掌握其中每一个子系统的细节,使用少量序参量就可 以表征系统的宏观特性(有序度),进而可以用序参量方程 以表征系统的宏观特性(有序度),进而可以用序参量方程 ), 描述系统由旧结构向新结构转变的复杂过程。 描述系统由旧结构向新结构转变的复杂过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1990年第3版;1999年第4版;2010年9月第5
版。是我国图书信息界为实现全国文献资料
统一分编而编制的一部大型文献分类法。22
个一级类目。标识符一级类目为大写英文字
母, 》
S512 3149
• G2信息与知识传播
• 20信息与传播理论
• 21新闻学、新闻事业
S72
S1
S1
•
M439 W556
T742 T933
•
中、外文期刊:分类--二排号--架位
•
先查分类: S
S15
S33
S34
•
155 2448 3253 2704
•
查二排号(同类): S66
S66
S66
•
2202 3444 3453
•
• 1 PHILOSOPHY. PSYCHOLOGY 哲学、心理学
• 2 RELIGION. THEOLOGY 宗教、神学
• 3 SOCIAL SCIENCES 社会科学、经济、法律、行政
• 4 vacant(语言学,该类1964年已并入第8类,现为空类)
• 5 NATURAL SCIENCES 数学和自然科学
600 Technology(Applied science)
• 100 Philosophy and related disciplines
• 200 Religion
700 The arts
• 300 Social science
800 Literature
• 400 Language
900 General geography and
•
中文图书:分类--二排号--架位
•
先查分类: S4
S41 S42 S432 S432.1 S5
•
9042 1054 0213 1031 7434 0758
•
再查二排号(在同类的情况下):
•
S4
S4
S4
S4
S4
•
4414
4422
4513 6002
7444
•
外文图书:分类--字顺--二排号--架位
•
S72
• 纸质文献的排序:
•
依据图书分类法(中图法;人大法)
进行首排序(一排号),其次进行二排号
的排序。
• 如: 《河南小麦栽培学 》
•
S512
一排号
•
3149
二排号
《河南小麦栽培学 》 分类号 书标
S512 3149
索书号:S512 / 3149
著者四角号码
图书排架方法:
图书经过加工后每种书获得一个索取号,书库图书严 格按索取号进行排架。
• 22广播、电视事业
• 23出版事业
• 24群众文化事业
• 25图书馆学、图书馆事
•
业
• 26博物馆学、博物馆事
•
业
• 27档案学、档案事业
• TP 自动化技术、计算机 • 技术 • 1自动化基础理论 • 2自动化技术及设备 • 3计算技术、计算机技 •术 • 6射流技术(流控技术) • 7遥感技术 • 8远动技术
第一所图书馆管理学院,他以馆长和图书馆学
教授名义兼任领导。 1876年编出一部可以用来
组织分类目录和进行分类排架的十进制分类法
即杜威十进分类法。
• 杜威十进图书分类法(Dewey Decimal Classification),对世界图书馆 分类学有相当大的影响,已翻译成西班牙 文、中文、法文、挪威文、土耳其文、日 文、增伽罗文、葡萄牙文、泰文等出版, 并被上述国家的一些图书馆和英语国家的 大部分图书馆采用,美国几乎所有公共图 书馆和学校图书馆都采用这种分类法。
二. 文献信息检索概论
搜索引擎“搜狐”上查到全球网站数量突 破1亿大关 两年时间翻一番,据Netcraft数据 显示,2009年10月份,全球新增350万个网站, 从而使全球网站总量达到了1.01435253亿个。
理解信息的涵义, 知道信息资源, 掌握信息获取技巧, 懂得如何利用信息服务。
1.文献、信息的概念
• 13.自然科学
• 14. 医药卫生
• 15. 工程技术
• 16. 农业科学技术
• 17. 综合参考
• 注:两位数的分类号后要加
•
“.”。
• 如: 16.26 作物栽培
•
16. 2652 可可
•
16. 26514.热带作物
3)《中国图书馆图书分类法》
•
简称《中图法》,中国图书馆组织全国
力量编辑,1975年第1版;1982年第2版;
• 319.4 读物
• 319.6 习题、试题
• 319.9 会话(听说、视听教材)
•
• I 文学 • 0 文学理论 • 1 世界文学 • 2 中国文学 • 21 作品集 • 22 诗歌、韵文 • 23 戏剧文学 • 24小说 • 25 报告文学 • 26 散文 • 27 民间文学
•
4 )国外主要的图书分类法
• 2)《中国人民大学图书馆图书分类》:简称《人 大法》,中国人民大学图书馆编辑。1953年9月 第一版,1985年第五版。由17个一级类目,标识 符为阿拉伯数字,对两位数后加“.”。如:13.生 物科学,16.农业科学。
《人大法》的一级类目:
• 1 马列主义、毛泽东思想 • 2 哲学 • 3 社会科学、政治 • 4 经济 • 5 军事 • 6 法律 • 7 文化、教育、科学、体育 • 8 艺术 • 9 语言、文字 • 10 文学 • 11. 历史 • 12 . 地理
按分类途径检索文献便于从学科体系的角度获得较系统的文献线 索,即具有族性检索功能。
较权威的图书分类法有, 如: 中国图书馆图书分类法 美国国会图书馆分类法 杜威十进分 类法
3.分类语言与分类法
• 1)分类语言:是以号码为基本字符,用分类号表 达文献概念的检索语言。例如: H31;G35;16.26
• 500 Pure science
history
•
•
杜威美国图书馆事业家、
•
图书馆学教育家。1851年出生
•
于纽约州的亚当斯中心 。1874
•
年毕业于美国阿默斯特学院。
•
读书时就在该学院图书馆工
•
作,毕业后留该馆工作,先后
任馆长助理、代理馆长。1883年杜威被任命为
哥伦比亚大学图书馆馆长,1887年在该校创立
国际十进分类法(Universal Decimal Classification)
•
简称UDC。由比利时学者鲍威.奥特勒(Paul otlet)和亨.拉芳
(Henrila)在DDC的基础上补充而成,初版于1905年,有23种文本, 从60年代末期起被称为世界图书信息的国际交流语言。
• 0 GENERALITIES 总类、科学和知识
•
杜威十进分类法(Dewey Decimal Classification and Relative
Index)简称DC或DDC,是美国图书馆学家麦威尔.杜威(Melvil
Dewey)所创制的,初版于1876年,历经22次的大改版,最新的版本
为2004年版。该法由10个一级(大类)类目所组成。
• 000 Generalities
• 文献(documents): • 信息(information):
• 是用文字、图形、符号、 声频、视频等技术手段记 录人类知识的一种载体, 或理解为固化在一定物质 载体上的知识。也可以理 解为古今一切社会史料的 总称。
•
• 以适合于通信、存储或处 理的形式来表示的知识或 消息。
信息 信息知信识息信息文信献息..
2. 文献信息检索
• 1)检索语言:检索语言就是检索文献所使 用
• 的语言。
• 2)检索语言的类型:
• 描写文献外表特征:书名语言;著者语言;
•
号码语言
• 描写文献内容特征:分类语言;主题语言
3)分类检索
分类检索是从文献内容所属的学科类别出发来检索文献,它依据 的是一个可参照的分类体系。
分类体系按文献内容特征的相互关系加以组织,并以一定的标记 (类号)作排序工具,它能反映类目之间的内在联系,包括从属、并列、 交替、相关等。不同检索工具使用各自规定的分类表。
• 2)分类法的类型: • 体系分类法:用将事物概念进行层层划分、层层隶属的
方法来形成一系列专指的分类标识,按照科学体系将分类 标识组织成具有隶属、并列关系的概念等级标识系统。
• 组配分类法:构成原理是概念的可分析和可综合性。
•
4.主要分类法简介
• 1)《中国科学院图书馆图书分类法》:简称《科 图法》,中国科学院图书馆编辑,1958年出版。 由25个一级类目,标识为阿拉伯数字。该法以自 然科学见长。
• 6 TECHNOLOGY 应用科学、医学、工业、农业
• 7 THE ARTS 艺术
• 8 LANGUAGE. LINGUISTICS. LITERATURE语言学、文学
• 9 GEOGRAPHY. BIOGRAPHY. HISTORY 地理、传记、历史
•
• 本馆文献信息检索 • 纸质文献检索 • 电子文献检索
首先是同一大类图书进行归集,如F 经济大类类首先 归集,同一大类图书按分类号逐位进行大小比较,小的排 前、大的排后,如F119和F12,分类号第二位数字同为1, 再比第三位,1比2小,故F119排在F12前面。分类号相同 的图书则按著者号组成的自然数字大小决定排次,小的在 前,大的在后。
本馆文献的排序(索取号)
其他类目:
• H 3 常用外国语
• 31 英语
• 310.4 英语水平考试