关于信息组织与检索
《信息组织与检索》网络辅助课程的建设探讨

(c n mi & Ma a e n x e me t e c igC ne, u n d n uie ol e u n z o 1 3 0C ia Eoo c s n g me t p r n a h e t G a g o g s s C l g , ag h u5 0 2 , hn ) E i T n r B n s e G
Ab ta t no d rt x lr e s d d ae n itme, d o aigsl td , ar u h e c ig in v t no — er— s rc: re o e po ean w t y mo ebsd o ne t a v ct f u y wecr o ttetahn o a o fe lan I u n e -s y n i
中图分类号:P 9 T 33
文献标识码 : A
文章编号 : 0 — 042 0 )2 07 - 1 1 9 3 4 ( 63 —0 6 0 0 0
Y E W e -hu n i
Dic s ino lf r t n Or a iaina d Re r v l —L arig Co re Co srcin s u so f” O ma i g nz t n ti a”E e nn u s n tu t n o o e o
Or a ia o n t e a”b sd o lc b a d g n zt n a d Re r v l ae n B a k o r 、 i i
Ke o : ak o r ; —lann ; no mainOr a i t na dRere a; s n y WOrSBlc b ad E — rig Ifr t g nz i n t v lDei t e o ao i g
第三章 信息检索的基本知识

1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
信息检索

中文书本式的检索工具
《国内总书目》--《全国新书目》《科技新 书目》:查找国内出版的图书目录 《外文新书通报》:查找国外新书目录 《全国报刊索引》:查找国内期刊论文的工 具 科技 文献书目型数据库检索系统 事实型数据库检索系统 数值型数据库检索系统 全文数据库检索系统
“逻辑或”的组配种类
同义词 同一个人多个姓名 通用的英文缩写 化学物名称 Eg:CAD
逻辑非
用于排除含有不需要概念的信息,可缩小所 检索信息的范围。 逻辑运算符:“NOT”、“-” 逻辑表达式:“A NOT B ”“A-B” 语义表示:被检索文献中含有A而不含有B
4字段(限制)检索
在检索系统中,数据库设置的可供检索的字 段通常有两种: 表达文献主体内容特征的基本字段 表达文献外部特征的辅助字段 基本字段包括篇目(TI)、文摘 (AB)…… 辅助字段包括作者(AU)、语种 (LA)……
4字段(限制)检索
为了缩小检索范围,可利用字段代码来限制检索词 出现的字段,以提高检索速度和命中率。 如: economic models in ti(表示只在题 目字段中查找文献) economic models in de(只在主题词中 查找) economic models in ab(只在文摘中查 找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献)
位置算符检索即运用位置算符表示两个检索 词间的位置。 如果说布尔逻辑算符是表示两个概念之间的 逻辑关系的话,位置算符表示的是两个概念 在信息中实际物理位置关系。
检索时会经常遇到这样的问题?
《信息组织学》考试复习大纲(详细)

第一章1、信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。
它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。
2、信息采集渠道:①大众传播媒体②文献③政府机构④合作伙伴⑤消费者⑥信息中介结构3、信息采集方法:问卷调查、访谈、实验研究、文献收集4、信息组织与信息检索的关系:信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量的信息中查找出所需信息的过程。
对信息检索进行完整描述,一般必须包括信息组织和检索两个方面。
在信息检索系统中,信息组织是依据信息资源的主题内容和特征,将无序的信息组织成有序集合。
信息组织是信息检索的基础和前提。
信息组织根据用户需要,以信息资源的一定单元为处理对象,依据预先制定的规范,对其特征加以记录,并进行标引和必要的记录,然后将这些信息记录,按照规定的方式输入检索系统。
第二章1、信息组织:就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
2、信息组织基本内容:按照信息组织的活动类型分“信息选择、信息分析、信息描述与揭示、信息存储”按照信息组织的流程分“信息的筛选和鉴别、信息的分类和排序、信息的著录和标引、信息的编目和组织、信息的分析和研究”3、信息描述与揭示方法:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。
4、信息组织的类型:信息组织可归为语法信息组织、语义信息组织和语用信息组织三大类型。
从广义上看,信息采集阶段的信息组织主要是一种语用信息组织;信息组织阶段的信息组织属综合型信息组织;信息检索和开发阶段的信息组织则属于优化型语用信息组织。
5、一次信息、二次信息、三次信息:一次信息是人们研究或创造性成果的直接记录,一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过处理的电子化信息等。
第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网
它
7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;
信息组织知识点

主题法的含义主题,主要指信息资源论述的主题对象,包括事物、问题、现象等。
经过选择,用来表达信息资源主题的语词,称为主题词。
所谓主题法,一般是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径、并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。
主题法一般都具有下述特征:1、直接以语词作为检索标识。
主题法不像分类法那样,以一种抽象的号码系统作检索标识,而是直接选用自然语言中的语词进行标引和检索。
2、以字顺作为主要检索途径。
虽然主题法往往也采用按范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。
我国的主题检索系统通常是根据汉字特点,按照拼音或笔画笔顺进行排检的;因此在使用主题法检索时,只要知道检索对象的名称,就可以按相应的排检方式进行查找。
在机检系统中,一般可以直接输入语词,由计算机进行查找,通用性好。
以特定的事物、问题、现象,即主题为中心集中信息资源。
分类法由于受学科体系的限制,从不同学科角度研究,同一对象的信息资源是分散在各知识门类中的,主题法则是直接从主题对象的角度揭示信息资源。
4、往往是通过详尽的参照系统等方式揭示主题词之间关系。
按照字顺排列不能必然揭示主题概念之间的联系,为了克服这一局限,主题法发展了完备的参照系统,通过在主题词下设置用、代、属、分、参等多种参照项,建立起“隐蔽的分类体系”。
与分类法相比,主题法的特点是可以集中与一个主题有关的各个方面的信息资源,检索的直接性、通用性好,适合于进行各种专指检索,在性能上具有与分类法相互补充的特点。
主题法通常不用于组织图书,只广泛用于组织各种检索工具,不仅可以利用它编制各类供手检使用的书目索引,同时也可以用来建立计算机检索系统,进行机检。
按照主题法的选词方式,可以分为标题法、元词法、叙词法、关键词法;1、标题法标题词,亦称标题,并非指文献“标题”中的词,是指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。
信息检索 ppt课件

详细描述
社交网络信息检索技术主要针对社交网络中 海量、动态更新的信息进行处理和检索。特 点包括实时性、个性化和社会化等。同时, 也面临一些挑战,如信息过载、隐私保护等
。
案例四:社交网络信息检索技术实践分享
总结词
社交网络信息检索技术的创新与应用
详细描述
介绍一些创新性的社交网络信息检索技术,如基于内 容的推荐算法、情感分析技术等。同时,分享一些成 功应用案例,如微博搜索、微信小程序等,说明这些 技术在社交网络中的实际应用和效果。
云服务和移动化 借助云服务和移动通信技术,实 现信息检索服务的移动化和云端 化,方便用户随时随地获取信息 。
个性化推荐和定制化服务 通过数据分析和挖掘,实现个性 化推荐和定制化服务,满足用户 多样化的信息需求。
多模态信息检索 融合文本、图像、音频和视频等 多种类型的信息,实现多模态信 息检索,提高信息检索的全面性 和多样性。
04
信息检索的应用领域
搜索引擎
搜索结果相关性
提高搜索结果与用户查询的关联 度,减少无关信息的展现。
语义分析和理解
对用户查询进行深度解析,识别关 键词的语义,提高搜索的准确性。
实时更新
对互联网上的新信息进行实时跟踪 和更新,确保用户获取最新、最相 关的信息。
数字图书馆
资源数字化
将传统图书馆的资源进行数字化 处理,方便用户在线阅读和下载
关联规则挖掘
挖掘信息之间的关联规则,帮 助用户发现隐藏的信息需求。
信息检索的评价指标
查全率
评估检索系统找全满足用户需求的信息的能 力。
响应时间
评估检索系统响应用户请求的速度。
查准率
评估检索系统找准满足用户需求的信息的能 力。
信息检索的概念

4.4.1 信息检索
● 各种搜索引擎 ● 各种数据库
4.4.2 信息发 布
● 主机托管 ● 虚拟主机 ● 主机租用
பைடு நூலகம்
信息检索的概念
广义概念指将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关的信息过程,故全称: “信息的存储与检索(Information Storage and Retrieval)。 狭义概念指广义概念的后半部分,即从信息集合中 找出所需要的信息的过程,相当于人们通常所说的信息 查询(Information Search)。 信息检索可分为直接检索和间接检索。 直接检索——直接从信息源和文献载体中获取信息; 间接检索——通过信息检索工具或检索系统获取所需的 信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《信息组织与检索》一.名词解释1. 一次文献:即原始文献。
它是作者以生产或科研为依据而创作的原始文献。
如专著、期刊论文、学位论文等。
2. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。
3. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。
它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。
4.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。
它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。
5. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。
6、文献信息资源文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。
7、信息检索语言信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。
8、竞争情报竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。
9、INTERNET(因特网)Internet:因特网。
泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。
采用TCP/IP协议。
因特网,源自英文的Internet,它的含义从广义上来说就是是“联接网络的网络”。
这种将计算机网络互相联接在一起的方法称为网络互联。
作为专有名词,它所指的是全球公有、使用TCP/IP这套通讯协议的一个计算机系统,这个系统所提供的信息与服务,以及系统的用户。
因此,世界上这个最大的互联网络也被简称为“互联网”(the Internet)。
二. 判断题(对的打“√” ,错的打“×” )1. 通过BA、ISTP、Kluwer online、Springer Link 数据库都能检索到外文期刊论文全文。
(×)2. 在重庆维普数据库检索系统中能查到企业名录。
(×)3. 利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印刷型图书和期刊。
(∨)4. 截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。
(∨)5. 联合目录可以帮助读者确定其所需要的文献收藏在那个情报机构。
(∨)6. 综述因附有大量参考文献,所以是二次文献。
(×)7. 通过“万方数据资源系统”可以查找标准文献的全文。
(∨)三. 填空题1.按文献载体形式划分,文献可分为印刷型、缩微型、声像型、和电子型。
2.根据文献Biomedical applications of nanoscale devices,Anon.Source: MaterialsTechnology, v 19, n 2, June, 2004, p 118-119.的著录特点,可以判断,该文献是科技期刊_。
3. 在计算机信息检索系统中,常用的检索技术主要有布尔逻辑检索、截词检索、位置检索、限制检索和加权检索_等。
4. 要查明同济大学图书馆是否有“computer communications”这本期刊,可以通过电子期刊导航系统和_书目信息检索系统等系统查找。
5.公告号为8510961的专利是_发明专利(类型的)专利,专利号为200420011414.6 的专利是实用新型(类型的)专利;申请号为99322746.5的专利是_外观设计(类型)专利。
在标准号GB/T 19557.8-2004中,其中GB/T是推荐标准代号,2004是颁布年代。
6.在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。
7、查找中文科技期刊全文文献的数据库有清华中国学术期刊(或维普中文科技期刊或万方数字化期刊);8、IPC 是国际专利分类号,其作用是提供从分类途径查找专利。
9、_知识__、_载体___、_记录____是构成文献的三个基本要素。
10、按检索方法划分,检索工具可分为_手工检索_工具、_计算机和网络检索工具。
11、目前,常见的主题词语言有_标题词_语言、_单元词_语言、_关键词_语言和_叙词_语言。
12、广义的信息检索实际上包括文献的_存储__和文献的_检索_两个相互依存的过程。
13、我国从1985年4月1日开始实施《中华人民共和国专利法》,标志着我国专利制度的正式建立。
14、手工检索检索中国专利主要使用_《中国专利公报》__和_《中国专利索引_》_两种。
15、德温特公司的专利文献检索工具为检索者提供了三种检索途径即:_国际专利分类号检索___、_专利权人检索__和_专利号检索__。
16、中文检索工具的内容,一般由使用说明、目次、_正文__、_索引___和_文摘来源_五个部分组成。
四、多项选择题1、专利文献的特点有(ABCD)。
A、技术新颖B、格式统一规范C、实用性强D、报道迅速,价值巨大2、按收录文献的范围划分,检索工具可分为(ABC )。
A、综合性检索工具B、专业性检索C、单一性检索D、手工检索3、情报的基本属性有( AB)。
A、传递性B、效用性C、目录性D、用户性4、我国技术标准主要分为(AC )。
A、国家标准B、部标准C、企业标准5、专利申请必须遵循的原则有( ACD)。
A、书面原则B、国民待遇原则C、优先权原则D、单一性原则五.运用学过的有关算符写出下列课题的检索式如果要查找McKee, Colin发表在Nature Biotechnology杂志上的“Production of biologically active salmon calcitonin in the m ilk of transgenic rabbits”文章,如何编写检索式。
FieldCodeFieldCodeAbstractABSerial titleSTAuthorAUSubject/Title/AbstractKYAuthor affiliationAFTitleTI“McKee, Colin”wn AU and “Nature Biotechnology” wn ST and (biologically and salmon and calcitonin and milk) wn TI 或者AU=McKee, Colin * ST=Nature Biotechnology * TI=biologically and salmon and calcitonin and milk六、找出下列检索式中的算符,并解释各检索式的含义1、((Telemedicine and (GPRS or “general packet radio service?” or “wireless net?”))) WN KY) and (({LEE B}) WN AU)在文摘或题名或主题词中查找包含远程医疗(Telemedicine)及GPRS或无线网络且作者是LEE B 的文献。
2.、(纳米材料+纳米技术+纳米科技)*(生物医学+卫生保健)*应用查找纳米材料或纳米技术或纳米科技在生物医学或卫生保健中应用的文献。
七.问答题1.影响查全率和查准率的因素有哪些?查全率:R=检出的相关信息量/检索系统中相关信息总量查准率:P=检出的相关信息量/检出的信息总量主要从以下几个方面考虑:选词、选择数据库是否全面;时间,文献类型2、信息的概念是什么?信息有哪些特征?广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息信息具有以下几个特征:普遍性、无限性、寄载性、传递性、可知性与可贮性、动态性、共享性3、如果要查找有关“转基因生物和细胞及其制备方法”方面的中外文文献,如何查找?请写出具体的检索步骤。
1、分析课题,明确检索要求;2、选择检索系统:要考虑文献类型3、选择检索途径4、选择检索方法5、查找文献线索6、获取原始文献4、简述信息检索语言的功能。
信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的依据;对信息检索人员来说,它是表达检索需求的依据。
5、信息的特征有哪些?信息具有如下几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性6、试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。
主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言。
主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性。