信息检索知识ppt课件
合集下载
信息检索技术基础知识讲义PPT(97张)

信息检索与利用
信息检索技术基础
1
主要内容
2.1 信息检索语言 2.2 信息检索技术 2.3 检索效果评价 2.4 检索词的确定 2.5 信息检索策略及策略式 2.6 信息检索步骤 2.7 科技查新
2
2.1 信息检索语言
• 检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言。
2.2.1 布尔逻辑
• 布尔逻辑检索:在进行信息检索时,检索项
之间概念有相交关系、同义关系或相关关系, 这时采用布尔逻辑进行检索项之间的逻辑组配。 • 布尔逻辑算符有三种: 逻辑与、逻辑或、逻辑非
用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
14
逻辑“与”
• 在计算机信息检索时,“与”用于表示概念的交 叉、限定关系 • 逻辑符号:and、﹡、还可用空格表示 A • 表达形式:A and B、 A * B 、或 A B • 具有缩小检索范围和提高专指性的功能。
22
截词的分类
• 按位置分类: 前截词 中间截词 后截词 • 按取代数量分: 有限截词 无限截词
运输 飞机 设计
•
飞机设计 运输飞机 通常使用的叙词表有: 国内《汉语主题词表》, 英国《科学文摘》使用的《INSPEC Thesaurus》,
美国《工程索引》使用的《Ei Thesaurus》等。
7
EI(Thesaurus)
8
2.1 信息检索语言
作用 • 检索词用来组织信息(信息工作者)
• 对文献信息内容进行标引; • 对内容相同或相关的信息加以集中或揭示其相关性; • 对信息进行系统化、有序化;
信息检索技术基础
1
主要内容
2.1 信息检索语言 2.2 信息检索技术 2.3 检索效果评价 2.4 检索词的确定 2.5 信息检索策略及策略式 2.6 信息检索步骤 2.7 科技查新
2
2.1 信息检索语言
• 检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言。
2.2.1 布尔逻辑
• 布尔逻辑检索:在进行信息检索时,检索项
之间概念有相交关系、同义关系或相关关系, 这时采用布尔逻辑进行检索项之间的逻辑组配。 • 布尔逻辑算符有三种: 逻辑与、逻辑或、逻辑非
用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
14
逻辑“与”
• 在计算机信息检索时,“与”用于表示概念的交 叉、限定关系 • 逻辑符号:and、﹡、还可用空格表示 A • 表达形式:A and B、 A * B 、或 A B • 具有缩小检索范围和提高专指性的功能。
22
截词的分类
• 按位置分类: 前截词 中间截词 后截词 • 按取代数量分: 有限截词 无限截词
运输 飞机 设计
•
飞机设计 运输飞机 通常使用的叙词表有: 国内《汉语主题词表》, 英国《科学文摘》使用的《INSPEC Thesaurus》,
美国《工程索引》使用的《Ei Thesaurus》等。
7
EI(Thesaurus)
8
2.1 信息检索语言
作用 • 检索词用来组织信息(信息工作者)
• 对文献信息内容进行标引; • 对内容相同或相关的信息加以集中或揭示其相关性; • 对信息进行系统化、有序化;
第一章信息检索基础知识PPT课件

信息、知识、文献的关系
信息 知识 文献
文献的类型
• 按载体的形态分 • 按内容、性质和加工深度来分 • 按文献的出版类型分
按载体的形态分
• 手写型 writer by hand form • 印刷型 printed form • 缩微型 Microform • 声像型 (视听文献)Audio-Visual form • 机读型(电子型)Machine Readable
。 美国国会图书馆总面积为34.2万平方米,世界上最大的图书馆
•
缩微型
• 以感光材料为载体,以照相为记录手段而形成的 文献形式
• 优:
–体积小。 –成本低,仅及印刷品1/10∽1/15 –长期保存 –忠实于原件
• 缺:
–不能直接阅读
缩微型
声像型
• 是以磁性和感光材料为介质记录声音、图像 等信息的一种文献形式。
• 知识(Knowledge) :是人类通过对自然界、人 类社会以及思维方式与运动规律的认识与掌握, 是人脑通过思维重新组合的、精简化的信息集 合。
• 知识包括个人知识和社会知识。
个人知识:存在于大脑、笔记或书信中,只 能 为个人所用。
社会知识:存在于文献中或人类的传说中
• 文献(Document / Literature):记录 有知识的一切载体。
form、Electronic Publication
手写型
• 以实物为载体的,以手工为记录手段的 文献
手写型
印刷型
• 以纸质材料为载体,以印刷为记录手段 而形成的文献形式。
•优
–便于阅读、传递
•缺
–十分笨重,保存起来费事费力 –难于实现信息自动化提取和高速度传递
• 国家图书馆总建筑面积25万平方米(含总馆一期、 二期,古籍馆),居世界国家图书馆第三位。
信息检索ppt课件

19
信息检索技术
❖ 一、布尔逻辑检索(not>and>or) ❖ 二、截词检索 ❖ 三、位置检索(常用的关系符号是(W)、(N)、
(F)、(S))
(四)限定字段检索
20
信息检索策略
❖ 1.分析检索课题,明确目的和要求 ❖ 2.选择合适的检索工具 ❖ 3.选择检索途径,确定检索标识 ❖ 4.编制检索表达式,调整检索策略 ❖ 5.浏览检索结果,获取原始文献。
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1信息的特征载体依来自性信无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程度和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的伦 理规范。
❖ 因此,知识是系统化、理论化的信息集合。
3 3
三、情报(information, intelligence )
❖ 《辞源》:“定敌情如何,而报于上官者”为情报。 ❖ 《辞海》:“战时关于敌情之报告,曰情报。
信息检索技术
❖ 一、布尔逻辑检索(not>and>or) ❖ 二、截词检索 ❖ 三、位置检索(常用的关系符号是(W)、(N)、
(F)、(S))
(四)限定字段检索
20
信息检索策略
❖ 1.分析检索课题,明确目的和要求 ❖ 2.选择合适的检索工具 ❖ 3.选择检索途径,确定检索标识 ❖ 4.编制检索表达式,调整检索策略 ❖ 5.浏览检索结果,获取原始文献。
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1信息的特征载体依来自性信无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程度和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的伦 理规范。
❖ 因此,知识是系统化、理论化的信息集合。
3 3
三、情报(information, intelligence )
❖ 《辞源》:“定敌情如何,而报于上官者”为情报。 ❖ 《辞海》:“战时关于敌情之报告,曰情报。
信息检索 ppt课件

详细描述
社交网络信息检索技术主要针对社交网络中 海量、动态更新的信息进行处理和检索。特 点包括实时性、个性化和社会化等。同时, 也面临一些挑战,如信息过载、隐私保护等
。
案例四:社交网络信息检索技术实践分享
总结词
社交网络信息检索技术的创新与应用
详细描述
介绍一些创新性的社交网络信息检索技术,如基于内 容的推荐算法、情感分析技术等。同时,分享一些成 功应用案例,如微博搜索、微信小程序等,说明这些 技术在社交网络中的实际应用和效果。
云服务和移动化 借助云服务和移动通信技术,实 现信息检索服务的移动化和云端 化,方便用户随时随地获取信息 。
个性化推荐和定制化服务 通过数据分析和挖掘,实现个性 化推荐和定制化服务,满足用户 多样化的信息需求。
多模态信息检索 融合文本、图像、音频和视频等 多种类型的信息,实现多模态信 息检索,提高信息检索的全面性 和多样性。
04
信息检索的应用领域
搜索引擎
搜索结果相关性
提高搜索结果与用户查询的关联 度,减少无关信息的展现。
语义分析和理解
对用户查询进行深度解析,识别关 键词的语义,提高搜索的准确性。
实时更新
对互联网上的新信息进行实时跟踪 和更新,确保用户获取最新、最相 关的信息。
数字图书馆
资源数字化
将传统图书馆的资源进行数字化 处理,方便用户在线阅读和下载
关联规则挖掘
挖掘信息之间的关联规则,帮 助用户发现隐藏的信息需求。
信息检索的评价指标
查全率
评估检索系统找全满足用户需求的信息的能 力。
响应时间
评估检索系统响应用户请求的速度。
查准率
评估检索系统找准满足用户需求的信息的能 力。
网络信息资源检索PPT课件

03
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。
网上信息搜索PPT课件

目的和目标
提高信息素养
掌握搜索技巧
通过学习网上信息搜索技巧,帮助学生提 高信息获取、筛选、评价和利用的能力, 培养良好的信息素养。
介绍常用的搜索引擎、搜索语法和技巧, 以及如何根据不同的需求选择合适的搜索 工具和方法。
解决实际问题
培养自主学习能力
通过实际案例和实践操作,引导学生运用 所学知识解决实际问题,提高信息搜索的 效率和准确性。
个性化搜索推荐
总结词
随着大数据和人工智能技术的不断发 展,个性化搜索推荐将成为网上信息 搜索的重要趋势。
详细描述
通过对用户行为、兴趣和需求的深度 挖掘,智能算法能够为用户提供更加 精准、个性化的搜索结果,满足用户 对信息获取的个性化需求。
智能搜索技术
总结词
智能搜索技术将进一步提升网上信息搜索的效率和准确性。
详细描述
通过自然语言处理、机器学习等技术,智能搜索能够更好地理解用户的查询意图 ,提供更加准确、全面的搜索结果,同时还能对搜索结果进行智能排序和过滤。
无界信息搜索
总结词
随着互联网信息的爆炸式增长,无界信息搜索将成为未来发展的必然趋势。
详细描述
通过跨平台、跨领域的搜索技术,无界信息搜索能够打破信息孤岛,整合各类信息资源,为用户提供更加全面、 丰富的搜索结果。同时,无界信息搜索还能够实现跨语言、跨文化的信息交流与共享,推动全球信息知识的普及 和发展。
信息真实性问题
虚假信息
01
网络上充斥着大量虚假信息,如假新闻、假广告等,这些信息
可能误导用户,影响其做出正确决策。
误导性信息
02
有些信息可能故意模糊事实,使用户产生误解,从而影响其判
断力和决策能力。
缺乏权威性
信息检索 ppt课件

学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科、综合性学科。据统计 ,目前全世界每年出版各种文献量为l2000万册,平均每天出版文献约32万件。
1950-2006年中文图书出版概况
140000 120000 100000
80000 60000 40000 20000
3、文种繁多,内容交叉重复
全球的科技期刊出版采用70余种语言出版。 由于研究和出版的重复,形成了大量的重复文献,如: 会议论文重复率达40 % ,专利文献重复率高达60%
4、文献分布既集中又分散
集中: 某一学科的文献通常有80%都集中在该学科15%的期 刊中,这些期刊称为“核心期刊”,其中的文献代表了该学科的 最高水平、最新成果,具有权威性。
狭义的信息指文献资源或数据资源,包括各媒体中的片 段、文章、图书、情报、观念等。
特 点: 1.不同的事物所存在的状态和运动方式,就会表现出不同的信息;
2.信息不是实体,必须借助某种介质才能表现或传播。
二、知识(knowledge)
是人类在认识和改造客观世界实践中获得的对事物本质 的认识和经验的综合。
信息经过选择、综合、研究、分析等加工过程后可以成为
情报;
知识是系统化、理论化的信息。
五、文献与信息素养
信息素养(Information literacy)指具有检索、分析、 评价和利用各种信息源以解决信息需求及制定明智决 策的能力,是对个人信息行为能力、独立学习能力以 及批判性思维能力等概括性描述。
分散: 随着科学技术发展, 学科分支越来越细,专业文献分散。
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科
5、新陈代谢频繁,文献老化加快
1950-2006年中文图书出版概况
140000 120000 100000
80000 60000 40000 20000
3、文种繁多,内容交叉重复
全球的科技期刊出版采用70余种语言出版。 由于研究和出版的重复,形成了大量的重复文献,如: 会议论文重复率达40 % ,专利文献重复率高达60%
4、文献分布既集中又分散
集中: 某一学科的文献通常有80%都集中在该学科15%的期 刊中,这些期刊称为“核心期刊”,其中的文献代表了该学科的 最高水平、最新成果,具有权威性。
狭义的信息指文献资源或数据资源,包括各媒体中的片 段、文章、图书、情报、观念等。
特 点: 1.不同的事物所存在的状态和运动方式,就会表现出不同的信息;
2.信息不是实体,必须借助某种介质才能表现或传播。
二、知识(knowledge)
是人类在认识和改造客观世界实践中获得的对事物本质 的认识和经验的综合。
信息经过选择、综合、研究、分析等加工过程后可以成为
情报;
知识是系统化、理论化的信息。
五、文献与信息素养
信息素养(Information literacy)指具有检索、分析、 评价和利用各种信息源以解决信息需求及制定明智决 策的能力,是对个人信息行为能力、独立学习能力以 及批判性思维能力等概括性描述。
分散: 随着科学技术发展, 学科分支越来越细,专业文献分散。
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科
5、新陈代谢频繁,文献老化加快
信息检索ppt课件

及时获取有价值的信息。
06
信息检索的未来发展
语义网与信息检索
语义网技术的成熟发展为信息检索提供了新的机会和挑战。
语义网通过使用本体、词汇表和规则等,使信息具有明确的含义和上下文,从而提 高了信息检索的准确性和效率。
基于本体的信息检索利用语义网中的本体模型,能够实现更精确、更快速的信息检 索,为搜索引擎、问答系统和推荐系统等应用提供了新的解决方案。
个性化推荐
通过分析用户的购物历史和浏览行 为,电子商务平台可以运用信息检 索技术为用户提供个性化的商品推 荐。
信息检索在数字图书馆中的应用
文本检索
数字图书馆使用信息检索 技术,允许用户通过关键 词或主题词检索相关的图 书和文献资料。
图像检索
数字图书馆中的图像资源 丰富,信息检索技术可以 帮助用户根据图像内容进 行检索,提高查找效率。
跨语言信息检索与多媒体信息检索
随着全球化的加速和互联网的普及,跨 语言信息检索和多媒体信息检索成为研
究的热点问题。
跨语言信息检索主要解决不同语言间 的语义鸿沟问题,通过语言翻译、对齐 等技术,实现跨语言的信息检索和问答
。
多媒体信息检索主要针对图像、视频、 音频等多媒体数据进行信息检索和分析 ,通过使用图像识别、视频分析和音频 识别等技术,提高多媒体信息检索的准
确性和效率。
THANKS FOR WATCHING
感谢您的观看
01
02
03
04
文本处理技术
包括分词、词性标注、句法分 析、文本聚类等。
索引技术
包括倒排索引、B树索引、位 图索引等。
查询处理技术
包括查询扩展、查询优化、查 询执行等。
结果展示技术
包括排序算法、摘要生成、结 果反馈等。
06
信息检索的未来发展
语义网与信息检索
语义网技术的成熟发展为信息检索提供了新的机会和挑战。
语义网通过使用本体、词汇表和规则等,使信息具有明确的含义和上下文,从而提 高了信息检索的准确性和效率。
基于本体的信息检索利用语义网中的本体模型,能够实现更精确、更快速的信息检 索,为搜索引擎、问答系统和推荐系统等应用提供了新的解决方案。
个性化推荐
通过分析用户的购物历史和浏览行 为,电子商务平台可以运用信息检 索技术为用户提供个性化的商品推 荐。
信息检索在数字图书馆中的应用
文本检索
数字图书馆使用信息检索 技术,允许用户通过关键 词或主题词检索相关的图 书和文献资料。
图像检索
数字图书馆中的图像资源 丰富,信息检索技术可以 帮助用户根据图像内容进 行检索,提高查找效率。
跨语言信息检索与多媒体信息检索
随着全球化的加速和互联网的普及,跨 语言信息检索和多媒体信息检索成为研
究的热点问题。
跨语言信息检索主要解决不同语言间 的语义鸿沟问题,通过语言翻译、对齐 等技术,实现跨语言的信息检索和问答
。
多媒体信息检索主要针对图像、视频、 音频等多媒体数据进行信息检索和分析 ,通过使用图像识别、视频分析和音频 识别等技术,提高多媒体信息检索的准
确性和效率。
THANKS FOR WATCHING
感谢您的观看
01
02
03
04
文本处理技术
包括分词、词性标注、句法分 析、文本聚类等。
索引技术
包括倒排索引、B树索引、位 图索引等。
查询处理技术
包括查询扩展、查询优化、查 询执行等。
结果展示技术
包括排序算法、摘要生成、结 果反馈等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的检索工具,如书刊或数据库,从大量的文献 资料中找到所需文献的过程。 包括,书目检索、题录或索引检索、文摘检索、 全文检索。
2
二、检索原理与检索语言
1 、检索原理
是指通过一定的方法和手段,使信息存 储与检索两个过程所采用的特征和标识 达到一致,以便有效地获取和利用文献。 存储过程--对文献进行标引 检索过程--根据需求,确定提问式
3
2 、检索语言(检索标识,Retrieval Language)
检索语言是一种在文献存储和检索过 程中共同使用的语言。它的用途是描述文 献特征,表达情报提问,并使两者能相互 沟通。 可分为规范化语言(受控语言)和非规范 化语言(自然语言)。
4
规范化语言:是指对文献检索用语的概念加以人 工控制和规范,把检索语言中各种同义词、多 义词、近义词、同形异义词等进行规范化处理, 使每个检索词只能表达一个概念。
一、信息检索(Information Retrieval )
包括两个部分:
一是信息存储,即把大量分散的无序的信息
集中起来,经过加工,使之有序化、系统 化,成为有功能的检索工具或检索系统。
二是信息检索,利用已组织好的检索工具或
检索系统,按照课题的要求将所需信息查 找出来。
1
信息检索类型,分为:
数据检索(Data Retrieval)--特定的数据 事实检索(Fact Retrieval)--特定的事实 文献检索(Document Retrieval)--特定的文献 是根据课题的要求,采用科学的方法,利用专门
15
按职能划分目录种类: 出版发行目录 馆藏目录:按检索标目划分为
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )
联合目录 资料来源目录,如IM、CA、BA
如:drug near abuse检索出的是同一句话中
同时出现这两个词的记录。(也可说成是两个 词之间没有句号的文献)。
11
邻近度算符Near# 其中“#”代表一个常数,检索式“A near# B”
表示检索词A和检索词B之间有0~#个单词的文献 (A和B在同一记录、同一字段里)。在near后加 一个数字,指定两个词的邻近程度,且不论语 序。
如:information near2 retrieval表示检索词
information和retrieval同时出现在一个句子中, 且这两个检索词之间的单词数不超过两个的那些 文献为命中文献。
12
四、文献检索工具的含义和类型
1 、检索工具的定义与特点
定义:检索工具(Retrieval Device)是指用 于报道、存储和查找文献的工具。它具有 存储(编制过程)和检索(查找过程)两 大职能。
词B不仅要同时出现在一条记录中,还要同时 出现在一个字段里的文献才是命中文献.
如:“drug with abuse”检索出的是同一个
字段中同时出现这两个词的记录。
10
邻近度算符Near
检索式“A near B”表示检索词A和检索 词B不仅要同时出现在一条记录的同一字段里, 还必须在同一个子字段(一句话)里的文献才 是命中文献。
例:《IM》的Subject Index;《CA》的CS、 GS;《中目》的分类目次
非规范化语言:它对检索用语中的各种同义词、 多义词、近义词、同形异义词等不加处理,所 以也叫自然语言,如关键词。
例:《CA》Keyword Index
5
文献特征 文献标识
目录或索引
---------------------------------------------------------------------------------------------------
6
逻辑“非” NOT/检索式“A not B”表示包含检索词A同时不
包含检索词B的文献为命中文献。 如:查“动物的乙肝病毒(不要人的)”的文献
的检索式为hepatitis B virus(乙肝病毒) not human(人类)。
A NOT B
9
邻近度算符 With 检索式“A with B”表示检索词A和检索
分类索引(Classified Index) 主题索引(Subject Index) 关键词索引(Keyword Index)
分类主题索引(Classified and Subject Index)
言
其它专用索引 分子式索引,环系索引等
(Formula Index),(Index of Ring system)
17
文摘(Abstract,Excerpta,Digest)
含义: 文摘是指对文献内容选择重要部分以简练的形
式作为摘要,并按一定的原则和方法编排而 成的一种检索工具。 著录内容: 同⑵ + 文摘。 如,中国医学文摘,中国药学文摘, 中国生物学 文 摘,CA,BA,CBM,CMCC,MEDLINE/PubMed 等。
特点:(1)收摘一次文献、(2)著录文献特征、 (3)提供多种检索手段
13
2 检索工具的类型
*按摘录方式划分如下:
目录 题录或索引 文摘 全文
14
目录(Catalogue)
完
整出版物(如一本书或一种刊或一个会议录 的名称)作为著录的基本单位来报道和记录 文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。
16
题录(Title)或索引(Index)
概念:
其一,是指检索工具,它揭示文献的外表特征和内容特 征,即著录文献是以一个完整出版物的某一部分(如 书的章节或刊中一篇论文题目)为著录单位。
其二,是指检索途径(附录式索引),如,分类索引、 主题索引、生物体索引、著者索引等。
著录内容:
论文题目、著者、文献出处(刊名、发表年月、卷、期、 页码)及文种等。如,《中目》、《IM》、《CNKI》 免费题录等。
检 外部特征 文献名称 文献名称索引(Title Index)引用期刊一览表等
著者名称 著者索引(Author Index)著者、专利权人索引
文献序号 序号索引(Number Index)专利号、报告号等
索
引用文献 引文索引(Citation Index)SCI
内部特征 分类号
主题词
语
关键词
分类主题
2
二、检索原理与检索语言
1 、检索原理
是指通过一定的方法和手段,使信息存 储与检索两个过程所采用的特征和标识 达到一致,以便有效地获取和利用文献。 存储过程--对文献进行标引 检索过程--根据需求,确定提问式
3
2 、检索语言(检索标识,Retrieval Language)
检索语言是一种在文献存储和检索过 程中共同使用的语言。它的用途是描述文 献特征,表达情报提问,并使两者能相互 沟通。 可分为规范化语言(受控语言)和非规范 化语言(自然语言)。
4
规范化语言:是指对文献检索用语的概念加以人 工控制和规范,把检索语言中各种同义词、多 义词、近义词、同形异义词等进行规范化处理, 使每个检索词只能表达一个概念。
一、信息检索(Information Retrieval )
包括两个部分:
一是信息存储,即把大量分散的无序的信息
集中起来,经过加工,使之有序化、系统 化,成为有功能的检索工具或检索系统。
二是信息检索,利用已组织好的检索工具或
检索系统,按照课题的要求将所需信息查 找出来。
1
信息检索类型,分为:
数据检索(Data Retrieval)--特定的数据 事实检索(Fact Retrieval)--特定的事实 文献检索(Document Retrieval)--特定的文献 是根据课题的要求,采用科学的方法,利用专门
15
按职能划分目录种类: 出版发行目录 馆藏目录:按检索标目划分为
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )
联合目录 资料来源目录,如IM、CA、BA
如:drug near abuse检索出的是同一句话中
同时出现这两个词的记录。(也可说成是两个 词之间没有句号的文献)。
11
邻近度算符Near# 其中“#”代表一个常数,检索式“A near# B”
表示检索词A和检索词B之间有0~#个单词的文献 (A和B在同一记录、同一字段里)。在near后加 一个数字,指定两个词的邻近程度,且不论语 序。
如:information near2 retrieval表示检索词
information和retrieval同时出现在一个句子中, 且这两个检索词之间的单词数不超过两个的那些 文献为命中文献。
12
四、文献检索工具的含义和类型
1 、检索工具的定义与特点
定义:检索工具(Retrieval Device)是指用 于报道、存储和查找文献的工具。它具有 存储(编制过程)和检索(查找过程)两 大职能。
词B不仅要同时出现在一条记录中,还要同时 出现在一个字段里的文献才是命中文献.
如:“drug with abuse”检索出的是同一个
字段中同时出现这两个词的记录。
10
邻近度算符Near
检索式“A near B”表示检索词A和检索 词B不仅要同时出现在一条记录的同一字段里, 还必须在同一个子字段(一句话)里的文献才 是命中文献。
例:《IM》的Subject Index;《CA》的CS、 GS;《中目》的分类目次
非规范化语言:它对检索用语中的各种同义词、 多义词、近义词、同形异义词等不加处理,所 以也叫自然语言,如关键词。
例:《CA》Keyword Index
5
文献特征 文献标识
目录或索引
---------------------------------------------------------------------------------------------------
6
逻辑“非” NOT/检索式“A not B”表示包含检索词A同时不
包含检索词B的文献为命中文献。 如:查“动物的乙肝病毒(不要人的)”的文献
的检索式为hepatitis B virus(乙肝病毒) not human(人类)。
A NOT B
9
邻近度算符 With 检索式“A with B”表示检索词A和检索
分类索引(Classified Index) 主题索引(Subject Index) 关键词索引(Keyword Index)
分类主题索引(Classified and Subject Index)
言
其它专用索引 分子式索引,环系索引等
(Formula Index),(Index of Ring system)
17
文摘(Abstract,Excerpta,Digest)
含义: 文摘是指对文献内容选择重要部分以简练的形
式作为摘要,并按一定的原则和方法编排而 成的一种检索工具。 著录内容: 同⑵ + 文摘。 如,中国医学文摘,中国药学文摘, 中国生物学 文 摘,CA,BA,CBM,CMCC,MEDLINE/PubMed 等。
特点:(1)收摘一次文献、(2)著录文献特征、 (3)提供多种检索手段
13
2 检索工具的类型
*按摘录方式划分如下:
目录 题录或索引 文摘 全文
14
目录(Catalogue)
完
整出版物(如一本书或一种刊或一个会议录 的名称)作为著录的基本单位来报道和记录 文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。
16
题录(Title)或索引(Index)
概念:
其一,是指检索工具,它揭示文献的外表特征和内容特 征,即著录文献是以一个完整出版物的某一部分(如 书的章节或刊中一篇论文题目)为著录单位。
其二,是指检索途径(附录式索引),如,分类索引、 主题索引、生物体索引、著者索引等。
著录内容:
论文题目、著者、文献出处(刊名、发表年月、卷、期、 页码)及文种等。如,《中目》、《IM》、《CNKI》 免费题录等。
检 外部特征 文献名称 文献名称索引(Title Index)引用期刊一览表等
著者名称 著者索引(Author Index)著者、专利权人索引
文献序号 序号索引(Number Index)专利号、报告号等
索
引用文献 引文索引(Citation Index)SCI
内部特征 分类号
主题词
语
关键词
分类主题