信息检索基础知识研究生
信息查询基础知识

分解为:
I 文学 I7 美洲文学 I712 美国文学 I712.45 美国文学长篇、中篇 小说
2.2 信息检索
(第二章2.2、2.3、2.4、2.5小节)
2.2.1 信息检索的基本概念
产品资料 科技报告 档案
课堂交互讨论:我们是否需要了解多种文献 信息源类型呢?
一、了解一种就可以了; 二、了解几种常用的和常见的就可以了; 三、各种类型都需要了解;
分别阐述你选择的原因。
2.1.3信息源的外表特征和内容特征
(1)外表特征由构成文献信息源的载体、符号系统 和记录方式三要素中提取出的特征构成。
档案文献(Archives,Technical Records)国家机 构、社会组织以及个人从事社会各种活动所形成的 具有保存价值的各种文字、图表、声像等不同形式 的历史记录,具有保密性。
产品资料(Product Literature) 是国内外生产厂 商或经销商为推销产品而印发的企业出版物,直观 性强、数据详实。
性强。
一 指作者以 论文、译文、 知 新颖性、创 时效性没有 次 本人的研 专著、报纸、 识 造性、具体、 零次文献强 文 究成果为 报告、产品样 首 详尽和系统 献 基本素材 本、学位论文、次
而创作的 专利文献、标 固 原始文献 准文献、档案 化
等
文献 定义 类型
表现形式
特征
二 对一次文献 目录、题录、索 检索
重点与难点:
重点:文献信息源的分类; 文献信息源的外部特征与内部特征; 一次文献、二次文献和三次文献; 布尔逻辑检索技术;截词检索技术;字段检索技术; 信息查询的基本流程。
第二章 文献信息检索基本知识(2).概要

(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?
?
? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法
《信息检索》实验报告1111

《信息检索》实验报告一、OPAC检索1.利用“中图分类法”查找自己所在专业的分类号,并记录。
再使用书目查询系统查找该分类下的一本图书,写出该书的书名、作者、出版社、出版年、索书号、馆藏复本数、ISBN号、馆藏地(写一个即可)。
TU新农村景观设计艺术顾小玲东南大学出版社2011年索引号:TU982/14 2本ISBN号:2011002852 馆藏地:样本二库[4楼西,借期20天]2.查找作者姓“李”、索书号为“H31”的图书,记录下检索的结果数量,再在结果中检索由中山大学出版社出版的图书,记录下检索结果的数量,并写下任一检索结果的作者、书名、出版社、索书号、馆藏复本数、可借复本数。
1337 7疯狂英语.听力高级飞跃李俊青中山大学出版社H319.9/1322:3馆藏复本:24 可借复本:223.分类号是“TP311.1”的是关于哪方面内容的图书?写出此类书其中一种图书的书名、作者、出版社和索书号。
程序设计、软件工程中文版Access 2007数据库应用实用教程冯先锋秦小英清华大学出版社TP311.13/13024.自行熟悉OPAC中“我的图书馆”各项功能,并写出已借阅图书数量和今年所借阅的两本书的书名,如果可能请进行续借。
7 小高层住宅设计图集新型住宅平面设计方案二、电子图书检索1.利用“读秀学术搜索”打开并阅读书名包含“竞争情报”,作者为“王知津”的图书,写出该书的书名、出版社、出版日期,并从书中查阅竞争情报的概念。
书名:《竞争情报》出版社:科学技术文献出版社出版日期:2005.02竞争情报的概念:为达到竞争目标,合法而合乎职业伦理的搜集竞争对手和竞争环境的信息,并转变为情报的连续的系统化过程。
2.利用“读秀学术搜索”检索二本有关美国前总统的图书,写出图书的书名、著者、出版社。
书名:《改变世界历史的七天美国前总统尼克松1972年七天访华揭秘》作者:梁建增,赵微主编出版社:高等教育出版社书名:冷战后的美国外交政策从老布什到小布什作者:潘锐出版社:时事出版社3.利用“读秀学术搜索”找出与自己专业相关的图书,写出其中2本图书的书名、作者和出版社。
信息检索基本知识

T
TB TG TH TE …… TU TV
TB1
TB2
TB3
TB4
…… TB48 …… TB488
……
TB482
TB489
T—工业技术类中图法举例
以T-工业技术大类下的TP类展开下位类如下: T 工业技术 TP 自动化技术、计算机技术 TP3 计算技术、计算机技术 TP39 计算机应用 TP393 计算机网络 TP393.0 一般性问题 TP393.01 计算机网络理论 TP393.02 计算机网络结构与设计
二、文献信息源类型
文献可按不同的方法分类描述,比较常见 的分类方法有如下三种: 按信息的载体形式划分(印刷、胶片、 电子文献等); 按信息加工的级别划分(四次文献); 按信息的发布形式划分(十大文献信 息源等)
1、按文献的载体形式划分
• 印刷型(Printed form):以纸张为载体 • 缩微型(Microform):以感光材料为载体:胶片 • 声像型(Audio-Visual form):以声像记录材料为 载体:磁带 • 电子型(Machine Readable form):以计算机信息 存储设备为载体 :软磁盘、光盘、硬盘等
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
• 国际十进分类法(UDC: UDC(Universal Decimal Classification)
又称为通用十进制分类法。是世界上规模最大、用户 最多、影响最广泛的一部文献资料分类法。原由比利 时人P.-M.-G.奥特莱和H.-M.拉封丹在《杜威十进分类 法》第6版的基础上编成。近百年来,UDC已被世界 上几十个国家的10多万个图书馆和情报机构采用。 UDC目前已成为名符其实的国际通用文献分类法。
大连理工大学研究生信息检索第一章 文献基础知识

(4)学位论文
是高等院校和研究机构的学生为获得学位资格(博士、硕士 和学士)而撰写的学术性较强的研究论文。其中硕、博士学位论 文具有较高的学术价值。
大连理工大学图书馆 《信息检索》研究生课程教学组
1.1 文献类型
1.1.1 按出版形式划分 1.1.2 按文献加工深度划分
特点:
学位论文理论性、系统性较强,阐述详细;参考文献多、全 面,有助于对相关文献进行追踪检索。
具有较强的科技情报价值。各国的《专利法》明确规定:申
请专利的发明创造必须具备工业实用性。因此,专利文献比 一般的科技文献更具有实用性。
适用于:
a. 了解某领域的技术水平及发展的最新动态; b. 开发新产品、投入新项目时,寻找技术方案。
大连理工大学图书馆 《信息检索》研究生课程教学组
1.1 文献类型
1.1.2 按文献加工深度划分
大连理工大学图书馆 《信息检索》研究生课程教学组
图书 …… 标准文献 期刊
按出版形式 划分
专利文献
会议文献
科技报告
学位论文 零次文献
三次文献
按文献加工 深度划分
二次文献
一次文献
大连理工大学图书馆 《信息检索》研究生课程教学组
1.1 文献类型
1.1.1 按出版形式划分 1.1.2 按文献加工深度划分
现在文献的封面或扉页,不打开书本或不看文献的具体内容
就可以确定一篇文献。
大连理工大学图书馆 《信息检索》研究生课程教学组
1.2 文献信息组织
1.2.1 基于外部特征的组织方法 1.2.2 基于内容特征的组织方法
(1)馆藏目录
馆藏目录主要就是对文献外表特征的揭示,用户可以通过OPAC 检索系统进行馆藏文献的查询。用户进入书目检索界面后,可以从题 名、责任者、主题词、ISBN/ISSN号、分类号、索书号、出版社等途 径进行书目查询。
1-1信息检索基础知识

小 结
上述的十类主要文献中,除图书和期刊外,其 余八种被称为特种文献—非书非刊出版物,非大 量公开发行需特殊渠道获取,其使用价值往往大 于常规信息。
1.2 信息检索
1.2.1 信息检索概念 广义概念:将信息按一定的方式组织和存储起 来,并根据信息用户的需要找出有关的信息过 程,故全称:“信息的存储与检索”。 狭义概念:仅指上述过程的后半部分,即从信 息集合中找出所需要的信息的过程,相当于人 们通常所说的信息查寻(Information Search)。
标准文献(促进社会产品质量的三次文献) 1、标准:是对工农业和工程建设的质量、规格、基本单 位及其检验方法等方面由有权威部门批准的技术规定。 反映的技术工艺水平及技术政策,是从事生产建设和管 理的一种共同规范或依据。
2、 分为:国际标准( ISO ) 、国家标准(GB) 、
行业标准、企业标准 3 、进入各大标准制定机构网站进行检索
相关信息检索工作(职业)
• 1--技术部门(资料员)
• 2—业务部门(咨询员) • 3—专利代理
• 4—查新员
• 5 —市场开拓、商业情报 • 6—其他一切经常需要获取信息„„
参考教材:
1、网络信息检索与利用,隋莉萍等,清华大学出版社,2008.9 2、网络信息检索:工具方法 实践,沈固朝, 高等教育出版社, 2004.8 3、信息检索与利用教程,彭奇志,中国轻工业出版社, 2002.2 4、石油科技文献检索,谢昆、郭林根等,石油工业出版社,1999.12
• 重点要求
• 了解图书馆现有电子资源(各数据库收录内容)
• INTERNET基本知识 • Ei Compendex、Web of science (SCI)、ISTP、 Elsevier 、PQDD、UMI、中国学术期刊网、万方数 据库、dialog等文献数据库的收录内容及检索方法。
考试信息检索

补充教材1考试信息检索在知识经济时代,学习已经成为人们日常活动中不可分割的一部分,终生学习是21世纪的生存概念。
随着网络的迅猛发展,工作、生活、学习已经离不开网络,有了网络,我们可以享受“网上掉馅饼”的生活,不但可以从网上获取各种免费的学术信息,而且可以享受最优秀的教育信息资源。
这里列举与推荐关于四六级考试、研究生考试、公务员考试和出国留学方面信息,希望能为大家学习、考试提供参考。
归纳一下,考试信息的获取途径大致包括以下几类。
1.直接进入相关网站在浏览器地址栏里直接输入网址或者域名进行检索。
利用这种检索方法的前提是检索者必须通过一定的已知途径,如别人告知、有关Internet资源指南的书籍等获取具体的网站地址。
2.利用搜索引擎查找这里要强调的是考试专题搜索引擎的使用,如要查找网上的考试信息,可利用中国教育搜索( www. edusoso. com),该专题网站不但提供丰富的教育考试资源网址导航,而且可按新闻、网站、学校、课程、专业和培训机构进行关键词检索;搜学网( ),也是著名的教育类搜索网站,依托强大的搜索引擎在第一时间获取最新、最前沿的教育动态、院校资讯等权威的教育信息。
3.查看门户网站门户网站包括教育门户网站和综合门户网站的教育频道。
要想较全面地了解网上考试信息资源的分布情况,门户网站不可忽略。
许多门户网站都设有考试栏目,如中国教育在线(www. )、新浪网教育频道(http: //edu. sina. com. cn)、中青在线教育频道(http://edu. cyol. com)、人民网教育频道(http: //edu. )、新华网教育频道( /edu)等。
4.留意考试网站内的友情链接友情链接,即分别在自己的网站上放置对方网站的LOGO或网站名称,并设置对方网站的超级链接,使得用户可以点击与该网站主题或者内容相关的资源链接。
通过链接,扩大了用户的检索范围。
四六级考试信息检索在众多考试项目当中,英语四六级考试的普及面最广,几乎所有在校大学生都要参加这项考试。
信息检索 第二讲 信息检索概述

通过分析信息存储和检索的全过程可以看出检索语言
大致有以下四个主要的功能:
对文献的情报信息内容及其外表特征加以规范化的标引;
对内容相同及相关的文献信息加以集中或揭示其相关性;
可使文献信息的存储集中化、系统化、组织化,便于检
索者按一定的排列秩序进行有序化检索;
便于将标引用语和检索用语进行相符性比较。
科性质进行分类和系统排列 。
特点:能集中体现学科的系统性,反映事物的
从属、源生关系,便于按学科门类进行族姓检
索。
(1)分类语言
按照分类方式的不同:
混合分类语言 体系分类语言 分类语言
体系分类法是基于概念
的划分和概括,以学科 分类为基础,把概括文
献内容与事物的各种类
目组成一层层隶属、详 细列举的等级结构体系。
文献检索
事实检索
数据检索
7
3.信息检索的类型
文献检索。以文献或其索引、文摘为检索对象, 目的是核实已知文献的不确切项目,如著者名、 年代、出处等,或查检某课题原始文献的线索 及它们的具有收藏情况。
文献检索是相关性检索,不直接回答用户所提 技术问题本身,只提供有关的文献供参考。
举例: “关于自动控制系统有些什么参考文献”
CALIS公共目录检索系统检索界面
读秀知识库检索界面
三、信息检索语言
1.检索语言的概念
2.信息检索语言的功能与作用
3.信息检索语言的类型
1.信息检索语言的概念
信息检索语言是一种专门的人工语言,又 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索者表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
字段标识符 中文释义
AB
文摘/摘要
AD
著者单位/地址
AU
著者/作者
SO
来源/出处
TI
篇名/题名/标题
LA
语种
23
题录的构成
Author Title
Source
题录(citation )
24
题录的格式
❖ 作者、篇名、出处(刊名、年、卷、期、页码) ❖ 格式:作者. 篇名. 刊名,年,卷(期):起止页码
3
Chapter 2 Information Retrieval Theoretical Knowledge
基础概念
信息检索:是指通过一定的方法,从任一信息 集合中查出特定信息的过程。
检索手段:手工检索 计算机检索 检索对象:文献、事实、数值数据等
4
手检VS机检(馆藏书目)
手工检索
计算机检索5手检VS机 Nhomakorabea(文献检索-手检)
检索工具书 检索工具书
6
手检VS机检(文献检索-机检)
7
Chapter 2 Information Retrieval Theoretical Knowledge
Section Ⅰ Database knowledge
8
Section Ⅰ Database knowledge
是指一定专业范围内的信息记录及其索引的 集合体。是计算机信息检索系统的重要组成部分。
是信息资源,是检索的对象
9
一次文献
10
二次文献
11
001 微量元素与老年人肺心病关系的探讨
王书钧; 汤兵祥信; 息杜鹃记; 录王国琳
河南医科大学第一附属医院
中华老年医学杂志 1993;12(4):247
肺心病; 痕量元素
002 慢阻肺的新进展与临床
黄桂平
江西省大吉山钨矿医院
医学综述 2000;6(4):164-165
肺疾病, 阻塞性; 慢性病
003 超声乳化白内障摘除术
施玉英
北京同仁医院
中国医刊 2001;36(7):11-13
超声乳化白内障吸除术
…………
12
杜黄鹃桂平索引000012
施玉英 003 汤兵祥 001 王国琳 001 王书钧 001
超声乳化白内障吸除术 003
肺疾病,阻塞性
002
肺心病
001
痕量元素
001 微量元素与老年人肺心病关系的探讨
王河主书南钧 医文;科汤大档兵学祥第与; 一杜索附鹃属; 引王医国院文琳 档图 释 中华老年医学杂志 1993;12(4):247
肺心病; 痕量元素 002 慢阻肺的新进展与临床
黄桂平 江西省大吉山钨矿医院 医学综述 2000;6(4):164-165 肺疾病, 阻塞性; 慢性病 003 超声乳化白内障摘除术 施玉英 北京同仁医院 中国医刊 2001;36(7):11-13 超声乳化白内障吸除术 22
001
慢性病
002
医学综述
002
中国医刊
003
中华老年医学杂志 001
Section Ⅰ Database knowledge
一、数据库的类型(Database Type) 按检索对象划分
1.文献数据库(literature Database) 又分为书目数据库、全文数据库
2.数值数据库(numeric database) 3.事实数据库(fact database) 4.多媒体数据库(multimedia database)
13
Section Ⅰ Database knowledge
二、数据库的结构
1. 记录(Record) 是构成数据库的一个完整的基本 信息单元,每条记录描述了一原始信息的外部特征和内容 特征。
2. 字段(Field) 是比记录更小的信息单元,是组成记 录的数据项目。
3. 文档(File)两重含义 4. 索引(Index) 为便于检索而建的倒排文档
▪ 例如:姜春林,刘则渊,梁水霞. H指数和G指数——期刊 学术影响力评价的新指标[J].图书情报工作,2006, 50(12):63-65 .
▪ Chler MW, Binder M, Friess H, et al. Potential role of somatostatin and octreotide in the management of acute pancreatitis. Digestion, 1994, 55:16-19.
数据库 文档 记录 字段
14
CBM记录样例
15
MEDLINE记录样例
16
专利数据库记录样例
17
科技名人数据库记录样例
18
SERLINE记录样例
19
文档的两重含义
⑴数据库中部分记录的集合
20
文档的两重含义
⑵指数据库的结构
分为 顺排文档(又称主文档) 倒排文档(又称索引文档)
21
主文档(顺排文档)
医学信息检索
Medical Information Retrieval
河北联合大学 医学信息检索教研室
可编辑版
1
Chapter 2 Information Retrieval Theoretical Knowledge
第二章 信息检索基础知识
主讲教师:谈伟文
图书馆信息咨询部 电话3725914/6576
25
Chapter 2 Information Retrieval Theoretical Knowledge
Section Ⅱ Computerized Retrieval Language
26
Section Ⅱ Computerized Retrieval Language
❖检索语言(Retrieval language) 是根据文献信息存储与检索的需要而创造 的人工语言。 又称标引语言或索引语言。
索引文档(倒排文档)
杜鹃 001 黄桂平 002 施玉英 003 汤兵祥 001 王国琳 001 王书钧 001
超声乳化白内障吸除术 003
肺疾病,阻塞性
002
肺心病
001
痕量元素
001
慢性病
002
…………
Remember the commonly used fields
字段名称 Abstract Affiliation Author
2
Chapter 2 Information Retrieval Theoretical Knowledge
Ⅰ Database Knowledge Ⅱ Computerized Retrieval Language Ⅲ Computerized Retrieval Techniques Ⅳ Approach, steps and effectiveness evaluation