信息检索第5讲-2-中文文献资源检索利用
信息检索

中文书本式的检索工具
《国内总书目》--《全国新书目》《科技新 书目》:查找国内出版的图书目录 《外文新书通报》:查找国外新书目录 《全国报刊索引》:查找国内期刊论文的工 具 科技 文献书目型数据库检索系统 事实型数据库检索系统 数值型数据库检索系统 全文数据库检索系统
“逻辑或”的组配种类
同义词 同一个人多个姓名 通用的英文缩写 化学物名称 Eg:CAD
逻辑非
用于排除含有不需要概念的信息,可缩小所 检索信息的范围。 逻辑运算符:“NOT”、“-” 逻辑表达式:“A NOT B ”“A-B” 语义表示:被检索文献中含有A而不含有B
4字段(限制)检索
在检索系统中,数据库设置的可供检索的字 段通常有两种: 表达文献主体内容特征的基本字段 表达文献外部特征的辅助字段 基本字段包括篇目(TI)、文摘 (AB)…… 辅助字段包括作者(AU)、语种 (LA)……
4字段(限制)检索
为了缩小检索范围,可利用字段代码来限制检索词 出现的字段,以提高检索速度和命中率。 如: economic models in ti(表示只在题 目字段中查找文献) economic models in de(只在主题词中 查找) economic models in ab(只在文摘中查 找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献)
位置算符检索即运用位置算符表示两个检索 词间的位置。 如果说布尔逻辑算符是表示两个概念之间的 逻辑关系的话,位置算符表示的是两个概念 在信息中实际物理位置关系。
检索时会经常遇到这样的问题?
如何检索文献

如何检索文献现在国际上有很多的文献检索网站,其中有国内和国外的网站,使用方便;本站就介绍以下几个文献题录的检索方法:1.通过研究论文或者书籍的后面所附的参考文献中获得。
2.通过网站或者光盘数据库检索获得;在各大高校以及科学院均有可以免费检索的题录数据库,以下推荐几个好的文件检索网站:1.中国文件管理中心,在这里可以免费检索到文献题录(进入);2.ScienceDirect,被认为是世界上水平最高的全文数据库提供商,它总共收集了1200多种从1995年以来的期刊全文和从更多的题录,实时更新,可免费检索题录。
3.OCLC,计算机联网图书馆中心,收录了4000多种期刊的题录和全文。
3.通过图书馆的文件检索工具获得(比如著名的Chemical Abstracts)。
如何利用互连网搜索文献?现代网络技术的发展,使得人们可以更为便捷地获取信息资源。
在文献搜集过程中,充分利用网络资源,常常可以事半功倍。
利用网络搜集资源大致有两种:一是处于选题阶段,还没有论文方向,想找等,阅读一些文一个合适的方向来做,此时可以在网上搜索“review”“survey”献综述,在其中寻找自己感兴趣的方向;另一种是已经确定了大致方向,希望了解本研究领域的进展,此时应当请教这一领域的专家,搞清楚哪些人是这一领域的牛人,搜索他们的文章——国外的传统,很多杂志要介绍某个领域的成就和进展,都会邀请牛人来写综述——只有知道哪些人是这一领域的杰出代表,才可能从这些人的著作中体验这一领域激动人心的发展。
网络搜索技巧我也谈一下:首先,肯定是一个很好的图书馆,它是全世界最大的搜索引擎,并且可以支持中文、英文搜索。
如果你已经知道一篇文章的名字,不妨把名字输进去看看——这里多说一句,因为国外的论文全文,比如可以这通常都是pdf格式的,所以不妨在输入的论文名字前加个“[pdf]”样“[PDF]+A Survey of Corporate Governance”作为关键词搜索,这样就有助于限制你搜索的是pdf格式的论文全文,你可以很方便地搜索到公司治理研究四人帮LLSV(1997)的《公司治理的一个综述》全文。
信息检索课程内容

课程内容信息检索课,过去也被称为文献检索课,是高校学生学习信息知识、掌握检索技能、提高信息素质的基础课,是由原国家教委统一命名并三次下文要求高等院校开设的一门科学方法课。
教学内容包括基本理论、信息检索、信息利用三大部分。
示例:蔡元培的思想研究(除政治思想以外)提问式:(蔡元培*思想)-政治思想示例:查找中学语法(不包括高中部分)教案。
提问式:中学语法–高中2 截词检索截词检索是利用检索词的词干或不完整形式进行检索,以检索出一组概念相关或同一词根的词。
截词检索TI=信息检索作者=马建华or赵慧君鲁迅/ AU微格教学*双语教学/ AB 后截断:前方一致前截断:后方一致中间截断:两端一致前后截断:中间一致3 字段检索字段检索是指定检索词出现的字段,被指定的字段也称检索入口、检索途径,系统只对指定字段进行匹配运算。
4 位置检索位置检索是运用位置算符表示两个检索词间的位置邻近关系,又叫邻近检索。
4 位置检索with算符:(W)或( ),表示两个词在命中结果中相邻(可有空格、标点和连字符),词序不得颠倒。
例:“input(w)output”“input output”、“input-output”(nW),表示两个词之间最多可夹入n个词,词序不得颠倒。
例:“laser(1w)printer”“laser printer”、“laser color printer”near算符:(N) ,表示两个词在命中结果中相邻,词序可颠倒。
例:“computer(N)network”“computer network”、“network computer”(nN),表示两个词之间最多可夹入n个词,词序可颠倒。
例:“computer(2N)system”“computer system”、“computer code system”、“system using modern computer”field算符:两个检索词必须同时出现在记录的同一个字段中,次序不限。
第二章-网络信息资源的检索与利用 第二,三节

A.互联网上的国内期刊信息
• 查找国内期刊,可以从以下站点入手: • 一、中国期刊网: • 二、维普科技期刊网: 或 / • 三、万方数据资源系统的数字化期刊: /qikan/ind ex.jsp • 四、学科导航信息
●
图片搜索
二.常用网络信息资源的检索
• • • • • • • 1. 网络检索--- 图书 2. 网络检索----期刊 3. 网络检索----报纸 4. 网络检索----人物,机构 等信息 5. 网络检索----专利, 标准, 科技报告, 统计数据等信息
怎样查找互联网上的图书信息?
网络信息资源 检索﹠利 用
• 网络信息资源与常用中英文搜索引擎
• 常用网络信息资源的检索利用(学术) • 网络信息资源的检索策略与技巧
第二节
• 常用网络信息资源的检索利用(学术)
一.重要的学术搜索简介
二.常用网络信息资源的检索利用
一.重要的学术搜索简介
• 1. Google scholar(Google学术搜索 ) • 2. Scirus(科学搜索)是目前网上最全面、 综合性最强的科技文献搜索引擎之一 • 3.一些专业专题搜索引擎。
•
Directory of Open Access Journals
• DOAJ( Directory of Open Access Journals)由 由Lund University建立,它提供有质量控制的可 免费获取的网上电子期刊资源,它的目标是建成一 个无学科、无语言限制的综合性的科学期刊系统, 方便科研人员使用,并可提升期刊的显示度。 • 目前该网站已收集了482种期刊,并把这些期刊分 成了15个大类,53个小类,其中包括农业、生命科 学、化学、数学、物理、天文学、工程技术、环境 科学DOAJ( Directory of Open Access Journals 、社会科学等。
02+文献信息检索工具基础和网络信息资源检索与文献线索

含《社科新书目》、《科技新书目》、《读者新书目》三大子报,是各类图 书、多媒体制品最新出版信息总汇的商务传媒。
收录图书品种丰富,介绍详细,以新书为主,每月预告初、重版图书信息逾 5000种,年近6万种; 《新华书目报· 社科新书目》报道全国各出版社的社科类图书、多媒体制品 等最新出版信息。年收录图书信息3万余种。主要以社科、文学、财经、少 儿、文教、综合类图书为报道对象。 《新华书目报· 科技新书目》报道全国各出版社的科技类图书、多媒体制品 等最新出版信息。年收录图书信息3万余种。主要以自然科学、基础科学、 工程技术、医药、各级标准、生活科学等类图书为报道对象。
4
2.1.1 文献信息检索工具的概念、特点、分类与结构
2.文献信息检索工具的特点
一般检索工具必须具备四个基本条件: (1)必须详细记录文献的外部特征和内容特征; (2)必须具有既定的检索标识。如主题词、分类号、著者姓名和文献序号 等; (3)必须根据标识的顺序,系统地、科学地排列文献,使其成为一个有机 的整体; (4)能够提供多种检索途径。
献数等)等。 如《全国新书目》、《全国联合目录》、 《四库全书总目录》 等。
8
2.1.2 检索工具的常见类型介绍
9
2.1.2 检索工具的常见类型介绍
2.题录
按“题录”要求进行著录,按“篇” 报导文献信息、揭示单篇文献的外部 特征。
题录著录的项目主要包括篇名、著者(或含其所在单位)、来源出处(包括 出版物名称、卷(期)、页数、出版年等)等,无内容摘要。例如,《中国 社会科学文献题录》、《全国报刊索引》、美国的《化学题录》(Chemical Title)等。
7
2.1.2 检索工具的常见类型介绍
1.目录
按“题录”要求进行著录,按“本” 报导文献信息、揭示出版物的外部特 征。 目录的著录项目一般有:题名、著者/编者、文献出处(包括出版单位名称、 出版年等)、编号(科技报告号、专利号等)、描述性注释(原文文别,译
信息检索与分析第3-5章

4.查找数值、公式、规格、条例、专业知识
• 查考数值、公式、规格、条例、专业知识的数据库主要有: • 1)中国科学数据库(http:// /) 由中国科学院创建。内容涵盖了多种学科,提供了大量具有重要 科学价值和实用意义的科学数据和资料。 • 2)贝尔斯坦/盖墨林化学数据库Beilstein/Gemlin Cross Fire • 3)物质的物理化学参数数据库 (/CUU/Constants/index. html)。 • 4)化学元素周期表(/chemistry/webelements/) 查找此类信息的印刷本参考工具书宜采用手册、表册。手册也有叫 “指南”、“便览”、“须知”、“大全”;包括综合性《读者百科 词典》、《世界知识手册》等和专科性《农业技术实用手册》、《世 界经济手册》等。此外,还有表册,如《常用数学公式大全》、《电 子学数据表与公式手册》。
• • • • • • 1.分类查询 2.关键词查询 3.多次查找 4.按照地域查询 5.查询最新信息 6.其它搜索技巧
1.Google高级检索技巧
• 1)短语检索 • 2)字段限定检索 (1) 限定网站 【实例】输入“金庸 site:”搜索中文教育科研网站() 上所有包含“金庸”的页面。 (2) 限定网页 【实例】输入“inurl:midi 沧海一声笑”查找MIDI曲“沧海一声 笑”。
(3)使用字段限定
• ① intitle title是网页的标题, intitle: A指所有搜索结果的title中都要包含“关键词A”。 • ② site site是限定在某类站点或某个网站内搜索。 例如“论坛搜索引擎 site: ”,是在sowang这个网站内搜索 “论坛搜索引擎”的网页。 • ③ filetype filetype是限定文件类型。 用法是“关键词A filetype:文件格式后缀名”。 如“个人年终总结 filetype:doc”,搜索结果全都是word文件的个人年 终总结。 • ④ inurl url就是地址栏里的域名等。 inurl常见的使用方式是“关键词A inurl:英文字符B”。 例如“搜索引擎 inurl:ssyq ”,是检索在url中含有ssyq的网页中关于 “搜索引擎”的信息。
中文信息资源检索系统(qikan)
aishiyao
aishiyao
3、标准检索——掌握 标准检索 掌握
高级检索是一种比初级检索要复杂一些的检索方式。但也可以进行简单检 索。高级检索特有功能如下:多项双词逻辑组合检索、双词频控制。 多项双词逻辑组合检索: 多项双词逻辑组合检索 多项是指可选择多个检索项; 多项 双词是指一个检索项中可输入两个检索词(在两个输入框中输入),每个检 双词 索项中的两个词之间可进行五种组合:并且、或者、不包含、同句、同段, 每个检索项中的两个检索词可分别使用词频、最近词、扩展词; 逻辑是指每一检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合。 逻辑
中外期刊的检索与利用
期刊的利用 中文期刊的利用 ※ 中文期刊检索系统 ※ 外文期刊检索系统(略讲)
aishiyao
期刊的利用
期刊
概述: 期刊是目前使用最多的一种信息载体,全世界每年出版的 期刊约15万种,中国有各类期刊9000多种。年发行量超过 了30亿册。 期刊提供的信息量大约是整个情报源的65%--70%之间。 中文期刊信息检索 期刊出版信息的查检 期刊收藏信息的查询 电子期刊检索系统 外文期刊信息检索 外文期刊出版信息的查询 外文数字化期刊检索系统
aishiyao
标准检索实例 标准检索实例 要求检索2000年来西南交通大学发表的 有关“轨道 不平顺” 方面的期刊文章。操作步骤如图所示。
aishiyao
aishiyao
aishiyao
4、二次检索——掌握 、二次检索 掌握
在结果中检索又称为二次检索。 是在当前检索结果内进行的检索, 主要作用是进一步精选文献。当检索结果太多,想从中精选出一 部分时,可使用二次检索。 二次检索这一功能设在实施检索后的检索结果页面。
aishiyao
信息检索概念
(4)网络检索(Internet Retrieval)
1.2.1信息检索系统的概念
信息检索过程的实现要依靠特定的系统,这个系统就是信息检索系统。系统是由两个或两个以上既相互区别又互相影响的各种要素构成的统一整体,信息检索系统的构成包括六个要素:
(1)目标
联机检索系统也称国际联机检索系统,通常采用相对封闭的客户机/服务器模式,属于典型的主从式结构。如图1-3所示,联机检索系统通常由联机检索中心、通信设施、检索终端3个主要部分组成。
联机检索系统的特点是:
①检索范围广,数据库数量多,几乎涉及到各个学科领域,世界上公开出版发行文献的90%都可以通过几种主要的联机检索系统查到。
因此文档信息检索过程实际上涉及文档集的逻辑表示、用户查询表示、相似性匹配及其排序三个重要的处理。
信息检索模型主要从两个方面抽象地研究信息检索方法:一是确定在检索模型中如何表示构成检索系统的两个要素,即文档和检索式;二是确定在模型中如何定义和计算文档和检索式之间的关系。
检索模型的重要作用主要体现在以下几个方面:更精确地描述出文档与文档、文档与查询间的相关关系,使之能比较和计算;安排更合理、更便于检索的文档存储形式;在此基础上设计出合理的检索方
(5)方法
(6)人员
由此可见,信息检索系统由若干个相互作用的部分构成,各部分的功能互异,设计的目的也各不相同,但它们之间相互联系,共同实现系统的目标。狭义地讲,这个目标就是检索信息;广义地讲,则是提升用户的知识水平。通常认为,信息检索系统的任务是告知用户他所需要的信息在哪里。也就是说,信息检索系统并不告诉用户他所询问的主题(即不改变用户的知识结构),它只是告诉用户这一主题是否存在于数据库中,相关的文献都存在哪里。
《信息检索与利用》综合检索报告
《信息检索与利用》综合检索报告一、Internet信息检索1.据《通志·氏族略》载:在京兆、河间一带的王氏族人,据说是周文王的第十五个儿子毕公高的后代,因此这一支系乃是出自于姬姓;在北海(今山东境内)、陈留(今河南开封附近)一带的王姓则传说是帝舜的后代,这一支系出自于妫姓之王;不仅华夏族的王室之后不少是以王为姓,许多少数民族的部落首领、执政者的后代也有以王为姓的,其意与上述出自姬姓、妫姓、子姓的王氏大致相同。
王氏的众多分支中数来仍以源自周文王姬姓子孙的那一支名气最大。
这一支王姓源自原来的周朝,也即今天的甘肃、陕西西安一带,其后来的主要分封之地在今山东省境。
根据考证,晋朝中兴名臣王导就是这支王氏在山东繁衍的子孙,其子孙世代簪缨,使王氏成为一时望族。
2.洛阳名胜有龙门石窟、白马寺、牡丹、汉光武帝陵、杜甫墓等等。
洛阳特产有黄河大鲤鱼、牛心柿、唐三彩、河洛奇石、洛阳青铜器等等。
洛阳有名的小吃餐馆一般都在老城区,可以坐出租车到达。
3.题名:《核工业铀资源勘查遥感应用的创新与数字勘查技术系统研究》作者:刘德长赵英俊仉宝聚王霞题名:《资源勘查图件计算机辅助编绘系统的结构分析与开发策略研究》作者:刘刚汪新庆李伟忠田宜平二、综合课题检索1.检索课题题目:金矿床地质特征及成因类型2.检索词:金(gold)矿床(deposit) 地质特征(geological characteristics) 成因类型(genetic types)3.检索程序:本课题题目是有关地质采矿专业的课题,专业性很强。
可以采用的检索系统有google的学术搜索,维普资讯(),中国期刊网,SCI,EI等。
检索关键词包括金矿床、地质特征、成因类型。
检索提问式包括:文献类型选择,查询范围选择,查询年限选择,输入关键词。
4.检索结果:(1)《平顶山岩金矿床地质特征及成因类型》摘要:一、地质概况平顶山金矿床位于黑龙江省东北部嘉荫县境内,隶属于兴凯湖---布列亚山地块区,佳木斯隆起带。
电子文献检索与利用
作者(author)检索是从文献的作者姓名出 发来检索其文献。 “作者”广义上还应包括:汇 编者(compiler)、编者(editor)、主办者 (sponsoring body)、译者(translator)等。
此外,还有代表机构、单位的团体作者 (corporate author),包括作者所在单位 (author's affiliation)。
五大基本部类
马克思主义、列宁主义、毛泽东思想、邓小 平理论
哲学、宗教 社会科学 自然科学 综合性图书
A 马克思主义、列宁主义、毛泽东 思想、邓小平理论
B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济
G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
逻辑“或”--“OR”或“+” 传统文化 OR 节日 传统文化+节日
逻辑“非”--“NOT”或“-” 传统文化 NOT 节日 传统文化-节日
2 位置检索
(1)(W)和(nW)算符 W是with的缩写,(W)可简写为()。 例:fixed(W)bed ,结果中含有 “fixed bed”或“fixed-bed” 等形式。
确定通用关键检索词 确定与之相关的上下位关键词 是否有其他的出版机构或作者与你 要查找的主题相关?
熟悉常用的检索系统 了解各种数据库收录文献的类型 查看检索系统及数据库的详细介绍和 说明
第4步 规划检索程序
选定检索主题词 建立检索表达式 整相关设定:年代、类型等
进行检索
词,使用逻辑“与”,增加限定条件如年限、 文献类型等。
6 检索效果的评价
查全率:检索出的相关文献量与检索系统中所有相
关文献量之比。反映了系统在实施某一检索作业时, 检出相关文献的能力。