文献检索-互联网信息检索

合集下载

信息检索---名词解释

信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。

它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retri)。

信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供高度对口的信息。

强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。

注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的出版物。

期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。

第二章-互联网信息资源检索概论

第二章-互联网信息资源检索概论
11
12
发展前景:
虽然目录型检索工具在当今互联网信息检 索界的地位已不如从前,但仍是个个人维护的目录 型检索工具,它成为了相当一部分上网用 户的“入口”,许多对上网无从下手的人, 最需要的就是这样的导航网站,如今360也 开发了360网址。
第2章
1
第2章 互联网信息检索概论
2.1互联网信息检索类型和特点 2.2互联网信息检索原理之一——信息组织 2.3互联网信息检索原理之二——信息查询 2.4互联网检索工具的性能评价
2
2.1互联网信息检索的类型和特点
2.1.1互联网信息检索的类型 2.1.2互联网信息检索的特点
8
最具代表的互联网目录型检索工具当属 “yahoo”(雅虎),是由斯坦福大学的研究 生杨致远(Jerry Yang)和David Filo与 1993年创立的。
互联网刚开始发展时,他们在网上冲浪时, 逐渐把自己喜爱的站点编成一个名单以便 寻找,并将这一名单在网上公布,供网友 使用,这就是雅虎的前身,也是目录型检 索工具的工作原理。
索互联网站点提供了极大的方便,但随着
互联网的持续发展,它的缺点也越来越明 显,其地位收到了以Google为代表的搜索 引擎的挑战。
时过境迁,雅虎和搜狐都已经发展成了门
户网站。
10
补充:门户网站
中国四大门户网站:新浪、网易、搜狐、 腾讯
门户网站:又被称为链接页面,是通向某 类综合性互联网信息资源并提供相关信息 服务的应用系统。
张朝阳在中国创办“搜狐”,也是比较成 功典型的互联网目录型检索工具。
9
优点:人工参与度高,网络资源目录的组 织编排符合人们所熟悉的知识分类体系,
检索目标性相对较强,提供的检索结果准 确性也较高。

网络信息检索课程简介

网络信息检索课程简介

课程内容介绍:
3、信息检索的基本技能:①掌握若干种基本 的综合性和专业性中外文检索工具,了解其内
容特点、结构和著录格式,能够通过多种途径 使用它们检索和专业相关的不同类型的文献。 ②掌握若干种主要综合性和专业性参考工具书, 了解其内容特点、适用范围和查阅方法,能够 使用它们进行事实检索和数据检索。③初步掌 握机检方法,包括选择数据库、制订检索策略、 分析检索结果。④能够独立地根据检索课题选 用适当的检索工具,并综合使用多种检索工具 和参考工具书完成检索课题。 ⑤掌握获取原 始文献的主要方法。
识、信息的概念;不同文献类型的特点; 专业文献概况及主要收藏单位;情报与 Information Literacy对科学活动及个人知识 增殖的作用;文献检索的意义和作用。
课程内容介绍:
2、信息检索的基本原理:信息检索类型、
检索程序和方法;检索语言与排检法;检 索工具和参考工具书的类别、特点、功用 及其结构;数据库、计算机检索的基本策 略。
信息检索的基本概念 ������ 信息检索的评价 ������ 信息检索模型和算法 ������ 模型、相关反馈、查询扩展 ������ 文本处理技术 ������ 文本分类和聚类技术(倾向性分析) ������ 信息过滤技术 ������ 信息组织和索引 ������ 并行和分布式检索 ������ 信息检索的应用 ������ WEB检索 ������ 数字图书馆 ������ 多媒体检索
要求
学会查询和利用信息(专业的查询、Internet)
搜索引擎的研究
市场发展的需求
用户需要信息检索技术:互联网的信息量太大,寻 找信息非常不容易 公司需要信息检索技术:信息检索技术可以挣大钱, 搜索引擎改变了很多传统na、 Sohu、Tecent、Netease都加入到这个搜索技术的竞

网络搜索与信息检索技术

网络搜索与信息检索技术

网络搜索与信息检索技术随着互联网的快速发展和普及,人们获取信息的方式也发生了翻天覆地的变化。

通过网络搜索引擎,我们可以轻松地获取到庞杂而丰富的信息资源,而其中背后起着重要作用的就是网络搜索与信息检索技术。

本文将为您详细介绍网络搜索与信息检索技术的定义、原理和应用领域。

一、网络搜索与信息检索技术的定义网络搜索与信息检索技术是通过利用计算机和互联网的力量,对海量的、分散的、异构的信息资源进行收集、分析、筛选和组织,以提供准确、有效、个性化的搜索结果的一种技术手段。

二、网络搜索与信息检索技术的原理1. 数据收集:网络搜索与信息检索技术通过网络爬虫程序定期抓取互联网上的各类网页,并存储为一个个的索引文件,以备后续的处理和查询。

2. 数据分析:在数据收集的基础上,搜索引擎会对抓取到的网页进行分析和处理,提取出页面的关键字、标题、描述等信息,并建立相应的索引文件,用于加速后续的搜索过程。

3. 查询处理:当用户输入查询关键词后,搜索引擎会通过与索引文件的对比,找到与查询条件匹配的网页,并按照一定的算法进行排名,以显示最相关的结果。

4. 结果展示:搜索引擎将根据排名规则,将搜索结果展示给用户。

常见的展示方式包括网页链接、摘要和相关图片等。

三、网络搜索与信息检索技术的应用领域1. 学术研究:学术界通过网络搜索与信息检索技术可以方便地查找到大量相关的期刊论文、学位论文等,为科研工作者提供了便捷的文献检索工具。

2. 商业应用:在商业领域,网络搜索与信息检索技术被广泛应用于市场调研、竞争情报等领域,帮助企业了解市场动态,预测趋势,优化产品和服务。

3. 搜索引擎优化:对于网站营销人员而言,网络搜索与信息检索技术是其工作的核心。

优化网站的结构和内容,提高网站在搜索引擎中的排名,有助于增加流量和提升用户体验。

4. 社交媒体:社交媒体平台通过网络搜索与信息检索技术,可以根据用户的兴趣和需求,推荐相关的朋友、话题和资讯,提供个性化的服务。

文献检索,信息检索(2)第二章 信息检索原理

文献检索,信息检索(2)第二章  信息检索原理
优点:可以检索到某学科或专业的所有文献,有较高 的查全率。
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。

学术猫文献检索

学术猫文献检索

学术猫文献检索
学术猫文献检索是一种基于互联网的信息检索技术,旨在帮助学者和研究人员找到他们所需的学术文献资源。

通过学术猫文献检索,用户可以快速、准确地获得相关领域的最新研究成果,从而提高自己的学术水平和研究能力。

学术猫文献检索的基本原理是通过关键词检索,从庞大的学术文献数据库中筛选出与用户需求相关的文献。

用户只需要输入相关的关键词或短语,学术猫就会根据这些关键词在数据库中进行搜索,并返回与之相关的文献列表。

学术猫文献检索的优势在于其高效性和准确性。

相比传统的图书馆检索方式,学术猫文献检索不仅速度更快,而且能够提供更多的信息资源。

另外,学术猫文献检索还具有自动化的特点,用户只需输入关键词,系统会自动为用户筛选出最相关的文献,省去了用户手动检索的繁琐过程。

然而,学术猫文献检索也存在一些局限性。

首先,由于学术猫依赖于互联网,因此在网络连接不稳定或者无网络的情况下,无法进行文献检索。

其次,学术猫文献检索的结果受到关键词选择的影响,如果用户选择的关键词不准确或不全面,可能无法得到满意的检索结果。

此外,学术猫文献检索也无法提供全面的文献资源,用户仍然需要参考其他渠道获取更多的文献信息。

尽管存在一些局限性,学术猫文献检索仍然是学术界不可或缺的工具之一。

通过学术猫的帮助,研究人员可以更加便捷地获取到相关领域的最新研究成果,促进学术交流和学科发展。

未来,随着技术的不断进步,学术猫文献检索还将不断完善和发展,为学术界提供更加便捷、准确的信息检索服务。

信息检索

信息检索

文献:记录信息和知识的一切载体。

文献检索:以文献为检索对象,查找含有用户所含信息的文献。

文摘:是将论文或专著的内容加以浓缩,以精炼的语言把文献信息的重要内容,学术观点,数据及结构准确的描述下来并按一定目录规则与排列起来,供读者查阅的一种信息系统.核心期刊是科技期刊中少数高质量的特定期刊,指各学科领域刊载本专业高水平学术论文,能反映本学科最新研究成果及前沿研究状况与发展趋势的期刊,其载文率、被引用率以及参考利用价值都很高.浏览法:直接浏览最新期刊,特别是核心期刊上的一次文献。

追溯法:当查到一篇参考价值较大的新文献后,以文献后面附的参考文献为线索,由近及远,进行逐一追踪的方法。

顺查法:是由旧到新的查找。

多用于已知所查主题起始年代。

倒查法:是由新到旧的查找。

多用于查找新课题或某课题的新内容。

抽查法:有选择地在某课题文献发表较集中的年限查找。

多用于事先了解该学科或课题的发展历史背景。

循环法:又称分段法,是交替使用“常用法”和“追溯法”来进行检索的综合检索方法。

即利用检索工具查到一批文献资料,又利用这些文献所附的参考文献追溯查找。

信息:是客观存在的事物现象,是生物体或有一定功能的机器可以感知的客观事物发出的一切有意义的信号和消息。

特点:客观性、可认知性、传递性、时效性知识:是人们对自然界、人类社会中各种信息进行思维分析、加工提炼、并加以系统和深化而形成的信息集合。

情报:用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的信息或知识。

特点:传递性、时效性查全率:在信息检索结果中,检索出的相关信息占信息检索系统中相关信息的比例.查准率:是指系统进行检索时,系统中检出的相关文献量与检出的文献总量的比率。

数据库:是计算机存储设备上按一定方式存储的相互关联的数据集合,同时又反作用于新形象检索.搜索引擎:指根据一定的策略、运用特定的计算机程序搜索互联网上的信息,对信息进行组织和处理后显示给用户,是为用户提供检索服务的系统。

2.简述文献信息检索的步骤

2.简述文献信息检索的步骤

简述文献信息检索的步骤文献信息检索是通过检索系统或数据库获取特定领域或主题相关文献的过程。

以下是文献信息检索的一般步骤:1. 明确研究主题:-定义您感兴趣的研究领域或主题。

-确定关键词、主题词或短语,用于检索相关文献。

2. 选择检索工具和数据库:-选择合适的检索工具,如图书馆目录、在线数据库(如PubMed、IEEE Xplore、Scopus、Web of Science等)。

-根据您的研究主题选择相应的数据库。

3. 构建检索字符串:-使用您定义的关键词和主题词构建检索字符串。

-考虑使用逻辑运算符(AND、OR、NOT)来组合关键词,以便更精确地检索所需信息。

4. 执行检索:-在选择的数据库或检索工具中输入构建好的检索字符串。

-查看检索结果,了解有多少文献符合您的检索条件。

5. 筛选和排序:-根据检索结果进行初步筛选,评估文献的相关性。

-根据您的研究目的和标准,进一步排序或过滤文献。

6. 查看摘要和关键词:-阅读文献的摘要和关键词,以确定其是否符合您的研究目的。

7. 获取全文:-获取符合要求的文献的全文。

这可能需要访问在线数据库、图书馆、请求作者提供文献等。

8. 阅读和分析:-详细阅读选定的文献,分析其中的方法、结果和结论。

-评估文献的质量和可信度。

9. 记录和引用:-记录引用信息,包括作者、标题、出版物信息等。

-使用引文管理工具(如EndNote、Zotero、Mendeley等)管理文献。

10. 更新检索:-定期更新检索,以获取最新的文献和研究成果。

这些步骤是一个一般性的指南,具体的文献检索过程可能因研究领域、检索工具和目标的不同而有所不同。

在实践中,灵活性和不断调整检索策略是进行文献信息检索的关键。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
http:通信协议名称 主机地址;edu为教育机构 含义是浏览器采用http协议,从的www服务器 的80端口上(缺省)、路径为Gets/school_notice下的 index.htm文件。 p.118
2 网络信息检索工具
• 搜索引擎 工作方式区分 • 工作语种区分 • 检索内容区分 • 虚拟图书馆
p.117
1 基本概念——网上信息资源的类型
• 出版类型区分:和印刷型出版物类似的对 应关系如:网络期刊,网络图书等。 • 原创性区分:一次资源、二次资源。 一次资源:首次发表的原创性信息。 二次资源:转载已有的信息。 • 有否经过审核区分:正式出版物(ISSN、 ISBN)、非正式出版物。 p.116
互联网上数据库—三次文献 主题词表
• HASSET叙词表(/search/hassetSearch.asp)
互联网上数据库—三次文献 化学专业主题词
• Chemfinder()
1 基本概念——网上信息资源的特点
• 数量庞大、增长迅速 • 更新频繁、变化无常、分布散乱 • 良莠混杂
资源:网络时代信息资源
局域网内使用
纸质印刷期刊 的书目信息
任何上网终端上使用
可见信息
有使用权的 网络数据库
馆藏书刊
不可见 资源 互联网上的 免费信息资源
馆内纸质印刷期刊的书目信息
馆内的电子资源
馆内的电子资源
• 中文电子期刊: 维普中文科技期刊 VipBrowser 浏览 下载 万方数据库— 数字化期刊 Acrobat Reader 浏览 下载 • 电子图书: 超星电子图书21万册 需事先注册 以后用户名 密码 登陆 浏览图书
2 网络信息检索工具——搜索引擎
定义: 网上信息搜索工具的通称。 类型: 工作方式的不同:主题引擎、目录引擎和多元 工作语种:中文搜索引擎和外文搜索引擎 检索内容区分:门户网站搜索引擎 、垂直搜索 引擎 。 p.119
工作方式—主题引擎
又称基于Robot的搜索引擎
Robot → Index→ 搜索软件 Robot:自动访问Web站点 ,提取站点 上的网页 Index :Robot提取的网页被放入到Index 中以便建立索引(提取标题、说明语、网址) 搜索:网页与关键词之间的符合程度(关键词 在网页中出现的位置和频率)高低把 搜索结果(网页)送回到用户的浏览器中 p.119-121
p.116
1 基本概念——网上信息资源的类型
• 按照是否属于搜索引擎检索范围
搜索引擎
可 见 信 息 不 可 见 信 息
1 基本概念——网上信息资源的类型
可见信息(静态网页)
1 基本概念——网上信息资源的类型
不可见信息
1 基本概念——网上信息资源的类型
不可见信息
1基本概念
• 超文本标识语言(HTML):为WWW建立超文本文件的 语言。 • 超文本文件:文本中的某些内容通过被称为链接项 (由高亮度,下划线或编号来标识)的一些词和其它 文本或文件连接起来,也就是说,超文本文件是指 含有多个指向其它文本、图像、声音或动画文件的 指针,使它们连接在一起的文件。普通文本文件和 印刷性文献的内容以线性排列,知识点之间固有的 网状联系无法予以体现。
1 基本概念——网上信息资源的类型
一次网络信息
1 基本概念——网上信息资源的类型
二次网络信息
新浪新闻中心
中国新闻网
1 基本概念——网上信息资源的类型
• 是否属于搜索引擎检索范围区分: 可见资源、不可见资源 可见资源:搜索引擎直接可搜索到的资源 含有HTML超链接
同时满足 三个条件: 没有设置口令或者IP限制 不属于动态产生的网页
本章要点
互联网信息资源组成 信息检索工具:搜索引擎
虚拟图书馆
学术网站的定义和类型
互联网实习要求
1 基本概念——信息资源的组成
• 计算机中的无数信息:数据库(一次、
二次、三次)、电子出版物、主页信息 、软件以及各种格式的文件。
• 网上的信息工具:E-mail、www 浏览器和搜索引擎等。 • 网络通信渠道
p.115
互联网上数据库—一次文献
• 中国专利数据库(全文) • 美国专利数据库(全文) • 世界专利数据库(全文)
互联网上数据库—二次文献
• 中国标准咨询网(题录) • 国际电工委员会网站(题录) http://www.iec.ch • 国际标准组织网站(题录) http://www.iso.ch
工作方式—主题引擎
优点: 信息量大、更新及时、无需人工干预。

p.120
工作方式—主题引擎举例
• 国外代表: Gole
• Suggest Google beta (/webhp?complete=1&hl=en)
p.118
1基本概念
• 网站和网页 网页是HTML或DHTML,XML等语言写成的文本文件 网站是有独立的域名,由若干相关网页组成的一 个站点。 互联网协议(IP)地址:互联网信息定位,每台 上网计算机都有一个惟一的IP地址,它的作用类 似于上网计算机在信息高速公路上的门牌号码。 域名(DN): 只有作为服务器的计算机才需要。 域名的作用类似于服务器在信息高速公路上的门 牌号码。如: p.117-118
• •
1基本概念
• 统一资源定位器件(URL): URL代表了互联网上一切资源,包括上网计算机及 其各种文件的地址。 格式为:Protocol://host.[:port]/path/filename 例如: /Get/school_notice/index.htm
相关文档
最新文档