第二章-互联网信息资源检索概论
第二章 信息检索

2.检索技巧和提示
(1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,包括:出版、结构(权威性),出版类 型(期刊、会议、报告、专利…),文献类型(全文、文摘、题录…),收集年限,使 用权限,文献版本,服务方式(光盘、联机、专线、镜象、出国),连接方式,帐 号、密码,咨询联系等。现在许多数据库被组织到信息服务中心的web网页 上,并提供了有关介绍,应当充分地利用它们。
(1)积木型 积木型检索策略的含义是:把检索课题剖析成若干个概念面,先分别 对这几个概念面进行检索;在每个概念面中尽可能全和多地列举相关词 、同义词、近义词,并用布尔算符OR连接成子检索式,然后再用布尔算 符AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点是:能够提供较明确的检索逻辑过程,以后容易检索和理解,还可 部分或全部地用作保留检索。一般地,“积木型”策略用于较复杂的检 索课题。 • 如“肺癌”与“吸烟”可以分成两个概念面,这两个概念面的各种形式 的检索词有: cancer smoker(s) • • carcinoma lung(s) cancer smoking cigar
(二)截词检索
截词检索:是指在检索时使用词的一个局部(某些 位置上的字符被截去)进行检索匹配,并认为凡满足这 个词局部中的所有字符要求的记录,都为命中结果。 截词检索需要使用专门符号(截词符),以指定截词 的具体位置与截断字符的数量。 • 按照截词位置的不同,截词检索分为: 右截词、左截词和中间截词三种。 例如:检索式 “wom?n”可检索到含有woman、women的结果。 截词检索实际上是一种隐含“逻辑或”的运算,能提 高查全率,扩大检索结果,是防止漏检的有力手段。
第二部分事实与数据检索工具
讨论事实、数据资源检索,其检索的对象是大量的、 常用的那些具体的科学技术数据和事实,如物理量、 物质特性、参数、规格等技术数据以及价格、产量、 公司名录、人名录等商业、经济等各种实用信息。 它们的检索工具包括:百科全书、年鉴、手册、词 典、机构指南和人名录、书目及书目指南等参考工 具。
第二章-网络信息资源的检索与利用 第二,三节

A.互联网上的国内期刊信息
• 查找国内期刊,可以从以下站点入手: • 一、中国期刊网: • 二、维普科技期刊网: 或 / • 三、万方数据资源系统的数字化期刊: /qikan/ind ex.jsp • 四、学科导航信息
●
图片搜索
二.常用网络信息资源的检索
• • • • • • • 1. 网络检索--- 图书 2. 网络检索----期刊 3. 网络检索----报纸 4. 网络检索----人物,机构 等信息 5. 网络检索----专利, 标准, 科技报告, 统计数据等信息
怎样查找互联网上的图书信息?
网络信息资源 检索﹠利 用
• 网络信息资源与常用中英文搜索引擎
• 常用网络信息资源的检索利用(学术) • 网络信息资源的检索策略与技巧
第二节
• 常用网络信息资源的检索利用(学术)
一.重要的学术搜索简介
二.常用网络信息资源的检索利用
一.重要的学术搜索简介
• 1. Google scholar(Google学术搜索 ) • 2. Scirus(科学搜索)是目前网上最全面、 综合性最强的科技文献搜索引擎之一 • 3.一些专业专题搜索引擎。
•
Directory of Open Access Journals
• DOAJ( Directory of Open Access Journals)由 由Lund University建立,它提供有质量控制的可 免费获取的网上电子期刊资源,它的目标是建成一 个无学科、无语言限制的综合性的科学期刊系统, 方便科研人员使用,并可提升期刊的显示度。 • 目前该网站已收集了482种期刊,并把这些期刊分 成了15个大类,53个小类,其中包括农业、生命科 学、化学、数学、物理、天文学、工程技术、环境 科学DOAJ( Directory of Open Access Journals 、社会科学等。
第二章网络检索

2.1.3、网络信息资源的特点
(一)优点: 1.数量巨大,增长迅速 2.内容丰富,形式多样 3.结构灵活,分布广泛 4.开放互动,共享性强 5.传播快速,利用方便 6.更新速度快,动态性强
网络信息资源的特点
(二)缺点: 1.网络信息质量参差不齐,良莠不一 2.分散无序,缺乏管理
2.2 网络信息检索的方法
2、网上出版物
网上出版物是指在网络环境中编辑、出版、发行的出版物以 及印刷型出版物的网络版,包括网上图书、网上期刊、网上报 纸等。如今,通过Internet浏览、订阅电子期刊、报纸、图书 等已成为一种时尚,网络出版物的数量正急剧增加。如在中国 科技期刊网上可以免费查找《中国学术期刊》的题录。其中网
上参考工具书更是独树一帜,像一些百科全书、辞典、指南、
手册、文摘索引、目次表、名录等,这些网络版参考工具书使 用起来方便、快捷。目前因特网上有上万种电子期刊向网上用
户提供服务,其中很多是免费提供。
主要网上书店
中国图书网(/) 中华图书网(/)
短短的两年多时间内,设在北京大学的项目管理中心联合各参建
单位,建设了文理、工程、农学、医学四个全国文献信息中心, 华东、华中、华南等七个地区中心和一个东北地区国防信息中心, 建立了一系列国内外文献数据库,并开展了公共目录查询、信息 检索、馆际互借、文献传递、网络导航等网络化、数字化文献信 息服务,对保障"211工程"各高校的重点学科建设、培养高层次人 才、支持科研创新等发挥了重要的作用。
CALIS面向读者的服务功能主要有: (1)公共检索:可以在网上查找全国性或地区 性的书刊联合目录数据库,了解所需文献是否有及在 哪里收藏。也可以联机检索CALIS国内外各种类型的 文献数据库。 (2)馆际互借 (3)文献传递 (4)电子资源导航:对网上的电子资源进行收 集、加工和整序,形成虚拟图书馆资源,提供用户浏 览和查询。
网络信息资源检索PPT课件

02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。
第二章 信息检索的基本知识

应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7
网络信息资源检索课件

网络信息资源的类型
政府信息
包括政府机构、政策法规、统 计数据等信息。
学术信息
包括学术论文、研究报告、学 术期刊等信息。
商业信息
包括公司简介、产品信息、市 场调研等信息。
个人信息
包括博客、论坛、社交媒体等 信息。
应了解常见的网络攻击手段,如钓鱼网站、恶意软件等,采取相应 的防范措施。
THANKS
感谢观看
网络信息资源的发展历程
1 2
互联网的兴起
随着计算机技术和通信技术的发展,互联网逐渐 兴起,成为人们获取信息的重要途径。
信息爆炸时代
随着互联网的普及,网络信息量呈爆炸式增长, 搜索引擎的出现使得信息检索变得更加便捷。
3
个性化信息服务
随着大数据和人工智能技术的发展,个性化信息 服务逐渐成为主流,能够根据用户需求提供更加 精准的信息服务。
网络信息资源检索课件
• 网络信息资源概述 • 网络信息资源检索基础 • 搜索引擎的使用 • 学术信息检索 • 网络信息资源的质量评价 • 网络信息资源的合理使用
01
网络信息资源概述
定义与特点
定义
网络信息资源是指通过计算机网 络可用的各种信息资源的总和, 包括文本、图像、音频、视频等 形式。
特点
使用恰当的关键词
选择能够准确描述信息需求的关键词,避免使用过于宽泛或模糊的词 汇。
调整检索策略
根据检索结果不断调整关键词和查询方式,以提高检索效率和准确性。
03
搜索引擎的使用
搜索引擎的原理与分类
搜索引擎的原理
搜索引擎通过爬取互联网上的网页,建立索引,然后根据关键词匹配程度进行 排序,为用户提供搜索结果。
《网络信息资源检索》课件

合法获取和使用
在使用网络信息资源时,应通过合法途径获取和 使用,避免使用盗版或非法获取的资源。
05
网络信息资源检索的发展趋势
个性化信息检索服务
总结词
个性化信息检索服务是一种基于用户兴趣和需求的信息检索方式,通过分析用户的历史搜索记录、兴趣偏好等信 息,为用户提供更加精准、个性化的搜索结果。
详细描述
信息排序
检索结果通常会按照相关度、时 间顺序等标准进行排序,以便用 户快速找到所需的信息。
02
网络信息资源检索工具
搜索引擎
搜索引擎定义
搜索引擎是一种网络信息资源检索工具,通过爬取互联网上的网 页信息,建立索引数据库,为用户提供关键词检索服务。
搜索引擎分类
搜索引擎可分为全文搜索引擎、元搜索引擎、垂直搜索引擎等类型 ,每种类型都有其特点和适用场景。
3
常用网络资源目录
常用的网络资源目录包括Yahoo目录、Open Directory等。
03
网络信息资源检索技巧
关键词选择与提炼
01
关键词是检索过程中最关键的要素,选择恰当的关 键词能够提高检索的准确性和效率。
02
关键词的提炼需要从信息主题、内容、特征等方面 进行提炼,以突出信息的核心内容。
03
常用特种文献数据库
常用的特种文献数据库包括万方数据、维普资讯、中国知网等。
网络资源目录
1 2
网络资源目录定义
网络资源目录是指将互联网上的各类资源进行分 类和整理,形成一个层次结构化的目录体系,方 便用户进行查找和检索。
网络资源目录特点
网络资源目录具有高度的组织性和分类性,能够 提供全面、系统的互联网资源检索服务。
图书馆资源
02139 计算机信息检索 自考考试大纲

湖北省高等教育自学考试课程考试大纲课程名称:计算机信息检索课程代码:02139第一部分课程性质与目标一、课程性质与特点计算机信息检索是湖北省高等教育自学考试信息管理与系统专业(本科)的学位课程,旨在系统地培养学生的信息获取、组织、评价和综合利用能力,提高学生的信息素养和信息技能,满足学生快速、准确、有效地获取和高效地利用网络信息资源的需求。
本课程引进数据库技术、网络技术和通信技术的内容,并紧密结合网络环境下信息资源的特点和信息检索的实际需要,全面而又系统地介绍了信息检索的基本理论和基础知识,尤其是网络信息资源检索的特点、检索技术和检索方法。
此外,还介绍了多种不同的网络信息资源检索工具、搜索引擎、网络数据库、网络信息资源检索系统的功能及其使用方法以及不同类型网络信息资源的获取方法和应用领域,为用户快速、有效地获取自身需要和适用的网络信息资源提供了有效的途径和方法。
二、课程目标与基本要求1.系统掌握信息检索的相关概念、类型及信息检索语言,尤其是信息资源检索的技术、方法、途径、步骤,以及效果评价;2.理解网络信息资源的概念、特点和类型,熟练掌握网络信息资源检索的特点、方法和工具;3.学习搜索引擎的概念、功能、类型、工作方法,及其使用方法和技巧,掌握各类主要的搜索引擎的工作原理和检索方法;4.熟练掌握主要的中文和英文网络数据库的检索;5.学习掌握当前主要的核心检索评价系统,并能合理实现各类常用特种文献信息的网络检索。
三、与本专业其他课程的关系该课程要求考生具备信息管理与信息系统专业的基础理论,其先行课程为计算机应用基础、信息资源建设、互联网及其应用等。
第二部分考核内容与考核目标第一章信息资源检索基础知识一、学习目的与要求理解信息资源的内涵,信息资源检索的概念、类型及信息检索系统和语言;掌握信息检索技术,信息资源检索的方法、途径和步骤,以及效果的评价。
二、考核知识点与考核目标(一)信息资源检索的相关概念,检索方法、途径和步骤(重点)识记:信息检索及其相关概念、类型,信息检索系统和数据库。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
发展前景:
虽然目录型检索工具在当今互联网信息检 索界的地位已不如从前,但仍是个个人维护的目录 型检索工具,它成为了相当一部分上网用 户的“入口”,许多对上网无从下手的人, 最需要的就是这样的导航网站,如今360也 开发了360网址。
第2章
1
第2章 互联网信息检索概论
2.1互联网信息检索类型和特点 2.2互联网信息检索原理之一——信息组织 2.3互联网信息检索原理之二——信息查询 2.4互联网检索工具的性能评价
2
2.1互联网信息检索的类型和特点
2.1.1互联网信息检索的类型 2.1.2互联网信息检索的特点
8
最具代表的互联网目录型检索工具当属 “yahoo”(雅虎),是由斯坦福大学的研究 生杨致远(Jerry Yang)和David Filo与 1993年创立的。
互联网刚开始发展时,他们在网上冲浪时, 逐渐把自己喜爱的站点编成一个名单以便 寻找,并将这一名单在网上公布,供网友 使用,这就是雅虎的前身,也是目录型检 索工具的工作原理。
索互联网站点提供了极大的方便,但随着
互联网的持续发展,它的缺点也越来越明 显,其地位收到了以Google为代表的搜索 引擎的挑战。
时过境迁,雅虎和搜狐都已经发展成了门
户网站。
10
补充:门户网站
中国四大门户网站:新浪、网易、搜狐、 腾讯
门户网站:又被称为链接页面,是通向某 类综合性互联网信息资源并提供相关信息 服务的应用系统。
张朝阳在中国创办“搜狐”,也是比较成 功典型的互联网目录型检索工具。
9
优点:人工参与度高,网络资源目录的组 织编排符合人们所熟悉的知识分类体系,
检索目标性相对较强,提供的检索结果准 确性也较高。
缺点:信息涵盖量不大,更新能力有限, 相对成本较高。
面临挑战:在互联网发展早期,为人们检
优点:扩大检索范围,提高检索效率,增 加了找到所需信息的可能性。
21
②垂直搜索引擎 其特点是“专、精、深”,且具有行业色
彩,与通用搜索引擎的海量信息无序化相 比,垂直搜索引擎的信息量虽然小,但更 加专注、深入具体。 比如酷讯的机票检索和团800的团购导航。
22
2.1.2互联网信息检索的特点
19
2、索引非文件形式的互联网信息资源的能 力有限,为了保证Robot抓取网页的效率, 让其不至于迷失在无尽的链接中无法返回, 通常Robot在漫游各个网站时会受到目录深 度的限制,较大搜索引擎的robot一般也就 能顺链到一个网站的4-5网检索工具
①元搜索引擎。它弥补了搜索引擎的不足, 他不存在Robot,也不存在存放网页的数据 库,当用户检索一个关键词时,它把用户 的检索请求转换成其他搜索引擎所能接受 的命令格式,并发送访问数个搜索引擎来 检索这个关键词,这些搜索引擎的结果经 过处理后再返回给用户。
3
2.1.1互联网信息检索的类型
1、“顺链而行”的浏览 基于互联网“超链接”的技术特点,用户
在浏览网页时,可以非常方便地利用超文 本文件中的链接从一个网页跳转到另一个 相关网页。这些类似于传统文献检索中的 “追溯检索”,但是检索效率已大大提升。 追踪网页的超链接,用户可以一轮一轮不 断地扩大检索范围,在很短的时间内获得 大量相关信息。
17
优点
充分利用了计算机的处理能力,对于规模 巨大的互联网信息资源的索引和检索具有 强大的优势,使得人们可以用更少的时间 检索到更广阔的互联网信息。
18
缺点
1.检索噪音问题。使用搜索引擎检索某个关 键词或关键词组合,通常会返回大量检索 结果,逐一浏览这些结果对用户来说是不 现实的。搜索引擎不断改进算法,使得最 满足检索需求的结果排序靠前,取得了一 定的效果,但是仍不能完全令人满意。
4
在互联网发展初期,“顺链浏览”的人工 浏览方式是互联网信息检索最主要的手段, 而浏览器的“书签”(收藏夹)功能是成 为该阶段被使用得最多的功能之一。
5
马云与黄页
1995年4月,马云和妻 子再加上一个朋友, 凑了两万块钱,专门 给企业做主页的杭州 海博网络公司就这样 开张了,网站取名 “中国黄页”,成为 中国最早的互联网公 司之一。其后不到三 年时间,他们利用该 网站赚到了500万元。
中国黄页2009年6月1 日,网站正式上线, 完全公益性网站,不 收任何费用!
6
人们对互联网信息的寻找,从最原始的 “顺链浏览”到黄页等早期检索工具,实 现了第一个飞跃。互联网黄页本质上就是 一种目录型检索工具。
7
2、基于目录型检索工具的互联网信 息检索
目录型检索工具,也被称为网络资源目录 或网络主题指南,它是一种基于人工的检 索工具,由人工发现、抓取、辨别互联网 信息,依靠编目、标引人员的知识,按照 图书分类、学科分类或其他分类依据的体 系,建立主题树分层目录,将采集、筛选 后的信息分门别类地放入各大类或子类下 面,用户通过逐级浏览这些目录来查询自 己所需要的内容。
13
14
15
3、基于索引型检索工具的互联网信 息检索
随着互联网信息量的急剧增加,仅以“网 站”为信息基本单元的检索方式已经不能 满足更精细的检索需求,于是基于“页面” 为信息基本单元的检索方式成为主流。
最具代表性的索引型网络检索工具就是搜 索引擎
16
搜索引擎原理
利用一个成为Robot的程序自动访问Web站 点,提取站点上的网页,并根据网页中的 链接进一步提取其他网页,并将搜集到的 网页加入到搜索引擎的数据库中,并建立 索引,供用户检索使用。然后用户输入关 键字之后进行检索。
1、无限检索范围,动态的检索对象 2、丰富的检索内容,新兴的检索领域 3、强大的检索工具,低廉的检索费用
23
2.2互联网信息检索原理之一—— 信息组织
目录型检索工具是基于某种人类制定的知 识分类体系,对网络信息资源的编排和组 织加以人工控制,其工作原理相对简单。 这里介绍的互联网信息检索原理,主要是 指基于计算机技术的索引型检索工具的工 作原理。