信息检索网络信息资源检索
合集下载
第九章 网络信息检索

Internet 的管理
常用网络名: com(商业机构)、edu(教育机构)、 mil(军事部门)、gov(政府部门)、 org(非盈利组织)、net(网络服务商) 最高域名: cn(中国)、uk(英国)、jp(日本)
域名 com
含义 商业 组织 教育 机构
域名 net
含义 网络 技术 组织 非盈 利性 组织
Internet 提供的主要服务
3.远程登录(Telnet) 是指本地计算机通过Internet访问远程计 算机上的硬件资源、软件资源和信息资源的过 程。对于限制公开访问的远程主机,登录时要 输入用户名和密码。 随着 www的普及, Telnet已少有使用。
Internet 提供的主要服务
4.电子论坛( Electronic Forum ) 是Internet用户在网上讨论交流的一种形式, 又称新闻组(Newsgroop)或专题讨论组 (Usenet)。
搜索引擎的分类
1、按搜索方式分 搜索引擎依其检索方式可以分为两种基本类型: 一种是关键词检索搜索引擎;另一种是目录式分类 搜索引擎。
目录式分类搜索引擎:首先依据某种分类依据(如学科分 关键词搜索引擎:在前台提供一个检索入口,用户通 类),建立主题树分层浏览体系,由搜索引擎抓取网上信息 过入口提交查询请求(关键词),系统再将检索结果反馈给 之后,对信息进行标引,并将标引后的信息放入浏览体系的 用户。这一类搜索引擎交互性强,通常具备二次检索功能, 各大类或子类下面,使这些信息呈现出错落有致的上下位关 以便用户逐步接近检索结果。适合于查找目的明确、并具 系。用户层层点击,最终找到自己所需的信息。这类搜索引 备一定的数据库检索知识的用户。著名搜索引擎 擎体现了知识概念的系统性,查准率高,但由于人工在分类 A1tavista最初即是关键词搜索引擎,国内的搜索引擎如 标引上的干预,录式分类搜索引擎即Yahoo。
网络信息资源检索4

现在大多数网络检索工具都是采用一种称为 Robot(又称为:Spider, Worms,Wanders等)的 网络自动跟踪索引程序。它实际上是一个在网络上检 索文件且自动跟踪该文件的超文本结构并循环检索被 参照的所有文件的软件。不同的自动索引软件所采用 的标引、搜索策略不同,自动索引软件搜寻、标引网 页的方式对信息检索的质量有直接影响。
第四章 Internet信息检索 1 2 3 4 网络信息检索的一般方法 网络信息检索工具 相关网络信息检索技术 搜索引擎及其原理
1 网络信息检索的一般方法
1.1 浏览
1.2 通过网络资源指南来查找信息 1.3 利用搜索引擎进行信息检索
1.1 浏览
(1)偶然发现。
这是在因特网上发现、检索信息的原始方法。
等功能。
2 网络信息检索工具
网络信息检索工具是指在因特网上提 供信息检索服务的计算机系统,其检索的 对象是存在于因特网信息空间中各种类型 的网络信息资源。
近来具一般是由自动索引程序、 数据库和检索代理软件组成的。
自动索引程序
即在日常的网络阅读、漫游过程中,意外发现一些
有用信息。这种方式的目的性不是很强,其不可预 见性、偶然性使检索过程具有某种探索宝藏的意味, 也许会充满乐趣,但也可能一无所获。
(2)顺“链”而行。
指用户在阅读超文本文档时,利用文档中的链接从一网
页转向另一相关网页。有些类似于传统文献检索中的“追溯 检索”,即根据文献后所附的参考文献目录去追溯相关文献, 一轮一轮地不断扩大检索范围。这种方式可以在很短的时间 内获得大量相关信息,但也有可能在“顺链而行”中偏离了
3、提供检索服务 用户输入关键词进行检索,搜索引擎从 索引数据库中找到匹配该关键词的网页;为 了用户便于判断,除了网页标题和URL外, 还会提供一段来自网页的摘要以及其他信息。
第四章 Internet信息检索 1 2 3 4 网络信息检索的一般方法 网络信息检索工具 相关网络信息检索技术 搜索引擎及其原理
1 网络信息检索的一般方法
1.1 浏览
1.2 通过网络资源指南来查找信息 1.3 利用搜索引擎进行信息检索
1.1 浏览
(1)偶然发现。
这是在因特网上发现、检索信息的原始方法。
等功能。
2 网络信息检索工具
网络信息检索工具是指在因特网上提 供信息检索服务的计算机系统,其检索的 对象是存在于因特网信息空间中各种类型 的网络信息资源。
近来具一般是由自动索引程序、 数据库和检索代理软件组成的。
自动索引程序
即在日常的网络阅读、漫游过程中,意外发现一些
有用信息。这种方式的目的性不是很强,其不可预 见性、偶然性使检索过程具有某种探索宝藏的意味, 也许会充满乐趣,但也可能一无所获。
(2)顺“链”而行。
指用户在阅读超文本文档时,利用文档中的链接从一网
页转向另一相关网页。有些类似于传统文献检索中的“追溯 检索”,即根据文献后所附的参考文献目录去追溯相关文献, 一轮一轮地不断扩大检索范围。这种方式可以在很短的时间 内获得大量相关信息,但也有可能在“顺链而行”中偏离了
3、提供检索服务 用户输入关键词进行检索,搜索引擎从 索引数据库中找到匹配该关键词的网页;为 了用户便于判断,除了网页标题和URL外, 还会提供一段来自网页的摘要以及其他信息。
网络信息资源检索PPT课件

03
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。
02
完整性
信息内容是否全面、完整,没有遗 漏或缺失。
权威性
信息来源是否具有权威性,发布者 是否具有专业资质。
04
信息资源的获取与整理
搜索引擎
使用搜索引擎进行关键词检索,获取相关信 息。
网络爬虫
利用网络爬虫技术自动抓取网页信息。
数据库
通过学术数据库、行业数据库等获取专业信 息。
信息筛选
对获取的信息进行筛选、去重、分类等处理, 整理成有用的资源。
高级检索功能的使用
限定字段检索
通过限定字段范围,缩小检索结果的范围,提高检索 效率。
模糊匹配
使用模糊匹配功能,对关键词进行模糊查询,提高查 全率。
分类导航
利用网站提供的分类导航功能,快速定位到相关资源。
检索结果评估与筛选
评估检索结果的相关性
根据检索结果与需求的匹配程度,评估检索结 果的可靠性。
筛选优质资源
跨媒体检索
随着多媒体技术的不断发展,跨媒体检索将成为未来网络 信息资源检索的重要方向,用户可以通过图片、视频、音 频等多种方式进行信息检索。
THANKS露
网络信息检索过程中,用户的个人信息可能被泄露或滥用,如搜索引擎记录用户 的搜索历史和位置信息等。
信息安全
网络信息资源的共享和传输过程中可能存在安全风险,如黑客攻击、数据篡改等 ,这些威胁可能对用户的隐私和信息安全造成严重威胁。
人工智能在信息检索中的应用
个性化检索
人工智能技术可以根据用户的兴趣、偏好和行为习惯,为用户提供更加个性化的检索结果,提高检索的准确性和 效率。
02
数据库检索的代表有CNKI、万方 等,它们提供了更为专业和深入
的搜索结果。
数据库检索的优点是信息质量较 高,收录的文献和数据较为全面 。
网络信息资源检索精品文档

如:
man woman organization defense men women organisation defence 检索时为防止漏检可用中间屏蔽的检索方法: m?n wom?n organi?ation defen?e
注意:
无论是前截断、后截断和中间屏蔽,从根本上来说, 它们是逻辑“或”的运算,因此能扩大检索范围, 提高查全率。此外还能减少输入检索词的工作量, 简化检索步骤,节省机时和费用。在中文数据库中 使用最多的是后截断检索。
主体是internet
2.网络信息资源的特点
(1)数量庞大,增长迅速; (2)内容丰富,形式多样; (3)变化频繁,价值不一; (4)结构复杂,分布广泛; (5)信息分散、无序;
3.Internet信息资源类型
按信息查询方式:
(1)互联网(WWW)信息。 (2) FTP信息。(远程服务器上可上传和下载的文
(3)元搜索引擎:
没有独立的数据库,只提供一个统一界 面,把多个具有独立功能的引擎组合起来。
万纬搜索引擎: 美国硅谷。 2001年10月22日,正式发布搜 1 索引擎。
网络信息 检索方法
偶尔发现
网上浏览
顺“链”而
行
分类目录 (目录型检索工具)
主题检索 搜索引擎
RSS阅读
5.计算机检索技术
(1)布尔逻辑检索技术
就是布尔检索是将多个关键词按照一 定的逻辑关系组合在一起形成的组合 检索.
这是计算机信息检索中最基本的 也是最常用的技术。
布尔逻辑运算符
逻辑“与” 逻辑“或” 逻辑“非”
从图中可以看出:
① 逻辑“与”的组配缩小了检索的范围。 参加逻辑“与”的检索词越多,检索的 结果范围限制得越小,命中的文献也就 越少。
man woman organization defense men women organisation defence 检索时为防止漏检可用中间屏蔽的检索方法: m?n wom?n organi?ation defen?e
注意:
无论是前截断、后截断和中间屏蔽,从根本上来说, 它们是逻辑“或”的运算,因此能扩大检索范围, 提高查全率。此外还能减少输入检索词的工作量, 简化检索步骤,节省机时和费用。在中文数据库中 使用最多的是后截断检索。
主体是internet
2.网络信息资源的特点
(1)数量庞大,增长迅速; (2)内容丰富,形式多样; (3)变化频繁,价值不一; (4)结构复杂,分布广泛; (5)信息分散、无序;
3.Internet信息资源类型
按信息查询方式:
(1)互联网(WWW)信息。 (2) FTP信息。(远程服务器上可上传和下载的文
(3)元搜索引擎:
没有独立的数据库,只提供一个统一界 面,把多个具有独立功能的引擎组合起来。
万纬搜索引擎: 美国硅谷。 2001年10月22日,正式发布搜 1 索引擎。
网络信息 检索方法
偶尔发现
网上浏览
顺“链”而
行
分类目录 (目录型检索工具)
主题检索 搜索引擎
RSS阅读
5.计算机检索技术
(1)布尔逻辑检索技术
就是布尔检索是将多个关键词按照一 定的逻辑关系组合在一起形成的组合 检索.
这是计算机信息检索中最基本的 也是最常用的技术。
布尔逻辑运算符
逻辑“与” 逻辑“或” 逻辑“非”
从图中可以看出:
① 逻辑“与”的组配缩小了检索的范围。 参加逻辑“与”的检索词越多,检索的 结果范围限制得越小,命中的文献也就 越少。
《网络信息资源检索》课件

合法获取和使用
在使用网络信息资源时,应通过合法途径获取和 使用,避免使用盗版或非法获取的资源。
05
网络信息资源检索的发展趋势
个性化信息检索服务
总结词
个性化信息检索服务是一种基于用户兴趣和需求的信息检索方式,通过分析用户的历史搜索记录、兴趣偏好等信 息,为用户提供更加精准、个性化的搜索结果。
详细描述
信息排序
检索结果通常会按照相关度、时 间顺序等标准进行排序,以便用 户快速找到所需的信息。
02
网络信息资源检索工具
搜索引擎
搜索引擎定义
搜索引擎是一种网络信息资源检索工具,通过爬取互联网上的网 页信息,建立索引数据库,为用户提供关键词检索服务。
搜索引擎分类
搜索引擎可分为全文搜索引擎、元搜索引擎、垂直搜索引擎等类型 ,每种类型都有其特点和适用场景。
3
常用网络资源目录
常用的网络资源目录包括Yahoo目录、Open Directory等。
03
网络信息资源检索技巧
关键词选择与提炼
01
关键词是检索过程中最关键的要素,选择恰当的关 键词能够提高检索的准确性和效率。
02
关键词的提炼需要从信息主题、内容、特征等方面 进行提炼,以突出信息的核心内容。
03
常用特种文献数据库
常用的特种文献数据库包括万方数据、维普资讯、中国知网等。
网络资源目录
1 2
网络资源目录定义
网络资源目录是指将互联网上的各类资源进行分 类和整理,形成一个层次结构化的目录体系,方 便用户进行查找和检索。
网络资源目录特点
网络资源目录具有高度的组织性和分类性,能够 提供全面、系统的互联网资源检索服务。
图书馆资源
《网络信息资源检索》课件

文搜索。
3 必应
微软推出的搜索引擎,注 重用户体验和视觉效果。
如何优化检索关键词
使用具体描述性词语,选择正确的关键词顺序,尝试使用相关词汇和同义词。
搜索引擎通常由爬虫、索引、排名等组成,通过收集、处理和展示信息。
检索词的选择与组合方法
选择准确且具体的检索词,使用布尔运算符和引号来组合或限定检索词的范围。
关键词搜索和全文搜索的区别
关键词搜索仅匹配检索词,而全文搜索会匹配整个文本内容,结果更全面但可能不准确。
常用的搜索引擎及其特点
1 谷歌
全球最大的搜索引擎,提 供广泛的信息检索。
《网络信息资源检索》 PPT课件
本课件将介绍网络信息资源检索的重要性以及相关技术和方法,帮助您更好 地利用搜索引擎和数据库来获得准确有效的信息。
什么是网络信息资源检索?
网络信息资源检索是通过使用搜索引擎和数据库等工具,寻找和获取互联网 上的各种信息资源的过程。
检索技术的发展历史
1
关键词检索
2
随着互联网信息爆炸增长,关键词检索
成为主要方法。
3
人工索引
早期检索技术主要依赖人工整理和分类 信息。
自然语言处理
利用机器学习和人工智能技术,使搜索 更智能化。
检索引擎的分类和作用
通用搜索引擎提供广泛的信息检索,如谷歌、。ຫໍສະໝຸດ
专业搜索引擎
针对特定领域的信息检索,如医学、法律。
元搜索引擎
整合多个搜索引擎的搜索结果。
检索引擎的原理和构成
3 必应
微软推出的搜索引擎,注 重用户体验和视觉效果。
如何优化检索关键词
使用具体描述性词语,选择正确的关键词顺序,尝试使用相关词汇和同义词。
搜索引擎通常由爬虫、索引、排名等组成,通过收集、处理和展示信息。
检索词的选择与组合方法
选择准确且具体的检索词,使用布尔运算符和引号来组合或限定检索词的范围。
关键词搜索和全文搜索的区别
关键词搜索仅匹配检索词,而全文搜索会匹配整个文本内容,结果更全面但可能不准确。
常用的搜索引擎及其特点
1 谷歌
全球最大的搜索引擎,提 供广泛的信息检索。
《网络信息资源检索》 PPT课件
本课件将介绍网络信息资源检索的重要性以及相关技术和方法,帮助您更好 地利用搜索引擎和数据库来获得准确有效的信息。
什么是网络信息资源检索?
网络信息资源检索是通过使用搜索引擎和数据库等工具,寻找和获取互联网 上的各种信息资源的过程。
检索技术的发展历史
1
关键词检索
2
随着互联网信息爆炸增长,关键词检索
成为主要方法。
3
人工索引
早期检索技术主要依赖人工整理和分类 信息。
自然语言处理
利用机器学习和人工智能技术,使搜索 更智能化。
检索引擎的分类和作用
通用搜索引擎提供广泛的信息检索,如谷歌、。ຫໍສະໝຸດ
专业搜索引擎
针对特定领域的信息检索,如医学、法律。
元搜索引擎
整合多个搜索引擎的搜索结果。
检索引擎的原理和构成
11 网络信息资源检索

网络信息资源检索
Telnet信息资源 指基于网络通信协议(Telecommunication network protocol, Telnet)从远程计算机对外开放的资源中所获得的信息资源。 用户的计算机首先通过 Internet暂时成为远程计算机的终端, 在登录成功后,用户便可实时访问,使用远程计算机中对外 开放的全部资源。通过Telnet方式提供的信息资源主要有一 些政府部门、研究机构对外开放的数据库,包括商用数据库 (如Dialog、OCLC、UMI、Datastar、LexisNexis等)和 免费数据库等。
网络信息资源检索
除此之外,网络信息资源从存储方式分,还可以分为:邮件型 信息、电话型信息、揭示板型信息、广播型信息、图书馆型 信息、书目型信息;从内容上分,则有商务信息、科技信息、 社科信息、教育信息、娱乐信息等。
网络信息资源检索
2.网络资源的特点 (1)网络信息资源具有开放性、共享性 网络信息资源的传递与交流,消除了时间、空间的限制和地理 位置的差异,使知识信息在更高的程度上实现了全社会的共 享,每个信息服务机构都成为全球性网络上的一个站点,成 为全开放的为全社会服务的网络信息中心和知识中心。网络 信息资源的利用是整个信息网络建设的重要组成部分,也是 科技信息网络面向用户并得以迅速发展的关键。要使信息网 络具有生命力,其首要的工作是加强网络信息资源的开发和 利用,保证网络信息资源朝着健康、有序的方向发展。
网络信息资源检索
(3)网络信息资源建设的高效性 “高效”并不是指速度方面的高效率,而是指用户所需要的知 识信息,对自己从事的活动具有较高价值。凡是用户认为具 有较高的实用价值,能获得高效益的知识内容,用户会千方 百计甚至不惜重金去搜集。现在世界上许多国家都在花大量 的精力和时间进入Internet,并在网上漫游。其主要一点就 是网络信息具有很强的实用价值,能给人们带来较大的经济 效益。几乎每个国家每年都要花大量经费购买对本国经济科 技发展有重要价值的专利,这些都是最好的证明。显而易见, 利用网络信息资源的价值的本质体现,就在于它的“高效 性”,即有较高的学术价值和实用价值,它的价值性给用户 提供了方便,带来了效益,同时也为科研、教学提供素材和 参考,了解科技的发展动向,便于人们及时掌握学术水平的 发展及动态。
信息检索

? 狭义的网络信息检索——指网络搜寻——利用相应的检索工具或检索系统,运用科学的方法,从有序的信息集合中查出所需信息的过程。
5.信息检索新策略
? 目前综合性搜索引擎的特点是查找范围很广而深度和专业性不够。
? 实行“元搜索”,即利用元搜索引擎先对综合性搜索引擎进行主题相关的检索,分析返回页面,下载结果URL,将得到的页面进行分析、存储、提取,得到一个庞大的初始结果集。再利用这个结果集对超链进行一定的分析判断后,按照传统的沿链递归方法“爬行”,对结果集进行扩展。利用这种检索策略,既需要掌握知名综合性搜索引擎的使用方法,又需要了解专业引擎和元搜索引擎的特点。
? 智能代理是在人工智能技术上发展起来的,常见的应用功能有资源挖掘、资源集成(沟通网络上不同物理位置的分布资源)和资源定制。
? 检索领域中的智能代理的研究就是要Agent去模仿人在信息检索中的行为(思考、比较、甄别、去重、判断、评估等等),并主动完成一系列高级、复杂的自动处理任务,而不是机械、被动地代理用户完成任务。
主题目录方式:主题目录方式的优点是可通过浏览的方式层层遍历,找到所需要的信息线索,再通过信息线索链接到相应的网络信息资源。该方式具有系统性、可扩充性、结构清晰、使用方便的优点,但更适合于建立专业性网络信息资源体系。
超媒体方式:超媒体技术是超文本与多媒体技术的结合,它将文字、表格、声音、图像、视频等多媒体信息以超文本组织起来,使用户可以通过高度链接的网络结构在各种信息库中自由航行,找到所需信息。
10.跨语言检索技术
? 跨语言信息检索是指使用一种语种的提问查询不同语种的检索技术,例如,输入的是中文的提问式,信息检索系统将返回英文、法文或其他语种描述的相关信息。结果信息资料可以是文本信息,也可以是以其他形式存在的信息。目前研究的较多的是文本信息与语音信息的跨语言信息检索。
5.信息检索新策略
? 目前综合性搜索引擎的特点是查找范围很广而深度和专业性不够。
? 实行“元搜索”,即利用元搜索引擎先对综合性搜索引擎进行主题相关的检索,分析返回页面,下载结果URL,将得到的页面进行分析、存储、提取,得到一个庞大的初始结果集。再利用这个结果集对超链进行一定的分析判断后,按照传统的沿链递归方法“爬行”,对结果集进行扩展。利用这种检索策略,既需要掌握知名综合性搜索引擎的使用方法,又需要了解专业引擎和元搜索引擎的特点。
? 智能代理是在人工智能技术上发展起来的,常见的应用功能有资源挖掘、资源集成(沟通网络上不同物理位置的分布资源)和资源定制。
? 检索领域中的智能代理的研究就是要Agent去模仿人在信息检索中的行为(思考、比较、甄别、去重、判断、评估等等),并主动完成一系列高级、复杂的自动处理任务,而不是机械、被动地代理用户完成任务。
主题目录方式:主题目录方式的优点是可通过浏览的方式层层遍历,找到所需要的信息线索,再通过信息线索链接到相应的网络信息资源。该方式具有系统性、可扩充性、结构清晰、使用方便的优点,但更适合于建立专业性网络信息资源体系。
超媒体方式:超媒体技术是超文本与多媒体技术的结合,它将文字、表格、声音、图像、视频等多媒体信息以超文本组织起来,使用户可以通过高度链接的网络结构在各种信息库中自由航行,找到所需信息。
10.跨语言检索技术
? 跨语言信息检索是指使用一种语种的提问查询不同语种的检索技术,例如,输入的是中文的提问式,信息检索系统将返回英文、法文或其他语种描述的相关信息。结果信息资料可以是文本信息,也可以是以其他形式存在的信息。目前研究的较多的是文本信息与语音信息的跨语言信息检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 搜索引擎概述
导航栏内栏目有:医学继续教育、会议、资源中心、 患者教育、图书馆、讨论区。医学教育为其特色栏目。 也提供多种数据库检索:Medscape是检索自身网站 的资源;Medline是美国国立医学图书馆提供的覆盖全 球近4800种医学期刊的全文数据;Druginfo是 FirstDatabank和美国医师协会提供的最大的药物数 据库,可查询20万种药物的使用剂量、毒副作用、使用 注意事项等内容。
第三章 网络信息资源检索
第一节 第二节 第三节
网络信息资源概述 搜索引擎概述 网络免费信息资源检索
第一节
网络信息资源概述
网络信息资源定义和特点 网络信息资源的类型
第一节
网络信息资源概述
一、网络信息资源定义和特点 1.网络信息资源的定义
网络信息资源是指以电子数据形式将文字、图像、 声音、动画等多种形式的信息存放在光、磁等非印刷 载体中,并通过网络通信、计算机或终端等方式再现 出来的信息资源的总和。
提供根据疾病名称、所属学科和内容性质(会议报告、 杂志文章的全文或摘要等)的英文着个字母的分类检索 (The Medscape Index)。在主页的首页可直接进入临 床管理系列(Clinical Management Series)、杂志全 文(Journals)、实用指南(Practice Guidelines)、指 南进展、杂志扫描、会议摘要和时间表、专家提问和讨论、 临床挑战等栏目。
(4)用户服务组信息资源
各种各样的用户服务组,保罗 新闻组信息资源、电 子邮件信息资源、邮件列表、专题讨论组等,都是因 特网上最受欢迎的信息交流形式。他们都是由一组对 某一特定主题有共同兴趣的网络用户组成的电子论坛, 用户以邮件形式进行网上交流和讨论。用户服务组信 息资源是一种丰富、自由和开放性的资源。
(3)内容丰富,形式多样
网络信息资源内容包罗万象,覆盖了不同学科,不同领 域,不同语言的信息资源,形式上包括文本、图像、声音、软 件、数据库等。是多媒体,多语种,多类型信息的混合体。
(4)自由发布,交流直接
提供了自由发表个人见解的空间和获取非出版信息的机会。 包括哪些正式出版物中所不能得到的信息,如类似于灰色文献 的信息,还未成熟的观点、教学资料等,网络扩大了人际交流 的空间,如新闻组,讨论组等,它提供一种开放的双向信息流 通方式,可以形成广泛的论坛氛围。
第一节
网络信息资源概述
2.网络信息资源的特点
(1)数量巨大,增长迅速
网络信息资源虽然出现较晚,但其数量增长迅猛。
(2)变化频繁,良莠不齐
信息发布的自由造成网络信息呈爆炸式增长,精加工信息 与与未经过任何过滤的低质量信息并存,造成信息的良莠不齐, 信息资源的更迭、消亡无法预测。
第一节
网络信息资源概述
第一节
网络信息资源概述
(3)网络数据库
网络数据库是借助于因特网、以web为检索平台提供 信息检索服务的数据库,是数据库技术与web技术结合的 产物。网络数据库所储存的信息都是经过人工严格收集、整 理加工和组织的具有较高学术价值、科研价值的信息资源。 许多著名的国际联机数据库检索系统(如Dialog)都开设 了与因特网的借口,用户可以通过远程登陆或以WWW方 式进行付费检索。有许多从事传统信息服务的机构开发了网 络数据库,如EBSCO公司的BSP(商业资源数据库)、万 方数据资源系统,CNKI等,都是由专门的信息信息机构或 公司来制作维护。
第二节 搜索引擎概述
(3)PhysLink(/) 1995年由麦克马斯特大学建立,为物理和天文学的研 究和教育提供了一个全面的网络资源、工具、服务和门户站 点。其信息和服务包括:重要文章(Cover Story)、请教 专家(Ask Experts)、就业机会(Physics Jobs)、科学 软件资源站点目录(Science Software)、科技参考资料 (Science Reference)、物理院系(Physics Departments)、物理学会(Physics Societies)、科 学期刊(Scientific Journals)、研究生咨询(Graduate Advisor)、物理新闻(Physics News)、高科技公司 (HighTech Companies)等。
(2)联机馆藏目录 网络上许多机构提供馆藏书目信息和中外 文期刊联合目录信息, 包括各图书馆和信息机 构提供的公共联机检索(OPAC)馆藏书目、 地区或行业的图书馆的联合目录等。全国高等 教育文献保障体系(CALIS)提供多所高校的 馆藏期刊、书目和学位论文联合查询。用户只
要通过图书馆的URL,就可以查询该馆的 图书馆馆藏,不受时间地点的限制。
第一节
网络信息资源概述
2.按照信息加工层次划分
(1)网络资源指南和搜索引擎
网络信息检索工具有资源指南和搜索引擎之分。资源指 南按主题的等级排列主题类目索引,用户通过逐层浏览类 别目录,逐步细化的方式来寻找合适的类别直至具体的资 源。搜索引擎强调检索功能,是个专用的WWW服务器, 收集了全世界上千万个WWW主页信息。
第一节
网络信息资源概述
二、网络信息资源的类型
1.按照所采用的网络传输协议划分 (1)WWW信息资源
WWW(world wide web)信息资源,也称为 WEB信息资源,是一种基于超文本传输协议(HTTP)的, 在WWW客户端和服务端之间传输,建立在超文本、超媒体 等技术基础上,集文本、图像、图形、声音等为一体,以网页 形式存在,以直观的图形用户界面展现的一类信息资源形式。 WWW信息资源自20世纪90年代问世以来,得到了迅速发 展,现在已经是因特网上信息资源的最主要、最常见的形式, 这类信息资源一般通过搜索引擎进行检索。
第二节 搜索引擎概述
二、搜索引擎的类别
1.综合类搜索引擎 指在检索过程中不限制检索信息的类型和主题范围, 以所有网络信息资源为检索对象,检索结果包括所涉 及的任何领域、任何方面的网络信息资源。 源
第二节 搜索引擎概述
第二节 搜索引擎概述
1.分析器的主要功能是对采集器robots搜集来的网页信 息或者下载的文档进行分析,以用于建立索引,这些 分析包括分词、过滤及转换等。 2.索引器的功能是对采集器所搜索的信息进行分析处理, 从中抽出索引项,用于表示文档以及生成文档库的索 引表。 3.检索器将用户查询与系统资源进行检索匹配,并根据 一定的算法将相关网页排序输出。 4.用户接口是系统提供给用户进行检索交互的,要求提 供检索窗口,特定的检索功能,接受用户检索要求, 将用户的检索要求编制成计算机可执行的规范化检索 式,提供用户相关信息反馈机制,现实检索结果。
第一节
网络信息资源概述
(5)网上动态消息
网络的开放性和交互性,使得网上有很多动态性很 强的信息,如网上新闻、BBS、政府机构发布的信息、 政策法规、会议消息、研究果等。
(6)其他网络信息
网上还有大量的电子邮件以及娱乐游戏、教育培训、 应用软件等信息。
第二节 搜索引擎概述
一、搜索引擎的搜索原理
搜索引擎是一个服务器程序,通过特定的检索软件,检索 自己的索引数据库并将检索结果交给用户。一个完整的搜索引 擎包括数据采集器、分析器、索引器、检索器和用户接口。
用 户 INTERNET 采 集 器 分 析 器 索 引 器 索引数据库 检 索 器 检 索 器
用 户
第二节 搜索引擎概述
搜索引擎的核心是采集器robots, robots是一个在 网络上检索文件且自动跟踪该文件的超文本结构,并循环 检索被参照的所有文件的软件。主要功能是根据预先设定 好的一组规则来搜集因特网上的信息,网页爬虫在各网址 中爬行,访问网络中公开区域的每一个站点并记录其网址, 创建详尽的网络目录。
(4)电子出版物
以数字代码形式将文字、图像、声音、视频等信息 存储在磁、光、电介质上,通过因特网传播,并通过 电脑或相关设备阅读的出版物,包括电子图书、电子 期刊和电子报纸等。现有的电子出版物,有的是传统 纸本文献的电子版本,也有的是完全以数字化形式编 辑、制作、出版和发布,并形成网络化形式发行。
第二节 搜索引擎概述
在物理与科学检索中,包括许多重要实验室网站检索,如 Lawrence Livermore国家实验室、欧洲粒子物理实验室 (European Laboratory for Particle Physics)、太阳 与空间观察室(Solar & heliospheric Observatory)等, 而且还有数据库和出版物网站,如美国国家海洋与气象局数据 库、科学家通讯、应用光谱学杂志等。 PhysLink的另一重要内容是它的物理资料,罗列了重要 物理常数、网上单位换算、物理公式、核物理数据、粒子物理 数据、表面物理数据、网上元素周期表、材料安全信息、各种 奖项信息、教育资源等。
(5)检索方便,价廉实惠
用户可以根据需要和已知信息任意选择检索方式与 入口,进行自然语言检索、全文检索,可迅速找到所 需内容。输出的信息按照相关型大小排列,检索信息 更全面准确。
(6)分散无序,缺乏管理 海量的信息和快捷地传播加剧了网络信息的无序
状态,许多信息资源缺乏加工和组织,网络信息的地 址、链接、内容出于经常性的动态变化之中,缺乏统 一管理机构控制,没有统一标准,缺乏质量控制和管 理机制。
2.专业类搜索引擎
专业类搜索引擎又称垂直型搜索引擎,是专门检索某一类 型、方面、学科、主题信息资源的搜索引擎。对某一特定信息 资源的描述、介绍都非常详细和专业,具有学术性强、针对性 强、目标明确、查准率高而全的特点。常用专业搜索引擎有如 下几种: (1)美国Medscape() 美国Medsite publishing 公司于1997年7月在 WWW上建立的著名医学搜索引擎,提供医学主题的分类目 录浏览和站点检索的功能。可检索图像、声频、视频资料,至 今共收藏了近20个临床学科25000多篇全文文献。