最新网络信息检索的工具

最新网络信息检索的工具
最新网络信息检索的工具

网络信息检索的工具

[摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。

[关键词] 信息检索中文搜索引擎存在的问题发展方向

随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型

搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。

目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。

1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内

著名的新浪、搜狐、中文雅虎都属于这种类型。

2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。

机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。

3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。

二、现阶段中文搜索引擎存在的主要问题

1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。

2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

国内绝大多数的网站组织的信息大多都是通过浏览方式获得内容。即使是经过精心组织、编排非常合理的网站,也会有70%~80%的网页不能被搜索引擎检索到。中文目录式搜索引擎因需人工介入、维护量大,在这方面表现较明显。

3.查准率较低。查准率更是判断检索系统质量的重要尺度。是指系统所检索到的真正与查询内容相关的文档占检索出的所有文档数的百分比。

造成查准率低的原因是,部分搜索引擎的分类体系与科学知识体系之间缺乏内在联系;类目之间逻辑关系模糊,导致检索路径与搜索引擎类目错位;信息加工深度不够;检索功能单一;检索词的专指性较差;大部分的检索结果是题录式而非全文式,其内容简单等等。机器人搜索引擎的分类和索引缺乏人工的参与,其查准率不如目录式搜索引擎,且检索结果中还含有大量的重复、虚假的信息。 4.专业性的搜索引擎发展迟缓。专业性的搜索引擎是为专门收录某一行业,某一主题的信息而建立,能够提供专题信息查询服务的搜索引擎。目前中文搜索引擎大多是综合性的,能同时收录各行业、各学科的多种信息,但在反映某一行业或某一专题的信息方面很难做到全面、精确,不能给用户提供特定的信息服务。这就使得专业人员,特别是某一领域的学者、专家不愿意利用中文搜索引擎去查询资料。

5.检索功能方面存在缺陷。一是检索中符合布尔逻辑运算符的搜索引擎极为有限;二是关键词检索输出的结果相关度排序方式杂乱,不能根据用户需要来选择信息输出的方式;三是多数的搜索引擎是面向主题搜索不是面向用户搜索,不能重复利用用户检索过的成果,更不能对特定的用户进行定题跟踪服务;四是检索网站的主页不规范,有些太简,有些又太繁,而且广告内容太多,无法进行有效检索。

三、中文搜索引擎的发展方向

1.提高查全率。首先是需要开发分布式的系统。这种系统可以把各个接点当作

是新的信息资源,扩大数据库的规模,正在兴起的元搜索引擎属于这种系统,它在接受了用户的查询命令后,可同时用多个搜索引擎进行查询;二是把专业数据库资源纳入自己的检索范围。除了Web信息资源外,网上还有大量的非Web信息资源,如联机检索系统、光盘检索系统、专业数据库系统。如中文搜索引擎能把这些Web和非Web资源结合起来使用,即使有的只能查到题录、文摘等内容,也大大扩展了检索范围,能为用户提供较全面的检索需求。

2.提高查准率。需解决以下几个难关:首先需提高搜索引擎的信息过滤功能。在对网络信息进行集中的搜集之后,搜索引擎还需对这些信息进行鉴别和过滤,即剔除大量的无用信息,而把有效的信息提炼出来并加以聚集;第二则是需对专家过滤后的信息进行一定的检索标引,并给予相关的标识符号,如关键词、分类号、主题词等各种标识,其关键是利用智能检索技术,提高准确性;把检索的结果存储在相应的数据库中,并由URL与Internet建立链接供用户使用;还需注意信息定期更新,以保证信息的新颖性和链接的可靠性。

3.建立垂直化专业领域的搜索引擎。网络用户所从事的职业千差万别,不同的用户对信息搜索往往有不同的要求。综合性的搜索引擎收录的范围太广、太大无法满足某一特定的需求。垂直化专业搜索引擎则可解决这一难题。它只面向某一特定的领域,专注于自己的特长和核心技术,能保证对该领域的信息的收录齐全与更新迅速。在提供专业信息方面有着大型综合搜索引擎无法比拟的优势,所采用的技术都是些较成熟的技术。

中文垂直化专业搜索引擎的发展已取得了一定的成功,如新浪的新闻搜索,博客搜索、雅虎的个性化旅行路线搜索、百度的MP3搜索、Google的学术搜索,航班搜索等都为用户提供了较好的搜索功能,为今后的继续发展奠定了基础。

4.搜索引擎的智能化发展。智能搜索引擎是未来搜索引擎的发展趋势。可以通过自然语言与用户交互,最大限度地了解用户的需求。智能检索一是表现在搜索引擎技术的智能化,研究重点放在自然语言处理技术和人工智能技术的研究上;另一表现是体现在搜索引擎面向检索者的智能化,它致力于通过分析检索者的检索和浏览行为来学习检索者的需求,利用搜索引擎现有的服务有选择地为检索者提供个性化的服务。

5.加强搜索引擎的检索功能。首先需强化全文检索功能。利用Robot实现对站点页面文字内容的全面检索技术。比起目录检索,全文检索提供了全新的检索功能,可以直接根据文献资料的内容进行检索,支持多角度、多侧面地综合利用信息资源,全面、准确、快速是衡量全文检索系统的关键指标;同时改善用户检索界面,设计简洁、明白的界面引导用户进入检索状态;更方便、实用的检索技巧的利用,中文搜索引擎需简化和统一语法规则,如布尔逻辑检索符号的利用:空格或“*”代替“与”、“+”代替“或”、“-”代替“非”,规范语法符号,节省用户的检索时间;还需研发查询图像、声音、图片和电影的搜索引擎。

6.完善元搜索引擎。元搜索引擎弥补了独立搜索引擎不全的特点,提高了检索的全面性。现开发出的中文元搜索引擎的数目很少,还有诸多缺陷,需在各方面进一步改进。

元搜索引擎要对各独立的信息特色进行较细致的调查,以确定自己要收录的范围;在对目标搜索引擎的组织中突出独立搜索引擎的检索特色,并设计各搜索引擎之间的检索方式的转换算法,提高用户检索行为的针对性;建立更为灵活的,面向用户的信息检索服务。检索界面要统一和友好,检索方法的设置要提供给用户更多的自由空间,使用户可以按照自己的意愿合理的组织检索式;在检索结

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

网络信息检索及其检索工具

摘要 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键字:网络信息检索;检索工具;因特网;web资源检索

目录 摘要 .......................................................................................................................................... I 1 信息检索的定义. (1) 2网络信息检索简介 (1) 2.1网络信息检索定义 (1) 2.2 网络信息检索的原理 (1) 2.3网络信息检索与传统信息检索的区别 (2) 2.4网络信息检索技巧 (2) 3网络信息检索工具类型 (3) 3.1非web资源检索工具 (3) 3.2web资源检索工具 (3) 4网络信息检索工具的功能 (4) 5网络信息检索展望 (5) 5.1网络信息检索的展望 (5) 5.2网络信息检索工具展望 (5) 参考文献 (6)

浅谈网络信息检索及其检索工具 1 信息检索的定义 什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 (1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询

网上搜索的方法和技巧

网上搜索的方法和技巧 我们已经知道网上有多种多样的教育资源,从技术上讲,它们是在Internet的多种服务功能的支持下实现的,包含WWW、e-mail、Usenet、FTP、BBS等,其中发展最快,也是最为流行的是WWW。因此我们着重介绍WWW信息的检索方法。 据1999年底的统计,网上大约有15亿个网页,并且以每天增加190万个网页的速度在增长,到2002年已达到80亿个网页。要想在这么大的一个资源库中查找一条具体 的信息,犹如大海捞针一般。因此,有人发出这样的感叹:"我们淹没在数据资料的的海 洋中,却又在忍受着知识的饥渴"。 现在出现了许多种在网上查找信息的方法。这些方法可以分为两类:一类是有既定目标的查找,一类是没有目标的查找,而后者往往是指一种网上"冲浪"游戏。在具有既定目标的情况下,如果已有信息线索,可以用浏览器航行的办法寻找信息对象;如果信息线索未定,则需要利用搜索工具首先获得信息线索。 搜索工具又有传统工具和现代工具之分。传统工具是在索引数据库中进行主题树/目录检索或KWDSEs(关键词搜索引擎)进行建设而索引库的建设是一个极其繁重的任 务,现在已经可以利用"机器人"程序来帮忙,它们通过跟踪最新建立的HTML网页的URL对整个网络进行浏览,可以在网上从这一个网站爬到另一个网站,并记录下它们访问过的网页的各自特征(这种只有十来年历史的搜索技术就被称为传统工具了,你觉得 奇怪吗?)。而现代搜索工具是利用智能代理来工作,它们不是对整个网络进行索引,而 是在接到一个新任务时就出发,去搜索网上资源并提取有价值的信息。因此,智能代理 是利用神经网络技术进行搜索,它试图去发现自然语言与样本网页的模式及它们之间的 相互关系,这些将与新近发现的网上资源相匹配,最后以一串网址的形式供用户访问。 图2_3_10显示了网上信息检索工具的选择方法。

江苏开放大学网络学习工具及应用第二次

江苏开放大学 形成性考核作业 学号 姓名张婷婷 课程代码:110010 课程名称:网络学习工具及应用(专) 评阅教师: 第 2 次任务(书面作业) 共 4 次任务(书面作业)

作业说明: 1.做作业之前首先在封面填上自己的学号和姓名,做完作业后请写上作业完成时间。 2.学习完第三、四单元内容之后必须完成本次作业,并请在规定时间内通过学习平台提交Word文档形式的电子作业,本次作业占形成性考核总成绩的20%。 作业内容: 一、不定项选择题,请将正确选项填入括号中,最后再填入以下表格(每题3分,共48分, 题号 1 2 3 4 5 6 7 8 答案 B D C A ABCD ABCDE ACDE ABCDE 题号9 10 11 12 13 14 15 16 答案ABCDE ABCDEF B ABCD AB ABD C AB 1、超市收银员用条码阅读器对商品上的条形码进行扫描,以获取相应的信息。这个扫描过程一般被称为( B ) A.信息的编码 B.信息的采集 C.信息的发布 D.信息的表达 2、用户在网上最常用的一类信息查询工具叫做( D )。 A. ISP B. 离线浏览器 C. 网络加速器 D. 搜索引擎 3、小赵填报高考志愿前想上网查后各个学校的情况,他通过百度首页打开如下左图所示页面,单击“大学搜索”超链接后,在右图所示页面中查找感兴趣的学校。这种信息检索方法属于( C ) A.全文检 B.关键字检索 C.主题目录检索D.自动网页检索 4、网络检索需要用到多项技术,其中有一项是全文检索。全文检索是一种从全文中检索所需信息的检索技术,其检索的对象为( A ) A.文本 B.图像 C.声音 D.视频 5、在网上查找所需学习资源时,下面哪方法可以使用:( ABCD ) A.利用综合性门户网站; B.利用搜索引擎; C.利用专业或专题资源网站; D.利用专业数据库 E.电子商务平台 6、网络上提供的学习资源主要分布在:(ABCDE )

网络信息检索与利用参考试题与答案

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借 助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。www:信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一 种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的 比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定 主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。 All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类 型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。联 合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单 位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工 作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1. 网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP(2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一

高中信息技术基础作业

高中信息技术基础作业 信息与信息技术-1 课程内容:教科版第1.1节和1.2节 教学目标: 1.通过列举身边的各种信息,感受信息的丰富性,形成对信息的感性认识。 2.结合具体例子描述信息的外在的重要特征,如价值性、时效性、可伪性、共享性、依附性等。 3.了解信息技术的发展历史,能描述几个重要阶段的基本特征。 4.结合信息技术的应用实例描述信息技术的发展趋势。 教学重点:理解信息的基本特征,了解信息技术的历史和发展趋势。 课标条目:描述信息的基本特征,列举信息技术的应用实例,了解信息技术的历史和发展趋势。 基础要求:能举例说明信息的特征,能结合实例描述信息技术的发展趋势。 条件要求:计算机教室、教室 1. 天气预报、市场信息都会随时间的推移而变化,这体现了信息的() A.载体依附性 B.共享性 C.时效性 D.必要性 答案:C 2. 信息不能独立存在,需要通过载体来呈现,这说明信息具有( ) A.载体依附性 B.传递性 C.时效性 D.真伪性 答案:A 3. 到目前为止,人类一共经历了( )信息技术革命,其中语言的使用是从猿进化到人的重要标志。 A.三次 B.四次 C.五次 D.六次 答案:C 4. 信息技术有着悠久的历史,它将向( )方向进一步发展。 A.商业化 B.大众化 C.人性化 D.人性化和大众化 答案:D 5. 下列关于信息技术的认识,错误的是( )。 A.信息技术是一把双刃剑,对社会既有积极的一面,还有消极的一面 B.青少年不用学习信息技术,只要一心读书就行 C.青少年不能过度崇拜信息技术,也不能盲目排斥信息技术 D.青少年学生应合理利用信息技术来做更多有意义的事情 答案:B 网络信息检索-3 课程内容:教科版的2.2和2.4 教学目标: 1.学会正确使用关键词搜索信息。 2.描述“全文搜索”、“目录索引搜索”和“在线数据库检索”的区别。 3.知道几种常见的搜索引擎的功能区别。 4.能够下载网页上的文字、图片、动画等信息。 教学重点:学会使用关键字搜索需要的信息,并且掌握一定的搜索技巧 课标条目:掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。 基础要求:能够熟练使用浏览器,对于信息有一定的基础认识,知道如何从要搜素的信息

网络信息检索方法与应用

网络信息检索方法与应用 摘要 随着Internet在全世界范围内迅猛发展,使人们获得有用信息越来越困难,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 关键词检索方法工具重要性 翻译summary With the rapid development of Internet in the world, to make people more and more difficult to obtain useful information, online information and huge numbers of people to obtain information contradiction between the increasingly prominent.Therefore, the retrieval of information technology and its development trends of the network to explore and research, is both urgent and practical issues.In this paper, the basic principle of network information retrieval techniques and tools of network information retrieval, information retrieval network status and other aspects of analysis, and the development trend of network information retrieval predicted, the network aims to find ways to improve information retrieval by means of and effective way to approach, and ultimately improve the effect of network information retrieval, making the network information resources can be fully effective use. Keyword Retrieval means Importance 一信息检索技术 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。 1 信息检索的广义含义

网络信息检索与利用考察题

陕西师范大学网络教育学院 考查题 题目网络信息检索与利用 姓名 学号 专业 批次/层次 指导教师 学习中心

作业一: 一、说明信息检索的步骤 答:(1)确定检索方向.这是使检索获得满意结果的先决条件,为此必须弄清所需信息的诸特征,如学科归属、主题概念、时间界限、文献类型、国别和语种等. (2)确定检索方法.一般有三种方法: a.正文法——从主题、分类、作者等途径查找. b.引文法:又叫追溯法,即着眼于文献所附的参考或引用文献目录.(SCI) c.交替法:正文法和引文法交替使用. (3)确定检索工具.根据学科专业、语 种等,选择一种或多种检索工具或检索引擎. (4)确定检索途径.主题、分类或作者 (5)实施检索.注意检出一批结果后,应浏览题目和文摘,判断是否满足要求,并加以筛选,若感到不满意,应及时修改检索策略,加以调整,再行检索,直到满意为止. (6)索取原始文献.检出结果通常是文献线索,还不是原始文献.为了索取原始文献,还须进行两项工作: a.辩识文献款目,包括文献类型、来源出版物名称等; b.查找原始文献的收藏单位,先从本单位、本地区入手,利用馆藏目录和联合目录(联网目录),找到原始文献收藏单位,即可通过借阅、复制或网上传送、馆际互借等途径获得文献.

二.简述信息检索的原理 答:1.信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻 2.信息检索是指从信息资源的集合中查找所需文献或查找所需文献中包含的信息内容的过程。 3.信息检索原理:信息的存储是实现信息检索的基础。这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等,首先要将这些原始信息进行计算机语言的转换,并将其存储在数据库中,否则无法进行机器识别。待用户根据意图输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与查询相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。 三、说明一次文献,二次文献和三次文献的特点和工用。 答:一次文献,就是人们通常所说的原始文献。属于这一类文献的有科技论文、会议文献,学位论文、研究报告、专利说明书、产品样本、技术标准等等。一次文献又称一级文献,区别于经过加工整理、重新组织的二、三次文献。一次文献大多发表在科技期刊上。哪些期刊主要刊登一次文献呢?一般说来,中文科技期刊凡是以?学报?命名的如《物理学报》、《数学学报》等,都主要刊登一次文献。同时,一次文献常常以图书形式出版。确定一篇文献是否为一次文献,主要是根

网络营销的工具及其应用教学内容

网络营销的工具及其应用 网络营销就是利用网络进行市场营销活动,包括:展示、宣传、广告、销售、服务、管理、甚至是物流等。网络营销的产生,是科学技术的发展、消费者价值观的变革和商业竞争等综合因素所促成的。网络营销的主要目的是利用网络及传统渠道与客户(无论是网上还是网下)建立积极的、长期的关系,由此使企业可以对自己的产品和服务收取比竞争对手更高的价格,为企业创造竞争优势 一、网络营销的工具 (一)网络营销常用的工具,优势和特点 (1)企业网站。 ●优势: 1.通过网站展示单位风采、传播文化、树立形象。 2.通过网站可介绍单位的基本情况,使经销商和用户更多的知道您的存在。 3.在网上您可以直接看到您产品的照片、型号或服务类型。 4. 通过网站您可以利用电子信箱经济而又快捷地与外界进行各种信息沟通。 5.通过网站您可以寻求合资与合作。 6.提供即时商业讯息,商品目录,广告行销内容。 ●特点: 1.企业网站具有自主性和灵活性。 2.企业网站是主动性与被动性的矛盾的同一体。

3.企业网站功能需要通过其他网络营销手段才能体现出来。 4.企业网站的功能具有相对稳定性。 5.企业网站是其他网络营销手段和方法的基础。 (2)搜索引擎。 ●优势: 1.检索结果深加工。 2.传播速度快,资金投入相对小 3.`提供个化服务。 4. 基于智能搜索。 ●特点: 1.与企业网站密不可分。 2.搜索引擎传递的信息只发挥向导作用。 3.用户主导的网络营销方式。 4.搜索引擎营销可以实现较高程度的定位。 5.效果表现为网站访问量的增加而不是直接销售。 6.需要适应网络服务环境的发展变化。 (3)电子邮件。 ●优势: 1. 通过键盘输入,可以快速书写,也可以编辑和储存。 2.可以发送附件和大容量的附件。 3.不同的服务商直接也可以发送。 4.接受方不在的时候也可以接受邮件,在方便的时候再阅读。 5.成本低。

《网络信息检索与优化技术》课程大纲

《网络信息检索与优化技术》教学大纲 一、课程基本信息 1.课程名称:网络信息检索与优化技术(Network Information Retrieval and SEO Optimizing Techniques) 2.课程管理:信息科学学院 3.教学对象:计算机科学与技术专业 4.教学时数:总时数36学时,其中理论教学18学时,实验实训18学时。 5.课程学分:2 6.课程性质:专业必修 7.课程衔接: 1)先修课程一:计算机网络技术 重要知识点:计算机组成原理,TCP/IP协议,路由和交换设备,网络编程技术,计算机网络操作系统,信息系统安全评估 2)先修课程二:软件工程 重要知识点:网络编程,面向对象程序设计与开发,数据库技术 3)后续课程:综合实训、社会实践、顶岗实习 二、课程简介 《大数据舆情分析技术》课程是计算机网络专业学生的专业必修课,也是学生将来从事舆情分析专业工作的必修课程。在大数据时代,网络已成为政府和企事业单位了解民意的重要渠道,网络舆情作为当今民情民意反映的晴雨表,其巨大的影响力不但能够左右社会上重大事件的发展走向,也能影响社会公共管理的决策。事实上,网络舆情已经成为政府决策的重要参考依据之一。 《大数据舆情分析技术》课程涵盖的知识领域广阔,包括:新闻学、媒体传播学、公共管理学、舆情管理。本课程突出案例教学特点,将多学科知识融会贯通到一起,将创新的授课内容传授给学生,学生不仅仅是一个学习者,也是一个创新思考者,更是项目的主导者。有鉴于此,本课程将围绕以下5方面内容开展教学: 1)舆情研究的历史和发展趋势; 2)网络舆情传播规律; 3)舆情管控和舆论引导; 4)舆情检测平台应用。 5)电子政务与社会化媒体的管理 网络信息检索与应用课程是计算机网络技术专业学生必修的一门重要专业课。该课程内容包括信息检索的基础知识,互联网信息检索方法和技巧、发布信息优化技巧等。学生通过本课程的学习,能够快速、准确、有效地获取网络信息资源,掌握互联网发布信息的优化技巧。这对学生积累专业知识,提高自学能力,更加高效的利用互联网资源提供了有力保障

《网络信息检索》教案

“网上资源检索”的教学设计 温州市龙湾区永强中学陈占泽 一、教学设计背景信息 1.模块:高中信息技术基础 2.年级:高中一年级 3.所用教材版本:浙江教育出版社 4.学时数:1学时 二、教材分析 本课的课程标准内容: (一)信息获取 (2)知道信息来源的多样性及其实际意义;学会根据问题确定信息需求和信息来源,并选择适当的方法获取信息。 (3)掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。 (4)掌握信息价值判断的基本方法,学会鉴别与评价信息。 本课的《学科教学指导意见》内容:第2.3 网上资源检索 基本要求:1.掌握通过搜索引擎检索网络信息的方法。 2.掌握通过主题目录检索网络信息的方法。 发展要求:掌握网络搜索的技巧。 教材内容分析: 本课内容是在学生已经学习了浙江教育出版社《信息技术基础》教材第二章“信息的来源和获取”第1、2节内容基础上开展的网络资料检索教学,是学习信息组织和信息处理的基础,也是学生信息素养的一项基本技能。本课确定以“中秋节”为主题,用不同的搜索方法来获取

所需信息,同时渗透获取有效信息的思想方法。 三、学情分析 我们是普通高中学校,高一年级的学生对网络已经不再陌生,大部分学生已经具备了使用网络的感性经验,也知道用百度、谷歌搜索引擎查找信息。但在获取信息的过程中会遇到搜索结果多,筛选困难、搜索技巧单一等问题。因此教师要在学生原有的认知基础上,提升对搜索结果进行适当的鉴别能力。同时考虑到学生信息技能参差不齐,引导学生进行自主学习和小组协作学习。 四、教学目标 1、知识与技能: 1)掌握搜索引擎获取信息的一般方法; 2)了解评价因特网信息资源的三种主要方式。 3)能区别主题目录和搜索引擎的不同特点。 2、过程与方法: 1)通过搜索“中秋节”的相关信息,提高自主学习、解决问题的能 力; 2)通过对搜索结果的筛选,培养学生信息评价的能力。 3、情感态度与价值观: 1)通过搜索中国的不同传统节日信息,增进对传统文化的了解和认 同。 2)能负责任地、健康地使用信息,形成良好的信息技术使用习惯。 五、重点难点 1、教学重点:掌握搜索引擎获取信息的一般方法,掌握搜索引擎的使用技巧。

检索工具的分类

1.检索工具的分类 (1)按照信息搜集方法分类 按照信息搜集方法的不同,搜索引擎系统可以分为三大类: 1)目录式搜索引擎(Directory Search Engine) 以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory. 2)机器人搜索引擎(Crawler-Based Search Engine) 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google. 3)元搜索引擎(Meta Search Engine) 这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket. 目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有"门户化"的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的"网络门户". (2)按照检索软件分类 按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。 全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。 非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。 主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。 (3)按照检索语言分类 目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。 2.全文数据库的检索软件 (1)Alta Vista 检索引擎 Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库,Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的

网络信息检索期末考试试卷及答案

绵阳师范学院历史文化与旅游管理学院 第一部分(基础知识部分,共三大题,共60) 一、填空题(每空1分,共30分) 1 ?信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2. 知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3. 情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4. 文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5 ?会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6 ?学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8 ?数据检索是指特定的数值型数据为对象的检索。 9. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10. Internet 是基于TCP/IP协议的网络。 11. 二级域名https://www.360docs.net/doc/8414458764.html,是指教育机构。 12. 目前WW环境中使用较多的网页浏览器有Microsoft公司的IE浏览器和360公司的360安全浏览器。 13. 每种网络信息检索工具一般由信息米集子系统、数据库和检索代理软件三部分组成。 14. 大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的: “ +”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中 不能包含的词汇。 15. 一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如, 用site表示搜索结果局限于某个网站。比如,用in title 表示到某个URL地址指定的网页标题内进行检索。比如,用UnJ表示到某个URL地址指定的地址内进行检索。 16. 搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.360docs.net/doc/8414458764.html,/ 17. CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh 需要下载安装CAJViewer全文浏览器软件或亚全文浏览器软件才能阅读这些资源。 18 .维普资讯网的高级检索中,查询语句“ K= (CAD+CAM*R=a械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM勺文献或文摘 19. OPAC中文或者英文的解释是联机图书馆公共检索目录 20. 国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi数字图书馆、中国数字图书馆等。 二「单项选择题(每题1分,共20 分) 1. 下面哪项不是情报构成的三 要素之一( D ) B .经过传递 D.通过购买获取 B?最主要的信息资源 D.按知识门类或专题组织、浓缩而 A ) o A. 期刊文献 B.科技报告 C?专利文献 D.学位论文 4. 报纸区别于其它文献的特征是( B )o A. 创新性 B.及时性 C.学术性 D.全面性 5. 有法律约束力和一定的时效性,经权威机构批准的规章性文献是 (A )o A.标准文献 B.学位论文 C?档案文献 D.科技报告 6. 一般存在相应二次文献的是( A ) A.期刊 B.产品样本 A.本质是知识 C?经过用户使用产生效益 2. —次文献是(A )0 A.最原始的信息资源 C.对文献的集中提炼和有序化 成 3. 下面哪一项是白色文献(

关于网络信息检索论文

关于网络信息检索论文 信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面我为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。 浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1、信息检索概述 信息检索(InformationRetrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2、网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,

不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3、网络信息检索的现行模式 3.1网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。 3.2网络搜索引擎检索 搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查

网络信息检索听课记录

班级(学校)授课 教师教时1个课时 听课 时间 2012.9.18 下 午第二节课 科目信息技术基础课题 教学过程听课意见一、回顾旧知 ①、确定信息需求,需要确定信息的内容和信息的类型。 ②、确定信息的来源。信息的来源有: Ⅰ、纸质媒介;Ⅱ、电子媒介;Ⅲ、人;Ⅳ、事物。 在回顾的该知识点的时候,教师提供多个情景,让学生进行判断,所提供情景的信息来源分别为什么; (1)、去动物园拍照:信息的来源为事物; (2)、去三坊七巷:信息的来源为事物; (3)、去听讲座:信息的来源为人; (4)、去网络上的查找:信息的来源为媒介。 二、引入新课,新课教授 ①、常见的信息获取方法 讲解常见的信息获取的方法,说明信息来源的多样性决定了信息获取方法的多样性。常见的信息获取方法有: Ⅰ、阅读法:通过阅读报纸、杂志、图书资料获取信息 Ⅱ、观察法:从事物的属性和特征获取信息 Ⅲ、问卷法:发放问卷获取信息 Ⅳ、访谈法:与他人沟通获取信息 Ⅴ、电子检索系统:通过计算机网络获取信息 在众多的信息获取方法中,重点讲解了网络信息获取的方法。 常见的网络信息获取方法包括搜索引擎。 ②、搜索引擎的讲解 Ⅰ、什么是搜索引擎? 搜索引擎是指自动从因特网上搜集并保存信息,按照一定的规则进行编排后,提供给用户进行查询的系统。 Ⅱ、常见的搜索引擎有哪些? 百度,谷歌,搜狗,雅虎,新浪爱问等等。 Ⅲ、使用搜索引擎进行搜索的两种方式 (1)、目录检索 在课堂刚开始,课堂秩序良好,学生跟随老师的思路,回顾旧知,认真听讲,并回答教师提出的问题。 学生认真听讲,根据课本内容,思考回答教师在授课过程中抛出的问题。 学生踊跃回答生活中常用的搜索引擎,如百度,谷歌,雅虎等等。 网络信息检索听课记录表

网络信息检索的工具

致力于打造高品质文档 网络信息检索的工具 [摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。[关键词] 信息检索中文搜索引擎存在的问题发展方向 随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型 搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。 目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。 1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。 2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。 机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。 3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。 二、现阶段中文搜索引擎存在的主要问题 1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。 2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

相关文档
最新文档