元搜索引擎的现状与发展

合集下载

搜索引擎技术的现状及发展趋势

搜索引擎技术的现状及发展趋势
数据库系统, 数据最大的特点就是半结构化。而搜 索引擎文本信息处理的首要任务就是将这些异构 的、 半结构化的信息的结构化处理, 否则一切分析 工作无从谈起。解决这一问题 , 就必须要有一个半 结构化数据模型来描述 Web 上的数据。并且 , 还 需要一种半结构化数据抽取技术。 移动代理 ( Mobile Agent ) 技术 是一种新型分 布式计算技术, 是指在网络上具有移动能力的、 能 够自主运行的、 按照用户的要求完成指定任务的程 序。移动代理技术是新一代分布式计算技术 , 移动 代理与传统分布式计算技术完全不同。在移动代 理模式下 , 客户机向服务器提交的不再是一些简单 的请求, 而是包含代码和数据的移动对象。移动对 象代表用户 , 按照 程序靠近数据! 的原则 , 在服务 器间自主的移动 , 完成数据处理的任务。基于移动 代理的模式之上的应用程序可以大大节省网络带 宽, 有效克服网络延时带来的种种问题, 可以智能 化的自主异步执行。它克服了搜索引擎传统的 数 据靠近程序! 的运行模式 , 大大降低了网络的数据 流量 , 节省了网络资源。 XML( eXtensible Markup Language ) 是一种中介 标示语言( Meta markup Language) , 可以提供描述结 构化资料的格式, 它是类似于 HTML, 被设计用来 描述数据的语言。XML 提供了一种独立的运行程 序的方法来共享数据 , 它是用来自动描述信息的一 种新的标准语言 , 它能使现有网络技 术把 Internet 的功能由信息传递扩大到人类其他多种多样的活 动中去 , 例如电子商务 等[ 8] 。ML 的出现为我们 提供了半结构数据模型抽取的思路。即对站点信 息经过半结构化抽取以后, 产生信息的 XML 语言
3 引擎技术的发展趋势
搜索引擎的发展已经取得了非常令人瞩目的 成就。随着网上信息数量、 种类的不断增加、 服务 需求水平的不断提高, 用户对搜索引擎提出了更高 的要求。当前 , 计算机技术日新月异的发展也为研 制开发高性能的搜索引擎提供了便利条件。 3. 1 各种搜索引擎正在走向不断融合 各种搜索引擎技术并不是一个并行发展的过 程, 而是一个不断融合不断自我完善的过程。这一 点, 上网用户在应用搜索引擎时就会深有体会。元 搜索引擎的出现便是一个典型的例子 , 目录式搜索 引擎的优点是信息准确 , 缺点是信息量小, 目录 的维护耗费的人力资源大; 机器人搜索引擎的优点 是信息量非常大, 耗费的人力资源很小, 但精确度 难以做得很高 ; 而元搜索引擎 则集中了两者 的优 点。 3. 2 基于 Web 的文本信息挖掘技术 基于 Web 的文本信息挖掘技术是将数据挖掘 的思想应用到 Web 文本信息处理中的一项技术 , 它涉及到文本分类、 索引、 聚类、 查询匹配等各项技 术, 它在 Web 个人浏览辅助工具中有着 广泛的应 用。由于引入了数据挖掘、 人工智能的处理方法 , 基于 Web 的文本信息挖掘技术大大提高了文本分 类的准确度、 文本索引对文本描述的全面性以及用 户查询匹配的精度。搜索引擎 Excite 通 过模式提 取和识别抽象化搜索条件与文档之间的关系, 大大 提高了文档的查全率。有人提出了应用模糊方法 构建智能搜索引擎的思想, 即在搜索引擎中引入模 糊方法, 来构建更有效的搜索引擎 [ 7] 。 3. 3 Robot 技术向分布式 、 智能化方向发展 如前所述, Robot 技术大大降低了人工搜集信 息的难度 , 但它的盲目性也给网络带来了麻烦。随 着分布式处理技术的发展, Robot 技术也正在由集 中式向分布式发展 , 即一个 Robot 只对特定区域进 行信息采集, 各个 Robot 之间协同工作 , 这样就大 大提高了 Robot 进 行信息采集的速 度。基于 Web 的文本信息挖掘技术通过对 Robot 采集 的信息的 处理 , 例如站点摘要处理、 站点更新速度处理等, 可 以为 Robot 的路径选择、 运行周期等加以控制 , 从 而降 低 Robot 的盲 目 性, 大大 提 高 Robot 的 智 能 性[ 8] 。 另外 , 随着网络应用的增多, Robot 搜索的范围 也不仅限于 Html 文档, 现在已经出现了搜索 FTP、

智能搜索引擎发展现状及关键技术

智能搜索引擎发展现状及关键技术

能够实现信息服务的智能化 、人性化 、高效化 ,
数的增长 ,人们将 怎样在 网络上搜索 自己需要 的信息 。传统的搜索 引擎技 术在 日益庞大的信 息量面前逐渐显得力不从心。 在 这样的状 况下 , 智能搜索引擎技术应运 而生 ,也成为 当前搜索
第三代搜索 引擎 的智能化、人性化特征 ,不再 为 用 户 检 索 互 联 网信 息 提 供 了方 便 ,其 发 展 是 局 限于机械的 关键词检索 ,可以直接对用户输 入的检索词进行语义分析整合 ,满足了用户更 快 、更准、更方便的查询需求。
章 中有较全面 的综述 ),由此来提高搜索结果
的质量 。
的各个领域 。数据挖掘 又可称为数据库 中的知 识发现 ,指的是从存放数据库 、数据仓库货其 他信息库中的大量数据中获取有效的、 新颖 的、
潜在 有 用 的 、 最 终 可 理解 的模 式 的 过程 [ 5 】 。
从第 一代 搜索 引擎 到第 二代 搜索 引擎 是
参考文献
[ 1 ] 浅析 第 三 代 搜 索 引 擎 的 发 展 … .包 瑞 . 晋 图 学 刊,2 0 1 0 年第4 期 ( 总第
1 1 9期 ) .
基于 关键 词和特 殊算法 的搜索 ,是 依靠机 器 条进行 匹配 ,在 待分析 汉字串 与词典 中已有的
抓取 的、建立在超链分析 基础上的大规能满足网民的 检索需求 ,用户在信息检索过程 中有仍存在查 全率、查准率低 , 检索 多媒 体信息 的能力 差等。

个长期的过程 。目前的搜索 引擎 主要提供 基
于 文 字 内容 的 信 息 检 索 服 务 ,而 对 于 进 一 步提
高检索结果的相关 、个性化检索服务 、支持多 媒 体检 索、支持 自然语 言检索 、 增 强检 索界

搜索引擎营销现状与发展趋势

搜索引擎营销现状与发展趋势

搜索引擎营销现状与发展趋势搜索引擎营销(Search Engine Marketing,简称SEM)在过去几年里已经成为了数字营销领域中的关键策略之一。

SEM通过在搜索引擎中投放广告,有效地将产品和服务推送给潜在客户,实现了精准营销的目标。

然而,随着技术和用户行为的不断演变,搜索引擎营销也在不断发展和改变。

当前的搜索引擎营销现状可以总结为以下几个关键点:1. 移动优先:随着智能手机的普及和移动互联网的快速发展,越来越多的用户选择在移动设备上进行搜索。

因此,搜索引擎营销也适应了移动优先的趋势,通过在移动设备上投放广告来达到更广泛的用户群体。

2. 语义搜索和自然语言处理:以前的搜索引擎营销主要依赖于关键词匹配,但是随着搜索引擎算法的不断升级和改进,语义搜索和自然语言处理变得越来越重要。

这意味着营销人员需要更关注用户的意图和上下文,以便更好地优化广告投放。

3. 人工智能和机器学习:随着人工智能和机器学习的发展,搜索引擎营销也受益于这些新技术。

通过使用人工智能算法和机器学习模型,营销人员可以更好地预测用户行为和需求,并相应地调整广告投放策略。

未来的搜索引擎营销发展趋势可以预测为以下几个方向:1. 视频搜索:随着在线视频的普及,视频搜索成为了一个重要的发展方向。

搜索引擎营销也将逐渐向视频搜索扩展,通过在视频平台上投放广告来吸引用户的关注。

2. 个性化搜索:个性化搜索将成为未来搜索引擎营销的一个重要方向。

通过了解用户的兴趣和偏好,搜索引擎可以提供更个性化的广告内容,提高广告的点击率和转化率。

3. 用户体验优化:搜索引擎营销不仅仅是投放广告,还需要关注用户体验。

优化网页加载速度、提供相关的搜索结果和精准的广告推荐,都可以提升用户的体验并增加广告的效果。

总而言之,搜索引擎营销在不断发展和进步,随着技术和用户行为的变化,也在不断调整和改变策略。

未来的搜索引擎营销将更加注重移动、语义、人工智能和用户体验,以实现更精准、个性化的广告推送。

搜索引擎的发展历史及现状

搜索引擎的发展历史及现状
天 的 网络信息 正在 以前所 未有 的速度 递增 ,这给 我们进 行 内容 的收集和 整理
企 业级 产 品 面世 , 同年 , 中科 院 计算 所 研发 出智能 搜 索 引擎 G u t。 h n 从2O o 2年 开始 ,中文 搜 索 引擎 门户 出现 了快 速成 长 的趋 势 。2 0 O 3年 1 ,原 慧聪 搜 索正 式 更 改为 中 国搜 索 ,主要 面 向中文 搜 索 。2 0 2月 0 4年 8 月 ,搜 狐 推 出搜 索 网站 。另 外 ,新 浪 、 网 易等 国 内著 名 门户 网 站也 相 继 推 出 了 中文 搜 索 引擎 ,提供 网站 、 网页 、新 闻、软 件 、游 戏 等 查询 服 务 。 值得注 意 的是 , 自 2 0 0 0年 以来 ,国 际大型 跨 国公 司纷纷进 军 中文搜 索 引擎 市 场 ,分别 采 用 收购 或 定 向招聘 的方式 ,在原 有西 文 搜索 引 擎的 基础 上纷 纷 增加 了支 持 中文搜 索 的功 能,如 G o l 、Y h o l a i t 等 。 o g e a o 、A t V a s 这一 方面 促进 了 中文 搜索 引擎 的研 究与开 发 ,另一方 面也加 剧 了国 内中文搜 索 引擎 在 线 服 务 市场 的竞 争 。 搜 索 引擎 的价值 在 于将传 统 的静 态环 境下 的信 息检 索 技术转 移 到动态 、 实 时的 网络 环 境 中,并应 用到 互联 网、外联 网和 企业 内 网的信息 资源管 理和 信息 利用 中去 , 过搜 索 引擎感 知企业 外部 经营 环境 , 通 进行 信 息资源 开发 、 管 理和 利用 。搜索 引擎 厂商 开始提 供包 括搜 索技 术在 内的更 多的技 术 ;搜 索必 不可 少 ,但不 能涵盖 垂直 行业 的特定 需要 ( 专业 市场 应用 ) ;寻找信 息 、智能

2024年搜索引擎市场分析现状

2024年搜索引擎市场分析现状

2024年搜索引擎市场分析现状1. 引言搜索引擎是现代互联网时代的核心工具之一,它为用户提供了方便、快捷的信息检索服务。

随着互联网的普及和用户对信息需求的不断增长,搜索引擎市场也变得日益竞争激烈。

本文将分析当前搜索引擎市场的现状,并探讨其未来发展。

2. 搜索引擎市场概况2.1 主要搜索引擎公司目前,全球搜索引擎市场主要由以下几家公司主导:•谷歌(Google)•百度(Baidu)•必应(Bing)•搜狗(Sogou)•360搜索这些公司不仅在全球范围内竞争激烈,而且在各自本土市场上也有其独特的竞争优势。

2.2 市场份额分析根据最新的数据显示,全球搜索引擎市场份额分布如下:•谷歌:占据约80%的市场份额,是全球最大的搜索引擎公司。

•百度:主要在中国市场竞争,占据约15%的市场份额。

•必应:在全球范围内市场份额较小,约为4%。

•搜狗:在中国市场有一定的竞争力,占据约1%的市场份额。

•360搜索:同样在中国市场有一定的市场份额,约为1%。

从市场份额来看,谷歌一直占据着绝对优势地位,百度在中国市场表现突出,而其他搜索引擎则相对较小。

3. 搜索引擎市场竞争模式在搜索引擎市场中,公司之间的竞争主要集中在以下几个方面:3.1 搜索算法的技术优势搜索算法是搜索引擎的核心竞争力之一。

通过不断改进和优化搜索算法,搜索引擎公司可以提供更精确、更贴近用户需求的搜索结果,从而吸引更多的用户和广告客户。

3.2 用户体验的提升搜索引擎公司通过改善用户界面、加速搜索速度以及提供更全面的搜索结果来提升用户体验。

用户对于搜索结果的满意度将直接影响他们的使用习惯和忠诚度。

3.3 广告收入的竞争搜索引擎公司通过广告业务来获取收入,并在此方面展开竞争。

通过提供更精准的广告投放和更高的点击率,公司可以吸引更多的广告主和广告投资。

3.4 移动搜索的布局移动设备的普及使得移动搜索成为搜索引擎公司争夺的新的战场。

各大搜索引擎公司都在加大对移动搜索的布局力度,通过开发移动应用和优化移动搜索结果,以满足用户在移动设备上的搜索需求。

11国内外网络搜索引擎的发展现状

11国内外网络搜索引擎的发展现状

目录第五章结束语 (55)5.1 结论 (55)5.2 未来展望 (56)参考文献 (59)致谢 (63)中文摘要 (64)Abstract (67)第一章绪论1.1国内外网络搜索引擎的发展现状 随着信息科技的进步和互联网的日益普及,人类正在进行信息史上最巨大的一项工程,即将实现世界现有的信息,诸如报纸、期刊、书籍、专利文献等,都放到网络上去,同时也不停地在网络上生产出数不胜数的新信息。

整个网络正在堆积成一个前所未有的超级大型数据库。

在最近几年里,WWW更是得到了长足的发展,不仅成为企业必不可少的组成部分,并且开始走进千家万户,根据NEC研究院在《自然》上发布的数据,截止到1999年2月,Internet上共有网站1,600万个,其中公开提供WWW服务的网站280万个,共有WWW网页大约8亿页,这些网页包含了15T 字节的数据,根据2000年4月在波士顿举行的第5届搜索引擎年会的会议报告,知道现今的网页数目已经超过了10亿。

其中WWW 在中国的发展速度也十分惊人,1994年4月中国科学技术网在国内首次实现了与国际互联网的直接连接,互联网星星之火开始进入了神州大地,4年来我国互联网络发展非常迅速,先后建成了中国公用计算机互联网、中国科学技术网、中国教育与科研网、中国金桥信息网等4个网络,上网用户达到了167.5万,根据CNNIC (中国互联网络信息中心)在2000年1月的统计信息表明,中国已有上网计算机350万台,其中WWW站点15,153个;上网人数890万。

关于网页的数目没有具体的统计数据,但根据《科学》杂志上提供的集合估计法,通过中国几个主要搜索引擎(天网、新浪、搜狐、网易)获得的搜索数据,可以估计到当前中国拥有的网页数已经超过1,000万。

如何在浩瀚如海的信息空间里,快速查找并获取所需的信息,已成为这新的信息时代里最根本的问题之一。

这就需要形成一些提供网上信息查询服务的系统,我们称之为搜索引擎,它是在互联网产生后伴随着网上用户快速查询信息的需求而产生的新生事物,即提供信息检索服务的计算机系统,检索的对象包括互联网上的站点、新闻组中的文章、软件存放的地址及作者、某个企业和个人的主页等,我们难以想象,如果没有搜索引擎,人们如何在浩瀚无边、拥有着各种各样信息的因特网上冲浪。

搜索引擎的现状和发展趋势

搜索引擎的现状和发展趋势

搜索引擎的现状和发展趋势期末课程论文论文标题:搜索引擎的现状与发展趋势课程名称:信息检索技术课程编号:1220500学生姓名:潘飞达学生学号:1100310120所在学院:计算机科学与工程学院学习专业:计算机科学与技术课程教师:王冲2013年7月 1 日【摘要】搜索引擎包括图片搜索引擎、全文索引、目录索引等,其发展历史可分为五个阶段,目前企业搜索引擎和网站运营搜索引擎运用范围较广。

在搜索引擎的未来发展中,呈现出个性化,多元化,智能化,移动化,社区化等多个趋势。

【关键词】发展过程、发展趋势、检索技巧、个性化、智能化1 搜索引擎简介搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

百度和谷歌等是搜索引擎的代表。

其工作作原理分为抓取网页,处理网页和提供检索服务。

抓取每个独立的搜索引擎都有自己的网页抓取程序,它顺着网页中的超链接,连续地抓取网页。

由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。

搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。

其中,最重要的就是提取关键词,建立索引文件。

搜索引擎是根据用户的查询请求,按照一定算法从索引数据中查找信息返回给用户。

为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护一个庞大的索引数据库。

一般的搜索引擎由网络机器人程序、索引与搜索程序、索引数据库等部分组成。

系统结构图2搜索引擎的工作原理第一步:爬行搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。

搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

2024年搜索引擎市场发展现状

2024年搜索引擎市场发展现状

2024年搜索引擎市场发展现状摘要搜索引擎市场是一个竞争激烈且不断发展的领域。

本文将分析当前搜索引擎市场的发展现状,并讨论其对用户和企业的影响。

我们将重点讨论搜索引擎市场的主要参与者、市场份额、技术创新以及监管挑战。

1. 引言搜索引擎是互联网时代最重要的工具之一,它们能够以极高的效率为用户提供大量的信息。

然而,在搜索引擎市场上,主导地位一直由少数几家大公司垄断,这限制了市场竞争和创新。

本文将分析当前搜索引擎市场发展的现状,探讨其背后的原因,并提出一些可能的解决方案。

2. 搜索引擎市场的主要参与者当前搜索引擎市场的主要参与者包括Google、百度、必应和Yahoo等公司。

这些公司凭借着其强大的技术实力、用户规模和品牌影响力,占据了市场的主导地位。

尤其是Google,其在搜索引擎市场上的份额远远超过其他公司。

3. 搜索引擎市场份额的分布根据最新的市场数据,Google在全球范围内的搜索引擎市场份额超过80%,而百度在中国市场的份额则超过70%。

其他公司如必应和Yahoo在市场上的份额相对较小。

这种市场份额分布导致了主导地位的集中,限制了竞争和创新的空间。

4. 技术创新的重要性搜索引擎市场的发展离不开技术创新。

公司需要不断改进其搜索算法、加强人工智能的应用,并提供更好的搜索体验。

谷歌公司在技术创新方面一直处于领先地位,这也是它能够保持市场主导地位的重要原因。

5. 监管挑战搜索引擎市场垄断的现状引发了监管机构的担忧。

一些国家的监管机构已开始对搜索引擎市场进行调查,并采取一些措施来保护市场公平竞争。

然而,监管机构面临的挑战是如何平衡市场竞争和创新之间的关系,以及如何保护用户隐私和信息安全。

6. 潜在的解决方案为了促进搜索引擎市场的竞争和创新,一些潜在的解决方案可以被考虑。

首先,监管机构应加强对搜索引擎市场的监管,防止垄断现象的发生。

其次,鼓励新兴搜索引擎公司的发展和创新,为用户提供更多选择。

最后,加强对用户隐私和信息安全的保护,建立可靠的数据隐私保护机制。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

元搜索引擎的现状与发展摘要:论文简要介绍了元搜索引擎的相关知识,提出了元搜索引擎系统的发展设想和发展空间。

任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。

一种搜索引擎不可能满足所有人或一个人所有的检索需求。

集成搜索引擎和元搜索引擎尽可能地减少和优化了检索操作,实现了“一次检索输入,多引擎同时搜索”。

由于其在搜索引擎中的不同特点和自身具有的优点,在以后的搜索引擎道路上必然会有很大的发展空间。

关键字:Internet搜索搜索引擎元搜索引擎信息检索技术发展前景一.引言在互联网发展初期,网站相对较少,网页数量亦较少,因而信息查找比较容易。

随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,以至于迷失在信息的海洋中不知所措,出现了我们所说的"信息丰富,知识贫乏"的奇怪现象。

搜索引擎正是为了解决这个"迷航"问题而出现的技术。

搜索引擎(Search Engine简称SE)以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。

现在,网上的搜索引擎有很多,比较著名的有Google,Yahoo,AltaVista,Dogpile,百度等。

按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:目录式搜索引擎,以Yahoo为代表(最近改为使用全文搜索技术);全文搜索引擎,以Google为代表;元搜索引擎,以Dogpile为代表。

一个单一搜索引擎的网络覆盖率最多只能覆盖到整Internet资源的30-50%[3],因而查全率便无法保障;再加上任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以查准率亦无法保证;因此,要想获得一个比较全面、准确的结果,就必须反复调用多个搜索引擎,并对返回结果进行比较、筛选和相互印证。

二.元搜索引擎概述各个搜索引擎的用户接口是异构的,有其特定且复杂的界面和查询语法,这给用户同时使用多个系统带来了不便.一些研究人员针对这种状况而开发了元搜索引擎,其中比较著名的有MetaCrawler,SavvySearch5等.元搜索引擎首先对用户的查询请求进行预处理,分别转换为若干个底层搜索引擎能处理的格式,并将其发送给各个搜索引擎.例如,MetaCrawler同时检Yahoo,LookSmart,AltaVista等九个主要的搜索引擎.在各个搜索引擎返回检索结果后,元搜索引擎进行组合,并向用户返回最终的检索结果[Selberg95].由于元搜索引擎建立在搜索引擎的基础之上,因此对于设计人员而言,不需要建立和维护庞大的索引数据库,也不需要使用复杂的检索机制;对于用户而言,元搜索引擎提供了一个能够同时查询多个搜索引擎的集成界面,将各个搜索引擎的位置,接口等细节屏蔽了起来,同时也有可能获得更好的检索效果.元搜索引擎便应运而生。

2.1 定义元搜索引擎(Meta Search Engine 简称MSE),元搜索引擎,也叫集搜索引擎,是指在统一的的用户查询界面与信息反馈的形式下,共享多个搜索引擎的资源库为用户提供信息服务的系统。

元搜索引擎是对搜索引擎进行搜索的搜索引擎。

元搜索与一般搜索引擎的最大不同在于它可以没有自己的资源库和机器人,它充当一个中间代理的角色,接受用户的查询请求,将请求翻译成相应搜索引擎的查询语法。

在向各个搜索引擎发送查询请求并获得反馈之后,首先进行综合相关度排序,然后将整理抽取之后的查询结果返回给用户。

元搜索引擎查全率高、搜索范围更多更大,查准率也并不低。

2.2 元搜索引擎的系统结构元搜索引擎包括Web服务器、结果数据库、检索式处理、Web处理接口、结果生成等几个部分,其中用户通过Web服务器访问元搜索引擎,而元搜索引擎则通过Web处理接口访问其它外部的搜索引擎。

其系统结构如图1所示。

用户通过WWW服务访问元搜索引擎,向Web服务器提交检索式。

当Web服务器收到查询请求时,先访问结果数据库,查看近期是否有相同的检索,如果有则直接返回保存的结果,完成查询;如果没有相同的检索,就分析检索式并转化成与所要查找各搜索引擎相应的检索式格式,然后送至Web处理接口模块。

Web处理接口通过并行的方式同时查询多个搜索引擎,把所有的结果集中到一起。

根据各搜索引擎的重要性,以及所得结果的相关度,对结果进行抽取并排序,生成最终结果返回给用户。

同时,把结果存到自己的数据库里,以备下次查询参考使用。

元数据整合方式是目前应用较多的跨平台系统。

元搜索引擎主要运用于网页信息搜索,而现有各种电子资源数据库都提供相应的客户端接口,因此可利用元搜索引擎的原理对各个异构数据库进行统一检索。

元搜索引擎是通过对多个全文数据库按一定标准(如DC)进行标引后,组成一个元数据集,通常用数据库方式储存。

通过一个发布系统(WEB服务器)与客户端进行交互。

元搜索引擎是一种集合其他搜索引擎的搜索结果为一体,方便用户同时参考多个搜索引擎提供的搜索结果的搜索引擎。

元搜索引擎的这种网络搜索方式侧重于过滤冗余无关的搜索结果,从而试图将最相关的搜索结果展示给搜索用户。

但是另一方面,根据搜索请求关键词的普遍度,也可能给用户造成被上百万搜索结果页面淹没的后果。

2.3 元搜索引擎的特点元搜索引擎区别于独立搜索引擎,主要有这样一些特征:①不用设立庞大网页数据库,节省存储设备②提供了统一的外界模式,将一次查询提交到多个独立搜索引擎③基于独立搜索引擎结果的二次加工④标明结果记录的来源搜索引擎及其局部相关度,提供了全局相关度。

三.元搜索引擎发展趋势目前,元搜索引擎的研究、开发十分活跃。

它要用到了信息检索、人工智能、数据库、数据挖掘、自然语言理解等领域的理论和技术,具有综合性和挑战性。

又由于搜索引擎有大量的用户,由此衍射出许多商机,具有很好的经济价值,据估计现在已有几十亿美元的全球市场,所以引起了世界各国计算机科学界、信息产业界和商界的高度关注,已投入了不少的人力、物力,也取得了不俗的成绩。

一个理想的元搜索引擎应该具备以下功能要求:①涵盖较多的搜索资源,可随意选择和调用独立搜索引擎,还可根据一定调度策略进行自动调度。

②具备尽可能多的可选择功能,如资源类型(网站、网页、新闻、软件、FTP、MP3、Flash、图像、影视等)选择、等待时间控制、返回结果数量控制、结果时段选择、过滤功能选择、结果显示方式选择等。

③强大的检索请求处理功能(如支持逻辑匹配检索、短语检索、自然语言检索等)和不同搜索引擎间检索语法规则、字符的转换功能(如对不支持"NEAR"算符的搜索引擎,可自动实现由"NEAR"向"AND"算符的转换等)。

④详尽全面的检索结果信息描述(如网页名称、URL、文摘、源搜索引擎、结果与用户检索需求的相关度等)。

⑤支持多种语言检索,比如提供中英文搜索等。

⑥可对结果进行自动分类,如按照域名、国别、资源类型、区域等进行分类整理。

⑦可以针对不同用户提供个性化服务。

目前Internet上面有很多元搜索引擎,良莠不齐。

在功能实现上,各有侧重点,能做到"理想"的尚不多见。

一些元搜索引擎在某些方面做得很好,但是在其他功能上却存在着缺陷或尚需改进:如大多数的元搜索引擎不支持自然语言检索,不支持中文检索等。

元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约:一方面,源搜索引擎的各具特色的强大功能在元搜索引擎中受到限制而不能充分体现,而另一方面,任何一种元搜索技术都不能发掘和利用独立搜索引擎的全部功能。

随着新技术的不断涌现,会使元搜索引擎做得更好,取得更好的用户满意度,这些技术有:1.提高搜索引擎对用户检索提问的智能理解,体现为对自然语言查询请求的支持。

2.确定搜索引擎信息搜集范围,提高搜索引擎的针对性,体现为主题搜索,多媒体搜索。

3.基于智能代理的信息过滤和个性化服务。

4.重视交叉语言检索的研究和开发[9],提供多语言检索的支持,提供本土化的搜索服务。

5.提高信息查询结果的精度,提高检索的有效性。

具体站点分析:是最近发布的一家元搜索引擎,他的主要特点在于集合了包括Google, Altavista , LookSmart , Fast, Overture, Inktomi, ASK Jeeves andYahoo在内的多达14家知名搜索引擎的搜索结果于一体,提供一站式搜索服务,包括网络搜索、新闻搜索、比较购物搜索,产品搜索、图片搜索等等。

Info的搜索功能更加强调的产品的搜索并促进用户购买。

这一理念主要受到合作伙伴在线购物门户的影响和推动,双方的合作促使用户获得广泛的产品购买信息。

图片搜索和白页及黄页搜索也是元搜索引擎的特色。

用户还可以进行新闻搜索,新闻搜索结果由提供。

同时,为了进一步加强作为用户的信息提供者的形象, 计划引入ebay聚合内容,以及关于班机信息搜索、健康问题搜索等。

由于侧重于消费者的使用体验,因此该元搜索引擎对于那些以调查研究为目的的所所用户来说就非常适合。

一方面侧重于调研的搜索请求产生的搜索结果将更加相关,但是返回结果并不彻底。

而将各个搜索引擎的结果集合起来就不失为一种简便方法,省却了逐页寻找信息的繁琐。

另外在搜索结果页面通常不会给出返回搜索结果的数量。

六.总结一款理想的元搜索引擎应该具备以下特点和功能:第一,含盖较多的搜索资源,可随意选择和调用源搜索引擎;其次,具备尽可能多的可选择功能,如资源类型(网站、网页、新闻、软件、FTP、MP3、图像等)选择、返回结果数量控制、结果时段选择、过滤功能选择等;第三,强大的检索请求处理功能(如支持逻辑匹配检索、短语检索、自然语言检索等)和不同搜索引擎间检索语法规则、字符的转换功能(如对不支持“NEAR”算符的搜索引擎,可自动实现由“NEAR”向“AND”算符的转换等);第四,详尽全面的检索结果信息描述(如网页名称、URL、文摘、源搜索引擎、结果与用户检索需求的相关度等);第五,支持多种语言检索。

目前运营的元搜索引擎各具特色,功能各有侧重,完全“理想”的尚不多见。

一些元搜索引擎在某些方面较为优秀,而其它功能则欠缺或需改进:如大多元搜索引擎不支持多语种,尤其是汉语检索;一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。

相关文档
最新文档