元搜索引擎

合集下载

元搜索引擎

元搜索引擎

元搜索引擎随着科学技术的发展,元搜索引擎技术应运而生。

元搜索引擎是基于搜索引擎之上的搜索引擎。

如今已逐渐成为了社会的热点话题,它已经渐渐地融入到人们的日常生活中。

A元搜索引擎定义:通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,它是是对分布于网络的多种检索工具的全局控制机制。

B元搜索引擎核心理论:元搜索引擎就是一个具有双层客户机/服务器机构的系统,一般由检索请求提交、检索接口代理、检索结果显示3部分组成。

(1)请求提交。

负责实现用户的检索设置要求,包括调用哪些独立搜索引擎、是否有最长检索时间设置、是否提供高级检索服务、设置每个搜索引擎返回的检索结果数量、在线帮助是否有效等。

若用户选择个性化检索,则推理机制将根据用户基本信息与动态知识库进行分析推理用户的当前意向,进行查询求精处理,并根据用户对返回结果的行为使用反馈机制动态更新知识库。

(2)检索接口代理。

负责将用户的检索请求“翻译”成能够满足不同搜索引擎“本地化”要求的格式,包括是否支持布尔检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。

它是元搜索引擎的一个重要指标。

(3)结果显示。

负责所有来源搜索引擎检索结果的去重、合并、输出处理等。

元搜索引擎如何将独立搜索引擎的检索结果以统一的格式显示给用户,是评测其检索性能的重要手段。

C元搜索引擎代表性文献:i 《元搜索引擎结果生成技术研究》张卫丰徐宝文等著ii 《中外元搜索引擎的比较研究》晏一平岳泉著D元搜索引擎主要模型:数学模型作为一个信息检索系统,元搜索引擎可以形式化的通过一个六元组来描述:MSE-System=(SEn,Qn,Hn,Fn,Rn,Tn)其中SEn、Qn、Hn、Fn、Rn和Tn分别表示待选择搜索引擎集合,信息检索需求集合,信息检索需求交换集合,待选择搜索引擎集合和信息检索需求集合之间的匹配处理框架,排序算法以及查询结果集筛选标准。

标准的检索工具

标准的检索工具

标准的检索工具
一些常见的标准检索工具包括:
1. 搜索引擎:如Google、Bing、百度等,用户可以通过输入关键词来获取相关信息。

2. 图书馆目录:图书馆提供的系统,用于查找图书、期刊、论文等资源。

3. 学术搜索引擎:如Google Scholar、Web of Science、Scopus 等,主要用于查找学术文献和学术资源。

4. 数据库:包括各种专业领域的数据库,如PubMed(生物医学)、IEEE Xplore(工程技术)、EBSCOhost(多学科领域)等。

5. 元搜索引擎:如Zotero、EndNote等,可以同时搜索多个数据库并整合结果。

6. 社交媒体搜索:如Twitter、Instagram、微博等,用于查找特定的社交媒体内容。

7. 文件管理工具:如Windows的文件搜索功能、Mac的Spotlight 等,用于在本地计算机上快速查找文件和文件夹。

8. 专业领域的检索工具:根据特定领域的需求,有一些定制化的检索工具,如化学领域的Reaxys、生物信息学领域的BLAST等。

这只是一些常见的标准检索工具,还有许多其他工具适用于特定的搜索需求。

元搜索引擎的资料挖掘

元搜索引擎的资料挖掘

复排除 、 新排序等处理 。 重 详尽 全 面 的检 索 结 果 信 息 描 述 : 持 多 支 种语 言 检索 . 服务 方 式 为 面 向: 网页 的全 文 检 索 元 搜 索 引 擎 是 搜 索 引 擎 的 搜 索 , 点 显 著 : 搜 索 引 擎 没 有 特 元 自己 的 网页 数 据 库 和 R bt利 用其 他 的 数据 库 不 侵 权 . 按 内 容 oo. 但 集 中 了多 个 专 门 的搜 索 引 擎 的 查 询 界 面 . 实 现 一 站 制 对 各 数 据 可 库 进 行 搜 索 . 约 存 储 设 备 : 过 对 多 个 全 文 数 据库 按 一 定 标 准 节 通 ( D )进 行 标 引 后 ,组 成 一 个 元 数 据 集 ,通 过 一 个发 布 系 统 如 C ( B服 务 器 ) 客 户 端进 行 交 互 。 到 一个 集 成 后 的 多数 据库 查 WE 与 得 询 系 统 , 对对 原 始 数 据 的 描 述 信息 。通 过 一个 特 定 连 接 . 户 可 有 用 以 直 接 从 原 始 数 据 库 中得 到原 文 数 据 .结 果 是 二 次 搜 索 号 擎 加 } 工 :把 多个 搜 索 引 擎 的 检 索结 果 重 新 组 织 .按 照 相 关 性 大 小 重 新 排 序 , 果 显示” 结 负责 所 有 源 搜 索 引擎 检 索 结 果 的 去 重 、 并 、 合 输 出处 理 等 元 搜 索 引 擎 的 出现 . 按 用 户 意 愿 对 检 索 结 果 进 行 分 级 能 编排 . 以统 一 的 界 面 呈 现 给用 户 . 可 以说 元 搜 索 引 擎 仅 是 一 种 也 代 理 机 制式 的查 询
K yWo d : a d p n e t e r n n ; ac n n : fr t nrte a d t mi n e rsYun i e e d n a h e g e er e g e n ma o r v l a n g n s c i s h i io i ei a i

元搜索引擎简介

元搜索引擎简介

著名元搜索引擎
8、ByteSearch ( ) 搜索速度快,可检索资源丰富,搜索范围包 括Web、城市信息、公司名录、域名、FTP 网站、多媒体、新闻组、包裹跟踪等,并提 供新闻浏览、URL提交、最新的20个检索浏 览、联机商店等内容方面的服务。支持完全 匹配(All)、部分匹配(Any)、短语检索 (Phrase)等特性检索功能,没有搜索引擎 列表,不能控制源搜索引擎的选择。
著名元搜索引擎
7、MetaCrawler ( ) 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
1、InfoGrid ( /) 提供与主要搜索网站的直接连结和目录检索,具 有强大的元搜索和新闻搜索功能。 2、Infonetware RealTerm Search ( /) 原为检验网络分类技术而设计。它以元搜索引擎 知名,但具有强大的对搜索结果进行主题分类的 功能。与众不同的是,用户可选择不同的主题, 并得到来自所有主题搜索结果,而不是仅仅把搜 索结果限制在一个主题范围之内。
元搜索引擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。

元搜索引擎的个性化

元搜索引擎的个性化

文 献标 志码 :A
文章 编号 :0 9 . 17( 0 8)0 .6 60 4 32 3 2 0 50 1—5
P r o aia in o e a S a c g n e s n l to f z M t — e r h En i e
LI a — o g,F NG i o g, Z oh n Xi E Zh — n y HANG a g Lin
维普资讯
第4卷 第5 1 期 20 0 8年 5 月






V 1 1 No 5 b. 4 .
J u n o ini ies y o r  ̄ f a j Unv ri T n t
Ma 0 8 v2 0
元搜索引擎 的个性化
李晓红 ,冯 志勇 ,张 亮
( c o l f mp tr cec n eh oo y, ini Unv ri , ini 0 0 2 C ia S h o o Co ue in e dT c n lg Taj iesy T ajn3 0 7 , hn ) S a n t
Abs r c : A eho t e e ae dy m i e o l orpe s a ia i n we r o c e r h s d c be . c s ta t m t d o g n r t na c us rpr f esf r on z ton i b es ur e s a c wa es r d Ac e s i l i
运 而生 .
在个 性 化方 面 已经有 了一些 相 关 的工作 【 J文 2. 。 献 [】 4 中讨 论 了各 种 各 样 的个 性化 问题 , 中包 括 大 其 量 个 性 化 业 务及 其 一些 可用 技 术 . 有 的商 业 系统 现 We T ed利 用 原 型 工 具 来进 行 日志分 析 JWu等 b rn . 人 【通 过 基 于 内容 的协 作 过滤 技 术 来 对 网站创 建 用 6

一个元搜索引擎的设计与实现

一个元搜索引擎的设计与实现
引擎与专 门搜 索 “nib b 的检索工具相 结 Iv i eWe ” sl 合, 采用高效 的融合处理算法对它们 的检索结果进 行分析处理后 , 按各记录表现的主题进行分类, 同时 通 过跟 踪分 析用 户 的搜 索 行 为 , 各 主题 与用 户 可 将 能最感兴越的主题 的记录返回给用户。
Ke r s S e i ie e c n i e T p c d s l t n; p c aie it n r I vsb e W e y wo d : p c a z d s a h e gn ; o i it l i S e il d d c i a y;n i l b l r ia o z o i
X AO Gu I o—q a g Z in , HANG F n ag
( eat etfCm u r c nead Tcnl y Wua 3 0 4 C i ) Dp r n o p t i c n eh o g , h n4 07 ,hn m o eSe o a
Ab t a t I h s p p r a mea — s a c n i e b s d o p ca ie e r h n n ie i i t - sr c :n ti a e , t e r h e gn a e n s e il d s a c i g e gn s n r z o
gae p ra h T e rs l tre d p e w y o s bi ig p fsin l dc o ay t xrc rtd a p o c . h e ut r u d a o tt a fe t l hn r eso a it n r o e t t se n h a s o i a
d cd Po si a sac n n i ema e i pca zdsac Ivs l We ”sac osne u e . r es n e heg ewlb d t sei i r h“n ibe b e r t l i — f ol r i l wh le e i h o t

元搜索引擎简介

元搜索引擎简介
元搜索Байду номын сангаас擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。
著名元搜索引擎
7、MetaCrawler ( )
1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
6、Mamma ( )
1996年面世,自称为“搜索引擎之母”的并行元搜 索引擎,可同时调用7个最常用的独立搜索引擎, 并且可查询网上商店、新闻、股票指数、图像和声 音文件等资源。其特点是检索界面友好,检索选项 丰富,主要包括:可控制调用的独立搜索引擎、选 择使用短语检索功能、设定检索时间、设定每页可 显示记录数等。另外,Mamma支持常用检索语法 在不同搜索引擎中的转换,还提供了专门检索页面 文件标题的特殊检索服务,以及通过E-mail传输检 索结果的特色功能。检索结果以相关性排序,内容 包括网页名称、URL、文摘、源搜索引擎。

一种元搜索引擎框架模型的设计

一种元搜索引擎框架模型的设计

元 搜索 引 擎是一 个搜 索其 他 引擎 的搜索 引擎 。一个 元 搜索 引 擎 以用 户输 入 的查 询关 键 字 作 为输 入 , 然后 将该关 键 字 同时 提交 给 多个 成员 搜索 引擎 , 将这 些搜 索 引擎 的返 回结 果按 照 一定 的算 法重 新排 序 并
并反馈给用户。元搜索引擎是用来提高单个搜索引擎的查准率 ( r io ) Pe s n 和查全率 ( ea ) 出现的一 ci R cl 而 1
种 新 的搜索 模式 。
1 搜索引擎的实现难点
由于元 搜索 引擎 环境 所特 有 的一些 特征 , 给创建 高效 的元 搜索 引擎 带来 一定 困难 。
1 1 成 员搜 索 引擎 的 自治 性 .
元 搜索 引擎 的成 员搜 索 引擎通 常都 是独立 建造 的 , 个搜 索引 擎 自己决定 该 索 引哪 类 文本 集 为用 户 每 提 供 服务 , 自己决定 文本 如 何表示 、 引及 更 新索 引 的时 间 , 索 自己决 定 相似 函数 的计 算 , 文 本 与 给定 查 而
文章 编 号 : 6 2— 3 5 20 ) 3— 4 8一o 17 9 1 (0 7 0 04 4

种 元搜 索 引擎 框 架模 型 的设 计
郭 晔, 李建廷 , 浩鸣 王
( 西安财经学院 计算机科学系 , 陕西 西安 70 6 ) 10 1
摘 要 : 索引擎是搜 索引擎之 上的搜 索引擎。用户递 交检 索请 求, 元搜 元搜 索 引擎接收该请 求 后, 它提 交给 多个预先选定的搜索 引擎成员, 中所有的查询 结果并以统一 的格式返 回给 用 把 集 户。首先概述 了元搜索引擎的原理和现状, 分析 了当前研究元搜 索引擎的难点所在 , 并提 出改进 方案。在此基础上 , 设计 了元搜 索引擎的总体框架, 出了查询代理 、 索代理、 提 搜 运算代理三大功
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

元搜索引擎
作者:姬洪强
来源:《中小学信息技术教育》2007年第12期
网络已逐渐成为教师教学中重要的信息来源,教师通常借助搜索引擎来检索所需求的资源。

然而,一种搜索引擎往往不能满足所有人或一个人所有的检索需求,经常需要使用多种搜索引擎,并对搜索结果进行比较、筛选和印证。

为解决逐一登录各种搜索引擎,并多次输入同一检索请求(检索字串)等操作繁琐的问题,元搜索引擎应运而生。

元搜索引擎的优点是返回的检索结果信息量大,检索效率高,服务多样化。

下面介绍几款国内外优秀的元搜索引擎以供中小学教师参考使用。

一、国内元搜索引擎
1.Xooda 元搜索引擎()
Xooda元搜索引擎支持16个国家/地区,可调用Baidu、Google、Yahoo、iAsk、Sogou、ZhongSou等12个源搜索引擎中全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目。

它还可以进行进阶搜索,自动实现符合特殊检索语法要求的转换,只调用支持特殊检索语法的搜索引擎。

支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新优化排序。

2.酷爱元搜索引擎()
酷爱元搜索引擎提供自动搜索和人工搜索两种模式。

调用Baidu、Sogou、Yahoo等独立搜索引擎,各搜索引擎的结果会进行智能排序。

当用户输入关键词的时候,搜索框会自动列举出相关的关键词列表。

它的深入搜索功能可以为用户提供更精确的关键词,进一步细化结果。

当用户点击网页智能分析时,酷爱会把最相关的结果呈现给用户。

3.万纬元搜索引擎()
万纬搜索引擎是最有名的中文元搜索引擎之一。

万纬中文集成搜索引擎包括了5个英文搜索引擎Argos、Google、Hotbot、NorthernLight、Yahoo和7个中文搜索引擎,如网典、新浪、雅虎(中文)、搜狐、天网、悠游搜索。

用户可根据需要自由选择其中最多6个引擎进行同步搜索,搜索结果可按相关度、时间、域名和引擎分类,还可以选择搜索的关键词之间是用and 还是用or来运算。

4.比比猫元搜索引擎()
比比猫是采用聚类技术对结果进行处理,并且提供收藏、快照等功能的社会化搜索引擎。

它可以同时调用Google、Yahoo、Baidu、iAsk以及Sogou等5个搜索引擎。

使用时,网页左边会出现分析搜索内容后返回的结果列表,用户可以通过搜索分类查看所需要的结果,过滤掉与需求不相关的内容。

在访问多个搜索引擎的同时,它可以把最好的检索结果获取下来进行自动分类。

用户可以把喜欢的网页和个人文件保存在网站上,不管在哪儿,只要能上网,就能找回收藏。

5.K风元搜索(/k-metasearch)
K风元搜索是由K风软件在2007年1月2日开发的元搜索引擎软件产品,特色是任意聚合搜索引擎;快速建立网络、行业、站内搜索引擎;网页收藏夹;网页分享社区。

K风元搜索能够在后台自由集成成员搜索引擎,随意添加、删除或开启、关闭成员搜索引擎,个性化聚合搜索引擎。

K风的相关搜索调用切换功能,可以选择调用本地或其他网络上的关键词数据。

二、国外元搜索引擎
1.MetaCrawler( )
MetaCrauler由华盛顿大学推出,支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务,包括常规检索、高级检索、定制检索、国家或地区的资源检索等。

其中,高级检索模式可实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,检索结果排序依据(包括相关度、域名、源搜索引擎)设定等。

以上内容均可作为定制检索的个性化选项并予以保存。

另外,检索结果中包括一个以1000为最大值的相关度指标。

2.Dogpile()
Dogpile是最老、最受欢迎的多元搜索引擎之一。

它是1996年12月由美国人Aaron Flin推出的并行式和串行式相结合的混合式元搜索引擎。

Dogpile可以调用20多个独立的源搜索引擎。

在收到查询提问时,它首先并行地调用Google、Yahoo、MSN、Ask Jeeves等4个源搜索引擎,如果没有得到10个以上的结果,再调用另外的搜索引擎。

但Dogpile不提供可调用的源搜索引擎列表,不支持对各个源搜索引擎的自行指定和选择。

3.Mamma()
Mamma是并行式元搜索引擎,自称为“搜索引擎之母”。

可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。

其特点是检索界面友好,检索选项丰富,主要包括可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。

4.Ixquick ()
Ixquick最大优点是支持中文检索。

支持各种基本的和高级的检索功能,包括关键词检索、短语检索、截词检索、布尔检索、概念检索、自然语言检索、指定字段检索、包含(+)或排除(-)检索等。

Ixquick知道哪些搜索引擎能够处理短语、布尔逻辑、截词等等,Ixquick将负责把“翻译”后的查询请求直接递交到那些能够处理这些复杂请求的搜索引擎中,实现更加有针对性的搜索服务,瞄准更加高、精、专的检索结果。

自从第一个元搜索引擎Metacrawler推出以来,这一新型的网络检索工具异军突起,发展十分迅速,目前可用的元搜索引擎已非常多。

尽管元搜索引擎存在着一些功能局限,但其以涵盖较多的搜索资源,能够在尽可能短的时间内提供相对全面、准确的检索结果等诸多优异功能受到用户的青睐,已渐成为一种不可或缺的网络检索工具。

(作者单位:浙江师范大学教育学院)。

相关文档
最新文档