浅谈元搜索引擎的关键技术

合集下载

元搜索引擎简介

元搜索引擎简介

著名元搜索引擎
8、ByteSearch ( ) 搜索速度快,可检索资源丰富,搜索范围包 括Web、城市信息、公司名录、域名、FTP 网站、多媒体、新闻组、包裹跟踪等,并提 供新闻浏览、URL提交、最新的20个检索浏 览、联机商店等内容方面的服务。支持完全 匹配(All)、部分匹配(Any)、短语检索 (Phrase)等特性检索功能,没有搜索引擎 列表,不能控制源搜索引擎的选择。
著名元搜索引擎
7、MetaCrawler ( ) 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
1、InfoGrid ( /) 提供与主要搜索网站的直接连结和目录检索,具 有强大的元搜索和新闻搜索功能。 2、Infonetware RealTerm Search ( /) 原为检验网络分类技术而设计。它以元搜索引擎 知名,但具有强大的对搜索结果进行主题分类的 功能。与众不同的是,用户可选择不同的主题, 并得到来自所有主题搜索结果,而不是仅仅把搜 索结果限制在一个主题范围之内。
元搜索引擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。

面向领域资源的智能元搜索技术研究

面向领域资源的智能元搜索技术研究
维普资讯
Байду номын сангаас
计算机 科学 2 0 Vo 3 N . 06 l 3o9 _
面 向领 域 资 源 的 智 能 元 搜 索技 术 研 究 )
苏 超 蔡 ・ 铭 姚 玉 荣
( 江大 学计 算机 学 院 杭 州 30 2 ) ( 浙 10 7 杭州 技 师学 院 桐庐 3 10 ) 15 0
( l g f o u e c n e Z ei gUnv r i . n z o 1 0 7 ( n z o c nc n C l g , n l 7 5 0 Col eo mp t r i c . h j n ie s y Ha g h u3 0 2 ) e C S e a l Ha g h u Teh i a ol e To g u 3 1 0 ) i e
Ab ta t Th e r l( o i e o r e r m n e n t i t e h ts o f r s a c u r n l Ba e n me a s a c src e r ti ) d man r s u c s fo i t r e s h o p to e e r h c r e ty a f sd o t-e rh tc n lg e h o o y,we d v lp r t t p y tm ih i e p ca l e i n d f r t ea q i i o fd ma n r s u c s e eo e a p o o y es s e wh c s s e i l d sg e o h c u st n o o i e o r e .Th s y i i p p r man y i to u e h e e h o o y a o t t e s s e ,n l d n h o i e o r e o e ,i q i e u s s a e i l n r d c s t e k y t c n l g b u h y t m i cu i g t e d man r s u c s m d l n u r r q e t y t a so ma i n,r mo e r ti l a l g n h e u tp o e sn . F n l rn fr t o e t e r l n ,a d t e r s l r c s i g a c i ial y,a c u le a l f c mp t rs in e r — n a t a x mp e o o u e ce c e s u c s r t iv n o o lg e c i g i g v n o r e e re i g f r c l e ta h n s ie . e Ke wo d M e a s a c n i e Cls i y tm ,Do an r s u c s y rs t -e r h e g n , a sf s s e y m i e o r e

一种基于多Agent的元搜索引擎优化技术

一种基于多Agent的元搜索引擎优化技术

价值工程源共享、协同工作的目的。

通过简单的配置就可以建立起一个完备的Internet ,实现常用的Web 页面发布、电子邮件系统互通、FTP 文件传输等功能,而内部用户则可通过拨号方式访问Internet ,实现Internet 接入。

本方案的操作系统分为服务器端操作系统和客户端操作系统。

服务器端操作系统和客户端操作系统均采用Windows 系列操作系统,其中服务器操作系统采用Windows2000Server ,客户端操作系统采用Windows2000profession 、Windows XP 系统,客户端操作系统为随机软件,不需另外购置。

医药商业企业信息化建设的关键是降低购销链过程成本,快速协调地提供物流服务;同时降低库存,提高资金使用效率。

英克科技是国内医药行业最为卓越的应用方案服务商。

同时,英克科技已经率先并成功的解决了目前医药市场背景下统购分销、连锁配送的管理难题。

英克ERP 系统是英克科技(INCA )根据KRM (知识与资源一体化管理)思想开放的ERP 系统,该ERP 软件具有技术先进性、管理科学性、对行业有深度了解。

其主要宗旨是将企业的各方面资源(信息、人力、资金、设备、时间、方法等方面)进行优化、整合,在强化企业财务管理、提高资金运营效率、建立“企业-供应商-客户”之间的供应链、提供强有力的管理。

它的目标是帮助高层管理人员对企业中错综复杂的动态信息进行及时、准确的分析和处理,使企业管理真正由经验管理进入科学管理模式,使企业的管理水平产生质的飞跃。

英克ERP 医药商业企业解决方案根据项目本身的目标要求和医药行业的实际,具有如下的主要特点:完全满足医药行业的质量管理规范(GSP )的要求:“即插即用的管理插件”可以使企业从容面对环境的改变;原子化的任务颗粒度能使企业做到精细核算、降低成本,以提高资金利用率;“知识流”保证企业在规范化管理的同时保持企业的个性特征。

作为应用软件运行的基础和整个计算机管理系统扩展的底层保证,本项目的数据库拟选用目前世界上最流行的中大规模关系数据库Oracle 公司的大型关系数据库Oracle 8i ,能够保证用户核心数据安全地存储和高效地访问;并且,Oracle 数据库支持英克公司ERP 软件。

基于知网的元搜索引擎多关键词检索研究

基于知网的元搜索引擎多关键词检索研究

对多关键词检索时只作机械性的字符 串匹配的缺 陷。实验 结果表 明, 查准率有 明显提 高。
关键 词 : 关键 词 ; 网 ; 原 ; 心 关键 词 多 知 义 核 D :03 7 /i n10 — 3 1 0 8 2 4 文 章 编 号 :0 2 8 3 (0 8 2 — 12 0 文 献 标 识 码 : 中 图分 类号 :P 9 . OI 1.78js . 2 83 . 0 . . 5 .s 0 2 20 10 — 3 12 0 )2 0 5 — 3 A T 3 1 3
Ke r s y wo d :mut k y r ; w t s me ; e n l k y o d l — e wo d Ho Ne ;e me k r e— e w r i

要 : 出了一种基 于知 网的多关键词语义关 系分析 方法, 提 并利 用其得 出核心关键词 , 置分级权 重 , 而解 决了搜 索引擎在 面 设 从
( )ni l '; 2 ety q t ̄ k
( )ti tl 性 ; 3 ar ue tb 属
( )V le 性 值 ; 4 a au l 属
结果与用户意图不符 , 并列出大量 的无关搜索结果 。
如果搜索 引擎能 够提供多关键词语义关 系的识别并 自动 设置权重的功能 , 则将能进一步理解用户的实际查询需求 , 使得
k y r y t e a ay i ,h n s t mu i l v l w ih .h e in s le h r b e o t n th n n te i fr t n r t e a e wo d b h n lss t e es h — e e eg t e d sg ov s t e p o l m f s i g ma c i g i h n o mai er v l T r o i w e t h s mu t k y o d T e e p r n a e u s id c t h t p e iin h s ge t mp e n . h n i a l— e w r . x ei i h me t r s h n iae t a r cso a r a l i mv me t l y

搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)

搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)

搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)(可以直接使用,可编辑完整版资料,欢迎下载)搜索引擎技术、现状、以及未来发展趋势的文献综述[摘要]随着最近10年中国互联网的快速发展,互联网已经彻底改变了人们的生活方式,而在互联网的发展过程中,搜索引擎发挥了巨大的推动作用。

本文对搜索引擎的发展历史,采用的技术,发展现状,出现的问题以及未来发展方向进行了综述,让读者对搜索引擎有个宏观的了解。

[关键词]搜索引擎,汉语分词,调查报告[正文]一、搜索引擎概述搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。

从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。

二、搜索引擎的重要发展历程1. 1990年,Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明Archie(Archie FAQ),成为所有搜索引擎的祖先。

2. 1993年,MIT Matthew Gray的World wide Web Wanderer,是世界上第一个Spider 程序。

3.1994年4月,杨致远和David Filo共同创办了Yahoo!。

4.1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine),即Washington大学硕士生 Eric Selberg 和 Oren Etzioni 发明的 Metacrawler。

5.1996年8月,sohu公司成立。

6.1998年,Google成立。

7. 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。

搜索引擎的种类与使用技巧

搜索引擎的种类与使用技巧
搜索引攀的基本知识和种类作简要介绍,并结合亲身实践介绍几种实用的搜索技巧。 1关键词1搜索引擎 种类 技巧 口 52 7 2 文献标识码: A 文章编号: 1671一7597 (2008) 0410036一 01 中图分类号: G 352
一、搜索引. 概述
题技巧”、 “ 报项目技巧”、 “ 课题申报经验" 、 “ 课题申报指南”等关
( 二) 目录索引 目录索引虽然有搜索功能,但不能称为真正的搜索引擎,只是按目录 分类的网站链接列表而己。用户完全可以按照分类目录找到所需要的信
键词来检索. (二) 局限于某个具体网站或者网站频道 许多单位都会针对同一热门事件在本单位网站发大量文件或文章。这 些文章或文件往往名称相同但具体内容和要求却不同。此时, 指定网站或 频道的搜索功能能为我们提高搜索效率。 ( 三) 按文件类型查找 如需要查找简历模版时可以构建如下检索式: “ 简历模版f i l t ype e : o d c”,此时能搜到 d 格式的简历模版。 。r 此处的f i l t ype :do 是限定检 e c 索文件的类型,该字段必须在英文状态下录入,而 “ 简历模版”是检索的 关键词。两个字段之间必须用空格隔开。同理,如果需要检索市场营销的 教案也可以构造 “ 市场营销教案fi l e yP :即t ”的检索式,检索结果为 t e
摘息
科学
S IL I C O N
L L E Y 礴新么
搜 索 引擎 的种 类 与使用 技巧
王俊程
(云南师范大学 云南 昆明 6 0222 5 )
〔 要 着 息 术 发 , 络 迅 普 , 索 擎 网 用 的活 扮 着 来 重 的 位 了 并 熟 使 搜 引成 大 的修 。 摘 ]随 信 技 的 展 网 的 速 及 搜 引 在 络 户 生 中 演 越 越 要 地 , 解 能 练 用 索 攀 为 众 必 课 对

“搜索引擎之母”

“搜索引擎之母”

浅析“搜索引擎之母”摘要:随着网络信息量的增加,单一搜索引擎已经难以满足要求,结合目录式搜索引擎,机器人搜索引擎的优势,以元搜索引擎为核心的多成代理搜索引擎是搜索引擎的发展方向。

本文介绍了元搜索引擎的概念、分类、分析了元搜索引擎的基本构成、优缺点,讨论了元搜索引擎的发展趋势。

关键词:搜索引擎;元搜索引擎;信息检索中图分类号:tp393文献标识码:a文章编号:1007-9599 (2013) 07-0000-021元搜索引擎的含义元搜索引擎,是在基于因特网搜索引擎的基础上,调用其它基于因特网的搜索引擎之上的引擎,所以称“搜索引擎之母”。

其中,“元”为“总的”意思,元搜索引擎就是将很多个独立搜索引擎进行调取、合成、优化利用和控制。

元搜索引擎就像是一个过滤器:输入的信息是由多个独立搜索引擎的输出结果而来,然后经过一番提取、删除、萃取等操作,最终形成结果,最后将最终结果输出给用户。

2元搜索引擎的基本组成请求提交代理、检索接口代理、结果显示代理是元搜索引擎的主要组成部分。

请求提交代理的主要任务是对用户特别的检索设置要求加以实现,主要包括搜索时间限定、调取了哪些搜索引擎、搜索结果数量上的限制等。

检索接口代理主要任务是将使用者的检索要求变成成满足其他不同搜索引擎自身要求的样式。

结果显示代理主要任务是将所有源搜索引擎检索结果去掉重复的然后进行合并最后进行输出处理等。

2.1请求提交代理:主要任务是对用户特别的检索设置要求加以实现,主要包括搜索时间限定、调取了哪些搜索引擎、搜索结果数量上的限制、是否提供高级检索服务、设置每个搜索引擎返回的检索结果数量、在线帮助是否有效等。

若用户选择个性化检索,则推理机制将根据基本信息与动态只是库进行分析推理用户的当前意向,进行查询求精处理,并根据用户对返回结果的行为适用反馈机制动态更新知识库。

2.2检索接口代理:不一样的搜索引擎所支持的查询方式是不一样的,即使是一样的方式也会有不一样的表示方法,所以我们必须把元搜索引擎中的一些查询要求对应到对应的搜索引擎中,并且不能将语义信息丢失掉。

元搜索引擎的调查分析

元搜索引擎的调查分析

元搜索引擎的调查分析
刘畅;林剑锋;王雁杰
【期刊名称】《现代图书情报技术》
【年(卷),期】2004(000)009
【摘要】通过对Dogpile、Ixquick、Profusion等6个国外元搜索引擎作较深入的调查和对比分析,归纳总结并评价了国外元搜索引擎的发展现状,最后基于这些调查结果对元搜索引擎提出一些发展建议.
【总页数】4页(P40-43)
【作者】刘畅;林剑锋;王雁杰
【作者单位】北京大学信息管理系,北京,100871;北京大学信息管理系,北
京,100871;北京大学信息管理系,北京,100871
【正文语种】中文
【中图分类】TP391
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档