google搜索引擎现状及发展趋势研究

google搜索引擎现状及发展趋势研究
google搜索引擎现状及发展趋势研究

摘要

Google 富于创新的搜索技术和典雅的用户界面设计使Google 从搜索引擎中脱颖而出。一路走来伴随着鲜花和掌声,但是近几年随着twitter及facebook 的兴起和苹果的多元化经营,以及搜索引擎市场的变化,往日的搜索巨头面临着市场逐渐被侵蚀的现实。Google也做出了相应的调整,以求在下一代搜索引擎市场中依然独占鳌头。

本文首先从Google的产生,发展的社会经济条件入手,层层展开。进而探讨了Google的营销模式。并且运用了市场定位的分析方法,提出了Google在发展过程了所遇到的问题,认为Google在发扬自己的原有优势的同时,应加强社交化搜索和移动化搜索等的力度,构建了全方位的搜索体系。

最后,总结出了Google搜索引擎发展的大趋势,并进一步指导企业顺应发展趋势,如何在Google搜索引擎上取得好名次。

关键字:Google,搜索引擎,市场定位分析法,移动化搜索

The situation and research of development trend of Google

search engine

Abstract

Innovative Google search technologies and elegant user interface make Googleexcellent among the first generation of search engine. Along the way along with flowers and applause, but in recent years with the rise of twitter and facebook and Apple's diversification, as well as the changes of the search engine market, past the search giant is facing with the reality of the market is gradually being eroded. Google also made a corresponding adjustment in order to still come out on top in the next generation of search engine market.

First from the Google generation, the development of socio-economic conditions start, layers expand. And then discusses the Google's marketing model. Market positioning and the use of analytical methods, the problems encountered by Google in the development process that Google at the same time develop their own original advantage, should strengthen the intensity of social search and mobile search, build a full faceted search system, summed up the trend in the development of the Google search engine and guide the foreign trade companies, the trend of development, how to get good ranking in the Google search engine.

Keywords:Google Search engine Analysis method of market ositioning Mobile search

目录

1 引言 (1)

1.1选题背景 (1)

1.2选题意义 (1)

2 Google公司现状分析 (1)

2.1 Google公司的整体简介 (1)

2.2 Google公司的产品与服务 (2)

2.2.1Android系统 (2)

2.2.2 云计算 (3)

2.2.3Google+ (3)

3 Google的营销模式 (5)

3.1 长尾理论和深度营销 (5)

3.2Google AdWords和Google AdSense介绍 (6)

4 Google的市场定位分析 (7)

4.1 Google的产品定位分析 (8)

4.1.1谷歌广告收入快速增长,搜索广告是支柱 (8)

4.1.2视频广告和展示广告增速较快,是未来重点发展领域 (8)

4.1.3谷歌不断布局广告市场,广告系统是关键 (10)

4.1.4中美市场发展阶段不同,谷歌动作证明视频和展示广告潜力 (11)

4.2 Google 企业定位 (12)

4.3 Google竞争定位 (12)

4.3.1Facebook的崛起 (12)

4.3.2社交业务 (13)

4.3.3 苹果的ios系统 (14)

4.3.4twitter (14)

5 分析Google的发展趋势 (16)

5.1 Google的全球化战略和国际化形式 (16)

5.1.1 Google的全球战略规划 (16)

5.1.2 语音识别以及语音合成技术 (16)

5.1.3 Google的“语义搜索”计划 (17)

5.2 搜索的社会化与Google的对策 (18)

6 企业在Google上的对策 (20)

6.1网站市场定位 (20)

6.2 谷歌优化排名发掘自己的优势 (21)

6.3网站运营的计划 (21)

6.4 竞争对手情况分析 (21)

6.5 谷歌优化排名站点的盈利点 (22)

1 引言

1.1选题背景

Google 富于创新的搜索技术和典雅的用户界面设计使Google 从搜索引擎中脱颖而出。一路走来伴随着鲜花和掌声,但是近几年随着twitter及facebook 的兴起和苹果的多元化经营,以及搜索引擎市场的变化,往日的搜索巨头面临着市场份额逐渐被侵蚀的现实。Google也做出了相应的调整,以求在下一代搜索引擎市场中依然独占鳌头。

1.2选题意义

穷则变,变则通,通则久。针对新一轮的互联网存在的新变化。Google不能坐以待毙。Facebook和twitter的崛起,逐渐侵蚀着Google的市场份额,目前在facebook可以实现的盈利模式包括展示类广告、搜索广告、电子商务、网络游戏以及向用户收费等形式,也就是说facebook既可以做到向企业收费,也可以向用户收费,收费模式是比较多元化的。2012年5月18日,facebook的IPO首次融资获得了1000多亿美元。这让Google更坐卧不安。

并且运用了市场定位的分析方法,提出了Google在发展过程了所遇到的问题,认为Google在发扬自己的原有优势的同时,应加强社交化搜索和移动化搜索等的力度,构建了全方位的搜索体系。

最后,总结出了Google搜索引擎发展的大趋势,并进一步指导外贸公司顺应发展趋势,如何在Google搜索引擎上取得好名次。

2 Google公司现状分析

首先介绍下Google的整体情况,及它产生的的社会经济条件。从中我们可以感性的了解到谷歌目前的情况,及所存在的问题,从而为进步分析Google的发展趋势打下良好的基础。

2.1 Google公司的整体简介

1996 年,斯坦福大学的研究生拉里·佩奇(Larry Page) 和塞吉·布林(Sergey Brin) 开发了一个名为“BackRub”的搜索引擎,该搜索引擎会使用链接确定各个网页的重要程度。到1998 年,他们的工作正式启动并创办了一家公司,也就是我们现在所知的Google。

此后,Google 便开始飞速发展。从最初只提供一种语言的搜索服务发展到现在提供支持多种语言的数十种产品和服务(包括适用于多种任务的各种形式的广告和网络应用程序)[1]。起初,只有两名计算机科学专业的学生在他们的大学宿舍中工作;如今,已拥有成千上万名员工,办公地点遍及世界各地。

Google 的使命就是提供网上最好的查询服务,促进全球信息的交流。Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对30 多亿网页进行整理,Google 可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。

2.2 Google公司的产品与服务

图1-1 Google的几个常见服务功能

另外值得重点指出的几个特色产品是:1. Google earth : Google 地球可带您飞往地球上的任何地方,您可以在Google 地球上看到卫星图

像、地图、地形和3D 建筑,包括外太空的银河系以及大洋峡谷。

2.2.1Android系统

据comScore最新的2012年2月美国移动用户市场份额报告,谷歌的Android移动操作系统在一年内持续增长,已经达到了50.1%。

图1-2 2012年2月美国移动用户操作系统市场份额报告

2.2.2 云计算

云计算是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变,各个互联网公司都开始蠢蠢欲动。希望在下一个科技趋势中,居于领导地位。2006年8月9日,Google首席执行官埃里克·施密特(Eric Schmidt)在搜索引擎大会(SES San Jose 2006)首次提出“云计算”(Cloud Computing)的概念。Google“云端计算”源于Google工程师克里斯托弗·比希利亚所做的“Google 101”项目。2012年4月6

日,全球搜索引擎龙头Google4月3日在台湾彰滨工业区举行云计算数据中心(Data center)动土典礼,Google亚太区总裁Daniel Alegre在典礼上宣布,因看到亚洲网络使用人口的需求,决定投资规模从一亿美元增加

到3亿美元,做为购地、建造和添购技术设备之用,预计数据中心到

2013年下半年就可逐步运作,并成为亚太区最大的云计算信息中心。2.2.3Google+

得社交着得天下。在网络世界里,每一个网民就是一个发言者,都有可能左右流行趋势的走向。每一个草根都有可能成为网络达人。

Google+的谷歌推出一方面是阻击twitter和facebook的迅速崛起。更重要的是顺应时代的发展。社交网络Google+取得了不俗成绩。网络数据调查公司Chitika对于Google+的数据统计报告显示,创建至今不到四个月,

Google+已经拥有1亿的用户群,不久前谷歌官方公布,截至2012年1月19日,他们的社交网用户达到了9000万。家谱网站创始人保罗·艾伦认为,Android 4.0推出后Google+的注册量和使用量会增加,到2012年底Google+用户会达4亿。

3 Google的营销模式

3.1 长尾理论和深度营销

首先介绍下长尾理论,它是网络时代兴起的一种新理论,由美国人克里斯·安德森提出。长尾理论认为,由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。这些需求和销量不高的产品所占据的共同市场份额,可以和主流产品的市场份额相比,甚至更大。

过去人们只能关注重要的人或重要的事,如果用正态分布曲线来描绘这些人或事,人们只能关注曲线的“头部”,而将处于曲线“尾部”、需要更多的精力和成本才能关注到的大多数人或事忽略。例如,在销售产品时,厂商关注的是少数几个所谓“VIP”客户,“无暇”顾及在人数上居于大多数的普通消费者。而在网络时代,由于关注的成本大大降低,人们有可能以很低的成本关注正态分布曲线的“尾部”,关注“尾部”产生的总体效益甚至会超过“头部”。

Google是一个最典型的“长尾”公司,其成长历程就是把广告商和出版

商的“长尾”商业化的过程。以占据了Google半壁江山的AdSense为例,它面向的客户是数以百万计的中小型网站和个人—对于普通的媒体和广告商

而言,这个群体的价值微小得简直不值一提,但是Google通过为其提供个性化定制的广告服务,将这些数量众多的群体汇集起来,形成了非常可观

的经济利润。目前,Google的市值已超过1200亿美元,被认为是“最有价

值的媒体公司”,远远超过了那些传统的老牌传媒。

深度营销,就是以企业和顾客之间的深度沟通、认同为目标,从关心人的显性需求转向关心人的隐性需求的一种新型的、互动的、更加人性化的营销新模式、新观念[2]。它要求让顾客参与企业的营销管理,给顾客提供无限的关怀,与顾客建立长期的合作性伙伴关系,通过大量的人性化的沟通工作,使自己的产品品牌产生润物细无声的效果,保持顾客长久的品牌忠诚。它强调将人文关怀的色彩体现到从产品设计到产品销售的整个过程之中,乃至产品生命周期的各个阶段[3]。

相信大家已经对在手机上点点画画的场面都经历过。有时感觉还不灵敏。现在Google已经推出了语音搜索服务。调查显示,2011年在美国智能手机

Android系统中,已有20%的客户选择了语音搜索,并且越来越受到消费着的喜欢。另外,Google推出了一系列的人机一体化的软件,大大方便了消费者。

3.2Google AdWords和Google AdSense介绍

Google AdWords ,它是一种在Google 及其广告合作伙伴的网站上快捷简便地刊登广告的方式,无论广告预算多少都可充分享受其高效广告服务。AdWords 广告会随搜索结果一起显示在Google上,还会显示在日益壮大的Google 联网中的搜索网站和内容网站上,包括AOL、EarthLink、HowStuffWorks 和Blogger 等网站[3]。每天都有为数众多的用户在Google 上进行搜索,并在Google 联网上浏览网页,因此,大量的用户将看到您的Google AdWords 广告。

Google AdSense是一个快速简便的网上赚钱方法,可以让具有一定访问量规模的网站发布商为他们的网站展示与网站内容相关的Google广告并将网站流量转化为收入。

4 Google的市场定位分析

根据Chitika2012年2月公布的研究数据发现,2012年2月全球搜索引擎市场的竞争格局基本与1月一致,其中,Google以72.1%的市场份额依然占据搜索引擎市场的主导地位,Chitika认为2012年Google仍将稳居搜索引擎市场第一的位置。Yahoo在2月赢得了更多的访问比例,成为2月搜索引擎市场唯一的赢家,其所占据市场份额从1月的11.1%上升到了2月的16.5%,超过了Bing占据了搜索引擎市场排名第二的市场份额。

分析认为,虽然搜索引擎市场竞争激烈,2月份Yahoo赢得了部分市场领先于Bing,但其是否能稳居第二仍难下断论,搜索引擎市场份额分布将继续保持基本稳定的格局,Google将继续保持搜索引擎市场的领先地位。面对其他搜索引擎的竞争,Google为了维持稳定的大比例市场份额正计划对其搜索功能进行全面改造,让搜索引擎更加智能化。新的谷歌搜索将更好地理解用户搜索问题的意思,为其提供最直接的事实和答案,让用户更快更容易地获得所需的信息[4]。

图3-1 2012年1月和2月全球搜索市场份额及分布情况

4.1 Google的产品定位分析

Google成功的一大特色,就是他始终走在技术的前沿。今天,很多企业热情的追逐品牌建设,却渐渐忘了技术是根本。你要想由内而外地打造品牌,要想创造客户体验,没有技术是不行的。舍弃技术这个根本,而追逐所谓的品牌塑造,是不切实际的。

成功建立起品牌识别以后,Google在产品线扩展方面的维护也值得一提。Google不满足于单一的搜索,也没有像许多急功近利的厂商那样,看什么流行就做什么。它所有产品都围绕“信息整理”,这一核心目标展开。因此有了海量邮箱,它对繁多的email进行有效整理[5];而Google Adwords则在搜索知识时,将包含相关信息的广告自动匹配;其它的地图服务,是对地理信息的整合;Orkut 则是对人际关系信息的整合。总之,Google的目标就是整理人类信息,它的产品线也是围绕这一主旨展开的,各产品之间通过整合,就可以实现密切的配合。这种产品策略,使得Google在品牌延伸的过程中“平滑过渡”。

近段时间来,谷歌推出视频版谷歌Adwords广告平台,在Yotube上改进广告系统,提升视频广告的投放效果;又不断整合AdSense和AdMob,理清桌面互联网、移动互联网和手机APP上展示广告投放系统的关系。在广告系统上动作不断。

4.1.1谷歌广告收入快速增长,搜索广告是支柱

根据谷歌的财报,其2011年三季度的全球营收达到了97.2亿美元,较去年同期增长39.5%。近十个季度以来其全球营收的结构比较稳定,今年二季度其营收中来自谷歌网站(Google Sites)的占69.3%,来自谷歌网络联盟(Google Networks)的占26.7%。这两部分广告收入总共占96.0%。显然,广告收入是谷歌营收的最主要来源,而这其中关键词搜索广告是支柱。

4.1.2视频广告和展示广告增速较快,是未来重点发展领域

目前美国网络广告市场上,搜索广告规模还是最大的,图形展示广告次之,视频广告规模也在前五名的位置。2010年,美国网络广告市场上搜索广告的规模有120亿美元,占整个美国网络广告市场规模的46.3%,而这其中相当大部分被谷歌挣得了。虽然搜索广告依然保持了较快增长,去年的增长率有12.2%,但是展示广告23.1%的增长率、视频广告39.6%的增长率使之成为成长

最突出的两种广告形式,预计今年这两种广告形式的增长将会更加迅速。美国市场是谷歌最重要的市场,来自美国市场的收入长期占谷歌总营收的将近50%:今年三季度来自美国本土市场的收入占谷歌总营收的45%.面对着美国网络广告市场发展的新形势,视频广告和图形展示广告是谷歌必须重视的业务领域。

在网络视频领域,YouTube在被谷歌以16.5亿美元收购之后,发展一直不错,根据https://www.360docs.net/doc/658880181.html,其排名仅次于https://www.360docs.net/doc/658880181.html,和Facebook,已经成长为全球第三大网站。此次调整广告系统,目的主要应该是进一步改进中小客户投放广告的体验、提升广告效果以增强其盈利能力。

另外,图形展示广告也是谷歌一直关注的领域。图形展示广告主要是其广告网络联盟进行投放。目前图形展示广告对谷歌的营收贡献相对较少,但是面对其越来越快的增长,谷歌会非常重视这一块市场。

图3-2 2010年美国互联网广告市场不同形式规模

图3-3 2010年美国互联网广告市场不同形式增长率

4.1.3谷歌不断布局广告市场,广告系统是关键

谷歌在网络广告市场上不断布局,收购了多家网络广告公司,旗下广告产品也在不断整合。谷歌成立至今已有13年,这期间其不但成为全球最大的搜索引擎、营收迅速增长,也在不断地实施收购。截止到目前,谷歌已完成了102起收购,披露的较大的33起收购案的金额超过221.7亿美元。在这些收购案中,刨除收购摩托罗拉移动花费的资金,其他收购涉及的金额超过96.7亿美元。这96.7亿美元中,收购的10家网络广告相关企业涉及金额超过46.2亿美元,占到47.8%。其中,2003年收购的Applied Semantics和Sprinks是与AdWords相关的;而收购其他几家企业,例如31亿美元收购DoubleClick、7.5亿美元收购AdMob等,几乎都着力于增强AdSense的竞争力,并被逐渐融合进了AdSense。

AdSense是谷歌通过网络联盟占领桌面和移动互联网广告市场的主要武器。谷歌目前的策略是通过搜索引擎、安卓系统、YouTube、Google+等产品获取用户信息、牢牢掌控流量,再将广告精准投放到合作伙伴的网站、视频、

APP等产品上。因为仅靠谷歌自身的资源是无法渗透到互联网的各个方面的,

联盟对他很重要。这也可以明白Facebook对谷歌的威胁所在,其掌握的大量社交用户的信息以及成员数量庞大的开放平台更有利于进行广告的精准投放。

谷歌在广告市场上的布局虽远不如在搜索、社交领域的动作那么引人注目,但却是谷歌营收的关键所在。现在谷歌主要依靠搜索广告创造营收,而在YouTube上推广广告以及通过AdSense向联盟网站投放视频广告和展示广告将会为其贡献越来越大的营收。

表3-4 视频广告和展示广告的贡献率增大

Google有史以来收购的网络广告企业

收购时间公司名称设计领域公司国籍收购金额

(亿美元)对应Google 业务

2003.4.1 Applied

semantics

在线广告美国$1.02 Adwords 2006.1.17 Adcarf 在线广告美国$0.23 Adsense 2007.2.16 Doubleclick 游戏内置广

美国$31 Adsense 2007.4.13 Admob 移动广告美国$- Adsense 2009.11.23 Teracent 在线广告美国$0.81 Adsense 2010.6.3 Invitemedia 在线广告美国$0.62 Adwords 2011.6.9 admeld 在线广告美国Adsense Source:https://www.360docs.net/doc/658880181.html,

4.1.4中美市场发展阶段不同,谷歌动作证明视频和展示广告潜力

美国的搜索引擎市场发展已经比较成熟了,虽然搜索广告市场规模依然保持着强劲增长,但以谷歌为代表的企业正在努力开拓搜索广告之外的市场。而中国的搜索引擎市场尚处于快速发展的阶段当中,竞争十分激烈。自去年谷歌退出中国风波以来,谷歌搜索的流量在不断下降,但是广告营收却依然保持了稳定增长,广告平台应当为其贡献了相当部分的营收。谷歌的动作预示了这样一种趋势,视频广告、展示广告是下一个快速增长的广告市场,各家公司都在积极拓展,并且这个市场将会在移动互联网上取得更大的发展。2012年4月10日消息,谷歌今日宣布在中国正式推出DoubleClick Ad Exchange广告交易平台。

DoubleClick Ad Exchange是谷歌为展示广告行业买卖双方提供的交易平台,通过实时竞价确定广告价格。

谷歌全球副总裁刘允表示,DoubleClick Ad Exchange在中国的推出是谷歌展示广告战略的重要部分。他表示,广告网络和代理机构可以用“每一次广告展示”为基础进行实时拍卖,谷歌同时也可以为发布商和广告代理商提供详尽的数据和结算方式。

最新的数据显示,中国2011年网络广告规模已超过报纸媒体,达到791亿元,仅次于电视861亿元的规模。

4.2 Google 企业定位

与大规模技术有关:用技术帮助人,让人们生活更好,让社区更好。显然,我们的使命是组合全球信息,让它最终可接入,可使用。Google用最精炼的语言诠释着自己的使命。其中让生活更美好,让社区更好。这一点值得特别关注。Google之前一向是技术的崇拜者,它也是这样做了。可苹果的成功让Google不得不审视自己的战略定位。消费者追求的是产品的时尚与可用性,而不是你的产品技术有多高。Google已经更加关注了社交化的发展这一大趋势。

4.3Google竞争定位

4.3.1Facebook的崛起

谷歌联合创始人拉里·佩奇有一段Facebook情结。在去年4月接替导师埃里克·施密特(Eric Schmidt)出任谷歌CEO时,佩奇便坚持认为,该公司必须采取更为主动的措施,应对Facebook日益受宠引发的威胁。

作为回应,佩奇启动了一项社交网络计划。虽然他本周三就将迎来担任CEO一周年的纪念日,但目前仍在借助这一计划重塑谷歌的形象。

Facebook已经迫使谷歌开发了自己的社交网络Google+,甚至还对隐私政策和互联网搜索结果进行了调整。这些变化引发了外界质疑:为了保护自己网络广告帝国,这家最有权势的互联网公司是否已经抛弃了“不作恶”的信条?

“Facebook让谷歌意识到自己在社交领域的不足,这是不容忽视的缺陷。”史蒂文·莱维(Steven Levy)说,他撰写的《In The Plex》一书对谷歌过去14年的发展进行了详细介绍。

考虑到谷歌在利润丰厚的互联网搜索和广告市场的主导地位,对Facebook 的担忧似乎有些杞人忧天。谷歌去年实现广告销售额365亿美元,达到Facebook 32亿美元广告收入的十多倍。

但佩奇明白,Facebook拥有一项重要优势,完全有可能借此超越谷歌。故不可不防呀。

4.3.2社交业务

自2004年诞生以来,Facebook便一直在囤积有关用户社交圈和兴趣爱好的重要信息。随着Facebook逐渐受到用户的欢迎,它所搜集的数据也在不断增多。这使得Facebook能够发布更为精准的广告,并提供与用户兴趣和喜好更为贴近的内容。

谷歌很难利用这些数据来改善搜索引擎和其他产品,这也正是该公司自主开发社交网络的原因。

自9个月前上线以来,Google+已经吸引了1亿多用户。尽管仍然落后于Facebook的8.45亿,但却远好于发展早期的Facebook.

不过,Google+尚未证明它的确能够吸引用户关注。据美国互联网流量监测机构comScore统计,用户每月平均在Google+上仅停留几分钟,而Facebook的这一数字则长达6至7小时。

但佩奇出任CEO后推出的Google+和其他社交网络功能,的确帮助谷歌更好地了解了用户的生活。如今,谷歌可以利用其中的部分数据出售更多广告,该公司几乎所有的收入都来源于此。

Facebook有可能在下月上市,届时,其威胁还会进一步加大。此次IPO(首次公开招股)有望融资50亿美元,由此获得的免费宣传可能会为该公司吸引更多流量。本次IPO有可能超过谷歌2004年时创下的记录,成为美国历史上规模最大的互联网公司新股首发。

谷歌表示,佩奇工作太忙,无法就过去一年的CEO生涯接受采访。事实上,佩奇曾在谷歌创立之初担任过CEO,但由于早期投资者希望引入一位更有经验的领导者,所以他于2001将帅印交给了施密特。

施密特现在担任谷歌执行董事长,他去年表示,没有对Facebook的挑战给予足够重视,是他任期内最大的遗憾。

佩奇接任CEO后,便将谷歌高管的办公室搬到Google+团队所在的办公楼,从而明确了公司的首要任务。他还将员工的部分奖金与Google+的表现挂钩,并取消了一些不必要的业务,关闭了20项不太热门的服务,包括数字病例项目[5]。

“佩奇受制于他对Facebook的偏执。显然,这两家公司正在开战。”肯·欧列塔(Ken Auletta)说,他是在写《谷歌:一如我们所知的世界末日》(Googled:The End of the World As We Know It)一书时认识佩奇的。

4.3.3 苹果的ios系统

谷歌CEO拉里·佩奇(Larry Page)在接受采访时表示,乔布斯痛恨Android 是在作秀(for show)。

佩奇表示,我认为,乔布斯对Android的痛恨事实上是装样子。我曾是史蒂夫的朋友。我不会说经常跟他在一起,但是我会定期性地去探望他。奇怪的是,事实上,那次谈话是他发出的邀请。他发给我一封邮件,里面写道,“嘿,你想不想来聚一聚聊聊天?”我说,“好的,我会去。”我们的对话十分愉快。我们之间的谈话一直很愉快。

他病得很重,当他表示希望和我聚一聚的时候,我感到十分荣幸。我知道,那时他希望能与他的家人在一起。在有关如何运营一个公司方面,他有很多十分有趣的见解,这是我们经常讨论的话题。

佩奇说,“对许多企业来讲,让他们觉得自己拥有一个强大的竞争者对他们自身是有益的。我个人认为,应该瞄准更高的目标。你不希望跟着竞争对手后面。你想要看到的是有没有这个可能性将世界变得更好,以及如何实现这个目标。

4.3.4twitter

微博客网站Twitter ,实际上是即时信息(IM)的一个变种,用户无须输入自己的手机号码,就可通过它免费地将自己的最新动态、想法和问题以短信息的形式发送给个人手机或者个性化网站群。

谁也没有想到,就是这款看似有趣的“小杰作”——Twitter使得威廉姆斯“时来运转”,不仅偿还了所有债务,身价也一度暴涨。今天,它成为Facebook、谷歌等争相收购的香饽饽[6]。

Twitter之所以如此受宠,就在于因为与生活息息相关,其网站上聚居了大量用户和信息,对于用户而言,人们使用产品和服务的体验通过Twitter来呈现,并可通过它来发帖投诉反应问题。对于商家,他们希望借助Twitter掌握客户的体验,通过收集信息,为其销售或服务的对错提供判断依据。

Twitter另一个有趣的创新在于用70个字的短小文本来回答“你在做什么”的问题。这看似平常的生活片段,却因真实、亲切、即时,而渐渐流行开来。

此外,Twitter还直接提供了大量报纸号外,使得用户能利用它及时、便利地分享新闻或查询事实。2008年孟买袭击事件和美航坠河事件,Twitter都成为人们坚守的信息阵地。对Twitter用户而言,许多新闻,特别是一些社区新闻,该网站的反应速度要比新闻网站或谷歌快。

除了扮演提供信息的微型博客服务外,Twitter的更大魅力在于可能成为一个深度搜索引擎,这点连谷歌都不具备。谷歌搜索的信息海量,但99%都是垃圾信息,而Twitter则有一个专业人士组成的团队负责挑选信息。

去年夏季,Twitter收购了Summize搜索引擎,并将其改善,包含了所有用户知识的搜索。用户可在上面搜索新闻,而商家则搜索反馈意见。今年3月初,Twitter搜索又增加了“趋势”(Trends)按钮,用户可直接选中网站下拉菜单中显示的“10大热门主题”进行趋势搜索[7]。

正是这些有趣和创新的功能,成为其挑战巨头的杀手锏。一名Twitter的投资人托德·查菲(Todd Chaffee)向《广告时代》网站(https://www.360docs.net/doc/658880181.html,)表示:“Twitter可向全球所有人发问并获得答案,有数百万人在贡献自己的知识,这点谷歌难以做到。

当今搜索引擎技术及发展趋势

当今搜索引擎技术及发展趋势 随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。 搜索引擎(Search Engine)是随着WEB信息的迅速增加,从1995年开始逐渐发展起来的技术。据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计,全球目前的网页超过8亿,有效数据超过9T,并且仍以每4个月翻一番的速度增长。用户要在如此浩瀚的信息海洋里寻找信息,必然会“大海捞针”无功而返。搜索引擎正是为了解决这个“迷航”问题而出现的技术。 搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”。搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。 一、分类 按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类: 1.目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo、LookSmart、Open Directory、Go Guide等。2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;国内代表为:“天网”、悠游、OpenFind等。 3.元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。 二、性能指标 我们可以将WEB信息的搜索看作一个信息检索问题,即在由WEB网页组成的文档库中检索出与用户查询相关的文档。所以我们可以用衡量传统信息检索系统的性能参数-召回率(Recall)和精度(Pricision)衡量一个搜索引擎的性能。 召回率是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统(搜索引擎)的查全率;精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统(搜索引擎)的查准率。对于一个检索系统来讲,召回率和精度不可能两全其美:召回率高时,精度低,精度高时,召回率低。所以常常用11种召回率下11种精度的平均值(即11点平均精度)来衡量一个检索系统的精度。对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的WEB网页,所以召回率很难计算。目前的搜索引擎系统都非常关心精度。 影响一个搜索引擎系统的性能有很多因素,最主要的是信息检索模型,包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制

中外搜索引擎研究的现状与发展

中外搜索引擎研究的现状与发展 夏旭李健康 (第一军医大学图书馆广州510515) 摘要: 以WWW网络搜索引擎的发展历程为基础,综述了WWW网络搜索引擎的定义、检索机制、检索规则、词表应用、分类研究、比较研究等方面取得的新进展,探讨搜索引擎发展走向与思路。同时就目前中外搜索引擎普遍存在的问题进行分析,希能对国内中文搜索引擎的开发和准确、快速、全面检索WWW网络乃至因特网信息资源有所启示。 关键词:搜索引擎研究进展综述信息资源管理 由于因特网上信息资源内容广泛、时效性强、访问快速、网络交互搜寻、动态更新,而且还提供快速访问网上信息资源的各种搜索引擎(Search Engines),用于快速搜索WWW网络乃至因特上的有用信息,使得通过WWW网络获取网络信息资源成为国内外研究的一大热点。基于网络的搜索引擎的研制与开发应用成为当前网络信息资源开发应用研究领域的热点。英文搜索引擎“GOOGLE”和中文搜索引擎“百度搜索”的推出,拉开了搜索引擎核心技术争夺战的序幕。可以预言,在今后一段相当长的时间里,搜索引擎还将有长足的发展和进步,检索功能将更趋向于集成化和更具亲和力、更显人性化。 1 搜索引擎的定义、检索机制、检索规则和词表应用 1.1 定义 搜索引擎,Search engines,又称搜索机,Web搜索器,是伴随WWW网络出现的检索网上信息资源的新工具。实质上是一种网页网址检索系统,有的提供分类和关键词检索途径,有的仅提供关键词检索途径。它根据检索规则和从其他信息服务器上得到数据并对数据进行加工处理,自动建立索引,并通过检索接口为用户提供信息查询服务,能够自动对WWW资源建立索引或进行主题分类,并通过查询语法为用户返回匹配资源的系统。搜索引擎主要是由Crawler、Spider、Worm、Robot等计算机软件程序自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万甚至上亿条记录的数据库。它是通过采集标引众多网络站点来提供全局性网络资源控制与检索机制、将全球WWW网络中所有信息资源作一完整的集合、整理和分类、方便用户查找所需信息的网络检索软件。具有检索面广、信息量大、信息更新速度快,特定主题的检索专指性强等特点。 1.1.1 常规搜索引擎和元搜索引擎 自带索引数据库的搜索引擎通常被称为常规搜索引擎或独立搜索引擎,相应地,集多种常规搜索引擎于一体的搜索引擎则称为(多)元搜索引擎。元搜索引擎是国外搜索引擎开发者新设计的一种集成型搜索引擎,与独立搜索引擎的区别在于:它是通过一个统一的用户界面帮助用户在多个独立搜索引擎中选择和利用合适的搜索引擎,甚至是同时利用多个搜索引擎来实现检索操作。元搜索引擎没有自己独立的数据库,却更多地提供统一界面,形成一个由多个搜索引擎构成的具有独立功能的虚拟逻辑体,通过元搜索引擎的功能实现对这个虚拟逻辑体中各搜索引擎数据库的查询等一切操作。由于元搜索引擎预先配置好多个搜索引擎,每条检索指令都自动通过预先配置的搜索引擎执行,免去了用户逐一记忆和单独使用每个搜索引擎的麻烦。主要的元搜索引擎有ALL-IN-ONE、CUSI、Fun City Web Search、HyperNews、Linksearch、Savvysearch、Metacrawler、Best Search、W3Search Engines、WebSearch、Profusion、Mamma、Avenuesearch、Dogpile、Kwikseek、Findspot、Bytesearch、Webferret、Bluesquirrel Webseeker等。Metacrawler (http://www. https://www.360docs.net/doc/658880181.html,)能同时调用6个搜索引擎;Savvysearch (http://www. https://www.360docs.net/doc/658880181.html,)可有选择地调用21个独立的搜索引擎,检索Web、Usenet 新闻组、软件、参考工具、技术报告等信息,每次最多并行检索5个搜索引擎的数据库。Profusion (http://www. https://www.360docs.net/doc/658880181.html,)最多同时调用9个独立的搜索引擎,调用方式有全部调用、系统自动选择最好的3个、系统自动选择最快的3个、用户从中选取任意个搜索引擎。最新出现的桌面型离线式搜索引擎如Webcompass、WebSeeker、WebFerret、Echosearch、Copernic98等也是元搜索引擎。 1.1.2 集中式搜索引擎和分布式搜索引擎

搜索引擎模式案例分析

搜索引擎模式案例分析 搜索引擎 的基本情况 谷歌()公司的介绍:( .,:)是一家美国上市公司(公有股份公司),于年月7日由里?佩奇(岁)和谢尔盖?布林(岁)在年用募集来的万美元建立,以设计并管理一个互联网搜索引擎。公司的总部称作“”,它位于加利福尼亚山景城。目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到搜索结果。属于全文搜索引擎,也是综合性的搜索引擎。不作恶(' )是谷歌公司的一项非正式的公司口号,最早是由服务创始人在一次会议中提出。年在全球的市场份额为,年在中国的市场份额为,年为, 年利润超过了亿美元。年月,谷歌以亿美元收购摩托罗拉移动。 搜索引擎的价值网络以为中心,涉及提供的搜索服务、服务、管家次广告主等等,它们的关系如下图所示。 商业模式

1.战略目标 ——要为互联网使用者提供网上最好的查询服务,促进全球信息的交流。 2.目标用户 1)全球网民——让人们能够更加快捷更加方便的获取和查找信息。 2)企业市场——助力企业内部信息整合,加强企业内部搜索;帮助企业实行网络营销 3.产品和服务 1)搜索服务、移动服务、分享与沟通服务、软件产品等, 2)搜索服务包括:网页搜索、图片搜索、视频搜索、音乐搜索、地图搜索、购物搜索、 博客搜索、大学搜索、生活搜索、图书搜索、学术搜索等。 4.赢利模式 1)付费搜索服务 的网页搜索服务保证了他在行业的领先地位。它通过向各大门户网站提供搜素技术。通过技术的部分使用权的转让收取费用。 2)在线广告业务 谷歌之前在上海建立全球唯一分析中国广告市场的研究中心,用于进行中国用户举动习惯的分析。

搜索引擎原理及发展趋势

1 南昌航空大学 Nanchang Hangkong University 毕 业 论 文 题目 _搜索引擎原理及发展趋势__________________ 学院 _江西工业工程职业学校 _____________________ 专业 __________计算机网络________________________ 姓名 周文飞___________学号 036811100078 指导老师 李国忠______________职称________________ __2012__年_5__月_5_ 日 _

目录 第一章搜索引擎的概述 3 1.1 搜索引擎3 1.2 搜索引擎的发展史3第二章搜索引擎基本常识9 2.1 搜索引擎工作原理9 2.2 搜索引擎分类9 2.3 全文搜索引擎10第三章使用搜索引擎的一些基本规则和技巧12 3.1 搜索引擎的一些基本规则12 3.2 搜索引擎的一些基本技巧12第四章搜索引擎的评测16 4.1搜索引擎缺陷16 4.2搜索速度16第五章搜索引擎的未来发展动向及趋势18 5.1搜索引擎的未来发展动向18 5.2搜索引擎趋势19 结束语23致谢24参考文献25 2

第一章搜索引擎的概述 1.1 搜索引擎 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。 1.2搜索引擎的发展史 互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。 1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。 起源 所有搜索引擎的祖先,是1990年由Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。发展(1) Excite 的历史可以上溯到1993年2月,6个Stanford University(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目,他们还发布了一个供 3

搜索引擎在电子商务中的应用

搜索引擎在电子商务中的运用

搜索引擎在电子商务中的运用 摘要:20世纪互联网的出现和飞速发展,商务信息爆炸式的增长以及网络环境的日益复杂,搜索引擎作为信息检索的重要工具在网络经济中的作用变得越来越重要,搜索引擎与电子商务的结合是未来电子商务的发展趋势,因此本文以搜索引擎现状、面向电子商务的智能搜索引擎技术及在网络营销中的应用以及搜索引擎在今后的发展趋势做出简单的介绍. 关键词:电子商务;信息检索;搜索引擎;应用研究;发展趋势 一、对电子商务和搜索引擎的理解 从总体上来看,电子商务是指给整个贸易活动实现电子化。应用计算机与网络技术与现代信息化通信技术,按照一定标准,利用电子化工具来实现包括电子交易在内的商业交换和行政作业的商贸活动的全过程。 搜索引擎(SearchEngine):通过运行一个软件,该软件在网络上通过各种链接,自动获得大量站点页面的信息,并按照一定规则进行归类整理,从而形成数据库,以备查询。这样的站点(获得信息——整理建立数据库——提供查询)我们就称之为“搜索引擎”。 1.2 搜索引擎在我国的发展现状 (8) 1.2.1我国搜索引擎的背景 (8) 1.2.2 搜索引擎的现状 (9) 1.3本文的研究内容 (10) 第一章搜索引擎的原理…………………………………………………………… 11 2.1搜索引擎的原理概述…………………………………………………………… 11 2.2搜索引擎的实现原理…………………………………………………………… 12

2.2.1从互联网上抓取网页……………………………………………………… 12 2.2.2建立索引数据库…………………………………………………………… 12 2.2.3在索引数据库中搜索……………………………………………………… 13 2.2.4对搜索结果进行处理排序………………………………………………… 13 1.2搜索引擎的现状 1.2.1 我国搜索引擎的背景 百度上市后,我国的搜索市场一下子热了起来。越来越多的企业围绕着搜索市场作起了文章。而且,在搜索大战的同时,一些企业也抛出了一些惊人言论。近日,记者从专业做人脉交际的联络家(https://www.360docs.net/doc/658880181.html,)技术总监冉征处了解到,联络家正在加紧研发人脉相关领域的专业垂直,联络家之所以涉足专业垂直搜索引擎领域,是看到未来垂直专业搜索引擎市场的巨大商机,他认为未来搜索市场将进一步细分,象Google、百度等主张大而全的全球式搜索引擎将会面临垂直专业搜索引擎更大的竞争与挑战,他们的市场分额将会被逐渐瓜分,专业的行业性垂直搜索将受到网民的青睐。 那么缘何能得出如此结论呢?CNNIC第十四次互联网调查显示,搜索以71.9%的绝对优势成为用户从互联网上获得信息的主要方式。几乎在全球所有的调查中,搜索引擎都是互联网上使用程度仅次于电子邮箱的服务,搜索引擎服务能成为最受欢迎的服务是因为他解决了用户在浩瀚的互联网海量快速定位信息屏颈问题,在海量的网页里找信息按照传统方式需要用户一个网站一个网站一级目录一级目录下找,要耗费大量的精力和时间,几乎是不可能实现的任务。 1.2.2 搜索引擎的现状 随着互联网的信息量呈爆炸趋势增长,几年前全球式搜索引擎收录的网页量

中国搜索引擎服务市场的现状及发展

中国搜索引擎服务市场的现状及发展 ① 黄建莲② (华北科技学院管理系,北京东燕郊 101601) 摘 要:针对当前我国的搜索引擎服务市场分析该市场的规模、商业模式及发展前景,并从加强技术创新,提高服务质量,实现服务的垂直化和个性发展方面进行了探讨。 关键词:搜索引擎;搜索引擎服务;市场规模;服务市场;搜索引擎技术 中图分类号:F76416 文献标识码:A 文章编号:1672-7169(2005)03-0113-03 搜索引擎是一个传递企业网络营销信息的基本工具,它具有用户数量多、营销定位强的特点。对于企业能实现网站推广、产品推广、提升企业品牌等多方面的作用。因此搜索引擎服务商更应抓住机遇,挖掘商机,实现搜索引擎的服务价值。 1 中国搜索引擎服务市场的现状分析 111 中国搜索引擎服务市场的规模 11111 中国使用搜索引擎的用户和企业数量变化 根据CNN IC互联网用户调查数据显示,随着互联网用户的逐年增加,搜索引擎作为用户使用互联网的主要工具使用率呈现逐年上涨趋势。2004年中国互联网用户使用搜索引擎的用户比例占到80%,预计未来两年使用搜索引擎的用户仍呈现稳定增长态势。 从当前企业使用搜索引擎的服务来看,搜索引擎作为连接企业和用户的一座桥梁,也越来越受到企业的重视,越来越多的企业选择使用搜索引擎作为企业的推广方式。在2001年仅有7万家企业使用搜索引擎技术作为企业的推广方式,而2003年企业数量达到26万家,2004年企业数量达到49万家。 11112 中国搜索引擎行业市场规模现状 中国的搜索引擎市场格局基本稳定,目前主要以百度、雅虎、搜狐、G oogle、新浪、网易、中国搜索等几家厂商为主;据IResearch调查,2004年中国搜索引擎市场中,百度、雅虎、G oogle分别以36129%、22172%、21122%的用户占有率占据着国内搜索引擎市场的前三位,形成了国内搜索市场的“第一阵营”。紧随其后,新浪、搜狐、网易、Tom、中国搜索、 中华网等国内厂商形成了“第二阵营”。 IResearch统计数据显示,2003年中国搜索引擎市场规模为619亿元人民币,年增长率为147%。2004年中国搜索引擎市场规模将达到1215亿元人民币,年增长率为81%。如图1所示: 图1 中国搜索引擎行业市场规模 综上,目前中国的搜索引擎网络营销仍处于快速发展阶段,中国的搜索引擎市场无论是企业广告主的数量,还是整个搜索引擎行业市场规模都迅速发展。 112 搜索引擎服务市场的商业模式 搜索引擎是企业实施网络营销的重要工具之 311 ① ②作者简介:黄建莲(1977—),女,福建顺昌人,大学毕业,华北科技学院管理系助教。 收稿日期:2005206221

搜索引擎的现状和发展趋势

期末课程论文 论文标题:搜索引擎的现状与发展趋势 课程名称:信息检索技术 课程编号:1220500 学生姓名:潘飞达 学生学号:1100310120 所在学院:计算机科学与工程学院 学习专业:计算机科学与技术 课程教师:王冲 2013年7月1 日

【摘要】 搜索引擎包括图片搜索引擎、全文索引、目录索引等,其发展历史可分为五个阶段,目前企业搜索引擎和网站运营搜索引擎运用范围较广。在搜索引擎的未来发展中,呈现出个性化,多元化,智能化,移动化,社区化等多个趋势。 【关键词】 发展过程、发展趋势、检索技巧、个性化、智能化 1 搜索引擎简介 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。 其工作作原理分为抓取网页,处理网页和提供检索服务。 抓取每个独立的搜索引擎都有自己的网页抓取程序,它顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。 搜索引擎是根据用户的查询请求,按照一定算法从索引数据中查找信息返回给用户。为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护一个庞大的索引数据库。一般的搜索引擎由网络机器人程序、索引与搜索程序、索引数据库等部分组成。 系统结构图 2搜索引擎的工作原理 第一步:爬行 搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛WWW 文档 网络机器人程序 建立Lucence 索引 从数据库中搜索信息 Tomcat 服务器 Lucence 索引数据库 WWW 浏览器 WWW 浏览器 JSP 网络机器人程序

搜索引擎论文

搜索引擎发展状态及未来趋势 【摘要】 搜索引擎包括图片搜索引擎、全文索引、目录索引等,其发展历史可分为五个阶段,目前企业搜索引擎和网站运营搜索引擎运用范围较广。在搜索引擎的未来发展中,呈现出个性化,多元化,智能化,移动化,社区化等多个趋势。 【关键词】 发展起源、索引、数据库、网站运营、未来趋势 【参考文献】 《个性化搜索引擎原理与技术》《搜索引擎的设计与实现》搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。其工作作原理分为抓取网页,处理网页和提供检索服务。抓取每个独立的搜索引擎都有自己的网页抓取程序,它顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。 搜索引擎的发展起源可以追溯到第一个Gopher搜索工具Veronica。后来的搜索引擎的发展分为五个阶段。第一阶段,出现World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统

计互联网上的服务器数量,后来则发展为也能够捕获网址。第二阶段,出现了以概念搜索闻名的Excite以及元搜索引擎Dogpile。第三阶段,即yahoo的出现。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。Yahoo以后陆续有Google等提供搜索引擎服务,但不可否认的是,Yahoo几乎成为20世纪90年代的因特网的代名词。第四阶段,一种新的搜索引擎形式出现了,即元搜索引擎。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第五阶段的代表是智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。 搜索引擎目前包括图片搜索引擎、全文索引、目录索引、元搜索引擎、垂直搜索引擎等。全文索引引擎是名副其实的搜索引擎,国外代表有Google,国内有百度、搜狐等。它们从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。搜索引擎的自动信息搜集功能分为定期搜索和提交网站搜索。它的特点是搜全率比较高。目录索引,就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。与全文搜索引擎相比,目录索引有许多不同之处。首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。其次,搜索引擎收录网站时,只要网站本身

基于Google的云计算实例分析

Computer Knowledge and Technology电脑知识与技术第5卷第25期(2009年9月) 基于Google的云计算实例分析 蔡键1,王树梅2 (1.徐州师范大学现代教育技术中心,江苏徐州221116;2.徐州师范大学计算机科学与技术学院,江苏徐州221116) 摘要:首先介绍了云计算产生的背景、概念、基本原理和体系结构,然后以Google系统为例详细阐述了云计算的实现机制。云计算是并行计算、分布式计算和网格计算等计算机科学概念的商业实现。Google拥有自己云计算平台,提供了云计算的实现机制和基础构架模式。该文阐述了Google云计算平台:GFS分布式文件、分布式数据库BigTable及Map/Reduce编程模式。最后分析了云计算发展所面临的挑战。 关键词:云计算;集群;谷歌文件系统;大表;映射/化简 中图分类号:TP311文献标识码:A文章编号:1009-3044(2009)25-7093-03 Cloud Computing System Instances Based on Google CAI Jian1,WANG Shu-mei2 (1.Xuzhou Normal University Modern Educational Technology Center,Xuzhou221116,China;2.Xuzhou Normal University,School of Computer Science&Technology,Xuzhou221116,China) Abstract:This paper introduces the backgrounds,concept,basic principle and infrastructure of cloud computing firstly.Then it surveys im-plementation mechanism of clouding computing based on the instances of Google.Cloud computing is the system in enterprises based on the concepts of computer science.These concepts include parallel computing,distributed computing and grid computing.Google has his own platform of cloud computing.It provides implementation mechanism and infrastructure of cloud computing.This paper surveys the platform of cloud computing:Google File System,Distributed database-BigTable and Map/Reduce.Finally the paper analyse the challenge of cloud computing. Key words:cloud computing;cluster;GFS;bigtable;map/reduce 自2007年第4季度开始,“云计算”变成了IT领域新的热点。而2008年被称为云计算的元年,Google、Amazon、IBM、微软等IT 巨头们以前所未有的速度和规模推动云计算技术和产品的普及。本文介绍一些关于云计算的一些基本概念及Google提出的云计算模型及实现机制。 1云计算综述 云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。 云计算是虚拟化(Virtualization)、效用计算(Utility Computing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演进并跃升的结果。 1.1云计算的概念 云计算现在还没有统一标准的定义,一些大公司在自己的技术文档里给出了自己的定义。例如云计算在IBM的文档中对云计算的定义是:云计算一词用来描述一个系统平台或者一种类型的应用程序。一个云计算的平台按需进行动态的部署、配置、重新配置以及撤销服务等。 而对云计算更加通用的的定义是:云计算是一种商业计算模型。它 将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根 据需要获取计算力、存储空间和各种软件服务。从这个定义上讲可把云 计算看成是“存储云”与“计算云”的有机结合。存储云对第三方用户公 开存储接口,用户通过这个接口可以把数据存储到“云”。计算云通过并 行计算和虚拟化技术给用户提供计算力,它的商业模式是给用户提供计 算力。 1.2云计算实现机制 图1简单的描述了云计算的实现机制。用户通过用户交互接口 (User interaction interface)来请求服务云。一个用户能够请求的所有服务 目录存放在服务目录(Services catalog)里。系统管理(System manage- ment)是用户管理计算机资源是否可用。服务提供工具(Provisioning tool)用来处理请求的服务,需要部署服务配置。监控统计(Monitoring 收稿日期:2009-05-07 作者简介:蔡键,硕士,讲师,主研领域为图形图像处理,网格技术。图1云计算实现机制 ISSN1009-3044 Computer Knowledge and Technology电脑知识与技术Vol.5,No.25,September2009,pp.7093-7095,7107 E-mail:info@https://www.360docs.net/doc/658880181.html, https://www.360docs.net/doc/658880181.html, Tel:+86-551-56909635690964

浅谈搜索引擎的研究现状

科 技 天 地 38 INTELLIGENCE ························浅谈搜索引擎的研究现状 西安外事学院计算机中心 李艳红 摘 要:文章分析了搜索引擎的发展历史及国内外搜索引擎的发展现状,采用了 对比的方法对特色搜索引擎的进行了阐述,并详尽的指出了各种搜索引擎的现状、特点及发展趋势。 关键词:搜索引擎 爬虫 网页快照 搜索引擎(Search Engine)正是帮助人们从网上检索信息的重要工具,是为了解决网上信息查询困难的问题应运而生的,它可以有效地帮助用户在网络上查找到自己需要的信息。它是在互联网产生后伴随着网上用户快速查询信息的需求的产物,即提供信息检索服务的计算机系统,检索的对象包括互联网上的站点,新闻组中的文章,软件存放的地址及作者,某个企业和个人的主页等。 当用户通过Archie 检索文件时,所要进行的全部工作就是对该数据库进行检索。尽管Archie 还不是真正的搜索引擎,但工作原理与现在的搜索引擎己经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者查询。1994年初,Internet 上出现了包括Lycos 在内的第一批Web 搜索引擎。第二代搜索引擎以1998年出的Google 和Directhit 为代表。它们是“根据以往用户实际访问一个网站并在该网站上所花费的时间来确定一个网站的重要性,或者根据一个网站被其他网站链接的数量来确定网站的重要性” ,“这种根据用户忠诚度的评判方法更具备客观性,因而,用户所获得的信息也就更准确”。如Directhit 以被大多数用户访问的情况认定一个网站的重要性;Google 以被其他网站链接的情况认定一个网站的重要程度。在发展过程中更强调了人的因素,主要表现在以下三个方面: (1)能利用自然语言查找信息。第二代搜索引擎可以将自然语言自动翻译成系统能理解的专业术语,进行精确查找。 (2)有判断地收集信息,根据众多网络用户行为特征来取舍信息。(3)人工分类。引入大量的人工对信息进行分类。强调人工分类的重要性。 此外,第二代的搜索引擎还有一个特点,他们只做后台技术,将技术提供给Yahoo 等门户网站。其中Google(https://www.360docs.net/doc/658880181.html,)是表现最为突出的。Google 于1998年9月发布测试版,是目前人们使用最广泛的搜索引擎。 Google 现为全球80多家门户和终级网站提供支持。Google 的优势是易用性和返回结果的高相关性。Google 提供一系列革命性的新技术,包括完善的文本对应技术和先进的PageRank 排序技术,后者可以保证重要的搜索结果排列在结果列表的前面。Google 还提供一项很有用的服务:“网页快照”功能。 目前,新一代的搜索引擎也己经进入了研制阶段,其最大特点就是大量智能化信息处理的引入,网络信息检索将步入知识检索和知识服务的领域。它的一个特征是能够解决文件格式问题,这就要求搜索引擎不仅能识别TXT 文件,也要能够识别PPT, Word, PDF,电子邮件等文件;另一个特征是把P2P 技术应用到网页的检索中,这样通过共享所有硬盘上的文件,目录乃至整个硬盘,用户搜索时无需通过Web 服务器,不受信息文档格式的限制,即可达到把散落在互联网上的不相关的人们关心的知识搜集起来,经过筛选,组织和分析返回给用户所需的信息。 国内目前已有很多关于搜索引擎的研究。百度搜索引擎[6]收录中文网页接近2亿,是全球最大的中文数据库。Baidu 搜索引擎的其它特色包括:网页快照,网页预览/预览全部网页,相关搜索词,错别字纠正提示,新闻搜索,Flash 搜索和信息快递搜索等。北大天 网搜索引擎是国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果,由北大计算机系网络与分布式系统研究室开发,有强大的搜索功能。除了WWW 主页检索外,天网还提供FTP 站点搜索(“天网文件”),为高级用户查找特定文件提供方便。同时,天网将FTP 文件分为电影和动画片,MP3音乐,程序下载,文档资源共四大类,用户可以像目录导航式搜索引擎那样层层点击,查找自己需要的FTP 文件。天网提供的服务还包括“天网目录”和“天网主题”。搜狐分类目录设有独立的目录索引,并采用百度搜索引擎技术,提供网站,网页,类目,新闻黄页,中文网址,软件等多项搜索选择。搜狐搜索范围以中文网站为主,支持中文域名。慧聪搜索引擎拥有超过2亿网页的中文信息库,提供网页,网站,新闻,地域,行业,MP3, Flash 等多种检索方式,具有互联网实时新闻搜索,高精度检索,分类查询,网站导航,企业与产品查询等功能。 目前的搜索引擎,每天使用爬虫在互联网上获取大量网页,这花去了大量的时间,对于面向大量用户的商业搜索引擎是非常合理的,但是对于只面向某一类型的网络,如校园网的搜索引擎,这无疑需要大量的计算资源和存储空间,这往往是得不偿失的。因此,对于校园网内搜索引擎,需要设计一种对资源要求低,灵活机动的方法。 参考文献: [1] 刘建国:《搜索引擎概述》,北京大学计算机与科学技术,1999年。 [2] 李晓明、刘建国:《搜索引擎技术及趋势》,《大学图书馆学报》,2000年第16期。

谷歌案例分析报告

G o o g l e搜索引擎案例分析报告 一、Google的基本情况 谷歌(google)公司的介绍:Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于1998年9月7日由里?佩奇(25岁)和谢尔盖?布林(24岁)在1998年用募集来的100万美元建立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到搜索结果。Google属于全文搜索引擎,也是综合性的搜索引擎。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号,最早是由Gmail服务创始人在一次会议中提出。Google 2008年在全球的市场份额为%,2007年Google在中国的市场份额为%,2008年为%,2008年Google利润超过了亿美元。2012年5月,谷歌以125亿美元收购摩托罗拉移动。 Google搜索引擎的价值网络以Google为中心,涉及Google提供的搜索服务、Google AdWords服务、管家次广告主等等,它们的关系如下图所示 二、商业模式 1.战略目标 ——要为互联网使用者提供网上最好的查询服务,促进全球信息的交流。 2.目标用户 全球网民——让人们能够更加快捷更加方便的获取和查找信息。 企业市场——助力企业内部信息整合,加强企业内部搜索;帮助企业实行网络营销 3.产品和服务 搜索服务、移动服务、分享与沟通服务、软件产品等,

搜索服务包括:网页搜索、图片搜索、视频搜索、音乐搜索、地图搜索、购物搜索、博客搜索、大学搜索、生活搜索、图书搜索、学术搜索等。 4. 赢利模式 1) 付费搜索服务 Google 的网页搜索服务保证了他在行业的领先地位。它通过向各大门户网站提供搜素技术。通过技术的部分使用权的转让收取费用。 2) 在线广告业务 谷歌之前在上海建立全球唯一分析中国广告市场的研究中心,用于进行中国用户举动习惯的分析。从信息传播的角度来看, Google 搜索引擎在此模式图中处于媒体( 信道) 的位置。搜索引擎从广告主得到广告业务( 信息) , 参与广告的制作与优化工作( 信息加工) , 并有选择地进行广告投放( 信息传播) 。与此同时, 搜索引擎收集来自检索用户的反馈信息( 反馈) , 进行用户行为 分析, 将结果用以个性化服务与广告投放改进( 调整) 。搜索引擎还将收集得到的反馈信息进行整理与加工, 并将广告效果信息反馈给广告主, 帮助其根据效果反馈对广告进行调整。如此循环, 就形成了搜索引擎广告业务的信息模型。Google 设计的关键字广告是目前互联网上最好的商业模式之一。google 的AdWords,是谷歌竞价排名盈利模式。它是一种以关键字为基本的网络广告情势。由于具有后果精准、价钱低廉、性价比高、操作方法简略、机动等特色,在全球得以敏捷推广和普及,目前已成为全球最风行的网络广告形式。有广告主开价竞购特定的搜索关键字,出价最高的人购买的广告关键字,会出现在用户搜索结果旁的最上面。最重要的是,广告主是按用户点击数付费的。也就是说,用户一开始只要付极少的费用就可以刊登广告。而且,可以保证用户的每次付费。因为Google 收费原则是点击付费,不点击不付费,默认点击在中国和波兰最低元/次,在全球其他区域是最低5美分/次。 2003年,Google 推出了比AdWords 更为先进、技术也更复杂的AdSense 广告模式,期望以会员的形式来吸引更多的网站加盟Google 广告发布平台。AdSense 实际上相当于一个广告联盟。AdSense 可以在加盟者网站的内容网页上展示相关性较高的Google 广告,并且这些广告不会过分夸张醒目。由于所展示的广告同用户在加盟者的网站上查找的内容相关,只要链接的广告被有效点击,加盟者还可以借此从Google 处分得一部分广告收入。谷歌的在线广告业务是谷歌成为世界上最赚钱的公司之一。据2009年财年Google 财报显示谷歌在这一年赚了236亿美元,净利润达65亿美元。目前谷歌的绝大多数收入来源于AdWords 和AdSense 这两项广告业务。 Google 广告业务模式图 5. 1) 网站兼容优势 Google 拥有强大的技术支持,能够支持网站的合理优化,网站管理员可以根据Google 的准则优化自己的网站。

专精深搜索引擎的发展趋势完整版

专精深搜索引擎的发展 趋势 Document serial number【NL89WT-NY98YT-NC8CB-NNUUT-NUT108】

专、精、深——搜索引擎的发展趋势中国互联网络信息中心的最新数据显示:截止至2009年6月底,中国的互联网人群规模为亿,其中约%的网民使用搜索引擎,年增长率高达34%。这说明随着计算机、互联网以及其它通讯技术的不断发展,人们对从网上获得信息的依赖程度越来越高。 据iResearch公司的调查报告指出,08年国内搜索引擎用户搜索内容最多是与“学习和工作”有关的资料,占%。如此高的比例,是源于网民的文化程度较高,50%以上的网民具有大专以上文凭,故而对于专业方面的信息需求量非常大。然而现今大多使用的搜索引擎搜索出的不相干结果很多,缺乏对内容的有效评判,并且存在大量的死链接和重复链接,让用户浪费了大量的时间去查找有用的结果。如何在浩瀚的信息海洋中快速地、有效地、准确完整地找到用户所需要信息是目前网民最为关心的。 “深度搜”)的出现修正了传统意义上搜索引擎的杂乱,它更专业、搜索结果更精准、对搜索内容的挖掘更深。 专业 全新打造的高质量专业信息搜索平台“深度搜”,已收集到世界上绝大部分中英文权威性学术期刊,包括自然科学,医药卫生,工程技术,人文及社会科学等领域的数万种期刊,近亿篇文献。除此之外,还有美国专利,欧洲专利,世界专利,中国专利,以及中英文百科全书。 精确 “深度搜”抛弃现今大部分搜索引擎使用的关键词、字符串匹配技术,采用全信息匹配技术,在不同层次,用不同组合,对搜索内容进行匹配,将最相关的搜索结果排在最前, 不会漏掉任何一个相关的搜索结果。“深度搜”可以用几个字,几句话,甚至整篇文章进行搜索,对搜索

元搜索引擎的现状与发展

元搜索引擎的现状与发展 摘要:论文简要介绍了元搜索引擎的相关知识,提出了元搜索引擎系统的发展设想和发展空间。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。一种搜索引擎不可能满足所有人或一个人所有的检索需求。集成搜索引擎和元搜索引擎尽可能地减少和优化了检索操作,实现了“一次检索输入,多引擎同时搜索”。由于其在搜索引擎中的不同特点和自身具有的优点,在以后的搜索引擎道路上必然会有很大的发展空间。 关键字:Internet搜索搜索引擎元搜索引擎信息检索技术发展前景 一.引言 在互联网发展初期,网站相对较少,网页数量亦较少,因而信息查找比较容易。随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,以至于迷失在信息的海洋中不知所措,出现了我们所说的"信息丰富,知识贫乏"的奇怪现象。搜索引擎正是为了解决这个"迷航"问题而出现的技术。搜索引擎(Search Engine简称SE)以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。现在,网上

的搜索引擎有很多,比较著名的有 Google,Yahoo,AltaVista,Dogpile,百度等。按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:目录式搜索引擎,以Yahoo为代表(最近改为使用全文搜索技术);全文搜索引擎,以Google为代表;元搜索引擎,以Dogpile 为代表。一个单一搜索引擎的网络覆盖率最多只能覆盖到整Internet资源的30-50%[3],因而查全率便无法保障;再加上任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以查准率亦无法保证;因此,要想获得一个比较全面、准确的结果,就必须反复调用多个搜索引擎,并对返回结果进行比较、筛选和相互印证。 二.元搜索引擎概述 各个搜索引擎的用户接口是异构的,有其特定且复杂的界面和查询语法,这给用户同时使用多个系统带来了不便.一些研究人员针对这种状况而开发了元搜索引擎,其中比较著名的有MetaCrawler,SavvySearch5等.元搜索引擎首先对用户的查询请求进行预处理,分别转换为若干个底层搜索引擎能处理的格式,并将其发送给各个搜索引擎.例如,MetaCrawler同时检 Yahoo,LookSmart,AltaVista等九个主要的搜索引擎.在各个搜索引擎返回检索结果后,元搜索引擎进行组合,并向用户返回最终的检索结果[Selberg95].由于元搜索引擎建立在搜索引擎的基础之

相关文档
最新文档