搜索引擎技术的发展
搜索引擎毕业论文

搜索引擎毕业论文搜索引擎毕业论文搜索引擎是当今信息时代的重要工具之一,它以其高效、准确的搜索结果,为人们提供了便捷的信息检索途径。
然而,搜索引擎的发展也面临着一些挑战和问题。
本文将探讨搜索引擎的发展历程、技术原理以及存在的问题,并提出一些改进的建议。
一、搜索引擎的发展历程搜索引擎的发展可以追溯到20世纪90年代,当时互联网开始迅速普及。
最早的搜索引擎主要是通过建立网页目录和分类索引的方式进行信息检索,但由于互联网信息的快速增长,这种方式无法满足用户的需求。
随着技术的进步,基于关键词的搜索引擎逐渐兴起,它通过对网页内容进行索引和排名,提供更加准确和全面的搜索结果。
二、搜索引擎的技术原理搜索引擎的核心技术是信息检索和网页排名。
信息检索是指根据用户输入的关键词,从海量的网页中筛选出与之相关的页面。
这一过程主要包括网页爬取、索引建立和查询处理等步骤。
网页爬取是指搜索引擎通过自动化程序(蜘蛛)访问互联网上的网页,并将其内容存储到数据库中。
索引建立是指将网页内容进行分词、词频统计等处理,生成索引文件以便后续查询。
查询处理是指根据用户输入的关键词,从索引文件中查找相关网页,并按照一定的算法进行排序和展示。
网页排名是指根据一定的算法,对搜索结果进行排序和展示。
搜索引擎的排名算法通常基于网页的相关性、权威性和用户体验等因素进行评估。
相关性是指网页与用户输入的关键词的匹配程度,权威性是指网页的信誉和影响力,用户体验是指用户对搜索结果的满意度。
搜索引擎通过对这些因素进行综合评估,为用户提供最符合其需求的搜索结果。
三、搜索引擎存在的问题尽管搜索引擎在信息检索方面取得了显著的成就,但仍然存在一些问题。
首先,搜索结果的准确性和可信度有待提高。
由于互联网上存在大量的垃圾信息和虚假信息,搜索引擎往往难以准确判断网页的质量和真实性。
其次,搜索引擎的个性化推荐功能存在一定的局限性。
虽然搜索引擎可以根据用户的搜索历史和兴趣偏好,为其提供个性化的搜索结果,但这种推荐往往容易陷入信息过滤的困境,导致用户接触到的信息变得单一和局限。
人工智能技术与语义搜索引擎的发展

人工智能技术与语义搜索引擎的发展随着科技的不断进步,人类已经进入了一个数字化和智能化的时代。
在这个时代中,我们不仅需要处理大量的信息,还需要快速地找到我们需要的信息。
因此,搜索引擎成为了我们日常生活中不可或缺的一部分。
搜寻引擎的技术也由最开始的简单的关键词匹配,发展到今天的语义搜索。
语义搜索是搜索引擎技术的一种演进形式。
在传统的搜索引擎中,我们需要精确地输入关键字,才能找到我们需要的信息。
而语义搜索则能够更加准确地理解搜索者的意图,找到和搜索者查询内容相关的信息。
为了实现语义搜索,搜索引擎需要使用人工智能技术。
人工智能技术包括自然语言处理、机器学习、大数据分析和人工智能算法等。
这些技术通过不断学习和累积信息,能够更准确地理解搜索者的意图,提供更好的搜索结果。
自然语言处理是人工智能技术中最基础的技术之一。
自然语言处理可以将人类自然语言转换为计算机能够理解的语言。
在搜索引擎的语义搜索中,自然语言处理起到很重要的作用,它可以将搜索者输入的自然语言转换为计算机能够理解的语言。
自然语言处理还可以将输入的信息进行标注和分类,方便搜索引擎进行更加准确的理解和分析。
机器学习也是人工智能技术中的重要组成部分。
机器学习可以让搜索引擎不断地从搜索者输入的信息中学习,进而提高搜索的准确性。
例如,通过记录搜索者的历史搜索记录、浏览记录、点击记录等数据,可以让搜索引擎更好地理解并预测搜索者的意图,提供更好的搜索结果。
除此之外,大数据分析也是语义搜索中的关键技术之一。
搜索引擎可以通过分析大量的数据,如图片、视频、文本等,获得更加丰富和多样化的信息。
这样搜索引擎就能够提供更深层次的搜索结果,满足搜索者更多元化的需求。
人工智能算法则是实现语义搜索的核心。
借助人工智能算法,搜索引擎可以更加准确地识别搜索者的意图,并提供更加个性化和精确的搜索结果。
例如,当搜索者查询“剪辑电影是什么意思”,传统搜索引擎可能会将结果局限于词语的解释。
但如果使用了人工智能算法,搜索引擎可以根据搜索者历史的搜索记录、浏览记录、地理位置等精准地判断搜索者的意图,并提供更加实用的信息。
互联网对网络搜索的影响与发展

互联网对网络搜索的影响与发展随着互联网的迅速发展和普及,网络搜索已经成为我们获取信息的主要途径之一。
无论是寻找新闻资讯、查找学术资料还是寻觅购物信息,人们都离不开搜索引擎。
本文将探讨互联网对网络搜索的影响与发展,并分析其对我们的日常生活和工作带来的重要变化。
一、互联网对搜索引擎的影响互联网的出现和发展,为搜索引擎提供了广阔的发展空间。
互联网的庞大信息海洋使得人们需要一种高效的方式来检索所需的信息。
搜索引擎通过自动化算法和大数据分析,能够在短时间内为用户提供准确的搜索结果,实现信息的快速查找。
互联网从根本上改变了人们获取信息的方式,使得搜索引擎成为了信息时代的重要工具。
二、搜索引擎的技术发展随着互联网的不断发展,搜索引擎技术也在不断更新和完善。
最初的搜索引擎通过对网页的关键字匹配来实现搜索结果的排序,但这种方式容易被优化者通过关键字堆砌等手段操纵搜索结果。
后来的搜索引擎技术引入了更复杂的算法,如PageRank算法,根据网页之间的链接关系进行排序,提高了搜索结果的质量。
随着人工智能和大数据技术的发展,搜索引擎开始利用机器学习等技术进一步改进搜索算法,提供更加个性化的搜索结果,满足用户多样化的需求。
三、互联网对搜索习惯的影响互联网的普及和搜索引擎的发展改变了用户的搜索习惯。
过去,人们往往通过书籍、报纸或者传统媒体来获取信息。
而现在,人们更倾向于通过搜索引擎直接搜索所需的信息,节省了大量的时间和精力。
另外,互联网还促使用户对搜索结果的要求更高,不再满足于简单的关键字匹配,而是希望能够获取更加精确、个性化的搜索结果。
这也进一步推动了搜索引擎的技术发展和更好地满足用户需求。
四、互联网对商业搜索的影响互联网的普及使得商业搜索成为可能。
越来越多的企业意识到在搜索引擎上展示自己的产品和服务的重要性,通过优化网站、投放广告等方式提高搜索引擎排名,从而获得更多的点击和曝光。
搜索引擎营销成为了一项重要的推广策略,极大地促进了企业的发展和增加了竞争力。
基于大数据的全网搜索引擎技术研究

基于大数据的全网搜索引擎技术研究当今互联网的发展已经使得搜索引擎成为了人们获取信息的重要方式。
而随着互联网数据的爆炸式增长,如何有效地利用大数据技术,提高全网搜索引擎的效率和准确性,成为了一个备受关注的话题。
全网搜索引擎技术的发展历程全网搜索引擎技术的发展可以追溯到上世纪90年代中期。
当时,由于互联网商业气息越来越浓厚,一些公司开始向网上营销转移。
为了提高网站流量和网民的黏性,搜索引擎应运而生。
早期的搜索引擎使用的是关键词索引技术,即将关键词在文档中出现的频率和位置等因素进行分析,以计算出文档的相似度,从而获取相关的搜索结果。
由于该方法只能基于关键字进行搜索,难以准确地理解用户的搜索意图,因此其准确性和效率都比较低。
2000年以后,随着大数据时代的到来以及基于机器学习的新技术的出现,全网搜索引擎技术得到了飞速的发展。
基于机器学习的搜索引擎,可以对用户的搜索历史、地域位置、兴趣爱好等信息进行分析,进而更好地理解用户的意图,并呈现出更加准确的搜索结果。
基于大数据的全网搜索引擎技术的特点和应用基于大数据技术的全网搜索引擎,它的最大特点在于可以处理海量的搜索数据,并能够从这些海量数据中挖掘和发现其中的规律性和价值。
与传统的搜索引擎相比,大数据技术的搜索引擎具有以下突出的特点。
1. 更加准确的搜索结果基于大数据的全网搜索引擎,能够对用户的搜索历史、位置、兴趣爱好等信息进行分析,从而能够对用户的意图进行更加准确的识别。
例如,当用户在搜索一台电脑时,搜索引擎除了会查询相关的关键字外,还会通过分析用户的历史搜索记录和兴趣爱好等信息,推荐合适的品牌、价格和配置等信息。
2. 更加智能的搜索策略基于大数据技术的全网搜索引擎,利用机器学习、自然语言处理等智能算法,能够通过不断的学习和优化,不断提升搜索策略的智能性和效率。
例如,在用户搜索“火锅”时,搜索引擎能够自动推荐附近的火锅店,在用户搜索“外卖”时,则能够智能推荐餐饮类型和优惠活动。
搜索引擎发展历程

搜索引擎发展历程搜索引擎在过去几十年的发展历程中经历了多次重大的技术突破和演进。
早期的搜索引擎主要是基于全文检索技术,用户通过输入关键词,搜索引擎会从海量数据中匹配出相关的网页结果。
1990年代初,最早的搜索引擎出现了,例如Excite和Infoseek。
当时的搜索引擎主要依赖人工编辑来整理和分类网页信息。
然而,由于互联网规模膨胀迅猛,这种人工编辑的方式很快变得不够高效和可扩展。
随着互联网的普及,1996年谷歌搜索引擎诞生了。
谷歌的创新之处是引入了PageRank算法,通过分析网页间的链接关系来评估网页的重要性和相关性。
这一算法大大提升了搜索结果的质量,并很快使得谷歌成为领先的搜索引擎。
为了提供更精准的搜索结果,搜索引擎开始采用语义分析和自然语言处理技术。
这些技术能够理解用户的意图,而不仅仅是匹配关键词。
例如,当用户搜索"天气"时,搜索引擎会返回天气预报结果,而不仅仅是包含"天气"关键词的网页。
移动互联网的兴起,使得移动搜索成为搜索引擎发展的重要方向。
移动搜索引擎需要考虑到用户的位置信息、设备特性和网络环境等因素,以提供更符合用户需求的搜索结果。
同时,移动搜索引擎还需要在有限的屏幕空间和低带宽环境下展示结果。
随着人工智能技术的快速发展,搜索引擎也开始引入机器学习和深度学习算法。
通过分析用户的搜索历史和行为,搜索引擎能够为用户提供个性化、定制化的搜索结果。
此外,搜索引擎还可以通过自动推荐、自动补全等功能提供更便捷、智能的搜索体验。
总的来说,搜索引擎发展的历程是一个不断创新和提升搜索质量的过程。
从最早的全文检索到引入链接分析、语义分析、移动搜索和人工智能等技术,搜索引擎不断演进,以满足用户不断变化的需求。
搜索领域的发展趋势

搜索领域的发展趋势
搜索领域的发展趋势包括以下几个方面:
1. 语义搜索- 这是一种新型的搜索技术,其利用自然语言处理技术来理解用户的搜索意图,从而提供更加精准的搜索结果。
2. 移动搜索- 随着移动设备的普及,越来越多的人会使用移动设备进行搜索,因此搜索引擎需要适应移动端的特点,如更好的界面设计和更好的体验。
3. 端到端搜索- 这是一种全新的搜索模式,其利用机器学习技术和大数据技术,通过联合搜索、推荐、智能问答等方式,在不同的终端(PC、移动端、智能音箱、智能电视)上提供一站式的信息服务。
4. 个性化搜索- 针对不同用户的需求和兴趣,搜索引擎会通过机器学习等技术来进行自适应相关信息的推送,从而提供更加个性化的搜索服务。
5. 语音搜索- 随着语音识别技术的发展,语音搜索正在成为一种趋势。
搜索引擎需要支持语音输入和语音识别功能,并通过自然语言处理技术来准确理解用户的搜索意图。
6. 图像搜索- 图像识别和计算机视觉技术的发展,使得搜索引擎可以对图像内容进行理解和识别。
这种技术可以应用于商品搜索、人脸搜索、场景搜索等领域。
2024年搜索引擎市场分析现状

2024年搜索引擎市场分析现状1. 引言搜索引擎是现代互联网时代的核心工具之一,它为用户提供了方便、快捷的信息检索服务。
随着互联网的普及和用户对信息需求的不断增长,搜索引擎市场也变得日益竞争激烈。
本文将分析当前搜索引擎市场的现状,并探讨其未来发展。
2. 搜索引擎市场概况2.1 主要搜索引擎公司目前,全球搜索引擎市场主要由以下几家公司主导:•谷歌(Google)•百度(Baidu)•必应(Bing)•搜狗(Sogou)•360搜索这些公司不仅在全球范围内竞争激烈,而且在各自本土市场上也有其独特的竞争优势。
2.2 市场份额分析根据最新的数据显示,全球搜索引擎市场份额分布如下:•谷歌:占据约80%的市场份额,是全球最大的搜索引擎公司。
•百度:主要在中国市场竞争,占据约15%的市场份额。
•必应:在全球范围内市场份额较小,约为4%。
•搜狗:在中国市场有一定的竞争力,占据约1%的市场份额。
•360搜索:同样在中国市场有一定的市场份额,约为1%。
从市场份额来看,谷歌一直占据着绝对优势地位,百度在中国市场表现突出,而其他搜索引擎则相对较小。
3. 搜索引擎市场竞争模式在搜索引擎市场中,公司之间的竞争主要集中在以下几个方面:3.1 搜索算法的技术优势搜索算法是搜索引擎的核心竞争力之一。
通过不断改进和优化搜索算法,搜索引擎公司可以提供更精确、更贴近用户需求的搜索结果,从而吸引更多的用户和广告客户。
3.2 用户体验的提升搜索引擎公司通过改善用户界面、加速搜索速度以及提供更全面的搜索结果来提升用户体验。
用户对于搜索结果的满意度将直接影响他们的使用习惯和忠诚度。
3.3 广告收入的竞争搜索引擎公司通过广告业务来获取收入,并在此方面展开竞争。
通过提供更精准的广告投放和更高的点击率,公司可以吸引更多的广告主和广告投资。
3.4 移动搜索的布局移动设备的普及使得移动搜索成为搜索引擎公司争夺的新的战场。
各大搜索引擎公司都在加大对移动搜索的布局力度,通过开发移动应用和优化移动搜索结果,以满足用户在移动设备上的搜索需求。
搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)

搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)(可以直接使用,可编辑完整版资料,欢迎下载)搜索引擎技术、现状、以及未来发展趋势的文献综述[摘要]随着最近10年中国互联网的快速发展,互联网已经彻底改变了人们的生活方式,而在互联网的发展过程中,搜索引擎发挥了巨大的推动作用。
本文对搜索引擎的发展历史,采用的技术,发展现状,出现的问题以及未来发展方向进行了综述,让读者对搜索引擎有个宏观的了解。
[关键词]搜索引擎,汉语分词,调查报告[正文]一、搜索引擎概述搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。
二、搜索引擎的重要发展历程1. 1990年,Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明Archie(Archie FAQ),成为所有搜索引擎的祖先。
2. 1993年,MIT Matthew Gray的World wide Web Wanderer,是世界上第一个Spider 程序。
3.1994年4月,杨致远和David Filo共同创办了Yahoo!。
4.1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine),即Washington大学硕士生 Eric Selberg 和 Oren Etzioni 发明的 Metacrawler。
5.1996年8月,sohu公司成立。
6.1998年,Google成立。
7. 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搜索引擎技术的发展
搜索引擎是收集、整理网上信息资源并按一定规则加以整理和组织,提供人们按相应的规则提取信息线索,并能直接连接到相关网上信息搜索工具。
搜索引擎的目的是帮助人们寻找信息资源。
目前大家所认识的主流搜索引擎也不外乎是百度和谷歌,其次就是搜搜、搜狗、以及雅虎,这些都是比较综合的搜索引擎。
而这其中除了百度和谷歌的里面的产品属于开放性搜索外,还有目录搜索引擎,当你输入某个关键词搜索的时候所有包括有合格关键词的网页就被找出来了并按一定的顺序排列。
个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。
一种方式通过搜索引擎的社区化产品的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。
通用搜索引擎的不足
目前搜索引擎的确风光无限,在给网民带来许多便利的同时也带来了巨大的经济效益。
但这不代表网民对目前搜索引擎表示完全满意,在CHIP的调查中,有73.3%的网民认为,搜索结果重复率高,搜索到的网页打不开等是一个令人讨厌的现象。
同时,有54.1%的网民认为个性化内容少,结果雷同也是不可以忍受的。
另外,还有48.3%的网民认为专业/行业搜索功能差,有49.1%的网民认为信息更新速度慢,有30.1%的网民认为多媒体搜索功能弱。
由此看来,搜索引擎还是需要不断改进和完善,才能满足人们的需要。
归根到底,用户是否对搜索引擎的信息满意,企业是否能从搜索邀请推广中获得价值,这才是搜索引擎是否可以长期发展的基础。
搜索引擎覆盖范围相对减少:搜索引擎的索引能力正在越来越落后于网络的快速增长速度,自97年12月以来,搜索引擎的覆盖面相对于网络上公开的可检索的内容实际上是减少了。
搜索差异问题:对同一关键字使用不同的搜索引擎得出的结果差别很大,有时采用这种搜索引擎得到的结果较为满意,而有时使用另一种搜索引擎则更好一些。
因此,可以考虑综合多个搜索引擎的查询结果,以达到更为令人满意的查询效果。
个性化问题:搜索引擎信息检索系统通常作为一种大型的服务器程序运行,同时响应多个用户的请求,这些系统不能够根据用户的兴趣需求来定制检索结果。
事实上,不同领域背景知识结构的用户对检索结果的要求是不一样的,故应该建立一种适合用户需求的,随用户的兴趣变化而动态调整的智能检索系统。
主动查询问题:搜索引擎的检索工作是用户驱动的,即由用户显式地提出检索请求,系统给出响应。
这是一种较为被动的信息获取方法,是否存在一种主动协助用户获取信息的机制,将网络中用户需要的信息主动通知给用户。
动态监测问题:由于网络中的信息是动态变化的,用户经常需要了解一些信息的最新动态,而在现有搜索引擎技术条件下,只有通过再次查询才能获取最新信息,对用户来说是极为不便的。
若能将变化的信息主动通知给用户,将节约用户很多时间与精力。
搜索引擎的未来发展
搜索引擎的快速发展也就是近15年发生的,这与互联网的发展趋势密切相关。
最近几年,互联网在经过了web2.0的市场培育阶段后,迎来了以互联网用户的个性化和社交化为中心的趋势。
同时,移动设备的逐渐流量及两大趋势的融合,催生了很多新型应用,为了迎接和顺应这种趋势,对搜索引擎来说,也产生了新的挑战。
本文将阐述未来搜索引擎的发展趋势。
纯属个人观点。
1,社会化搜索
随着Facebook的流行,社交网络平台和应用占据了互联网的主流,社交网络平台强调用户之间的联系和交互,这对传统的搜索技术提出了新的挑战。
传统搜索技术强调搜索结果和用户需求的相关性,社会化搜索除了相关性外,还额外增加了一个维度,即搜索结果的可信赖性。
对某个搜索结果,传统的结果可能成千上万,但如果处于用户社交网络内其他用户发布的信息、点评或验证过的信息则更容易信赖,这是与用户的心里密切相关的。
社会化搜索为用户提供更准确、更值得信任的搜索结果。
2,实时搜索
随着微博的个人媒体平台兴起,对搜索引擎的实时性要求日益增高,我想这
也是搜索时引擎未来的一个发展方向。
实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索核心强调的就是“快”,用户发布的信息第一时间能被搜索引擎搜索到。
3,移动搜索
随着智能手机的快速发展,基于手机的移动设备搜索日益流行,但移动设备有很大的局限性,比如屏幕太小,可显示的区域不多,计算资源能力有限,打开网页速度很慢,手机输入繁琐等问题都需要解决。
4,个性化搜索
个性化搜索的核心是根据用户的网络行为,建立一套准确的个人兴趣模型。
而建立这样一套模型,就要全民收集与用户相关的信息,包括用户搜索历史、点击记录、浏览过的网页、用户email信息、收藏夹信息、用户发布过的信息、博客、微博等内容。
比较常见的是从这些信息中提取出关键词及其权重。
为不同用户提供个性化的搜索结果,是搜索引擎总的发展趋势,但现有技术有很多问题,比如个人隐私的泄露,而且用户的兴趣会不断变化,太依赖历史信息,可能无法反映用户的兴趣变化。
5,地理位置感知搜索
目前很多手机已经有GPS的应用了,这是基于地理位置感知的搜索,而且可以通过陀螺仪等设备感知用户的朝向,基于这种信息,可以为用户提供准确的地理位置服务以及相关搜索服务。
6,跨语言搜索
这方面做的最好的是Google,Google目前已经提供多种语言之间的跨语言搜索,比如我搜“麻省理工”排在第一位的则是麻省理工学院的主页。
如何将中文的用户查询翻译为英文查询,目前主流的方法有3种:机器翻译、
双语词典查询和双语语料挖掘方法。
对于一个全球性的搜索引擎来说,具备跨语言搜索功能是必然的发展趋势,而其基本的技术路线一般会采用查询翻译加上网页的机器翻译这两种技术手段。
7,多媒体搜索
目前搜索引擎的查询还是基于文字的,即使是图片和视频搜索也是基于文本方式。
那么未来的多媒体搜索技术则会弥补查询这一缺失。
多媒体形式除了文字,主要包括图片、音频、视频。
多媒体搜索比纯文本搜索要复杂许多,一般多媒体搜索包含4个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据搜索引擎。
8,情境搜索
情境搜索是融合了多项技术的产品,上面介绍的社会化搜索、个性化搜索、地点感知搜索等都是支持情境搜索的,目前Google在大力提倡这一概念。
所谓情境搜索,就是能够感知人与人所处的环境,针对“此时此地此人”来建立模型,试图理解用户查询的目的,根本目标还是要理解人的信息需求。
比如某个用户在苹果专卖店附近发出“苹果”这个搜索请求,基于地点感知及用户的个性化模型,搜索引擎就有可能认为这个查询是针对苹果公司的产品,而非对水果的需求。
9, 移动搜索
根据comScore公司对美国6300余万手机上网人群的统计说明,2009年1月份每日使用手机上网的人数达到了2240余万,占整体手机上网人群的35%,比2008年同期有了高达107%的增长。
2010年12月的统计结果更是显示,美国和日本市场使用手机搜索功能的用户分别占到整个手机上网用户群体的21.4%和31.5%,位于手机上网各种应用功能中的第二位和第一位。
2010年,我国手机网民规模继续扩大,截至2010年12月,手机网民达3.03亿,较2009年底增加了6930万人。
手机网民在总体网民中的比例进一步提高,从2009年末的60.8%提升至66.2%。
2010年,手机网民较传统互联网网民增幅更大,成为
拉动中国总体网民规模攀升的主要动力,移动互联网展现出巨大的发展潜力。
这说明随着包括手机在内的手持设备上网功能的强化,手持设备搜索将成为未来搜索引擎发展的重要方向。
10, 社区化搜索
以Facebook,人人网等为代表的社会网络服务(SNS)站点的迅速崛起无疑是2010年互联网应用范畴最重要的事件之一,Facebook取代谷歌成为美国市场上用户停留时间最长的网站更是成为媒体关注的焦点。
从全球范围SNS站点应用的覆盖率上看,欧美市场乃至拉丁美洲、中东等传统第三世界互联网用户中的SNS应用率都已达到80%以上,而亚太地区的SNS应用率却停留在50%左右。
根据中国互联网信息中心的统计,我国2010年SNS网站的用户规模和渗透率均比2009年有较大提升。
截止2010年12月,中国网络交友人群规模2.35亿,较去年年底增长5918万人,网民使用率为51.4%,比2009年增加5.6个百分点。
考虑到这一应用比例仍旧比其他地区市场有明显差距,因此SNS服务在中国市场的高速发展是可以预期的。
11, 云搜索
暗网数据(Deep Web Data)指目前搜索引擎所无法抓取的信息。
这部分数据分为两类:一类是由于技术实现的原因无法抓取,如很多网站本身不符合协议规范、导致了搜索引擎的爬虫无法识别这些网站内容并抓取;另一类是不少网站提供的存储在网络数据库中的内容,搜索引擎难以通过网页抓取的方式获取其全部信息内容。
由于暗网数据在互联网资源中占有相当大的比重,因此,如何获取其中的有价值内容就成为了搜索引擎竞相研究的重点技术。
然而,网络数据库的异构特性和网络数据的繁杂使得绝大多数相关技术并没有取得很好的效果。
在这种情况下,搜索引擎基于搜索社区和用户产生内容(UGC)提升搜索质量的尝试可能成为一个有益的借鉴。