搜索引擎的投票选举的模式与网页排序的问题
搜索引擎的排名算法

搜索引擎的排名算法随着互联网的不断发展,搜索引擎已经成为我们获取信息的主要途径之一。
然而,谷歌、百度等搜索引擎搜索结果的排序却是人们一直所关注的问题。
在互联网上,搜索引擎的排名算法是决定一个网站是否能实现商业化转型的重要因素。
那么,搜索引擎的排名算法到底是什么?它为什么会这么重要?一、搜索引擎的排名算法是指通过搜索引擎给出的关键词或短语,对网页或网站进行评估和排序的一种算法。
其目的是为了使用户能够快速地获取相关的信息。
目前,常见的搜索引擎排名算法有多种,其中最常见的是谷歌的PageRank算法和百度的超级链路分析算法。
1. 谷歌的PageRank算法2000年,谷歌公司创始人Larry Page提出了一种新的算法——PageRank。
这种算法依靠网页之间的链接来评估网页的重要性。
具体来说,如果一个网页被越多的其他网页所链接,那么这个网页的重要性就会越高。
PageRank算法将网页与网页之间的链接看作是一种投票方式,被投票次数越多的网页排名越靠前。
而且,被投票次数越高的网页还可以影响其他网页的排名,因为被投票次数多的网页可以对其他网页进行投票。
虽然PageRank算法现在已经不是谷歌的主要算法,但它仍然是搜索引擎算法的代表之一。
2. 百度的超级链路分析算法百度的超级链路分析算法是一种与PageRank算法类似的算法。
该算法也是通过网页之间的链接来评估网页的重要性。
不同之处在于,该算法还考虑了网页与关键词之间的相关性,从而实现更加准确的排名。
百度的超级链路分析算法将网页与网页之间的链接看作是一种投票方式,被投票次数越多的网页排名越靠前。
而且,该算法还考虑了网页与关键词之间的相关性,所以含有相关关键词的网页排名会更加靠前。
二、搜索引擎的排名算法为什么如此重要?1. 影响网站流量搜索引擎的排名算法直接影响到了网站的展现。
如果一个网站的排名不高,那么就会很难被用户发现。
而高排名的网站就可以吸引更多的用户流量,实现商业化转型。
三大主流搜索引擎的网页排名算法分析

三大主流搜索引擎的网页排名算法分析第一篇:三大主流搜索引擎的网页排名算法分析三大主流搜索引擎的网页排名算法分析搜索引擎算法是搜索引擎的核心技术机密,也是每个搜索引擎优化人员所希望了解的问题,但是这样的核心机密自然不可能完全被揭密,于是对搜索引擎排名算法的推测成为搜索引擎优化人员关注的话题之一。
三大英文主流搜索引擎google、yahoo和MSN的网页排名算法中,对于一个网站被其他网站链接的质量和数量等,都被认为是网站在搜索结果排名的重要因素,不过各个搜索引擎的网页排名算法对于网站外部链接的质量以及其他因素的权重可能有一定的差异。
美国搜索引擎营销公司Fortune Interactive最近发布一项研究报告,对三大主流搜索引擎Google, Yahoo 和MSN的网页排名算法进行了分析。
以下是新竞争力网络营销管理顾问选择编译的Fortune Interactive对网页排名算法中有关外部链接因素重要程度的研究发现。
三大主流搜索引擎对网页排名算法外部链接因素重要性评估重视程度排名Google外部链接网站的质量网站内容主题相关性外部链接网站title关键词链接文本外部链接数量Yahoo外部链接网站的质量网站内容主题相关性链接文本外部链接网站title关键词外部链接数量MSN外部链接网站的质量链接文本网站内容主题相关性外部链接网站title关键词外部链接数量研究结果表明,主流搜索引擎对于网站外部链接在网页排名算法中的基本要素是类似的,尽管不同搜索引擎对各项要素的权重有一定的差异,三者最大的共同点在于,在评估外部链接的重要程度时,均最重视外部链接网站本身的质量,同时最不重视外部链接的数量。
此外,Fortune Interactive的研究也发现,搜索引擎优化受到的重视程度越来越高,通过大型企业搜索引擎营销策略的渐变也可以反映出这种趋势。
Fortune Interactive发现,过去24个月以来,世界财富1000强公司大都投放了点击付费的搜索引擎广告,而过去6-12个月以来,同样这些财富1000强企业已经纷纷开始投入于网站的搜索引擎优化。
互联网搜索引擎的排名

互联网搜索引擎的排名互联网搜索引擎的排名是指搜索引擎在搜索结果页面上显示的权重顺序,也是衡量一个网站在搜索引擎中的可见性和影响力的重要指标。
在当前信息爆炸的时代,搜索引擎的排名对于网站的流量、收益以及品牌形象具有重要的影响。
本文将探讨互联网搜索引擎的排名原理、影响排名的因素以及优化排名的方法。
一、互联网搜索引擎的排名原理互联网搜索引擎的排名原理是通过算法来确定某个网页的权重,并根据权重的高低来排序显示在搜索结果页面上。
不同的搜索引擎拥有自己独特的排名算法,其中最著名的是Google的PageRank算法。
PageRank算法是根据网页之间的链接关系进行计算的,即通过链接的数量和质量来判断一个网页的权重。
该算法认为,被其他网页链接得越多的网页,其权重越高,排名也就越靠前。
但是,随着互联网的发展和不断的优化,搜索引擎的排名算法已经越来越复杂,除了链接因素外,还考虑了用户行为、内容质量等因素。
二、影响搜索引擎排名的因素1. 网站内容质量:搜索引擎越来越注重用户体验,对网站的内容质量要求也越来越高。
高质量的内容可以提供有价值的信息给用户,增加网站的知名度和权威度,从而提高排名。
2. 网站关键词优化:关键词是用户在搜索引擎中输入的词语,也是搜索引擎判断网页内容相关性的重要依据。
合理地在网页的标题、正文、标签等位置使用关键词,并确保关键词的密度适中,可以提高网页在搜索引擎中的排名。
3. 外部链接质量:外部链接指其他网站指向自己网站的链接,也被称为反向链接。
搜索引擎认为,被其他高质量网站链接的网页更可信赖和有价值,因此,外部链接的数量和质量也是影响排名的重要因素。
4. 网站速度和性能:搜索引擎更倾向于显示加载速度快、响应迅速的网页。
优化网站的加载速度、减少页面错误以及提升用户的访问体验,可以提高排名。
5. 用户行为和互动信号:搜索引擎会根据用户的点击、停留时间、转化率等行为数据来评估网页的质量和受欢迎程度。
因此,提高网站的用户体验,增加用户互动行为,能够对排名产生积极的影响。
搜索引擎排名算法解读

搜索引擎排名算法解读搜索引擎的出现改变了我们获取信息的方式,它们通过检索关键字来帮助我们找到相关的网页。
然而,当我们在搜索引擎中输入关键字时,如何确定显示哪些网页,以及以怎样的顺序呈现给我们,引起了人们的关注。
这就涉及到搜索引擎排名算法,它是搜索引擎决定网页排名的核心机制。
搜索引擎排名算法旨在通过分析网页的内容、质量和其他相关指标,将搜索结果按照相关性和权威性进行排序。
这样,当用户输入关键字后,搜索引擎可以迅速返回最相关和最有价值的网页。
一种常见的搜索引擎排名算法是PageRank算法。
PageRank算法将网页之间的链接关系看作是投票关系,即一个网页的链接数量越多,其在搜索结果中排名越高。
同时,权威网页的投票权重也更高。
这样,PageRank算法可以通过分析网页之间的链接关系为网页赋予一个权重值,从而影响搜索结果的排序。
除了PageRank算法,搜索引擎排名还涉及到其他一些因素,比如关键字匹配度、网页质量、网页加载速度、用户体验等。
搜索引擎会根据用户的搜索意图和搜索行为,结合算法模型,综合考虑这些因素,最终给出最相关和最有价值的网页。
关键字匹配度是决定搜索结果排序的重要因素之一。
当用户在搜索引擎中输入关键字时,搜索引擎会通过与网页的关键字匹配程度来判断网页的相关性。
如果一个网页的标题、正文和其他相关内容中包含与用户输入的关键字高度匹配的内容,那么这个网页就可能在搜索结果中排名较高。
另外,网页质量也是影响搜索结果排序的重要因素。
搜索引擎会通过分析网页的内容质量、原创度、时效性等指标来评估网页的质量。
高质量的网页往往被认为是更有权威性和价值的,因此可能在搜索结果中得到更高的排名。
此外,网页的加载速度和用户体验也会影响搜索结果的排序。
如果一个网页加载速度很快,用户可以快速获取到所需内容,那么搜索引擎可能会更倾向于将其排名靠前。
同样地,用户在访问网页时的体验也是搜索引擎考虑的因素之一。
如果用户对某个网页的访问时间较长,且回归搜索结果页的概率较低,那么搜索引擎可能会解读为该网页对用户不够有吸引力,进而影响其在搜索结果中的排名。
Web搜索引擎中的网页排名算法设计与优化研究

Web搜索引擎中的网页排名算法设计与优化研究概述:在当今信息爆炸的时代,Web搜索引擎已成为人们获取信息的主要途径。
然而,随着互联网上网页数量的急剧增长,如何提高搜索引擎的检索效果成为一个重要的问题。
网页排名算法是决定搜索结果排序的关键因素之一。
本文将探讨Web搜索引擎中的网页排名算法设计与优化的相关问题。
一、搜索引擎中的网页排名算法概述1.1 网页排名算法的定义网页排名算法是搜索引擎用于确定搜索结果在搜索页面上的位置顺序的一系列算法和方法。
其目标是根据用户的查询意图和相关度对搜索结果进行排序,使得用户能够尽快找到最相关的信息。
1.2 常见的网页排名算法在现实应用中,搜索引擎通常采用多种算法和方法来对搜索结果进行排序。
其中,PageRank算法、TF-IDF算法、BM25算法等是最为典型和常见的网页排名算法。
这些算法根据不同的原理和特点,对搜索结果进行评分和排序。
二、PageRank算法的设计与优化研究2.1 PageRank算法原理PageRank算法是由谷歌公司提出的一种网页排名算法。
其核心思想是通过计算网页之间的链接关系和链接权重,对网页进行评分和排序。
PageRank算法认为,链接数越多、链接的网页排名越高的网页越重要。
2.2 PageRank算法的优化策略尽管PageRank算法在很大程度上解决了网页排名的问题,但在实际应用中仍存在一些不足之处。
为了进一步优化PageRank算法,研究者提出了许多改进方案。
例如,引入主题相关性、社交网络影响力等因素来调整网页的排序,同时考虑网页的时效性和用户的个性化需求。
三、TF-IDF算法的设计与优化研究3.1 TF-IDF算法原理TF-IDF算法是一种常用的信息检索技术,也可以用于网页排名。
TF代表了词频(term frequency),IDF代表了逆文档频率(inverse document frequency)。
TF-IDF算法通过计算词频和逆文档频率的乘积,对网页进行评分和排序。
搜索引擎排名规则

搜索引擎排名规则搜索引擎排名是指搜索引擎将查询时得到的网页按照一定的规则排序的过程,搜索引擎的排名规则在搜索引擎行业中十分重要,因为它可以让网站的访问者有更好的搜索体验。
搜索引擎排名规则通常是由搜索引擎提供商决定的,而搜索引擎会参考诸如网页内容和排名因素等许多因素来确定搜索引擎排名。
下面将介绍搜索引擎排名规则的详细内容。
一、网页内容网页内容是搜索引擎排名规则的重要因素,它通常反映了网页的质量和实用性,因此网页的内容是搜索引擎排名的重要依据。
首先,搜索引擎会对网页的关键词进行分析,判断其是否存在重复或多余的关键词,或者是否有错误的语法等,如果有,则可能影响搜索引擎排名;其次,搜索引擎会分析网页的文字信息,如标题、关键词等,以得知网页的主要内容;第三,搜索引擎还会分析网页的图片和视频内容,看看是否是与网站主题相符的图片和视频,以及这些内容的实用性。
二、搜索引擎排名因素搜索引擎排名因素是搜索引擎排名规则的另一重要因素,它主要包括网站结构、网站流量、网站反链等多个方面。
首先,搜索引擎会根据网页的结构、层次性等来评判,搜索引擎会把各网页之间的关系绑定起来,以便提高搜索引擎排名;其次,搜索引擎会根据网站的流量来判断网站的受欢迎程度,如果网站流量较大,则表明网站受欢迎程度较高,从而可以提高搜索引擎排名;第三,搜索引擎还会对网站的反链进行分析,如果网站有大量的外部链接,则可以证明其网站的受欢迎程度较高,也可以提高搜索引擎排名。
三、搜索引擎优化搜索引擎优化是提高搜索引擎排名的必要步骤,它主要指的是一系列通过改善网站内容和搜索引擎排名因素来提高网站搜索排名的技术措施。
基本上,进行搜索引擎优化的步骤主要分为以下几点:首先,改善网页内容,增加网页的关键词和内容;其次,改善网站结构,改善网站的层次性;再次,增加网站流量,增加网站的访问量;第四,增加网站的反链,使得其网站的外部链接数量达到一定的数量;最后,改善网站的安全性,确保网站信息安全。
浅谈搜索引擎优化中的投票原理和操作误区
浅谈搜索引擎优化中的投票原理和操作误区随着互联网的飞速发展,SEO行业近年来竞争愈演愈烈,百度算法的频繁变动更使SEO行业处于水深火热之中,许多行业运营人员表明:网站利用SEO 优化所带来的效果远不如以前,甚至许多企业都放弃了SEO优化。
其实这并不是明智的决策,只要更深入的了解之后,我们会发现竞争越激烈表示SEO在网站运营中的地位更加重要,而且笔者敢断言,在今后的互联网中,企业网站要想持续盈利并稳定的运营下去是离不开SEO和网络营销的,所以企业不可轻视搜索引擎优化的作用;同时从事网站优化人员更应该加强自身的优化技术,使网站在激烈的行业形势下脱颖而出,给企业带来更高的商业价值。
网站优化人员除了不断的探索新的技术之外,还需要经常了解搜索引擎的动态。
对于百度来说,我们不需要知道详细的算法内容,但对于算法中提到的东西我们一定要多去了解,然后扬长避短合理的运用于我们的网站优化上。
接下来,笔者就跟大家谈论一下搜索引擎优化之中的投票原理和操作误区。
搜索引擎算法中的投票原理关于投票原理和机制,相信大家并不陌生,可能我们曾经也有参与过投票活动;例如:部门责任人推荐、国外领导人选举等,这些都属于投票行为。
那么,对于网站而言,投票可以分为:站内的互相投票与来自互联网的投票,搜索引擎可以通过投票比列初步判断一个网站质量价值、受众群体以及优化是否正规,投票比例越高,在搜索引擎获得的排名展现越好。
关于站内的互相投票站内互相投票可以简单的理解为内链,因此内链的合理性尤为重要。
一般来说,网站首页会接受来自网站各个内页的投票,它所获得的投票最多,自然搜索引擎给予网站首页的权重值最高,而在实际站内优化中,许多SEO优化人员仍在网站内页添加关键词指向首页,其实这是不合理的,也是无效的投票,很可能被搜索引擎判断为优化过度导致首页降权,笔者就曾经犯过这样的错误。
另外,首页在获得站内的投票的同时,也会对内页进行投票,因此我们需要把网站非常重要的信息布局在首页,并给予链接入口,让内页获得首页的投票,搜索引擎也会认为这样的页面是网站精华部分,会给予比较高的权重值。
网络搜索引擎中的网页排名算法研究
网络搜索引擎中的网页排名算法研究引言:随着互联网的快速发展,人们对于信息获取的需求变得越来越迫切。
而网络搜索引擎的出现为我们提供了方便快捷的信息检索途径。
然而,当我们在搜索引擎中输入关键词并点击搜索按钮时,千千万万的网页中,如何决定展示给我们哪些网页,以及这种展示的顺序,背后是一个复杂的网页排名算法。
一、搜索引擎的基本原理与功能在探讨网页排名算法之前,我们需要了解搜索引擎的基本原理与功能。
一个搜索引擎通常包括爬虫、索引器、检索器和用户界面等组成部分。
爬虫负责从互联网上抓取网页内容,并将这些内容交给索引器进行处理。
索引器将网页内容进行索引,以便后续的检索和排名。
当用户在搜索引擎中输入关键词时,检索器会根据这些关键词在索引中找到相关的网页,并按照一定的算法进行排名,最终将符合用户需求的网页展示给用户。
二、网页排名算法的重要性随着互联网的规模不断扩大,网页数量呈现爆炸性增长。
如果没有一套合理的排名算法,用户很难从众多网页中找到真正符合自己需求的内容。
因此,网页排名算法的设计成为了搜索引擎领域的重要研究方向。
三、基于关键词匹配的排名算法最早的搜索引擎排名算法主要是基于关键词匹配的。
这种算法通过计算网页中关键词的出现频率来判断网页与用户查询的相关性,从而进行排名。
然而,这种算法容易被一些不正当手段所利用,比如关键词堆砌、隐藏关键词等,导致搜索结果的质量下降。
四、基于链接分析的排名算法为了解决关键词匹配算法的局限性,研究学者们提出了基于链接分析的排名算法。
这种算法主要考虑了网页之间的链接关系。
通过分析网页之间的链接结构,可以将网页按照其被引用的程度进行排名。
具有被其他网页引用多的网页往往被认为是具有更高的权威性和可信度,因此排名更靠前。
这种算法的代表是PageRank算法。
然而,由于网页中存在链接的买卖和互换等现象,以及一些黑帽SEO技术的运用,使得基于链接分析的排名算法也受到了一定的质疑。
五、综合算法的出现与发展为了应对排名算法被人工操控的问题,搜索引擎公司们开始研究综合各种算法的排名策略。
搜索引擎的投票原理与点击原理
搜索引擎的投票原理与点击原理引擎的投票原理与点击原理是引擎排名算法的两个重要组成部分,可以有效评估和排列结果的重要性和质量。
下面将详细介绍这两种原理及其在引擎中的应用。
1. 投票原理(Link Voting Principle)引擎中的投票原理基于互联网链接的数量和质量,认为一个网页链接数越多,表明其在互联网上的重要性也越高。
因此,投票原理可以通过网页之间的链接关系来衡量网页的权威性和受欢迎程度。
投票原理的具体实现方式是通过计算网页的PageRank值。
PageRank 算法通过页面之间的链接关系进行计算,给予链接权重值,权重值越高,表示该网页被认为是更重要的页面。
具体计算包括以下步骤:1)初始化每个网页的PageRank值为12)根据网页之间的链接关系,迭代计算每个网页的PageRank值。
3)根据计算出的PageRank值,对网页进行排名。
2. 点击原理(Click Voting Principle)点击原理是引擎算法中另一个重要的组成部分,通过用户的点击行为来衡量结果的质量和相关性。
它认为用户点击一些结果的概率越高,说明该结果越相关和有价值。
点击原理的实现方式主要包括以下步骤:1)引擎记录用户的行为,包括用户的关键字和点击的结果。
2)根据用户的点击行为,统计每个结果被点击的次数,定义为点击率(CTR)。
3)根据点击率,对结果进行排名,点击率越高的结果排名越靠前。
点击率是衡量结果质量和相关性的重要指标。
用户通过点击与其关键字相关的结果,表示这些结果对他们有帮助,因此引擎会根据点击率来评估结果的质量,并将点击率高的结果展示在更靠前的位置。
需要注意的是,点击原理也存在一些问题。
例如,一些网站可能通过恶意手段提高自己的点击率,从而获得更高的排名。
为了解决这个问题,引擎还会考虑其他因素,如结果的可信度、网页的内容质量等,以综合评估结果的质量。
综上所述,引擎的投票原理和点击原理是引擎排名算法的重要组成部分。
搜索引擎的投票选举的模式与网页排序的问题
搜索引擎的投票选举的模式与网页排序的问题前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。
先说美国选举制度,美国的总统选举是一种"赢者通吃"的方式,每个州根据其人口多少,有几十或几百的"州票",州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的"州票",然后统计所有候选人的"州票"多少,获得最多"州票"的候选人获胜。
这样制度的问题是显然的,比如如果只有两个州,A州5个人,而B州4个人,州票也分别是5和4,如果某候选人X在A州以3:2获胜,另一个候选人Y在B州以4:0获胜,这样显然候选人Y在全国范围内获得了6张票,而候选人X只有在A州的3张票,但是由于"赢者通吃",X获得了A周的全部5张"州票",Y只获得了B周的4张"州票",在全国只有1/3民众支持的X居然获得了选举的胜利。
这样的情况在2000年美国总统选举中就出现过,小布什的州票领先于戈尔,然而在全国民众中统计支持戈尔的人数却是大于小布什的,当然戈尔输给小布什还有另一个原因,这里按下不表。
如果放在算法领域,可以看出这里的问题在于,为了统计结果R(最适合的总统人选),找到了一个特征A(每个民众的投票),而决定结果R的,却不是特征A,而是由特征A推导出来的特征B(州票),在特征A向特征B的推导过程中,信息丢失了(每个洲的支持百分比不一样)。
"赢者通吃"这种制度的具体历史原因先不说,有兴趣的朋友可以去看原著。
解决这种问题的最直接方案就是从"赢者通吃"变成直选,也就是一人一票,直接统计票数,然而这样也会遇到一系列问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搜索引擎的投票选举的模式与网页排序的问题前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。
先说美国选举制度,美国的总统选举是一种"赢者通吃"的方式,每个州根据其人口多少,有几十或几百的"州票",州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的"州票",然后统计所有候选人的"州票"多少,获得最多"州票"的候选人获胜。
这样制度的问题是显然的,比如如果只有两个州,A州5个人,而B州4个人,州票也分别是5和4,如果某候选人X在A州以3:2获胜,另一个候选人Y在B州以4:0获胜,这样显然候选人Y在全国范围内获得了6张票,而候选人X只有在A州的3张票,但是由于"赢者通吃",X获得了A周的全部5张"州票",Y只获得了B周的4张"州票",在全国只有1/3民众支持的X居然获得了选举的胜利。
这样的情况在2000年美国总统选举中就出现过,小布什的州票领先于戈尔,然而在全国民众中统计支持戈尔的人数却是大于小布什的,当然戈尔输给小布什还有另一个原因,这里按下不表。
如果放在算法领域,可以看出这里的问题在于,为了统计结果R(最适合的总统人选),找到了一个特征A(每个民众的投票),而决定结果R的,却不是特征A,而是由特征A推导出来的特征B(州票),在特征A向特征B的推导过程中,信息丢失了(每个洲的支持百分比不一样)。
"赢者通吃"这种制度的具体历史原因先不说,有兴趣的朋友可以去看原著。
解决这种问题的最直接方案就是从"赢者通吃"变成直选,也就是一人一票,直接统计票数,然而这样也会遇到一系列问题。
在谈那一系列问题之前,先把要解决的问题抽象一下:有n个候选人,每个选民对这n个候选人投票,最终在n个候选人中选出最合适、最符合民意、也符合逻辑的那个人。
方案1:一票制,每人一票,选出自己最喜欢的候选人,对结果进行统计,得票最多的那个人当选。
这样做的问题是会导致作者定义的一种"鹬蚌困局",举例说,如果有ABC三个候选人,其中BC政见比较类似,支持B的人也比较支持C,反之亦然,在全民中,喜欢BC的人占多数,A的政见和BC相反,支持A的人在全民中占少数。
这样导致的后果就是,BC获得的票会比较分散,而A获得的票比较集中从而获得胜利,如果BC中有1人不参加选举,票就会集中到B或者C一个人的手中,从而使多数选民的支持者当选。
前面按下不表的戈尔失败的另一个原因,就是有人认为有跟戈尔政见类似的耐德的参与,他分散了部分戈尔的选票。
可以对此问题有所改善的方案叫做"二选制"。
方案2:二选制,每人一票,如果无人获得大于50%的支持,则将得票最高的两个候选人拿出来,再进行一轮选举,得票多的人获胜。
法国总统选举就是这样的二选制,但是这样的方法只能改善"鹬蚌困局",而不能彻底解决,2002年的法国总统大选就出现了类似的情况,当时支持左派政见的民众较多,然而在二选制下,最终的前两名却是一个右派和一个极右派。
出现这种情况的原因是当年有16个总统候选人,且多数是持左派政见者,这样就导致左派的票极端分散。
方案3:n选制,每人一票,如果无人获得大于50%的支持,则去掉支持最少的候选人,再进行一轮投票,若依旧无人获得大于50%的支持,再去掉得票最少的候选人,直到有人大于50%支持为止。
2001年奥委会决定北京为2008年奥运会主办城市的时候,就是用的这样的制度,在第一轮投票里大阪被淘汰,北京在第二轮就获得了半数以上的支持,从而当选。
n选制的问题在于不实用,如果是奥委会这种只有几百个人投票的情况还可以使用,如果类似前面法国总统选举,有16个候选人,举国上下最多可能进行15次投票,成本太高。
方案4:即刻复选制,每个民众对候选人进行排序,如果某个候选人获得了50%以上的首选,则直接获得胜利,否则淘汰票数最低的候选人,并且把票数最低候选人的得票中的第二候选人拿出来,分给对应的候选人,如果有人获得50%以上,则当选,否则再淘汰一位最低的,并且把他票分给里面排序最高的且未被淘汰的候选人,如此往复。
爱尔兰总统选举和伦敦市长选举采用的是类似的方案,此方案也有问题,试想如此场景:选民共10人,中间派候选人是3人的首选,左派和右派的候选人分别是4人的首选,当然左派选民最讨厌右派候选人,而右派选民也最讨厌左派候选人,而左派右派的民众对中间派候选人倒是都可以接受,不管是即可复选制还是n选制,中间派候选人都会在第一轮被淘汰。
而中间派候选人则是全体民众都可以接受的人,也最能调和各派之间矛盾,最和谐。
这个方案的本质问题是,虽然每个选民可以对候选人排序,但是在第一轮的时候却只考虑了第一选,没有考虑选民的二、三选。
方案5:上行复选制,跟方案4类似,只不过第一轮淘汰的不是支持最少,而是反对最多的候选人(获得最多末选票的候选人)再看上面提到的情况,中间派候选人由于不是任何人的末选,所以第一轮淘汰的是左派或者右派,再第二轮选举中,中间派的候选人就可以获胜了。
方案5也有方案5的问题,考虑这样一种情况,只有两个候选人AB参选,选民9人,其中6人喜欢A而讨厌B,3人喜欢B而讨厌A,无论按照之前的哪种方式,都会是A获胜。
但是现在又多了两个候选人C和D,喜欢B的3人中,都是把A列在最后一个候选的,而喜欢A的6人的末选,却是BCD各2票,这样,在第一轮选举中,A就由于获得了最多的末选票被淘汰了,而通过精心的构造例子,完全可以使B最终当选。
仅仅由于CD参选或者不参选,A和B之间的胜负关系就发生了大逆转。
实际使用此方案的例子不多,只有在公元前507年的雅典有类似的方案,不是让民众投支持票,而是投反对票,把反对最多的人投出局。
方案6:多赛制,民众对候选人排序,然后候选人之间两两pk,统计每一张选票上看候选人A在候选人B前面还是B在A前面,如此找到获胜场次最多的候选人来赢得选举。
这样的问题是可能导致循环胜负,如ABC三个候选人,有3个民众,投票分别是ABC,BCA,CAB,可以看出AB之间A获胜两次,A>B;BC之间B获胜两次,B>C,AC之间C获胜两次,C>A,这样就构成了一个A>B>C的循环。
这个是不是有点像足球联赛的记分制啊,如果积分相同,足球比赛中可以再看净胜球、进球、胜负关系等,但是作者并没有在这个方面进行展开,而是介绍了另一种方式:博达制。
方案7:博达制,民众对候选人排序,假如有n个候选人,第一位的候选人得n分,第二位得n-1分,以此类推,然后统计每个候选人的总分,获得最多分的获胜。
有人对博达制的批评是:可能有选民会利用这种方式进行作弊(投"策略票"),最支持B的候选人本来心目中的排序是B>A>C,但是由于相对A,他们还是更喜欢B,因此,为了把B拉上来,就得把A拉下去,他们的投票就变成了B>C>A。
博达对此批评的回应是:我的制度只适用于诚实的投票者。
而这本书的作者却认为博达制的"策略票"问题没那么严重,如果无法准确预测民意和精确控制策略票的投法,有可能因为用力过猛,不但把A拉下来了,反而让C获得的支持票增加,这样就使得最支持B的那些人的"策略票"反而使得他们最讨厌的C当选了,当年在IMDB 上就发生过类似一幕:电影《蝙蝠侠6》上映后,蝙蝠侠的粉丝们觉得这部片太酷了,于是就想把蝙蝠侠6投成IMDB 第一位,于是他们疯狂的给蝙蝠侠6打高分,而同时,也纷纷的给当时的IMDB第一《教父》投低分,导致的结果就是用力过猛,教父变成了第三名,原来的第二肖申克的救赎(TSR)变成了第二(原来的第二是排在教父后面,新的第二是排在蝙蝠侠6后面),而后来,随着疯狂粉丝的热情消退,理性的意见占据了上风,蝙蝠侠6的得分逐渐下降,跌到了第10。
而教父还是在肖申克的救赎后面,很久没有回去了。
博达制是否有其他问题呢?以上只是对这本书第14章的一个笔记,也仅仅针对"多候选人单职位"问题进行了讨论,书的后面还会对"多候选人多职位"的情况继续探讨,也就是根据每个人对候选人的排序,来决定最终的候选人排序。
回到搜索引擎领域来,如上策略的变迁会给我们一些启示,先看看之前抽象出来的问题:有n个候选人,每个选民对这n个候选人投票,最终在n个候选人中选出最合适、最符合民意、也符合逻辑的那个人。
这很像搜索引擎在解决的问题:系统里有n个网页,有m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)对n个网页有不同的打分,如何根据这些特征的"投票",选出最适合放在第一位的网页呢?从选举的例子中,我们可以得到的几个启示:1. 设计算法时,要避免出现"赢者通吃"带来的信息丢失问题。
2. 不要因为某几个特征特别好,就把某个网页排到最前,或者因为某几个特征特别差,就把某个网页抛弃。
3. 最合适放在首位的网页不一定是在每个特征上都最好,而应该是能够兼顾所有特征,综合表现最好的那个。
4. 搜索引擎使用者对搜索结果的点击行为,可以看成是对搜索结果进行的"投票",这样的"投票"信息的使用方式,也要注意考虑是否会带来选举过程中出现的种种不合理。
以上提到的种种选举方案,仅仅是对"多候选人单职位的"的情况进行讨论,而搜索引擎面对的问题,则更类似于"多候选人排序"的情况,也即:系统里有n个网页,有m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)对n个网页有不同的打分,如何根据这些特征的"投票",决定n个网页的顺序?而这个"多候选人排序"问题,是有一个"不可能的民主"的理论的,该理论的大意是,"合理"的民主应该满足3个条件:1. 如果选民都认为A比B好,那么最终结果应该也是A比B好2. 没有"独裁者",也即,不存在这样一个人,无论别人怎么排序,最终结果的排序都和这个人的排序一致3. 无关因素独立性,也即,在第一次投票完成后,A排在B前面,现在进行第二次投票,如果所有人都没有改变自己投票中A和B的相对顺序,那最终结果应该也是A在B前面而通过数学的证明,可以得出结论:如果某种选举方式满足条件1和3,则必然不满足2,也即必然存在"独裁者.根据"不可能的民主"理论,和搜索引擎结合起来看,似乎搜索引擎很难给出一个合理的网页排序,但是搜索引擎和投票又似乎有所不同,有两个角度可以破解1. 认为条件3过于强,需要弱化。