基于选择模式的幂律生成机制 !
长尾分布、幂律的产生机制和西蒙模型

长尾分布、幂律的产生机制和西蒙模型作者:山石, 邱红作者单位:上海大学 国际工商与管理学院,上海 2004441.期刊论文曹盼盼.阎春宁.CAO Pan-pan.YAN Chun-ning人类通信模式的幂律分布和Zipf定律-复杂系统与复杂性科学2009,6(4)通信是一类重要的人类行为,通过对中国名人的书信时间进行统计分析,建立写信间隔时间所服从的漂移幂律分布模型,确定了漂移幂律分布和齐普夫定律的参数.揭示出幂律特性在人类社会行为中的普适性,指出幂指数的不同和名人所处的社会环境有关.2.会议论文山石长尾分布、幂律的产生机制和西蒙模型2009幂律广泛存在于物理学、生物学、经济学、计算机科学、统计学、社会学等诸多领域。
本文试图回答长尾分布的形成机制这一问题,讨论与长尾分布紧密相关的幂律分布,讨论长尾分布(即齐普夫定律)和幂律分布的关系以及在互联网背景下怎样重新构造西蒙模型;最后研究互联网背景下西蒙模型的一种推广形式。
3.期刊论文许雯燕.康平立.龚勋科学生产率的分布及其产生机制-现代情报2007,27(9)幂律广泛存在于物理学、生物学、经济学、计算机科学、统计学、社会学等诸多领域.本文进行参数估计和假设检验验证科学生产率的数量分布服从齐普夫型分布,建立模型探讨科学生产率呈现优势累积分布背后的形成机制,对科学生产率的差异做出解释,最后对模型进行改进使其适用于解释更广范围内幂律的产生机制.4.学位论文康平立基于长尾理论的商业经济模型与长尾机制研究20072005年,“连线”杂志主编克里斯·安德森(Chris Anderson)出版了《长尾理论》(The Long Tail)一书,全书以长尾分布为主线,研究了当今世界媒体正在经历的巨大变革。
由于这本书把握了世界经济的变化核心,敏锐地洞察到了下一个时代的互联网革命和机遇,在读者中引起了巨大反响。
本文首先介绍了在长尾时代下,一些新的成功的经济模式,并分析了成功的原因。
幂律分布——精选推荐

幂律分布什么是幂律分布?⽤数学表达就是“节点具有的连接数和节点数的乘积是⼀个定值”。
简单说,在⼀个系统⾥,如果拥有1万元的⼈有10个,那么拥有1000元的⼈就有100个,⽽有10块钱的⼈就有1万个。
这种分布现象就是幂律分布。
幂律分布的两个特征:1、⾼度的不平均。
2、⽆标度(分形)说幂律分布,你可能不太了解,但你肯定听过⼀个词,叫“⼆⼋法则”。
⽐如全社会80%的财富集中在20%的⼈⼿⾥,⼀个⾏业80%的市场被20%的头部公司占据,⼀家公司80%的⽣意来⾃20%的重点客户……⼆⼋法则,其实就是幂律分布最直观的表现。
这也是幂律分布特征之⼀,⾼度的不平均。
图⾥横坐标,代表随机变量的取值;纵坐标,代表发⽣的概率。
⽽幂律分布就是⼀条向下的曲线,拖着⼀个长长的尾巴。
它的含义也⾮常明确——在随机变量中,越⼩的数值,出现的概率越⼤;越⼤的数值,出现的概率则越⼩。
虽然幂律分布⽆处不在,但它的数学特征只有⼀个,就是⽆标度,也叫“⽆尺度”“尺度⽆关”。
不管怎么叫,意思是⼀致的——在任何观测尺度下,幂律分布都呈现同样的分布特征。
⼀般的分布都会有个尺度范围,在这个范围内服从这个分布,超过这个尺度可能就不服从这种分布了。
⽽幂律分布没有尺度的限制,不管截取任何⼀个部分,都仍然呈现幂律分布的特征。
⽐如,图书销量是服从幂律分布的,最畅销那本书的销量在前10名销量中占的⽐例,和前10名的销量在前100名的销量中占的⽐例,和前100名在前1000名的总销量中占的⽐例,⼤体都是相同的。
这就是幂律分布的数学特征——⽆标度。
符合幂律分布的⽹络,⼜被称为“⽆标度⽹络”。
如果你懂”分形“的话,分形的结构⾃相似性符合幂律分布。
世界是不公平的幂律分布和正态分布,给我们展⽰了两个不同的世界。
在正态分布的社会⾥,中等收⼊阶层占绝⼤多数,低收⼊和⾼收⼊阶层只占极少数。
这种分布,被认为是⾮常理想的社会结构,对聪明勤奋的⼈有激励,让弱者的落差感没那么⼤。
但是真实世界的趋势,是越来越像幂律分布。
alphagpt幂律

alphagpt幂律【原创版】目录1.概述2.幂律的定义3.AlphaGo 的背景和原理4.AlphaGo 的改进5.AlphaGo 的成就6.未来发展正文1.概述AlphaGo 是一款由 DeepMind 开发的人工智能围棋程序。
它于 2016 年击败了围棋世界冠军李世石,引起了全球范围内的广泛关注。
AlphaGo 的核心技术是基于深度学习和强化学习的,其中一个重要的概念是幂律。
2.幂律的定义幂律是指某个物理量与另一个物理量的关系可以表示为幂指数的形式,即 $A propto B^alpha$。
在 AlphaGo 中,幂律被用来描述棋子之间的重要性和关系。
3.AlphaGo 的背景和原理AlphaGo 的背景是围棋,这是一种非常复杂的棋类游戏,其规则简单但是可能的棋局数量极其庞大。
AlphaGo 的原理是基于深度学习和强化学习,它通过学习大量的棋局数据来提高自己的下棋水平。
4.AlphaGo 的改进AlphaGo 经过多次改进,其中最重要的一次是 AlphaGo Zero 的推出。
AlphaGo Zero 不再需要学习人类的棋局数据,而是直接从零开始自我对弈,通过不断的自我学习和优化来提高自己的下棋水平。
5.AlphaGo 的成就AlphaGo 的成就主要包括击败围棋世界冠军李世石、推出 AlphaGo Zero 和 AlphaGo Master 等。
它的成功标志着人工智能在围棋领域的重大突破,也引起了全球范围内的广泛关注。
6.未来发展AlphaGo 的未来发展方向主要是在围棋领域继续提高自己的下棋水平,以及将 AlphaGo 的技术应用到其他领域,如医疗、金融等。
金融幂律

金融幂律:实证,模型以及原理Thomas Lux1Department of EconomicsUniversity of Kiellux@bwl.uni-kiel.de为社会科学中的幂律而准备:发现社会科学的复杂性和非均衡动态,Claudio Cioffi,编者.概述:金融市场(股票市场,外汇市场以及其他市场)均以一系列普遍使用的幂律为特征,最突出的例子是以强健的,近似三次幂律(cubic power law)来描述大量回报(large returns)的分布这一独特发现。
一个几乎同样强健特征是对波动性的长期依赖(例如:其自相关函数的双曲线递减)。
最近的文献加入了交易量的时间标度(temporal scaling)和higher moments of returns的multi-scaling. 最近,对于这些特征的关注引起了人们对市场过程中这些关键特征之所以出现的原因进行理论解释的尝试。
理论上来讲,不用种类的动态过程可能造成了这些幂律。
在经济学文献中找到的例子包括乘法随机过程(multiplicative stochastic processes)和多均衡的动态过程。
尽管这两种过程dynamics均以间歇产生大规模活动爆发的间断行为为特征,而事实上它们则可能是基于对交易过程上根本性地不同的理解。
前面的章节既回顾了在经济学文献中提出的相关模型,又复习了出现在以上数据到产生机制中的幂律的分析背景。
一简介尽管关于收入和资产中的幂律研究可以追溯到19世纪(Pareto), 但对于在金融数据中幂律的关注还是最近的事情。
幂律在金融中第一次体现可能是在Mandelbrot 的Journal of Business 中1963卷的具有开启意义的Variation of Certain Speculative Prices"一文中,随后紧接着Eugene Fama在随后的一篇名为“Mandelbrot and the Stable Paretian Hy-pothesis"的一文中,进一步阐述了同一个问题。
一个关于幂律的一些认识

对幂律、名次函数的一些认识张学文,2012/8/13最近李杰等在博客上对幂律做了一些探索,我随着也想到一些问题,现在说几句认识:1.圆的面积是其半径的2次幂,s=πr2,小学生都知道。
幂函数本来就中学的数学知识。
在科学中符合幂函数的确定性关系(公式)很多。
它们的形成原因应当从对应学科里找答案。
把幂函数转而单独称为“幂律(power low)”,我认为是特指一定含义的问题。
我理解主要是指一些具有随机性的自然现象所体现、对应的概率分布不是50年前时髦的正态分布,而是具有幂函数形式的概率密度分布函数。
其基本公式是p=a/x b.这里p是变量x的概率密度,a,b是两个常数,变量x具有的基本特点是它大于0。
另外,b是大于0的一个数。
当b=1,则p,x是双曲线关系。
2.所谓对应着概率分布问题,可以设想存在一大批(N个)个体。
每个个体就特征变量x有一个确定值。
问具有不同特征值的个体各有多少就对应一个概率分布(这个问“问题”的格式很重要)。
这个情况对应存在于存在N个数据。
例如800学生(个体们)中不同身高的学生个有多少,不同级别的地震发生了多少次,不同财富的家庭分别占有多少百分比等,这些问题太多了。
它们构成了统计学与概率论中的核心问题(采样结果,其特征量被称为随机变量)。
3.对上面的“具有不同特征值的个体各有多少”的答案对应一个概率分布(函数)。
而不同的问题其答案对应的概率分布是不同的。
正态分布曾经是很多统计学者认为的重要的一类概率分布,但是二项分布,均匀分布等10多种分布都被概率论所研究,并且认为比较常见。
而幂律是其一,也仅是其一。
4.符合“具有不同特征值的个体各有多少”模型的事物千千万万,而常见的对应分布仅10多种。
是否存在一个统一的理论来回答这些结局不同的分布?在我写的《组成论》(2003,中国科学技术大学出版社,2003,其实在1992年的《熵气象学》一书已经有了)从随机性事件对应熵(我称为复杂程度)最大配合不同的约束条件可以推出很多基本分布来。
幂法的构造原理及应用

幂法的构造原理及应用1. 构造原理幂法是一种用于求解矩阵特征值和特征向量的迭代算法。
其基本原理是通过不断对一个向量进行矩阵乘法,并对结果进行归一化操作,最终得到矩阵的最大特征值和对应的特征向量。
具体步骤如下: 1. 随机生成一个非零向量作为初始向量x0。
2. 计算新向量x’= A · x0,其中A为待求特征值的矩阵。
3. 对x’进行归一化,得到新的初始向量x1。
4. 通过不断重复步骤2和步骤3,即可得到收敛的特征向量。
2. 应用场景幂法在实际应用中有着广泛的应用领域,下面列举了几个常见的应用场景。
2.1 网页排名算法幂法被广泛应用于网页排名算法中,其中著名的PageRank算法就是基于幂法的。
该算法通过分析网页之间的链接关系,为每个网页分配一个权重,以反映该网页的重要性。
幂法可以帮助计算这些权重,并且在大规模网页排序中很高效。
2.2 基因组学研究在基因组学研究中,幂法也有广泛的应用。
例如,在基因表达数据分析中,可以使用幂法来识别出不同基因之间的相关性,找到相关程度最高的基因对。
这对于研究基因之间的相互作用和调控关系具有重要意义。
2.3 信号处理信号处理是另一个应用幂法的领域。
幂法可以用于信号压缩、频谱分析和信号降噪等方面。
通过幂法,可以提取出信号中的主要成分,从而实现信号的特征提取和降维。
2.4 矩阵分解幂法还被广泛应用于矩阵分解问题中。
例如,矩阵的奇异值分解(SVD)就可以通过幂法来求解。
通过幂法,可以找到矩阵的最大奇异值和对应的奇异向量,从而实现矩阵分解和降维。
3. 总结幂法是一种用于求解矩阵特征值和特征向量的迭代算法。
它的构造原理简单而有效,已经在多个领域得到了广泛应用。
无论是在网页排名、基因组学研究、信号处理还是矩阵分解等问题中,幂法都发挥着重要的作用。
通过深入理解幂法的构造原理和应用场景,我们可以更好地应用这一算法解决实际问题。
以上就是幂法的构造原理及应用的文档。
通过幂法,可以方便地求解矩阵特征值和特征向量,并且在实际应用中有着广泛的应用领域。
你忽略的一个生活规律:幂律分布
你忽略的⼀个⽣活规律:幂律分布你忽略的⼀个⽣活规律:幂律分布来源:商务周刊转载⾃:搜狐财经作者:王育琨编辑:学妹任何能提⾼我们分享、协调或⾏动能⼒的事情都会增加我们和他⼈⼀起共同追寻某些⽬标的⾃由。
在互联⽹时代,这么多⼈能如此⾃由地和其他⼈说或者做各种事,这在历史上是第⼀次。
⽹络消除了有关参与的技术障碍。
既然现在每个⼈都有了各种⼯具可以平等做贡献,你或许以为将看到平等参与的⼤幅增长。
你如果这样想就错了。
许多例⼦中的参与是很不平衡的。
维基百科的⽂章有⾮常多的贡献者,他们不停地进⾏各种修改,但其中的⼤多数⼯作是由⼀⼩部分⼈做的。
Flickr上也出现了类似的模式:在某次活动以后,众多摄影者向Flickr提交照⽚,但可能其中⼀半会来⾃排名前⼗位的提交者,其中最活跃的摄影者提交的照⽚所占的⽐例更⾼。
这种形态叫做幂律分布(power law distribution)。
在这样的分布中,你可以注意到从排名最靠前的⼏位提交者到⼤多数参与者之间照⽚数量的急剧下降。
也请注意由于少数⼏位摄影者不成⽐例的提交量,3/4的摄影者所提交照⽚数量低于平均值。
这个模式在博客、邮件组等社会性媒体中普遍呈现。
这其中有两个意外之处。
第⼀,虽然是许多种不同类型的⾏为,它们的这种不平衡都呈现同⼀形态。
Flickr⽹站上照⽚标记(或“标签”)的引⽤次数,与维基百科上每⼀条⽬读者数及每⼀⽤户提交⽂章数,其数据分布都具有相同的形状。
你可以按⼀组Flickr⽤户提交照⽚的数量将他们排序。
也可以对⼀组照⽚按每张的观众数排序。
还可以按每个标签被应⽤的照⽚数量对它们进⾏排序,所有这些图形都会⼤致呈现幂律分布的形态。
第⼆个意外是,这种不平衡对⼤型社会系统有驱动作⽤⽽不是损害它。
维基百科⽤户中提交过内容的不⾜2%,却⾜以为数百万⽤户创造深远的价值。
如果考虑过减少这些不平等的话,推动维基百科发展的⾃发的劳动分⼯就不可能了。
相反的,绝⼤多数⼤型社会实验都推动了利⽤某种不平等现象⽽不是限制它。
幂律分布——精选推荐
幂律分布⼏⼗年前,埃尔德什和莱利将复杂⽹络放到“随机”灌⽊丛中。
是幂律将复杂⽹络从中拉了出来,并将其放到⾊彩斑斓、内涵丰富的“⾃组织”舞台上。
1、啥?幂律是什么所谓幂律,是说节点具有的连线数和这样的节点数⽬乘积是⼀个定值,也就是⼏何平均是定值,⽐如有10000个连线的⼤节点有10个,有1000个连线的中节点有100个,100个连线的⼩节点有1000个……,在对数坐标上画出来会得到⼀条斜向下的直线。
所谓幂律分布,是指⾃然界与社会⽣活中存在各种各样性质迥异的幂律分布现象,因⽽对它们的研究具有⼴泛⽽深远的意义。
借助于有效的物理和数学⼯具以及强⼤的计算机运算能⼒,科学家们对幂律分布的本质有了进⼀步深层次的理解。
数学模型y=cx^-r。
如图:哦,这个不是数学课和物理课。
这么说吧,幂律分布是⼀条没有峰,且不断递减的曲线,它最突出的特征是⼤量微⼩事件和少数⾮常重⼤的事件并存。
也就是说,⽹络中⼤多数节点只有很少⼏个链接,它们通过少数⼏个⾼度连接的枢纽节点连接在⼀起。
2、幂律、钟型曲线、帕累托定律如果你不是物理学家或数学家,你可能从没有听说过“幂律”。
这是因为,⾃然界中⼤多数的量都遵循钟形曲线,⽽钟形曲线对应的分布和刻画随机⽹络的单峰分布⾮常相似。
但是在过去⼏⼗年⾥,科学家发现,⾃然界有时会产⽣⼀些遵循幂律分布的量,它们不再遵循钟形曲线。
幂律最突出的特征不是有很多⼩事件,⽽是⼤量微⼩事件和少数⾮常重⼤的事件并存。
⽽与之相对,这些⾮常重⼤的事件绝对不可能出现在钟形曲线中。
在物理学家和数学家⼤谈幂律时,80/20定律风⾏于⼤众媒体和商业刊物中。
只要80/20定律适⽤,你就可以确定,其背后⼀定有幂律存在。
80/20定律即帕累托定律,源⾃⼀位⾮常有影响⼒的意⼤利经济学家维弗雷多·帕累托。
在学术之外,帕累托凭借⼀个经验观察⽽享有盛名。
作为⼀个勤劳的园丁,他注意到,80%的豌⾖是20%的⾖荚结出的。
作为经济不平等现象的细⼼观察者,他发现意⼤利80%的⼟地被20%的⼈⼝占有。
幂律分布 拟合 python-概述说明以及解释
幂律分布拟合python-概述说明以及解释1.引言1.1 概述幂律分布在自然界和社会现象中普遍存在,其描述了一种特定现象中大部分事件都是很小规模的,而很少事件具有巨大规模的特性。
幂律分布在网络节点的连接数、城市人口规模分布、地震强度分布等领域都有广泛的应用。
Python作为一种强大的编程语言,提供了丰富的数据分析和统计工具,可以帮助我们对幂律分布进行拟合和分析。
本文将介绍幂律分布的概念和应用,以及在Python中如何进行幂律分布的拟合方法,帮助读者更好地了解和应用幂律分布在实际问题中的意义。
1.2 文章结构文章结构部分主要介绍了本文的整体结构安排。
首先,本文包括引言、正文和结论三个部分。
在引言部分,将介绍幂律分布的概念、文章结构和目的。
在正文部分,将深入探讨幂律分布的概念和应用,以及介绍在Python中如何进行幂律分布的拟合方法。
在结论部分,将总结幂律分布的重要性,探讨Python拟合方法的优势,并展望幂律分布在未来的应用前景。
通过对文章结构的预览,读者可以清晰地了解到本文的内容安排和重点分布。
1.3 目的本文的目的是介绍幂律分布的概念和应用,并重点讨论在Python中如何进行幂律分布的拟合方法。
通过本文的阐述,读者将能够了解幂律分布在实际应用中的重要性,以及掌握在Python中如何使用各种方法进行幂律分布的拟合和分析。
同时,本文还将探讨Python拟合方法相比于其他方法的优势,并展望在未来幂律分布在不同领域的应用前景。
通过本文的阅读,读者将能够全面地理解幂律分布的特点和应用,并掌握在Python 中进行幂律分布拟合的技巧和方法。
2.正文2.1 幂律分布的概念幂律分布是一种在统计学和概率论中经常出现的概率分布模型,也被称为长尾分布。
它描述了一种特定类型的概率分布,其中大部分事件的频率很低,而只有少数事件的频率非常高。
幂律分布通常用来描述那些具有极端值或异常值的数据集,例如互联网流量、城市人口分布、地震震级分布等。
Python数据可视化:幂律分布实例详解
Python数据可视化:幂律分布实例详解1、公式推导对幂律分布公式:对公式两边同时取以10为底的对数:所以对于幂律公式,对X,Y取对数后,在坐标轴上为线性⽅程。
2、可视化从图形上来说,幂律分布及其拟合效果:对X轴与Y轴取以10为底的对数。
效果上就是X轴上1与10,与10与100的距离是⼀样的。
对XY取双对数后,坐标轴上点可以很好⽤直线拟合。
所以,判定数据是否符合幂律分布,只需要对XY取双对数,判断能否⽤⼀个直线很好拟合就⾏。
常见的直线拟合效果评估标准有拟合误差平⽅和、R平⽅。
3、代码实现#!/usr/bin/env python# -*-coding:utf-8 -*-import matplotlib.pyplot as pltimport numpy as npfrom sklearn import linear_modelfrom scipy.stats import normdef DataGenerate():X = np.arange(10, 1010, 10) # 0-1,每隔着0.02⼀个数据 0处取对数,会时负⽆穷⽣成100个数据点noise=norm.rvs(0, size=100, scale=0.2) # ⽣成50个正态分布 scale=0.1控制噪声强度Y=[]for i in range(len(X)):Y.append(10.8*pow(X[i],-0.3)+noise[i]) # 得到Y=10.8*x^-0.3+noise# plot raw dataY=np.array(Y)plt.title("Raw data")plt.scatter(X, Y, color='black')plt.show()X=np.log10(X) # 对X,Y取双对数Y=np.log10(Y)return X,Ydef DataFitAndVisualization(X,Y):# 模型数据准备X_parameter=[]Y_parameter=[]for single_square_feet ,single_price_value in zip(X,Y):X_parameter.append([float(single_square_feet)])Y_parameter.append(float(single_price_value))# 模型拟合regr = linear_model.LinearRegression()regr.fit(X_parameter, Y_parameter)# 模型结果与得分print('Coefficients: \n', regr.coef_,)print("Intercept:\n",regr.intercept_)# The mean square errorprint("Residual sum of squares: %.8f"% np.mean((regr.predict(X_parameter) - Y_parameter) ** 2)) # 残差平⽅和# 可视化plt.title("Log Data")plt.scatter(X_parameter, Y_parameter, color='black')plt.plot(X_parameter, regr.predict(X_parameter), color='blue',linewidth=3)# plt.xticks(())# plt.yticks(())plt.show()if __name__=="__main__":X,Y=DataGenerate()DataFitAndVisualization(X,Y)⽀持。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
!% # $)
" %" (" % $ ) $ (") ! ! " %(" % $ ) 上述选择过程中, 只考虑了小球是否被选进视
野中, 没有考虑选择小球时的先后次序, 即进行视野 中小球的选择过程时, 只考虑了小球的组合情况, 而 将小 没有考虑小球的排列情况 ! 那么在选择小球时, 球的排序考虑进去后, 不同大小的小球被选择的概 率有何变化呢? 此时, " 号小球被取到的前提条件仍然是视野 中一定有 " 号小球, 其余则为 " $ " 号到 ! 号这 ! % 视野中小球的个数依然为 # " 个小球中的任意个, 个, ; " ! # ! ! % " $ " " 号到 " % " 号小球仍然不在 视野范围内 ! 不过由于选择时还需考虑小球的排序, 如果小球的排序不影响其被选入视野的概率, 那么 得到同一个视野的次数为不考虑小球排序时的 ! ! 倍, 即相对于不考虑小球排序的情况, 小球被选到时 所有可能的视野情况的数量增加了 ! ! 倍 ! 假定小球 被选进视野中的概率为 $ , 所有 " 号小球被选到时,
基于选择模式的幂律生成机制 !
尉伟峰!
(北京交通大学电子信息工程学院, 北京 "###$$) (%##& 年 ’ 月 %( 日收到; %##& 年 ) 月 & 日收到修改稿)
自然界与社会生活中存在多种性质迥异的幂律分布现象, 因而对它们的研究具有广泛而深远的意义 * 研究了 一类由于人类的选择行为而产生的幂律现象, 提出了人类选择行为的两个特性: 理性与自利 * 据此, 通过小球选择 试验构建了模型 * 研究发现, 这类幂律现象中随机变量服从一种近似于 +,-. 分布的分布 * 此分布为首次提出的一种 新分布, 将它命名为偏序分布 * 网络中已有的统计数据表明, 偏序分布比 +,-. 分布更真实的反应了网络中统计变量 服从的分布 * 文中对偏序分布进行了理论分析, 并通过约束条件的改变, 生成了 /012 分布; 表述了 /012 分布的物理 意义, 并构造了比 /012 分布更具现实意义的分布 * 说明了选择理论在解释幂律现象方面的普遍适用性及模型的可 扩展性 * 文中在幂律现象的成因上支持还原论, 即简单的人类选择行为导致了普遍的幂律现象 *
图" "# & ’
模型 " 的仿真图与理论图 实验次数为 #$ 万次, ! % $ ! #,
(#
% ( # ," ’ %( ’ (" ( % ( ’) ! , 对 % 个小球 示为 " (’% !( " ( !) ( #’! ’%"
通过上面的分析可知, 当小球的排序对其被选 入视野不存在影响时, 考虑小球的排序与否对模型 并无影响 ! 那么当小球的排序对其被选入视野存在 影响时, 即处于选择序列中不同位置的同一个小球 被选入视野的概率不同时, 小球的排序会不会对模 型产生影响呢?当小球的排序对其被选入视野存在 决定性影响时, 例如规定只有选择时位于前 $ 个的 小球能被选入视野, 而位于 $ 及 $ 以后的小球则不 能被选入视野, 在选择视野过程中, 如果 # 号小球 的选择顺序为前 $ 个, 则其必然被选入视野; 反之 则必然不在 视 野 中 ! 此 时 # 号 小 球 所 在 的 位 置 不 同, 其被选入视野的概率不同, 从而影响了其最终被 选中的概率 ! 显而易见, 此时小球的排序对最终的选 择结果是有影响的, 这种情况下构建的模型必然与 模型 " 不同 ! 这种情形在现实生活中是很常见的 ! 以 网络中的文件下载为例, 如果网络中存在 % 个用 户, 用户 ) 可以从这 % 个用户中的任意一个下载所 需的文件 ! 由于网速等因素的影响, 用户 ) 对这 % 个用户的选择存在偏好, 假设用户 ) 最愿意选择 " 号用户下载文件, 依此类推 ! 而这 % 个用 ’ 号次之, 户拥有用户 ) 所需文件的时间先后次序是等概的 ! 当用户 ) 在某时刻 & 需要下载文件 * 时, 用户 ) 的 视野为此时拥有文件 * 的用户 ! 如果 " 号用户此时 没有用户 ) 所要下载的文件 *, " 号用户必然不在用 户 ) 的视野中 ! 这里的某时刻 & 相当于一个门限, 在此门限范围内, 即 & 时刻及 & 时刻前拥有文件 * 的用户被选入视野, 否则不能被选入 !
影响其被选入视野的概率, 即处于选择序列中不同 位置的同一个小球是否被选入视野的概率是相同 的, 此时小球的排序对最终的选择结果并无影响 ! (") 式和 (#) 式相同, 说明通过这两种选择过程构建
/期
尉伟峰:基于选择模式的幂律生成机制
’"’4
的模型本质上是无差别的 ! 将此模型记为模型 " ! 图 " 是模型 " 的仿真与理论结果 ! 从 (") 式与图 模型 " 的概率分布为几何分布 ! " 可知,
第 3& 卷 第 $ 期 %##) 年 $ 月 (#$) "###84%)#J%##)J3& J%"%(8#)
物
理
学
报
K5IK CG/LM5K LMNM5K
O<1* 3&, N<* $, K-=,1, %##) !%##) 5P,;* CPQ@* L<A*
" " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " "
(批准号: 和国家重点基础研究发展计划 (批准号: 资助的课题 * ’#((%#$4, ’#’(%#’)) %##(564#("#") !国家自然科学基金 ! 789:,1: ;<=:>? @,;:* A<9
#"#’
物
理
学
! % " $"
报
(’ 卷
人的行动的唯一动力” ! 马歇尔和帕累托相互独立地 从各自立场出发, 都确立了这样的观念: 个体以理性 的方式行事, 以图使自己的个人利益最大化 ! 个体在 计算是否投入某项行动时, 依据的是该行动能在多 大程度上满足自己的需求 ! 这都非常明确地表述了利益对人们的至关重要 性, 利益最大化是选择的出发点 ! 因此可以把人们的 选择看作是为了实现利益或效用最大化的过程 ! 同 时, 对于一个理性的个人而言, 这里的利益最大化的 形式是多种多样的, 可以是物质利益最大化, 或是精 神上的效用最大化, 抑或是两者的结合 ! 由此可以看出人类的选择行为具有以下两个重 要的特征: (") 人类的选择行为是理性的, 个体独立 的、 客观的做出选择; ( #) 人类选择行为的目的是实 现自身利益最大化, 即人类的选择行为是自利的 ! ! " ! " 模型的构建 以下将通过试验, 根据人类选择行为的特征来 构建数学模型 ! 假设存在 ! 个大小不同的小球, 小球越大则表 即 示其代表的利益越大 ! 将小球由大到小顺序编号, 依此类推 ! 号小球最 " 号小球最大, # 号小球次之, 小 ! 每个人独立的选择一个小球, 记录选择结果并进 行统计 ! 如果每个人的视野不受限制, 即其可选择的小 球范围是所有的 ! 个小球, 那么勿容置疑, 所有人 都会选择 " 号小球 ! 但事实并非如此 ! 在现实生活 中, 每个人的视野受到各种因素的限制, 可供其选择 人们实现自身利益最大化的 的范围是变化的 ! 因此, 选择只是相对的利益最大的选择 ! 也正由于如此, 在 有些人看来是差的选择, 在有些人眼中却是好的选 择 ! 由于每个人视野的限制, 才呈现出多元化的选择 即对每个人而言, 所 结果 ! 首先考虑最基本的情况, 有的视野情况出现的概率相同, 每个小球被选到视 野中的概率相同 ! 当然这里不存在视野中可选对象 为零的情况, 即视野中至少存在一个可选对象 ! 每个人都会选择视野范围内利益最大的小球, 所以 " 号小球被取到的前提条件是视野中一定有 " 号小球, 其余则为 " $ " 号到 ! 号这! % " 个小球中 的任意个, 因此视野中小球的个数为 # 个, "! # ! ! 而 " 号到 " % " 号小球则不在视野范围内 ! % " $ "; 如果小球被选进视野中的概率为 $ , 那么 " 号小球 被选 到 时,所 有 可 能 的 视 野 情 况 可 以 表 示 为
关键词:选择行为,幂律分布,偏序分布,/012 分布
!"##:#%3#,#3##
数, 对几种不同的分布进行了比较 *
"B 引
言 % * 人类选择行为的特性及模型的构建
Байду номын сангаасF#
幂律分布也称为 C:=2D< 分布或 +,-. 分布, 幂律 现象是指系统中某个随机变量统计数据的分布近似 服从 +,-. ( !" E " ) 分布的现象 * 研究发现, 幂律现 象广泛存在于自然界与社会生活中, 尤其是各种结 ["—)] 构与功能复杂的网络中 * 揭开幂律的成因已成 为许多学者关注的一个焦点 * 几十年来, 为了解释幂律的形成原因, 科学家们 提出了几种机制, 包括增长与优先连接 、 自组织 ["%, ["$, "4] "3] 临界 、 最优抗干扰 ( GHI ) 理论 、 渗流模 ["’—")] ["’, %#, %"] 型 以及一些随机过程 等 * 这些理论分别 针对一些特定的幂律现象并合理地解释了其形成原 因, 而事实上还有相当多的幂律现象没有得到合理 地解释 * 现实世界中存在一类幂律现象, 如网页被点 击次数的分布、 书籍及唱片的销售量的分布等, 就本 质而言, 这些幂律分布是人们的选择行为导致的结 果 * 本文针对这一类幂律现象, 研究了人类选择行为 的特性, 并据此建立数学模型表征了这类幂律现象 的生成机制; 同时利用选择理论揭示了 /012 分布在 此层面上的物理意义, 并分析了选择理论的适用性 及其模型的可扩展性 * 此外, 文中还提出了比较函