本福特定律论文
神秘的本福特定律范文

神秘的本福特定律physixfan 2010-10-31 21:25统计一下世界上237个国家的人口数量,你觉得其中以1开头的数会占多大比例,而以9开头的数又占多大比例呢?如果你的回答是都为1/9,恭喜你你是正常人,但是事实却不是如此:以1开头的数惊人的占到了27%,而以9开头的数却只占5%。
下图可以很形象的展示出在各国人口数量问题上,以各个数字开头的数占了多大的比例(图片来自维基百科)。
为什么会相差这么大呢?这正是神秘的本福特定律在起作用。
本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍,推广来说,越大的数字,以它为首几位的数出现的机率就越低;精确地数学表述为:在b进位制中,以数n起头的数出现的机率为logb(n + 1) − logb(n)。
在十进制中,首位数字出现的概率为:这个定律的发现,据说是因为本福特在翻对数表的时候发现前面几页被翻得很黑很破烂,越往后越颜色越浅。
由此他想到会不会是1开头的数字就是比其他数多,他统计了一下发现果然如此。
其实这个对数表的事情真假难辨了,就像是牛顿说自己是被苹果砸到了头才发现的万有引力定律一样,只要最后的定律有用就可以了。
首先说明一下本福特定律的适用范围这个定律是一个非常神奇的定律,它的适用范围异常的广泛,几乎所有日常生活中没有人为规则的统计数据都满足这个定律。
比如说世界各国人口数量、各国国土面积、账本、物理化学常数、数学物理课本后面的答案、放射性半衰期等等数据居然都符合本福特定律。
值得一提的是,科学家还发现,统计物理的三个重要分布,Boltzmann-Gibbs分布,Bose-Einstein分布,Fermi-Dirac分布,也基本上满足Benford定律!(来源:李淼的博客)其次这个定律毕竟还是有适用范围的第一,这些数据必须跨度足够大,必须横跨好几个数量级才能产生这个结果。
第二,有人为规则的数据就不满足次定律,比如说手机号码、身份证号、发票编号等数据,明显不满足这种对数分布律。
对本福特定律的感受和理解

对本福特定律的感受和理解一、引言本福特定律(Pareto principle)是指“20/80原则”,即大约80%的结果来自于20%的原因。
这个定律被广泛运用于各个领域,如经济学、管理学、市场营销等。
在我的日常生活中,我也能够感受到这个定律的存在。
本文将从不同角度探讨本福特定律的感受和理解。
二、在工作中的体现1. 重要性与紧急性在工作中,我们常常会遇到各种任务和问题需要解决。
根据本福特定律,其中只有20%的任务是最重要且最紧急的,而其他80%的任务则可以放到后面去处理。
因此,在处理任务时,我们应该优先考虑那些最重要且最紧急的任务,并将时间和精力集中在这些任务上。
2. 人员分配在团队合作中,根据本福特定律,只有20%的人员会对整个团队产生80%以上的贡献。
因此,在人员分配时,我们应该尽可能地将这些高贡献人员安排到关键岗位上,并给予他们更多的资源和支持。
3. 市场营销策略在市场营销中,根据本福特定律,只有20%的客户会产生80%以上的销售额。
因此,在制定市场营销策略时,我们应该将重点放在这些高价值客户身上,并为他们提供更好的服务和体验。
三、在个人生活中的体现1. 时间管理在个人生活中,我们也可以运用本福特定律来管理时间。
只有20%的时间会产生80%以上的价值。
因此,在规划时间时,我们应该优先考虑那些最重要且最紧急的事情,并将时间和精力集中在这些事情上。
2. 物质消费在物质消费方面,根据本福特定律,只有20%的物品会被使用80%以上的时间。
因此,在购买物品时,我们应该选择那些最常用且最有用的物品,并尽可能地避免购买那些不必要或者很少使用的物品。
3. 社交关系在社交关系方面,根据本福特定律,只有20%的人会对我们产生80%以上的影响。
因此,在建立社交关系时,我们应该尽可能地与那些对我们有帮助或者对我们产生积极影响的人交往,并尽可能地避免与那些对我们没有帮助或者对我们产生负面影响的人交往。
四、结语总之,本福特定律是一个非常有用的工具,可以帮助我们更好地管理时间、资源和人员。
利用本福特定律快速发现数据异常实践

利用本福特定律快速发现数据异常实践
今天向大家介绍一种可以快速判断数据异常的定律——本福特定律。
本福特定律是由美国数学家、天文学家西蒙·纽卡姆于1881年首次发现。
在使用对数表做计算时,纽卡姆突然注意到对数表的第一页要比其它页更为破旧。
经过大量的统计分析,他发现,以1为首位的随机数的出现概率要比以2为首位的随机数高,而以2为首位的随机数的出现概率又要比以3为首位的随机数高,以此类推。
但纽卡姆并未对此做出解释,当时的人们也未给予充分关注,这一发现逐渐被淡忘。
1938年,美国通用电器的物理学家法兰克·本福特注意到了同样的现象,并进行了大量的分析验证。
最终,本福特推导出:在十进制下,首位数字的出现概率分布如下:
从数学的角度看,实际分布与本福特定律预期分布的偏差越大,数据造假的程度越大。
但本福特定律并不是万能的,如果造假者操纵首位数字,使得造假数据符合该定律,我们就无法初步判断数据是否造假。
因此,本福特定律只是为我们提供一个考察数据的新角度,并不能替代其它分析方法或审计程序。
但是有一点可以确定,大幅度偏离本福特定律的数据,大概率涉及造假或异常。
对某集团公司近5年113492个办公耗材消耗记录进行统计发现:
能看出明显异常吗?
异常即为妖!审计人员带着怀疑对异常的数据5开头的数据进行分析发现:硒鼓与打印纸之间存在相关性。
按照单位对硒鼓与打印纸的数据进行对比发现下图异常的数据在红色方框之外。
沿着数据异常这个思路进一步分析发现了虚假冒用以物易物的现象,提出加强管理建议后效果显著。
2017年该方面的费用支出同比节约了近50%。
对本福特定律的感受和理解

本福特定律的感受和理解1. 引言在现代社会,我们常常会听到“本福特定律”这个词,它是由美国工程师亨利·福特所提出的经济学定律。
本福特定律指出,随着生产数量的增加,单位成本会逐渐下降,从而带来更高的效率和更低的价格。
在这篇文章中,我将分享对本福特定律的感受和理解,并探讨其在现实生活中的应用。
2. 感受与体会2.1 效率改善本福特定律的核心观点是,随着生产数量的增加,单位成本会下降。
这意味着企业可以通过规模化生产来降低成本,提高产品的生产效率。
在我个人的观察和体验中,这一观点得到了充分的验证。
举个例子,汽车制造业是本福特定律应用得非常成功的行业之一。
当汽车生产规模不断扩大时,企业可以利用大规模生产带来的规模经济,降低材料采购成本和生产设备成本,从而降低单位成本。
这使得汽车在过去几十年中价格不断下降,使得更多人能够负担得起汽车。
2.2 价格竞争因为单位成本的下降,企业有更多的空间来降低产品价格,以吸引更多的消费者。
这就引发了激烈的价格竞争,从而推动了市场的发展。
以电子产品为例,比如手机。
随着技术的进步和生产能力的提高,手机的价格逐渐下降,同时功能和性能也得到了大幅度的提升。
这使得越来越多的消费者能够购买到价格合理且功能强大的手机。
这种价格竞争不仅满足了消费者的需求,也推动了全球电子产品市场的繁荣。
2.3 产品多样性本福特定律还促进了产品多样化的发展。
当规模生产降低了单位成本之后,企业可以更容易地推出多个产品系列,满足不同消费者的需求。
通过适应不同的市场细分,企业能够生产出更多样化、更专门化的产品。
例如,汽车制造商可以根据不同国家和地区的需求,设计和生产不同尺寸、不同燃料类型、不同配置的汽车。
因此,消费者能够根据自己的喜好和需求选择适合自己的产品。
3. 应用与实践3.1 制造业在制造业领域,本福特定律的应用非常普遍。
通过扩大生产规模,企业可以降低成本,提高生产效率并降低产品价格。
这使得制造业具备了更强的竞争力。
浅析基于本福特定律的大数据审计路径

浅析基于本福特定律的大数据审计路径作者:何超来源:《今日财富》2021年第07期随着信息技术发展,大数据审计的方法逐渐得到广泛应用。
论文以本福特定律为数据分析模型,尝试构建一个大数据审计的路径。
通过分析费用发生额的首位数分布,与本福特定律的分布概率进行比对,并对不符合本福特定律的发生额进行重点审计,从而提高抽样审计的效率和准确度。
根据《审计署办公厅关于印发数据审计相关标准用语(试行)的通知》:大数据审计是指审计机关遵循大数据理念,运用大数据技术方法和工具,利用数量巨大、来源分散、格式多样的经济社会运行数据,开展跨层级、跨地域、跨系统、跨部门和跨业务的深入挖掘与分析,提升审计发现问题、评价判断、宏观分析的能力。
[ 山西省审计厅,《山西省审计厅关于转发《审计署办公厅关于印发数据审计相关标准用语(试行)的通知》的通知》http:///shenji/contents/1616/38074.html]在审计过程中,利用大数据审计方法能迅速帮助审计人员快速读懂纷繁复杂的数据,找到审计需要关注的重点区域,进一步拓展内部审计的广度和深度,提高审计效率和质量。
一、本福特定律概述本福特定律,也稱为本福特法则。
1938年,美国电气工程师本福特发现:在b进位制中,以数n起头的数出现的概率为。
具体到我们常用的十进制而言,在一群不规则的数列中,首位数是1的概率为lg(2/1),即约为30.1%;首位数是2的概率为lg(3/2),即约为17.6%......以此类推,首位数为9的概率为lg(10/9),即约为4.6%。
具体概率分布如图1。
本福特定律被认为是可以通过自然规律验证不规则数据真伪的工具,被广泛应用于数学、金融等领域。
如有人为编造数据,就会出现不符合本福特定律分布规则的现象。
2020年5月,央视新闻网报道:牛津大学商学院学者冈村健与美国达拉斯联邦储备银行研究部高级经济师克里斯托弗·科赫联合发表了一篇名为《本福特定律和新冠疫情数据报告》的论文。
基于Benford定律的会计舞弊发现研究

基于Benford定律的会计舞弊发现研究作者:狄为施鹏仙来源:《会计之友》2010年第26期【摘要】文章结合我国上市公司的真实数据,运用Benford定律进行会计舞弊分析检测,指出Benford定律作为一种数值分析技术应用于会计舞弊检测,具有操作性好、使用成本低、客观性强等特点,是一种常规的舞弊检查技术方法。
但单个会计舞弊公司的财务数据首位数出现的概率分布与Benford定律的理论分布存在较大差异。
【关键词】 Benford定律;会计舞弊;数值分析近年来,会计舞弊不断发生,如何发现舞弊、阻止舞弊、证据舞弊是会计人员、法务工作者、监管部门不断研究的对象。
本文将Benford定律应用于会计舞弊领域研究,试图以统计学角度检测数字内在分布规律的分析方法,发现财务舞弊者的造假现象,进一步发现和获得舞弊证据。
Benford定律是一种数字统计的内在规律,在财务、人口普查、股票指数等领域有着很强的数据适用性。
会计、统计、税收、金融及证券市场各种数字可以很好地符合Benford定律。
从具体方法上来看,本文的研究对传统舞弊侦查方法,如分析性复核法、资产质量分析法、奇异分析法等,是一个很好的补充。
一、Benford定律的内涵奔福德定律(Benford's law)也被称为“首位数现象”(First-digit phenomena)、有效数字法则(Significant digit law)、对数法则(Logarithm Law),是从统计学角度检测鲜为人知的数字分布的内在规律。
该定律揭示了在满足特定条件的情况下,大量统计数据中数字1—9出现在数据首位的概率分布规律。
1881年,美国数学家Newcomb最早发现Benford定律。
1938年,美国通用电气公司(GE)科学家Frank Benford通过研究,得出和Newcomb同样的结论:人们处理较小数字开头的数值的频率较大。
为了证明结论,Benford收集了20 229个20组数据,这些数据来源千差万别,发现整数1在首位出现的概率约为30%,整数2约为17%,而8和9在数字首位出现的概率分别为5%和4%。
本福特定律的原理概述

本福特定律的原理概述The principle of the Ford Duality Law is a fundamental concept in mathematics and physics. It deals with the relationship between primal and dual feasible solutions in linear programming. The law states that if a primal linear program has an optimal solution, then its dual linear program will also have an optimal solution, and the optimal values of the two solutions will be equal.福特定律的原理对数学和物理学都有重要影响。
它涉及线性规划中原问题和对偶问题之间的关系。
定律表明,如果原线性规划有最优解,则其对偶线性规划也将有最优解,并且两个最优解的值将相等。
The duality principle serves as a powerful tool in optimization theory and is crucial for understanding the underlying structure of linear programming problems. By relating the primal and dual problems, it allows us to make inferences about one problem based on the solutions of the other. This duality relationship provides insight into the nature of constraints and objectives in a linear programming model.对偶原理是优化理论中的重要工具,对于理解线性规划问题的基本结构至关重要。
神奇的本福特定律

神奇的本福特定律从常理上说,世界上千千万万的数据(非开0头)的开头数字是1到9的任何一个数字,而且每个数字开头的概率应该差不多。
现在,请你随便找本书,统计一下上面的各种开头数据的开头数字,看看是否符合我们的设想。
如果你统计的数据足够多,你就会惊讶的发现,开头数字是1的数据最多,大约占了所有数据的1/3左右,打头是2的数据其次,往后依此减少。
难道是人们对1情有独钟,把它时常写在数据的最前面吗?肮脏的对数表书页首先要恭喜你,你发现了数学上的一个有趣的定律,这就是本福特定律。
据说这个定律在1881年首先被一位天文学家在分析数据的时候发现,但是当时科学家们并没有把这个发现当回事。
直到1935年,美国的一个叫本福特的物理学家从新发现了这个定律。
当时,他在图书馆翻阅对数表时发现,对数表的头几页比后面几页更脏一些,这说明头几页在平时被更多的人翻阅。
这并不奇怪,因为许多读书的人都先看看书的开头,不喜欢就不再读下去。
但是,对数表却是一种数学工具,只有需要查数据的人才会去碰它。
因此,头几页如果比较脏,这就说明人们查阅的数据大多在头几页里,也反映出人们所使用的数据并不是散乱的,而是有些数据使用的频率比较高。
本福特再进一步研究后发现,只要数据的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率并不是人们想当然认为的1/9,而是0.301,这说明30%的数字都以1开头。
而2为首的数字出现的频率是0.176,3开头的数字出现的频率为0.125,往后出现频率依此减少,9打头的数字出现的频率最低,只有0.046。
这个规律甚至能用一个数学方程来表示。
除了对数表,其他类型的数据是否也有这样的现象呢?本福特开始对其他数字进行调查,发现各种完全不同的数据,比如人口,死亡率,物理和化学常数,棒球统计表,半衰期放射性同位素,物理书中的答案,素数数字中均有这个定律的身影。
定律成因之迷本福特定律在生活中很常见,但是为什么人们使用的数据会有这样的现象呢?几十年来,人们提出了一些猜想来解释这个现象。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
奇妙的统计规律——本福特定律
1.引入
世界上千千万万的数据的开头数字是1到9中的任何一个数字,而且每个数字打头的概率本应该差不多,但如果你统计的数据足够多,就会惊讶地发现,打头数字是1的数据最多,约为总数的三成,越大的数,以它为首几位的数出现的机率就越低。
进一步讲,对于随机变量,只要样本空间足够大,每一样本首位数字为1至9各数字的概率在一定范围内具有稳定性。
本福特研究后发现,只要统计的样本足够多,同时数据没有特定的上限和下限,则数据中以l为开头的数字出现的频率是0.301,这说明30%的数字都以1开头.而以2为首的数字出现的频率为0. 176,以3打头出现的频率为0.125.往后出现的频率依次减少,9出现的频率最低,只有4.6%。
具体概率分布如图所示:
在数学术语中,这一数学定律的公式可以表示为F(d)=lg[1+(1/d)],此公式中F代表出现的概率,d代表待求证数据的第一个数字。
这就是著名的“本福特定律”。
也叫做“第一数字定理”。
2.发现
1881年,天文学家西蒙·纽康伯发现对数表包含以1起首的数那首几页较其他页破烂。
不过这个故事可能是虚构的,亦可以以任何书起首数页也会较破烂这个观点解释。
1935年,美国的一位叫做本福特的物理学家重新发现了这一现象。
他在图书馆翻阅对数表时发现,对数表的头几页比后面的页更脏一些,说明头几页在平时被更多的人翻阅。
由此产生极大兴趣,并做了进一步研究,总结出了其中的规律。
除了对数表,本福特对其他类型的数据进行了统计、调查,发现各种完全不相同的数据,比如人口、死亡率、物理和化学常数、棒球统计表、半衰期放射性同位数、物理书中的答案、素数数字以及斐波纳契数列数字中均有这一定律的身影.换句话说,也就是只要是由度量单位制获得的数据都符合“第一数字定律”。
鉴于本福特的巨大贡献,这条定律以他的名字命名。
3.解释
1961年,一位美国科学家提出,本福特定律其实是数字累加造成的现象,即使没有单位的数字。
比如,假设股票市场上的指数一开始是1000点,并以每年10%的程度上升,那么要用7年多时间,这个指数才能从1000点上升到2000点的水平;而由2000点上升到3000点只需要4年多时间;但是,如果要让指数从10000点上升到20000点,还需要等7年多的时间。
因此我们看到,以1为开头的指数数据比以其他数字打头的指数数据要高很多。
现在考虑{2^n}(n为自然数,下同)这个数列,统计前面足够多的项,可以发现首位数字的分布满足本福特定律。
对于{2^n}中一个k位数x,其首位数字是1可表示为:
1*10^k<x<2*10^k,两取常用对数,得:
k<nlg2<k+lg2,即x的小数部分在(0,lg2)之间,计为
{nlg2}∈(0,lg2),
如果{nlg2}(的小数部分,下同)在(0,1)间是均匀分布,则
{nlg2}∈(0,lg2)的概率为:(lg2-0)/1=lg2≈0.301.同理可得,首位
数字(有效数字,下同)是d即{nlg2}∈( lg d,lg (d+1) )的概率为:
F(d)=lg[1+(1/d)]。
为什么{nlg2}会在(0,1)间均匀分布呢,这里也不做证明,只举几个例
子。
比如数列{2n},由于2是整数,{2n}各项没有小数部分,故在(0,1)间只占“0”位置。
如果是{n/2},则占的位置也只有“0”和“1/2”。
从中不难发现,对于一个{na}(a!=0)数列,“a”的小数部分越长(稍欠妥),则该数列在(0,1)间的取值越多。
如果a是一个有理数,即a可表示为p/q的形式,则{na}在(0,10间只能取{0,1/p,2/p,…(q-1)/p}q个固定的值。
不过对于无理数a,则情况不一样了,考虑到a有无限位小数,而且也不能表示为p/q的形式,{na}在(0,1)间可以取无限多个值,而且并不固定。
其实数学上可以证明,对无理数a,{na}在(0,1)间确实是均匀分布的,前面假设成立。
这里便不难理解本福特定律,即是对一大堆从生活中得出的数据,它们在(0,1)间的分布像{nlg2}一样,是均匀的。
当然若想了解这个定律的严格证明,
可以参见Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.
继续来看这个公式,F(d)=lg[1+(1/d)],我们讨论的都是十进制数,不
过从前面的论述不难看出,对于b进制(b>=2,下同)数,我们只须取以“b”为底的对数,便可仿照前面将以d开头的数字x表示为:
K+log b d<x<k+log b (d+1),于是得到b进制中,以数字d开头的数在自然
界中所占的比例是:F(d)=log b [1+(1/d)].对于二进制的特例,可以发现,当样本足够多时,以1开头的数字所占比例为:F(1)=log 2 [1+(1/1)]=1,事实的
确如此。
还是以十进制为例,这里的d也可以推广,比如d=10,11,…,推理仍可仿照前面。
由此可得,当第一位数是1时,第二位也是1的概率为F=F(11)/F(1).
(d)=F(10+d)+F(20+d)+…+F(90+d).当进而得到第二位数字是d的概率公式:F
2
然理论也可得到第k 位出现d的概率,这里不再累述。
4.应用
1972年,Hal Varian提出这个定律来用作检查支持某些公共计划的经济数据有否欺瞒之处。
1992年,Mark J. Nigrini便在其博士论文"The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies."(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它检查是否有伪帐。
推而广之,它能用于在会计、金融甚至选举中出现的数据。
数学家们发现,公司账本中的数据打头数字出现的频率与“本福特定律”有着惊人的巧合.如果做假账的人更改了账本上真实的数据,就会使账本上打头数字出现的频率发生变化从而偏离“本福特定律”.更有趣的是,数学家们还发现。
在那些假账中,数字5和6居然是最常见的打头数字,而不是符合定律的数字1,这就表明,伪造者试图在账目中间“隐藏”数据.
在美国,该定律在部分实用领域进行了实践。
在经济方面,会计师可以根据这一定律对公司的年度账目进行分析,查找伪造数据。
最为典型的例子就是美国安然公司“假账”事件.2001年,“9·11”事件发生后不久,曾是美国最大的能源交易商、全球500强中排名第七的安然公司在事先没有任何征兆的情况下突然宣布破产.随后传出了该公司涉嫌做假账的丑闻.事后,人们发现,安然公司在2001年度到2002年度所公布的每股盈利数字完全不符合“本福特定律”.这证明了安然公司的高层领导确实改动过数据.
在选举方面,本福特定律还用于投票欺诈发现。
科学家依据这一定律发现了2004年美国总统选举中佛罗里达州的投票欺诈行为,以及2004年委内瑞拉和2006年墨西哥的投票欺诈行为。
现在,“本福特定律”在我们的生活领域中越来越广泛地被应用。
如表1,这是欧盟目前的25个成员国的能源消费(一个国家的总能源消费通常用Mtoe为单位表示,即百万吨油当量),一列中是真实的数据,而另一列中包含伪造的数据.哪一列是正确的?
答案是左列数据正确,
右列数据是伪造.简单的定
律揭示了数据的真伪,这就
是科学的奇妙之处,简单中
蕴藏着意想不到的神奇.
5.适用范围
本福特定律至今仍然没有找到任何能解释各种范例的统一判断标准。
一般要求:一是数据应是由度量单位制获得,即数据应有度量单位的,如元、t、m等;二是数据不能是规律排序的,比如发票编号、身份证号码等;三是有指定数值范围,或不是以机率分布出现的数据也不适用,如正态分布的数据;四是数据不能经过人为加工,即事前按照本福特定律对数据进行调整。
陈某某。