让人匪夷所思的统计学定律——本福特定律

合集下载

本福特定律公式

本福特定律公式

本福特定律公式摘要:1.本福特定律公式的概述2.本福特定律公式的推导过程3.本福特定律公式的应用领域4.本福特定律公式的局限性正文:1.本福特定律公式的概述本福特定律公式,又称为本福特- 洛伦茨方程,是由美国气象学家爱德华·诺顿·洛伦茨(Edward Norton Lorenz)在1963 年提出的。

该公式描述了大气中气象要素(如气压、风速、温度等)随时间的变化规律。

本福特定律公式在气象学领域具有重要的意义,为气象预报提供了重要的理论依据。

2.本福特定律公式的推导过程本福特定律公式的推导过程较为复杂,涉及偏微分方程、线性变换等数学知识。

在此,我们简要介绍一下其推导思路。

首先,根据气象学的基本物理过程,我们可以列出描述大气运动的原始方程。

这些方程包含了气压、风速、温度等气象要素的变化。

然后,通过对这些方程进行适当的简化和线性变换,我们可以得到一组新的方程,称为本福特方程组。

最后,通过求解本福特方程组,我们可以得到本福特定律公式。

3.本福特定律公式的应用领域本福特定律公式在气象学领域具有广泛的应用,主要体现在以下几个方面:(1)气象预报:本福特定律公式可以用于预测大气中的气象要素,如气压、风速、温度等。

这对于气象预报具有重要意义,有助于提高预报的准确性。

(2)气候研究:本福特定律公式可以用于研究气候现象,如厄尔尼诺现象、拉尼娜现象等。

这对于了解气候变化规律、预测气候趋势具有重要意义。

(3)气象灾害预警:本福特定律公式可以用于预测气象灾害,如台风、暴雨、干旱等。

这对于气象灾害预警、防范和减轻灾害损失具有重要意义。

4.本福特定律公式的局限性虽然本福特定律公式在气象学领域具有重要意义,但它也存在一定的局限性:(1)数学复杂度:本福特定律公式的推导过程较为复杂,涉及偏微分方程、线性变换等数学知识。

这增加了理解和应用的难度。

(2)非线性问题:气象现象本身具有非线性特点,而本福特定律公式是基于线性变换得到的。

神秘的本福特定律范文

神秘的本福特定律范文

神秘的本福特定律physixfan 2010-10-31 21:25统计一下世界上237个国家的人口数量,你觉得其中以1开头的数会占多大比例,而以9开头的数又占多大比例呢?如果你的回答是都为1/9,恭喜你你是正常人,但是事实却不是如此:以1开头的数惊人的占到了27%,而以9开头的数却只占5%。

下图可以很形象的展示出在各国人口数量问题上,以各个数字开头的数占了多大的比例(图片来自维基百科)。

为什么会相差这么大呢?这正是神秘的本福特定律在起作用。

本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍,推广来说,越大的数字,以它为首几位的数出现的机率就越低;精确地数学表述为:在b进位制中,以数n起头的数出现的机率为logb(n + 1) − logb(n)。

在十进制中,首位数字出现的概率为:这个定律的发现,据说是因为本福特在翻对数表的时候发现前面几页被翻得很黑很破烂,越往后越颜色越浅。

由此他想到会不会是1开头的数字就是比其他数多,他统计了一下发现果然如此。

其实这个对数表的事情真假难辨了,就像是牛顿说自己是被苹果砸到了头才发现的万有引力定律一样,只要最后的定律有用就可以了。

首先说明一下本福特定律的适用范围这个定律是一个非常神奇的定律,它的适用范围异常的广泛,几乎所有日常生活中没有人为规则的统计数据都满足这个定律。

比如说世界各国人口数量、各国国土面积、账本、物理化学常数、数学物理课本后面的答案、放射性半衰期等等数据居然都符合本福特定律。

值得一提的是,科学家还发现,统计物理的三个重要分布,Boltzmann-Gibbs分布,Bose-Einstein分布,Fermi-Dirac分布,也基本上满足Benford定律!(来源:李淼的博客)其次这个定律毕竟还是有适用范围的第一,这些数据必须跨度足够大,必须横跨好几个数量级才能产生这个结果。

第二,有人为规则的数据就不满足次定律,比如说手机号码、身份证号、发票编号等数据,明显不满足这种对数分布律。

本福特定律

本福特定律

1881年,天文学家西蒙·纽康伯发现对数表包含以1起首的数那首几页较其他页破烂。

可是,亦可以以任何书起首数页也会较破烂这个观点解释。

这个故事可能是虚构的。

1938年,物理学家法兰克·本福特重新发现这个现象,还通过了检查许多数据来证实这点。

2009年,西班牙数学家在素数中发现了一种新模式,并且惊讶于为何那时才为人发现。

虽然素数一般被认为是随机分布的,但西班牙数学家发现素数数列中每个素数的首位数字有明显的分布规律,它可以被描述了素数的本福德法则。

这项新发现除了提供对素数属性的新洞见之外,还能应用于欺骗检测和股票市场分析等领域。

数字统计的一种内在规律,指所有自然随机变量,只要样本空间足够大,每一样本首位数字为1至9各数字的概率在一定范围内具有稳定性。

见右图。

即以1开首的样本占样本空间的0.3,以2开首的样本占样本空间0.17-0.19,而以9或8开首的样本始终只占0.05左右。

世界上千千万万的数据的开头数字是1到9中的任何一个数字,而且每个数字打头的概率本应该差不多,但如果你统计的数据足够多,就会惊讶地发现,打头数字是1的数据最多。

1935年,美国的一位叫做本福特的物理学家在图书馆翻阅对数表时发现,对数表的头几页比后面的页更脏一些,这说明头几页在平时被更多的人翻阅。

本福特再进一步研究后发现,只要数据的样本足够多,数据中以1为开头的数字出现的频率并不是1/9,而是30.1%。

而以2为首的数字出现的频率是17.6%,往后出现频率依次减少,9的出现频率最低,只有4.6%。

本福特开始对其它数字进行调查,发现各种完全不相同的数据,比如人口、物理和化学常数、棒球统计表以及斐波纳契数列数字中,均有这个定律的身影。

1961年,一位美国科学家提出,本福特定律其实是数字累加造成的现象,即使没有单位的数字。

比如,假设股票市场上的指数一开始是1000点,并以每年10%的程度上升,那么要用7年多时间,这个指数才能从1000点上升到2000点的水平;而由2000点上升到 3000点只需要4年多时间;但是,如果要让指数从10000点上升到20000点,还需要等7年多的时间。

本福特定律:如何不懂报表也能发现企业财务造假?

本福特定律:如何不懂报表也能发现企业财务造假?

本福特定律:如何不懂报表也能发现企业财务造假?本福特定律是近来备受资本市场青睐的一种分析财务报告的方法。

只是数数就可以发现企业财务造假的端倪。

这不是才蹦出来的定律,只是最近才应用于会计和金融领域:保险公司开始用这种方法检测虚假申报,美国国内税务局用来检测税务欺诈,而四大会计师事务所则用它检测会计造假。

心动了没?本文先对本福特定律进行简要介绍,然后以茅台、暴风以及造假的金亚科技的财务报表为例,说明该定律是如何发现报表造假问题的。

一、本福特定律简介1、什么是本福特定律?本福特定律因20世纪早期英国物理学家本福特而得名,其内容是:自然数据源(信用卡账单、采购记录、现金收据)生成的数字中,约有30%的数字的首位数是1,如1、1314;首位数为2的数字约有18%;顺序递减,首位数为9的数字少于5%。

2、本福特定律的应用这个分布规律适用的数据集几乎无穷无尽,包括河流的长度、城市和国家的人口、证券交易所的成交量,当然我们的会计数据(数据没有被人为操纵过)也同样适用。

如果一组会计数据不符合本福特定律的话,就存在被篡改过的嫌疑。

比如说,一家会计事务所对某公司的财务报表进行审查,发现会计数据中首位数是7、8、9的数字非常多,这就说明了管理者可能为了达到财务目标而修改了数据。

生活中会有很多的例子。

——图书馆里大部分书的头几页通常比较脏。

因为许多到图书馆看书的人大多只是看书的开头,不喜欢的话就不会再看下去了;把一本书完整看完的人比较少。

靡不有初,鲜克有终。

——数学书后的对数表、化学书后的一些化学常数、财务课本后的终值、现值系数表等等,我们查阅的数据大多在头几页里面。

——如果统计的数据足够多,我们会发现,开头是数字1的数据最多,大约占了所有数据的三分之一;开头是2的数据居于其次;剩下的数字的数量依次递减。

人口、死亡率、物理和化学常数、棒球统计表、半衰期放射性同位数、物理书中的答案、素数数字以及斐波纳契数列数字中均有这一定律的身影。

本福特定律excel公式

本福特定律excel公式

本福特定律excel公式
本福特定律(Benford's Law)也称为第一数字定律,它描述了在许多自然发生的数据集中,以1为首位数字的数出现的概率最大,约为30.1%,而以2到9为首位数字的数出现的概率逐渐减小。

在Excel中,可以使用以下步骤来计算数据是否符合本福特定律:
1.首先,需要将数据粘贴到Excel工作表的A列。

2.然后,可以使用Excel的公式和函数来计算首位数字为1到9的概率分布。


体的公式和函数可能因版本和具体需求而异,但通常涉及到使用COUNTIF函数来统计以特定数字开头的数字的数量,并使用SUM函数或其他方法来计算总数。

然而,Excel本身并没有内置直接计算本福特定律的函数或公式。

如果需要更高级的功能或自动化处理,可能需要使用VBA(Visual Basic for Applications)编写自定义的Excel 插件或宏来实现。

此外,需要注意的是,本福特定律并不是绝对的,它只是一种经验法则,用于描述在某些情况下数字的分布情况。

因此,即使计算出的概率分布与本福特定律有所偏差,也不一定意味着数据存在问题或不符合本福特定律。

利用本福特定律快速发现数据异常实践

利用本福特定律快速发现数据异常实践

利用本福特定律快速发现数据异常实践
今天向大家介绍一种可以快速判断数据异常的定律——本福特定律。

本福特定律是由美国数学家、天文学家西蒙·纽卡姆于1881年首次发现。

在使用对数表做计算时,纽卡姆突然注意到对数表的第一页要比其它页更为破旧。

经过大量的统计分析,他发现,以1为首位的随机数的出现概率要比以2为首位的随机数高,而以2为首位的随机数的出现概率又要比以3为首位的随机数高,以此类推。

但纽卡姆并未对此做出解释,当时的人们也未给予充分关注,这一发现逐渐被淡忘。

1938年,美国通用电器的物理学家法兰克·本福特注意到了同样的现象,并进行了大量的分析验证。

最终,本福特推导出:在十进制下,首位数字的出现概率分布如下:
从数学的角度看,实际分布与本福特定律预期分布的偏差越大,数据造假的程度越大。

但本福特定律并不是万能的,如果造假者操纵首位数字,使得造假数据符合该定律,我们就无法初步判断数据是否造假。

因此,本福特定律只是为我们提供一个考察数据的新角度,并不能替代其它分析方法或审计程序。

但是有一点可以确定,大幅度偏离本福特定律的数据,大概率涉及造假或异常。

对某集团公司近5年113492个办公耗材消耗记录进行统计发现:
能看出明显异常吗?
异常即为妖!审计人员带着怀疑对异常的数据5开头的数据进行分析发现:硒鼓与打印纸之间存在相关性。

按照单位对硒鼓与打印纸的数据进行对比发现下图异常的数据在红色方框之外。

沿着数据异常这个思路进一步分析发现了虚假冒用以物易物的现象,提出加强管理建议后效果显著。

2017年该方面的费用支出同比节约了近50%。

对本福特定律的感受和理解

对本福特定律的感受和理解

本福特定律的感受和理解1. 引言在现代社会,我们常常会听到“本福特定律”这个词,它是由美国工程师亨利·福特所提出的经济学定律。

本福特定律指出,随着生产数量的增加,单位成本会逐渐下降,从而带来更高的效率和更低的价格。

在这篇文章中,我将分享对本福特定律的感受和理解,并探讨其在现实生活中的应用。

2. 感受与体会2.1 效率改善本福特定律的核心观点是,随着生产数量的增加,单位成本会下降。

这意味着企业可以通过规模化生产来降低成本,提高产品的生产效率。

在我个人的观察和体验中,这一观点得到了充分的验证。

举个例子,汽车制造业是本福特定律应用得非常成功的行业之一。

当汽车生产规模不断扩大时,企业可以利用大规模生产带来的规模经济,降低材料采购成本和生产设备成本,从而降低单位成本。

这使得汽车在过去几十年中价格不断下降,使得更多人能够负担得起汽车。

2.2 价格竞争因为单位成本的下降,企业有更多的空间来降低产品价格,以吸引更多的消费者。

这就引发了激烈的价格竞争,从而推动了市场的发展。

以电子产品为例,比如手机。

随着技术的进步和生产能力的提高,手机的价格逐渐下降,同时功能和性能也得到了大幅度的提升。

这使得越来越多的消费者能够购买到价格合理且功能强大的手机。

这种价格竞争不仅满足了消费者的需求,也推动了全球电子产品市场的繁荣。

2.3 产品多样性本福特定律还促进了产品多样化的发展。

当规模生产降低了单位成本之后,企业可以更容易地推出多个产品系列,满足不同消费者的需求。

通过适应不同的市场细分,企业能够生产出更多样化、更专门化的产品。

例如,汽车制造商可以根据不同国家和地区的需求,设计和生产不同尺寸、不同燃料类型、不同配置的汽车。

因此,消费者能够根据自己的喜好和需求选择适合自己的产品。

3. 应用与实践3.1 制造业在制造业领域,本福特定律的应用非常普遍。

通过扩大生产规模,企业可以降低成本,提高生产效率并降低产品价格。

这使得制造业具备了更强的竞争力。

神奇的本福特定律

神奇的本福特定律

神奇的本福特定律从常理上说,世界上千千万万的数据(非开0头)的开头数字是1到9的任何一个数字,而且每个数字开头的概率应该差不多。

现在,请你随便找本书,统计一下上面的各种开头数据的开头数字,看看是否符合我们的设想。

如果你统计的数据足够多,你就会惊讶的发现,开头数字是1的数据最多,大约占了所有数据的1/3左右,打头是2的数据其次,往后依此减少。

难道是人们对1情有独钟,把它时常写在数据的最前面吗?肮脏的对数表书页首先要恭喜你,你发现了数学上的一个有趣的定律,这就是本福特定律。

据说这个定律在1881年首先被一位天文学家在分析数据的时候发现,但是当时科学家们并没有把这个发现当回事。

直到1935年,美国的一个叫本福特的物理学家从新发现了这个定律。

当时,他在图书馆翻阅对数表时发现,对数表的头几页比后面几页更脏一些,这说明头几页在平时被更多的人翻阅。

这并不奇怪,因为许多读书的人都先看看书的开头,不喜欢就不再读下去。

但是,对数表却是一种数学工具,只有需要查数据的人才会去碰它。

因此,头几页如果比较脏,这就说明人们查阅的数据大多在头几页里,也反映出人们所使用的数据并不是散乱的,而是有些数据使用的频率比较高。

本福特再进一步研究后发现,只要数据的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率并不是人们想当然认为的1/9,而是0.301,这说明30%的数字都以1开头。

而2为首的数字出现的频率是0.176,3开头的数字出现的频率为0.125,往后出现频率依此减少,9打头的数字出现的频率最低,只有0.046。

这个规律甚至能用一个数学方程来表示。

除了对数表,其他类型的数据是否也有这样的现象呢?本福特开始对其他数字进行调查,发现各种完全不同的数据,比如人口,死亡率,物理和化学常数,棒球统计表,半衰期放射性同位素,物理书中的答案,素数数字中均有这个定律的身影。

定律成因之迷本福特定律在生活中很常见,但是为什么人们使用的数据会有这样的现象呢?几十年来,人们提出了一些猜想来解释这个现象。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

j 理翳馆 ・ 数学 fbu Si c , A ot c n ee
在 日常生活 中, 过对某些统计数 据的分析 , 通 我们可 以了解某一情况 、 出某些决定. 做
考 点分析 : 统计 与概率 的综合 问题 , 与我 们 的生活联 系非常 紧密 , 是中考 应用 问题 弹性较 也
大的命题 .

数据 最多 , 约 占了所有 数据 的 , 头数字 是 大 打

2的数据其 次 . 往后依 次减少 . 这是 一种巧合 吗 ?
絮 05 . 2
点 00 . 2
n1 5
§00 . 1
与 05 . 0 13 9 5年 ,美 国通 用 电气 公 司的一 位物 理学 家弗 兰 克 ・ 福 特 和你 一样 . 发现 了这 一 “ 本 也 见


I 理斛馆・ ot cne 数学i u Sic e
表 示为Fd_gl 了 I ( l。l1 , )o0+ 此公式中F 使用 代表
L ¨ J
账 本上 打 头数 字 出现 的频 率 发 生 变 化从 而 偏 离 “ 福特定 律 ” 更 有趣 的是 , 学 家们 还发 现 。 本 . 数 在 那些 假账 中 , 数字 5和 6居 然是 最 常见 的 打头 数
衰期 放 射 性 同位 数 、 物理 书 中 的答 案 、 素数 数 字 以及 斐 波纳 契 数列 数 字 中均有 这 一 定 律 的身 影. 换句 话说 , 就是 只要 是 由度 量单 位制 获得 的数 也
据都 符合 “ 一数字 定律 ” 第 .
随后传 出 了该 公 司 涉嫌 做 假账 的丑 闻.事后 , 人 们 发现 , 安然 公司 在 2 0 0 1年 度到 2 0 0 2年 度所 公 布的每 股盈 利 数字 完全 不符 合 “ 福特 定 律 ”这 本 .
几 十年 来 , 人们 一直无 法更 合理 地解释 这个 现象 .
此外 . 在生 活 中还 有 一 些 类 似 的数 据 , 这一 定 与 律并 不吻合 . 彩票 、 比如 电话 号码 、 油价 格 、 的 汽 人
除 了对 数 表 . 本福 特对 其他 类 型 的数 据进 行
了统计 、 查 , 现各种 完 全不 相 同的数 据 , 调 发 比如 人 口、 亡 率 、 理 和 化学 常数 、 球统 计 表 、 死 物 棒 半
的能 源交 易商 、 球 5 0强 中排 名第 七 的安 然公 全 0
司在事 先 没有任 何 征兆 的情 况下 突然 宣 布破产 .
让 人 匪夷所思的统计学定律—一 本福特定律
0 柯锦丽
如 果 你经 常去 图 书馆 。那 么你可 能会 发现

这 说 明表 的头几 页 在平 时 被更 多 的人 翻阅.于
种奇 妙 的现象 :图书馆 的大 部分 书 的头几 页
是 , 位物理学 家对此 产生 了极大 的兴 趣. 这
通 常会 比较脏 . 是一种 很普 遍 的现象 , 面上 这 表
条形 图所示 :
03 .0
在头 几 页里 ,同 时反 映出人 们使 用 的数据 并 不
是散乱 的 . 而是有些 数据使 用 的频 率较高 . 你还 可 以统计 一下 所学 过 的数学 、物 理课 本 上 面各 种数 据 的开 头数 字.如果 你 的 样本 足
够多, 那么 你就 会惊 讶地 发 现 , 打头 数字 是 1的
频 率 . 表待 求证 数据 的第一 个数 字. d代 这 就 是 著 名 的 “ 福 特 定 律 ” 也 叫做 “ 一 本 。 第 数 字定 理 ” .
字 , 不是 符合 定 律 的数 字 1这 就 表 明 , 造 者 而 , 伪 试 图在账 目中间“ 隐藏 ” 数据 .
最 为典 型 的就 是美 国安然 公 司 “ 账 ” 假 事件 . 20 0 1年 ,9 1 ” 件 发生 后 不 久 , “ ・1 事 曾是 美 国最 大

L a igdgt e d n ii
怪 不怪 ” 的现 象 , 当时他在 图书馆 翻 阅数学 对数
表 时发 现 , 对数 表 的头几 页 比后 面 的更脏 一 些 ,
图1
在数 学术 语 中 ,这一 数学 定 律 的公式 可 以
2 中 科 用引 、调特 含 、刺反 号 作 :用强 、殊 义讽 、 语
证 明 了安然公 司 的高层 领导 确实 改动过 数据. 现 在 , 本 福特 定 律 ” 在我 们 的生 活领 域 中 “ 越 来越 广 泛 地被 应 用 。如表 1 这是 欧 盟 目前 的 , 2 5个 成 员 国 的 能 源 消费 ( 个 国家 的 总 能 源 消 一
本福 特定 律 在我们 的 日常 生活 中很 常见 , 但
看来 并不 奇 怪 .因为许 多 到 图书馆 读书 的人 大 多是 先 看看 书 的开头 ,不喜 欢 的话 就不 会再 接
着读 下 去 了.但是 , 如果 你 有兴 趣 的话 , 进 行 再

下深入 考察 . 你就 会发现 同样现 象 的存 在. 比如 , 学书 后 的对数 表 、 学书后 的一些 数 化
弗 兰 克 ・ 福 特 本
化 学 常数表 等 等 ,由于这 些数 学用 表是 一种 工 具, 只有 需 要 查数 据 的人 才会 去 碰 它 , 因此 , 如
果头 几 页 比较 脏 。就说 明人 们查 阅 的数 据大 多
n二
通 过更 进一 步 的研 究 , 本福 特发 现 , 只要 统 计 的样 本足 够多 ,同时数据 没有 特定 的上 限和 下限, 则数 据 中以 l 开头 的数字 出现 的频率 是 为 03 1 这说 明 3%的数字都 以 1 头.而 以 2为 .0 , 0 开 首 的数 字 出现 的频率 为 01 6 . ,以 3打头 出现 的 7 频率 为 01 5 往后 出现 的频率依 次减 少 , . . 2 9出现 的频 率最 低 , 只有 46 具体 概率分 布如 图 1的 . %。
相关文档
最新文档