两个统计小故事
统计学故事(例子)

谁获利?——概率论的产生与发展街头有人席地设摊,白布上醒目地写着:“有奖抽签销售”,任何人都可以免费从摊主小布口袋中的20个小球(其中有10个红球,10个蓝球)中摸出10个,除摸得5红5蓝这种情况外,其他各种情况均可马上获得奖金(或实物)。
奖金设臵如下:摸得10红或10蓝者奖50元;摸得9红1蓝或9蓝1红者奖25元;摸得8红2蓝或8蓝2红者奖5元;摸得7红3蓝或7蓝3红者奖1.5元;摸得6红4蓝或6蓝4红奖0.5元。
但摸得5红5蓝者必须用6元钱向摊主购买两双袜子。
这种免费抽签的有奖销售谁获利呢?如果学过概率论与数理统计的有关知识,你就能知道最后获利的是谁。
概率论是研究大量随机现象的统计规律的一门数学。
近几十年来,随着科学技术的飞速发展,概率论大量应用于国民经济、工农业生产、近代物理、气象、地震、生物、医学等部门。
一些新兴的应用数学学科,如信息论、对策论、控制论等,几乎无一不以概率为基础,概率论的发展正方兴未艾。
最早研究概率的,可能要算十六世纪意大利数学和医学教授卡尔达诺,他天资聪明,有着有趣而丰富的经历。
在一生中超过40年的时间里,他几乎每天都参与赌博,而且是带着数学的头脑去观察、去思考。
最终,在一本名叫《机会性游戏手册》的书中,他公布了调查和思考的结果和关于赌博实践的体会。
这本书写于1526年左右,但一直到一百多年后的1663年才出版。
书中已包含了等可能性事件的概率的思想萌芽,即一个特殊结果的概率是所有达到这个结果的可能方法的数目被一个事件的所有可能结果的总和所除。
从书中可以看到关于骰子的问题由经验向理论概率思想的第一次转变。
从这一角度来讲,概率论这一数学分支应当以此作为起点,但是这种观点并未得到广泛的认可。
数学史学家大多赞同这样一个观点:“点数问题”的解法的探讨成为数学化概率学科产生的标志之一。
一个具体的有关“点数问题”的例子是法国的德〃梅勒提出来的。
德〃梅勒是一位军人、语言学家、古典学者,同时也是一个有能力、有经验的赌徒。
两个统计小故事

数学故事袁永红理智避开德军潜艇1943年以前,在大西洋上英美运输船队常常受到德国潜艇的袭击。
当时,英美两国实力受限,又无力增派更多的护航舰艇。
一时间,德军的“潜艇战”搞得盟军焦头烂额。
为此,一位美国海军将领专门去请教了几位数学家。
数学家们运用概率论分析后发现,舰队与敌潜艇相遇是一个随机事件。
从数学角度来看这一问题,它具有一定的规律:一定数量的船编队规模越小,编次就越多;编次越多,与敌人相遇的概率就越大。
美国海军接受了数学家的建议,命令舰队在指定海域集合,再集体通过危险海域,然后各自驶向预定港口,结果盟军舰队遭袭被击沉的概率由原来的25%下降为1%,大大减少了损失。
算准深水炸弹的爆炸深度二战期间,英美运输船队在大西洋航行时经常受到德军潜艇的袭击。
英国空军经常派出轰炸机利用深水炸弹对德军潜艇实施打击,但轰炸效果总不理想。
为此,英军请来一些数学家专门研究这一问题。
结果发现,潜艇从发现英军飞机开始下潜到深水炸弹爆炸为止,只下潜了米,而英军飞机的深水炸弹却已下沉到21米处爆炸,从而对潜艇的毁伤效果低下。
经过科学论证,英军果断调整了深水炸弹的引信,爆炸深度由21米调整到米,结果轰炸效果提高了4倍,德军还以为英军有了什么新式武器。
狐狸开公司狐狸在森林里开了一家服装公司,生意日渐火红起来。
可是公司的员工却十分不满,原来雇用的员工们每天要工作强度很大,但工资却很低。
员工们每天从早忙到晚上,得不到休息,而得到的工资又不多,所以它们集体罢工,要求减轻工作量,增加工资。
狐狸想:与其给原来职工加工资以求保住员工,还不如招一批新工人合算。
因为即使给它们低工资,一时半会也不会闹事。
于是马上印了许多广告到处张贴,说:“本公司平均工资1800元,名额有限,欲报从速。
“小老虎听说了以后,心想一个月1800元工资还不错,于是到公司报名。
狐狸对小老虎说:“我们公司的平均工资是1800元,你愿意到我们公司工作吗?“小老虎表示同意,狐狸马上录用了它,签约工作合同1年。
统计学不得不说的二三事

统计学不得不说的二三事毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。
话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。
话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁)再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。
(其实这是不对的,世界上一多半的人都比他更聪明。
因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。
)不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。
(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……)好冷好冷,我们还是来讲点正事,分享几则统计小故事。
1、两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。
路人甲以A和B的参考范围上限作为诊断界值,得出了A和B 在该界值下对应的诊断敏感性和特异性。
结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。
路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。
诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。
文章的结论到底是想说明A优秀还是B优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。
稿件被退了,路人甲有些许郁闷。
经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。
高中数学概率统计小故事

1.分赌本问题A ,B 二人赌博,各出注金a 元,每局每个人获胜的概率都是12,约定:谁先胜S 局,即赢得全部注金a 2元,现进行到A 胜1S 局、B 胜2S 局(1S 与2S 都小于S )时赌博因故停止,问此时注金a 2应如何分配给A 和B 才算公平?此问题文字最早见于1494年帕西奥利的一本著作,是对6=S ,51=S 和22=S 的情况的分析.由于对“公平分配”一词的意义没有一个公认的正确理解,在早期文献中出现过关于此问题的种种不同的解法,如今看来都不正确.例如,帕西奥利本人提出按2:S S 1的比例分配.塔泰格利亚则在1556年怀疑能找到一种数学解法的可能性,他认为这是一个应由法官来解决的问题,但他也提出了如下的解法:若2S S 1>,则A 取回自己下的注a ,并取走B 下的注的S S S 1/)(2-,这等于按)(:)(22S S S S S S 11+--+的比例瓜分注金.法雷斯泰尼在1603年根据某种理由,提出按)12(:)12(22S S S S S S 11+---+-的比例分配.卡丹诺在其1539年的著作中,通过较深的推理提出了一种解法:记1S S r -=1,22S S r -=.把注金按)1(22+r r ︰)1(11+r r 之比分给A 和B.他这个解法如今看来虽然仍不正确,但有一个重要之处,即他注意到起作用的是1S ,2S 与S 的差距,而不在其本身.这个问题的症结在于:它关乎每个人在当时状况下的期望值.从以上这些五花八门的解法中,似乎可以认为,这些作者已多少意识到这一点,但未能明确期望与概率的关系.而与此处有关的是:假定赌博继续进行下去,各人最终取胜的概率.循着这个想法问题很易解决:至多再赌121-+=r r r 局,即能分出胜负.假如A 获胜,他在这r 局中至少须胜1r 局.因此按二项分布,A 取胜的概率为r rr i A i r p -=∑⎪⎪⎭⎫ ⎝⎛=21,而B 取胜的概率为1B A p p =-.注金按B A p p :之比分配给A 和B ,因A ap 2和B ap 2是A ,B 在当时状态下的期望值.这个解是巴斯噶(B.Pascal, 1623~1662)在1654年提出的.他用了两种方法,其一是递推公式法,其二是用“巴斯噶三角”(即杨辉三角).1710年,蒙特姆特在一封信中给出了我们在前面写出的解法,且不必规定二人的获胜概率相同.后来他又把此问题推广到多个赌徒的情形.分赌本问题在概率史上起的作用,在于通过对这个在当时来说较复杂的问题的探索,对数学期望及其与概率的关系有了启示.有的解法,特别是巴斯噶的解法,使用或隐含了若干直到现在还广为使用的计算概率的工具.如组合法、递推公式、条件概率和全概率公式等.可以说,通过对这个问题的研究,概率计算从初期简单计数步入较为精细的阶段.2. 巴斯噶与费尔马的通信巴斯噶与费尔马(P. de Fermat ,1601-1665)的名字,对学习过中学以上数学的人来说,想必不陌生.巴斯噶三角,在我国称杨辉三角,中学教科书中已有提及.至于费尔马,因其“费尔马大定理”(不存在整数,,,≠xyx z y x xyz≠0和整数3≥n ,使n n n z y x =+) 于近年得到证明,名声更远播数学圈子内外.费尔马在数学上的名声主要因其数论方面的成就,其在概率史上占到一席地位,多少有些偶然,由于他与巴斯噶在1654年7~10月间来往的7封信件,其中巴致费的有3封.这几封信全是讨论具体的赌博问题.与前人一样,他们用计算等可能的有利与不利情况数,作为计算“机遇数”即概率的方法(他们没有使用概率这个名称).与前人相比,他们在方法的精细和复杂性方面大大前进了.他们广泛使用组合工具和递推公式,初等概率一些基本规律也都用上了.他们引进了赌博的值(value)的概念,值等于赌注乘以获胜概率.3年后,惠更斯改“值”为“期望” (expectation),这就是概率论的最重要的概念之一——(数学)期望的形成和命名过程.前文已指出:此概念在更早的作者中已酝酿了一段时间.这些通信中讨论的一个重要问题之一是分赌本问题,还讨论了更复杂的输光问题:甲、乙二人各有赌本a 和b 元(a ,b 为正整数),每局输赢1元,要计算各人输光的概率.这个问题拿现在的标准看也有相当的难度.由此也可看出这组通信达到的水平及其在概率论发展史上的重要性.有的学者,如丹麦概率学者哈尔德,认为巴、费2人在1654年的这些信件奠定了概率论的基础.这话相当有道理,但也应指出,这些通信的内容是讨论具体问题,没有明确陈述并提炼出概率运算的原则性内容.例如,他们想当然地使用了概率加法和乘法定理.但未将其作为一般原则凸现出来.促使巴、费2人进行这段通信的,是一个名叫德梅尔的人,他曾向巴斯噶请教几个有关赌博的问题.1564年7月29日巴斯噶首先给费尔马写信,转达了这些问题之一,请费尔马解决.所提问题并不难,但不知为何巴斯噶未亲自回答:将两颗骰子掷24次,至少掷出一个“双6”的机遇小于2/1(其值为.0)36/35(124≈-≈0.491 4).但从另一方面看,掷两颗骰子只有36种等可能结果,而24占了36的3/2,这似乎有矛盾,如何解释.现今学过初等概率论的读者都必能毫无困难地回答这个问题.巴、费通信中涉及的有关分赌本问题的解法,包含了一些在当时看很先进且直到现在仍广为使用的想法和技巧.3. 惠更斯的《机遇的规律》惠更斯是一个有多方面成就的、在当时声名与牛顿相若的大科学家.人们熟知他的贡献之一是单摆周期公式g l T /2π=.他在概率论的早期发展史上也占有重要地位,其主要著作《机遇的规律》出版于1657年,出版后得到学术界的高度重视,在欧洲作为概率论的标准教本长达50年之久.该著作的写作方式不大像一本书,而更像一篇论文.他从关于公平赌博(fair game)的值的一条公理出发,推出关于“期望”(这是他首先引进的术语)的3条定理.基于这些定理并利用递推法等工具,惠更斯解决了当时感兴趣的一些机遇博弈问题.最后,他提出了5个问题,对其中的3个给出了答案但未加证明.3条定理加11个问题,被称为惠更斯的14个命题.前3条如下述:命题1若某人在赌博中以等概率12得a ,b 元,则其期望为2/)(b a +元.命题2若某人在赌博中以等概率13得a ,b 和c 元,则其期望为3/)(c b a ++元.命题3若某人在赌博中以概率p ,)1(=+q p q 得a ,b 元,则其期望为qb pa +元.看了这些命题,现代的读者或许会感到惶惑:为何一个应取为定义的东西,要当作需要证明的定理? 答案在于,这反映了当时对纯科学的一种公认的处理方法,即应从尽可能少的“第一原理”(first principle ,即公理)出发,把其他内容推演出来.惠更斯只从一条公理出发而导出上述命题,其推理颇为别致,此处不细述.这几个命题是期望概念的一般化.此前涉及或隐含这一概念只是相当于命题3中0=b 的特例,即注金乘取胜概率,因而本质上没有超出概率这个概念的范围.惠更斯的命题将其一般化,是这个重要概念定型的决定性的一步.实际上,据惠更斯的命题不难证明:若某人在赌博中分别以概率得k a a ,,1 元,则其期望为11k k p a p a ++.这与现代概率论教科书中关于离散随机变量的期望的定义完全一致.余下的11个命题及最后的5个问题,都是在形形色色的赌博取胜约定下,去计算各方取胜的概率,其中命题4~9是关于2人和多人的分赌本问题.对这些及其他问题,惠更斯都用了现行概率论教科书中初等概率计算方法,通过列出一定的方程求解,大体上与巴斯噶的做法相似.这种方法后来被伯努利称为“惠更斯的分析方法”.最后5个问题较难一些,其解法的技巧性也较强.现举其一为例:A ,B 二人约定按ABBAABBAABB …掷两颗骰子,即A 先掷一次,然后从B 开始轮流各掷两次.若A 掷出和为6点,则A 胜;若B 掷出和为7点,则B 胜.求A ,B 获胜的概率.A 在一次投掷时掷出和为6的概率36/5=A p ,而B 在一次投掷时掷出和为7的概率6/136/6==B p .记B B A A p q p q -=-=1,1,又记i e 为在第1i -次投掷完时A ,B 都未取胜,求在这一条件下A 最终取胜的概率.利用全概率公式,并注意到约定的投掷次序,可以列出方程组:14433221,,,e q p e e q e e q e e q p e A A B B A A +===+=.由此容易得出略小于1/2.故此赌法对A 不利.机遇博弈在概率概念的产生及其运算规则的建立中,起了主导的作用.这一点不应当使人感到奇怪:虽说机遇无时不在,但要精确到数量上去考虑,在几百年前那种科学水平之下,只有在像掷骰子这类很简单的情况下才有可能.但这门学科建立后,既脱离赌博的范围又找到了多方面的应用.这也是一个有趣的例子,表明一种看似无益的活动(如赌博),可以产生对人类文明极有价值的副产物.把概率论由局限于对赌博机遇的讨论拓展出去的转折点和标志,应是1713年伯努利划时代著作《推测术》的出版,是在惠更斯的《机遇的规律》出版后56年.惠更斯这一著作,内容基本上限于掷骰子等赌博中出现各种情况的概率的计算,而伯努利这本著作不仅对以前的成果作了总结和发挥,更提出了“大数定律”这个无论从理论和应用角度看都有着根本重要性的命题,可以说其影响一直到今日而不衰.其对数理统计学的发展也有不可估量的影响,许多统计方法和理论都是建立在大数定律的基础上.有的概率史家认为,这本著作的出版,标志着概率概念漫长的形成过程的终结与数学概率论的开端.假定有一个事件A ,根据某种理论,我们算出其概率为p A P =)(.这理论是否正确呢?一个检验的方法就是通过实际观察,看其结果与此理论的推论——p A P =)(是否符合.或者,一开始我们根本就不知道)(A P 等于多少,而希望通过实际观察去估计其值.这些包含了数理统计学中两类重要问题——检验与估计.这个检验与估计概率p 的问题,是数理统计学中最常见、最基本的两个问题.要构造具体例子,最方便的做法是使用古典概率模型.拿一个缸子,里面装有大小、质地一样的球b a +个,其中白球a 个,黑球b 个.这时,随机从缸中抽出一球(意指各球有同等可能被抽出),则“抽出之球为白球”这事件A 有概率)/(b a a p +=.如果不知道a ,b 的比值,则p 也不知道.但我们可以反复从此缸内抽球(每次抽出记下其颜色后再放回缸中).设抽了N 次,发现白球出现N X 次,则用N X N /去估计p .这个估计含有一定程度不确定的误差,但我们直观上会觉得,抽取次数N 愈大,误差一般会愈小.这一点如伯努利所说:“哪怕最愚笨的人,也会经由他的本能,不需他人的教诲而理解的”.但对这个命题却无人能给出一个严格的理论证明.伯努利决心着手解决这个问题,其结果导致了以他的名字命名的大数定律的发现.这个发现对概率论和数理统计学有极重大的意义.伯努利把这一研究成果写在他的著作《推测术》的第四部分中,是该著作的精华部分.由于该书在概率统计史上的重要意义,在此对伯努利其人及此书的整个面貌先做一点介绍.4. 伯努利的《推测术》伯努利1654年出生于瑞士巴塞尔.在其家族成员中,对数学各方面做出过不同程度贡献的至少有12人,在概率论方面有5人,其中杰出的除他本人外,还有其弟弟约翰与侄儿尼科拉斯.伯努利的父亲为其规划的人生道路是神职人员.但他的爱好却是数学.他对数学的贡献除概率论外,还包括微积分、微分方程和变分法等.后者包括著名的悬链线问题.他和牛顿、莱布尼兹是同时代人,并与后者有密切的通信联系,因而非常了解当时新兴的微积分学的进展,学者们认为他在这方面的贡献,是牛、莱之下的第一人.此外,他对物理学和力学也做出过贡献.他与惠更斯长期保持通信联系,仔细阅读过惠更斯的《机遇的规律》,由此引发了他对概率论的兴趣.从他与莱布尼兹的通信中,可知他写《推测术》这一著作是在他生命的最后两年.在1705年他去世时,此书尚未整理定稿.由于家族内部的问题,整理和出版遗稿的工作,迟迟未能实现.先是其遗孀因对其弟约翰的不信任,不愿把整理和出版的事委托给他,后来又拒绝了欧洲一位富有学者捐资出版的建议.最后在莱布尼兹的敦促下,才决定由其侄儿尼科拉斯来负责这件事情.尼科拉斯也是当时重要的数学家,与欧拉和莱布尼兹保持通信联系.当时尚无科学期刊,学者的通信是学术交流的一种重要方式.《推测术》一书共239页,分四个部分.第一部分(P 2~71)对《机遇的规律》一书作了详细的注解,总量比惠更斯的原书长4倍.第二部分(P 72~137)是关于排列组合的系统的论述.第三部分(P 138~209)利用前面的知识,讨论了一些使用骰子等的赌博问题.第四部分(P 210~239)是关于概率论在社会、道德和经济等领域中的应用,其中包括了该书的精华、奠定了概率史上不朽地位的,以其名字命名的“伯努利大数定律”——大数定律的名称不是出自该书,首见于泊松1837年的一篇著作中.该书若缺了这一部分,则很可能会像某些早期概率论著作那样湮没无闻,或至多作为一本一般著作被人评价.该书最后有一长为35页的附录,用与友人通信的形式讨论网球比赛中计分问题.5. 伯努利大数定律现在我们来介绍伯努利《推测术》中最重要的部分——包含了如今被称之为“伯努利大数定律”的第四部分.回到前面的缸中抽球模型:缸中有大小、质地一样的球b a +个,其中白球a 个,黑球b 个,“抽出之球为白球”的概率为p ,则有)/(b a a p +=.假设有放回地从缸中抽球N 次,记N X 为抽到白球的次数,以N X N /估计p .这种估计法现今仍是数理统计学中最基本的方法之一.此处的条件是,每次抽取时都要保证缸中b a +个球的每一个有同等机会被抽出,但这一点在实践中并不见得容易保证.例如,产生中奖号码时可能要用复杂的装置.在实际工作中,统计学家有时用一种叫做“随机数表”的工具.这是一本很厚的书,各页按行、列排列着数字9,,2,1,0 ,它们是用据说是“充分随机”的方法产生的.在使用时,“随机地”翻到一页并随机地点到一个位置,以此处的数字确定抽出的对象.伯努利企图证明的是:用N X N /估计p 可以达到事实上的确定性——他称为道德确定性.其确切含义是:任意给定两个数0>ε和0>η,总可以取足够大的抽样次数N ,使事件{}ε>-|)/(|p N X N 的概率不超过η.这意思就很显然:ε>-|)/(|p N X N 表明估计误差未达到指定的接近程度ε,但这种情况发生的可能性可以“随心所欲地小”(代价是加大N ).为忠实于伯努利的表达形式,应指出两点:一是伯努利把ε限定于1)(-+b a ,虽然其证明对一般ε也有效.但他做这一模型限定与所用缸子模型的特殊性有关:必要时把缸中的白、黑球分别改为ra 和rb 个,则p 不变,1)(-+b a 改为1)(-+rb ra ,只须取r 足够大,便可使1)(-+rb ra 任意小.二是伯努利欲证明的是:对任给的0>c ,只要抽取次数足够大,就可使⎭⎬⎫⎩⎨⎧>->⎭⎬⎫⎩⎨⎧≤-εεp N X cP p N X P N N . (5)这与前面所说是一回事.因为由上式得.11c p N X P N +<⎭⎬⎫⎩⎨⎧>-ε (6)取c 充分大,可使(6)式右边小于η.另外要指出的是:伯努利使用的这个缸子模型使被估计的p 值只能取有理数,因而有损于结果的普遍性.但其证明对任意的p 成立,故这一细节并不重要.伯努利上述对事实上确定性数学的理解,即(5)式,有一个很值得赞赏的地方,即他在概率论的发展刚刚起步的阶段,就给出了问题的一个适当的提法.因为,既然我们欲证明的是当N 充分大时,N X N /和p 可以任意接近,则一个看来更直截了当的提法是,lim p N X N N =∞→ (7)而这不可能实现.因为原则上不能排除“每次抽到白球”的可能性,这时N X N /总为1,不能收敛到1<p .或者退一步:要求(7)式成立的概率为1,这一结论是对的,但直到1909年才由波莱尔给予证明,证明的难度比伯努利的提法大得多.设想一下,如果当时伯努利就采用该提法,他也许在有生之年不能完成这一工作.由于波莱尔的结论比伯努利的结论强,现今人们又把他们的结论分别称之为强大数定律和弱大数定律.6. 泊松公式、泊松分布与泊松大数定律泊松(Possion )的名字对学概率论与数理统计的人来说,可谓耳熟能详.原因主要在于泊松近似公式,以及更重要的是源于该近似公式的泊松分布,泊松分布的重要性和知名度在离散型分布中仅次于二项分布.泊松的另一个重要工作是把伯努利大数定律推广到每次试验中事件发生的概率可以不同的情况,现称泊松大数定律.继狄莫佛给出二项概率近似计算公式(10)之后,丹尼尔和拉普拉斯也给出了二项概率近似计算公式,但这些公式在现今的教科书上已很少提及,只有泊松近似公式则不然,其形式为,!),,(lim k e k p N b k N λλ-∞→= (11)其中Np N ∞→=lim λ,N k ,,2,1,0 =.公式(11)在教科书上通称为泊松逼近公式、泊松近似公式或泊松公式.它是泊松在1838年于《概率在法律审判的应用》一书中所引进,此公式适用于p 很小,N 很大而Np 又不很大时,这正好填补了狄莫佛公式(10)的不足,因后者只适用于p 不太接近于0和1的时候.不过,从历史上看,狄莫佛早在1712年已做出了这个结果.7. 贝叶斯及其传世之作托马斯•贝叶斯(Thomas Bayes,1701-1761)在18世纪上半叶的欧洲学术界,恐怕不能不算是一个很知名的人物.在他生前,没有发表过任何的科学论著.那时,学者之间的私人通信,是传播和交流科学成果的一种重要方式.许多这类信件得以保存下来并发表传世,而成为科学史上的重要文献,例如,前面提到的费尔马和巴斯噶的通信、伯努利与莱布尼兹的通信等.但对贝叶斯来说,这方面材料也不多.在他生前,除在1755年有一封致约翰•康顿的信(其中讨论了辛普森有关误差理论的工作)外,历史上没有记载他与当时的学术界有何重要的交往.但他曾在1742年当选为英国皇家学会会员(相当于科学院院士),因而可以想到,他必定曾以某种方式表现出其学术造诣而被当时的学术界所承认.如今,我们对这个生性孤僻、哲学气味重于数学气味的学术怪杰的了解,是因他的一篇题为“An essay towards solving a problem in the doctrine of chance(机遇理论中一个问题的解)”的遗作.此文发表后很长一个时期在学术界没有引起什么反响,但到20世纪以来突然受到人们的重视,成为贝叶斯学派的奠基石.1958年,国际权威性的统计杂志《Biometrika》(生物计量)重新刊载了这篇文章.此文也有中译本(见廖文等译《贝叶斯统计学——原理、模型及应用》的附录4,中国统计出版社1992年版).此文是他的两篇遗作之一,首次发表于1764年伦敦皇家学会的刊物《Philosophical Transactions》上.此文在贝叶斯生前已写就,为何当时未交付发表,后来的学者有些猜测,但均不足定论.据文献记载,在他逝世之前4个月,他在一封遗书中将此文及100英镑托付给一个叫普莱斯的学者,而贝叶斯当时对此人在何处也不了然.所幸的是,后来普莱斯在贝叶斯的文件中发现了这篇文章,他于1763年12月23日在皇家学会上宣读了此文,并在次年得以发表.发表时普莱斯为此文写了一个有实质内容的前言和附录.据普莱斯说,贝叶斯自己也准备了一个前言.这使人们无法确切区分:哪些思想属于贝叶斯本人,哪些又是普莱斯所附加的.贝叶斯写作此文的动机,说法也不一.一种表面上看来显然的说法是为了解决伯努利和狄莫佛未能解决的、二项分布概率p的“逆概率”问题,因为当时距这两位学者的工作发表后尚不久,有人认为他是受了辛普森误差工作的触动,想为这种问题的处理提供一种新的思想.还有人主张,贝叶斯写作此文,是为了给“第一推动力”的存在提供一个数学证明.这些说法现在都无从考证.上面提到“逆概率”这个名词.在较早的统计学著作中这个名词用得较多,现在已逐渐淡出.顾名思义,它是指“求概率这个问题的逆问题”:已知事件的概率为p,可由之计算某种观察结果出现的概率如何.反过来,给定了观察结果,问由之可以对概率p做出何种推断.推广到极处可以说,“正概率”是由原因推结果,是概率论;“逆概率”是由结果推原因,是数理统计.8. 拉普拉斯的“不充分推理原则”贝叶斯的遗作发表后很长一段时期,都没有得到学术界的注意,因而他的这种思想未能及早地发展成为一种得到广泛应用的统计推断方法.但是,也有些学者独立地朝这个方向思考,提出类似的思想并付诸实用,其中最重要的当属拉普拉斯.拉普拉斯在1774年的一篇文章中提出了所谓的“不充分推理原则”(principle of insufficient reasoning ).他的思想大致如下:如果一个问题中存在若干个不同的原因(cause) n A A A ,,,21 ,则在没有理由认为其中哪一个特别有优势时,概率应各取n /1,即认为各原因有同等机会出现.在统计问题中,这里所说的不同“cause ”n A A A ,,,21 可看作代表未知参数的不同的可能值.以E 记在这原因下可能产生的事件(例如,在某参数值之下观察到的样本),拉普拉斯提出:)|(/)|(i i A E P E A P 与i 无关. (12)用现今熟知的概率论知识很容易证明(12),但拉普拉斯在其文章中用了一个很复杂的证法.拉普拉斯的原则(12)可用于由)|(i A E P 推)|(E A P i ,这与贝叶斯的原则完全一样,也并未超出贝叶斯思想的范围.因此,现在统计学史上也把拉普拉斯视为贝叶斯统计的一个奠基者.9. 勒让德发明最小二乘法勒让德是法国大数学家,在数学的许多领域,包括椭圆、积分、数论和几何等方面,都有重大的贡献.最小二乘法最先出现在他于1805年发表的一本题为《计算彗星轨道的新方法》著作的附录中,该附录占据了这本长达80页著作的最后9页.勒让德在这本书前面几十页关于彗星轨道计算的讨论中没有使用最小二乘法,可见在他刚开始写作时,这一方法尚未在他头脑中成形.历史资料还表明,勒让德在参加测量巴黎子午线长这项工作很久以后还未发现这个方法.考虑到此书发表于1805年且该法出现在书尾的附录中,可以推测他发现这个方法应当在1805年或之前不久的某个时间.勒让德在该书72~75页描述了最小二乘法的思想、具体做法及方法的优点.他提到:使误差平方和达到最小,在各方程的误差之间建立了一种平衡,从而防止了某一极端误差(对决定参数的估计值)取得支配地位,而这有助于揭示系统的更接近真实的状态.的确,考察勒让德之前一些学者的做法,都是把立足点放在解出一个线性方程组上.这种做法对于误差在各方程之间的分布的影响如何,是不清楚的.在方法的具体操作上,勒让德指出,为实现20111()n i i ki k i x x x θθ=+++=∑最小而对各i θ求偏导数所形成的线性方程组⎪⎪⎩⎪⎪⎨⎧=====+∑∑==.,,1,,,1,0,,,,1,0110k j k r x x s k j s n i ji ri rj kr j r rj θθ (13)只涉及简单的加、乘运算,至于解线性方程组,这是当时已知的其他方法也难免的.现今我们把(13)叫做正则方程组,这是后来高斯引进的称呼.关于最小二乘法的优点,勒让德指出了以下几条:第一,通常的算术平均值是其一特例.第二,如果观察值全部严格符合某一线性方程,则这个方程必是最小二乘法的解.第三,如果在事后打算弃置某些观察值不用或增加新的观察值,对正则方程组的修改易于完成.从现在的观点看,这方法只涉及解线性方程组是其最重要的优点之一(其他的重要优点包括此法在统计推断上的一些优良性质,以及其广泛的适用性).近年发展起来的,从最小二乘法衍生出的其他一些方法,尽管在理论上有其优点,可是由于计算上的困难而影响了其应用.最小二乘法在19世纪初发明后,很快得到了欧洲一些国家的天文和地测学工作者的广泛使用.据不完全统计,自1805年至1864年的60年期间,有关这一方法的研究论文约250篇,一些百科全书,包括1837年出版的《不列颠百科全书》(第7版),都收进了有关这个方法的介绍.在研究论文中,有一些是关于。
数学家小故事十则

数学家小故事十则一蒲丰一天,法国数学家蒲丰请许多朋友到家里,做了一次试验.蒲丰在桌子上铺好一张大白纸,白纸上画满了等距离的平行线,他又拿出很多等长的小针,小针的长度都是平行线的一半.蒲丰说:“请大家把这些小针往这张白纸上随便仍吧!”客人们按他说的做了。
蒲丰的统计结果是:大家共掷2212次,其中小针与纸上平行线相交704次,2210÷704≈3.142。
蒲丰说:“这个数是π的近似值。
每次都会得到圆周率的近似值,而且投掷的次数越多,求出的圆周率近似值越精确。
”这就是著名的“蒲丰试验”。
二高斯高斯是位小学二年级的学生,有一天他的数学老师因为事情已处理了一大半,虽然上课了,仍希望将其完成,因此打算出一题数学题目给学生练习,他的题目是:1+2+3+4+5+6+7+8+9+10=?,因为加法刚教不久,所以老师觉得出了这题,学生肯定是要算蛮久的,才有可能算出来,也就可以藉此利用这段时间来处理未完的事情,但是才一转眼的时间,高斯已停下了笔,闲闲地坐在那里,老师看到了很生气的训斥高斯,但是高斯却说他已经将答案算出来了,就是55,老师听了下了一跳,就问高斯如何算出来的,高斯答道,我只是发现1和10的和是11、2和9的和也是11、3和8的和也是11、4和7的和也是11、5和6的和还是11,又11+11+11+11+11=55,我就是这么算的。
高斯长大后,成为一位很伟大的数学家。
高斯小的时候能将难题变成简易,当然资质是很大的因素,但是他懂得观察,寻求规则,化难为简,却是值得我们学习与效法的。
三笛卡儿笛卡儿最杰出的成就是在数学发展上创立了解析几何学。
在笛卡儿时代,代数还是一个比较新的学科,几何学的思维还在数学家的头脑中占有统治地位。
笛卡儿致力于代数和几何联系起来的研究,于1637年,在创立了坐标系后,成功地创立了解析几何学。
他的这一成就为微积分的创立奠定了基础。
解析几何直到现在仍是重要的数学方法之一。
四冯·诺依曼20世纪最杰出的数学家之一的冯·诺依曼。
两个统计小故事

两个统计小故事
这两个故事都发作在二战时期,并且都是盟军方面机智的统计学家,数学在二战时期充任了十分重要的角色,明天说的是统计。
第一个故事发作在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不活期地对英国狂轰乱炸,后来英国空军开展起来,双方空战不时。
为了可以提高飞机的防护才干,英国的飞机设计师们决议给飞机添加护甲,但是设计师们并不清楚应该在什么中央添加护甲,于是求助于统计学家。
统计学家将每架中弹之后依然平安返航的飞机的中弹部位描画在一张图上,然后将一切中弹飞机的图都叠放在一同,这样就构成了稀疏不同的弹孔散布。
任务完成了,然后统计学家很一定地说没有弹孔的中央就是应该添加护甲的中央,由于这个部位中弹的飞机都没能幸免于难。
第二个故事与德国坦克有关。
我们知品德国的坦克战在二战前期占了很多廉价,直到后来,苏联的坦克才干和德国坦克一拼上下,坦克数量作为德军的主要作战力气的数据是盟军十分希望取得的情报,有很多盟军特工的义务就是窃取德军坦克总量情报。
但是依据战后所取得的数据,真正牢靠的情报不是来源于盟军特工,而是统计学家。
统计学家做了什么事情呢?这和德军制造坦克的惯例有关,德军坦克在出厂之后按消费的先后顺序编号,1,2,…,N,这是一个十分古板的传统,正是由于这个传统,德军送给了盟军统计学家需求的数据。
盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,如今统计学家需求在这些编号的基础上估量N,也就是德军的坦克总量,而这经过一定的统计工具就可以完成。
看过这两个故事,同窗们是不是对统计有了更大的兴味?。
和统计有关的10个小故事知音

和统计有关的10个小故事知音统计是一项重要的工作,它可以帮助人们了解世界、做出决策和规划未来。
在各行各业中,统计都扮演着重要角色。
下面我们将通过10个小故事,来了解统计在日常生活中的应用。
第一个故事发生在一家大型超市。
这家超市想要了解顾客们对新推出的产品的反应,于是他们进行了一次问卷调查。
通过对收集到的数据进行分析,他们得出了顾客们的满意度,并且做出了相应的调整。
这个故事告诉我们,统计可以帮助企业了解市场需求,从而做出更好的经营决策。
第二个故事发生在医院里。
一名医生想要了解某种药物对患者的治疗效果,于是他进行了一项临床试验,并对实验结果进行了统计分析。
通过统计,医生得出了该药物的疗效,并且为患者的治疗提供了参考依据。
这个故事告诉我们,统计可以帮助医生进行科学的医疗决策,提高治疗效果。
第三个故事发生在学校里。
一名老师希望了解学生们的学习情况,于是她进行了一次考试,并对成绩进行了统计分析。
通过统计,老师得知了学生们的学习水平,并且可以根据统计结果进行有针对性的教学。
这个故事告诉我们,统计可以帮助老师了解学生,提高教学质量。
第四个故事发生在政府部门。
一家政府部门希望了解市民对某项政策的满意度,于是他们进行了一次问卷调查,并对数据进行了统计分析。
通过统计,政府部门得出了市民对政策的态度,并且可以根据统计结果进行政策调整。
这个故事告诉我们,统计可以帮助政府了解民意,制定更好的政策。
第五个故事发生在科研领域。
一名科学家希望了解某种新发现的规律,于是他进行了一系列实验,并对实验数据进行了统计分析。
通过统计,科学家得出了新的规律,并且可以为进一步的研究提供指导。
这个故事告诉我们,统计可以帮助科学家发现新知识,推动科学进步。
第六个故事发生在金融行业。
一家投资公司希望了解股市的走势,于是他们对股票数据进行了统计分析。
通过统计,投资公司可以了解股市的变化趋势,并且可以做出相应的投资决策。
这个故事告诉我们,统计可以帮助投资者找到投资机会,获得更好的投资回报。
数学故事《统计分析》

数学故事《统计分析》数学故事:《统计分析》摘要本文通过一个有趣的故事介绍统计分析的概念和方法。
故事以两位主人公小明和小红的研究项目展开,他们分别收集了一组数据,并利用统计分析方法对数据进行了深入的分析和解读。
本文旨在帮助读者了解统计分析的基本原理,掌握常用的统计分析方法,并能够将这些方法应用到实际问题中。
故事背景小明和小红是同一所大学的研究生,他们分别选择了不同的研究方向进行研究。
小明的研究方向是心理学,他收集了一组关于人们消费惯的数据;小红的研究方向是生物学,她收集了一组关于植物生长的数据。
他们希望通过对这些数据的统计分析,得出有意义的结论。
统计分析方法描述性统计分析描述性统计分析是对数据进行概括和描述的方法。
小明和小红首先对收集的数据进行了描述性统计分析。
他们计算了数据的平均值、中位数、众数等统计量,并对数据进行了图表展示,如条形图、折线图等。
通过描述性统计分析,他们可以对数据的整体分布和特征有一个初步的了解。
推断性统计分析推断性统计分析是基于描述性统计分析的结果,对总体数据进行推断和预测的方法。
小明和小红利用推断性统计分析方法,对数据进行了假设检验和置信区间估计。
他们提出了研究假设,并利用样本数据进行了假设检验,以判断研究假设是否成立。
同时,他们还计算了置信区间,以估计总体参数的可信范围。
通过推断性统计分析,他们可以对研究问题进行更深入的探讨和解释。
回归分析回归分析是研究两个或多个变量之间关系的方法。
小明和小红利用回归分析方法,研究了消费惯与其他因素之间的关系。
他们选择了消费金额作为因变量,其他可能影响消费的因素作为自变量,建立了回归模型。
通过回归分析,他们可以了解不同自变量对消费金额的影响程度,并得出相应的结论。
方差分析方差分析是研究多个组别之间差异的方法。
小明和小红利用方差分析方法,比较了不同人群在消费惯上的差异。
他们将人群分为两个组别,分别是一般消费者和重度消费者,并计算了两个组别在消费金额上的方差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这两个故事都发生在二战期间,并且都是盟军方面机智的统计学家,数学在二战期间充当了十分重要的角色,今天说的是统计。
第一个故事发生在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期地对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。
为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是求助于统计学家。
统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。
工作完成了,然后统计学家很肯定地说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。
第二个故事与德国坦克有关。
我们知道德国的坦克战在二战前期占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下,坦克数量作为德军的主要作战力量的数据是盟军非常希望获得的情报,有很多盟军特工的任务就是窃取德军坦克总量情报。
然而根据战后所获得的数据,真正可靠的情报不是来源于盟军特工,而是统计学家。
统计学家做了什么事情呢?这和德军制造坦克的惯例有关,德军坦克在出厂之后按生产的先后顺序编号,1,2,,N,这是一个十分古板的传统,正是因为这个传统,德军送给了盟军统计学家需要的数据。
盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,现在统计学家需要在这些编号的基础上估计N,也就是德军的坦克总量,而这通过一定的统计工具就可以实现。
看过这两个故事,同学们是不是对统计有了更大的兴趣?。