概率论与数理统计的发展

合集下载

数理统计学的发展历程

数理统计学的发展历程

数理统计学的发展历程数理统计学是伴随着概率论的发展而发展起来的。

19世纪中叶以前已出现了若干重要的工作,如C.F.高斯和A.M.勒让德关于观测数据误差分析和最小二乘法的研究。

到19世纪末期,经过包括K.皮尔森在内的一些学者的努力,这门学科已开始形成。

但数理统计学发展成一门成熟的学科,则是20世纪上半叶的事,它在很大程度上要归功于K.皮尔森、R.A.费希尔等学者的工作。

特别是费希尔的贡献,对这门学科的建立起了决定性的作用。

1946年H.克拉默发表的《统计学数学方法》是第一部严谨且比较系统的数理统计著作,可以把它作为数理统计学进入成熟阶段的标志。

数理统计学的发展大致可分3个时期。

第一时期20 世纪以前。

这个时期又可分成两段,大致上可以把高斯和勒让德关于最小二乘法用于观测数据的误差分析的工作作为分界线,前段属萌芽时期,基本上没有超出描述性统计量的范围。

后一阶段可算作是数理统计学的幼年阶段。

首先,强调了推断的地位,而摆脱了单纯描述的性质。

由于高斯等的工作揭示了正态分布的重要性,学者们普遍认为,在实际问题中遇见的几乎所有的连续变量,都可以满意地用正态分布来刻画。

这种观点使关于正态分布的统计得到了深入的发展,但延缓了非参数统计的发展。

19世纪末,K.皮尔森给出了以他的名字命名的分布,并给出了估计参数的一种方法——矩法估计。

德国的F.赫尔梅特发现了统计上十分重要的x2 分布。

第二时期20世纪初到第二次世界大战结束。

这是数理统计学蓬勃发展达到成熟的时期。

许多重要的基本观点和方法,以及数理统计学的主要分支学科,都是在这个时期建立和发展起来的。

这个时期的成就,包含了至今仍在广泛使用的大多数统计方法。

在其发展中,以英国统计学家、生物学家费希尔为代表的英国学派起了主导作用。

第三时期战后时期。

这一时期中,数理统计学在应用和理论两方面继续获得很大的进展。

概率论与数理统计的起源与发展

概率论与数理统计的起源与发展

概率论与数理统计的起源与发展概率论产生于十七世纪,本来是有保险事业的发展而产生的,但是来自于赌博者的请求,却是数学家们思考概率论中问题的源泉。

早在1654年,意大利医生兼数学家卡当,据说曾大量地进行过赌博。

他在赌博时研究不输的方法,实际是概率论的萌芽。

在那个时代,虽然概率论的萌芽有些进展,但还没有出现真正的概率论。

十七世纪中叶,法国贵族德·美黑在骰子赌博中,由于有要急近处理的事情必须中途停止赌博,要靠对胜负的预测把赌资进行合理的分配,但不知用什么样的比例分配才算合理,于是就写信向当时法国的最高数学家帕斯卡请教。

正是这封信使概率论向前迈出了第一步。

帕斯卡和当时第一流的数学家费尔玛一起,研究了德·美黑提出的关于骰子赌博的问题。

于是,一个新的数学分支--概率论登上了历史舞台。

三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯企图自己解决这一问题,结果写成了《论机会游戏的计算》一书,这就是最早的概率论著作。

在概率问题早期的研究中,逐步建立了事件、概率和随机变量等重要概念以及它们的基本性质。

后来由于许多社会问题和工程技术问题,如:人口统计、保险理论、天文观测、误差理论、产品检验和质量控制等。

这些问题的提法,均促进了概率论的发展,从17世纪到19世纪,贝努利、隶莫弗、拉普拉斯、高斯、普阿松、切贝谢夫、马尔可夫等著名数学家都对概率论的发展做出了杰出的贡献。

在这段时间里,概率论的发展简直到了使人着迷的程度。

但是,随着概率论中各个领域获得大量成果,以及概率论在其他基础学科和工程技术上的应用,由拉普拉斯给出的概率定义的局限性很快便暴露了出来,甚至无法适用于一般的随机现象。

因此可以说,到20世纪初,概率论的一些基本概念,诸如概率等尚没有确切的定义,概率论作为一个数学分支,缺乏严格的理论基础。

概率论的第一本专著是1713年问世的雅各·贝努利的《推测术》。

经过二十多年的艰难研究,贝努利在该树种,表述并证明了著名的"大数定律"。

概率论与数理统计发展史简要、主要内容概要及其主要应用

概率论与数理统计发展史简要、主要内容概要及其主要应用

概率论与数理统计是一门研究随机现象和数据分析的学科。

以下是关于概率论与数理统计发展史、主要内容概要以及其主要应用的简要介绍:发展史概率论与数理统计是数学的重要分支之一,其发展可以追溯到17世纪。

以下是一些重要的里程碑事件:- 1654年,法国贵族帕斯卡尔引入概率论的基本概念。

- 18世纪,瑞士数学家伯努利家族对概率论做出了系统的研究,并提出伯努利试验和大数定律。

- 19世纪,法国数学家拉普拉斯在概率论方面有很多重要贡献,提出了拉普拉斯公式和拉普拉斯逼近定理。

-20世纪,俄国数学家科尔莫哥洛夫发展了现代概率论的基本框架,建立起了测度论和概率测度的数学基础。

主要内容概要概率论研究随机现象的规律性和不确定性,主要包括以下几个方面的内容:1. 概率基本概念:包括样本空间、事件、随机变量等。

2. 概率分布:研究随机变量的取值及其对应的概率。

3. 大数定律:研究随机变量序列的稳定性,指出当样本容量足够大时,随机现象的长期平均值收敛于期望值的概率趋近于1。

4. 中心极限定理:研究多个相互独立的随机变量之和的分布趋近于正态分布的概率。

数理统计是利用样本数据对总体特征进行推断和决策的学科,主要内容如下:1. 抽样方法:研究如何从总体中获取代表性样本的方法。

2. 统计描述:通过统计量对总体特征进行度量和描述。

3. 参数估计:利用样本数据对总体参数进行估计。

4. 假设检验:根据样本数据对关于总体的假设进行推断和判断。

5. 方差分析和回归分析:研究多个变量之间的关系和影响。

主要应用概率论与数理统计具有广泛的应用领域,涉及自然科学、社会科学、工程技术等众多领域,包括但不限于以下方面:1. 金融和风险管理:用于分析投资组合的风险、金融市场波动性的预测和金融产品的定价。

2. 医学和生物统计学:应用于疾病概率分析、药物疗效评估和流行病学研究等。

3. 工程和质量控制:用于产品质量分析、过程改进和可靠性评估。

4. 社会科学和市场调查:用于样本调查、舆论调查和社会现象的分析。

统计学发展历程简述

统计学发展历程简述

统计学发展历程简述
统计学是一门通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。

其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。

据权威统计学史记载,从17世纪开始就有了“政治算术”、“国势学”,即初级的社会统计学,起源于英国、德国。

几乎同时在意大利出现了“赌博数学”,即初级的概率论。

直到19世纪,由于概率论出现了大数定理和误差理论,才形成了初级的数理统计学。

也就是说,社会统计学的形成早于数理统计学两个世纪。

由于社会统计学广泛地用于经济和政治,所以得到各国历届政府的极大重视,并得到系统的发展。

而数理统计在20世纪40年代以后,由于概率论的发展,而得到飞速发展。

经过近400年的变迁,目前世界上已形成社会统计学和数理统计学两大体系。

两体系争论不休,难分伯仲。

概率论与数理统计发展史

概率论与数理统计发展史

概率论与数理统计发展简史姓名:苗壮班级:1108105指导教师:曹莉摘要:在这里,我们将简略地回顾一下概率论与数理统计的发展史,包括发展过程中所经历的一些大事,以及对这门学科的创立和发展有特别重大影响的那些学者的贡献.关键词:概率论、数理统计、发展史正文:1.概率论的发展17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论.早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大的赌博次数会呈现一定的规律性,卡丹诺为此还写了一本《论赌博》的小册子,书中计算了掷两颗骰子或三颗骰子时,在一切可能的方法中有多少方法得到某一点数.据说,曾与卡丹诺在三次方程发明权上发生争论的塔尔塔里亚,也曾做过类似的实验.促使概率论产生的强大动力来自社会实践.首先是保险事业.文艺复兴后,随着航海事业的发展,意大利开始出现海上保险业务.16世纪末,在欧洲不少国家已把保险业务扩大到其它工商业上,保险的对象都是偶然性事件.为了保证保险公司赢利,又使参加保险的人愿意参加保险,就需要根据对大量偶然现象规律性的分析,去创立保险的一般理论.于是,一种专门适用于分析偶然现象的数学工具也就成为十分必要了.不过,作为数学科学之一的概率论,其基础并不是在上述实际问题的材料上形成的.因为这些问题的大量随机现象,常被许多错综复杂的因素所干扰,它使难以呈“自然的随机状态”.因此必须从简单的材料来研究随机现象的规律性,这种材料就是所谓的“随机博弈”.在近代概率论创立之前,人们正是通过对这种随机博弈现象的分析,注意到了它的一些特性,比如“多次实验中的频率稳定性”等,然后经加工提炼而形成了概率论.荷兰数学家、物理学家惠更斯(Huygens)于1657年发表了关于概率论的早期着作《论赌博中的计算》.在此期间,法国的费尔马(Fermat)与帕斯卡(Pascal)也在相互通信中探讨了随机博弈现象中所出现的概率论的基本定理和法则.惠更斯等人的工作建立了概率和数学期望等主要概念,找出了它们的基本性质和演算方法,从而塑造了概率论的雏形.18世纪是概率论的正式形成和发展时期.1713年,贝努利(Bernoulli)的名着《推想的艺术》发表.在这部着作中,贝努利明确指出了概率论最重要的定律之一――“大数定律”,并且给出了证明,这使以往建立在经验之上的频率稳定性推测理论化了,从此概率论从对特殊问题的求解,发展到了一般的理论概括.继贝努利之后,法国数学家棣谟佛(AbrahamdeMoiver)于1781年发表了《机遇原理》.书中提出了概率乘法法则,以及“正态分”和“正态分布律”的概念,为概率论的“中心极限定理”的建立奠定了基础.1706年法国数学家蒲丰(ComtedeBuffon)的《偶然性的算术试验》完成,他把概率和几何结合起来,开始了几何概率的研究,他提出的“蒲丰问题”就是采取概率的方法来求圆周率π的尝试.通过贝努利和棣谟佛的努力,使数学方法有效地应用于概率研究之中,这就把概率论的特殊发展同数学的一般发展联系起来,使概率论一开始就成为数学的一个分支.概率论问世不久,就在应用方面发挥了重要的作用.牛痘在欧洲大规模接种之后,曾因副作用引起争议.这时贝努利的侄子丹尼尔·贝努利(DanielBernoulli)根据大量的统计资料,作出了种牛痘能延长人类平均寿命三年的结论,消除了一些人的恐惧和怀疑;欧拉(Euler)将概率论应用于人口统计和保险,写出了《关于死亡率和人口增长率问题的研究》,《关于孤儿保险》等文章;泊松(Poisson)又将概率应用于射击的各种问题的研究,提出了《打靶概率研究报告》.总之,概率论在18世纪确立后,就充分地反映了其广泛的实践意义.19世纪概率论朝着建立完整的理论体系和更广泛的应用方向发展.其中为之作出较大贡献的有:法国数学家拉普拉斯(Laplace),德国数学家高斯(Gauss),英国物理学家、数学家麦克斯韦(Maxwell),美国数学家、物理学家吉布斯(Gibbs)等.概率论的广泛应用,使它于18和19两个世纪成为热门学科,几乎所有的科学领域,包括神学等社会科学都企图借助于概率论去解决问题,这在一定程度上造成了“滥用”的情况,因此到19世纪后半期时,人们不得不重新对概率进行检查,为它奠定牢固的逻辑基础,使它成为一门强有力的学科.1917年苏联科学家伯恩斯坦首先给出了概率论的公理体系.1933年柯尔莫哥洛夫又以更完整的形式提出了概率论的公理结构,从此,更现代意义上的完整的概率论臻于完成.相对于其它许多数学分支而言,数理统计是一个比较年轻的数学分支.多数人认为它的形成是在20世纪40年代克拉美(H.Carmer)的着作《统计学的数学方法》问世之时,它使得1945年以前的25年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方面的工作结合起来,从而形成数理统计这门学科.它是以对随机现象观测所取得的资料为出发点,以概率论为基础来研究随机现象的一门学科,它有很多分支,但其基本内容为采集样本和统计推断两大部分.发展到今天的现代数理统计学,又经历了各种历史变迁.2.统计的发展统计的早期开端大约是在公元前1世纪初的人口普查计算中,这是统计性质的工作,但还不能算作是现代意义下的统计学.到了18世纪,统计才开始向一门独立的学科发展,用于描述表征一个状态的条件的一些特征,这是由于受到概率论的影响.高斯从描述天文观测的误差而引进正态分布,并使用最小二乘法作为估计方法,是近代数理统计学发展初期的重大事件,18世纪到19世纪初期的这些贡献,对社会发展有很大的影响.例如,用正态分布描述观测数据后来被广泛地用到生物学中,其应用是如此普遍,以至在19世纪相当长的时期内,包括高尔顿(Galton)在内的一些学者,认为这个分布可用于描述几乎是一切常见的数据.直到现在,有关正态分布的统计方法,仍占据着常用统计方法中很重要的一部分.最小二乘法方面的工作,在20世纪初以来,又经过了一些学者的发展,如今成了数理统计学中的主要方法.从高斯到20世纪初这一段时间,统计学理论发展不快,但仍有若干工作对后世产生了很大的影响.其中,如贝叶斯(Bayes)在1763年发表的《论有关机遇问题的求解》,提出了进行统计推断的方法论方面的一种见解,在这个时期中逐步发展成统计学中的贝叶斯学派(如今,这个学派的影响愈来愈大).现在我们所理解的统计推断程序,最早的是贝叶斯方法,高斯和拉普拉斯应用贝叶斯定理讨论了参数的估计法,那时使用的符号和术语,至今仍然沿用.再如前面提到的高尔顿在回归方面的先驱性工作,也是这个时期中的主要发展,他在遗传研究中为了弄清父子两辈特征的相关关系,揭示了统计方法在生物学研究中的应用,他引进回归直线、相关系数的概念,创始了回归分析.数理统计学发展史上极重要的一个时期是从19世纪到二次大战结束.现在,多数人倾向于把现代数理统计学的起点和达到成熟定为这个时期的始末.这确是数理统计学蓬勃发展的一个时期,许多重要的基本观点、方法,统计学中主要的分支学科,都是在这个时期建立和发展起来的.以费歇尔(R.A.Fisher)和皮尔逊(K.Pearson)为首的英国统计学派,在这个时期起了主导作用,特别是费歇尔.继高尔顿之后,皮尔逊进一步发展了回归与相关的理论,成功地创建了生物统计学,并得到了“总体”的概念,1891年之后,皮尔逊潜心研究区分物种时用的数据的分布理论,提出了“概率”和“相关”的概念.接着,又提出标准差、正态曲线、平均变差、均方根误差等一系列数理统计基本术语.皮尔逊致力于大样本理论的研究,他发现不少生物方面的数据有显着的偏态,不适合用正态分布去刻画,为此他提出了后来以他的名字命名的分布族,为估计这个分布族中的参数,他提出了“矩法”.为考察实际数据与这族分布的拟合分布优劣问题,他引进了着名“χ2检验法”,并在理论上研究了其性质.这个检验法是假设检验最早、最典型的方法,他在理论分布完全给定的情况下求出了检验统计量的极限分布.1901年,他创办了《生物统计学》,使数理统计有了自己的阵地,这是20世纪初叶数学的重大收获之一.1908年皮尔逊的学生戈赛特(Gosset)发现了Z的精确分布,创始了“精确样本理论”.他署名“Student”在《生物统计学》上发表文章,改进了皮尔逊的方法.他的发现不仅不再依靠近似计算,而且能用所谓小样本进行统计推断,并使统计学的对象由集团现象转变为随机现象.现“Stu dent分布”已成为数理统计学中的常用工具,“Student氏”也是一个常见的术语.英国实验遗传学家兼统计学家费歇尔,是将数理统计作为一门数学学科的奠基者,他开创的试验设计法,凭借随机化的手段成功地把概率模型带进了实验领域,并建立了方差分析法来分析这种模型.费歇尔的试验设计,既把实践带入理论的视野内,又促进了实践的进展,从而大量地节省了人力、物力,试验设计这个主题,后来为众多数学家所发展.费歇尔还引进了显着性检验的概念,成为假设检验理论的先驱.他考察了估计的精度与样本所具有的信息之间的关系而得到信息量概念,他对测量数据中的信息,压缩数据而不损失信息,以及对一个模型的参数估计等贡献了完善的理论概念,他把一致性、有效性和充分性作为参数估计量应具备的基本性质.同时还在1912年提出了极大似然法,这是应用上最广的一种估计法.他在20年代的工作,奠定了参数估计的理论基础.关于χ2检验,费歇尔1924年解决了理论分布包含有限个参数情况,基于此方法的列表检验,在应用上有重要意义.费歇尔在一般的统计思想方面也作出过重要的贡献,他提出的“信任推断法”,在统计学界引起了相当大的兴趣和争论,费歇尔给出了许多现代统计学的基础概念,思考方法十分直观,他造就了一个学派,在纯粹数学和应用数学方面都建树卓越.这个时期作出重要贡献的统计学家中,还应提到奈曼(J.Neyman)和皮尔逊(E.Pearson).他们在从1928年开始的一系列重要工作中,发展了假设检验的系列理论.奈曼-皮尔逊假设检验理论提出和精确化了一些重要概念.该理论对后世也产生了巨大影响,它是现今统计教科书中不可缺少的一个组成部分,奈曼还创立了系统的置信区间估计理论,早在奈曼工作之前,区间估计就已是一种常用形式,奈曼从1934年开始的一系列工作,把区间估计理论置于柯尔莫哥洛夫概率论公理体系的基础之上,因而奠定了严格的理论基础,而且他还把求区间估计的问题表达为一种数学上的最优解问题,这个理论与奈曼-皮尔逊假设检验理论,对于数理统计形成为一门严格的数学分支起了重大作用.以费歇尔为代表人物的英国成为数理统计研究的中心时,美国在二战中发展亦快,有三个统计研究组在投弹问题上进行了9项研究,其中最有成效的哥伦比亚大学研究小组在理论和实践上都有重大建树,而最为着名的是首先系统地研究了“序贯分析”,它被称为“30年代最有威力”的统计思想.“序贯分析”系统理论的创始人是着名统计学家沃德(Wald).他是原籍罗马尼亚的英国统计学家,他于1934年系统发展了早在20年代就受到注意的序贯分析法.沃德在统计方法中引进的“停止规则”的数学描述,是序贯分析的概念基础,并已证明是现代概率论与数理统计学中最富于成果的概念之一.从二战后到现在,是统计学发展的第三个时期,这是一个在前一段发展的基础上,随着生产和科技的普遍进步,而使这个学科得到飞速发展的一个时期,同时,也出现了不少有待解决的大问题.这一时期的发展可总结如下:一是在应用上愈来愈广泛,统计学的发展一开始就是应实际的要求,并与实际密切结合的.在二战前,已在生物、农业、医学、社会、经济等方面有不少应用,在工业和科技方面也有一些应用,而后一方面在战后得到了特别引人注目的进展.例如,归纳“统计质量管理”名目下的众多的统计方法,在大规模工业生产中的应用得到了很大的成功,目前已被认为是不可缺少的.统计学应用的广泛性,也可以从下述情况得到印证:统计学已成为高等学校中许多专业必修的内容;统计学专业的毕业生的人数,以及从事统计学的应用、教学和研究工作的人数的大幅度的增长;有关统计学的着作和期刊杂志的数量的显着增长.二是统计学理论也取得重大进展.理论上的成就,综合起来大致有两个主要方面:一个方面与沃德提出的“统计决策理论”,另一方面就是大样本理论.沃德是20世纪对统计学面貌的改观有重大影响的少数几个统计学家之一.1950年,他发表了题为《统计决策函数》的着作,正式提出了“统计决策理论”.沃德本来的想法,是要把统计学的各分支都统一在“人与大自然的博奕”这个模式下,以便作出统一处理.不过,往后的发展表明,他最初的设想并未取得很大的成功,但却有着两方面的重要影响:一是沃德把统计推断的后果与经济上的得失联系起来,这使统计方法更直接用到经济性决策的领域;二是沃德理论中所引进的许多概念和问题的新提法,丰富了以往的统计理论.贝叶斯统计学派的基本思想,源出于英国学者贝叶斯的一项工作,发表于他去世后的1763年后世的学者把它发展为一整套关于统计推断的系统理论.信奉这种理论的统计学者,就组成了贝叶斯学派.这个理论在两个方面与传统理论(即基于概率的频率解释的那个理论)有根本的区别:一是否定概率的频率的解释,这涉及到与此有关的大量统计概念,而提倡给概率以“主观上的相信程度”这样的解释;二是“先验分布”的使用,先验分布被理解为在抽样前对推断对象的知识的概括.按照贝叶斯学派的观点,样本的作用在于且仅在于对先验分布作修改,而过渡到“后验分布”――其中综合了先验分布中的信息与样本中包含的信息.近几十年来其信奉者愈来愈多,二者之间的争论,是战后时期统计学的一个重要特点.在这种争论中,提出了不少问题促使人们进行研究,其中有的是很根本性的.贝叶斯学派与沃德统计决策理论的联系在于:这二者的结合,产生“贝叶斯决策理论”,它构成了统计决策理论在实际应用上的主要内容.三是电子计算机的应用对统计学的影响.这主要在以下几个方面.首先,一些需要大量计算的统计方法,过去因计算工具不行而无法使用,有了计算机,这一切都不成问题.在战后,统计学应用愈来愈广泛,这在相当程度上要归公功于计算机,特别是对高维数据的情况.计算机的使用对统计学另一方面的影响是:按传统数理统计学理论,一个统计方法效果如何,甚至一个统计方法如何付诸实施,都有赖于决定某些统计量的分布,而这常常是极困难的.有了计算机,就提供了一个新的途径:模拟.为了把一个统计方法与其它方法比较,可以选择若干组在应用上有代表性的条件,在这些条件下,通过模拟去比较两个方法的性能如何,然后作出综合分析,这避开了理论上难以解决的难题,有极大的实用意义.参考文献:(无)百度文库。

概率论与数理统计发展史

概率论与数理统计发展史

概率论与数理统计发展史标准化工作室编码[XX968T-XX89628-XJ668-XT689N]概率论与数理统计发展简史姓名:苗壮班级:1108105指导教师:曹莉摘要:在这里,我们将简略地回顾一下概率论与数理统计的发展史,包括发展过程中所经历的一些大事,以及对这门学科的创立和发展有特别重大影响的那些学者的贡献.关键词:概率论、数理统计、发展史正文:1.概率论的发展17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论.早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大的赌博次数会呈现一定的规律性,卡丹诺为此还写了一本《论赌博》的小册子,书中计算了掷两颗骰子或三颗骰子时,在一切可能的方法中有多少方法得到某一点数.据说,曾与卡丹诺在三次方程发明权上发生争论的塔尔塔里亚,也曾做过类似的实验.促使概率论产生的强大动力来自社会实践.首先是保险事业.文艺复兴后,随着航海事业的发展,意大利开始出现海上保险业务.16世纪末,在欧洲不少国家已把保险业务扩大到其它工商业上,保险的对象都是偶然性事件.为了保证保险公司赢利,又使参加保险的人愿意参加保险,就需要根据对大量偶然现象规律性的分析,去创立保险的一般理论.于是,一种专门适用于分析偶然现象的数学工具也就成为十分必要了.不过,作为数学科学之一的概率论,其基础并不是在上述实际问题的材料上形成的.因为这些问题的大量随机现象,常被许多错综复杂的因素所干扰,它使难以呈“自然的随机状态”.因此必须从简单的材料来研究随机现象的规律性,这种材料就是所谓的“随机博弈”.在近代概率论创立之前,人们正是通过对这种随机博弈现象的分析,注意到了它的一些特性,比如“多次实验中的频率稳定性”等,然后经加工提炼而形成了概率论.荷兰数学家、物理学家惠更斯(Huygens)于1657年发表了关于概率论的早期着作《论赌博中的计算》.在此期间,法国的费尔马(Fermat)与帕斯卡(Pascal)也在相互通信中探讨了随机博弈现象中所出现的概率论的基本定理和法则.惠更斯等人的工作建立了概率和数学期望等主要概念,找出了它们的基本性质和演算方法,从而塑造了概率论的雏形.18世纪是概率论的正式形成和发展时期.1713年,贝努利(Bernoulli)的名着《推想的艺术》发表.在这部着作中,贝努利明确指出了概率论最重要的定律之一――“大数定律”,并且给出了证明,这使以往建立在经验之上的频率稳定性推测理论化了,从此概率论从对特殊问题的求解,发展到了一般的理论概括.继贝努利之后,法国数学家棣谟佛(AbrahamdeMoiver)于1781年发表了《机遇原理》.书中提出了概率乘法法则,以及“正态分”和“正态分布律”的概念,为概率论的“中心极限定理”的建立奠定了基础.1706年法国数学家蒲丰(ComtedeBuffon)的《偶然性的算术试验》完成,他把概率和几何结合起来,开始了几何概率的研究,他提出的“蒲丰问题”就是采取概率的方法来求圆周率π的尝试.通过贝努利和棣谟佛的努力,使数学方法有效地应用于概率研究之中,这就把概率论的特殊发展同数学的一般发展联系起来,使概率论一开始就成为数学的一个分支.概率论问世不久,就在应用方面发挥了重要的作用.牛痘在欧洲大规模接种之后,曾因副作用引起争议.这时贝努利的侄子丹尼尔·贝努利(DanielBernoulli)根据大量的统计资料,作出了种牛痘能延长人类平均寿命三年的结论,消除了一些人的恐惧和怀疑;欧拉(Euler)将概率论应用于人口统计和保险,写出了《关于死亡率和人口增长率问题的研究》,《关于孤儿保险》等文章;泊松(Poisson)又将概率应用于射击的各种问题的研究,提出了《打靶概率研究报告》.总之,概率论在18世纪确立后,就充分地反映了其广泛的实践意义.19世纪概率论朝着建立完整的理论体系和更广泛的应用方向发展.其中为之作出较大贡献的有:法国数学家拉普拉斯(Laplace),德国数学家高斯(Gauss),英国物理学家、数学家麦克斯韦(Maxwell),美国数学家、物理学家吉布斯(Gibbs)等.概率论的广泛应用,使它于18和19两个世纪成为热门学科,几乎所有的科学领域,包括神学等社会科学都企图借助于概率论去解决问题,这在一定程度上造成了“滥用”的情况,因此到19世纪后半期时,人们不得不重新对概率进行检查,为它奠定牢固的逻辑基础,使它成为一门强有力的学科.1917年苏联科学家伯恩斯坦首先给出了概率论的公理体系.1933年柯尔莫哥洛夫又以更完整的形式提出了概率论的公理结构,从此,更现代意义上的完整的概率论臻于完成.相对于其它许多数学分支而言,数理统计是一个比较年轻的数学分支.多数人认为它的形成是在20世纪40年代克拉美(H.Carmer)的着作《统计学的数学方法》问世之时,它使得1945年以前的25年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方面的工作结合起来,从而形成数理统计这门学科.它是以对随机现象观测所取得的资料为出发点,以概率论为基础来研究随机现象的一门学科,它有很多分支,但其基本内容为采集样本和统计推断两大部分.发展到今天的现代数理统计学,又经历了各种历史变迁.2.统计的发展统计的早期开端大约是在公元前1世纪初的人口普查计算中,这是统计性质的工作,但还不能算作是现代意义下的统计学.到了18世纪,统计才开始向一门独立的学科发展,用于描述表征一个状态的条件的一些特征,这是由于受到概率论的影响.高斯从描述天文观测的误差而引进正态分布,并使用最小二乘法作为估计方法,是近代数理统计学发展初期的重大事件,18世纪到19世纪初期的这些贡献,对社会发展有很大的影响.例如,用正态分布描述观测数据后来被广泛地用到生物学中,其应用是如此普遍,以至在19世纪相当长的时期内,包括高尔顿(Galton)在内的一些学者,认为这个分布可用于描述几乎是一切常见的数据.直到现在,有关正态分布的统计方法,仍占据着常用统计方法中很重要的一部分.最小二乘法方面的工作,在20世纪初以来,又经过了一些学者的发展,如今成了数理统计学中的主要方法.从高斯到20世纪初这一段时间,统计学理论发展不快,但仍有若干工作对后世产生了很大的影响.其中,如贝叶斯(Bayes)在1763年发表的《论有关机遇问题的求解》,提出了进行统计推断的方法论方面的一种见解,在这个时期中逐步发展成统计学中的贝叶斯学派(如今,这个学派的影响愈来愈大).现在我们所理解的统计推断程序,最早的是贝叶斯方法,高斯和拉普拉斯应用贝叶斯定理讨论了参数的估计法,那时使用的符号和术语,至今仍然沿用.再如前面提到的高尔顿在回归方面的先驱性工作,也是这个时期中的主要发展,他在遗传研究中为了弄清父子两辈特征的相关关系,揭示了统计方法在生物学研究中的应用,他引进回归直线、相关系数的概念,创始了回归分析.数理统计学发展史上极重要的一个时期是从19世纪到二次大战结束.现在,多数人倾向于把现代数理统计学的起点和达到成熟定为这个时期的始末.这确是数理统计学蓬勃发展的一个时期,许多重要的基本观点、方法,统计学中主要的分支学科,都是在这个时期建立和发展起来的.以费歇尔(R.A.Fisher)和皮尔逊(K.Pearson)为首的英国统计学派,在这个时期起了主导作用,特别是费歇尔.继高尔顿之后,皮尔逊进一步发展了回归与相关的理论,成功地创建了生物统计学,并得到了“总体”的概念,1891年之后,皮尔逊潜心研究区分物种时用的数据的分布理论,提出了“概率”和“相关”的概念.接着,又提出标准差、正态曲线、平均变差、均方根误差等一系列数理统计基本术语.皮尔逊致力于大样本理论的研究,他发现不少生物方面的数据有显着的偏态,不适合用正态分布去刻画,为此他提出了后来以他的名字命名的分布族,为估计这个分布族中的参数,他提出了“矩法”.为考察实际数据与这族分布的拟合分布优劣问题,他引进了着名“χ2检验法”,并在理论上研究了其性质.这个检验法是假设检验最早、最典型的方法,他在理论分布完全给定的情况下求出了检验统计量的极限分布.1901年,他创办了《生物统计学》,使数理统计有了自己的阵地,这是20世纪初叶数学的重大收获之一.1908年皮尔逊的学生戈赛特(Gosset)发现了Z的精确分布,创始了“精确样本理论”.他署名“Student”在《生物统计学》上发表文章,改进了皮尔逊的方法.他的发现不仅不再依靠近似计算,而且能用所谓小样本进行统计推断,并使统计学的对象由集团现象转变为随机现象.现“Student分布”已成为数理统计学中的常用工具,“Student氏”也是一个常见的术语.英国实验遗传学家兼统计学家费歇尔,是将数理统计作为一门数学学科的奠基者,他开创的试验设计法,凭借随机化的手段成功地把概率模型带进了实验领域,并建立了方差分析法来分析这种模型.费歇尔的试验设计,既把实践带入理论的视野内,又促进了实践的进展,从而大量地节省了人力、物力,试验设计这个主题,后来为众多数学家所发展.费歇尔还引进了显着性检验的概念,成为假设检验理论的先驱.他考察了估计的精度与样本所具有的信息之间的关系而得到信息量概念,他对测量数据中的信息,压缩数据而不损失信息,以及对一个模型的参数估计等贡献了完善的理论概念,他把一致性、有效性和充分性作为参数估计量应具备的基本性质.同时还在1912年提出了极大似然法,这是应用上最广的一种估计法.他在20年代的工作,奠定了参数估计的理论基础.关于χ2检验,费歇尔1924年解决了理论分布包含有限个参数情况,基于此方法的列表检验,在应用上有重要意义.费歇尔在一般的统计思想方面也作出过重要的贡献,他提出的“信任推断法”,在统计学界引起了相当大的兴趣和争论,费歇尔给出了许多现代统计学的基础概念,思考方法十分直观,他造就了一个学派,在纯粹数学和应用数学方面都建树卓越.这个时期作出重要贡献的统计学家中,还应提到奈曼(J.Neyman)和皮尔逊(E.Pearson).他们在从1928年开始的一系列重要工作中,发展了假设检验的系列理论.奈曼-皮尔逊假设检验理论提出和精确化了一些重要概念.该理论对后世也产生了巨大影响,它是现今统计教科书中不可缺少的一个组成部分,奈曼还创立了系统的置信区间估计理论,早在奈曼工作之前,区间估计就已是一种常用形式,奈曼从1934年开始的一系列工作,把区间估计理论置于柯尔莫哥洛夫概率论公理体系的基础之上,因而奠定了严格的理论基础,而且他还把求区间估计的问题表达为一种数学上的最优解问题,这个理论与奈曼-皮尔逊假设检验理论,对于数理统计形成为一门严格的数学分支起了重大作用.以费歇尔为代表人物的英国成为数理统计研究的中心时,美国在二战中发展亦快,有三个统计研究组在投弹问题上进行了9项研究,其中最有成效的哥伦比亚大学研究小组在理论和实践上都有重大建树,而最为着名的是首先系统地研究了“序贯分析”,它被称为“30年代最有威力”的统计思想.“序贯分析”系统理论的创始人是着名统计学家沃德(Wald).他是原籍罗马尼亚的英国统计学家,他于1934年系统发展了早在20年代就受到注意的序贯分析法.沃德在统计方法中引进的“停止规则”的数学描述,是序贯分析的概念基础,并已证明是现代概率论与数理统计学中最富于成果的概念之一.从二战后到现在,是统计学发展的第三个时期,这是一个在前一段发展的基础上,随着生产和科技的普遍进步,而使这个学科得到飞速发展的一个时期,同时,也出现了不少有待解决的大问题.这一时期的发展可总结如下:一是在应用上愈来愈广泛,统计学的发展一开始就是应实际的要求,并与实际密切结合的.在二战前,已在生物、农业、医学、社会、经济等方面有不少应用,在工业和科技方面也有一些应用,而后一方面在战后得到了特别引人注目的进展.例如,归纳“统计质量管理”名目下的众多的统计方法,在大规模工业生产中的应用得到了很大的成功,目前已被认为是不可缺少的.统计学应用的广泛性,也可以从下述情况得到印证:统计学已成为高等学校中许多专业必修的内容;统计学专业的毕业生的人数,以及从事统计学的应用、教学和研究工作的人数的大幅度的增长;有关统计学的着作和期刊杂志的数量的显着增长.二是统计学理论也取得重大进展.理论上的成就,综合起来大致有两个主要方面:一个方面与沃德提出的“统计决策理论”,另一方面就是大样本理论.沃德是20世纪对统计学面貌的改观有重大影响的少数几个统计学家之一.1950年,他发表了题为《统计决策函数》的着作,正式提出了“统计决策理论”.沃德本来的想法,是要把统计学的各分支都统一在“人与大自然的博奕”这个模式下,以便作出统一处理.不过,往后的发展表明,他最初的设想并未取得很大的成功,但却有着两方面的重要影响:一是沃德把统计推断的后果与经济上的得失联系起来,这使统计方法更直接用到经济性决策的领域;二是沃德理论中所引进的许多概念和问题的新提法,丰富了以往的统计理论.贝叶斯统计学派的基本思想,源出于英国学者贝叶斯的一项工作,发表于他去世后的1763年后世的学者把它发展为一整套关于统计推断的系统理论.信奉这种理论的统计学者,就组成了贝叶斯学派.这个理论在两个方面与传统理论(即基于概率的频率解释的那个理论)有根本的区别:一是否定概率的频率的解释,这涉及到与此有关的大量统计概念,而提倡给概率以“主观上的相信程度”这样的解释;二是“先验分布”的使用,先验分布被理解为在抽样前对推断对象的知识的概括.按照贝叶斯学派的观点,样本的作用在于且仅在于对先验分布作修改,而过渡到“后验分布”――其中综合了先验分布中的信息与样本中包含的信息.近几十年来其信奉者愈来愈多,二者之间的争论,是战后时期统计学的一个重要特点.在这种争论中,提出了不少问题促使人们进行研究,其中有的是很根本性的.贝叶斯学派与沃德统计决策理论的联系在于:这二者的结合,产生“贝叶斯决策理论”,它构成了统计决策理论在实际应用上的主要内容.三是电子计算机的应用对统计学的影响.这主要在以下几个方面.首先,一些需要大量计算的统计方法,过去因计算工具不行而无法使用,有了计算机,这一切都不成问题.在战后,统计学应用愈来愈广泛,这在相当程度上要归公功于计算机,特别是对高维数据的情况.计算机的使用对统计学另一方面的影响是:按传统数理统计学理论,一个统计方法效果如何,甚至一个统计方法如何付诸实施,都有赖于决定某些统计量的分布,而这常常是极困难的.有了计算机,就提供了一个新的途径:模拟.为了把一个统计方法与其它方法比较,可以选择若干组在应用上有代表性的条件,在这些条件下,通过模拟去比较两个方法的性能如何,然后作出综合分析,这避开了理论上难以解决的难题,有极大的实用意义.参考文献:(无)百度文库。

对于概率论与数理统计专业的学生来说,现在什么行业发展前景最好?

对于概率论与数理统计专业的学生来说,现在什么行业发展前景最好?

对于概率论与数理统计专业的学生来说,现在什么行业发展前景最好?嗨,亲爱的朋友们!今天,咱们来聊聊概率论与数理统计专业在各个领域的精彩表现。

在当今科技飞速发展的时代,概率论与数理统计专业也正迎来前所未有的机遇与挑战。

人工智能技术和大数据分析等前沿技术的广泛应用,如同为该专业的学生点亮了一盏通往璀璨未来的明灯。

一、概率论与数理统计专业在大数据和人工智能领域的广阔前景对于概率论与数理统计专业的学生来说,目前大数据和人工智能领域确实展现出了极为诱人的发展前景。

这一结论可以从多个方面得到有力支持。

(一)大数据与人工智能的结合随着大数据时代的到来,统计学与大数据的结合成为一种必然趋势。

大数据技术使得统计学家可以处理和分析海量的用户行为数据,从而揭示复杂的用户行为模式和市场趋势。

例如,某大型电商平台利用大数据分析用户的购买行为、浏览记录等数据,通过概率论与数理统计的方法,预测用户的购买意向,从而进行精准的商品推荐,大大提高了销售额。

(二)就业方向广泛概率论与数理统计专业的毕业生适合在银行、保险、金融、企事业单位、政府部门等行业从事教学、人工智能研究、大数据处理与分析、统计预测与决策等工作。

此外,该专业还可以做大数据开发、机器学习、深度学习等与人工智能相关的工作。

以金融行业为例,精算师这一职位对概率论与数理统计专业毕业生的需求量很大。

他们通常任职于保险公司、财务分析顾问公司、银行和投资公司等,通过运用概率论与数理统计的知识进行资产定价、风险管理、保险产品设计以及投资决策等工作。

(三)行业需求旺盛统计学专业毕业生已成为各行业争相招揽的人才,从岗位配角向岗位主角蜕变。

尤其在互联网公司、数据调查公司和咨询公司等领域有较高的需求。

科技领域越先进,社会经济越发达,愈发为统计学类人才提供更多机遇。

据统计,近年来,大数据和人工智能相关企业对概率论与数理统计专业毕业生的需求逐年增长,增长率达到了 [具体数据]%。

(四)跨学科融合统计学与计算机科学的深入交叉逐渐形成了数据科学这一新的发展方向,成为统计学科发展的重要趋势。

概率论与数理统计概率历史介绍

概率论与数理统计概率历史介绍

概率论与数理统计概率历史介绍-CAL-FENGHAI.-(YICAI)-Company One1一、概率定义的发展与分析1.古典定义的历史脉络古典定义中的“古典”表明了这种定义起源的古老,它源于赌博.博弈的形式多种多样,但是它们的前提是“公平”,即“机会均等”,而这正是古典定义适用的重要条件:同等可能.16世纪意大利数学家和赌博家卡尔丹(1501—1576)所说的“诚实的骰子”,即道明了这一点.在卡尔丹以后约三百年的时间里,帕斯卡、费马、伯努利等数学家都在古典概率的计算、公式推导和扩大应用等方面做了重要的工作.直到1812年,法国数学家拉普拉斯(1749—1827)在《概率的分析理论》中给出概率的古典定义:事件A的概率等于一次试验中有利于事件A的可能结果数与该事件中所有可能结果数之比.2.古典定义的简单分析古典定义通过简单明了的方式定义了事件的概率,并给出了简单可行的算法.它适用的条件有二:(1)可能结果总数有限;(2)每个结果的出现有同等可能.其中第(2)条尤其重要,它是古典概率思想产生的前提.如何在更多和更复杂的情况下,体现出“同等可能”伯努利家族成员做了这项工作,他们将排列组合的理论运用到了古典概率中.用排列(组合)体现同等可能的要求,就是将总数为P(n,r)的各种排列(或总数为C(n,r)的各种组合)看成是等可能的,通常用“随意取”来表达这个意思.即使如此,古典定义的方法能应用的范围仍然很窄,而且还有数学上的问题.“应用性的狭窄性”促使雅各布?伯努利(1654—1705)“寻找另一条途径找到所期待的结果”,这就是他在研究古典概率时的另一重要成果:伯努利大数定律.这条定律告诉我们“频率具有稳定性”,所以可以“用频率估计概率”,而这也为以后概率的统计定义奠定了思想基础.“古典定义数学上的问题”在贝特朗(1822—1900)悖论中表现得淋漓尽致,它揭示出定义存在的矛盾与含糊之处,这导致了拉普拉斯的古典定义受到猛烈批评.3.统计定义的历史脉络概率的古典定义虽然简单直观,但是适用范围有限.正如雅各布•伯努利所说:“……这种方法仅适用于极罕见的现象.”因此,他通过观察来确定结果数目的比例,并且认为“即使是没受过教育和训练的人,凭天生的直觉,也会清楚地知道,可利用的有关观测的次数越多,发生错误的风险就越小”.虽然原理简单,但是其科学证明并不简单,在古典概型下,伯努利证实了这一点,即“当试验次数愈来愈大时,频率接近概率”.事实上,这不仅对于古典概型适用,人们确信“从现实中观察的频率稳定性”的事实是一个普遍规律.1919年,德国数学家冯•米塞斯(1883—1953)在《概率论基础研究》一书中提出了概率的统计定义:在做大量重复试验时,随着试验次数的增加,某个事件出现的频率总是在一个固定数值的附近摆动,显示出一定的稳定性,把这个固定的数值定义为这一事件的概率.4.统计定义的简单分析虽然统计定义不能像古典定义那样确切地算出概率,但是却给出了一个估计概率的方法.而且,它不再需要“等可能”的条件,因此,从应用的角度来讲,它的适用范围更广.但是从数学理论上讲,统计定义是有问题的.在古典概率的场合,事件概率有一个不依赖于频率的定义——它根本不用诉诸于试验,这样才有一个频率与概率是否接近的问题,其研究导致伯努利大数定律.在统计定义的场合这是一个悖论:你如不从承认大数定律出发,概率就无法定义,因而谈不上频率与概率接近的问题;但是你如承认大数定律,以便可以定义概率,那大数定律就是你的前提,而不是一再需要证明的论断了.5.公理化定义的历史脉络正因为古典定义和统计定义数学理论上的这样或那样的问题,所以到了19世纪,无论是概率论的实际应用还是其自身发展,都要求对概率论的逻辑基础作出更加严格的考察.1900年,38岁的希尔伯特(1862—1943)在世界数学家大会上提出了建立概率公理系统的问题,这就是著名的希尔伯特23个问题中的第6个问题.这引导了一批数学家投入这方面的工作.在概率公理化的研究道路上,前苏联数学家柯尔莫哥洛夫(1903—1987)成绩最为卓著,1933年,他在《概率论基础》中运用集合论和测度论表示概率论的方法赋予了概率论严密性.6.公理化定义的简单分析为什么直到20世纪才实现了概率论的公理化,这是因为20世纪初才完成了勒贝格测度与积分理论以及抽象测度与积分理论,而这都是概率论公理化体系建立的基础.柯尔莫哥洛夫借助实变函数论和测度论来定义概率概念,形成了概率论的公理化体系,他的公理体系既概括了古典定义、统计定义的基本特性,又避免了各自的局限.例如,公理中有一条,是把事件概率的存在作为一个不要证明的事实接受下来,在这个前提下,大数定律就成为一个需要证明且可以得到证明的论断,这就避免了“4”中统计定义的数学理论上的问题;而公理中关于“概率存在”的规定又有其实际背景,这就是概率的古典定义和统计定义.所以,我们说,概率论公理体系的出现,是概率论发展史上的一个里程碑,至此,概率论才真正成为了严格的数学分支.二、关于概率定义教学的几点思考对于概率的定义,教科书是先给出古典定义,然后再给出统计定义.这与历史上概率定义的发展相吻合,从“简单到复杂”.在教学中,我们不仅要明了这种顺序的设计意图,而且还要抓住不同定义的特点和思想,以引导学生更好地理解概率.1.古典定义的教学定位在前面的分析中,我们说“等可能”是古典概率非常重要的一个特征,它是古典概率思想产生的前提.正是因为“等可能”,所以才会有了“比率”.因此,“等可能性”和“比率”是古典定义教学中的两个落脚点.“等可能”是无法确切证明的,往往是一种感觉,但是这种感觉是有其实际背景的,例如,掷一枚硬币,“呈正面”“呈反面”是等可能的,因为它质地均匀;而掷一枚图钉,“钉帽着地”“顶针着地”不是等可能的,因为图钉本身给我们的感觉就是帽重钉轻.因此,“等可能”并不要多么严密的物理上或化学上的分析,只需要通过例子感知一下“等可能”和“不等可能”即可,以便让学生明白古典定义的适用对象须具备的条件.2.统计定义的教学定位从直观上讲,统计定义是非常容易接受的,但是它的内涵是非常深刻的,涉及到大数定律.在初中阶段,我们不可能让学生接触其严格的形式和证明.因此,统计定义定位在其合理性和必要性是比较恰当的.如何让学生体会其合理性和必要性?罗老师的课堂教学比较好地实现了这两点.从教学顺序来看,罗老师将“掷硬币”作为归纳统计定义的例子,“掷硬币”可以用古典定义求概率,所以概率值是明确的,而通过试验的方法计算得到的频率就可以和这个明确的概率值相比较,如此更容易让学生体会到“频率具有稳定性”这一事实,从而感受到“用频率估计概率”的合理性;罗老师将“掷图钉”作为统计定义的应用,“掷图钉”不能用古典定义求概率,由此能让学生体会到学习统计定义计算事件概率的必要性.从教学手段来看,罗老师主要采用了“学生试验”的方法,学生的亲自试验在这节课所起的作用是无可代替的:“亲自试验”获得的结果能够给学生以真实感和确切感;“亲自试验”能够让学生感受到频率的随机性和稳定性等特点.所以,像概率与统计的学习,学生应该有更多的主动权和试验权,在动手和动脑中感受概率与统计的思想和方法.3. 概率与统计教学的背后:专业素养的提升在课题研讨时,教师们表现出这样一些困惑:随着试验次数的增加,频率就越来越稳定频率估计概率,一定要大量试验实验次数多少合适事实上,这些问题涉及的就是概率与统计的专业素养.对于大多数教师而言,概率与统计相对而言比较陌生,这是很自然的,因为在教师自身接受的数学专业学习中,概率与统计就是一个弱项.但是,既然要向学生教授概率与统计,那么还是需要有“一桶水”的.就像上面的问题,翻阅任何一本《概率论与数理统计》,都可以给我们知识上的答案,而翻阅一下相关的科普读物或史料,就可以给我们思想方法上的答案.举个例子:伯努利大数定律:设m是n重伯努利试验中事件A出现的次数,又A在每次试验中出现的概率为p(),则对任意的,有.狄莫弗-拉普拉斯极限定理:设m是n重伯努利试验中事件A出现的次数,又A在每次试验中出现的概率为p(),则.伯努利大数定律只是告诉我们,当n趋于无穷时,频率依概率收敛于概率p.伯努利的想法是:只要n充分大,那么频率估计概率的误差就可以如所希望的小.值得赞赏的是,他利用了“依概率收敛”而不是更直观的p,因为频率是随着试验结果变化的,在n次试验中,事件A出现n次也是有可能的,此时p就不成立了.伯努利不仅证明了上述大数定律,而且还想知道:若想要把一个概率通过频率而确定到一定的精确度,要做多少次观察才行.这时,伯努利大数定律无能为力,但是狄莫弗-拉普拉斯极限定理给出了解答:.(*)例如研究课中掷硬币的问题,若要保证有95%的把握使正面向上的频率与其概率0.5之差落在0.1的范围内,那要抛掷多少次?根据(*)式,可以估计出.三、概率论发展简史概率论有悠久的历史,它的起源与博弈问题有关。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数理统计学前沿简介(陈希孺院士访谈)一、概率论与数理统计学的产生和发展记者:陈希孺院士,请你谈谈概率论与数理统计学学科的诞生和发展情况。

陈希孺院士:我们先从数理统计学开始,数理统计学是研究收集数据、分析数据并据以对所研究的问题作出一定的结论的科学和艺术。

数理统计学所考察的数据都带有随机性(偶然性)的误差。

这给根据这种数据所作出的结论带来了一种不确定性,其量化要借助于概率论的概念和方法。

数理统计学与概率论这两个学科的密切联系,正是基于这一点。

统计学起源于收集数据的活动,小至个人的事情,大至治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。

现今各国都设有统计局或相当的机构。

当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。

例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。

根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问——数理统计学的内容。

这样的统计学始于何时?恐怕难于找到一个明显的、大家公认的起点。

一种受到某些著名学者支持的观点认为,英国学者葛朗特在1662年发表的著作《关于死亡公报的自然和政治观察》,标志着这门学科的诞生。

中世纪欧洲流行黑死病,死亡的人不少。

自1604年起,伦敦教会每周发表一次“死亡公报”,记录该周内死亡的人的姓名、年龄、性别、死因。

以后还包括该周的出生情况——依据受洗的人的名单,这基本上可以反映出生的情况。

几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。

他因这一部著作被选入当年成立的英国皇家学会,反映学术界对他这一著作的承认和重视。

这是一本篇幅很小的著作,主要内容为8个表,从今天的观点看,这只是一种例行的数据整理工作,但在当时则是有原创性的科研成果,其中所提出的一些概念,在某种程度上可以说沿用至今,如数据简约(大量的、杂乱无章的数据,须注过整理、约化,才能突出其中所包含的信息)、频率稳定性(一定的事件,如“生男”、“生女”,在较长时期中有一个基本稳定的比率,这是进行统计性推断的基础)、数据纠错、生命表(反映人群中寿命分布的情况,至今仍是保险与精算的基础概念)等。

葛朗特的方法被他同时代的政治经济学家佩蒂引进到社会经济问题的研究中,他提倡在这类问题的研究中不能尚空谈,要让实际数据说话,他的工作总结在他去世后于1690年出版的《政治算术》一书中。

当然,也应当指出,他们的工作还停留在描述性的阶段,不是现代意义下的数理统计学,那时,概率论尚处在萌芽的阶段,不足以给数理统计学的发展提供充分的理论支持,但不能由此否定他们工作的重大意义,作为现代数理统计学发展的几个源头之一,他们以及后续学者在人口、社会、经济等领域的工作,特别是比利时天文学家兼统计学家凯特勒19世纪的工作,对促成现代数理统计学的诞生起了很大的作用。

数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。

早期,测量工具的精度不高,人们希望通过多次量测获取更多的数据,以便得到对量测对象的精度更高的估计值。

量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的“拉普拉斯分布”,即是他在这研究中的一个产物,这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德19世纪初(1805)在研究慧星轨道计算时发明的“最小二乘法”,他在估计过巴黎的子午线长这一工作中,曾使用这个方法。

现今著作中把这一方法的发明归功于高斯,但高斯使用这一方法最早见诸文字是1809年,比勒让德晚。

一种现在逐步取得公认——这项发明系由二人独立做出,看来使比较妥当的。

另外一个重要成果是德国大学者高斯1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。

正态分布也常称为高斯分布,其曲线是钟形,极象颐和园中玉带桥那样的形状,故有时又称为“钟形曲线”,它反映了这样一种极普通的情况:天下形形色色的事物中,“两头小,中间大”的居多,如人的身高,太高太矮的都不多,而居于中间者占多数——当然,这只是一个极粗略的描述,要作出准确的描述,须动用高等数学的知识。

正是其数学上的特性成为其广泛应用的根据。

正态分布在数理统计学中占有极重要的地位,现今仍在常用的许多统计方法,就是建立在“所研究的量具有或近似地具有正态分布”这个假定的基础上,而经验和理论(概率论中所谓“中心极限定理”)都表明这个假定的现实性,现实世界许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。

大批生产的产品,其质量指标各有差异 。

看来毫无规则,但它们在总体上服从正态分布。

这一点,显示在纷乱中有一种秩序存在,提出正态分布的高斯,一生在多个领域里面有不少重大的贡献,但在德国10马克的有高斯图像的钞票上,单只画出了正态曲线,以此可以看出人们对他这一贡献评价之高。

图1英国约克大学葛朗特图2 帕齐利图3 拉普拉斯图4:高斯图5:连续型随机变量20世纪以前数理统计学发展的一个重要成果,是19世纪后期由英国遗传学家兼统计学家高尔顿发起,并经现代统计学的奠基人之一K·皮尔逊和其他一些英国学者所发展的统计相关与回归理论。

所谓统计相关,是指一种非决定性的关系如人的身高X与体重Y,存在一种大致的关系,表现在X大(小)时,Y也倾向于大(小),但非决定性的:由X并不能决定Y。

现实生活中和各种科技领域中,这种例子很多,如受教育年限与收入的关系,经济发展水平与人口增长速度的关系等,都是属于这种性质,统计相关的理论把这种关系的程度加以量化,而统计回归则是把有统计相关的变量,如上文的身高X 和体重Y的关系的形式作近似的估计,称为回归方程,现实世界中的现象往往涉及众多变量,它们之间有错综复杂的关系,且许多属于非决定性质,相关回归理论的发明,提供了一种通过实际观察去对这种关系进行定量研究的工具,有着重大的认识和实用意义。

到20世纪初年,由于上述几个方面的发展,数理统计学已积累了很丰富的成果——在此因篇幅关系,我们不能详尽无遗地一一列举有关的重要成果,如抽样调查的理论和方法方面的进展,但是直到这时为止,我们还不能说现代意义下的数理统计学已经建立起来,其主要标志之一就是这门学问还缺乏一个统一的理论框架,这个任务在20世纪上半叶得以完成,狭义一点说可界定在1921——1938年,起主要作用的是几位大师级的人物,特别是英国的费歇尔·K·皮尔逊,发展统计假设检验理论的奈曼与E·皮尔逊和提出统计决策函数理论的瓦尔德等。

我国已故著名统计学家许宝碌(1910——1970)在这项工作中也卓有建树。

自二战结束迄今,数理统计学有了迅猛的发展,主要有以下三方面的原因:一是数理统计学理论框架的建立以及概率论和数学工具的进展,为统计理论在面上和向纵深的发展打开了门径和提供了手段,许多在早期比较粗略的理论和方法,在理论上得到了完善与深入,并不断提出新的研究课题;二是实用上的需要,不断提出了复杂的问题与模型,吸引了学者们的研究兴趣;三是电子计算机的发明与普及应用,一方面提供了必要的计算工具——统计方法的实施往往涉及大量数据的处理与运算,用人力无法在合理的时间内完成,所以在早年,一些统计方法人们虽然知道,但很少付诸实用,就因为是人力所难及。

计算机的出现解决了这个问题。

而赋予统计方法以现实的生命力。

同时,计算机对促进统计理论研究也有助益,统计模拟是其表现之一,在承认上述成就的同时,不少统计学家也指出这一时期发展中出现的一些问题或偏向,其中主要的一点是,数理统计学理论研究中的“数学化”气味愈来愈重,相当一部分研究工作停留在数学的层面,早期那种理论研究与现实问题密切结合的优良传统有所淡化,一些学者还提出了补救的建议,对未来统计学发展的方向进行探讨。

同时,现实问题愈来愈涉及到大量的,结构复杂的数据,按现行的数理统计学规范去处理,显得力所不及,需要一些带有根本性创新的思路,使统计学的发展登上一个新的台阶,以适应应用上的需要,考虑这一背景,有的统计学家乐观地认为数理统计学正面临一个新的突破。

在上面讲述数理统计学的发展状况时,我们着重在实际需要所起的促进作用方面,由于概率论的概念和方法是数理统计学的理论基础,概率论的进展也必然对数理统计学的发展起促进作用。

概率,又称几率,或然率,指一种不确定的情况出现可能性的大小,例如,投掷一个硬币,“出现国徽”(国徽一面朝上)是一个不确定的情况。

因为投掷前,我们无法确定所指情况(“出现国徽”)发生与否,若硬币是均匀的且投掷有充分的高度,则两面的出现机会均等,我们说“出现国徽”的概率是1/2;同时,投掷一个均匀骰子,“出现4点”的概率是1/6,除了这些以及类似的简单情况外,概率的计算不容易,往往需要一些理论上的假定,在现实生活中则往往用经验的方法确定概率,例如某地区有N人,查得其中患某种疾病者有M人,则称该地区的人患该种疾病的概率为M/N,这事实上是使用统计方法对发病概率的一个估计。

图1 条形图图2 饼图概率的概念起源于中世纪以来的欧洲流行的用骰子赌博,这一点不难理解,某种情况出现可能性的大小要能够体察并引起研究的兴趣,必须满足两个条件:一是该情况可以在多次重复中被观察其发生与否(在多次重复下出现较频繁的情况有更大的概率),一是该情况发生与否与当事人的利益有关或为其兴趣关注之所在,用骰子赌博满足这些条件。

当时有一个“分赌本问题”曾引起热烈的讨论,并经历了长达一百多年才得到正确的解决。

在这过程中孕育了概率论一些重要的基本概念,举该问题的一个简单情况:甲、乙二人赌博,各出赌注30元,共60元,每局甲、乙胜的机会均等,都是1/2。

约定:谁先胜满3局则他赢得全部赌注60元,现已赌完3局,甲2胜1负,而因故中断赌情,问这60元赌注该如何分给2人,才算公平,初看觉得应按2:1分配,即甲得40元,乙得20元,还有人提出了一些另外的解法,结果都不正确,正确的分法应考虑到如在这基础上继续赌下去,甲、乙最终获胜的机会如何,至多再赌2局即可分出胜负,这2局有4种可能结果:甲甲、甲乙、乙甲、乙乙。

前3种情况都是甲最后取胜,只有最后一种情况才是乙取胜,二者之比为3:1,故赌注的公平分配应按3:1的比例,即甲得45元,乙15元。

相关文档
最新文档