数理统计学的起源和发展doc
数理统计学的诞生

数理统计学的诞生当你漫步在森林公园或在水库边领略自然风光的时候,你是否知道森林中的树有多少棵,水库里到底有多少条鱼?这些都无法具体去数,具体去量。
而当我们必须知道某一无法具体测量的事物的量时,就可以用一种可行的数学方法来计算,那就是数理统计。
从一个总体中抽取样本,将收集来的样本数据加以整理,并从中得出认识总体的结论,这是科学研究工作和日常生活中屡见不鲜的手段。
数理统计是现代数学中一个非常活跃的分支,它在20世纪获得巨大的发展和迅速普及,被认为是数学史上值得提及的大事。
然而它是如何产生的呢?随着生物学发展而产生的数学方法莱尔根据各个地层中的化石种类和现仍在海洋中生活的种类作出百分率,然后定出更新世、上新世、中新世、始新世的名称,并于1830~1833年出版了三卷《地质学原理》。
这些地质学中的名称沿用至今,可是他使用的类似于现在数理统计的方法,却没有引起人们的重视。
生物学家达尔文关于进化论的工作主要是生物统计,他在乘坐“贝格尔”号军舰到美洲的旅途上带着莱尔的上述著作,二者看来不无关系。
从数学上对生物统计进行研究的第一人是英国统计学家皮尔逊。
他曾在伦敦大学学院学习,然后去德国学物理,1881年在剑桥大学获得学士学位,1882年任伦敦大学应用数学力学教授。
1891年,他和剑桥大学的动物学家讨论达尔文自然选择理论,发现他们在区分物种时用的数据有“好”和“比较好”的说法。
于是皮尔逊便开始潜心研究数据的分布理论,他借鉴前人的做法,并大胆创新,其研究成果见诸著作《机遇的法则》,其中提出了“概率”和“相关”的概念。
接着又提出“标准差”、“正态曲线”、“平均变差”、“均方根误差”等一系列数理统计的基本术语。
这些文章都发表在进化论的杂志上。
直至1901年,他创办了杂志《生物统计学》,使得数理统计有了自己的阵地。
这可以说是数学在进入20世纪时最初的重大收获之一。
学科奠基者——费歇尔数理统计作为一个进一步完善的数学学科的奠基者是英国人费歇尔。
数理统计学的发展历程

数理统计学的发展历程数理统计学是伴随着概率论的发展而发展起来的。
19世纪中叶以前已出现了若干重要的工作,如C.F.高斯和A.M.勒让德关于观测数据误差分析和最小二乘法的研究。
到19世纪末期,经过包括K.皮尔森在内的一些学者的努力,这门学科已开始形成。
但数理统计学发展成一门成熟的学科,则是20世纪上半叶的事,它在很大程度上要归功于K.皮尔森、R.A.费希尔等学者的工作。
特别是费希尔的贡献,对这门学科的建立起了决定性的作用。
1946年H.克拉默发表的《统计学数学方法》是第一部严谨且比较系统的数理统计著作,可以把它作为数理统计学进入成熟阶段的标志。
数理统计学的发展大致可分3个时期。
第一时期20 世纪以前。
这个时期又可分成两段,大致上可以把高斯和勒让德关于最小二乘法用于观测数据的误差分析的工作作为分界线,前段属萌芽时期,基本上没有超出描述性统计量的范围。
后一阶段可算作是数理统计学的幼年阶段。
首先,强调了推断的地位,而摆脱了单纯描述的性质。
由于高斯等的工作揭示了正态分布的重要性,学者们普遍认为,在实际问题中遇见的几乎所有的连续变量,都可以满意地用正态分布来刻画。
这种观点使关于正态分布的统计得到了深入的发展,但延缓了非参数统计的发展。
19世纪末,K.皮尔森给出了以他的名字命名的分布,并给出了估计参数的一种方法——矩法估计。
德国的F.赫尔梅特发现了统计上十分重要的x2 分布。
第二时期20世纪初到第二次世界大战结束。
这是数理统计学蓬勃发展达到成熟的时期。
许多重要的基本观点和方法,以及数理统计学的主要分支学科,都是在这个时期建立和发展起来的。
这个时期的成就,包含了至今仍在广泛使用的大多数统计方法。
在其发展中,以英国统计学家、生物学家费希尔为代表的英国学派起了主导作用。
第三时期战后时期。
这一时期中,数理统计学在应用和理论两方面继续获得很大的进展。
概率论与数理统计的发展

数理统计学前沿简介(陈希孺院士访谈)一、概率论与数理统计学的产生和发展记者:陈希孺院士,请你谈谈概率论与数理统计学学科的诞生和发展情况。
陈希孺院士:我们先从数理统计学开始,数理统计学是研究收集数据、分析数据并据以对所研究的问题作出一定的结论的科学和艺术。
数理统计学所考察的数据都带有随机性(偶然性)的误差。
这给根据这种数据所作出的结论带来了一种不确定性,其量化要借助于概率论的概念和方法。
数理统计学与概率论这两个学科的密切联系,正是基于这一点。
统计学起源于收集数据的活动,小至个人的事情,大至治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。
现今各国都设有统计局或相当的机构。
当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。
例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。
根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问——数理统计学的内容。
这样的统计学始于何时?恐怕难于找到一个明显的、大家公认的起点。
一种受到某些著名学者支持的观点认为,英国学者葛朗特在1662年发表的著作《关于死亡公报的自然和政治观察》,标志着这门学科的诞生。
中世纪欧洲流行黑死病,死亡的人不少。
自1604年起,伦敦教会每周发表一次“死亡公报”,记录该周内死亡的人的姓名、年龄、性别、死因。
以后还包括该周的出生情况——依据受洗的人的名单,这基本上可以反映出生的情况。
几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。
数理统计的起源

课程文化2-数理统计的起源数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议.数理统计的发展大致可分为古典时期、近代时期和现代时期三个阶段.古典时期(19世纪以前).这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期.在这一时期里,瑞土数学家雅各布·伯努利(Jakob Bernoulli,1654-1705)较早地系统论证了大数定律.1763年,英国数学家贝叶斯(Thomas Bayes,1701-1761)提出了一种归纳推理的理论,后被发展为一种统计推断方法―贝叶斯方法,开创了数理统计的先河.法国数学家棣莫佛(de Moivre,1667-1754)于1733年首次发现了正态分布的密度函数并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础.1809年,德国数学家高斯(Gauss.Garl Friedrich,1777-1855,德国)和法国数学家勒让德(Adrien Marie Legendre1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析.在数理统计的理论与应用方面都作出了重要贡献,他不仅将数理统计应用到生物学,而且还应用到教育学和心理学的研究.并且详细地论证了数理统计应用的广泛性,高斯曾预言:"统计方法,可应用于各种学科的各个部门."近代时期(19世纪末至1845年).数理统计的主要分支建立,是数理统计的形成时期.上一世纪初,由于概率论的发展从理论上接近完备,加之工农业生产迫切需要,推动着这门学科的蓬勃发展.1889年,英国数学家皮尔逊(Karl Pearson,1857-1936)提出了矩阵估计法,次年又提出了频率曲线的理论,并于1900年在德国大地测量学者赫尔梅特(F.Helmert)1876年研究正态总体的样本方差时发现的一个十分重要的分布的基础上提出了检验,这是数理统计发展史上出现的第一个小样本分布.1908年,英国的统计学家戈塞特(W.S.Gosset,1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t检验法),这为数理统计的另一分支---多元分析奠定了理论基础.1912年,英国统计学家费歇(R.A.Fisher,1890-1962)推广了t检验法,同时发展了显著性检验及估计、方差分析等数理统计新分支.这样,数理统计的一些重要分支如假设检验、回归分析、方差分析、正交设计等都有了决定其基本面貌的内容和理论框架.数理统计成为应用广泛、方法独特的一门数学学科.现代时期(1945年以后).美籍数理统计学家瓦尔德(A.Wald,1902-1950)致力于用数学方法使统计学精确化、严密化,取得了很多重要成果.他发展了决策理论,提出了一般的判别问题,创立了序贯分析理论,提出了著名的序贯概率比检验法(比如,用于贵重产品的抽样检查与验收).瓦尔德的两本著作《序贯分析》和《统计决策函数论》,被认为是数理发展史上的经典之作.统计决策理论从人与大自然进行博弈的观点出发,把形形色色的统计问题纳入一个统一的模式之下,对战后数理统计许多分支的发展产生了很大的影响,特别是参数估计这个分支.随着概率论的高速发展,随机过程的统计逐步形成了内容丰富的重要分支.其中,线性滤波理论占据了显著地位,它是40年代维纳-柯尔莫哥洛夫滤波理论(N.Wiener,A.H.Kolmogorov)和60年代卡尔曼滤波理论(Rudolf E.Kalman)向非线性领域的扩展.苏联学者李普泽尔(R.S.Liptser)和希拉也夫(A.N.Shiryaev)在1974年写的专著《随机过程的统计》系统论述了这方面的理论.统计学发展在趋于成熟并得到大量应用后,一些回避不了的弱点开始显露并逐渐为人们所重视.传统的统计方法不能充分利用过去经验积累起来的知识,小样本问题里表现出来难以克服的局限性,这一点在可靠性统计问题中特别突出.二战后数理统计的发展中,一个引人注目的现象是贝叶斯学派的崛起.他们用独到的方法,加入了过去积累的经验因素,在应用中常能得到意想不到的效果.虽然如此,贝叶斯方法仍存在很多困难,先验分布的客观性常引起非议.贝叶斯学派的观点还难以被广大统计工作者普遍接受,因此和传统学派的争论仍将长期存在.目前情况,后者大体上仍处于支配地位.随着计算机技术的进步和广泛使用,统计学又产生了一些新的分支和边缘性的新学科,如最优设计和非参数统计推断等,不仅使得过去难于计算的问题能够解决,而且有利地促使了那些能有效利用现代计算机强大计算能力的统计学新理论、新方法的纷纷问世,例如自助法(bootstarp)、投影寻踪法(projection pursuit)、蒙特卡罗法(Monte Carlo Method)等.统计的应用范围愈来愈广泛,已渗透到许多科学领域,应用到国民经济各个部门,成为科学研究不可缺少的工具.。
概率论与数理统计发展简史

概率论与数理统计发展简史在这里,我们将简略地回顾一下概率论与数理统计的发展史,包括发展过程中所经历的一些大事,以及对这门学科的创立和发展有特别重大影响的那些学者的贡献.17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论.早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大的赌博次数会呈现一定的规律性, 卡丹诺为此还写了一本《论赌博》的小册子,书中计算了掷两颗骰子或三颗骰子时,在一切可能的方法中有多少方法得到某一点数.据说,曾与卡丹诺在三次方程发明权上发生争论的塔尔塔里亚,也曾做过类似的实验.促使概率论产生的强大动力来自社会实践.首先是保险事业.文艺复兴后,随着航海事业的发展,意大利开始出现海上保险业务.16世纪末,在欧洲不少国家已把保险业务扩大到其它工商业上,保险的对象都是偶然性事件.为了保证保险公司赢利,又使参加保险的人愿意参加保险,就需要根据对大量偶然现象规律性的分析,去创立保险的一般理论.于是,一种专门适用于分析偶然现象的数学工具也就成为十分必要了.不过,作为数学科学之一的概率论,其基础并不是在上述实际问题的材料上形成的.因为这些问题的大量随机现象,常被许多错综复杂的因素所干扰,它使难以呈“自然的随机状态”.因此必须从简单的材料来研究随机现象的规律性,这种材料就是所谓的“随机博弈”.在近代概率论创立之前,人们正是通过对这种随机博弈现象的分析,注意到了它的一些特性, 比如“多次实验中的频率稳定性”等,然后经加工提炼而形成了概率论.荷兰数学家、物理学家惠更斯(Huygens)于1657年发表了关于概率论的早期著作《论赌博中的计算》.在此期间,法国的费尔马(Fermat)与帕斯卡(Pascal)也在相互通信中探讨了随机博弈现象中所出现的概率论的基本定理和法则.惠更斯等人的工作建立了概率和数学期望等主要概念,找出了它们的基本性质和演算方法,从而塑造了概率论的雏形.18世纪是概率论的正式形成和发展时期.1713年,贝努利(Bernoulli)的名著《推想的艺术》发表.在这部著作中,贝努利明确指出了概率论最重要的定律之一――“大数定律”,并且给出了证明,这使以往建立在经验+++-之上的频率稳定性推测理论化了,从此概率论从对特殊问题的求解,发展到了一般的理论概括.继贝努利之后,法国数学家棣谟佛(Abraham de Moiver)于1781年发表了《机遇原理》.书中提出了概率乘法法则,以及“正态分”和“正态分布律”的概念,为概率论的“中心极限定理”的建立奠定了基础.1706年法国数学家蒲丰(Comte de Buffon)的《偶然性的算术试验》完成,他把概率和几何结合起来,开始了几何概率的研究,他提出的“蒲丰问题”就是采取概率的方法来求圆周率π的尝试.通过贝努利和棣谟佛的努力,使数学方法有效地应用于概率研究之中,这就把概率论的特殊发展同数学的一般发展联系起来,使概率论一开始就成为数学的一个分支.概率论问世不久,就在应用方面发挥了重要的作用.牛痘在欧洲大规模接种之后,曾因副作用引起争议.这时贝努利的侄子丹尼尔•贝努利(Daniel Bernoulli)根据大量的统计资料,作出了种牛痘能延长人类平均寿命三年的结论,消除了一些人的恐惧和怀疑;欧拉(Euler)将概率论应用于人口统计和保险,写出了《关于死亡率和人口增长率问题的研究》,《关于孤儿保险》等文章;泊松(Poisson)又将概率应用于射击的各种问题的研究,提出了《打靶概率研究报告》.总之,概率论在18世纪确立后,就充分地反映了其广泛的实践意义.19世纪概率论朝着建立完整的理论体系和更广泛的应用方向发展.其中为之作出较大贡献的有:法国数学家拉普拉斯(Laplace),德国数学家高斯(Gauss),英国物理学家、数学家麦克斯韦(Maxwell),美国数学家、物理学家吉布斯(Gibbs)等.概率论的广泛应用,使它于18和19两个世纪成为热门学科,几乎所有的科学领域,包括神学等社会科学都企图借助于概率论去解决问题,这在一定程度上造成了“滥用”的情况,因此到19世纪后半期时,人们不得不重新对概率进行检查,为它奠定牢固的逻辑基础,使它成为一门强有力的学科.1917年苏联科学家伯恩斯坦首先给出了概率论的公理体系.1933年柯尔莫哥洛夫又以更完整的形式提出了概率论的公理结构,从此,更现代意义上的完整的概率论臻于完成.相对于其它许多数学分支而言,数理统计是一个比较年轻的数学分支.多数人认为它的形成是在20世纪40年代克拉美(H.Carmer)的著作《统计学的数学方法》问世之时,它使得1945年以前的25年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方面的工作结合起来,从而形成数理统计这门学科.它是以对随机现象观测所取得的资料为出发点,以概率论为基础来研究随机现象的一门学科,它有很多分支,但其基本内容为采集样本和统计推断两大部分.发展到今天的现代数理统计学,又经历了各种历史变迁.统计的早期开端大约是在公元前1世纪初的人口普查计算中,这是统计性质的工作,但还不能算作是现代意义下的统计学.到了18世纪,统计才开始向一门独立的学科发展,用于描述表征一个状态的条件的一些特征,这是由于受到概率论的影响.高斯从描述天文观测的误差而引进正态分布,并使用最小二乘法作为估计方法,是近代数理统计学发展初期的重大事件,18世纪到19世纪初期的这些贡献,对社会发展有很大的影响.例如,用正态分布描述观测数据后来被广泛地用到生物学中,其应用是如此普遍,以至在19世纪相当长的时期内,包括高尔顿(Galton)在内的一些学者,认为这个分布可用于描述几乎是一切常见的数据.直到现在,有关正态分布的统计方法,仍占据着常用统计方法中很重要的一部分.最小二乘法方面的工作,在20世纪初以来,又经过了一些学者的发展,如今成了数理统计学中的主要方法.从高斯到20世纪初这一段时间,统计学理论发展不快,但仍有若干工作对后世产生了很大的影响.其中,如贝叶斯(Bayes)在1763年发表的《论有关机遇问题的求解》,提出了进行统计推断的方法论方面的一种见解,在这个时期中逐步发展成统计学中的贝叶斯学派(如今,这个学派的影响愈来愈大).现在我们所理解的统计推断程序,最早的是贝叶斯方法,高斯和拉普拉斯应用贝叶斯定理讨论了参数的估计法,那时使用的符号和术语,至今仍然沿用.再如前面提到的高尔顿在回归方面的先驱性工作,也是这个时期中的主要发展,他在遗传研究中为了弄清父子两辈特征的相关关系,揭示了统计方法在生物学研究中的应用,他引进回归直线、相关系数的概念,创始了回归分析.数理统计学发展史上极重要的一个时期是从19世纪到二次大战结束.现在,多数人倾向于把现代数理统计学的起点和达到成熟定为这个时期的始末.这确是数理统计学蓬勃发展的一个时期,许多重要的基本观点、方法,统计学中主要的分支学科,都是在这个时期建立和发展起来的.以费歇尔(R.A.Fisher)和皮尔逊(K.Pearson)为首的英国统计学派,在这个时期起了主导作用,特别是费歇尔.继高尔顿之后,皮尔逊进一步发展了回归与相关的理论,成功地创建了生物统计学,并得到了“总体”的概念,1891年之后,皮尔逊潜心研究区分物种时用的数据的分布理论,提出了“概率”和“相关”的概念.接着,又提出标准差、正态曲线、平均变差、均方根误差等一系列数理统计基本术语.皮尔逊致力于大样本理论的研究,他发现不少生物方面的数据有显著的偏态,不适合用正态分布去刻画,为此他提出了后来以他的名字命名的分布族,为估计这个分布族中的参数,他提出了“矩法”.为考察实际数据与这族分布的拟合分布优劣问题,他引进了著名“χ2检验法”,并在理论上研究了其性质.这个检验法是假设检验最早、最典型的方法,他在理论分布完全给定的情况下求出了检验统计量的极限分布.19 01年,他创办了《生物统计学》,使数理统计有了自己的阵地,这是20世纪初叶数学的重大收获之一.1908年皮尔逊的学生戈赛特(Gosset)发现了Z的精确分布,创始了“精确样本理论”.他署名“Student”在《生物统计学》上发表文章,改进了皮尔逊的方法.他的发现不仅不再依靠近似计算,而且能用所谓小样本进行统计推断,并使统计学的对象由集团现象转变为随机现象.现“Student分布”已成为数理统计学中的常用工具,“Student氏”也是一个常见的术语.英国实验遗传学家兼统计学家费歇尔,是将数理统计作为一门数学学科的奠基者,他开创的试验设计法,凭借随机化的手段成功地把概率模型带进了实验领域,并建立了方差分析法来分析这种模型.费歇尔的试验设计,既把实践带入理论的视野内,又促进了实践的进展,从而大量地节省了人力、物力,试验设计这个主题,后来为众多数学家所发展.费歇尔还引进了显著性检验的概念,成为假设检验理论的先驱.他考察了估计的精度与样本所具有的信息之间的关系而得到信息量概念,他对测量数据中的信息,压缩数据而不损失信息,以及对一个模型的参数估计等贡献了完善的理论概念,他把一致性、有效性和充分性作为参数估计量应具备的基本性质.同时还在1912年提出了极大似然法,这是应用上最广的一种估计法.他在20年代的工作,奠定了参数估计的理论基础.关于χ2检验,费歇尔1924年解决了理论分布包含有限个参数情况,基于此方法的列表检验,在应用上有重要意义.费歇尔在一般的统计思想方面也作出过重要的贡献,他提出的“信任推断法”,在统计学界引起了相当大的兴趣和争论,费歇尔给出了许多现代统计学的基础概念,思考方法十分直观,他造就了一个学派,在纯粹数学和应用数学方面都建树卓越.这个时期作出重要贡献的统计学家中,还应提到奈曼(J.Neyman)和皮尔逊(E.Pearson).他们在从1928年开始的一系列重要工作中,发展了假设检验的系列理论.奈曼-皮尔逊假设检验理论提出和精确化了一些重要概念.该理论对后世也产生了巨大影响,它是现今统计教科书中不可缺少的一个组成部分,奈曼还创立了系统的置信区间估计理论,早在奈曼工作之前,区间估计就已是一种常用形式,奈曼从1934年开始的一系列工作,把区间估计理论置于柯尔莫哥洛夫概率论公理体系的基础之上,因而奠定了严格的理论基础,而且他还把求区间估计的问题表达为一种数学上的最优解问题,这个理论与奈曼-皮尔逊假设检验理论,对于数理统计形成为一门严格的数学分支起了重大作用.以费歇尔为代表人物的英国成为数理统计研究的中心时,美国在二战中发展亦快,有三个统计研究组在投弹问题上进行了9项研究,其中最有成效的哥伦比亚大学研究小组在理论和实践上都有重大建树,而最为著名的是首先系统地研究了“序贯分析”,它被称为“30年代最有威力”的统计思想.“序贯分析”系统理论的创始人是著名统计学家沃德(Wald).他是原籍罗马尼亚的英国统计学家,他于1934年系统发展了早在20年代就受到注意的序贯分析法.沃德在统计方法中引进的“停止规则”的数学描述,是序贯分析的概念基础,并已证明是现代概率论与数理统计学中最富于成果的概念之一.从二战后到现在,是统计学发展的第三个时期,这是一个在前一段发展的基础上,随着生产和科技的普遍进步,而使这个学科得到飞速发展的一个时期,同时,也出现了不少有待解决的大问题.这一时期的发展可总结如下:一是在应用上愈来愈广泛,统计学的发展一开始就是应实际的要求,并与实际密切结合的.在二战前,已在生物、农业、医学、社会、经济等方面有不少应用,在工业和科技方面也有一些应用,而后一方面在战后得到了特别引人注目的进展.例如,归纳“统计质量管理”名目下的众多的统计方法,在大规模工业生产中的应用得到了很大的成功,目前已被认为是不可缺少的.统计学应用的广泛性,也可以从下述情况得到印证:统计学已成为高等学校中许多专业必修的内容;统计学专业的毕业生的人数,以及从事统计学的应用、教学和研究工作的人数的大幅度的增长;有关统计学的著作和期刊杂志的数量的显著增长.二是统计学理论也取得重大进展.理论上的成就,综合起来大致有两个主要方面:一个方面与沃德提出的“统计决策理论”,另一方面就是大样本理论.沃德是20世纪对统计学面貌的改观有重大影响的少数几个统计学家之一.1950年,他发表了题为《统计决策函数》的著作,正式提出了“统计决策理论”.沃德本来的想法,是要把统计学的各分支都统一在“人与大自然的博奕”这个模式下,以便作出统一处理.不过,往后的发展表明,他最初的设想并未取得很大的成功,但却有着两方面的重要影响:一是沃德把统计推断的后果与经济上的得失联系起来,这使统计方法更直接用到经济性决策的领域;二是沃德理论中所引进的许多概念和问题的新提法,丰富了以往的统计理论.贝叶斯统计学派的基本思想,源出于英国学者贝叶斯的一项工作,发表于他去世后的1763年后世的学者把它发展为一整套关于统计推断的系统理论.信奉这种理论的统计学者,就组成了贝叶斯学派.这个理论在两个方面与传统理论(即基于概率的频率解释的那个理论)有根本的区别:一是否定概率的频率的解释,这涉及到与此有关的大量统计概念,而提倡给概率以“主观上的相信程度”这样的解释;二是“先验分布”的使用,先验分布被理解为在抽样前对推断对象的知识的概括.按照贝叶斯学派的观点,样本的作用在于且仅在于对先验分布作修改,而过渡到“后验分布”――其中综合了先验分布中的信息与样本中包含的信息.近几十年来其信奉者愈来愈多,二者之间的争论,是战后时期统计学的一个重要特点.在这种争论中,提出了不少问题促使人们进行研究,其中有的是很根本性的.贝叶斯学派与沃德统计决策理论的联系在于:这二者的结合,产生“贝叶斯决策理论”,它构成了统计决策理论在实际应用上的主要内容.三是电子计算机的应用对统计学的影响.这主要在以下几个方面.首先,一些需要大量计算的统计方法,过去因计算工具不行而无法使用,有了计算机,这一切都不成问题.在战后,统计学应用愈来愈广泛,这在相当程度上要归公功于计算机,特别是对高维数据的情况.计算机的使用对统计学另一方面的影响是:按传统数理统计学理论,一个统计方法效果如何,甚至一个统计方法如何付诸实施,都有赖于决定某些统计量的分布,而这常常是极困难的.有了计算机,就提供了一个新的途径:模拟.为了把一个统计方法与其它方法比较,可以选择若干组在应用上有代表性的条件,在这些条件下,通过模拟去比较两个方法的性能如何,然后作出综合分析,这避开了理论上难以解决的难题,有极大的实用意义.。
数理统计论文.doc

浅谈数理统计摘要:数理统计学是统计学的数学基础,从数学的角度去研究统计学,为各种应用统计学提供理论支持。
它研究怎样有效地收集、整理和分析带有随机性的数据,以对所考察的问题做出推断或预测,直至为采取一定的决策和行动提供依据和建议的数学分支。
概率论作为一门研究随机现象统计规律的数学学科,已在包括控制,通讯,生物,力学,金融,社会科学以及其他工程技术等领域得到了广泛的应用。
关键字:数理统计学;发展;工程;应用;1引言数理统计是以概率论为基础,根据实验或观察到的数据,研究如何利用有效的方法对这些已知的数据进行整理,分析和推断,从而对研究对象的性质和统计规律做出合理和科学的估计和判断。
数理统计学是统计学的数学基础,从数学的角度去研究统计学,为各种应用统计学提供理论支持。
它研究怎样有效地收集、整理和分析带有随机性的数据,以对所考察的问题做出推断或预测,直至为采取一定的决策和行动提供依据和建议的数学分支。
英国是数理统计的发源地和研究中心,但从第二次世界大战开始,美国也发展得很快。
近几十年来,数理统计的广泛应用是非常引人注目的。
在社会科学中,选举人对政府意见调查、民意测验、经济价值的评估、产品销路的预测、犯罪案件的侦破等,都有数理统计的功劳。
在自然科学、军事科学、工农业生产、医疗卫生等领域,哪一个门类都离不开数理统计。
数理统计学内容庞杂,分支学科很多,难于做出一个周密而无懈可击的分类。
大体上可以划分为如下几类:第一类分支学科是抽样调查和试验设计。
它们主要讨论在观测和实验数据的收集中有关的理论和方法问题,但并非与统计推断无关。
第二类分支学科为数甚多,其任务都是讨论统计推断的原理和方法。
各分支的形成是基于:(1)特定的统计推断形式,如参数估计和假设检验。
(2)特定的统计观点,如贝叶斯统计与统计决策理论。
(3)特定的理论模型或样本结构,如非参数统计、多元统计分析、回归分析、相关分析、序贯分析,时间序列分析和随机过程统计。
概率论和数理统计起源11页word

概率论和数理统计起源(1)从随机现象谈起在自然界和现实生活中,一切事物都是相互联系和不断发展的。
在它们彼此间的联系和发展中,根据它们是否有必然的因果关系,可以分成截然不同的两大类:一类是确定性的现象。
这类现象是在一定条件下,必定会导致某种确定的结果。
举例来说,在标准大气压下,水加热到100度,就必然会沸腾。
又如,把铁加热到1530度的时候,必然会熔化成液态。
事物间这种联系是属于必然性的。
通常的自然科学各学科就是专门研究和认识这种必然性,寻求这类必然现象的因果关系,把握它们之间的数量规律,以达到认识世界和改造世界的目的。
另一类是不确定性的现象。
这类现象是在一定条件下,它的结果是不确定的。
举例来说,同一工人在同一车床上加工同一种零件若干个,它们的尺寸总会有些差异。
又如,在同样条件下,进行小麦品种的人工催芽试验,各颗种子的发芽情况也不尽相同,有强弱和早晚之别等等。
为什么在相同的一定条件下,会出现这种种不确定的结果呢?这是因为,我们说的“相同条件”是指一些主要条件来说的,除了这些主要条件外,还会有许多次要条件和偶然性因素影响着结果。
而这些次要的、偶然起作用的因素又是人们无法事先一一能够掌握的。
正因为这样,我们在这一类现象中,就无法用必然性的因果关系,对个别现象的结果事先作出确定的答案。
事物间这种关系是属于偶然性的,这种现象叫做偶然现象,或者叫做随机现象。
在自然界,在生产、生活中,随机现象十分普遍,也就是说随机现象是大量存在着的。
比如:拿北京地区来说,测量每年七月份的天气平均气温,每年都各有差异,不完全相同,而且也不能准确地预测来年七月份的平均气温。
这样,“北京七月份平均气温”就是随机现象。
又如,同一名工人,用同一台车床在同一条件下(同材料、同一操作规程)加工一种标准长度150毫米的零件等现象,也是随机现象。
因此,我们说随机现象就是:在同样条件下,多次进行同一试验或调查同一现象,所得结果不完全一样,而且无法准确地预测下次所得结果的现象。
数理统计学

[科目] 数学[关键词] 统计/相关系数[文件] sxbj90.doc[标题] 数理统计学[内容]数理统计学数理统计学﹝Mathematical Statistics﹞是研究大量随机现象的统计规律性的数学学科。
其核心问题是根据从总体中随机抽出的样本里所获得的信息来推断总体的性质。
数理统计学的发展可分为三个时期。
20世纪以前,是数理统计学的萌芽时期。
这个时期,总的说没有超出描述性统计的范围。
历史上最早出现的统计推断可以看作是英国统计学家J‧格兰特在1662年组织调查伦敦市死亡人数,从数量上去掌握集团的统计推断,并发表专着《从自然和政治方面观察死亡统计表》。
因此,数理统计学可认为是格兰特于17世纪60年代开创的。
格兰特对生命统计,保险统计及经济统计进行数学的研究。
这一学问曾被称为「政治算术」。
他由统计的结果发现人口出生率与死亡率相对稳定,于是提出「大数恒静定律」,成为统计学的基本原理。
这个时期,在概率论方面有较多的发展,必然影响到数理统计学的发展。
现在人们所理解的统计推断程序,最早的就是贝斯方法。
T‧贝斯在1763年发表的《论有关机遇问题的求解》对后世的统计思想影响很大。
19世纪初开始用概率模型进行数据分析。
高斯和勒让德首先把最小二乘法用于分析天文观测中的误差。
20世纪以来,最小二乘法经过俄国数学家马尔可夫和其它学者的工作,成为数理统计学中的一个重要方法。
19世纪中叶,许多数理统计学理论的新发展,几乎直接或间接地由两个人所推动。
一个是比利时统计学家A‧凯特勒,一个是英国生物学家S‧E‧高尔顿。
凯特勒的主要功绩在于使统计方法获得普遍应用。
他对天文学、数学、物理学、生物学、社会统计学及气象学等均有研究,将统计方法应用到上述研究范围上去,并强调了正态分布的用途,主张这一分布状态可以适用于许多学科范畴。
高尔顿最早把统计方法应用于生物学。
他曾到非洲考察和探险,搜集了大量资料,并投入很大精力钻研资料中所隐藏的模型与关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学起源于收集数据的活动,小至个人的事情,大至治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。
现今各国都设有统计局或相当的机构。
当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。
例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。
根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问——数理统计学的内容。
这样的统计学始于何时?恐怕难于找到一个明显的、大家公认的起点。
一种受到某些著名学者支持的观点认为,英国学者葛朗特在1662年发表的著作《关于死亡公报的自然和政治观察》,标志着这门学科的诞生。
中世纪欧洲流行黑死病,死亡的人不少。
自1604年起,伦敦教会每周发表一次“死亡公报”,记录该周内死亡的人的姓名、年龄、性别、死因。
以后还包括该周的出生情况——依据受洗的人的名单,这基本上可以反映出生的情况。
几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。
他因这一部著作被选入当年成立的英国皇家学会,反映学术界对他这一著作的承认和重视。
这是一本篇幅很小的著作,主要内容为8个表,从今天的观点看,这只是一种例行的数据整理工作,但在当时则是有原创性的科研成果,其中所提出的一些概念,在某种程度上可以说沿用至今,如数据简约(大量的、杂乱无章的数据,须注过整理、约化,才能突出其中所包含的信息)、频率稳定性(一定的事件,如“生男”、“生女”,在较长时期中有一个基本稳定的比率,这是进行统计性推断的基础)、数据纠错、生命表(反映人群中寿命分布的情况,至今仍是保险与精算的基础概念)等。
葛朗特的方法被他同时代的政治经济学家佩蒂引进到社会经济问题的研究中,他提倡在这类问题的研究中不能尚空谈,要让实际数据说话,他的工作总结在他去世后于1690年出版的《政治算术》一书中。
当然,也应当指出,他们的工作还停留在描述性的阶段,不是现代意义下的数理统计学,那时,概率论尚处在萌芽的阶段,不足以给数理统计学的发展提供充分的理论支持,但不能由此否定他们工作的重大意义,作为现代数理统计学发展的几个源头之一,他们以及后续学者在人口、社会、经济等领域的工作,特别是比利时天文学家兼统计学家凯特勒19世纪的工作,对促成现代数理统计学的诞生起了很大的作用。
数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。
早期,测量工具的精度不高,人
们希望通过多次量测获取更多的数据,以便得到对量测对象的精度更高的估计值。
量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的“拉普拉斯分布”,即是他在这研究中的一个产物,这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德19世纪初(1805)在研究慧星轨道计算时发明的“最小二乘法”,他在估计过巴黎的子午线长这一工作中,曾使用这个方法。
现今著作中把这一方法的发明归功于高斯,但高斯使用这一方法最早见诸文字是1809年,比勒让德晚。
一种现在逐步取得公认——这项发明系由二人独立做出,看来使比较妥当的。
另外一个重要成果是德国大学者高斯1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。
正态分布也常称为高斯分布,其曲线是钟形,极象颐和园中玉带桥那样的形状,故有时又称为“钟形曲线”,它反映了这样一种极普通的情况:天下形形色色的事物中,“两头小,中间大”的居多,如人的身高,太高太矮的都不多,而居于中间者占多数——当然,这只是一个极粗略的描述,要作出准确的描述,须动用高等数学的知识。
正是其数学上的特性成为其广泛应用的根据。
正态分布在数理统计学中占有极重要的地位,现今仍在常用的许多统计方法,就是建立在“所研究的量具有或近似地具有正态分布”这个假定的基础上,而经验和理论(概率论中所谓“中心极限定理”)都表明这个假定的现实性,现实世界许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。
大批生产的产品,其质量指标各有差异。
看来毫无规则,但它们在总体上服从正态分布。
这一点,显示在纷乱中有一种秩序存在,提出正态分布的高斯,一生在多个领域里面有不少重大的贡献,但在德国10马克的有高斯图像的钞票上,单只画出了正态曲线,以此可以看出人们对他这一贡献评价之高。
20世纪以前数理统计学发展的一个重要成果,是19世纪后期由英国遗传学家兼统计学家高尔顿发起,并经现代统计学的奠基人之一K·皮尔逊和其他一些英国学者所发展的统计相关与回归理论。
所谓统计相关,是指一种非决定性的关系如人的身高X与体重Y,存在一种大致的关系,表现在X大(小)时,Y也倾向于大(小),但非决定性的:由X并不能决定Y。
现实生活中和各种科技领域中,这种例子很多,如受教育年限与收入的关系,经济发展水平与人口增长速度的关系等,都是属于这种性质,统计相关的理论把这种关系的程度加以量化,而统计回归则是把有统计相关的变量,如上文的身高X和体重Y的关系的形式作近似的估计,称为回归方程,现实世界中的现象往往涉及众多变量,它们之间有错综复杂的关系,且许多属于非决定性质,相关回归理论的发明,提供了一种通过实际观察去对这种关系进行定量研究的工具,有着重大的认识和实用意义。
到20世纪初年,由于上述几个方面的发展,数理统计学已积累了很丰富的成果——在此因篇幅关系,我们不能详尽无遗地一一列举有关的重要成果,如抽样调查的理论和方法方面的进展,但是直到这时为止,我们还不能说现代意义下的数理统计学已经建立起来,其主要标志之一就是这门学问还缺乏一个统一的理论框架,这个任务在20世纪上半叶得以完成,狭义一点说可界定在1921——1938年,起主要作用的是几位大师级的人物,特别是英国的费歇尔·K·皮尔逊,发展统计假设检验理论的奈曼与E·皮尔逊和提出统计决策函数理论的瓦尔德等。
我国已故著名统计学家许宝(1910——1970)在这项工作中也卓有建树。
自二战结束迄今,数理统计学有了迅猛的发展,主要有以下三方面的原因:一是数理统计学理论框架的建立以及概率论和数学工具的进展,为统计理论在面上和向纵深的发展打开了门径和提供了手段,许多在早期比较粗略的理论和方法,在理论上得到了完善与深入,并不断提出新的研究课题;二是实用上的需要,不断提出了复杂的问题与模型,吸引了学者们的研究兴趣;三是电子计算机的发明与普及应用,一方面提供了必要的计算工具——统计方法的实施往往涉及大量数据的处理与运算,用人力无法在合理的时间内完成,所以在早年,一些统计方法人们虽然知道,但很少付诸实用,就因为是人力所难及。
计算机的出现解决了这个问题。
而赋予统计方法以现实的生命力。
同时,计算机对促进统计理论研究也有助益,统计模拟是其表现之一,在承认上述成就的同时,不少统计学家也指出这一时期发展中出现的一些问题或偏向,其中主要的一点是,数理统计学理论研究中的“数学化”气味愈来愈重,相当一部分研究工作停留在数学的层面,早期那种理论研究与现实问题密切结合的优良传统有所淡化,一些学者还提出了补救的建议,对未来统计学发展的方向进行探讨。
同时,现实问题愈来愈涉及到大量的,结构复杂的数据,按现行的数理统计学规范去处理,显得力所不及,需要一些带有根本性创新的思路,使统计学的发展登上一个新的台阶,以适应应用上的需要,考虑这一背景,有的统计学家乐观地认为数理统计学正面临一个新的突破。
在上面讲述数理统计学的发展状况时,我们着重在实际需要所起的促进作用方面,由于概率论的概念和方法是数理统计学的理论基础,概率论的进展也必然对数理统计学的发展起促进作用。