概率论公理化源头初探_程小红
概率的公理化

概率的公理化是概率论的基础,它提供了一种严格的数学框架来描述不确定性和随机现象。
概率的公理化由俄国数学家安德雷·科尔莫哥洛夫在20世纪30年代首次提出,并被广泛接受和应用。
概率的公理化基于三条基本原则,它们构成了概率论的基础。
以下是对这三条原则的详细阐述。
1. 非负性:概率是非负的。
这意味着对于任何事件A,它的概率必须大于等于零。
即P(A) ≥0。
这个原则表明概率不能为负数,即任何事件都至少有一定的可能性发生。
2. 规范性:全样本空间的概率为1。
全样本空间是指所有可能结果的集合,通常用Ω表示。
规范性要求全样本空间的概率等于1,即P(Ω) = 1。
这个原则确保所有可能结果的总和为1,表示了一定会发生某个结果的确定性。
3. 可加性:对于互斥(互不相交)事件的概率,可以通过求和计算。
如果事件A和B是互斥事件(即A和B不可能同时发生),则它们的概率之和等于它们分别的概率之和。
即P(A∪B) = P(A) + P(B)。
这个原则允许我们通过计算各个可能事件的概率来得到复合事件的概率。
在这三条基本原则的基础上,可以推导出概率论中的其他重要定理和性质。
例如,可以通过可加性原理推导出条件概率和乘法规则,用于计算事件之间的依赖关系。
条件概率是指在已知某一事件发生的条件下,另一个事件发生的概率。
乘法规则则用于计算多个事件同时发生的概率。
概率的公理化还涉及到概率空间的定义。
概率空间由样本空间Ω和一个叫做事件域的集合F组成。
事件域是样本空间的子集合的集合,它包含了我们感兴趣的所有事件。
概率被定义为一个函数P,它将事件映射到实数,即P:F→[0,1]。
满足非负性、规范性和可加性的概率函数被称为概率测度。
概率的公理化使得概率论成为一门严密的数学理论,并被广泛应用于统计学、风险管理、金融学、物理学等领域。
它提供了一种计算和分析不确定性的工具,帮助我们做出决策、预测事件的发生概率,并评估风险。
总结起来,概率的公理化是概率论的基础,它建立了一套数学框架来描述不确定性和随机现象。
概率论 龙永红 第一章

27 January 2020
华东师范大学
第一章 随机事件与概率
第28页
1.2.4 确定概率的古典方法
古典方法 设 为样本空间,若 ① 只含有限个样本点; ② 每个样本点出现的可能性相等,
则事件A的概率为: P(A) = A中样本点的个数 / 样本点总数
27 January 2020
华东师范大学
4. 设 x 表示一个沿数轴做随机运动的质点位置, 试说明下列各对事件间的关系 ① A ={|xa|<σ},B ={x a<σ} AB ② A ={x>20}, B ={x≤22} 相容 ③ A ={x>22}, B ={x<19} 不相容
27 January 2020
华东师范大学
第一章 随机事件与概率
第一章 随机事件与概率
第1页
不确定数学小插曲
1.随机数学 2逻辑学
二十世纪两大重要领域:随机科学和多值逻辑(卢卡斯) 1950年以前:随机现象-概率论统计学随机数学-气候/风险/
化工/生物/采矿/遗传 1965年:美国加州伯克南分校教授扎德开创模糊数学-电器/
智能控制/机器智能 1999陕西师大王国俊教授西安交大张文修教授3I推理模型 2007年:清华大学刘宝啶教授等提出的不确定推理模型 2005中科院高庆狮院士-新模糊集 2000年代:清华李想等研究可信性逻辑以及华中科技李凡
2. 样本点 —— 随机试验的每一个可能结果.
3. 样本空间(Ω) —— 随机试验的所有样本点构成的集合.
4. 两类样本空间: 离散样本空间 样本点的个数为有限个或可列个. 连续样本空间 样本点的个数为无限不可列个.
27 January 2020
华东师范大学
概率公理化的定义

概率公理化的定义概率公理化是概率论的基本公理系统,用于定义和推导概率的性质和规则。
它由三个基本公理组成,分别是非负性公理、规范性公理和可列可加性公理。
首先,非负性公理指出概率是一个非负的实数,即概率值始终大于或等于零。
这是因为概率是表示事件发生的可能性的度量,而任何事件的发生概率都不应该是负数。
因此,对于任何事件A,其概率P(A)满足P(A)≥0。
其次,规范性公理指出概率的最大值是1,即整个样本空间的概率是1。
样本空间是所有可能事件的集合,而其中的某一个事件一定会发生。
因此,整个样本空间的概率等于1。
即对于整个样本空间S,有P(S) = 1。
最后,可列可加性公理是概率公理化的核心内容,它指出对于任意可列个互不相容的事件Ai(i=1,2,3,...),其概率P(Ai)的和等于它们各自概率的和。
这表示当我们考虑多个事件同时发生的情况时,可以将它们的概率逐个相加来求得总概率。
即对于事件A1,A2,A3,...,有P(A1∪A2∪A3∪...) =P(A1) + P(A2) + P(A3) + ...。
这三个基本公理共同构成了概率公理化的定义,通过这些公理我们可以进行概率的形式化描述和推导。
同时,这些公理也满足概率的一些基本性质和规则,如辅助定理、概率的有限可加性、概率的递减性等。
其中,辅助定理是基于这三个公理得到的,它指出对于事件A 和事件B,当A包含于B时,A的概率一定小于等于B的概率。
即当A⊆B时,有P(A)≤P(B)。
概率的有限可加性指出对于任意有限个互不相容的事件A1,A2,A3,...,它们的概率P(A1∪A2∪A3∪...)等于它们各自概率的和。
即对于有限个事件A1,A2,A3,...,有P(A1∪A2∪A3∪...) = P(A1) + P(A2) + P(A3) + ...。
概率的递减性指出对于事件A和事件B,当A包含于B时,B的概率一定大于等于A的概率。
即当A⊆B时,有P(B)≥P(A)。
概率论公理化源头初探

对原始文献进行综合分析 。结果 柯 尔莫 戈洛夫 ( oM rp B 10 一l8 ) 概 率论基 A H K n oo o ,93 97 的《 础 》 立 了概 率论 的公 理化体 系 , 定 了近 代概 率论 的基 础 。结 论 对概 率论 基 本 概 念 的探 讨 及 建 奠
研 究工具 的 改进 , 得概 率论 成为 一 门严 格 的数 学分 支。 使
纪的分析本身就没有严格化 , 以它为研究工具的概 率论 的严格 化 就 可想 而 知 了。虽 然 , 来分 析 的基 后
础严 密 了 , 但概 率论 公 理 化 所必 须 的测 度论 还 未发 明 , 不严 密是难 以避 免 的 。在 这种情 况下 , 故 出现 了 “ 贝特 朗悖论 ” 问题 及 对 概 率 论 基 础 概 念 —— 概 等
率— —概 率 局 限 于 实 在 的 物 质 世 界 , 有 主 观 概 也
率——反映了人们对某些事物 的一种信任程度 , 是 对 事 物 的不 确 定性 的一种 主观 判 断 ] 。
前一 种 有 以 拉 普 拉 斯 ( ir -i o a l e Per Sm n L pa , e c
维普资讯
第 6期
程小红 等 : 概率论公理化源头初探
P( A)I )发 生 的可能性 越来 越 小 ” 或者 说 , 随 ≥ 。 “ 着 n的增 大 , 件 { ( )一P( )I 事 I A A ≥ } 发生 的 概
・
科 学技术史 ・
概 率 论公 理 化 源 头初 探
程 小红 杨 ,
(. 1 首都师 范大学 初 等教 育学 院, 北京
静
10 0 ) 0 1 1
10 8 ;. 00 0 2 北京 联合大学 基 础部 , 北京
概率论的创立与发展过程

概率论的创立与发展过程概率论是一门研究随机现象与事件发生的可能性的数学学科。
它的创立和发展过程可以追溯到17世纪,包括概念的提出、公理化和数学推理的发展。
概率论的起源可以追溯到古希腊和古罗马时期。
在古希腊,一些哲学家和数学家开始研究掷骰子、赌博和裁判的公正性等问题。
其中最著名的是古希腊哲学家赫拉克利特提出的“一切都是由偶然性引起的”。
古罗马时期的拉普拉斯和卡西尼等人也对概率问题进行了探索。
然而,真正的概率论的发展可以追溯到17世纪学院时期。
法国数学家帕斯卡尔被认为是概率论的奠基者之一。
在他的著作《有关圣奥纳西的信件》中,帕斯卡尔详细讨论了一个涉及赌博的问题,这个问题被称为帕斯卡悖论。
帕斯卡尔的研究对后来概率论的发展产生了深远的影响。
在18世纪,瑞士数学家伯努利兄弟进一步发展了概率理论。
他们提出了伯努利概率模型,用于描述在一系列重复试验中事件发生的概率。
之后,法国数学家拉普拉斯在他的著作《统计自然中之智慧》中将概率论与统计学相结合,建立了概率论的数学框架。
拉普拉斯将概率定义为事件发生的可能性与所有可能结果的比值,同时他提出了拉普拉斯定理,该定理描述了大数定律。
与此同时,正规化概率理论也得到了更严谨的推导。
在20世纪初,俄国数学家科尔莫哥洛夫创立了公理化概率论,即利用一组公理来系统定义概率的性质和运算规则。
科尔莫哥洛夫的公理化概率论奠定了现代概率论的基础,成为概率论的完整体系。
随着科技的进步和数学研究的深入,概率论的应用领域也不断扩展。
概率论已经被广泛地应用于金融、统计学、工程、计算机科学等领域。
它被用于模型设计和预测,如股市走势预测、风险管理和信号处理等。
总之,概率论的创立和发展经历了一个漫长的过程。
从古希腊的哲学思考到数学家们的推理,再到公理化和数学框架的建立,概率论逐渐成为一门重要的数学学科,并广泛应用于各个领域。
随着科学技术的发展,概率论的应用领域仍在不断扩展,为现代社会的发展做出了重要贡献。
概率论数数理统计论文1

2.1.1 随机事件内涵 随机事件是指在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种 规律性的事件叫做随机事件(简称事件)。随机事件通常用大写英文字母 A、B、C 等表示。 在概率论中,把具有以下三个特征的试验称为随机试验: (1) 可以在相同的条件下重复地进行 (2) 每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果; (3) 进行一次试验之前不能确定哪一个结果 会出现. 2.1.2 随机现象 自然界所观察到的现象叫做随机现象, 随机现象可分为确定性现象和随机现象。 其中确 定性现象是指在一定条件下必然发生的现象,比如太阳不会从西边升起,人一定会死等。显 著特征是出现的结果取决于条件; 随机现象是指在一定条件下可能出现也可能不出现的现象, 比如在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况:P(A)=正面或者 P(A) =反面 2.2 古典概型 17世纪,随着赌博在西欧的盛行,的正是源自赌博的问题。 研究这些赌博问题的意义, 并不在于解决了这些问题 本身,而在于人们借助对这些问题的研究,开始逐步深入理解概率的某些性质,并最终导致 概率论的诞生。 最著名的是帕斯卡与费马的通信, 他们之间的通信开创了用数学方法研究和 思考 概率问题的先河,他们被认为是概率论的启幕者。尤其是帕斯卡的工作蕴涵了概 率论“数学期望”的重要思想。这种思想成为后来惠更斯概率论工作中的一个基本思想,并 在以后相当长的时间里在古典概率论的研究中起着重要的作用。 因此读概率论发展历史的研 究既有着重要意义, 也充满了乐趣, 于是笔者对概率论几个重要时期的发展进行了简要总结 归纳。 2.2.1 古典概型内涵 古典概型是指(1)试验的样本空间只包含有限个样本点;(2)试验中每个基本事件发生 的可能性相同;同时具备以上条件的试验叫做古典概型。其样本空间可以表示为: Ω ={a1,a2,a3,a4„„an},他的每一个基本事件发生的概率都相同,为 1/n。 2.2.2 几种典型的古典概型
概率的公理化定义及其确定方法

概率的公理化定义及其确定方法随着中学教材改革的深入,许多原来只在大学教材中才出现的一些概念现在已经出现在中学教材中.但是,由于中学教材的难度的限制,很多概念和方法并没有象大学教材中叙述的那么系统、严格.本文主要针对概率的定义及其确定方法进行归纳总结.1 概率的公理化定义在概率论的发展史上,曾经有过概率的古典定义、概率的几何定义、概率的频率定义和概率的主观定义,这些定义各适合一类随机现象.为了给出适合一切随机现象的概率的最一般的定义,前苏联数学家柯尔莫哥洛夫在1933年提出了概率的公理化定义,该定义既概括了上述几种概率定义的共同特性,又避免了各自的局限性和含混之处.概率的公理化定义刻画了概率的本质,概率是集合(事件)的函数,对给定的样本空间及事件域F,若定义在F上的函数满足上述三个条件,就被称为概率.概率的公理化定义没有告诉人们如何去确定概率,它只是规定了概率应该满足的性质.历史上在公理化定义出现之前的概率的古典定义、几何定义、频率定义和主观定义都在一定的场合下给出了各自的确定概率的方法,因此在有了概率的公理化定义之1/ 7后,把它们看作确定概率的方法是恰当的.2 确定概率的古典方法确定概率的古典方法是概率论历史上最先开始研究的情形,它简单、直观,不需要做大量重复试验,只是在经验事实的基础上,对被考察事件的可能性进行逻辑分析后得出事件的概率.它的基本如下:(1)所涉及的随机现象只有有限个结果,即样本空间中只有有限个样本点,设为n;(2)每个样本点发生的可能性相等(称为等可能性);(3)若事件A含有k个样本点,则事件A的概率为P(A)=事件A 所含样本点的个数中所有样本点的个数=kn.容易验证,由上述方法确定的概率满足概率的公理化定义,这种概率模型通常称为古典概型.用古典方法求概率的关键是计算样本空间所包含的点的个数和事件A所含的样本点的个数.在我们日常生活中经常遇到可以用古典方法解决的问题,如下例:例1 设有一张电影票,甲、乙、丙三个人都想得到它,现抽签决定三人由谁得到这张电影票.设三张签分别标号为1、2和3,甲、乙、丙三个人各抽取一张,抽到标号为1的人得到电影票.证明这种抽签方法是公平的.证明这是一个典型的古典概型问题.用A表示甲得到这张电2/ 7影票,则甲、乙、丙三人抽签的结果共有6种可能,并且每种结果出现的可能性都是16,满足古典概型的条件.由于事件A含有2个样本点,因此事件A的概率为P(A)=26=13,即甲得到这张电影票的概率为13.同理可得,乙和丙得到这张电影票的概率也都是13,因此,三人得到这张电影票的概率相等,这说明抽签方法是公平的.实际生活中抽签的例子比比皆是,很多人在抽签时都抢着先抽,因为他们知道,一旦前面的人抽到了,后面的人就抽不到或者抽到的机会就变小了,这些人通常不会想到:如果前面的人没有抽到,后面的人抽到的机会会变大,因此,总的机会是相等的,这其中包含着条件概率的.而由前面的例子知道,无论先抽后抽,抽到的概率都是相等的.古典方法的局限是它只适用于样本空间中只有有限个样本点的情形,下面的几何方法适用于样本空间有无限个样本点的情形.3 确定概率的几何方法几何概率是日常生活中另一种常见的概率模型,其基本思想是:由上述方法确定的概率称作几何概率,它也满足概率的公理化定义.求几何概率的关键是对样本空间和事件A用图形描述清楚(一般用平面或者空间图形),然后计算出相关图形的度量3/ 7(一般为面积或者体积).虽然几何方法能够处理样本空间有无限个样本点的情形,但是它同样要求某种“等可能性”,有时对“等可能性”的不同理解会得到不同的答案,从而会出现自相矛盾的情形,著名的“贝特朗悖论”就是大家熟知的一个例子.下面这个例子是我在教学中遇到的一个类似于“贝特朗悖论”的例子.例2 如图,从等腰直角三角形的直角顶点C任作一条射线交斜边AB于点D,求AD的长度小于AC的长度的概率.解法一由于射线CD可以由点C和∠ACD唯一确定,从直角顶点C任作一条射线可以理解为∠ACD的取值在闭区间[0°,90°]上是“等可能的”,而AD的长度小于AC的长度当且仅当∠ACD的取值落在区间[0°,67.5°)内,从而AD的长度小于AC的长度的概率为P1=67.590=0.75.解法二设三角形ABC的直角边AC长为a,则斜边AB长为2a.由于射线CD可以由点C和D唯一确定,从直角顶点C任作一条射线可以理解为点D在斜边AB上的分布是“均匀的”,即线段AD的长度取值在区间[0,2a]上是“等可能的”,而AD的长度小于AC的长度当且仅当AD的长度取值落在区间[0,a)内,从而AD 的长度小于AC的长度的概率为P2=a2a=22.由例2可以看出,处理几何概率题目的难点是对“等可能性”4/ 7的理解.由于高中学生在初学几何概率时还没有深刻理解“等可能性”的内涵,因此,老师在处理那些类似于“贝特朗悖论”的题目时一定要慎重,最好在开始时避免在学生的练习和作业中出现这类题目,要等到时机成熟以后再讲这类题目,以加深学生对“等可能性”的内涵的理解.4 确定概率的频率方法频率方法也是确定概率的一种常用方法,其基本思想是:(1)与所考察事件A有关的随机试验可以大量重复进行;(2)在n次重复试验中,记n(A)为事件A出现的次数,称n(A)为n次重复试验中事件A的频数,称f n(A)=n(A)n为事件出现的频率;(3)随着试验重复次数n的增加,f n(A)会稳定在某一常数p附近,称这个常数为频率的稳定值,这个频率的稳定值就是所求事件A的概率.根据概率极限理论,当n趋向于无穷时,f n(A)会以概率1收敛到相应的概率p.可以验证,用上述方法确定的概率也满足概率的公理化定义.频率方法的优点是它不需要象古典方法和几何方法那样要求某种“等可能性”,人们只需要多次重复试验即可.但是,由于人们不可能把一个试验无限次的重复下去,因此要精确获得频率的稳定值是困难的,通常只能获得概率的一个近似值.5/ 7例3 抛硬币试验.历史上有不少人做过抛硬币试验,其结果如下表.试验者抛硬币次数出现正面次数频率De Morgan2 0481 0610.518 1Buffon4 0402 0480.506 9Feller10 0004 9790.497 9Pearson12 0006 0190.501 6Pearson24 00012 0120.500 5 在很多概率题目中,会出现“均匀硬币”、“均匀骰子”之类的字样,如:抛掷一枚均匀的硬币5次,求出现2次正面的概率.这类问题可以用古典方法求相应的概率.由于假设硬币是均匀的,因此每抛掷一次硬币,出现正面的概率都是0.5.但是,在现实生活中,“均匀”只是一种理想的假设,不会存在绝对“均匀”的硬币.先不说上面表格中的试验者用的是否是同一枚硬币,即使假设他们用的是同一枚硬币,那么抛掷一次这枚硬币出现正面的概率应该是多少?是0.5,还是平均值(0.5181+0.5069+0.4979+0.5016+0.5005)/5=0.505,亦或是中位数0.5016呢?通常大家会选0.5作为一个近似值.如果他们用的不是同一枚硬币,那么我们估计这个概率就没有意义了,因为抛掷不同的硬币出现正面的概率通常是不同的,此时我们只能得到抛掷这些硬币得到正面的各自不同的概率的近似值.5 确定概率的主观方法在现实世界里有一些随机现象是不能重复或者不能大量重6/ 7复的,它们也不具有某种“等可能性”,因此不能用上面的三种方法确定有关事件的概率,这时我们应该怎么确定其概率呢?统计界的贝叶斯学派认为:一个事件的概率是人们根据经验对该事件发生的可能性所给出的个人信念.这样给出的概率称为主观概率.如在气象预报中常常会说:“明天下雨的概率是25%”,这是气象专家根据气象专业知识和最近的气象情况给出的主观概率.由于主观给定的概率没有明确的公式,因此,确定主观概率时要使其符合公理化的定义.主观概率和主观臆造有着本质的不同,前者要求当事人对所考察的事件有透彻的了解和丰富的经验,并能对历史和当时的进行仔细分析,如此确定的主观概率是可信的.用主观方法得出的概率本质上是对随机事件概率的一种推断,其精确性有待实践的检验和修正,但结论的可信性在统计意义上是有其价值的.在遇到的随机现象无法大量重复时,用主观方法去做决策和判断是适合的.因此,主观方法是频率方法的一种补充.以上是对概率的公理化定义及其确定方法的总结,应该在教学中与现实生活结合起来,灵活运用,加深学生对概率定义及其确定方法的理解.7/ 7。
概率公理化的定义

概率公理化的定义概率公理化是概率论的基础,是概率论建立在严谨的数学基础上的关键概念。
概率公理化的定义包括三个基本要素:样本空间、事件和概率。
我们来定义样本空间。
样本空间是指一个随机试验的所有可能结果的集合。
例如,抛一个硬币的样本空间可以是{正面,反面},而掷一个骰子的样本空间可以是{1,2,3,4,5,6}。
我们来定义事件。
事件是样本空间的一个子集,表示我们感兴趣的一些结果。
例如,在抛一个硬币的试验中,正面朝上可以是一个事件,反面朝上也可以是一个事件。
我们来定义概率。
概率是对事件发生的可能性的度量。
概率的取值范围是0到1之间,表示不可能事件到必然事件之间的程度。
概率为0表示事件不可能发生,概率为1表示事件一定会发生。
根据概率公理化的定义,我们可以得出以下三个公理:1. 非负性公理:对于任何事件A,它的概率P(A)大于等于0。
这个公理保证了概率的取值范围是非负的。
2. 规范性公理:对于样本空间Ω,它的概率P(Ω)等于1。
这个公理保证了样本空间中的所有结果发生的总和是确定的。
3. 可列可加性公理:对于任意个两两互不相容的事件A1,A2,A3...,它们的并集的概率等于它们各自概率的和。
即P(A1∪A2∪A3...) = P(A1) + P(A2) + P(A3) + ...。
这个公理保证了概率在集合运算下的可加性。
通过这三个公理,我们可以推导出概率论的一些基本性质,例如:互补事件的概率之和为1,两个事件的交集的概率不会超过它们各自的概率之和等等。
概率公理化的定义为概率论提供了一个严密的数学基础,使得我们可以用数学的方法来研究和描述随机事件的概率。
通过概率公理化的定义,我们可以进行概率计算、推导概率分布以及进行统计推断等等,从而在实际问题中应用概率论的知识。
总结起来,概率公理化的定义是概率论的基础,它通过样本空间、事件和概率三个要素来描述随机事件的概率。
概率公理化的定义包括非负性公理、规范性公理和可列可加性公理,它们为概率论提供了一个严谨的数学框架,使得我们可以应用概率论的知识来解决实际问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西北大学学报(自然科学版)2007年12月,第37卷第6期,D ec.,2007,V o.l37,N o.6Journal o fN o rt hwest U niversity(N atural Science Ed iti on)收稿日期:2007 09 04基金项目:国家自然科学基金资助项目(10671053)作者简介:程小红(1973 ),女,辽宁葫芦岛人,首都师范大学讲师,从事近现代数学史和数学教育研究。
科学技术史概率论公理化源头初探程小红1,杨 静2(1.首都师范大学初等教育学院,北京 100080;2.北京联合大学基础部,北京 100101)摘要:目的 鉴于概率论公理化在概率论历史上的重要性,尝试研究其产生的背景和过程。
方法对原始文献进行综合分析。
结果 柯尔莫戈洛夫( !∀#!∃!%!&,1903 1987)的 概率论基础 建立了概率论的公理化体系,奠定了近代概率论的基础。
结论 对概率论基本概念的探讨及研究工具的改进,使得概率论成为一门严格的数学分支。
关 键 词:概率论;公理化;柯尔莫戈洛夫( !∀#!∃!%!&,1903 1987)中图分类号:O112 文献标识码:A 文章编号:1000 274 (2007)06 1026 03概率论公理化在概率论历史上占有十分重要的地位,因为自此之后,概率论才真正变为一门演绎的数学学科。
1 严密化的需求概率论在17世纪中叶由研究赌博问题而诞生[1]。
到了19世纪,由于获得新的研究动机以及分析方法的引入,使得概率论获得了重要进展。
可是在发展过程中,概率论没能演绎成一门逻辑上完美的数学学科,它的基础存在着缺陷。
这是因为19世纪的分析本身就没有严格化,以它为研究工具的概率论的严格化就可想而知了。
虽然,后来分析的基础严密了,但概率论公理化所必须的测度论还未发明,故不严密是难以避免的。
在这种情况下,出现了贝特朗悖论 等问题及对概率论基础概念 概率的深入思考。
贝特朗悖论 是由法国数学家贝特朗(J.B ertrand,1822 1900)在 概率论 一书中首先提出的:在半径为1的圆内随机地取一条弦,问其长超过该圆内接等边三角形的边长的概率为多少?贝特朗用3种不同的解法,得到了3个不同的结果[2]。
这似乎与数学论断的确定不变性相矛盾。
同一时期还出现了许多悖论,这些问题不仅推动数学家更加精确地用公式表示问题的条件,而且促使人们思考概率论的基础问题,其中尤为突出的是对概率这一基本概念的认识。
历史上出现了对概率的各种认识,既有实体概率 概率局限于实在的物质世界,也有主观概率 反映了人们对某些事物的一种信任程度,是对事物的不确定性的一种主观判断[3]。
前一种有以拉普拉斯(P i e rre S i m on Laplace,1749 1827)为代表提出的古典定义:事件的概率等于有利于事件的结果数与所有可能的结果数之比。
然而,这种定义讨论的对象局限于随机试验所有可能结果为有限个等可能的情形。
若随机试验中的基本事件有无穷多个,且每个基本事件发生是等可能的,这时就不能使用古典概率,于是产生了几何概率。
随着人们遇到问题的复杂程度的增加等可能性逐渐暴露出它的弱点,特别是对于同一事件,可以从不同的等可能性角度算出不同的概率,从而产生了种种悖论。
另一方面,随着经验的积累,人们逐渐认识到,在做大量重复试验时,随着试验次数的增加,一个事件出现的频率会集中在该事件的概率,这就是概率的频率定义。
当试验次数n充分大时,频率f n(A)越来越接近于概率P(A)。
频率f n(A)越来越接近于P(A) 的含义是指 随着n的增大,(|f n(A)-P(A)| )发生的可能性越来越小 。
或者说, 随着n的增大,事件{|f n(A)-P(A)| }发生的概率趋向于0 。
我们可以看出:一方面 频率接近于概率 表明概率是一个客观存在,并且频率可以作为概率的近似值;另一方面,频率接近于概率的含义本身却又需要通过 概率趋于0 来描述[4]。
上述这些问题使得一些人对当时的概率论中的一些概念和方法产生了怀疑。
于是,人们不得不探讨解决的办法,而解决的办法就是完善概率论自身的理论基础。
于是,1900年希尔伯特(David H il ber,t1862 1943)在巴黎国际数学家大会上所作的著名的报告中的第6问题,就呼吁把概率论公理化[5]。
由此,概率论公理化成为当时数学及整个自然科学的最迫切的问题之一。
2 最初的尝试20世纪初,许多数学家尝试解决这个问题。
最早对概率论严格化进行尝试的是俄国数学家伯恩斯坦( . . !∀# ∃!,1880 1968)。
1927年伯恩斯坦 概率论 第一版出版,书中给出了一个详细的概率论公理体系。
他假定了一个我们在自然科学中进行推理所依据的基本方案,即 根据以往的经验,我们断言,只要给定的条件集合 实现,属于已知类的事件A就必然发生,这和任何其他因素都无关 。
然而,一般而言一个事件不可能绝对出现。
人们不能完全确切地预言真实现象的行为。
只有当条件集合 不太大,而且易于观测时,把 和A联系起来的规律才有实际意义。
如果这个条件不成立,事件A就叫做随机事件。
然后,他试着引进一个简单点的条件集合 来代替 ,它(至少在理论上)可以重复实现无限多次,当 存在时,给定试验中事件A以一个明确的概率发生,而且这个概率可以用数值表示。
如果也定义了事件B的概率,那么下面3个关系必有一个成立:P(A)=P(B);P(A)>P(B);P(A)<P(B)。
然后,伯恩斯坦引进了3个公理: 概率的可比较性公理; 不相容事件公理; 事件组合公理。
前两个公理考虑了条件集合 固定的情况。
第三个公理把条件 下A的概率与不同的条件集合 下同一事件的概率联系起来[6]。
伯恩斯坦就在这3个公理的基础之上构造了概率论的整个大厦。
正像柯尔莫戈洛夫( ! ∀ # ∃,1903 1987)所指出的,第一个系统的概率论公理化体系是伯恩斯坦给出的,他建立的基础是,根据随机事件的概率对事件做定性比较的思想。
在定性比较这一思想中概率的数值似乎是推导而来的,而不是一个基本概念。
因此,伯恩斯坦的工作并没有真正解决问题。
上面已经提到,概率概念是公理化概率论的基础,人们对此有着不同的理解。
当时出现了许多对这些认识的评论,其中最著名的是米泽斯(R.von M ises,1883 1953)的工作。
他的主要工作是概率论的频率定义和统计定义的公理化,他在 概率、统计和真理 (1928)一书中建立了频率的极限理论。
他明确强调,概率概念只有在大量现象存在时才有意义。
米泽斯的频率理论中最根本的概念是 集体 概念。
集体是由相似的事件或过程组成的无限序列K,每个事件确定一个给定的有限维空间R的某个点。
他把一事件的概率定义为该事件在独立重复随机试验中出现的频率的极限,并把此极限的存在性作为他的第一条公理。
他的第二条公理是,对随机选取的子试验序列,事件出现的频率的极限也存在并且极限值相等。
严格说来,第二条公理没有明确的数学含义。
因此,这种所谓公理化在数学上是不可取的。
虽然,频率定义在直观上易于理解,易为实际工作者和物理学家所接受,便于在实际工作中应用。
但是,像某个事件在一独立重复试验序列中出现无穷多次这一事件的概率,米泽斯理论是无法定义的。
因此,他们的公理理论都是不尽如人意的。
3 公理化的建立从20世纪20年代开始,概率论的研究类型在很大程度上是由集合论和函数论的思想所决定的。
通过对概率论基本概念 事件与概率的仔细分析,可以发现事件的运算与集合的运算完全类似,概率与测度有相同的性质。
这成为建立概率论逻辑基础的正确道路。
在这方面的研究最卓著的是柯尔莫戈洛夫[7]。
概率论中一个十分重要的定律就是大数定律。
自第一个大数定律建立起,数学家们对它进行了深入的研究,这些研究实质上是对大数定律条件的推广,即扩大了满足定律的随机变量序列的范围,其科学价值在于发现了大数定律的一般条件,而这揭示了平均值的统计稳定性,即随机的规律性。
其中,马尔科夫(A.A.M apkob,1856 1922)在这方面的工作值得称赞,他削弱了中心极限定理与大数定律的1027第6期 程小红等:概率论公理化源头初探条件限制,把随机变量互相独立的情况推广到变量相关的情况,把相关随机变量引入概率论研究[8]。
马尔科夫推广了大数定律的适用性,但他没有得到这个问题的明确解答。
只有通过函数论的方法和概念,才能建立大数定律适用性的充分必要条件。
1926年,柯尔莫戈洛夫得到了这些条件。
他证明了下列定理:一列互相独立的随机变量 1, 2, , n 服从(弱)大数定律,当且仅当,n 时满足下列关系:1)nk =1|x | nd F k (x ) 0;2)(1/n)nk=1|x |<nx d F k(x ) 0;3)(1/n 2) nk=1|x |<nx 2d F k(x ) 0。
这里F k (x )表示P ( k -M k <x )。
这个定理完全解决了概率论的一个中心问题 (弱)大数定律。
法国数学家博雷尔(E .Borel ,1871 1956)于1909年得到强大数定律:设m 是事件A 在n 次试验中出现的次数,在每次试验中事件A 出现的概率均为p,则有P li m n m n=p =1。
他解决的是p =12时伯努利概型的情况。
在所有这些研究中,与度量函数论的相似之处起了重要的作用,特别是弱大数定律类似于测度中的收敛概念,强大数定律类似于处处收敛。
正是由于对大数定律的深入研究,使得概率与测度论的联系愈来愈明显,从而度量函数的思想越来越深入地渗透到概率论中。
从20世纪20年代中期开始,柯尔莫戈洛夫开始从事这些新思想的明确阐述。
1933年,柯尔莫戈洛夫以德文出版了他的经典性著作 概率论基础 ,这可以说是概率论的一个里程碑。
他建立了在测度论基础上的概率论的公理化体系,奠定了近代概率论的基础。
这本书中建立起了集合测度与事件概率的类比,积分与数学期望的类比,函数正交性与随机变量独立性的类比等等。
这种广泛的类比终于赋予了概率论以演绎数学的特征[9]。
这一公理体系着眼于规定事件及事件概率的最基本的性质和关系,并用这些规定来表明概率的运算法则。
它们是从客观实际中抽象出来的,既概括了概率的古典定义、几何定义及频率定义的基本特征,又避免了各自的局限性和含混之处。
这样,概率论就从半物理性质的科学变成严格的数学分支,和所有其他数学分支一样建立在同样的逻辑基础之上。
参考文献:[1] 徐传胜,吕建荣.亚伯拉罕 棣莫弗的概率思想与正态概率曲线[J].西北大学学报:自然科学版,2006,36(2):339 343.[2] S HEYN IN O.Ber trand s w ork on probability[J].A rch i vesf o r H i story of the Ex act Sc ience ,1994,48:155 199.[3] 张尧庭,陈汉峰.贝叶斯统计推断[M ].北京:科学出版社,1991:230 231.[4] 苏淳.概率论[M ].北京:科学出版社,2004:36.[5] CAL I NGER R.C l assi cs ofM a t he m atics[M ].N ew Jersey :P ren tice H a l,l 1995:708.[6] M A IS TROV L E .P robab ility theo ry :a histo rical sketch[M ].N e w Y ork :A cadem ic P ress ,1974:249 252,254256,261 262.[7] 李文林.文明之光-图说数学史[M ].济南:山东教育出版社,2005:137 138.[8]S HEYN I N O B ,M ARKOV S A A.W ork on probab ili ty [J].A rch i ves for H isto ry o f the Exact Sc i ence ,1989,39:337 377.[9] 李文林.数学史教程[M ].北京:高等教育出版社,2000:290.(编 辑 姚 远)The st udy of the origin of t he probabilit y theory s axio matizationCHENG X i ao hong 1,YANG Ji ng2(1.Co ll ege of E le m en tary Educationa,l Cap ita lN or m a lU n i ve rsity ,Be ijing 100080,Ch i na ;2.D epart m ent of Basic Sub j ects ,Be iji ng Un i on U n i versti y ,Be iji ng 100101,Ch i na)Abst ract :A i m To study the background and developm ent of probab ility s ax i o m atizati o n i n vie w o f its i m portance i n the histo r y of the theory .M et hods Co m prehensive ana l y sis o f t h e o ri g i n al literatures .R esults Foundati o ns o f t h e Theory of Probability w ritten by A.N.Ko l m ogorov(1903 1987)estab lishes the ax io m atics of probab ility t h eo ry and lays a foundation for m odern t h eo r y of pr obab ility .C onclusion The study of the funda m enta l concepts and i m pr ove m ent of the tools m ake the probab ility theo r y beco m e a rigo r ous m athe m atical branch .K ey w ords :theory o f probability ;ax i o m atizaiton ;A.N.Ko l m ogorov(1903 1987)1028 西北大学学报(自然科学版) 第37卷。