大数定律及其应用( 刘胜举200702014001)
概率论中的大数定律的解读与应用

概率论中的大数定律的解读与应用概率论作为一门重要的数学分支,研究的是随机事件的规律性和不确定性。
在概率论中,大数定律是一条非常重要的定律,它描述了随机事件在重复试验中的长期平均行为。
本文将对大数定律进行解读,并探讨其在实际应用中的意义。
首先,我们来了解一下大数定律的基本概念。
大数定律是指在独立重复试验的条件下,随着试验次数的增加,随机事件的频率将趋于其概率。
换句话说,如果我们进行足够多次的试验,那么事件发生的频率将接近于事件发生的概率。
这个定律的重要性在于它揭示了随机事件的长期规律性,使我们能够对未知的随机事件进行预测和分析。
大数定律有两种主要形式,即辛钦大数定律和伯努利大数定律。
辛钦大数定律又称为弱大数定律,它指出当试验次数趋于无穷大时,随机事件的频率将收敛于其概率。
伯努利大数定律又称为强大数定律,它要求试验序列必须是独立同分布的,并且当试验次数趋于无穷大时,随机事件的频率几乎必定收敛于其概率。
大数定律在实际应用中有着广泛的意义和应用价值。
首先,大数定律提供了一种有效的方法来估计随机事件的概率。
通过进行足够多次的试验,我们可以计算事件发生的频率,并将其作为事件概率的估计值。
这种方法在统计学中被广泛应用,可以用来估计样本的均值、方差等参数。
其次,大数定律在风险管理和金融领域中也有着重要的应用。
在金融市场中,价格的波动和变动往往是随机的,无法准确预测。
然而,通过大数定律,我们可以根据历史数据和试验结果,对未来的价格走势进行一定程度的预测和分析。
这对于投资者和风险管理者来说,具有重要的参考价值。
此外,大数定律还可以用来解释一些看似随机的现象。
例如,赌场中的赌博游戏,尽管每一局都是随机的,但通过进行足够多的试验,我们可以发现赌场总是能够赚取利润。
这是因为赌场利用了大数定律,确保了长期的盈利。
类似地,大数定律也可以解释为什么在大规模的抽奖活动中,中奖者总是符合一定的概率分布。
总之,概率论中的大数定律是一条重要的定律,它揭示了随机事件的长期规律性。
大数定律在统计学中的应用

大数定律在统计学中的应用
大数定律在统计学中有着广泛的应用。
它揭示了一个重要规律:当试验次数足够多时,随机事件的频率趋近于其概率。
这一原理为统计学提供了坚实的理论基础,使得我们能够对大量数据进行准确分析和预测。
首先,大数定律在抽样调查中发挥着关键作用。
在实践中,我们通常无法对总体中的每个个体进行精确测量,因此需要通过抽样来估计总体的性质。
大数定律确保了样本均值在样本量足够大时趋近于总体均值,因此我们可以通过对大量样本的分析来推断总体的特征。
这使得抽样调查成为一种高效且准确的方法,广泛应用于市场调研、民意调查和质量控制等领域。
其次,大数定律在频率稳定性方面也具有重要应用。
在统计学中,我们常常需要比较不同样本的统计量是否相同。
大数定律告诉我们,当样本量足够大时,样本统计量的概率分布趋近于稳定,因此我们可以比较不同样本的统计量来判断它们是否来自同一总体。
这种比较方法对于检验假设、评估差异和进行统计推断具有重要意义。
此外,大数定律还在中心极限定理中发挥了重要作用。
中心极限定理指出,无论总体分布是什么形状,只要样本量足够大,样本均值的分布就会趋近于正态分布。
这一原理使得我们能够利用正态分布的性质来分析样本均值,从而进行更准确的统计推断和估计。
总之,大数定律作为统计学中的重要原理,在抽样调查、频率稳定性和中心极限定理等方面都有着广泛的应用。
它帮助我们准确分析和预测大量数据,为统计学提供了理论基础和实践指导。
大数定理及其在生活中的应用

大数定理及其在生活中的应用摘要:大数定律是随机现象统计规律性的具体表现,它在概率论与数理统计中一直占着重要地位。
本文介绍了几种常用的大数定律,并给出一些简单应用,同时列写了一些生活中的大数。
关键词:大数定律历史应用大数概率论与数理统计是研究随机现象的统计规律的学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验和观察才会呈现出来。
在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
也就是说,大数定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
概率论历史上第一个极限定理属于贝努里,后人称之为“大数定律”,又称弱大数理论,贝努里对微积分、微分方程、变分法,尤其是概率论的奠基性研究做出了重要贡献。
切比雪夫第一个给出伯努利大数定理的严格证明。
辛钦大数定律是辛钦在1929 年证得,证明的主要工具是特征函数。
常用的大数定理:(1)切贝雪夫大数定理:设是一列两两相互独立的随机变量,服从同一分布,且存在有限的数学期望a和方差σ2,则对任意小的正数ε,有:该定律的含义是:当n很大,服从同一分布的随机变量的算术平均数将依概率接近于这些随机变量的数学期望。
(2)贝努里大数定律:设μn是n次独立试验中事件A发生的次数,且事件A在每次试验中发生的概率为P,则对任意正数ε,有:该定律是切贝雪夫大数定律的特例,其含义是:当n足够大时,事件A出现的频率将几乎接近于其发生的概率,即频率的稳定性。
(3)辛钦大数定律:设为独立同分布的随机变量序列,若Xi的数学期望存在,则服从大数定律:即对任意的ε>0 有:生活中的应用:(1)如果我们向上抛一枚硬币,硬币落下后哪一面朝上是不可预知的,但当我们上抛硬币的次数足够多后,达到上万次甚至几十万几百万次后,我们就会发现,硬币每一面向上的次数约占总次数的二分之一,也就是正面向上还是反面向上是等概率的。
(2)如果称量某个物体的重量,由于精度等各种因素的影响,当对同一物体重复称量多次时,可能会得到多个不同的数值,当称量次数的增加后,平均值逐渐接近于物体的真实重量。
大数定律在概率论中的应用

大数定律在概率论中的应用概率论是数学的一个重要分支,它研究的是随机现象和概率规律。
在概率论的发展过程中,大数定律是一个十分重要的概念。
大数定律指出,当试验次数足够多时,随机事件的频率将接近于其概率。
本文将重点探讨大数定律在概率论中的应用,并展示它在实际问题中的重要性。
一、大数定律概述大数定律是概率论的核心内容之一,它主要研究随机试验次数足够多时,事件发生频率的稳定性。
大数定律包括弱大数定律和强大数定律两类,其中弱大数定律是指事件发生频率的期望值可以逼近其概率值,而强大数定律则是指事件发生频率的几乎必然收敛于其概率值。
二、大数定律的应用1. 投资收益率大数定律在金融领域中有广泛的应用。
比如,当投资者进行大量投资时,根据大数定律,投资收益率的均值将逐渐接近投资组合的期望收益率。
这对于评估投资风险和预测未来收益具有重要意义。
2. 统计调查在统计调查中,大数定律可以保证样本的代表性和可信度。
通过采集足够多的样本,可以使样本统计量接近总体参数,从而得到对总体的准确推断。
这在社会调查、市场研究等领域中具有重要应用价值。
3. 数字模拟数字模拟是一种通过计算机模拟随机实验的方法,用于分析复杂系统的行为。
大数定律在数字模拟中扮演着重要的角色,通过大量的模拟实验,可以得到收敛准确的近似解。
这在工程设计、风险评估等领域中被广泛使用。
4. 股票市场分析大数定律在股票市场分析中有着重要的应用。
通过分析历史数据并进行足够多的交易,可以根据大数定律,得到股票价格的趋势和波动范围,从而指导投资决策。
5. 生物统计学在生物统计学中,大数定律可用于描述生物学实验结果的稳定性。
通过重复实验并取得足够多的样本,可以保证实验结果的可靠性,为疾病治疗、药品研发等提供科学依据。
三、大数定律的重要性大数定律在概率论中的应用广泛且重要。
它为我们理解和分析随机事件提供了可靠的数学基础,有助于我们从大量试验中总结规律,并为实际问题的解决提供准确的依据。
大数定律与中心极限定理的关系及其应用

论文题目:大数定律与中心极限定理的关系及其应用摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.关键词:随机变量序列;大数定律;中心极限定理;应用ITitle:Law of large numbers and the relationship between the centrallimit theorem and its applicationAbstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Keywords: Random variables ; Law of large numbers; Central limit theorem; ApplicationII目录摘要 (I)Abstract (II)第1章引言 (1)第2章大数定律及其证明 (2)2.1 几个相关定义 (2)2.2 大数定律及其证明 (4)第3章中心极限定理 (8)3.1 中心极限定理的提法 (8)第4章大数定律与中心极限定理的关系 (11)4.1 服从大数定律, 但不服从中心极限定理 (11)4.2 服从中心极限定理, 但不服从大数定律 (12)4.3 大数定律与中心极限定理都不服从 (13)4.4 大数定律、中心极限定理都服从 (13)第5章应用 (14)5.1“概率”及“数学期望”的确切定义 (14)5.2 解释测量(随机) 误差 (14)5.3 在数学分析中的应用 (15)5.4 在计算精确的近似概率方面的应用 (16)5.5 在彩票和保险业的应用 (17)结语 (20)参考文献 (21)致谢 (22)附录 (23)IIIIV第1章引言概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.第 1 页共27页第 2 页 共 27 页第2章 大数定律及其证明2.1 几个相关定义定义1[1] 设n (1,2,)n ξ= 为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:l i m {}0nn p ξξε→∞-≥=或lim {}1n n p ξξε→∞-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞=或pn ξξ−−→.定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的0ε>.恒有:1111lim (())1nniin i i p E nnξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律.定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒有:11lim ()1nin n i p a nξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律.注:定义2和定义3两种大数定律定义的讨论所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大量随机现象即{}n ξ的平均结果是11nii n ξ=∑(n 充分大),其平均值是11()nii E nξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有11l i m ()1ni n n i pa nξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{11()nii E nξ=∑}之间的关系.首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,11lim (())0nn in i p a E nξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取11()nn ii a E nξ==∑,(1n ≥).此时, 定义2 与定义第 3 页 共 27页3 是等价的.其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连续点x ,都有li m ()()n n F x F x →∞=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .定义5 设n ()(1,2,)F x n = , ()F x 分别是随机变量(1,2,)n n ξ= 及ξ的分布函数,若()()wn F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为Ln ξξ−−→,且有: (1)若p n ξξ−−→,则Ln ξξ−−→; (2)设c 为常数,则p n c ξ−−→的充要条件是Ln c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:22{},p a σξεε-≥≤(2-1)或有22{}1p a σξεε-<≥- (2-2)称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.证 设的密度函数为()f x ,则有222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰{}22()x EX f x dx P x E X εεεε-≥==-≥⎰,第 4 页 共 27 页于是 {}2D XP x E X εε-≥≤这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和(,)a ε++∞.(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明D X 越小,则X 的取值越集中在E X 附近.这进一步说明了方差是反映随机变量取值的离散程度的.2.2 大数定律及其证明大数定律形式有很多,我们仅介绍几种最常用的大数定律. 定理1[5][6] (车比雪夫大数定律)设随机变量12n ,,,,ξξξ 相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ 而且存在正常数k ,使得对一切1,2,i = 有2i k σ<,则对任意给定的正常数ε,恒有1111lim {}1nniin i i p annξε→∞==-<=∑∑证 设11nii nξξ==∑,则ξ的数学期望和方差分别为: 111111nnni ii i i i E E E a nn nξξξ===⎛⎫===⎪⎝⎭∑∑∑,222111111n nni iii i i D D D n n nξξξσ===⎛⎫===⎪⎝⎭∑∑∑由车比雪夫不等式,对任意给定的正数ε,有11111{}nni i i i p a nnξε==≥-<∑∑=22221222{}1111ni i D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑即 211111{}1nniii i p a k n nnξεε==≥-<=-∑∑.对不等式取极限,则得1111lim {}1nniin i i p a nnξε→∞==-<=∑∑车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值11nii nξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.第 5 页 共 27页推论 1 设随机变量12n ,,,,ξξξ 相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ== ,则对任意给定的正数ε,有11lim {}1nin i p a nξε→∞=-<=∑.此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.定理 2[7](辛钦大数定律)设12n ,,,,ξξξ 是相互独立的随机变量,而且有相同是的分布,具有有限的数学期望k ,(1,2,)E a k ξ== ,则对任意给定的0ε>,有11lim {}1nkn k p a nξε→∞=-<=∑.注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.证 因为12n ,,,,ξξξ 是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t ti a t οο=++=++,其中()t ο表示关于t 的高阶无穷小量. 再由独立性知,11nk k n ξ=∑的特征函数为:1nnt t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n niat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11nk k nξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a>⎧=⎨=⎩因此,11,nLkk a nξ=−−→∑由(2)式知:11nPkk anξ=−−→∑.定理 3[8](贝努利大数定律)设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1nn p p nμε→∞-<= 或 lim {}0nn p p nμε→∞-≥=第 6 页 共 27 页证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩ 第试验不发生,,第试验发生.显然12n n Y Y Y μ=+++ ,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,k k E Y P D Y P Pk ==-= . 由定理1有 lim {}1nn p p nμε→∞-<=.此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),n B n p μ 因此:n E np μ=,n D npq μ=,()n E n pμ=,()n D n pq n μ=.在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()npq p p n nn μεε≥-<≥-→→∞,因而lim {}1nn p p nμε→∞-<=.定理 4 (泊松大数定律)设12n ,,,,ξξξ 是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.证 由定理所设可得:11E()nn ini P P nξ===∑,2221111111()()24nnnn n n iiii i i P q D D P qnnnn ξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22()10{}4n n n D P P n ξξεεε≤-≥≤≤.两边取极限,得lim {}0n n n P P ξε→∞-≥=.泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.定理5[9][10] 马尔可夫(Marrkov) 大数定律)设{}k ξ是随机变量序列,若211lim()0nk n k D nξ→∞==∑,则对任意>0ε,均有1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑,即{}k ξ服从大数定律.证 车比雪夫不等式得212111()111{}1nk nnk kkk k D np E nnξξξεε===≥-<≥-∑∑∑,取极限得:1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.第3章 中心极限定理直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.3.1 中心极限定理的提法定理 6[3][11](林德贝格——列维定理(Lindeberg-Levy)中心极限定理)设随机变量12,,ξξ 是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方差22(0),1,2,k D k ξσσ=>= ,则对任意实数x ,有22lim ()t nkx n na P x edt x ξ--∞→∞⎛⎫-⎪⎪<==Φ ⎪ ⎪⎝⎭∑ (3-1)证 设k a ξ-的特征函数为()t ϕ,1nknk na ξ=-=∑∑的特征函数为nϕ⎡⎤⎢⎥⎣⎦又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==- 于是特征函数()t ϕ有展开式:2'''22221()()(0)(0)()1()22tt t t t t t ϕϕϕϕοσο=+++=-+,从而对任意固定的t ,有22221(),2nntt t t e n n n ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而22te-是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,尽管k ξ的分布是任意的,但只要n 充分大,nkna ξ-∑近似服从标准正态分布(0,1)N .或者说,当n 很大时,独立同分布的随机变量kξ的和1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而正态分布在理论上和应用上都具有极大的重要性.若(,)B n p ξ ,则当n 很大时,有()P a b ξ⎛⎫⎛⎫≤≤≈Φ-Φ⎝定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有22lim t nkb an na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<=⎪ ⎪⎝⎭∑⎰二项分布的极限分布是正态分布 即如果(,)X B n p ,则221()()t nk b anaP a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪ ⎪⎝⎭∑⎰一般地,如果(,)X B n p ,则()P a X b P ⎛⎫≤<=≤<⎝b np a np --≈Φ-Φ说明:这个公式给出了n 较大时二项分布的概率计算方法.引理 设12,,ξξ 是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ== ,221nnkk B σ==∑,这时:(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有2211lim()()0k nnk k x a B n k n x a P x dx Bτ->→∞=-=∑⎰(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,n nj nj P x P j ξ=== ,如果对任意0τ>,有()2211lim0nj k nnnjk kj n k x a B nxa P B τ→∞=->-=∑∑则称{}k ξ满足林德贝尔格条件.定理 8 (林德贝格定理) 设独立随机变量序列12,,ξξ 满足林德贝尔格条件,则当时,对任意的,有()2211lim y nx k k n k nP a x edy B ξ--∞→∞=⎛⎫-<=⎪⎝⎭∑这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.定理 9 (李雅普诺夫定理) 设12,,ξξ 是独立随机变量序列,又k kE a ξ=,2(1,2,)k k D k ξσ== ,记221nnkk B σ==∑,若存在0δ>,使有22110,nk kk nE a n B δδξ++=-→→∞∑,则对任意的实数x ,有()2211lim y nx k k n k n P a x edy B ξ--∞→∞=⎛⎫-<= ⎪⎝⎭∑定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.第4章 大数定律与中心极限定理的关系概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.定理10[12](格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,11lim {()}1nkk n k p E nξξε→∞=-<=∑的充要条件是2221()lim[]0()nk k n k k k E E nE ξξξξ→∞=-=+-∑.定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若211()0nk k D nξ=→∑,则对0ε∀>, 有11lim {()}1nkk n k p E nξξε→∞=-<=∑.定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k nM ξ≤≤≤,且limn n nM B →∞=, 则{}k ξ服从中心极限定理.设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.4.1[12][13] 服从大数定律, 但不服从中心极限定理令(),1,1210,121k k P k α==-+,(),2,221,21k k k P k α==+,(),3,321,21k k k P k α==+,1,2,3,k = ,即()21(0)11k P k ξ==-+,()21()()21k k P k P k k ξξ===-=+可知0,k E ξ=()2221k k kD E k ξξ==+,()222111nnnk k k kB D k ξ====+∑∑因222110,n B n n nn<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为12111(0)(0,0,,0)(0)(0)nnk n kkk k k P P P P ξξξξξξ∞==========≥=∑∏∏()2111(1)021nk k ==-=>+∏若服从中心极限定理,则取120,0x x <>,有22211211()t nx kx k nP x x edt B ξ-=<<=∑, 当12,x x 充分靠近 0 时,222112t x x e dt -<. 这就出现了矛盾. 所以中心极限定理不成立.4.2 服从中心极限定理, 但不服从大数定律取,,()k k j k j P P ξα==,为1()2k P k ξ==,1()2k P k ξ=-=,1,2,,k = 可知0,k E ξ=2k D kξ=,221nn k B k ==∑, 又 3333322221(1)(1)lim limlim3(1)n n n nn nnn n n n BB B n →∞→∞→∞++-+-===-+,即 313223limlim13n n nnnn B B -→∞→∞==,()12133lim1n nnB -→∞=又 1ax k k nM n ξ≤≤≤,()1213limlim03n n nn nB n→∞→∞-==则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为2()x x R n x∈+, 为凸函数, 由琴生不等式222222222()kkkkE kE n n E n kξξξξ≥=+++,而 222222111111,244nnn k k k kkn k n n knnnn===+≥==→→∞++∑∑∑由格涅坚克定理知, {}k ξ不服从大数定律.4.3 大数定律与中心极限定理都不服从取,,()k k j k j P P ξα==,为1(2)2k k P ξ==,1(2)2k k P ξ=-=,可知0,k E ξ=4k k D ξ=,21144(41)3nnknnk k k B D ξ=====-∑∑, 当 n充分大时24n n B >,即2n n B >21112222(21)2n nn n n kk k k ξξ+==≤≤+++=-<∑∑,112nkk nB ξ=<∑故11lim (2)1(2)(2)1nkn k nP B ξ→∞=<=≠Φ-Φ-<∑可知不服从中心极限定理, 又22222222111144()44kknnnnkkknk k k k kkE E nn E n n ξξξξ====≥=>++++∑∑∑∑22111444(41),4433nknnnk n n n ===⋅-→→∞++∑,由格涅坚克定理知不服从大数定律.4.4 大数定律、中心极限定理都服从若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从. 这时有11lim (())1nkk n k P E nξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能回答. 而根据中心极限定理有22111(())()x nnkk kk k k P E P E edx nεξξεξξσ-==≤-<=-<≈∑其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.第5章 应用大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.5.1[3] “概率”及“数学期望”的确切定义在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:概率——独立重复实验中,事件A 出现的频率11nPii Pnξ=−−→∑,则该常数P 即为概率.数学期望——对于任一0ε>,有11lim ()1nin i p nξμε→∞=-<=∑,则()k E μξ=称为数学期望.5.2 解释测量(随机) 误差根据大数定律,对于随机误差12,,,n δδδ ,应有11nPii nδ=−−→∑.这说明当测量次数较多时, 实测数据的平均值11nii a nδ=+∑和预测真值a 的差值能以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,,n x x x ,如果仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?解 把(1,2,,)i x i n = 视作n 个独立同分布的随机变量的观察值,则()i E x μ=,2(),(1,2,,)i D x i n σ== .仪器第i 次测量的误差i x A -的数学期望()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,,i i Y x A i n =-= ,则i Y 也相互独立服从同一分布.在仪器无系统误差时()0i E x A -=,即有A μ=,222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦由车比雪夫定律,可得: 211lim {}1nin i p Ynσε→∞=-<=∑即 ()2211lim {}1nin i p x A nσε→∞=--<=∑从而确定,当n →∞时,随机变量()211ni i x A n=-∑依概率收敛于2σ,即当n 充分大时可以取()211nii x A n=-∑作为仪器测量误差的方差.5.3 在数学分析中的应用例2[1] 假设()22212121,,,:,0,,12n n n n nG x x x x x x x x ⎧⎫=+++≤≤≤⎨⎬⎩⎭,求其极限. 解 假设随机变量(1,2,)n n ξ= 在[]0,1上有均匀分布,而且相互独立,有112D ξ=,2112E ξ=,易见(){}22111,,2nn n n n Gn dx dx P G P ξξξξ⎧⎫=∈=++≤⎨⎬⎩⎭⎰⎰ ()()222222211111111111266nn n ii P P E P E n n nξξξξξξξ=⎧⎫⎧⎫⎧⎫=++≤=++-≤≥-≤⎨⎬⎨⎬⎨⎬⎩⎭⎩⎭⎩⎭∑ 由1,,n ξξ 独立同分布,可见221,,,n ξξ 独立同分布.根据辛钦大数定律知:2111lim ()16ni i n i p E nξξ→∞=-≤=∑从而1lim1nn G n dx dx →∞=⎰⎰ .例3 用概率方法证明维尔斯特拉斯[w eierstrass ]定理.假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收敛于函数()f x ,[],x a b ∈.证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2f x f x ε-<,只要12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:()(1)nm m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭∑,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()limnn x P nξ→∞=,[]0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0(1)1nm m n m n m C x x -=-=∑,可见()()0()(1)nmmn mn n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦∑,由此可得:()()0()(1)nm m n m n n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n mn n mm x x nnm m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=--+-- ⎪ ⎪⎝⎭⎝⎭∑∑2(1)222m m n mn n mx nkC x x kP x n δεεξδ--<⎧⎫<+-=+-≥⎨⎬⎩⎭∑. 由于对任意[]0,1x ∈,Pnxnξ−−→可见存在N ,使当时n N ≥,4nP x n kξεδ⎧⎫-≥≤⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22422n B x f x k kεεεεε-<+=+= .即()n B x 关于[]0,1x ∈一致收敛于()f x .5.4 在计算精确的近似概率方面的应用例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?解 设取出的种子中的良种粒数为X ,则1(6000,)6X B 于是1600010006E X n p ==⨯= 155(1)60001000666D X np p =-=⨯⨯=⨯(1) 要估计的规律为{}1110006060006100XP P X ⎧⎫-<=-<⎨⎬⎩⎭相当于在切比雪夫不等式中取60ε=,于是{}21110006016000610060X D X P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭ 由题意得 25111100010.23150.76856063600D X-=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6B ,可用正态分布5(1000,1000)6N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625≈Φ-Φ≈Φ-≈从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤ 的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.5.5[16][17] 在彩票和保险业的应用大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.M0.5181=2048N=1061N M==4040M0.5069N=2048N M=M0.5016N=6019=12000N M=M0.5005=24000N=12012N M==30000M0.4996N=14984N M=M0.5011N=36124=72088N M=由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112=个球.2. 每个球平均出现3.6次3. 奇数出现59次;偶数出现53次4. 小于或等于15的数47次;大于或等于16的数出现65次由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.概率分布的四条法则:1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.例 5已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?解设一年中死亡的人数为x人. 死亡概率为0.001P= ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,保险公司每年收入为10000*10100000=元,付出2000x元.(1) P(保险公司获利不少于40000 元){}=->=(1000002000)40000P x。
概率论大数定律及其应用

概率论大数定律及其应用Revised as of 23 November 2020概率论基础结课论文题目:独立随机序列的大数事件的定理与应用作者摘要:历史上第一个定理属于,后人称之为“”。
概率论中讨论的向的定律。
概率论与数理的基本定律之一,又称弱大数理论。
大数定律以严格的数学形式表达了随机现象最根本的性质—平均结果的稳定性,它是概率论中一个非常重要的定律,是随机现象统计规律性的具体表现,应用很广泛。
本文介绍了几种常用的大数定律,并分析了它们在理论与实际中的应用。
关键词:弱大数定理伯努利大数定理随机变量数学期望概率引言:“大数定律”本来是一个数学概念,又叫做“平均法则”。
在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律,通俗的说,这个定律就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。
比如,我们向上抛一枚硬币,硬币落下时哪一面朝上本身是偶然的,但当我们向上抛的硬币的次数足够多时,达到上万次甚至几十万几百万时之后,我们就会发现,硬币朝上的次数大约占总数的二分之一。
偶然之中包含着必然。
从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近,人们在实践中观察其他的一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性。
这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的个别特征无关,而且结果也不再是随机的。
深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么在什么条件下具有稳定性这就是我们大数要研究的问题。
概率与统计是研究随机现象的统计规律的学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。
然而,在大量重复试验或观察中,我们会发现,一个事件发生的频率具有稳定性,它的稳定性会随着试验次数的增多表现得越来越明显。
这种稳定性与它在在实验进行中的个别特征无关,且不再是随机的。
大数定理与中心极限定理的关系及应用汇总

大数定理与中心极限定理的关系及应用汇总大数定理和中心极限定理都是概率论中非常重要的定理,它们在概率论和统计学中有着广泛的应用。
下面我们来详细介绍它们的关系及应用。
大数定理(Law of Large Numbers)是概率论中的一个重要定理,它描述的是随机变量序列的平均值收敛于期望的情况。
大数定理主要分为弱大数定律和强大数定律。
弱大数定律指的是当样本容量趋于无穷大时,随机变量的平均值收敛于期望的概率为1;强大数定律则指的是在一些条件下,随机变量的平均值几乎处处收敛于期望,即概率为1中心极限定理(Central Limit Theorem)是概率论中另一个重要的定理,它描述的是随机变量序列的和随着样本容量的增大逼近于正态分布的现象。
中心极限定理分为三种形式:林德伯格-列维定理、德莫佛拉-拉普拉斯定理和契比雪夫不等式。
其中,林德伯格-列维定理是最早提出的版本,它陈述了独立随机变量和的分布函数在适当的标准化下会趋近于标准正态分布。
大数定理和中心极限定理的关系:大数定理和中心极限定理在一定程度上是互补的。
大数定理关注的是样本容量趋于无穷大时随机变量的平均值的收敛情况,中心极限定理则关注的是样本容量增加时和的分布趋近于正态分布的情况。
可以说,中心极限定理是大数定理的一种具体形式。
应用汇总:大数定理和中心极限定理在实际应用中有着广泛的应用。
下面我们来汇总一些常见的应用领域:1.投资与金融:大数定理可以应用在股票市场分析中,通过分析历史数据计算出平均回报率,从而预测未来的回报率。
而中心极限定理则可以用于计算股票收益率的置信区间,帮助投资者进行风险管理。
2.生物统计学:大数定理和中心极限定理在生物统计学中有着广泛的应用。
例如,通过大数定理可以估计人口中患其中一种疾病的比例,从而指导公共卫生政策制定。
而中心极限定理则可以用于计算样本均值的置信区间,帮助比较两个群体的差异性。
3.教育评估:在教育评估中,大数定理和中心极限定理可以用于计算学生的平均成绩以及学校的平均分数的置信区间。
大数定律及其应用

学号:20100401179信阳师范学院华锐学院本科毕业论文系数学与计算机科学专业数学与应用数学年级2010级姓名潘方方论文题目全概率公式在实际问题中的应用指导教师任园园职称讲师2014年5月6日目录摘要 (1)关键词 (1)Abstract (1)Key Words (1)前言 (1)1.全概率公式 (2)1.1全概率公式 (2)1.2 Bayes公式 (2)1.3全概率公式的内涵剖析 (3)2.全概率公式在实际中的应用 (3)2.1在摸彩模型下的应用 (3)2.2在医疗领域中的应用 (4)2.3在敏感问题调查中的应用 (5)2.4在抽检次品类型问题中的应用 (5)2.5在商品销售问题中的应用 (6)2.6 在系统可靠性问题中的应用 (7)2.7在生物研究中的应用 (8)3.小结 (9)参考文献 (11)致谢词 (12)全概率公式在实际问题中的应用学生姓名:潘方方学号:20100401179数学与计算机科学系数学与应用数学专业指导教师:任园园职称:讲师摘要:在概率论中,概率计算是一个重要的问题.而全概率公式是概率计算中应用较多的公式之一.本文介绍了全概率公式的定义及内涵,并给出了它在摸彩模型、医疗领域、敏感问题调查、抽检次品、商品销售、系统可靠性、生物研究等问题中的应用.关键词:概率计算;全概率公式;应用Abstract:In probability theory, probability calculation is an important question. The total probability formula is one of the more formula used in the calculation of probability. In this article, we describe the definition and connotation of the total probability formula and give its application in the lucky model, the medical field, sensitive issues survey, sampling defective, merchandise sales, system reliability, biological research and so on.Key Words:Probability calculation; The total probability formula; Applications前言概率论的基本概念是学习概率论的基础,其中心任务是阐明概率的意义和概率统计的重要法则.乘法公式、全概率公式和Bayes公式等反映了解决问题的正确思路,同时也体现了互不相容、独立和条件概率等重要概念的应用.而全概率公式作为概率论中的一个重要公式,它的基本思想就是把一个复杂的事件分解为若干个互不相容的简单事件,再通过分别计算这些简单事件的概率,最后利用概率的可加性得到最终结果.它为我们计算复杂事件的概率提供了一条简单有效的途径.全概率公式的提出,不仅推动了概率学的发展,也在学科和实际应用中起着重要的作用.随着概率论的不断发展,全概率公式也越来越广泛地应用于各个领域,成为实际生活中不可缺少的基本理论.本文首先介绍了全概率公式的定义及内涵,其次给出了全概率公式在摸彩模型、医疗领域、敏感问题调查、抽检次品、商品销售、系统可靠性、生物研究等问题中的应用,灵活使用全概率公式会给我们的解题带来很大的便利,是我们解决复杂问题的有效工具.1.全概率公式1.1全概率公式定义1.1.1 设n B B B ,,,21 为样本空间Ω的一个分割,即12,,,n B B B 互不相容,且1ni i B ==Ω ,如果()n i B P i ,,2,1,0 =>,则对任一事件A 有()()()i ni i B A P B P A P ∑==1.证明 因为()11n ni i i i A A A B AB ==⎛⎫=Ω== ⎪⎝⎭ 且12,,,n AB AB AB 互不相容,所以由可加性得()()()11n ni i i i P A P AB P AB ==⎛⎫== ⎪⎝⎭∑ ,再将()()(),1,2,,i i i P AB P B P A B i n == ,代入上式即可得到()()()i ni i B A P B P A P ∑==1.如果事件12,,,n B B B 互不相容,且1ni i B ==Ω ,则称12,,,n B B B 是完备事件组.这时()()()i ni i B A P B P A P ∑==1对任何事件A 成立.B 和B 总构成完备事件组,所以()()()()()P A P B P A B P B P A B =+.这是一个最常用的公式. 1.2 Bayes 公式定义1.2.1 设12,,,n B B B 是样本空间Ω的一个分割,即12,,,n B B B 互不相容,且1ni i B ==Ω ,如果()0P A >,()0i P B >,1,2,,i n = ,则()()()()i i i P B P A B P B A P A =.若将它与全概率公式结合起来, 就是Bayes 公式的以下的常用形式()()()()()1i i i njjj P B P A B P B A P B P A B ==∑,1,2,,i n = .一般求解概率问题都是在试验之前进行的,其结论也称为“先验概率”,而实际应用中人们往往想要得知在“结果”发生的情况下,“原因”发生的可能性大小,也就是“后验概率”.而事实上Bayes 公式就是计算后验概率的公式.利用Bayes 公式可求得后验概率并以此对先验概率进行修正.这种方法在经济分析、药物临床检验、投资等各种领域有很大的实用价值. 1.3全概率公式的内涵剖析从公式()()()i ni i B A P B P A P ∑==1中可以悟出:“全”部概率()P A 被分解成许多部分之和.它的理论和实际意义在于:在比较复杂的情况下直接算()P A 不易,但A 总是伴随着某个i B 出现,适当去构造这一组i B 往往可以简化计算.这一公式也可以从另一个角度去理解,把i B 看成导致事件A 发生的一种可能途径.对不同途径,A 发生的概率即条件概率()P A B 可能各不相同,而采取哪个途径却是随机的.直观上可理解为:在这种机制下,A 的综合概率()P A 应在最小的()i P A B 和最大的()i P A B 之间,它也不一定是所有()P A B 的算术平均,因为各途径被使用的机会()i P B 各不相同,正确的答案如所预期,应是各个()i P A B ,1,2,,i n = ,以()i P B ,1,2,,i n = 为权的加权平均值.一个形象的例子如下:某中学有若干个毕业班,各班升学率不同.其总升学率是各班升学率的加权平均,其权与各班学生数成比例.2.全概率公式在实际中的应用2.1在摸彩模型下的应用例1 设在n 张彩票中有一张奖券,求第二人摸到奖券的概率是多少?解 设i A 表示事件“第i 人摸到奖券”,1,2,,i n = .现在目的是求()2P A .因为1A 是否发生直接关系到2A 发生的概率,即()()212110,1P A A P A A n ==-. 而1A 与1A 是两个概率大于0的事件:()()1111,n P A P A n n-==. 于是由全概率公式得()()()()()2121121111101n P A P A P A A P A P A A n n n n -=+=⋅+⋅=-.这表明:摸到奖券的机会与先后次序无关.因后者可能处于“不利状况”(前者已摸到奖券),但也可能处于“有利状况”(前者没有摸到奖券,从而增加后者摸到奖券的机会),两种状况用全概率公式综合(加权平均)所得结果(机会均等)即全面又合情理. 用类似的方法可得()()()341n P A P A P A n====. 如果设n 张彩票中有()k n ≤张奖券,则()()()12n k P A P A P A n====. 这说明购买彩票时,不论先买后买,中奖机会是均等的. 2.2在医疗领域中的应用例2 假设有1,2,3,4四个地区爆发了某种传染病,通过对患病人口分布和地理环境调研后发现四个地区感染此病的概率分别为1111,,,6543,现从这四个地区中随机找到一个人,那么此人患病的概率是多少?解 令{}{}A B i ==此人患病,此人来自地区,1,2,3,4i =,由题意可知()()()()123414P B P B P B P B ====,()()()()12341111,,,6543P A B P A B P A B P A B ====.因此由全概率公式得()()()41i i i P A P B P A B ==∑11111111194645444380=⨯+⨯+⨯+⨯=.所以此人患病的概率为1980. 2.3在敏感问题调查中的应用例3 在调查家庭暴力(或婚外恋、服用兴奋剂、吸毒等敏感问题)所占家庭的比例p 时,被调查者往往不愿回答真相,这就使得调查结果失真.为得到实际的p 同时又不侵犯个人隐私,调查人员在袋中放入比例是0p 的红球和比例是001q p =-的白球.被调查者在袋中任取一球窥视后放回,并承诺取到红球就讲真话,取到白球就讲假话.被调查者只需在匿名调查表中选“是”(有家庭暴力)或“否”,然后将表放入投票箱.没人知道被调查者是否讲真话和回答的是什么.如果每个家庭回答“是”的概率是1p ,求p .解 对任选的一个家庭,用B 表示回答“是”,用A 表示取到红球.利用全概率公式得到()()()()()1p P B P B A P A P B A P A ==+ ()001pp p q =+- ()000q p q p =+-. 于是只要00p q ≠,则1000p q p p q -=-. 实际问题中,1p 是未知的,需要经过调查得到.假定调查了n 个家庭,其中有k 个家庭回答“是”,则可以用1ˆkpn=估计1p ,于是可用1000ˆˆp q pp q -=-估计p .其中00p q -越大,得到的结论越可靠.但是00p q -越大,调查方案越不易被调查者接受.2.4在抽检次品类型问题中的应用例4 要验收一批乐器共100件,从中随机取出3件测试,且3件乐器的测试是互相独立的.如果3件中任意一件音乐不纯,则拒绝接受这批乐器.设一件音色不纯的乐器经测试被查出来的概率为0.95,而一件音色纯的乐器经测试被认为不纯的概率为0.01,如果这100件乐器中有4件音色不纯,求这批乐器被接受的概率. 解 设事件i A 为“3件乐器中有i 件音色不纯”()0,1,2,3i =,事件B 为“这批乐器被接受”.0123,,,A A A A 构成完备事件组,要考察B 出现的概率,需要考虑各个i A ()0,1,2,3i =出现的情况下B 的条件概率.由全概率公式,得()()()30i i i P B P A P B A ==∑.由题设知,事件i A 的概率()()349631000,1,2,3i i i C C P A i C -==.事件{}i B A 的含义是:在3件乐器中有i 件音色不纯的情况下这批乐器被接受.这意味着:i 件音色不纯的乐器都查不出来,而()3i -件音色纯的乐器也都不能被误认为不纯,又因为3件乐器的测试是相互独立的,所以()()()()3310.9510.010.050.99iiii i P B A --=-⨯-=⨯ ()0,1,2,3i =,代入上式,得()()()333496301000.050.990.8629i ii ii C C P B C --==⨯⨯=∑.2.5在商品销售问题中的应用例5 假设某段时间内来百货公司的顾客数服从参数为λ的Poisson 分布,而在百货公司里每个顾客购买电视机的概率为p ,且顾客之间是否购买电视机的事件互相独立,试求这段时间内百货公司售出k 台电视机的概率.解 设k A 表示出售电视机k 台,i B 表示来到百货公司的顾客数为i 人,则(),0,1,2,!ii P B e i i λλ-== ,()()0,0,1,2,,1,1,,1,.i kk i k k ii k P A B C P p i k k -=-⎧⎪=⎨-=+⎪⎩所以,由全概率公式得()()()0k i k i i P A P B P A B +∞==∑()1!ii kk kii kC p p e i λλ+∞--==-∑()()!1!!!ii k ki k i p p e k i k i λλ+∞--==--∑()()()1!!i kki kp p e k i k λλλ-+∞-=-⎡⎤⎣⎦=-∑()()0,1,2,!kpp e k k λλ-== .说明百货公司所售出的电视机数仍服从Poisson 分布,参数为p λ. 2.6 在系统可靠性问题中的应用例6 元件能正常工作的概率称为该元件的可靠性,由多个元件构成的系统能正常工作的概率称为该系统的可靠性.设如图所示(见图1)系统中各元件正常工作的概率均为p ()01p <<,且各元件正常工作与否相互独立,求下列各系统正常工作的概率.图1:由元件组成的工作系统解 (1)设系统KL 正常工作的概率为KL p ,因为要是系统KL 正常工作,两条串联线路必须至少有一条正常工作,而第一条串联线路正常工作的概率为n p ,不正常工作的概率为1n p -,两条串联线路都不正常工作的概率为()21n p -,因为KLp等于不是两条串联线路都不正常工作的概率,即()()2112n n n KL p p p p =--=-.(2)类似(1),设系统MN 正常工作的概率为MN p ,则()()2112nnn MNp p p p ⎡⎤=--=-⎣⎦. 显然,当1n >时,有MN KL p p >.(3)设系统RS 正常工作的概率为RS p ,以,,,,A B C D E 表示相应元件正常工作,并设事件W 为“系统RS 正常工作”.方法一 因,,,AD ACE BE BCD 4条线路至少有一条正常工作,系统RS 就正常工作,再由加法公式得()RS p P AD ACE BE BCD =()()()()()P AD P ACE P BE P BCD P ACDE =+++-- ()()()()P ADBE P ADBC P ACEB P ACEBD ---- ()()()P BECD P ADCEB P ABCED +++()2P ABCDE 23452252p p p p =+-+. 方法二 由全概率公式和(1)、(2),得()()()()()RS p P W P C P W C P C P W C ==+()()()2222212p p p p p p =⋅-+-⋅-23452252p p p p =+-+.从上面的解题步骤我们可以看出,如果使用通常的解答方法的话,在遇到样本空间庞大,数据复杂的事件时是十分费时费力的.而用全概率公式的话就是非常简洁明了.2.7在生物研究中的应用例7 某实验室在器皿中繁殖成k 个细菌的概率为,0,0,1,2,!kk p e k k λλλ-=>= ,并设所繁殖成的每个细菌为甲类菌或乙类菌的概率相等.求下列事件的概率: (1)器皿中所繁殖的全部是甲类菌; (2)已知全是甲类菌,求恰好有2个甲类菌; (3)求所繁殖的细菌中有i 个甲类菌.解 以事件A 表示“繁殖的细菌全是甲类菌”,k B 表示“繁殖了k 个细菌”,0,1,2,k = ,i A 表示“所繁殖的细菌中有i 个甲类菌”,0,1,2,i = .(1)由全概率公式得()()()12111(1)!2kkk k k k P A P B P A B e e e k λλλλ∞∞--==⎛⎫===- ⎪⎝⎭∑∑.(2)()()()()222222112212!2(1)8(1)e P B P A B P B A P A e e e λλλλλλ--⎛⎫⎪⎝⎭===--. (3)由题意得()()11,!222ik ikk i i k i k k k e i P B P A B C C k λλ--⎛⎫⎛⎫⎛⎫=== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭.由全概率公式得()()()i k i k k iP A P B P A B ∞==∑1!2kkikk ie C k λλ∞-=⎛⎫= ⎪⎝⎭∑()!!!!2kk ik e k i k i λλ∞-=⎛⎫= ⎪-⎝⎭∑()12!2!k ii k i e i k i λλλ-∞-=⎛⎫ ⎪⎛⎫⎝⎭= ⎪-⎝⎭∑ 122!ie i λλ⎛⎫ ⎪⎝⎭= ()1,2,i = .3.小结本文对全概率公式的定义、内涵及在部分领域的应用做了简单的阐述,仅此就可以看到全概率公式在实际应用中的重要性.事实上这是由全概率公式的思想方法决定的.全概率公式的精髓之处就在于将事件分割,化繁为简、化难为易.因此我们在解答实际问题时只要遇到事件构成复杂、数据量庞大的问题时就可以考虑使用全概率公式及其推广,即使有的问题不能够使用全概率公式,我们也可以利用其思想对问题进行分析研究并求解.全概率公式在以后的科学技术领域、工农业生产及国民经济各部门中会有更加广泛的应用.如保险业务;气象、地震报告;产品的抽样检验;研发新产品中的寻求最佳生产方案;在可靠性工程中进行器件和装置使用可靠性程度和平均寿命的估算等.我们要在熟练掌握基本理论和基本方法的前提下,理论联系实际,不断提高自己分析问题和解决问题的能力.参考文献:[1] 林正炎,苏中根.概率论.[M].杭州:浙江大学出版社,2001.8.[2] 茆诗松,程依明,濮晓龙.概率论与数理统计教程.[M].北京:高等教育出版社,2011.2(2012.5重印).[3] 顾晓青.全概率公式的应用.[J].沧州师范专科学校学报,2000.6,第16卷,第3期.[4] 陈希孺.概率论与数理统计.[M].合肥:中国科学技术大学出版社,1992.5(2007.8重印).[5] 王明慈,沈恒范.概率论与数理统计.[M].北京:高等教育出版社,1999(2002重印).[6] 马晓丽,张亮.全概率公式的推广及其在保险中的应用.[J].高等数学研究,2010.6,第13卷,第1期.[7] 符方健.全概率公式及其应用技巧.[J].高等数学研究,2011.3,第14卷第2期.[8] 马元生.概率统计简明教程.[M].北京:科学出版社,2007.[9] 郭跃华.概率论与数理统计.[M].上海:科学出版社,2011.01第一版.[10] 金圣才.概率论与数理统计.[M].北京:中国石化出版社, 2005第一版.[11] 陈家鼎,郑忠国.概率与统计.[M].北京:北京大学出版社,2007.8.[12] 何书元.概率论.[M].北京:北京大学出版社,2006.1.致谢词光阴似箭,四年的大学生生活即将结束.回顾在学校度过的每个日日夜夜,感受颇多.报到第一天的情景、四年时间里发生的点点滴滴仿佛就在昨天,对于即将奔向他乡走上工作岗位的我来说,才发现自己原来是那么的不舍.在本文的写作过程中,要特别感谢我的指导老师任园园老师的指导和督促.从选题到开题报告,从写作提纲到写作定稿,倾注了任老师大量的心血.可以说,没有任老师的帮助就没有今天的这篇论文.您积极进取的工作态度、宽广的胸怀与见识、曾经教给我的许多为人处事的道理以及在面对困难时所表现出的勇气都是我一生宝贵的财富,我将带着这些财富踏上我的新的征程.在此,谨向任老师表示我最诚挚的敬意和感谢.其次,感谢我的室友们,感谢她们在我论文写作期间对我论文提出的所有建议;四年来,我们朝夕相处,共同进步,感谢她们给予我的所有关心和帮助.同窗之谊,我将终生难忘!感谢我们10级3班的同学们,感谢他们陪伴着我一起走过的风风雨雨,希望大家都能有个好的前程.最后需要特别感谢的是我的父母.父母的养育之恩无以为报,他们是我十多年求学路上的坚强后盾,在我面临人生选择的迷茫之际,为我排忧解难,他们对我无私的爱与照顾是我不断前进的动力.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本科生毕业论文(设计)题 目:大数定律及其应用 姓 名:刘胜举 学 号:200702014001 系 别:数学与计算机科学系 年 级:2007级 专 业:数学与应用数学 指导教师 熊国敏 职称: 教授 指导教师 王海英 职称: 讲师2011年 4 月 28日目录摘要 (I)第一章绪论 (1)第二章大数定律 (2)2.1大数定律的发展历史 (2)2.2几个常用的大数定律 (3)第三章大数定律的一些应用 (6)3.1大数定律在数学分析中的一些应用 (6)3.2大数定律在保险业的应用 (10)结论 (18)参考文献 (19)致谢 (20)摘要大数定律以严格的数学形式表达了随机现象最根本的性质—平均结果的稳定性,它是概率论中一个非常重要的定律,应用很广泛。
本文介绍了几种常用的大数定律,并分析了它们在理论与实际中的应用。
关键词:大数定律,概率分布,保险业Abstract:The law of large numbers describles the most fundamental of the random nature in rigorous mathematical formation—the stability of the average results .It is a very important law, and its applications are very wide. This article describes several common law of large numbers, and analyzes their theoretical and practical applications.Key words: law of large numbers, probability distribution, insurance第一章绪论概率与统计是研究随机现象的统计规律的学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。
然而,在大量重复试验或观察中,我们会发现,一个事件发生的频率具有稳定性,它的稳定性会随着试验次数的增多表现得越来越明显。
这种稳定性与它在在实验进行中的个别特征无关,且不再是随机的。
大数定律给出了稳定性的确切含义,并且给出了什么条件下才具有稳定性。
那么,这对于我们解决理论与实际问题有哪些实际意义呢?这就是我们在下面将要了解到的,大数定律的某些应用。
即,大数定律及其在理论与实际生活中的一些应用。
一方面,在理论上,大数定律可以看作是求解极限、重积分以及级数的一种新思路,另一方面,在实际生活中,保险动机的产生、保险公司财政稳定和保费的确定,我们都将看到大数定律的重要作用。
第二章大数定律2.1大数定律的发展历史概率论与数理统计是研究随机现象的统计规律的科学, 而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出: 一个事件发生的频率具有稳定性, 即随着试验次数的增多, 事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时, 也常常会发现大量随机个体的平均效果的稳定性. 这就是说, 无论个别随机个体以及它们在试验进行过程中的个别特征如何, 大量随机个体的平均效果与每一个体的特征无关, 且不再是随机的. 深入考虑后, 人们会提出这样的问题: 稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.1733年,德莫佛—拉普拉斯在分布的极限定理方面走出了根本性的一步,证明了二项分布的极限分布是正态分布。
拉普拉斯改进了他的证明并把二项分布推广为更一般的分布。
1900年,李雅普诺夫进一步推广了他们的结论,并创立了特征函数法。
这类分布极限问题是当时概率论研究的中心问题,卜里耶为之命名“中心极限定理”。
20世纪初,主要探讨使中心极限定理成立的最广泛的条件,二三十年代的林德贝尔格条件和费勒条件是独立随机变量序列情形下的显著进展。
伯努利是第一个研究这一问题的数学家,他于1713年首先提出后人称之为“大数定律”的极限定理。
因此概率论历史上第一个极限定理属于伯努利。
它是概率论与数理统计学的基本定律之一,属于弱大数定律之一,当然也称为伯努利大数定律。
它可以通俗的理解,有些随机事件无规律可循,但不少却是有规律的,这些“有规律的随机事件”中在大量重复出现的条件下,往往呈现几乎必然的统计特性,这个规律就是大数定律。
通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
例如:在重复投掷一枚硬币的随机试验中,观测投掷n次硬币中出现正面的次数。
不同的n次试验,出现正面的频率(出现正面次数与n之比)可能不同,但当试验的次数n越来越大时,出现正面的频率将大体上逐渐接近于1/2。
频率靠近概率的一种客观存在的,可以直接观察到的现象。
而伯努利给这种现象给予了一种确切的含义。
随着数学的发展,随机变量序列服从大数定律的证明,出现了更多更广泛的大数定律,例如契贝晓夫大数定律,伯努利大数定律就是契贝晓夫大数定律的一个特例。
再到后面,出现独立同分布的辛钦大数定律等常用的大数定律。
2.2几个常用的大数定律由于随机变量序列向常数的收敛有多种不同的形式,按其收敛为依概率收敛,以概率1收敛或均方收敛,分别有弱大数定律、强大数定律和均方大数定律。
定义1 设有一列随机变量1,2,ηηη…..,如果对于任意的0ε>,有()l i m 1n n P ηηε→∞-<=则称随机变量序列{}n η依概率收敛于η,记作(),pn n ηη−−→→∞。
定义2 设有随机变量η和一列随机变量{}n η ,1,2ηη…..,若(){}l i m 1n n P ηωη→∞==成立,则称{}n η几乎处处收敛于η,记作().,a en n ηη−−→→∞ 定义3 若12,,n ξξξ⋅⋅⋅⋅⋅⋅是随机变量序列,如果存在常数列1,2,a a ⋅⋅⋅,使得对任意的0ε>,有11lim 1ni n n i P a nξε→∞=⎛⎫-<= ⎪⎝⎭∑ (8)成立,则称随机变量序列{}i ξ满足大数定律.定义4 设有随机变量η和随机变量序列{}n η的r 阶原点矩r E η、rn E η(n=1,2……)存在,其中r>0,若lim 0rn n E ηη→∞-=则称nηr 次平均收敛到η。
记作 rL n ηη−−→。
此时必有r r n E E ηη=。
当r=2时是常用的二阶矩,2L n ηη−−→称为均方收敛。
定义5 若12,,n ξξξ⋅⋅⋅⋅⋅⋅是随机变量序列,它们的数学期望(1,2,.....)i E i ξ=存在,0ε∀>有11lim 1nnk k n iiE nnξξε→∞⎛⎫-<= ⎪⎝⎭∑∑则称随机变量序列12,,n ξξξ⋅⋅⋅⋅⋅⋅服从弱大数定律。
定义6 若12,,n ξξξ⋅⋅⋅⋅⋅⋅是随机变量序列,它们的数学期望(1,2,.....)i E i ξ=存在,0ε∀>有()1l i m 01nkk n iP E nξξ→∞⎧⎫-==⎨⎬⎩⎭∑或等价地.110nna ekkiiE nnξξ-−−→∑∑,则称12,,n ξξξ⋅⋅⋅⋅⋅⋅服从强大数定律。
上述两个大数定律要注意,强大数定律和弱大数定律区别不仅仅是一个法则的不同,不能简单的把极限符号lim n →∞从概率号P ()中移出来,弱大数定律描述的是一列概率的收敛性,而强大数定律说的是一列随机变量收敛到一个常数,也正是这点,保证了用事件出现的频率来作为事件概率的估计的正确性。
定理1 对任意的随机变量ξ,若E a ξ=,又D ξ存在,则对任意的正常数ε,有()2D P a ξζεε-≥≤, 则称此式子为契贝晓夫不等式。
粗糙地说,如果D ξ越大,那么()P a ζε-≥也会大一些。
大数定律形式有很多种,我们仅介绍几种最常用的大数定律。
定理2 (伯努利大数定律)设n μ是n 重伯努利实验中事件A 出现的次数,且A 在每次试验中出现的概率为p (0<p<1),则0ε∀>,有l i m 1nn P p n με→∞⎛⎫-<=⎪⎝⎭(5)此定理表明:当n 很大时,n 重伯努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定律以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。
定理3 (契贝晓夫大数定律) 设12,,n ξξξ⋅⋅⋅⋅⋅⋅是一列两两不相关的随机变量,又设它们的方差有界,即存在常数0C >,使有,1,2,3i D C i ξ≤=⋅⋅⋅,则对于任意的0ε>,有1111lim 1nni i n i i P E nnξξε→∞==⎛⎫-<=⎪⎝⎭∑∑(9)在上述的定理中,因为用到契贝晓夫不等式,都有对方差的要求,其实方差这个条件并不是必要的。
例如独立同分布时的辛钦大数定律定理4 (辛钦大数定律) 设12,,n ξξξ⋅⋅⋅⋅⋅⋅是独立同分布的随机变量序列,且有有限的数学期望()1,2i E a i ξ==⋅⋅⋅,则对于任意的0ε>,有11l i m 1ni n i P a nξε→∞=⎛⎫-<= ⎪⎝⎭∑ (10)上式也可表示为11lim pnin i anξ→∞==∑或()11npii a n nξ=−−→→∞∑,并且称11nii nξ=∑依概率 收敛于.定理5 (泊松大数定律)设12,,n ξξξ⋅⋅⋅⋅⋅⋅是相互独立的随机变量序列,()1nn P p ξ==,()0nn P q ξ==,其中1nnp q +=,则12,,n ξξξ⋅⋅⋅⋅⋅⋅服从泊松大数定律。
泊松大数定律是伯努利大数定律的推广,伯努利大数定律证明了事件在完全相同的条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时,频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近。
定理6 (马尔科夫大数定律)对于随机变量序列12,,n ξξξ⋅⋅⋅⋅⋅⋅,若有2110,n i i D n n ξ=⎛⎫→→∞ ⎪⎝⎭∑则有1111lim 1nni i n i i P E nnξξε→∞==⎛⎫-<= ⎪⎝⎭∑∑第三章 大数定律的一些应用3.1大数定律在数学分析中的一些应用3.1.1大数定律在极限、重积分上的应用大数定律本身便是概率论中非常重要的定理之一,而它与其他数学理论也有密不可分的联系,而且对这些数学理论分支有不可或缺的作用。
大数定律本身便是频率靠近概率的极限理论,是大量随机现象的平均结果稳定于平均值的极限理论。