正态分布的介绍资料
高中数学正态分布

高中数学正态分布正态分布是高中数学中一个重要的概率分布,也被称为高斯分布。
它在自然界和社会科学中具有广泛的应用,可以描述许多随机变量的分布情况。
正态分布具有许多独特的特性,包括对称性、钟形曲线、均值和标准差等。
本文将介绍正态分布的基本概念、性质以及它在实际问题中的应用。
一、基本概念正态分布是一种连续型的概率分布,它的概率密度函数可以用一个钟形曲线来表示。
钟形曲线关于均值对称,左右两边的面积相等。
正态分布的概率密度函数可以用数学公式表示,但在本文中我们不涉及具体公式。
二、性质1. 对称性:正态分布的钟形曲线关于均值轴对称,即曲线左右两侧的面积相等。
2. 峰度:正态分布的峰度较高,表示数据相对集中,没有明显的长尾巴。
3. 均值和标准差:正态分布的均值和标准差决定了曲线的位置和形状。
均值决定了曲线的中心位置,标准差决定了曲线的宽度。
三、应用举例正态分布广泛应用于各个领域,下面举几个例子说明其具体应用:1. 身高分布:人类的身高大致符合正态分布,均值是一定范围内的平均身高,标准差则决定了身高的变化范围。
2. 考试成绩:在一次考试中,学生的成绩往往呈现出正态分布的特点。
均值代表了班级的平均水平,标准差则反映了学生成绩的离散程度。
3. 生产质量控制:正态分布在生产过程中的质量控制中发挥重要作用。
通过对产品尺寸、重量等特征的测量,可以判断产品是否符合正态分布,从而进行质量控制和改进。
四、正态分布的应用思考正态分布的应用思考是高中数学中常见的问题类型之一。
通过理解正态分布的基本概念和性质,我们可以解决一些实际问题,例如:1. 求解概率:已知某一正态分布的均值和标准差,我们可以求解某个范围内的概率,从而回答一些关于随机事件的概率问题。
2. 参数估计:通过样本数据对总体的均值和标准差进行估计,从而推断总体的特征。
3. 假设检验:通过正态分布的性质,可以进行关于总体均值的假设检验,从而判断总体是否满足某种条件。
高中数学中的正态分布是一种重要的概率分布,具有广泛的应用。
概率与统计中的正态分布

概率与统计中的正态分布正态分布是概率与统计学中最为重要的概率分布之一,也被称为高斯分布。
它在自然界和人类社会中广泛存在,被用于描述各种现象的分布规律,从而对数据进行分析和预测。
本文将详细介绍正态分布的定义、性质以及应用。
一、正态分布的定义和性质正态分布是一种连续型的概率分布,可以通过其概率密度函数来描述。
这个函数的图像呈现出钟形曲线,其形状对称轴对称,且在均值处达到最大值。
正态分布的概率密度函数可由以下公式表示:f(x) = 1 / (σ√(2π)) * e^(-((x-μ)^2) / (2σ^2))其中,μ表示均值,σ表示标准差,e表示自然对数的底数。
正态分布具有以下重要的性质:1. 对称性:正态分布的概率密度函数相对于均值呈现对称性,即左右两侧的曲线形状相同。
2. 峰度:正态分布的峰度为3,表示其曲线相较于正态分布的峰度更加平坦。
3. 标准正态分布:当均值μ为0,标准差σ为1时,所得的正态分布称为标准正态分布。
标准正态分布在统计学中具有重要的作用,经过适当的转换,可以将任何正态分布转化为标准正态分布。
二、正态分布的应用正态分布在自然科学、社会科学和工程技术等领域具有广泛的应用。
下面将介绍其中几个典型的应用。
1. 统计推断:由于正态分布具有丰富的性质和可靠的统计特征,在统计学中得到了广泛应用。
通过对观测数据的分析,可以利用正态分布进行参数估计和假设检验,从而得到关于总体的推断结果。
2. 质量控制:正态分布在质量控制中有着重要的应用。
例如,在生产过程中,通过对产品质量数据的测量和分析,可以使用正态分布来确定产品是否合格以及如何调整生产过程,以确保产品符合规定的质量标准。
3. 金融市场:正态分布在金融领域中的应用广泛而重要。
许多金融市场价格变动的模型都基于正态分布。
例如,根据正态分布模型,可以计算股票价格的变动概率,评估投资风险,并进行资产配置和风险管理。
4. 人口统计学:正态分布在人口统计学中的应用主要用于研究人口特征和人口变化规律。
标准的正态分布

标准的正态分布正态分布,又称高斯分布,是概率论和统计学中最重要的连续型概率分布之一。
它具有许多重要的性质,因此在自然和社会科学中经常出现。
正态分布的形状呈钟形曲线,两侧尾部逐渐减小,呈对称分布。
在正态分布中,均值、中位数和众数是相等的,且位于分布的中心。
正态分布的密度函数可以用以下公式表示:f(x) = (1/(σ√(2π))) exp(-((x-μ)²/(2σ²)))。
其中,μ是分布的均值,σ是标准差,π是圆周率,exp是自然对数的底数。
正态分布具有许多重要的特性,其中之一是68-95-99.7法则。
这一法则指出,大约68%的数据落在均值加减一个标准差的范围内,约95%的数据落在均值加减两个标准差的范围内,约99.7%的数据落在均值加减三个标准差的范围内。
这一特性使得正态分布在统计推断中有着重要的应用,可以帮助我们对数据的分布进行初步的判断。
正态分布在自然界和社会科学中有着广泛的应用。
例如,人的身高、智力分数、体重等都呈现出正态分布的特征。
在工程和经济学中,许多随机变量的分布也可以近似地用正态分布来描述。
因此,对正态分布的理解和运用对于我们理解和分析各种数据具有重要意义。
在实际应用中,我们经常会遇到需要对数据进行正态性检验的情况。
正态性检验是指通过统计方法来判断数据是否符合正态分布。
常见的正态性检验方法包括直方图分析、QQ图检验、Shapiro-Wilk检验等。
通过对数据进行正态性检验,我们可以更好地选择适当的统计方法,从而得到更加准确的分析结果。
除了在统计学和概率论中的应用外,正态分布还在金融工程、风险管理、医学诊断等领域发挥着重要作用。
例如,在金融领域,股票价格的日收益率往往呈现出正态分布的特征,这对于风险管理和投资决策具有重要意义。
总之,正态分布作为概率论和统计学中最重要的分布之一,具有广泛的应用价值。
通过对正态分布的深入理解和运用,我们可以更好地分析和解释各种数据现象,为科学研究和实际应用提供有力支持。
正态分布所有的知识点

正态分布是统计学中一种常见的概率分布,也称为高斯分布。
它在许多实际问题的建模和分析中都有重要应用。
本文将从基本概念、性质和应用等方面介绍正态分布。
1. 基本概念正态分布是一种连续型的概率分布,其特点是呈钟形曲线,对称分布于均值周围。
正态分布的定义由两个参数确定,分别是均值μ和标准差σ。
记为N(μ, σ^2),表示随机变量X服从均值为μ,标准差为σ的正态分布。
2. 性质正态分布具有许多重要的性质,包括:2.1 对称性正态分布是关于均值对称的。
也就是说,分布在均值μ左侧的曲线与分布在均值右侧的曲线是相似的。
2.2 峰度和偏度正态分布的峰度是指其曲线的陡峭程度。
正态分布的峰度为3,称为正态分布的峰度系数。
高于3的峰度表示曲线更陡峭,低于3的峰度表示曲线更平缓。
正态分布的偏度是指其曲线的对称性。
正态分布的偏度为0,表示曲线对称。
大于0的偏度表示曲线向左偏斜,小于0的偏度表示曲线向右偏斜。
2.3 中心极限定理中心极限定理是指在一定条件下,独立同分布的随机变量之和近似服从正态分布。
这个定理在统计学中有广泛的应用,使得正态分布成为统计推断的基础。
3. 应用正态分布在实际问题中有广泛的应用,下面介绍几个常见的应用场景:3.1 统计推断正态分布在统计推断中起到至关重要的作用。
通过收集样本数据,我们可以根据正态分布的性质进行参数估计和假设检验等统计分析。
3.2 财务分析正态分布在财务分析中也有重要应用。
例如,股票市场的收益率往往服从正态分布,基于正态分布的模型可以用于分析和预测股票的风险和收益。
3.3 质量控制正态分布在质量控制中用于判断产品质量是否符合要求。
通过收集产品的测量数据,可以利用正态分布的性质进行质量控制和异常检测。
3.4 自然科学研究正态分布在自然科学研究中也有广泛应用。
例如,地震的震级、物种的体重和身高等都可以用正态分布进行建模和分析。
结论正态分布是统计学中最重要的概率分布之一,具有许多重要的性质和应用。
正态分布的概念及表和查表方法

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A·棣莫弗在求二项分布的渐近公式中得到。
.高斯在研究测量误差时从另一个角度导出了它。
P·S·拉普拉斯和高斯研究了它的性质。
是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
目录1历史发展2定理3定义▪一维正态分布▪标准正态分布4性质5分布曲线▪图形特征▪参数含义6研究过程7曲线应用▪综述▪频数分布▪综合素质研究▪医学参考值历史发展正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。
在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。
这要到20世纪正态小样本理论充分发展起来以后。
拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。
这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。
函数正态分布

函数正态分布介绍函数正态分布是统计学中的一种重要概念,它描述了某些函数在大量样本中的分布情况。
在数学中,正态分布是一种连续概率分布,其函数形式为钟形曲线,因此也被称为钟形曲线分布。
正态分布在自然界和社会科学中经常出现,对于研究人群、实验结果等具有重要意义。
特征正态分布具有以下几个重要特征:1.对称性:正态分布的概率密度函数是对称的。
即分布的左右两侧关于均值对称。
2.唯一性:正态分布由均值和标准差确定,均值决定了分布的中心位置,标准差决定了分布的形状。
3.高峰度:正态分布的峰度较高,即在均值附近概率密度较大,随着距离均值的增加,概率密度逐渐减小。
4.独立性:正态分布的样本之间是独立的,即一个样本的取值不会影响其他样本的取值。
概率密度函数正态分布的概率密度函数可以表示为:f(x) = (1 / (σ * √(2π))) * exp^(-((x-μ)^2) / (2 * σ^2))其中,μ为均值,σ为标准差。
标准正态分布标准正态分布是一种特殊的正态分布,其均值为0,标准差为1,即μ=0,σ=1。
标准正态分布是统计学中的一种标准分布,可以将其他正态分布转化为标准正态分布进行比较和计算。
应用正态分布广泛应用于各个领域,以下是几个常见的应用场景:1. 统计推断正态分布在统计推断中起到了重要作用。
通过对样本数据进行观察和分析,可以利用正态分布的特性来进行参数估计、假设检验等统计推断操作。
2. 随机变量建模正态分布常用于随机变量的建模。
许多实际问题可以抽象成随机变量,而正态分布是对许多实际问题的合理近似。
3. 财务分析正态分布在财务分析中非常有用。
许多财务数据,如股票收益率、利润等,都符合正态分布。
通过对财务数据的分析,可以对风险和收益进行评估和预测。
4. 生物学生物学中许多现象也可以用正态分布进行建模,例如身高、体重等。
对生物学数据的分析可以帮助研究者理解和解释生物现象。
5. 工程和物理学正态分布在工程和物理学的应用非常广泛。
正态分布名词解释电大

正态分布名词解释正态分布是一种常见的概率分布,用于描述各种随机现象。
本文将介绍正态分布的概念、特征、含义以及应用。
一、正态分布的概念正态分布是一种连续型概率分布,它具有两个参数:均值和标准差。
均值是分布的中心点,标准差是分布的分散程度。
正态分布的概率密度函数呈钟形,左右对称,中间高,两边低。
二、正态分布的特征1. 中心对称:正态分布的概率密度函数关于均值对称,即对于任意 x,有 f(x)=f(-x)。
2. 左右对称:正态分布的概率密度函数在均值处取得最大值,即f(μ)=max{f(x)}。
3. 长尾:正态分布的概率密度函数在x=μ时取得最大值,但随着 x 离μ越来越远,概率密度函数逐渐变得平缓,呈现出长尾特征。
4. 标准化:将正态分布标准化,即将其转化为均值为 0,标准差为 1 的分布,称为标准正态分布。
三、正态分布的含义正态分布表示的是一个随机变量的分布情况,它具有以下含义: 1. 均值是分布的中心点,反映了随机变量的平均水平。
2. 标准差是分布的分散程度,反映了随机变量的离散程度。
3. 正态分布的概率密度函数呈钟形,说明随机变量取值集中在均值附近,离均值越远的取值概率越小。
四、正态分布的应用正态分布在统计学中具有广泛的应用,下面列举几个主要的应用: 1. 假设检验:正态分布是许多统计假设检验的基础,例如 t 检验、F 检验等。
2. 置信区间:正态分布可以用来计算置信区间,用于估计总体参数。
3. 预测分析:正态分布可以用来进行预测分析,例如预测销售量、股票价格等。
4. 质量控制:正态分布可以用于质量控制,例如通过正态分布来判断一个产品是否合格。
总之,正态分布是一种重要的概率分布,它在统计学中有着广泛的应用。
统计学正态分布

统计学正态分布统计学是一门研究收集、整理、分析和解释数据的学科。
在统计学中,正态分布是最为重要和广泛应用的一种概率分布。
本文将介绍正态分布的定义、特点、应用以及与其他分布的比较。
正态分布,又称高斯分布或钟形曲线分布,是一种对称的连续概率分布。
它的概率密度函数(PDF)可以用以下公式表示:f(x) = 1 / (σ * √(2π)) * e^(-(x-μ)^2 / (2σ^2))其中,μ是均值(期望),σ是标准差。
正态分布的均值决定了曲线的位置,标准差决定了曲线的形状。
当μ=0,σ=1时,称为标准正态分布。
正态分布具有许多重要的特点。
首先,它是对称的,即曲线的左右两侧是镜像关系。
其次,大部分数据集都可以近似地用正态分布来描述。
这是由中心极限定理保证的,即当样本容量足够大时,样本均值的分布会趋于正态分布。
因此,正态分布在统计推断中扮演着重要的角色。
正态分布在许多领域中都有广泛的应用。
首先,它可以用来描述许多自然现象,如身高、体重等。
在人群中,身高和体重的分布通常近似于正态分布。
其次,正态分布在工程和质量控制中也起着重要的作用。
例如,在制造过程中,产品尺寸的分布通常可以用正态分布来描述。
通过分析正态分布,可以评估产品的质量水平和生产过程的稳定性。
除了正态分布,在统计学中还有许多其他的概率分布。
例如,均匀分布、指数分布、泊松分布等。
与这些分布相比,正态分布具有许多独特的优点。
首先,正态分布是连续的,可以表示任意小的概率。
其次,正态分布具有良好的数学性质,便于进行推导和计算。
最重要的是,许多统计推断方法是基于正态分布的假设建立的,因此正态分布在统计学中具有特殊的地位。
尽管正态分布在统计学中具有重要地位,但也存在一些限制。
首先,正态分布假设数据呈正态分布,但实际数据往往不完全符合这个假设。
因此,在使用正态分布进行统计推断时,需要进行适当的检验和修正。
其次,正态分布对异常值比较敏感,当数据中存在异常值时,正态分布的拟合效果会受到影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.1 正态分布,熟悉的陌生人 (2)0.2 邂逅,正态曲线的首次发现 (4)0.3 最小二乘法,数据分析的瑞士军刀 (7)0.4 众里寻她千百度,误差分布曲线的确立 (10)0.5 曲径通幽处,禅房花木深 (16)0.5.1 高斯(1809)的推导 (17)0.5.2 赫歇尔(1850)和麦克斯韦(1860) 的推导 (19)0.5.3 兰登(1941)的推导 (20)0.5.4 基于最大娟的推导 (22)0.6 开疆拓土,正态分布的进一步发展 (24)0.6.1 论剑中心极限定理 (24)0.6.2 进军近代统计学 (28)0.6.3 数理统计三剑客 (32)0.7 正态魅影 (34)0.8 大道至简,大美天成 (36)0.9 推荐阅读 (39)12神说,要有正态分布,就有了正态分布。
神看正态分布是好的,就让随机误差服从了正态分布。
创世纪—数理统计0.1 正态分布,熟悉的陌生人学过基础统计学的同学大都对正态分布非常熟悉。
这个钟形的分布曲 线不但形状优雅,它对应的密度函数写成数学表达式f (x ) = 1 e − √2πσ(x −µ)2 2σ2 也非常具有数学的美感。
其标准化后的概率密度函数1x 2 f (x ) = √2πe 更加的简洁漂亮,两个最重要的数学常量π队e 都出现在这公式之中。
在我 个人的审美之中,它也属于top-N 的最美丽的数学公式之一,如果有人问 我数理统计领域哪个公式最能让人感觉到上帝的存在,那我一定投正态分 布的票。
因为这个分布戴着神秘的面纱,在自然界中无处不在,让你在纷 繁芜杂的数据背后看到隐隐的秩序。
Figure 1: 正态分布曲线 正态分布又通常被称为高斯分布,在科学领域,冠名权那是一个很高的荣誉。
2002年以前去过德国的兄弟们还会发现,德国1991年至2001年间− 23发行的的一款10马克的纸币上印着高斯(Carl Friedrich Gauss, 1777-1855)的 头像和正态密度曲线,而1977年东德发行的20马克的可流通纪念钢铺上, 也印着正态分布曲线和高斯的名字。
正态分布被冠名高斯分布,我们也容 易认为是高斯发现了正态分布,其实不然,不过高斯对于正态分布的历史 地位的确立是起到了决定性的作用。
Figure 2: 德国马克和纪念币上的高斯头像和正态分布曲线正态曲线虽然看上去很美,却不是一拍脑袋就能想到的。
我们在本科 学习数理统计的时候,课本一上来介绍正态分布就给出分布密度函数,却 从来不说明这个密度函数是通过什么原理推导出来的。
所以我一直搞不明 臼数学家当年是怎么找到这个概率分布曲线的,又是怎么发现随机误差服 从这个奇妙的分布的。
我们在实践中大量的使用正态分布,却对这个分布 的来龙去脉l 之甚少,正态分布真是让人感觉既熟悉又陌生。
直到我读研 究生的时候,我的导师给我介绍了陈希儒院士的《数理统计学简史》这本 书,看了之后才了解了正态分布曲线从发现到被人们重视进而广泛应用, 也是经过了几百年的历史。
正态分布的这段历史是很精彩的,我们通过讲一系列的故事来揭开她4的神秘面纱。
0.2 邂逅,正态曲线的首次发现第一个故事和概率论的发展密切相关,主角是楝莫弗(Abraham deMoivre, 1667-1754) 和拉普拉斯(Pierre-Simon Laplace 1749-1827)。
拉普拉 斯是个大科学家,被称为法国的牛顿;楝莫弗名气可能不算很大,不过大 家应该都应该很熟悉这个名字,因为我们在高中数学学复数的时候都学过 楝莫弗公式(cos θ + i sin θ)n = cos(n θ) + i sin(n θ)。
而楝莫弗所写的《机遇 论》C The do ctrine of c hances )是概率论发展历史中很重要的一本书。
牛 顿对楝莫弗十分欣赏,遇到学生向他请教概率方面的问题时,他就说:“这 样的问题应该去找楝莫弗,他对这些问题的研究比我深入得多。
”Figure 3: 楝莫弗和拉普拉斯古典概率论发源于赌博,惠更斯(Christiaan Huygens, 1629-1695)队帕斯卡(Blaise Pascal, 1623-1662)队费马(Pierre de Fermat, 1601-1665)队雅可 比·贝努利(Jacob Bernoulli, 1654-1705)都是古典概率的奠基人,他们那会 研究的概率问题大都来自赌桌上,最早的概率论问题是赌徒梅累在1654年 向帕斯卡提出的如何分赌金的问题。
统计学中的总体均值之所以被称为期 望(Expectation), 就是源自惠更斯队帕斯卡这些人研究平均情况下一个赌徒 在赌桌上可以期望自己赢得多少钱。
有一天一个哥们,也许是个赌徒,向楝莫弗提了一个和赌博相关的问 题:A 队B 两人在赌场里赌博,A 队B 各自的获胜概率是p, q = 1 − p , 赌n 局。
两人约定:若A 赢的局数X > np , 则A 付给赌场X − np 元;若X < np ,则B5i 2 b · n付给赌场np − X 元。
问赌场挣钱的期望值是多少。
问题并不复杂,本质上是一个二项分布,若np 为整数,楝莫弗求出最 后的理论结果是2npqb (n, p, n p )其中b (n, p, i ) = ·n )p i q n −i 是常见的二项概率。
但是对具体的n , 因为其中的 二项公式中有组合数,要把这个理论结果实际计算出数值结果可不是件容 易的事,这就驱动楝莫弗寻找近似计算的方法。
与此相关联的另一个问题,是遵从二项分布的随机变量X ∼ B (n, p ),求X 落在二项分布中心点一定范围的概率P d = P (|X − n p | ≤ d )。
对于p = 1/2 的情形,楝莫弗做了一些计算并得到了一些近似结果,但 是还不够漂亮,幸运的是楝莫弗和斯特林(James Stirling, 1692-1770)处在 同一个时代,而且二人之间有联系,斯特林公式是在数学分析中必学的一 个重要公式 √ ( n ,n n ! ≈ 2πn . e事实上斯特林公式的雏形是楝莫弗最先得到的,但斯特林改进了这个公式,改进的结果为楝莫弗所用。
1733 年,楝莫弗很快利用斯特林公式进 行计算并取得了重要的进展。
考虑n 是偶数的情形,二项概率为b (n, 1 , i ) = t n l t 1 l n 2 i 2以下把b (n, 1 , i )简记为b (i ), 通过斯特林公式做一些简单的计算容易得到,b ( n , 2 2 , πn 2 + d ) 2 d 2 −于是有 · n ) ≈ e n , 2b ( n + d , ≈√ 2 e − 2d 2 n . 2 2πn使用上式的结果,并在二项概率累加求和的过程中近似的使用定积分代替 ≈ b6 √n求和,很容易就能得到 t I X 1 I c l ( n , P I I 「 I n − 2 I ≤ √n = b + iI I −c √ n≤i≤c √n 「 2 2 2i 2 ≈ −c √n≤i≤c √n √2πn e − n (1)= 「 1 − 1 2i 2 2 √2πe −2c ≤ 2i ≤2c 2 ( √n ) n l 2c 1 2 ≈−2c √ e −x /2dx. 2π 看,正态分布的密度函数的形式在积分公式中出现了! 这也就是我们在数理统计课本上学到的一个重要结论:二项分布的极限分布是正态分 布。
以上只是讨论了p = 1/2 的情形,楝莫弗也对p /= 1/2做了一些计算, 后来拉普拉斯对p /= 1/2 的情况做了更多的分析,并把二项分布的正态近 似推广到了任意p 的情况。
这是第一次正态密度函数被数学家刻画出来,而且是以二项分布的极限分布的形式被推导出来的。
熟悉基础概率统计的 同学们都l 道这个结果其实叫楝莫弗-拉普拉斯中心极限定理。
定 理0.2.1 (楝 莫 弗-拉 普 拉 斯 中 心 极 限 定 理) 设 随 机 变 量X n (n= 1, 2, · · · ) 服从参数为n, p 的二项分布,则对任意的x , 恒有 / X n − np \ l x 1−t 2 lim P n→∞ np (1 − p ) = √ e −∞2π 2 dt. 我们在大学学习数理统计的时候,学习的过程都是先学习正态分布, 然后才学习中心极限定理。
而学习到正态分布的时候,直接就描述了其概 率密度的数学形式,虽然数学上很漂亮,但是容易困惑数学家们是如何凭 空就找到这个分布的。
读了陈希宿的《数理统计学简史》之后,我才明臼 正态分布的密度形式首次发现是在楝莫弗-拉普拉斯的中心极限定理中。
数 学家研究数学问题的进程很少是按照我们数学课本编排的顺序推进的,现 代的数学课本都是按照数学内在的逻辑进行组织编排的,虽然逻辑结构上 严谨优美,却把数学问题研究的历史痕迹抹得一干二净。
DNA 双螺旋结构 的发现者之一詹姆斯·沃森(James D. Watson, 1928-) 在他的名著《DNA 双螺旋》序言中说:“Science seldom proceeds in the straightforward logical √ xmanner imagined b y out s iders.C科学的发现很少会像门外汉所想象的一样,按照直接了当合乎逻辑的方式进行的。
)”楝莫弗给出他的发现后40年C大约是1770年),拉普拉斯建立了中心极限定理较一般的形式,中心极限定理随后又被其他数学家们推广到了其它任意分布的情形,而不限于二项分布。
后续的统计学家发现,一系列的重要统计量,在样本量N趋于无穷的时候,其极限分布都有正态的形式,这构成了数理统计学中大样本理论的基础。
楝莫弗在二项分布的计算中瞥见了正态曲线的模样,不过他并没有能展现这个曲线的美妙之处。
楝莫弗的这个工作当时并没有引起人们足够的重视,原因在于楝莫弗不是个统计学家,从未从统计学的角度去考虑其工作的意义。
正态分布(当时也没有被命名为正态分布) 在当时也只是以极限分布的形式出现,并没有在统计学,尤其是误差分析中发挥作用。
这也就是正态分布最终没有被冠名楝莫弗分布的重要原因。
那高斯做了啥工作导致统计学家把正态分布的这顶桂冠戴在了他的头上呢?这先得从最小二乘法的发展说起。
0.3 最小二乘法,数据分析的瑞士军刀第二个故事的主角是欧拉(Leonhard Eule r,1707-1783)队拉普拉斯队勒让德(Adrien-Marie Lege ndre,1752-1833)和高斯,故事发生的时间是18世纪中到19世纪初。