统计学三大分布与正态分布的关系

合集下载

三大分布和正态分布的关系

三大分布和正态分布的关系

三大分布和正态分布的关系三大分布是指均匀分布、正态分布和泊松分布。

在统计学中,这三个分布都是非常重要的基本概率分布之一。

正态分布是最为常见的一种概率分布,也被称为高斯分布或钟形曲线,因其形状呈钟形而得名。

均匀分布则是一种平均分布的概率分布,泊松分布则是一种描述稀有事件发生次数的概率分布。

首先,我们来探讨一下正态分布和均匀分布的关系。

首先需要了解的是,均匀分布是一种最简单的概率分布,它在给定区间内的各个取值概率相等,也就是说每个取值都是等可能发生的。

而正态分布则是一种近似正常分布的概率分布,它的概率密度在均值处达到最大值,两侧逐渐减小。

在正态分布中,大部分的值都集中在均值附近,并且对称分布。

均匀分布和正态分布在形状上有明显的区别。

均匀分布的概率密度函数是一个矩形,在给定区间内的取值概率是相等的,因此其形状是平坦的。

而正态分布的概率密度函数呈现钟形曲线,形状相对较高且对称。

在正态分布中,均值和标准差控制了曲线的位置和形状。

对于均匀分布,通过区间的长度可以控制分布的形状。

另外,均匀分布和正态分布在数学性质上也有一些区别。

对于均匀分布,其期望值和方差均可以通过区间的长度来计算。

例如,在[0,1]区间上的均匀分布的期望值为0.5,方差为1/12。

而对于正态分布,其期望值恒为均值μ,方差为标准差的平方σ^2。

在正态分布中,许多常见的统计推理方法都是基于正态分布的假设,这也是正态分布被广泛应用的原因之一。

此外,正态分布和均匀分布在实际应用中也有着不同的特点和用途。

正态分布广泛应用于实际测量的误差分布、自然现象的变异分布等。

在统计学中,许多假设检验和参数估计方法都是基于正态分布的推论,因此正态分布在统计学中具有重要作用。

而均匀分布常常用于随机数生成、模拟实验中,以及一些特定的情况下,如等可能事件的建模等。

最后,我们来讨论一下正态分布和泊松分布的关系。

正态分布和泊松分布是两种完全不同的概率分布。

正态分布是描述连续型随机变量的概率分布,而泊松分布则是描述离散型随机变量的概率分布。

统计学三大分布的应用

统计学三大分布的应用

统计学三大分布的应用
统计学三大分布是指正态分布、t分布和卡方分布。

这些分布在统计学中应用广泛,下面将分别介绍其应用。

正态分布是自然界中最常见的分布之一,常用于描述连续性变量。

例如,身高、体重、智商等连续性变量都可以用正态分布来描述。

在假设检验、置信区间估计和回归分析等统计学方法中,正态分布也是一个非常重要的理论基础。

t分布是由威廉·塞德威克·高斯特(W.S.Gosset)于1908年提
出的,用来解决小样本量的问题。

t分布的形状与正态分布非常接近,但是在样本量较小的情况下,t分布的尾部更宽一些,因此在小样本量的情况下,使用t分布进行假设检验和置信区间估计更为合适。

卡方分布是概率论中一个重要的分布,通常应用于描述计数数据。

例如,在卡方检验中,卡方分布常常用来处理分类数据,如调查中统计“喜欢”或“不喜欢”某种产品或服务的人数。

卡方分布也常用于多项式回归和逻辑回归等模型中。

综上所述,正态分布、t分布和卡方分布在统计学中应用非常广泛,是统计学的重要组成部分。

对于从事统计学研究或相关领域的人员来说,深入理解和熟练运用这些分布是非常重要的。

- 1 -。

概率论与数理统计 7.2 数理统计中的三大分布

概率论与数理统计 7.2 数理统计中的三大分布
数理统计
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025

统计学三大分布与正态分布的差异

统计学三大分布与正态分布的差异

申请大学学士学位论文大学学士学位论文统计学三大分布与正态分布的差异年级专业:学生:指导教师:统计学三大分布与正态分布的差异中文摘要统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策者提供依据和参考。

它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

而对数据的分析过程中就需要利用到数据的分布来研究分类。

在实际遇到的许多随机现象都服从或近似服从正态分布。

而由正态分布构造的三大分布在实际中有广泛的应用,因为这三大分布不仅有明确的背景,而且其抽样分布的密度函数有明显表达式,研究三大分布与正态分布有助于研究实际事例,比如经济安全与金融保险领域、人口统计等。

本文讨论了三大分布与正态分布,并将它们之间的密度函数进行比较说明.第二章介绍了正态分布的定义、性质,三大分布的定义、性质。

第三章介绍了正态分布与三大分布的密度函数,并将它们之间的密度函数进行比较关键词:正态分布;三大分布;密度函数The Difference between the Three Statistical Distributions andthe Normal DistributionAbstractStatistics is a branch of applied mathematics, the mathematical models are mainly established by the probability and statistics theory based on the collectingthe data, so as to conduct the quantitative analysis, and obtain the correct inference. It is widely used in the subjects, such as physical, social science, industrial and commercial field, and government intelligence decision. The process of the data analysis will need to use the data distributions to study.In practice, many random phenomena are obedient for the normal distributions, or approximately. And the three statistical distributions structured by the normal distributions have extensive applications, because these three distributions is explicitly background, and the sampling distribution density function have obvious expressions. Research on the distributions and normal distributions is useful for the study of economic security and financial insurance fields, population statistics, etc.This paper discusses the three statistical distributions and normal distributions, their density functions are compared.The second chapter presents the definition of the normal distribution, the distribution of nature, three definitions and properties.The third chapter covers a normal distribution and the density functions of the three distributions, and then the density functions are compared. Keywords: the normal distribution; Three distribution; Density function目录中文摘要 (2)英文摘要 (2)1 绪论 (5)1.1 问题的提出 (5)1.2 国外研究现状 (5)1.3 本文的主要工作 (6)2 基础知识介绍 (7)2.1 正态分布 (7)2.2 三大统计分布 (8)3 三大分布与正态分布的比较 (12)3.1 三大分布与正态分布的密度函数 (12)3.2 三大分布与正态分布的密度函数比较 (12)3.3 本章小结 (16)4 进一步工作 (16)参考文献 (17)致 (17)1 绪论统计学,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。

统计学三大分布的应用

统计学三大分布的应用

统计学三大分布的应用统计学是一门重要的学科,它通过收集、整理和分析数据来揭示事物之间的潜在规律和关系。

在统计学中,分布是一种揭示数据特征的重要工具。

在统计学中,有三大常见的分布,它们分别是正态分布、均匀分布和指数分布。

这些分布在各个领域都有广泛的应用,能够帮助我们更好地理解和解释现象。

首先,正态分布是统计学的核心概念之一。

正态分布也被称为高斯分布,它的形状近似为一个钟形曲线。

正态分布在自然界中广泛存在,例如人的身高、体重等,也在许多地方出现,如测试成绩、产品质量等。

统计学家常常使用正态分布来研究和描述各种现象,并通过计算均值和标准差来分析数据的集中度和离散程度。

正态分布也是许多假设检验和参数估计方法的基础,为我们进行科学研究和决策提供了强有力的工具。

其次,均匀分布是一种简单且常见的分布形式。

在均匀分布中,所有的取值都具有相同的概率。

这种分布可以用来模拟随机实验的结果,例如抛硬币的正反面、掷骰子的点数等。

均匀分布还在随机数生成、概率推断等方面发挥着重要作用。

在实际应用中,均匀分布也可以用来描述一些特定的自然现象,如某些地区的降雨量、温度等。

通过研究和理解均匀分布,我们可以更好地预测和解释这些现象。

最后,指数分布是描述事件发生时间的一种重要分布。

在指数分布中,事件发生的概率密度函数随时间指数级衰减。

这种分布常常用于研究和模拟一些连续系统的寿命、等待时间等。

指数分布也在信号处理、通信理论、生物学等领域中得到广泛应用。

通过对指数分布的研究,我们能够更好地理解和预测事件的发生模式,为我们提供关键信息,以便做出合理的决策。

总而言之,正态分布、均匀分布和指数分布是统计学中三大重要分布。

它们在各个领域都有广泛的应用,帮助我们更好地理解和解释现象,提供科学依据和决策支持。

通过对分布的研究和应用,统计学可以发挥重要作用,推动科学发展和社会进步。

第九章 多元正态分布与统计中的三大分布

第九章 多元正态分布与统计中的三大分布

由度的 t 分布,记为 Z ~ t (n) 。
n +1 ) n +1 y2 − 2 2 密度函数为 t n ( y ) = (1 + ) 。当 n = 1 时, t 分布的均值不存在, n n nπ Γ( ) 2 n (n > 2) 。 当 n > 1 时, t (n) 的均值为 0,方差为 n−2 X /m 定义 3:设 X , Y 独立且 X ~ χ 2 (m), Y ~ χ 2 (n) ,称 Z = 的分布为具有自由度 Y /n
i =1
n
i
− X )2
,则
n −1
1)
X ~ N (µ , (n − 1) S 2
σ2
n
);
2) 3) 4)
σ
2
~ χ 2 (n − 1) ;
X 与 S 2 独立; n(X − µ) ~ t (n − 1) 。 S
2 定 理 2 : 设 X 1 ,L X n i.i.d ~ N ( µ1 , σ 12 ) , Y1 , LYm i.i.d ~ N ( µ 2 , σ 2 ) 且 X 1 ,L X n 与
− (σ 14 u 2 u 3 + σ 24 u1u 3 + σ 34 u1u 2 )ϕ (t1 , t 2 , t 3 , t 4 ) + u1u 2 u 3u 4ϕ (t1 , t 2 , t 3 , t 4 )
从而 Eξ1ξ 2ξ 3ξ 4 =
+ (σ 13σ 24 + σ 23σ 14 )ϕ (t1 , t 2 , t 3 , t 4 ) − (σ 13 u 2 + σ 23 u1 )u 4ϕ (t1 , t 2 , t 3 , t 4 )
= u 3σ 12ϕ (t1 , t 2 , t 3 , t 4 ) + (σ 13 u 2 + σ 23u1 )ϕ (t1 , t 2 , t 3 , t 4 ) − u1u 2 u 3ϕ (t1 , t 2 , t 3 , t 4 )

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班摘要:本文首先将介绍2χ分布,t 分布,F 分布与正态分布的定义及基本性质,然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之、1、 三大分布函数[2]1、12χ分布2()n χ分布就是一种连续型随机变量的概率分布。

这个分布就是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它就是由正态分布派生出来的,主要用于列联表检验。

定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,),则称统计量222212n =+X X χ++…X 为服从自由度为n 的2χ分布,记为22~()n χχ、2χ分布的概率密度函数为122210(;),2()200n xn x e x nf x n x --⎧≥⎪⎪=Γ⎨⎪⎪<⎩ 其中伽玛函数1(),0t x x et dt x +∞--Γ=>⎰,2χ分布的密度函数图形就是一个只取非负值的偏态分布,如下图、卡方分布具有如下基本性质:性质1:22(()),(())2E n n D n n χχ==;性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++;性质3:2n χ→∞→时,(n )正态分布; 性质4:设)(~22n αχχ,对给定的实数),10(<<αα称满足条件:αχχαχα==>⎰+∞)(222)()}({n dx x f n P 的点)(2n αχ为)(2n χ分布的水平α的上侧分位数、 简称为上侧α分位数、 对不同的α与n , 分位数的值已经编制成表供查用、2()n χ分布的上α分位数 1、2t 分布t 分布也称为学生分布,就是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置、定义:设2~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/XT Y n=服从自由度为n 的t 分布,记为~()T t n 、t 分布的密度函数为1221()2(;)(1),.()2n n x t x n t n n n π+-+Γ=+-∞<<+∞Γt 分布的密度函数图t 分布具有如下一些性质:性质1:()n f t 就是偶函数,221,()()2t n n f t t e ϕπ-→∞→=;性质2:设)(~n t T α,对给定的实数),10(<<αα 称满足条件;ααα==>⎰+∞)()()}({n tdx x f n t T P 的点)(n t α为)(n t 分布的水平α的上侧分位数、 由密度函数)(x f 的对称性,可得 ).()(1n t n t αα-=-类似地,我们可以给出t 分布的双侧分位数,)()()}(|{|)()(2/2/2/αααα=+=>⎰⎰+∞-∞-n t n t dx x f dx x f n t T P 显然有.2)}({;2)}({2/2/αααα=-<=>n t T P n t T P对不同的α与n , t 分布的双侧分位数可从附表查得、t 分布的上α分位数 1、3F 分布F 分布就是随机变量的另一种重要的小样本分布,应用也相当广泛、 它可用来检验两个总体的方差就是否相等,多个总体的均值就是否相等、 F 分布还就是方差分析与正交设计的理论基础、定义:设22~(),~()X n Y m χχ,,X Y 相互独立,令则称统计量//X nF Y m=服从为第一自由度为n ,第二自由度为m 的F 分布、F 分布的密度函数图F 分布具有如下一些性质:性质1:若~(,),1/~(,)F F n m F F m n 则; 性质2:若)(~n t X ,则2~(1,)X F n ; 性质3:设),(~m n F F α,对给定的实数),10(<<αα称满足条件;ααα==>⎰+∞),()()},({m n F dx x f m n F F P的点),(m n F α为),(m n F 分布的水平α的上侧分位数、F分布的上α分位数F 分布的上侧分位数的可自附表查得、性质4:.),(1),(1m n F n m F αα-=此式常常用来求F 分布表中没有列出的某些上侧分位数、 1、4正态分布正态分布就是数理统计中的一种重要的理论分布 ,就是许多统计方法的理论基础、 高斯(Gauss)在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布、 正态分布有两个参数,μ与σ,决定了正态分布的位置与形态、 为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1)、 正态分布的密度函数与分布函数若连续型随机变量X 具有概率密度()f x 为22()21(),,2x f x ex μσπσ--=-∞<<+∞其中,(0)μσσ>为常数,则称X 服从参数为μσ,的正态分布,记为2~()X N μσ,、正态分布的密度函数图特征1:正态曲线(normal curve)在横轴上方均数处最高; 特征2:正态分布以均数为中心,左右对称;特征3:正态分布有两个参数,即均数μ与标准差σ、 μ就是位置参数,σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动、 σ就是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭、 通常用2N μσ(,)表示均数为μ,方差为2σ的正态分布、 用N (0,1)表示标准正态分布、 特征4:正态曲线下面积的分布有一定规律。

三大抽样分布

三大抽样分布

F(n1, n2)为F(n1, n2)的上侧分位点;
1 注: F1 (n1 , n2 ) F (n2 , n1 )
F (n1 , n2 )
若X 1 , Y1 ,
, X n1 来自正态总体X, X ~ N ( 1 , 12 ),
2 , Yn2 来自正态总体Y, Y ~ N ( 2 , 2 ), 且两样本独立.

2 ( n)
2.t 分布

关于t分布的早期理论工作,是英国统计学家威廉· 西利· 戈塞 特(Willam Sealy Gosset)在1990年进行的。 t分布是小样本分布,小样本一般是指n<30。t分布适用于 当总体标准差未知时用样本标准差s代替总体标准差σ,由

样本平均数推断总体平均数及两个小样本之间差异的显著性


χ2 分布是海尔墨特(Hermert)和卡· 皮尔生(K· Pearson) 分别于1875年和1890年导出的。它主要适用于对拟合优度检 验和独立性检验,以及对总体方差的估计和检验。 χ2 分布是一种抽样分布。当我们对正态随机变量随机地重 复抽取个数值,将每一个值变换成标准正态变量,并对这个 新的变量分别取平方再求和之后,就得到一个服从χ2分布的 变量,即
F分布的主要性质有: ①F分布是一种非对称的分布,呈右偏态; ② F分布两个自由度:n1-1和n2-1,相应的分布记作F(n1-1,n2-
1)。通常n1-1称为分子自由度, n2-1称为分母自由度。
③随n1,n2的不断增大,F分布的右偏程度逐渐减弱,但不会趋向 正态;
④具有倒数性质即若X~F(n1,n2),则1/X~F(n1,n2);
(4) t 分布是一个分布族,对于不同的样本容量对应不同的 分布,且均值都为0;随着自由度的增大,分布也逐渐趋 于标准正态分布。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质,然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之.1. 三大分布函数[2]1.12χ分布2()n χ分布是一种连续型随机变量的概率分布。

这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。

定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,),则称统计量222212n =+X X χ++…X 为服从自由度为n 的2χ分布,记为22~()n χχ.2χ分布的概率密度函数为122210(;),2()200n xn x e x n f x n x --⎧≥⎪⎪=Γ⎨⎪⎪<⎩ 其中伽玛函数10(),0t x x e t dt x +∞--Γ=>⎰,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.卡方分布具有如下基本性质:性质1:22(()),(())2E n n D n n χχ==;性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++;性质3:2n χ→∞→时,(n )正态分布; 性质4:设)(~22n αχχ,对给定的实数),10(<<αα称满足条件:αχχαχα==>⎰+∞)(222)()}({n dx x f n P的点)(2n αχ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用.2()n χ分布的上α分位数 1.2t 分布t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置.定义:设2~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量T =服从自由度为n 的t 分布,记为~()T t n .t 分布的密度函数为1221()2(;)(1),.(2nnxt x n tn n+-+Γ=+-∞<<+∞Γt分布的密度函数图t分布具有如下一些性质:性质1:()nf t是偶函数,22,()()tnn f t tϕ-→∞→=;性质2:设)(~ntTα,对给定的实数),10(<<αα称满足条件;ααα==>⎰+∞)()()}({ntdxxfntTP的点)(ntα为)(nt分布的水平α的上侧分位数. 由密度函数)(xf的对称性,可得).()(1ntntαα-=-类似地,我们可以给出t分布的双侧分位数,)()()}(|{|)()(2/2/2/αααα=+=>⎰⎰+∞-∞-ntntdxxfdxxfntTP显然有.2)}({;2)}({2/2/αααα=-<=>ntTPntTP对不同的α与n,t分布的双侧分位数可从附表查得.t分布的上α分位数1.3F 分布F 分布是随机变量的另一种重要的小样本分布,应用也相当广泛. 它可用来检验两个总体的方差是否相等,多个总体的均值是否相等. F 分布还是方差分析和正交设计的理论基础.定义:设22~(),~()X n Y m χχ,,X Y 相互独立,令则称统计量//X nF Y m=服从为第一自由度为n ,第二自由度为m 的F 分布.F 分布的密度函数图F 分布具有如下一些性质:性质1:若~(,),1/~(,)F F n m F F m n 则; 性质2:若)(~n t X ,则2~(1,)X F n ;性质3:设),(~m n F F α,对给定的实数),10(<<αα称满足条件;ααα==>⎰+∞),()()},({m n F dx x f m n F F P的点),(m n F α为),(m n F 分布的水平α的上侧分位数.F 分布的上α分位数F 分布的上侧分位数的可自附表查得.性质4:.),(1),(1m n F n m F αα-= 此式常常用来求F 分布表中没有列出的某些上侧分位数.1.4正态分布正态分布是数理统计中的一种重要的理论分布 ,是许多统计方法的理论基础. 高斯(Gauss )在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布. 正态分布有两个参数,μ和σ,决定了正态分布的位置和形态. 为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1). 正态分布的密度函数和分布函数若连续型随机变量X 具有概率密度()f x 为22()2(),,x f x x μσ--=-∞<<+∞其中,(0)μσσ>为常数,则称X 服从参数为μσ,的正态分布,记为2~()X N μσ,.正态分布的密度函数图特征1:正态曲线(normal curve )在横轴上方均数处最高;特征2:正态分布以均数为中心,左右对称;特征3:正态分布有两个参数,即均数μ和标准差σ. μ是位置参数,σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动. σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭. 通常用2N μσ(,)表示均数为μ,方差为2σ的正态分布. 用N (0,1)表示标准正态分布. 特征4:正态曲线下面积的分布有一定规律。

实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率. 正态曲线下一定区间的面积可以通过标准正态分布函数表求得。

对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计.2. 三大分布与正态分布的密度函数比较[3]2.12χ分布收敛于正态分布 设2~()X n χ,则对任意x ,有2/2lim )xt n P x e dt --∞→∞≤=⎰.证明:因为 2()n χ分布的222111()()()()nnniii i i i E E x E x D x n χ=======∑∑∑22211()()()2n ni i i i D D x D x n χ=====∑∑所以由独立同分布中心极限定理得(0,1)Y N =→ 因为122/21~,0()22n x n Xx e x n -->Γ且y =所以x n = 因为()()Y X f y dy f x dx =所以11()22/21()()()22nnYndxf y n en dy--=+Γ=111()222/21(1)()22n nnnn en---令2n m=,利用Stirling公式:1m!,012mm m mm e emθθ-=⋅⋅<<则上式11())(1)m m mm e---+11())(1)m m mm e---+11())(1)m m mm e---+(1)1)mm e--+212yn-→∞−−−所以2χ分布的极限分布为正态分布.下面用MATLAB来验证上面结论,首先定义2()nχ分布函数和相应的正态分布(,2)N n n,再依次增大n,比较两者关系:[4]从上面三个图形可以看出,n 越大,2()n χ分布密度函数与正态分布(,2)N n n 度函数越接近,这就和所证结论相符合.2.2t 分布收敛于标准正态分布若n X 服从自由度为n 的t分布,2/2lim ()xt n n P X x e dt --∞→∞≤=(1)证法1:由于自由度为n 的t分布的概率密度函数为1221()2p(;)(1),()2n n x x n x n n +-+Γ+-∞<<+∞= 因此(1)式等价于2/2,x n x -→∞-∞<<+∞lim (2) 先利用Stirling公式:1m!,012m m m m m e e mθθ-=⋅⋅<<证明1()2()2n n n →∞+Γ=lim事实上,利用Γ函数的性质1132121().......()2222242222()......()2222n n n n k n k n n n k n k +---+-+ΓΓ=--+-+Γ21(1)(3)......(21)()2222)(4)......(22)()2n kn n n kn kn n n k-+---+Γ=-+---+Γ当2n k=时11()(21)(23)......1()2()2nk kn+Γ--⋅Γ==21221221()12())kk kkeke----≈-⋅2121222222(21)(1)22(1)kkkkkkekkeππ------=-⋅-⋅2111(1))22k nk e-=+⋅→→∞-当21n k=+时亦可推出同样的结果。

另外,由特殊极限公式可得221122()222lim(1)lim[(1)]n n xn xx nn nx xen n++∙---→∞→∞+=+=综合上诉,即证明(2)式所以,t分布的极限分布是正态分布.下面用MATLAB来验证上面结论,首先定义()t n分布函数和相应的正态分布(0,)2nNn-,再依次增大n,比较两者关系:从上面三个图形可以看出,n 越大,()t n 分布密度函数与正态分布(0,)2nN n -度函数越接近,这就和所证结论相符合.2.3F 分布收敛于标准正态分布 若//X mF Y n=服从为第一自由度为m ,第二自由度为n 的F分布,则2/2lim ()xt n n P X x e dt --∞→∞≤=.证明:m /m 1PY →∞−−→当时 所以/n LF X −−→因为222(/)1,(/)n E X n D X n n n=== 所以由中心极限定理,当→∞n(0,1)LN −−→ 所以F 分布的极限分布是正态分布.下面用MATLAB 来验证上面结论,首先定义(,)F m n 分布函数和相应的正态分布222(2)(,)2(2)(4)n n m n N n m n n +----,再依次增大n ,比较两者关系:从上面三个图形可以看出,n 越大,(,)F m n 分布密度函数与正态分布222(2)(,)2(2)(4)n n m n N n m n n +----度函数越接近,这就和所证结论相符合.在实际应用中我们往往在取得总体的样本后,通常是借助样本的统计量对未知的总体分布进行推断,为此须进一步确定相应的统计量所服从的分布,正态分布、 2()n χ分布、t 分布、F 分布是统计学最基本的四种分布,而2()n χ分布、t 分布和F 分布又都收敛于正态分布,可见正态分布在统计学中的地位. 实际上,χ分布、t分布和F分布收敛于正态分布的方法很多,本质上都是应用证明2()n了大数定理和中心极限定理.既然三大抽样分布都收敛于正态分布,则当样本容量很大时,就可以用正态分布来近似三大抽样分布. 本文主要还利用了计算机软件来验证数学上的理论证明,在现代数学学习中,我们是离不开计算机的,因此我们也应多学习一些软件的使用.参考文献:[1]XX学士学位论文. 统计学三大分布与正态分布的差异. 扬州大学.2010[2]范玉妹,汪飞星,王萍,李娜. 概率论与数理统计.机械工业出版社.2007[3] 宗序平,赵俊,陶伟. 统计学上三大分布推导方法.2009χ分布、t分布和F分布的近似计算. 2008[4] 王福昌,曹慧荣. 2()n[5]李贤平,沈崇圣,陈予毅.概率论与数理统计.复旦大学出版社.2005。

相关文档
最新文档