正态分布的可加性

合集下载

正态分布的性质及其在实际中的应用

正态分布的性质及其在实际中的应用

正态分布的性质及其在实际中的应用正态分布是数学中的一个重要概念,这种分布在生活中的应用非常广泛。

在现代统计学中,正态分布是基本分布之一,具有许多独特的性质。

在本文中,我们将探讨正态分布的性质及其在实际中的应用。

什么是正态分布?
正态分布是一种连续的概率分布,也被称为高斯分布或钟形曲线。

它具有以下特点:
1. 对称性: 正态分布是一个对称分布,以均值为中心对称。

2. 集中性: 大多数数据集中在均值附近。

3. 概率密度函数: 正态曲线的概率密度函数具有以下形式:
其中,μ是均值,σ是标准差,π是圆周率,e是自然对数的底数。

实际应用
正态分布的应用非常广泛,特别是在统计学中。

如下是几个例子:
1. 财务分析
正态分布可用于分析公司收益的变化情况。

在财务分析中,正态分布可作为比较不同公司的基准。

如果一个公司的收益呈正态分布,那么可以比较其收益的均值和标准差来判断其在业内的优劣。

2. 计算机科学
正态分布可用于计算机网络的性能分析。

在计算机科学中,正态分布可以用于模拟和预测网络中的数据传输和带宽利用率等方面的情况。

3. 生物学
在生物学中,正态分布可以用于分析群体的数量和分布。

例如,可以使用正态分布来分析某个药物的效果、细胞数量等。

结论
正态分布是统计学中一个基本且有用的概念。

它在实际中的应
用非常广泛,可以用于越来越多的领域,包括财务、计算机科学
和生物学等。

在熟悉它的模式和特点的基础上,我们可以更好地
分析它的数据,并从中获得更多、更精准的信息。

概率论与数理统计总复习知识点归纳

概率论与数理统计总复习知识点归纳
z2 , 0 z 1 f Z ( z ) FZ' ( z ) z ( 2 z ) , 1 z 2 0 , 其它
0 x 1 法二 (公式法):注意到被积函数的非零区域G为: 0 z x 1 能否用 f Z ( z ) f X ( x) fY ( z x )dx ?
若Xi ~ N( i,i 2), i=1,2,...n, 相互独立,则对任 何实数a1, a2, …, an, 有
aX1 b ~ N ( a1 b,, a2? 12 ), ?
ai i , ? i2 i2 ) a ai X i ~ N ( ?
i 1 i 1 i 1
(P( A B) B) P3 A / B) 0.3 0054 0.2 P AB) P( 0. ( 0.5 0.5 . . P( A B) P( A) P( B) P( AB) 0.3 0.5 0.2 0.6
P( A B ) P( A B) 1 P( A B) 0.4
于是Y的概率密度为 1 1 1/ 2 fY ( y ) f X ( y ) ( y ) f X ( y ) ( y ) 1/ 2 2 2 1 ( y ) 1/ 2 [ f X ( y ) f X ( y )] , y 0 2
f Y ( y) 0 , y 0
例1 设甲、乙、丙三 人的命中率分别为0.3, 0.2,0.1。现三人独立地 A 1 向目标各射击一次,结果 有两次命中目标,试求丙 没有命中目标的概率。
P(Ai)—— 先验概率
A2
........
An
P(Ai /B ) 后验概率
P(B/Ai) P(B )

《正态分布》说课稿

《正态分布》说课稿

《正态分布》说课稿正态分布是统计学中非常重要的一个概念,它描述了大量随机变量的分布规律,被广泛应用于各个领域的数据分析和预测中。

本文将介绍正态分布的基本概念、性质、应用以及如何利用正态分布进行统计推断。

一、正态分布的基本概念1.1 正态分布的定义:正态分布又称高斯分布,是一种连续概率分布,其概率密度函数呈钟形曲线,左右对称,中间最高。

1.2 正态分布的特点:正态分布具有唯一的均值和标准差,均值决定了曲线的中心位置,标准差决定了曲线的宽度。

1.3 正态分布的标准化:通过标准化可以将正态分布转化为标准正态分布,即均值为0,标准差为1的正态分布。

二、正态分布的性质2.1 正态分布的均值和中位数相等:正态分布的均值和中位数相等,即曲线对称中心位置处的值。

2.2 正态分布的68-95-99.7法则:约68%的数据落在均值附近的一个标准差范围内,约95%的数据落在两个标准差范围内,约99.7%的数据落在三个标准差范围内。

2.3 正态分布的线性组合仍然是正态分布:对于正态分布的线性组合,如两个正态分布的和或差,仍然是正态分布。

三、正态分布的应用3.1 在自然科学中的应用:正态分布常用于测量误差、实验数据分析等领域,如物理学、化学等。

3.2 在社会科学中的应用:正态分布被广泛应用于人口统计、心理学研究、经济学分析等领域。

3.3 在工程技术中的应用:正态分布在质量控制、可靠性分析、风险评估等方面有重要应用。

四、利用正态分布进行统计推断4.1 正态分布的参数估计:通过样本数据估计总体的均值和标准差,得到对总体的估计。

4.2 正态分布的假设检验:利用正态分布进行假设检验,判断总体参数是否符合某种假设。

4.3 正态分布的置信区间估计:通过正态分布的性质,构建总体参数的置信区间,对总体参数进行估计。

五、结语正态分布作为统计学中重要的概念,具有丰富的性质和广泛的应用。

通过深入理解正态分布的基本概念和性质,我们可以更好地应用正态分布进行数据分析和推断,为各个领域的研究和实践提供有力支持。

正态分布所有的知识点

正态分布所有的知识点

正态分布是统计学中一种常见的概率分布,也称为高斯分布。

它在许多实际问题的建模和分析中都有重要应用。

本文将从基本概念、性质和应用等方面介绍正态分布。

1. 基本概念正态分布是一种连续型的概率分布,其特点是呈钟形曲线,对称分布于均值周围。

正态分布的定义由两个参数确定,分别是均值μ和标准差σ。

记为N(μ, σ^2),表示随机变量X服从均值为μ,标准差为σ的正态分布。

2. 性质正态分布具有许多重要的性质,包括:2.1 对称性正态分布是关于均值对称的。

也就是说,分布在均值μ左侧的曲线与分布在均值右侧的曲线是相似的。

2.2 峰度和偏度正态分布的峰度是指其曲线的陡峭程度。

正态分布的峰度为3,称为正态分布的峰度系数。

高于3的峰度表示曲线更陡峭,低于3的峰度表示曲线更平缓。

正态分布的偏度是指其曲线的对称性。

正态分布的偏度为0,表示曲线对称。

大于0的偏度表示曲线向左偏斜,小于0的偏度表示曲线向右偏斜。

2.3 中心极限定理中心极限定理是指在一定条件下,独立同分布的随机变量之和近似服从正态分布。

这个定理在统计学中有广泛的应用,使得正态分布成为统计推断的基础。

3. 应用正态分布在实际问题中有广泛的应用,下面介绍几个常见的应用场景:3.1 统计推断正态分布在统计推断中起到至关重要的作用。

通过收集样本数据,我们可以根据正态分布的性质进行参数估计和假设检验等统计分析。

3.2 财务分析正态分布在财务分析中也有重要应用。

例如,股票市场的收益率往往服从正态分布,基于正态分布的模型可以用于分析和预测股票的风险和收益。

3.3 质量控制正态分布在质量控制中用于判断产品质量是否符合要求。

通过收集产品的测量数据,可以利用正态分布的性质进行质量控制和异常检测。

3.4 自然科学研究正态分布在自然科学研究中也有广泛应用。

例如,地震的震级、物种的体重和身高等都可以用正态分布进行建模和分析。

结论正态分布是统计学中最重要的概率分布之一,具有许多重要的性质和应用。

正态分布

正态分布

正态分布(normal distribution )一、 定义 如果连续型随机变量取值分布呈现单峰、对称、两侧均匀变动的钟形分布,且能用下列函数描述其位置和形状特征的,则称之为正态分布。

概率密度函数, -∞<x<∞二、 参数1、可变参数(1)位置参数 μ E (x )=μ表达正态曲线在横轴的位置:μ3>μ2>μ11 2 3(2) 形态参数 σ表达正态曲线的偏尖峰形状和偏平阔形状:σ3>σ2>σ1 V(x)= σ2固定参数 (1)偏度系数 理论三阶矩 SK=∑(x-μ)3/nσ3=0 (2) 峰度系数 理论四阶矩 KU=∑(x-μ)4/nσ4=3 * 样本偏度系数g 1与样本峰度系数g 2公式复杂,可参阅其他教材。

三、图形及曲线与横轴向面积(概率)分布规律P{μ-σ<x<μ+σ}=0.6827P{μ-1.96σ<x<μ+1.96σ}=0.9500 P{μ-2.58σ<x<μ+2.58σ}=0.990022()())2X f X μσ-=-四、 应用1、描述资料分布2、依据面积分布规律求医学参考值范围3、质量控制方法中随机误差分布符合正态,可用一定范围作为质量警戒线和控线4、标准正态分布的U 值,可视为重要统计量,是大样本参数估计和假设检验的基础。

而且用于求资料某一定范围内分布的理论频数(n 、x 、s )已计算出例:已知x =50,S=10,N=200,求45<x<65的频数 解:令x 1=45 x 2=65U 1=(45-50)/10=-0.5, U 2=(65-50)/10=1.5 查U 值表Ф{-0.5< U 1<0}=0.5-0.3085=0.1915 Ф{0< U 2<1.5}=0.5-0.0668=0.4332 P{-0.5<U<1.5}=0.1915+0.4332=0.6247 200×0.6247=1255、正态分布式在特定条件下一些离散型分布的极限分布,这意味着只要符合特定条件,这些离散型分布亦可按正态近似法处理。

概率论与数理统计之正态分布

概率论与数理统计之正态分布

转化为标准正态分布
P(8100 Yn 10000)
标准化
P 2.5
Yn np np(1 p)
50
(50) (2.5) 1 0.9938 0.0062
37
例:某电站供应10000户居民用电,设在高峰时每户用电的概率为0.8 各用户用电多少是相互独立的,求:
(1)同一时刻有8100户以上用电的概率; (2)若每户用电功率为100W,则电站至少需要多少电功率才能保证以
1
z2
e 10 , z R
10
§4.4 二维正态分布
定义: 二维随机变量 (X ,Y )服从二维正态分布,记作
(
X
,Y
)
~
N(x
,
y
,
2 x
,
2 y
,
r)
其中 x, y ,x 0, y 0, r( r 1) 是参数.
26
§4.4 二维正态分布
定理1:设二维连续随机变量
(X
,Y
)
~
N(x
,
Q /100 8000 1.96
Q 807840
38
40
39
15-16,五. 设每个零件上的瑕疵点个数服从泊松分布P(1),现 随机抽取100个零件,根据中心极限定理,求100个 零件上总瑕疵点个数不多于120个的概率.
正态分布的前世今生
一、邂逅,正态曲线的首次发现 棣莫弗—拉普拉斯中心极限定理,4.5节
二、寻找随机误差分布的规律(正态分布的确立) 三、正态分布的各种推导 四、正态分布开疆扩土 五、正态魅影
正态分布性质,4.3节
§4.1 正态分布的概率密度与分布函数
定义:设随机变量 X 的概率密度为

正态分布知识点归纳总结

正态分布知识点归纳总结一、正态分布的概念正态分布是概率论和统计学中最重要的连续概率分布之一,具有许多重要的性质和应用。

它的密度函数表达式为:\[f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]其中,μ是分布的均值(也称为期望值),σ是分布的标准差,π是圆周率。

该密度函数描述了正态分布的概率密度曲线,呈钟形曲线,中心对称。

正态分布具有以下几个重要的性质:1. 对称性:正态分布是关于均值对称的,即以均值为中心呈对称分布。

2. 峰度:正态分布的峰度为3,表示分布的尾部平缓,数据集中在均值附近。

3. 位置参数和尺度参数:正态分布具有两个参数,均值μ用于描述分布的位置,标准差σ用于描述分布的离散程度。

4. 68-95-99.7法则:正态分布在均值附近有着特别的区间划分规律,约68%的数据落在均值附近一个标准差的范围内,约95%的数据落在两个标准差的范围内,约99.7%的数据落在三个标准差的范围内。

二、正态分布的特性正态分布具有一些独特的特性,使得它在统计学和概率论中广泛应用。

以下是一些正态分布的特性:1. 中心极限定理:若从任意总体中抽取样本,在样本容量足够大时,样本均值的分布将近似服从正态分布,这就是中心极限定理。

2. 独特的形状:正态分布的概率密度函数呈钟形曲线,两侧逐渐平缓衰减,分布的形状独特,使得其具有许多重要的性质。

3. 偏度和峰度:正态分布的偏度(skewness)为0,表示分布的对称性;峰度(kurtosis)为3,表示分布比较平缓。

4. 边缘分布:正态分布具有边缘分布的性质,在多维情况下,边缘分布为正态分布。

正态分布的这些特性使得它成为了统计学和概率论中极为重要的概率分布,被广泛应用于假设检验、置信区间估计、回归分析、贝叶斯分析等统计方法。

三、正态分布的应用正态分布在实际应用中具有广泛的意义,涉及到许多不同领域。

三正态分布——数量性状遗传理论新解

三正态分布——数量性状遗传理论新解张廷桢【摘要】用与生产关系密切且广泛存在的孟德尔群体,讨论数量遗传理论.首先,对Nilsson-Ehle小麦粒色实验的原始资料进行分析,得知小麦种皮的深红色受3对基因控制,进而作X2检验,说明数量性状受多基因控制.用Lyapunov中心极限定理证明,基因型值G呈正态分布,小生境环境效应E呈正态分布.从概率角度,阐述G与E 的独立,用正态分布的可加性合成G与E,使P=G+E呈正态分布,并且绘制出三正态曲线图.这说明在随机交配下,不论是否连锁,不论基因效应是否相等,不论等位基因是否存在显性和什么样的显性,表现型值P均服从正态分布.吸收微效多基因假说的合理内核,引入环境效应,其应用范围突破微效多基因假说,更加全面和科学.【期刊名称】《安徽农业科学》【年(卷),期】2015(000)003【总页数】3页(P4-6)【关键词】数量性状遗传;孟德尔群体;中心极限定理;基因型值G;环境效应E;表现型值P;正态分布【作者】张廷桢【作者单位】西北农林科技大学林学院,陕西杨凌712100【正文语种】中文【中图分类】S188+.1;Q348数量性状遗传是遗传学的重要内容之一。

自1909年Nilsson-Ehle发表小麦杂交实验100年以来,国内外在数量遗传理论上都延用着他的研究,但许多人将F2(种子)的表现型隐去真像,指出由白粒到深红粒有多种级别。

实际上,小麦F2胚外包被的是母体F12n组织,种子应是同一红色。

这里所谈的是一种假象。

这是其一。

第二,没有引入组成数量遗传的另一重要组分——环境效应。

Nilsson-Ehle认为没有环境影响。

Ayala等认为,环境对小麦粒色变异的影响极小。

在Nilsson-Ehle实验中,环境的影响可忽略不计。

确切地说,他研究的是数量性状遗传的基因型部分,就基因的积加作用来说,只是比两对基因的遗传多了一对,不能产生数量性状遗传的完整理论。

第三,现行的多基因假说设立很多不切实际的禁区,如要求无连锁、各基因效应相等、等位基因只能是不完全显性或无显性等,难以解释自然界生物普遍存在的数量性状遗传的许多问题。

概率论 正态分布

概率论正态分布概率论&colon;正态分布第四章正态分布第一节第二节第三节第四节第五节正态分布的密度函数正态分布的数字特征正态分布的线性性质二维正态分布中心极限定理正态分布的密度函数正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,它在概率统计中占有特别重要的地位.比如,考察一群人的身高,个体的身高作为一个随机变量,其取值特点是:在平均身高附近的人较多,特别高和特别矮的人较少.一个班的一次考试成绩、测量误差等均有类似的特征.高斯在研究误差理论时曾用它来刻画误差,因此很多文献中亦称之为高斯分布. 进一步的理论研究表明,一个变量如果受到大量独立的因素的影响(无主导因素),则它一般服从正态分布,这是中心极限定理探讨的问题.一. 一般正态分布1. 定义若随机变量X的密度函数为1 2 2 f ( x) e 2其中 x ( x )2式中为实数, >0 .则称X服从参数为 ,2的正态分布,亦称高斯分布.记为N(, 2).可表为X~N(, 2). 图象见右上角正态分布有两个特性: (1) 单峰对称密度曲线关于直线x=对称1 f()=maxf(x)= 2(2) 的大小直接影响概率的分布越大,曲线越平坦; 越小,曲线越陡峻. 正态分布也称为高斯(Gauss)分布N ( 4,3 / 5)N ( 4,1)N ( 4,7 / 5)二. 标准正态分布参数=0,2=1的正态分布称为标准正态分布,记作X~N(0, 1)。

(x) 其密度函数为1 (x)2 ( x )x2 e 24 2 0(1) (0)=0.5( x ) P { X x}t2 x 1 e 2 2(2) (+∞)=1;dt , xf ( x) 1 e 2(3) (x)=1-(-x). 一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值.(P328附表1)如,若 X~N(0,1),(0.5)=0.6915, P{1.32正态分布的数字特征 (一) 一般正态分布N(, 2)( x)2 2 21 X ~ f (x) e 2, xE( X )xf ( x)dxt ( xt2 2 e dt 2x e 2( x )2 2 2D( X )) f ( x )dx(二)标准正态分布N(0, 1)X ~ f ( x)E( X )x2 e 2, xx2 e 2 dxxf ( x ) dx0(奇函数 )D( X ) E{[ X E ( X )] }2 x[ xE ( X )] f ( x)dxx2 e 2 dx三. 一般正态分布概率的计算若X~N(,2),>0,则有F ( x ) P { X x}x 1 e 2 (t ) 2 2 2x }F ( x) P{X x} P{ P{Z ( x ).} ( x ) /t2 1 e 2 dt 2一般地,有例1 设随机变量 X ~ N (1, 2 ) , 求 P{ 1.6 X 2.4} 解 P{ 1.6 X 2.4} P{ 1.6 1 X 1 2.4 1} P{ 2.6 X 1 1.4}P{ 2.6 / 2 ( X 1) / 2 1.4 / 2} P{ 1.3 ( X 1) / 2 0.7}(0.7) ( 1.3)(0.7) [1 (1.3)] 0.7580 [1 0.9032] 0.6612 .P{a X b} P{a X b } a b a Xb P{ } P{ Z } b a P{Z } P{Z } Z ~ N (0,1) b a( ) ( ) 2例2. 设 X N(,2),求P{-3解 P{ 3 X 3 } P{( 3 ) X( 3 ) } P{3 X 3 } P{ 3 X3 } P{ 3 ( X ) / 3} (3) ( 3)(3) [1 (3)] 2 (3) 1 0.9973本题结果称为3原则.在工程应用中,通常认为P{|X|≤3} ≈1,忽略{|X|>3}的值.如在质量控制中, 常用标准指标值±3作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常.例 3 设随机变量 X ~ N ( 2, 2 ) , 且 P{2 X 4} 0 .3, 求 P{ X0}. 随机变量解 P{2 X 4} P{0 ( X 2) / 2 / } 标准化(2 / ) (0) 0.3, (2 / ) 0.3 (0) 0.8P{ X 0} P{( X 2) / 2 / } ( 2 / ) 1 (2 / ) 1 0.8 0.2 例 4 设随机变量 X ~ N ( 3, 4 ) , 且常数 C 满足 P{ X C } P{ X C }, 求常数 C . 解由P{ X C} P{ X C}, 即 1 P{ X C} P{ X C} 所以 P{ X C} 0.5 X 3 C 3 C 3 另一方面 , P{ XC} P{ } ( ) 0.5 2 2 2 C 3 0 , C 3. 2例 4(2021年) ( A)设 X ~ N (0 , 1), 对于给定的 (0,1), 数 ( B)满足 P{ X } . 若 P{ X x} , 则 x 等于( D) 1解 P { X x} P { x X x}1 P{ X x}2 故 x 1一种电子元件的使用寿命X(小时)服从正态分布N(100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率. 解:设Y为使用的最初90小时内损坏的元件数,则Y~90 100 ) (0.67) 0.2514 其中 p P{ X 90} ( 15P{Y 0} (1 p ) 3 0.4195 故2 (2021年) 设随机变量X ~ N ( 1 , 12 ), Y ~ N ( 2 , 2 ),且 P{ X 1 1} P{ Y 2 1}, 则必有 ( A) 1 2 . ( B ) 1 2 . (C ) 1 2 . ( B) 1 2 .第二节正态分布的数字特征一. 一般正态分布N(, 2)( x)2 2 21 X ~ f (x) e 2, xE( X )xf ( x)dxt ( xt2 2 e dt 2x e 2( x )2 2 2D( X )) f ( x )dx标准正态分布N(0, 1)X ~ f ( x)E( X )x2 e 2, xx2 e 2 dxxf ( x ) dx0(奇函数 )D( X ) E{[ X E ( X )] }2 x[ xE ( X )] f ( x)dxx2 e 2 dx例1 已知随机变量X的密度函数为 1 x 2 2 x 1 f ( x) e ,x 求 E ( X )、D ( X ) .f ( x)x 2 x 11 e2 (1/ 2)( x 1) 2 2(1/ 2 ) 21 故 1, 2例2 设X服从N(0,1)分布,求E(X2),E(X3)1 解 f (x) e2 x2 x2 2 E ( X 2 ) x 2 f ( x)dxe dx 2 2 2x de 2x 2x 2 eE( X )3 xf ( x) dxx2 x3 2 e dxx2 e 2 dx 12021年(数一) 设随机变量X的分布函数为F ( x) 0.3 ( x) 0.7 ( 其中 ( x)为标准正态分布函数, 则EX ( A)0. ( B )0.3. (C )0.7. ( D)1.x 1 ), 2分析 : EX xf ( x )dx ,因此先求随机变量 X的概率密度函数 f ( x ).解 f ( x ) F ( x ) [ 0 . 3 ( x ) 0 . 7 (0 .7 x 1 0 . 3 ( x ) ( ) 2 2于是 EXx 1 ) ] 2xf ( x ) dxx[0.3 ( x )0 .7 x 1 ( )]dx 2 20.7 x 1 0.3 x ( x)dx x ( )dx 2 21 0 .3 x e 20 .7 dx x 21 x 12 ( ) 2 21 x 12 ( ) 1 2 2 e dx 20 .7 1 x 2 e 21 x 12 ) ( 0 .7 1 2 2 dx dx x 2 e 2x 1 令 t , 则dx 2dt , x 2t 1. 代入上式得 20 .7 1 x 2 e 21 x 12 ) ( 2 20 .7 1 dx (2t 1) 2 e 21 0 .7 2t e2 22 dt0 .7 1 2 e 20. 7 10 2 e 22dt 0.7dt 0.7.设随机变量 X与 Y相互独立 , 且 X服从标准正态分布 ,1 Y的概率分布为 P{Y 0} P{Y 1} .记 FZ ( z )为随机变量2 Z XY 的分布函数 , 则函数 FZ ( z )的间断点个数为 ( A) 0 . ( B )1. (C ) 2 . ( D )3 .解 FZ (z) P{Z z} P{XY z}P{Y 0}P{XY z | Y 0} P{Y 1}P{XY z | Y 1}1 [ P{ XY z | Y 0} P{ XY z | Y 1}]2 1 [ P{ X 0z | Y 0} P{ X 1 z | Y 1}] 2 为什么? 1 [ P { X 0 z }P { X z }] 21 (1)当z 0时, FZ ( z ) [ P{ X 0 z} P{ X z}] 21 1 [ P( ) P{ X z}] [0 P{ X z}]2 21 1 P{ X z} ( z )2 2 1 (2)当z 0时, FZ ( z ) [ P{ X0 z P{ X z}] 21 1 [ P() P{ X z}] [1 P{ X z}]2 2所以 , z 0为函数 FZ ( z )的间断点 . ( B )正确 .1 [1 ( z )] 2例 3 某地抽样调查结果表明 , 考生的外语成绩 (百分制) 近似服从正态分布 , 平均成绩为 72 分, 而 96以上的考生占总数的 2.3%, 求考生的外语成绩在 60 分至 84 分之间的概率 . 解设 X —考生的外语成绩, 依题设知X ~ N ( , 2 ), 其中72, 下求方差 2 X 96 由题设 P{ X 96} 0.023 P{ } 0.023 X 96 96 1 P{ } 0.023, 即 1 ( ) 0.023) 0.977,96 96 72 2, 12 2 2于是 , P{60 X 84 } P{60 72 X 84 72 X 1} P{ } P{ 1 12 12(1) (1) (1) [1 (1)]2 (1) 1 2 0.841 1 0.682例 4 假设测量的随机误差 X ~ N ( 0,10 2 ).试求在 100 次独立重复测量中 , 至少有三次测量的绝对值大于 19 .6 的概率 ,并利用泊松分布求出的近似值 . 解先求每次测量误差的绝对值大于19.6的概率 p p P{ X 19.6} 1 P{ X19.6} 1 P{19.6 X 19.6}1 P{ 19.619.6 0 X 19.6 0 } 1 P{ 10 10 X1 P{ 1.96 1.96} 1 [ (1.96) ( 1.96)]1 [ (1.96) ( 1.96)] 1 (1.96) [1 (1.96)]2 2 (1.96) 2 2 0.975 2 1.95 0.0519.6设 Y — 100次测量中绝对值大于19.6, 则Y ~ B (100,0.05)于是所求的概率为 P{Y 3} 1 P{Y 0} P{Y 1} P{Y2}0 1 1 C100 (0.05) 0 (0.95)100 C100 (0.05)1 (0.95)99 2 C100 (0.05) 2 (0.95)98np 100 0 .05 5, 故由泊松分布得52 1 e (1 ) 1 e 5 (1 5 ) 0.87 2 2习作题 1.设随机变量X N(0,1),Y U(0,1),Z B(5,0.5),且 X,Y,Z独立,求随机变量U=(2X+3Y)(4Z-1)的数学期望答:27 E (U ) E (2 X 3Y ) E (4 Z 1) 22 设随机变量 X 1 ,..., X n 相互独立,且均服从 N ( , 2 )1 n 分布,求随机变量 X X i 的数学期望 n i 1 1 n 答: E ( X ) E ( X i ) n i 11. 设随机变量X B(12,0.5),Y N(0,1), COV(X,Y)=-1,求V=4X+3Y+1与W=-2X+4Y 的方差与协方差.2. 某单位招聘2500人,按考试成绩从高分到低分依次录用,共有10000人报名.假定报名者的考试成绩X 服从正态分布 N ( , 2 ), 现已知90分以上有359人, 60分以下的有1151人,求被录用者中的最低分数.第三节正态分布的线性性质一. 线性性质例1 设随机变量X服从标准正态分布,求随机变量 Y a X b ~ N (b, a2 ) Y=aX+b的密度函数,且有y b 解: Y=ax+b关于x严单,反函数为 h( y ) ay b fY ( y) f X ( ) h( y) 1 a 2E (Y )y b a 2 e( y b ) 2 2a2y e 2 a( y b ) 2 2a 2dyax b 2x2 e 2 dxD (Y ) E{[YE (Y )]2 } [ y E (Y ) ]2 f ( y ) dy( y b)2 2 a 2 2 e dy a 2 a 直接由Y的密度函数,可观察到Y的数学期望与方差1 2a2 , 由 f ( y) e 2 a 可知随机变量Y服从正态分布, ( y b) 2( y b)2而且 E (Y ) b , D (Y ) a 2定理1 设随机变量X 服从正态分布N(, 2),则X的线性函数 Y a b X 也服从正态分布,且有 Y a bX ~ N ( a b , a 2 2 )已知X N(,2),求 Y解 Y X 关于x严格单调,反函数为 h( y) y 故 fY ( y) f X [h( y)] | h( y) | f X (y )y 2你能用正态分布的线性性质求解吗?二. 正态分布的可加性定理2 设随机变量X1,X2 相互独立且Xi 服从正态分布N(i ,i2),i=1,2, 则 2 2 2 2 a1 X 1 a2 X 2 ~ N (a1 1 a2 2 , a1 1 a2 2 ) 定理3 设随机变量X1, X2,..., Xn独立且Xi 服从正态分布N(i ,i2),i=1,...,n, 则a i X i ~ N ( a i i , a i2 i2 )i 1 i 1例1. 设随机变量X与Y独立且均服从标准正态分布,求证:Z=X+Y服从N(0,2)分布.解依题设 X ~ N ( 0,1) , Y ~ N ( 0,1) ; 故有E ( X ) 0 , D ( X ) 1 , E (Y ) 0 , D (Y )于是由定理 2可知 X Y服从正态分布 , 且有E ( X Y ) E ( X ) E (Y ) 0 0 0D ( X Y ) D ( X ) D (Y ) 1 1 2,即 X Y ~ N (0 , 2 )例2. 设随机变量X与Y独立,且X~ N(1,2),Y~N(0,1). 求证:(1)Z=2X-Y+3的密度函数;(2)P{2D ( Z ) D ( 2 X Y 3) 4 D ( X )E (Y ) 8 1 9Z 2 X Y 3 ~ N (5,9) 2 Z 8 Z (2) P{2 Z 8} P{ } P{ 1 1} (1) (1) (1) [1 (1)] 即2 (1) 1 2 0.8413 1 0.6826一. 密度函数若随机变量(X,Y)的密度函数为f ( x, y )1 212 11 ( x 1 )2 ( x 1 )( y 2 ) ( y 2 ) 2 [ ] 2 22 2 1 2 2( 1 ) 2 1其中,1、2为实数,1>0、2>0、| |( X , Y ) ~ N ( 1 , 2 , , , )2 1 2 2二、边缘密度函数 2 设(X, Y)~f(x,y),(x,y)R ,则称 f X ( x) f ( x, y )dy 为(X,Y)关于X的边缘密度函数;同理,称 fY ( y ) f ( x,y )dx为(X, Y)关于Y的边缘密度函数。

数理统计2:为什么是正态分布,正态分布均值与方差的估计,卡方分布

数理统计2:为什么是正态分布,正态分布均值与⽅差的估计,卡⽅分布上⼀篇⽂章提到了⼀⼤堆的统计量,但是没有说到它们的⽤处。

今天,我们就会接触到部分估计量,进⼊到数理统计的第⼀⼤范畴——参数估计,同时也会开始使⽤R 语⾔进⾏模拟。

由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:为什么是正态分布为什么要突然提到正态分布的参数估计?原因有以下⼏个。

⾸先,正态分布是⽣活中最常见的分布,许多随机事件的分布可以⽤正态分布来概括。

林德贝格勒维中⼼极限定理告诉我们,⼆阶矩存在的独⽴同分布随机变量列{ξn },记它们的和为S n ,E(ξ1)=µ,D(ξn )=σ2,则S n −nµ√n σd→N (0,1).刚刚学完概率论的同学应该对这个结论不陌⽣。

⽽中⼼极限定理的条件实际上并不需要这么强,林德贝格费勒定理去除了同分布的约束,只要{ξn }满⾜∀τ>0,1∑nk =1D(ξk )n∑k =1∫|x +E(ξk )|≥τ∑n k =1D(ξk )(x −E(ξk ))2d F k (x )→0,就有∑nk =1(ξk −E(ξk ))∑nk =1D(ξk )d→N (0,1).这说明⾃然界中微⼩随机项的累积效应普遍服从中⼼极限定理。

另外,正态分布的信息完全由两个参数所决定:期望和⽅差,即前两阶矩。

因此,如果我们假定总体是服从正态分布的,就只需要对其两个参数作估计,这给问题的讨论带来⽅便。

最后就是正态分布在实⽤上的意义了,两个独⽴正态分布的和、差甚⾄乘积都是正态分布,这在实⽤上也很⽅便,所以许多时候即使总体不服从正态分布,也近似认为服从正态分布。

Part 2:正态分布均值估计既然正态分布完全由两个参数所决定,那么只要知道出这两个参数的值(或者范围),就能确定总体的全部信息。

然⽽,在实际⽣活中要获得绝对正确的正态分布参数是不可能的,因为⽣活中的总体情况总是未知,要认识总体,我们只能从总体中抽取⼀系列样本,再通过样本性质来估计总体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档