正态分布

合集下载

正态分布

正态分布
x
x
当-x<0时 ( x ) P ( X x )
P( X x) 1 P( X x)
1 ( x ) (0 x 4.99)
当x 5时, ( x ) 1;当x 5时, ( x ) 0
P ( a X b) ( b) ( a)

令x=μ+c, x=μ-c (c>0), 分别代入f (x), 可 得 f (μ+c)=f (μ-c) 且 f (μ+c) ≤f (μ), f (μ-c)≤f (μ)
1 f ( x) e 2
( x )2 2 2
, x
当x→ ∞时,f(x) → 0, 这说明曲线 f(x)向左右伸展时,越来越 贴近x轴。即f (x)以x轴为渐近线。
将标准正态分布概率密度的图形向左(或) 右平行移动 个单位,向上伸长(或压缩)
1
图形。
个单位,即可得一般正态分布概率密度的
( x )2 2 2
1 f ( x) e 2 ( x )
,
既然标准正态分布是关于y 轴对称的,而一 般正态分布是由标准正态分布平移 个单位 得来的,故f (x)以μ为对称轴,并在x=μ处达到 最大值: 1 f ( ) 2
2
X

~N(0,1)
根据定理1,只要将一般正态分布的分布 函数转化成标准正态分布,然后查表就可解 决一般正态分布的概率计算问题.
设X ~ N ( , 2 ),Y ~ N (0,1) 其概率密度分别为:
( x ), 0 ( y ) 分布函数分别为: ( x ), 0 ( y )
P ( X a ) P (Y a
a

正态分布

正态分布

2. 一般正态分布的概率计算
对于一般正态分布的概率计算,可以应用定积分的
换元法将其转化为标准正态分布的概率计算.
定理 设X~ N(, ) ,则 X ~ N(0,1).

这样,若X~ N(, ),并记其分布函数为 F(x),则
从而
F ( x)

P{X

x}

P

X



x


P

X
1 2

5
1
2

2
0.9772
P{0

X
1.6}
P

0
1 2

X 1 2

1.6 1
2

0.3 0.5
0.3 0.5 1
0.6179 0.6915 1 0.3094
P{
解:由题意知 X ~ N (10.05,0.062 ),于是
P{
X
10.05

0.12}
P

0.12 0.06

X
10.05 0.06

0.12
0.06

2 2
22 1
2 0.9772 1 0.9544
例4 设 X ~ N(, ),求 P{ X }, P{ X 2 },
越小,图形越陡峭.
o
1 x
0.5 1 1.5
x
特别地,当 0, 1时,称 X 服从标准正态分布,
记为 X ~ N(0,1),其概率密度函数为
(x)
1
x2

正态分布

正态分布
y (x)
密度函数
(x)
1 2
x
2
e
2
专用符 号
分布函数
( x)

x
1 2

x
2

e
2
dx
专用符 号
标准正态分布的性质
分布函数
( x ) P{ X x}
( x)
( x)

x
1 2

t
2

e
2
dt
x
( x) 1 ( x)
一般正态分布的标准化
定理
x 如果 X ~ N ( , ), 则 F ( x)
2
概率计算 若 X ~ N ( , 2 )
b a P (a X b)
a P( X a) 1
决定了图形的中心位置,
的陡峭程度.
决定了图形中峰
正态分布的分布函数
f (x) 1 2
(x ) 2
2 2
e

y
1
1 2
F ( x)
x
1 2

( x ) 2
2
2

e
dx
F(x)

x
计算概率?
P a X b F b F a
由 x 的单调性可得
k 18 2.5 0.91

k 20.275
正态分布的实际应用
某单位招聘155人,按考试成绩录用,共有526 人报名,假设报名者的考试成绩 X ~ N ( , 2 ) 已知90分以上的12人,60分以下的83人,若从高 分到低分依次录取,某人成绩为78分,问此人能否被 录取? 分析

正态分布

正态分布

三. 特征
1. 是单峰曲线,x=μ 2. 以均数μ为中心左右对称 3. 有2个参数,μ:位置参数, σ:变异度参数 σ越大,数据越分散,曲线越平坦。 特别地 N(0,1)称为标准正态分布 (z分布、u分布)
四.正态曲线下面积的分布规律
通过对密度函数积分我们可以知道正态曲线下, 横轴上所夹的面积为1,标准正态分布下1.96~1.96部分的面积为0.95 (可以通过积分 求得)。也就是说|u|>1.96的面积为0.05,对 任意的x,-x~x区间面积为多少呢?统计学家 已将此编制成了正态分布界值表,不过表中 的面积是指p(u<x), 也记作φ(x)。
3. 正态分布是许多统计方法的理论 基础,如后面要讲的t检验、方差分析、 相关回归等,t分布、二项分布、 Poisson分布的极限分布也是正态分布。
4.估计频数分布
例 出生体重低于2500克为低体重儿。若 由某项研究得某地婴儿出生体重均数为 3200克,标准差为350克,估计该地当 年低体重儿所占的比例。2. 源自计医学正常值范围x u s
例 120名健康成年男性农民舒张压的均数 为10.1kPa,标准差为0.93kPa,求舒张 压的95%双侧正常值范围。 ±1.96s =10.1±1.96×0.93 即 8.28~11.92 kPa 95%参考范围(reference range)或正常 范围(normal range)仅仅告知95%健 康者的测定值在此范围之内,并非告知 凡在此范围之内皆健康,也非告知凡在 此范围之外皆不健康,所以不可将之作 为诊断标准。
以上讨论的是标准正态分布,对一般的正 态分布,某指标x~N(μ,σ2),则 u=(x-μ)/σ~N(0,1) 即-1.96<u<1.96的面积为0.95 μ-1.96σ<x<μ+1.96σ的面积为0.95

正态分布

正态分布

正态分布(normal distribution )一、 定义 如果连续型随机变量取值分布呈现单峰、对称、两侧均匀变动的钟形分布,且能用下列函数描述其位置和形状特征的,则称之为正态分布。

概率密度函数, -∞<x<∞二、 参数1、可变参数(1)位置参数 μ E (x )=μ表达正态曲线在横轴的位置:μ3>μ2>μ11 2 3(2) 形态参数 σ表达正态曲线的偏尖峰形状和偏平阔形状:σ3>σ2>σ1 V(x)= σ2固定参数 (1)偏度系数 理论三阶矩 SK=∑(x-μ)3/nσ3=0 (2) 峰度系数 理论四阶矩 KU=∑(x-μ)4/nσ4=3 * 样本偏度系数g 1与样本峰度系数g 2公式复杂,可参阅其他教材。

三、图形及曲线与横轴向面积(概率)分布规律P{μ-σ<x<μ+σ}=0.6827P{μ-1.96σ<x<μ+1.96σ}=0.9500 P{μ-2.58σ<x<μ+2.58σ}=0.990022()())2X f X μσ-=-四、 应用1、描述资料分布2、依据面积分布规律求医学参考值范围3、质量控制方法中随机误差分布符合正态,可用一定范围作为质量警戒线和控线4、标准正态分布的U 值,可视为重要统计量,是大样本参数估计和假设检验的基础。

而且用于求资料某一定范围内分布的理论频数(n 、x 、s )已计算出例:已知x =50,S=10,N=200,求45<x<65的频数 解:令x 1=45 x 2=65U 1=(45-50)/10=-0.5, U 2=(65-50)/10=1.5 查U 值表Ф{-0.5< U 1<0}=0.5-0.3085=0.1915 Ф{0< U 2<1.5}=0.5-0.0668=0.4332 P{-0.5<U<1.5}=0.1915+0.4332=0.6247 200×0.6247=1255、正态分布式在特定条件下一些离散型分布的极限分布,这意味着只要符合特定条件,这些离散型分布亦可按正态近似法处理。

正态分布完整ppt课件

正态分布完整ppt课件
正态性检验
使用如Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法,对 误差项进行正态性检验,以验证其是否符合正态分布。
方差分析中F分布应用
01 02
F分布的定义
F分布是一种连续型概率分布,常用于方差分析中的假设检验。在方差 分析中,通过比较不同组间的方差与组内方差,判断各因素对结果的影 响是否显著。
筛选方法
包括单变量分析和多变量分析等,结合临床 意义和统计学显著性进行生物标志物的筛选 。
社会科学调查数据分析
社会科学调查数据特点
大量、复杂、多维度的数据,往往需要进行统计分析和数据挖掘。
正态分布在社会科学调查数据分析中的应用
通过对调查数据进行正态性检验,选择合适的数据处理和分析方法,如参数检验、回归分析等。
有对称性和单峰性。
性质
对称性:正态分布曲线关于均值对称 。
单峰性:正态分布曲线只有一个峰值 ,位于均值处。
均值、中位数和众数相等。
概率密度函数在均值两侧呈指数下降 。
正态曲线特点
01
02
03
04
形状
钟形曲线,中间高,两边低。
对称性
关于均值对称,即左右两侧形 状相同。
峰值
位于均值处,且峰值高度由标 准差决定。
05
正态分布在金融学领域应用
风险评估及资产组合优化
风险评估
正态分布用于描述金融资产的收益和风险分布,通过计算均值和标准差来评估投资组合 的风险水平。
资产组合优化
基于正态分布假设,利用马科维茨投资组合理论等方法,构建最优资产组合以降低风险 并提高收益。
VaR(Value at Risk)计算
正态分布用于计算投资组合在一定置信水平下的最大可能损失(VaR),以衡量潜在风 险。

正态分布

正态分布

正态分布normal distribution正态分布一种概率分布。

正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。

服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。

正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。

它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。

当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。

μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。

多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。

C.F.高斯在研究测量误差时从另一个角度导出了它。

P.S.拉普拉斯和高斯研究了它的性质。

生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。

例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。

一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。

从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。

附:这种分布的概率密度函数为:(如右图)正态分布公式正态分布1.正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号~。

正态分布

正态分布

[µ − 3σ , µ + 3σ ] 区间内. 区间内.
这在统计学上称作“ σ 准则” 这在统计学上称作“3 准则” .
看一个应用正态分布的例子: 看一个应用正态分布的例子
例 公共汽车车门的高度是按男子与车门顶头 以下来设计的.设男子身高X~ 碰头机会在 0.01 以下来设计的.设男子身高 ~ N(170,62),问车门高度应如何确定? 问车门高度应如何确定? ( , ),问车门高度应如何确定 解 设车门高度为h cm,按设计要求 设车门高度为 ,

设 X ~ N(0, 1), P(X ≤ b) = 0.9515, P(X ≤ a) = 0.04947, 求 a, b.
解: Φ(b) = 0.9515 >1/2, 所以 b > 0, 反查表得: Φ(1.66) = 0.9515, 故 b = 1.66
而 Φ(a) = 0.0495 < 1/2, 所以 a < 0, Φ(−a) = 0.9505, 反查表得: Φ(1.65) = 0.9505, 故 a = − 1.65
例 设 X ~ N(0, 1), P(X>−1.96) ,
求 P(|X|<1.96)
解: P(X>−1.96) = 1− Φ(−1.96) = 1−(1− Φ(1.96)) = Φ(1.96) = 0.975 (查表得) P(|X|<1.96) = 2 Φ(1.96)−1 = 2 ×0.975−1 = 0.95
标准正态分布的上 α分位点 设 X ~ N ( 0,1) ,若数 zα满足条件
P{ X > zα} = α , 0 < α < 1 ⇒ P{ X < − zα } = α
则称点 zα 为标准正态分布的上 α分位点 标准正态分布的上 分位点.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对正态分布的理解 1.正态分布是自然界最常见的一种分布,例如:测量的误差; 人的身高、体重等;农作物的收获量;工厂产品的尺寸:直径、长 度、宽度、高度„„都近似地服从正态分布. 2.正态分布定义中的式子实际是指随机变量 X 的取值区间在 (a,b]上的概率等于总体密度函数在[a,b]上的定积分值.也就是 指随机变量 X 的取值区间在(a, b]上时的概率等于正态曲线与直线 x=a,x=b 以及 x 轴所围成的封闭图形的面积. 3.从正态曲线可以看出,对于固定的 μ 和 σ 而言,随机变量 在(μ-σ, μ+σ)上取值的概率随着 σ 的减小而增大. 这说明 σ 越小, X 取值落在区间(μ-σ, μ+σ)的概率越大, 即 X 集中在 μ 周围的概 率越大.正态分布的 3σ 原则是进行质量控制的依据,要会应用给 定三个区间的概率解决实际问题.
知识点三 3σ 原则 1.若 X~N(μ,σ2),则对于任何实数 a>0,P(μ-a<X≤μ+ μ +a a)= φμ,σ(x)dx.
- μ a
2.正态分布在三个特殊区间内取值的概率. P(μ-α<X≤μ+σ)=0.682 6; P(μ-2α<X≤μ+2σ)=0.954 4; P(μ-3α<X≤μ+3σ)=0.997 4.
变式训练 2 设 X~N(1,22),试求: (1)P(-1<X≤3). (2)P(3<X≤5).
解析:因为 N~N(1,22),所以 μ=1,σ=2. (1)P(-1<X≤3)=P(1-2<X≤1+2) =P(μ-σ<X≤μ+σ)=0.682 6. (2)因为 P(3<X≤5)=P(-3≤X<-1),所以 P(3<X≤5) 1 = [P(-3<X≤5)-P(1<X≤3)] 2 1 = [P(1-4<X≤1+4)-P(1-2<X≤1+2)] 2 1 = [P(μ-2σ<X≤μ+2σ)-P(μ-σ<X≤μ+σ)] 2 1 = (0.954 4-0.682 6)=0.135 9. 2
类型二 正态分布下的概率计算 【例 2】 在某项测量中,测量结果服从正态分布 N(1,4),求 正态总体 X 在(-1,1)内取值的概率.
解析: 由题意得 μ=1,σ=2, 所以 P(-1<X≤3)=P(1-2<X≤1+2)=0.682 6. 又因为正态曲线关于 x=1 对称, 1 所以 P(-1<X<1)=P(1<X<3)= P(-1<X<3)=0.341 3. 2
[点评] 1.本题利用正态分布曲线的图象和性质以特殊概率的值进行转 化求值. 2.解决正态分布曲线的概率计算问题,首先应理解曲线的对称 性,再者要熟练记住正态变量的取值在区间(μ-σ,μ+σ),(μ-2σ, μ+2σ),(μ-3σ,μ+3σ)上的概率值,同时又要根据已知的正态分布 确定所给区间属于上述区间的哪一个.
知识点一 正态曲线 1.正态曲线的概念 1 e 若 φμ,σ(x)= , x∈(-∞, +∞), 其中实数 μ 和 σ(σ 2πσ >0)为参数, 我们称 φμ,σ(x)的图象为正态分布密度曲线, 简称正态 曲线.
( x )2 2 2
2.正态曲线的性质 ①曲线位于 x 轴上方,与 x 轴不相交; ②曲线是单峰的,它关于直线 x=μ 对称; 1 ③曲线在 x=μ 处达到峰值 ; 2πσ ④曲线与 x 轴之间的面积为 1; ⑤当 σ 一定时,曲线的位置由 μ 确定,曲线随着 μ 的变化而 沿 x 轴平移; ⑥当 μ 一定时, 曲线的形状由 σ 确定, σ 越小, 曲线越“瘦高”, 表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分 布越分散.
答案:C
4.设随机变量 X~N(1,52),且 P(X≤0)=P(X>a-1),则实数 a 的值为__________.
解析:因为随机变量 X~N(1,52),所以正态曲线关于 x=1 对 称,因为 P(X≤0)=P(X>a-1),所以 0 与 a-1 关于 x=1 对称, 1 所以 ×(0+a-1)=1,所以 a=3. 2 答案:3
[点评] 1.本题利用转化的思想方法,把普通的区间转化为 3σ 区间,由 特殊区间的概率值求出. 2.解答正态分布的实际应用题,其关键是如何转化,同时应熟 练掌握正态分布在,(μ-σ,μ+σ],(μ-2σ,μ+2σ],(μ-3σ,μ+3σ] 三个区间内的概率.
变式训练 3 某一部件由三个电子元件按如图方式连接而成, 元件 1 或元件 2 正常工作,且元件 3 正常工作,则部件正常工作, 设三个电子元件的使用寿命 ( 单位:小时 ) 均服从正态分布 N(1 000,502),且各个元件能否正常工作相互独立,那么该部件的使用 寿命超过 1 000 小时的概率为__________.
( x 209)2 72
( x 2 )2 2 2 2
( x 1 ) 2 2 2 1
(x∈R),曲
(x∈R),则(
)
A.μ1<μ2 B.曲线 C1 与 x 轴相交 C.σ1>σ2 D.曲线 C1、C2 分别与 x 轴所夹的>μ2,σ1<σ2,曲线 C1,C2 分别与 x 轴所夹面积相等. 答案:D
解析:设元件 1,2,3 的使用寿命超过 1 000 小时的事件分别记 1 为 A,B,C,显然 P(A)=P(B)=P(C)= , 2 ∴该部件的使用寿命超过 1 000 小时的事件为(A B + A B+ AB)C, ∴该部件的使用寿命超过 1 000 小时的概率 1 1 1 1 1 1 1 3 P=2×2+2×2+2×2× = . 2 8 3 答案: 8
5.若一批白炽灯共有 10 000 只,其光通量 X 服从正态分布, ( x 209)2 1 72 其概率密度函数是 f(x)= e , x∈R.试求光通量在下列范 6 2π 围内的白炽灯的个数. (1)(209-6,209+6). (2)(209-18,209+18).
1 解析:由于 X 的概率密度函数为 f(x)= e , 6 2π 所以 μ=209,σ=6. 所以 μ-σ=209-6,μ+σ=209+6. μ-3σ=209-6×3=209-18, μ+3σ=209+6×3=209+18. 因此光通量 X 的取值在区间(209-6,209+6),(209-18,209+ 18)内的概率应分别是 0.682 6 和 0.997 4. (1)光通量 X 在(209-6,209+6)范围内的白炽灯个数大约是 10 000×0.682 6=6 826. (2)光通量 X 在(209-18,209+18)范围内的白炽灯个数大约是 10 000×0.997 4=9 974.
知识点二 正态分布 如果对于任何实数 a,b(a<b),随机变量 X 满足 P(a<X≤b) b = φμ,σ(x)dx,则称随机变量 X 服从正态分布.

a
正态分布完全由参数 μ 和 σ 确定,因此正态分布常记作 N(μ, σ2).如果随机变量 X 服从正态分布,则记为 X~N(μ,σ2).
[点评] 1.本题直接根据正态分布曲线的性质解决 μ,σ. 2.正态曲线的图象及性质特点,其具有两大明显特征: (1)对称轴方程 x=μ; 1 (2)最值 这两点把握好了,参数 μ,σ 便确定了,代入 φμ, σ 2π σ(x)中便可求出相应的解析式.
1 变式训练 1 如图,曲线 C1:f(x)= e 2πσ1 线 C2:φ(x)= 1 e 2πσ2
对正态曲线特征的认识 特征 认识 函数的值域为正实数集的子集,且以 x 轴为 特征 1 渐近线 特征 2 曲线是对称的,关于直线 x=μ 对称 特征 3 函数在 x=μ 处取最大值 特征 4 随机变量在(-∞,+∞)内取值的概率为 1 当标准差一定时,μ 变化时曲线的位置变化 特征 5 情况 均值一定时,σ 变化时总体分布的集中、离 特征 6 散程度
1.下列函数中,可以作为正态分布密度函数的是(
)
答案:A
2.如果随机变量 ξ~N(-1,σ2),且 P(-3≤ξ≤-1)=0.4, 则 P(ξ≥1)等于( ) A.0.1 B.0.2 C.0.3 D.0.4
答案:A
3.某校高考的数学成绩近似服从正态分布 N(100,100),则该 校成绩位于(80,120)内的人数占考生总人数的百分比约为( ) A.22.8% B.45.6% C.95.44% D.97.22%
类型一 正态曲线的图象的应用 【例 1】 如图所示是一个正态曲线,试根据该图象写出其正 态分布的概率密度函数的解析式,求出总体随机变量的均值和方 差.
解析: 从正态曲线可知, 该正态曲线关于直线 x=20 对称, 最大值为 1 1 1 ,所以 μ=20, = ,∴σ= 2. 2 π 2 π 2πσ ( x 20)2 1 4 于是 φμ,σ(x)= · , e 2 π x∈(-∞,+∞),总体随机变量的期望是 μ=20, 方差是 σ2=( 2)2=2.
类型三 正态分布的应用 【例 3】 据调查统计,某市高二学生中男生的身高 X(单位: cm)服从正态分布 N(174,9).若该市共有高二男生 3 000 人,试估 计该市高二男生身高在(174,180]范围内的人数.
解析:因为身高 X~N(174,9), 所以 μ=174,σ=3, 所以 μ-2σ=174-2×3=168, μ+2σ=174+2×3=180, 所以身高在(168,180]范围内的概率为 0.954 4. 又因为 μ=174. 所以身高在 (168,174] 和 (174,180] 范围内的概率相等,均为 0.477 2, 故该市高二男生身高在(174,180]范围内的人数是 3 000×0.477 2≈1 432(人).
相关文档
最新文档