第5章正态分布及其应用
正态分布的概念及应用

• 正态分布的简介 • 正态分布的性质 • 正态分布的应用场景 • 正态分布在数据分析中的应用 • 正态分布在机器学习中的应用 • 正态分布与其他统计分布的关系
01
正态分布的简介
正态分布的定义
01
正态分布是一种连续概率分布, 描述了许多自然现象的概率分布 形态,其概率密度函数呈钟形曲 线,且具有对称性。
贝叶斯推断
正态分布在贝叶斯推断中发挥了重要作用。通过贝叶斯定理,我们可以根据先 验知识和数据更新对未知参数的估计,而正态分布可以作为先验知识的分布形 式。
核方法和支持向量机
核方法
在支持向量机(SVM)等核方法中,正态分布作为核函数的一 种形式,用于将输入空间映射到高维特征空间,从而使得线性 不可分的数据变得线性可分。
在时间序列分析中,正态分布可用于描述时间序列数据的分布特征, 并建立预测模型。
05
正态分布在机器学习中的应用
概率模型和贝叶斯推断
概率模型
正态分布是一种常用的概率分布,在贝叶斯推断中,我们常常假设某些参数服 从正态分布,以便进行统计推断。例如,在朴素贝叶斯分类器中,特征的概率 分布被假设为正态分布。
考试成绩和测试评分
考试成绩和各种测试评分也经常呈现正态分布,因为大多数人的得分集中在平均分附近, 而高分和低分的人数较少。
气温、降雨量等气候数据
气温、降雨量等自然现象数据也可以用正态分布来描述,因为它们通常遵循类似的统计规 律。
科学研究和技术开发
01 02
实验结果和测量数据
在科学实验和测量中,很多数据呈现正态分布,如放射性衰变的半衰期、 化学反应速率等。这些数据反映了物质内部微观粒子的随机运动和相互 作用。
正态分布在统计学中的地位
4、正态分布及其应用

某地630名50岁~60岁正常女性血清甘油三酯含量 (mmol/L)
甘油三酯 0.10~ 0.40 ~ 0.70 ~ 1.00 ~ 1.30 ~
1.60 ~ 1.90 ~ 2.20 ~ 2.50 ~ 2.80 ~ 3.10 ~3.40 合计
频数 27 169 167 94 81
有些指标如白细胞数过高或过低均属异常 (a) ,
故其参考值范围需要分别确定下限和上限,称作双侧。
有些指标如 24 小时尿糖含量仅在过高 (b) 、肺活
量仅在过低时为异常(c),只需确定其上限或下限,称
作单侧参考值范围。
(a)白细胞数参考值范围
(b)24小时尿糖参考值范围
(c)肺活量参考值范围
(四)选择适当的百分范围
(2)从均数为μ,标准差为σ的正态总体抽 取例数为n的样本,样本均数的均数也为μ ,样本均数的标准差称标准误,用 x表示, 理论上 x 可按公式计算。
理论值
x n
估计值
sx
s n
标准误大小与标准差呈正比,与样本例 数的平方根呈反比。
二、标准误的概念
• 标准误:是用于描述抽样误差大小的指标。
Normal Distribution)
X -μ u= σ
u为标准正态变量 或标准正态离差 u变换的特点:若X服从正态分布,则u服从 标准正态分布 标准正态分布:均数为0、标准差为1 。 记为 N(0,1)
表中曲线下面积为 - ~ u 的面积;即 P ( u)
可以利用标准正态分布表求出与原始变量X 有关的概率值。
第二节 正态分布及其应用
三峡大学医学院公共卫生系 王南平
一、正态分布(Normal Distribution)
正态分布及其应用

Part
04
正态分布在金融领域的应用
资产收益率的正态分布假设
资产收益率的正态分布假设
在金融领域中,正态分布被广泛用于描述资产收益率的概率分布。这一假设基于大量历史 数据的统计分析,认为资产收益率的分布近似于正态分布。
中心极限定理
中心极限定理是正态分布假设的理论基础,它表明无论总体分布是什么,当样本量足够大 时,样本均值近似服从正态分布。
生物医学研究
在生物医学研究中,许多生理指 标和疾病发生概率的分布并不服 从正态分布,而是呈现出偏态分 布或泊松分布等其他类型。
正态分布在大数据时代的发展
01 02
机器学习算法的改进
随着机器学习算法的不断改进,正态分布在大数据时代的 应用场景将得到进一步拓展。例如,深度学习算法可以处 理大规模、高维度的数据集,并能够自动提取特征,从而 减少对正态分布假设的依赖。
参数估计
在正态分布假设下,可以使用历史数据估计资产的预期收益率和风险波动率等参数,为投 资决策提供依据。
VaR(风险价值)的计算
VaR(风险价值)定义
VaR是指在一定置信水平下,某 一金融资产或投资组合在未来特 定时间段内的最大可能损失。
VaR计算方法
基于正态分布假设,可以使用历 史模拟法、蒙特卡洛模拟法等计 算VaR。这些方法通过模拟资产 价格的随机变动,计算出在给定 置信水平下的潜在损失。
无法处理复杂数据
正态分布在处理具有复杂结构或非线性关系的数据时可能表现不佳, 无法准确描述数据的分布特性。
非正态分布的适用场景
金融领域
自然语言处理
在金融领域中,许多金融变量的 分布并不服从正态分布,而是呈 现出尖峰厚尾的特点。例如,股 票收益率、波动率等金融时间序 列数据的分布往往具有这些特征。
正态分布的理论原理及应用

正态分布的理论原理及应用正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),是概率统计学中最重要的概率分布之一,也是最常见的连续概率分布之一、正态分布在理论研究和实际应用中都起到了重要的作用。
1.中心极限定理:中心极限定理是正态分布理论的基础,它指出,独立同分布的随机变量的和的极限分布依近似于正态分布。
这意味着,对于大量独立随机变量的和,即使这些变量的分布不同,其总体分布也会接近于正态分布。
2.正态分布的概率密度函数:正态分布的概率密度函数由两个参数决定,即均值(μ)和标准差(σ)。
其概率密度函数可以表示为:f(x)=(1/(σ*√(2π)))*e^(-((x-μ)^2/(2σ^2)))3.正态分布的特性:-均值μ是分布的中心,标准差σ决定了分布的离散程度。
-68%的观测值在均值左右一个标准差范围内,95%的观测值在均值左右两个标准差范围内,99.7%的观测值在均值左右三个标准差范围内。
1.统计分析:正态分布广泛应用于统计分析中。
很多统计模型都需要基于正态分布的假设。
例如,参数估计、假设检验、方差分析等都需要基于正态分布进行推断。
2.质量控制:质量控制中常常使用正态分布。
通过收集样本数据,计算平均值和标准差,可以对产品的质量进行控制和评估。
例如,正态分布常用于确定产品的上下公差。
3.自然科学:正态分布在自然科学中也有应用。
例如,生物学中研究身高、体重等指标时可以使用正态分布。
物理学中粒子运动的速度和位置分布也可以近似为正态分布。
4.金融与经济学:金融市场和经济领域中,许多变量的分布近似为正态分布。
例如,股票收益率、利率、汇率等可以建模为正态分布。
这使得研究人员能够使用正态分布的属性来做出预测和决策。
5.归一化处理:正态分布是进行归一化处理的常用工具之一、通过将数据转化为标准正态分布,可以对不同数据进行比较和分析。
第五章概率与正态分布

正态分布曲线的特点
• 钟形轴对称曲线,对称轴是随机变量的平均数
。
• 正态分布曲线的位置和形状分别由平均数
和标准差 决定。
• 平均数大小决定图形向左移或右移。 • 标准差大小决定图形的陡峭程度,即纵线的最大
值。
y
0 1
5 1
x
-4 -3 -2 -1 0 1 2 3 4 5 6 7 8
图5.3 平均数不等,标准差相等的正态分布示意图
标准正态分布表中各变量的含义
表 5.4 标准正态分布表中各变量的说明
Z 横轴坐标
原始变量(Xi)取值转换后的标准
分数(Zi)
Y 纵轴高度
某一点取值(Zi)所对应的概率密
度(相对频次,Yi)
P (0,Zi)两点间 取值界于区间(0,Zi)的概率
曲线下的面积
• 已知下列Z值,查表求P值。
– (1)Z=-1与Z=1之间的概率 – (2)Z=-2与Z=2之间的概率 – (3)Z=-3与Z=3之间的概率 – (4)Z=-1.96与Z=1.96之间的概率 – (5)Z=-2.58与Z=2.58之间的概率
• 经验概率 对多次重复相同或相似试验所得到的数据进行分 析,获得事件发生的相对频率,作为对此事件 发生概率的一个估计。
P(A) a,N NFra bibliotek事件的概率
• 先验概率 • 当试验满足:试验中各种可能结果(基本事件)是
有限的,并且每种结果发生的可能性是不变时, 则某事件发生的概率等于该事件包含的基本事件 数除以试验中可能发生的基本事件总件数之商。 • 设N代表可能发生的基本事件总数,K代表事件A 包含的基本事件数,则A事件发生的概率为:
– 例:某公共汽车停车点上乘客候车的时间记为 随机变量Y
社会统计学 第五章 正态分布

n P ( A) N
(2)古典概率类型
在古典概率类型问题中,所有可能的试验结果是有 限的,即试验的基本事件数是有限的,并且,所有 这些基本事件都是等可能的。 若事件组 A1, A2 , A3 ,, An 满足下面三个条件,则称该事 件为等可能完备事件组。
(1)二项试验
一个二项实验是一个满足如下条件的实验:
实验由确定的试验数所组成; 每个试验只有两个可能的结果,通常称为”成功” 和”失败”; 任一试验的结果独立于任何其他试验结果; 在各次实验中,”成功”的概率和”失败”的概率 都是固定的常数,并且他们的和等于1。
(2)二项实验的概率
1 5 p , q 1 p , n 20, m 7. 6 6
因此,20次中恰好出现7次6点的概率为:
P
7 20
1 7 5 20 -7 C ( ) ( ) 6 6
7 20
二项实验的概率
如果单次试验中,事件成功与失败的概 1 率相等,即 p q 2 则上述二项实验 的概率公式可简化为:
C
m n
Pnm m!
例7:
一条航线上共有十个航空站,请问这条航 线上共有多少种不同的飞机票? 有四栋大楼将分配给四个单位使用,分配 原则是每个单位只允许分配一栋,请问共 有多少种分配方案?
例8:
抛掷一枚骰子20次,则恰好出现7次“6 点”的概率. 解:这是一个二项实验,依题意,此时
例2:某年级共有学生100名,其中来自广东 省的有25名,来自广西省的有10名,问任抽 一名,来自两广的概率是多少?
第4讲 正态分布及其应用(2004)
正态分布及其应用一、正态分布的概念和特征根据频数表资料绘制成直方图,可以设想,如果将观察人数逐渐增多,线段不断分细,图中直条将逐渐变窄,其顶端将逐渐接近一条光滑的曲线,这条曲线称为频数曲线或频率曲线,略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布(normaldistribution)。
由于频率的总和等于100%或1,故横轴上曲线下的面积等于100%或1。
正态分布是一种横重要的连续型分布,在生物统计学中,占有极其重要的地位。
许多生物学现象所产生的数据,都服从正态分布。
1、正态分布的图形有了正态分布的密度函数f(X),即正态分布的方程,就可给出图形-上式中右側为均数,为标准差,X为自变量。
当X确定后,就可由此式求得其密度函数f(X),也就是相应的纵坐标的高度。
所以,已知和 ,就能绘出正态曲线的图形。
2、正态分布的特征(1)正态分布以为中心,左右对称。
(2)正态分布有两个参数,即和。
是位置参数,当恒定后,越大,则曲线沿横轴越向右移动;越小,则曲线沿横轴越向左移动。
是变异参数,当恒定时,越大,表示数据越分散,曲线越“胖”;越小,表示数据越分散,曲线越“瘦”。
(3)正态分布的偏斜度1=0,峭度2=0为了应用方便,常将上式作如下变换,也就是将原点移到的位置,使横轴尺度以为单位,使=0,=1,则正态分布变换为标准正态分布。
(standard normal distribution) ,u 称为标准正态离差(standard normal deviate)标准正态分布的密度函数为:一般用N(,2)表示均方为,方差为2的正态分布。
于是标准正态分布用N(0,1)表示。
-3 -2 -1 0 1 2 368.26%95.45%99.74%下列一些值很重要,应予记忆:u= -1 到 u=1 面积=0.6827u= -1.96 到 u=1.96 面积=0.9500u= -2.58 到 u=2.58 面积=0.9900标准正态分布有以下特征:(1)在u=0时,(u)达到最大值。
正态分布及其应用医本PPT课件
第17页/共37页
若上例均数为4.78 (1012/L) ,标准差为0.38 (1012/L),问低于4×1012/ L的人占总人数的比例有多少?
P299 表9-8 标准正态分布曲线下的面积,注意 P ( u)
u x x 4 4.78 2.05
S
0.38
查表得:P(u 2.05) 0.0202
f X 1 e , x (1/2)[ X ]2
2
由上式可见,正态分布的图形由 和 所 决定,即N( , 2)
第5页/共37页
正态曲线下的面积F(x)的计算:
F X 1
x e dx, (1/2)[ X ]2 x
2
第6页/共37页
2、正态分布的特征
小结
第1页/共37页
表9-1 某地140名正常成年男性血清尿素氮浓度 (mmol/L) 6.00 5.28 3.90 5.30 4.20 3.90 5.60 5.66 4.10 4.00 4.50 3.77
4.34 4.30 4.22 5.30 5.13 3.79 4.80 5.20 4.70 2.94 5.90 4.50 2.10 5.60 5.90 2.85 4.90 4.22 5.63 3.21 4.66 3.00 5.96 3.45 3.50 4.23 3.90 3.88 4.24 4.53 4.88 2.48 3.40 3.26 3.21 3.60 2.73 4.15 4.60 4.35 4.96 5.61 5.87 5.01 4.33 5.74 4.87 3.96 3.00 3.93 3.15 5.00 3.44 3.50 2.85 4.87 4.60 3.40 4.79 3.02 6.23 4.98 2.89 5.82 6.30 5.20 5.40 3.00 2.80 4.43 4.50 5.52 6.40 4.86 5.90 4.70 3.47 4.66 4.78 5.70 2.26 4.10 3.70 5.40 3.70 4.37 4.20 6.10 4.80 5.10 5.55 2.97 5.11 3.26 3.04 6.01 5.07 4.22 5.39 5.34 4.47 3.58 5.26 4.54 4.07 3.83 3.97 6.05 4.02 2.69 2.52 5.21 6.55 4.28 4.45 5.15 4.45 5.37 3.80 3.73
第五章-正态分布、常用统计分布和极限定理
的面积, 然后根据1 0.125 0.875查附表4, 对应
Z 1.15,那么录取分数线
x X Z X 74 1.1511 86.65(分)
表5-2
例11:
0Z 图5-11
(1)求Z 1分数以上的概率是多少 ?
解:Z 1时, (Z) 0.34134, Z以上的概率为
(Z) Z
1
t2
e 2 dt
2
(Z 2 ) 图5-8 Z 2
(Z2 Z1)
图5-9Z1 Z 2
例4:已知服从标准正态分布 N(0,1), 求P( 1.3) ? 解:因为() 1,() P( 1.3) P( 1.3) 所以( 1.3) 1 P( 1.3) 1 (1.3) 1 - 0.9032 0.0968
2
如果把u 0, 1代入(x)
1
e
(
xu)2
2 2
2
(x)
1
x2
e2
2
标准正态分布其实是一般正态分布的一个特 例,记作N(0,1),一般正态分布记作N(μ,σ2)。
一般正态分布之所以能变成唯一的标准正态 分布,就是把原来坐标中的零点沿着X轴迁到μ点, 并且以σ为单位记分。
σ=1
0
图5-5
13.6%
13.6%
2.16% 0.11%
3 2 1 图05-6 1
2.16% 0.11%
23
三、标准分的实际意义
例1:甲、乙、丙3个同学《社会统计学》分数 都是80分,甲同学所在班平均成绩μ甲=80分, μ 乙=75分, μ丙=70分,标准差都是10,比较甲、乙、 丙3个同学在班上的成绩。
正态分布及其应用、抽样误差
置信区间是一种表示抽样误差的方法,它表示总体参数的可能取值范围。置信区间越窄,说明样本统计量与总体 参数的偏差越小,即抽样误差越小。
减少抽样误差的方法
增加样本量
增加样本量可以减小每个样本的代表性误差,从而减 小抽样误差。
改进抽样方法
采用更科学的抽样方法,如分层抽样、系统抽样等, 可以提高样本的代表性,从而减小抽样误差。
重复抽样
通过多次抽取样本并计算其统计量,可以减小抽样误 差。
05
抽样误差的影响因素
总体与样本的差异程度
总体与样本的差异程度越大,抽样误 差越大。
当总体分布与样本分布差异较大时, 需要采取更严格的抽样方法来减小误 差。
样本容量大小
样本容量越大,抽样误差越小。
在实际应用中,需要根据研究目的和资源情况合理确定样本容量,以减小误差。
在市场调查中,抽样误差可能导致对市场趋势的误判。例如,如果某品牌在目标消费群体中的实际市场份 额为30%,而由于抽样误差,调查结果显示其市场份额为25%,那么该品牌可能会错过扩大市场份额的机 会。因此,市场调查需要综合考虑抽样误差和其他不确定性因素,以做出明智的决策。
质量控制
在质量控制中,抽样误差可能导致对 产品质量的误判。如果某批次产品的 不合格率高于标准,但实际是由于抽 样误差造成的,那么这可能导致不必 要的生产成本和产品退货。因此,质 量控制需要采用合适的抽样方案和统 计分析方法,以减小抽样误差的影响。
04
抽样误差的概念
定义与产生原因
定义
抽样误差是由于从总体中随机抽取样本而产生的误差,它反映了样本统计量与总体参数之间的偏差。
产生原因
由于每个样本都是随机抽取的,因此每个样本的统计量都可能不同,从而导致抽样误差的产生。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
Psychology Statistics
六、正态分布表
标准正态分布函数(x)的数值表. (-x)=1- (x);
将一般正态分布化为标准正态分布,通过查表可解决正态 分布的概率计算问题。使用正态分布表可作如下计算: 1)依据Z分数求概率; 如Z=1时,p=0.841 2)知道概率求Z分数;如p=0.7517时,Z=0.68 3)已知概率或Z分数,求概率密度值f(x).
等
级
D E 总 数
100 100
100 100
22
Psychology Statistics
四、化等级评定为等距数据
20% 10% E D
40%
20% 10%
C
B
A
23
Psychology Statistics
五、测验题目难度的确定
什么是项目(测验题目)的难度?
难度为什么要化为等距数据(标准化)
7
Psychology Statistics
六、正态分布表
(x)
0
8
Psychology Statistics
例:X~N(0,1),求以下概率。 (1)P(X<1.5) (2) P(X>2)
(3)P(-1<X3)
(4) P(|X| 2)
解:(1) P(X<1.5) =(1.5)=0.9332 (2) P(X>2)=1-P(X 2)=1- (2)=1-0.9773=0.0227 (3) P(-1<X3)= P(X3) -P(X-1)= (3)- (-1) = (3)-(1- (1))=0.9987-(1-0.8413)=0.8354 (4) P(|X| 2)= P(-2 X 2)= (2)- (-2)) = (2)-(1- (2))=2 (2)-1=2×0.9773-1=0.9545
( x)
1 e 2
x x2 2
,
x
( x) (t )dt
1 e 2
t2 2
dt
5
Psychology Statistics
五、一般的正态分布与标准正态分布的关系
X ~ N ( , 2 ), 设:Z X
则:
Z ~ N (0,1)
任何一个一般的正态分布都可以通过线性变换转 化为标准正态分布.
难度如何化为等距数据?
24
Psychology Statistics
第三节 正态分布的检验
为什么要进行正态分布检验?
正偏态分布的特点
负偏态分布的特点 偏态量、峰态量 偏度系数、峰度系数25 Nhomakorabea17
Psychology Statistics
例 某市参加数学奥林匹克业余学校入学考试的人数为
2800人,只录取学生150人,该次考试的平均分为75分,
标准差为8,问录取分数应定为多少?
18
Psychology Statistics
解:考试成绩服从正态分布,即
X~N(75, 82), 通过Z转换, Z=(X-75)/8, Z~N(0,1)。根据题意招生人数的概率为 P(ZZ0)=150/2500=0.053, P(Z< Z0)=1-0.053=0.947 查标准正态分布表,Z=1.61时,p=0.9463,Z=1.62时, p=0.4738, 可取Z0=(1.61+1.62)/2=1.615 故分数线应定为 X0=8Z0+75=8×1.615+75=88(分)
X 5 ~ N (0,1), 3 X 5 10 5 X 5 P ( X 10 ) P 1.67 P 3 3 3 1.67 0.9525
2 5 X 5 10 5 ( 2) : P 2 X 10 P 3 3 3 X 5 P 1 1.67 (1.67 ) ( 1) 3 0.9525 (1 (1)) 0.7938
在美国人第一次结婚的平均年龄是26岁。假设第一次结婚 的年龄为正态分布,标准差为4年。问:
(1)一个人第一次结婚时的年龄小于23岁的概率多大?
(2)一个人第一次结婚时的年龄在20到30岁之间的概率 多大?
(3)90%的人在什么年龄以前第一次结婚?
21
Psychology Statistics
四、化等级评定为等距数据
英语 82 87 65 9
62 50 51 5
15
Psychology Statistics
Z分数的线性变换
T=aZ+b
常用的有
▪ ▪ T=15Z+100 T=10Z+50
16
Psychology Statistics
三、确定录取分数线和各分数段人数
例: 在某年高考的平均分数为500,标准差为100的正态总 体中,某考生得到650分。设当年高考录取率为10%,问 该生的成绩能否入围? 解:该生的标准分数为 Z=(650-500)/100=1.5 查正态分布表,当Z=1.5时,p=0.933,即93.3%,从低分到高分 的顺序中他处于93.3%的位置, 那么,从高分到低分的顺序中他应处于6.7%的位置。因高 考录取是从高分至低分顺序录取的,所以,该生处在录 取率10%之内,他的成绩入了围。
9
Psychology Statistics
一般,设X~N(0,1),则有
P(a X b)= (b)- (a) P(|X| a)=2 (a)-1
10
Psychology Statistics
例: 设X~N(5,32),求下列概率
(1)P(X 10) 解
(1) : Z
(2) P(2<X<10)
( x )
则称X服从正态分布,记作X~N(,2) 为随机变量X的均值; 为随机变量X的标准差;
为圆周率3.14159…;
e为自然对数的底2.71828….
2
Psychology Statistics
二、正态分布图形特点
1) f(x)0,整个密度函数都在x轴的上方;
2)曲线对称,平均数,中数,众数三者相 等,x= 处达到最大值 f ( ) 1
19
Psychology Statistics
思考题1
某地区某年高考物理科考试4.7万人,平均分数为57.08,标 准差为18.04。试问:
(1)成绩在90分以上的有多少人?
(2)成绩在80分到90分之间有多少人?
(3)成绩在60分以下的有多少人?
20
Psychology Statistics
思考题2
±1 内,概率为0.6826; ±2内,概率为0.95545; ±3内,概率为0.9973
4
Psychology Statistics
四、标准正态分布
当=0, =1时,有相应的正态分布N(0,1)称为标准正 态分布(Standard normal distribution). 通常用 (x)表示概率密度函数.
14
Psychology Statistics
二、化原始分数为标准分
X ~ N ( , 2 ), X 设:Z 则: Z ~ N (0,1)
总分 224 227
标准分,即化为标准正态分 布条件下的分数。 比较张三、李四的成绩
语文 张三 李四
班级平均分 班级标准差
数学 80 90 76 11
四名老师对100学生作文评定等级,等级为A、B、C、 D、E。如何比较下面三篇作文的成绩
1号 作文一 作文二
作文三
2号 3号 4号 B B C A B A A A B
1号
2号
3号
4号
B A A
A
评 B 定 C
10
20 40 20 10
5
20 50 20 5
15
20 40 20 5
15
25 50 8 2
第五章 正态分布及其应用
第一节 正态分布的基本特性与正态分布表 第二节 正态分布理论的应用 第三节 正态分布检验
1
Psychology Statistics
一、正态分布(Normal distribution)的定义
如果随机变量X的概率密度是:
1 f ( x) e 2
1 2
2
x 2
2
-
+
3)曲线的陡缓程度由决定, 越大,曲 线越平缓; 越小,曲线越陡峭。 4) X趋向于无穷时,曲线以x轴为其渐 近线。 5)正态曲线下面的面积为1,平均数左 右各为0.5;
3
正态分布的概率密度曲线
Psychology Statistics
三、正态曲线下的面积特点
正态分布曲线下,标准差与概率(面积)有一定的关系:
11
Psychology Statistics
一般,设X~N(,2), 则有
b a P ( a X b )
12
第二节 正态分布理论的应用
13
Psychology Statistics
一、3 准则
P(|X|3)=2(3)-1=0.9973, X的取值几乎全部集中在[-3,3]区间内,超出这个范 围的可能性仅占不到3% 当X~N(, 2)时,有 P(|x- | 3 )=0.9973 如果某个值在|x- | 3之外,可以判定为异常值. 例:X~N(0.2,0.052), 由3准则测量值应在0.2-0.05×3-- 0.2+0.05×3 之间, 即[0.05, 0.35]。有一个值为0.367>0.35, 所 以为异常值,应删除。