1.5正态分布及其应用
正态分布的概念及应用

• 正态分布的简介 • 正态分布的性质 • 正态分布的应用场景 • 正态分布在数据分析中的应用 • 正态分布在机器学习中的应用 • 正态分布与其他统计分布的关系
01
正态分布的简介
正态分布的定义
01
正态分布是一种连续概率分布, 描述了许多自然现象的概率分布 形态,其概率密度函数呈钟形曲 线,且具有对称性。
贝叶斯推断
正态分布在贝叶斯推断中发挥了重要作用。通过贝叶斯定理,我们可以根据先 验知识和数据更新对未知参数的估计,而正态分布可以作为先验知识的分布形 式。
核方法和支持向量机
核方法
在支持向量机(SVM)等核方法中,正态分布作为核函数的一 种形式,用于将输入空间映射到高维特征空间,从而使得线性 不可分的数据变得线性可分。
在时间序列分析中,正态分布可用于描述时间序列数据的分布特征, 并建立预测模型。
05
正态分布在机器学习中的应用
概率模型和贝叶斯推断
概率模型
正态分布是一种常用的概率分布,在贝叶斯推断中,我们常常假设某些参数服 从正态分布,以便进行统计推断。例如,在朴素贝叶斯分类器中,特征的概率 分布被假设为正态分布。
考试成绩和测试评分
考试成绩和各种测试评分也经常呈现正态分布,因为大多数人的得分集中在平均分附近, 而高分和低分的人数较少。
气温、降雨量等气候数据
气温、降雨量等自然现象数据也可以用正态分布来描述,因为它们通常遵循类似的统计规 律。
科学研究和技术开发
01 02
实验结果和测量数据
在科学实验和测量中,很多数据呈现正态分布,如放射性衰变的半衰期、 化学反应速率等。这些数据反映了物质内部微观粒子的随机运动和相互 作用。
正态分布在统计学中的地位
正态分布的性质与应用

正态分布的性质与应用正态分布是统计学中最重要的概率分布之一,也被称为高斯分布。
它具有许多独特的性质和广泛的应用。
本文将介绍正态分布的性质以及在实际问题中的应用。
正态分布的定义正态分布是一种连续型概率分布,其图像呈钟形曲线。
它由两个参数完全确定:均值μ和标准差σ。
正态分布的概率密度函数可以表示为:其中,是自然对数的底数,是随机变量,是均值,是标准差。
正态分布的性质正态分布具有以下几个重要的性质:对称性正态分布是关于均值对称的,即其概率密度函数在均值处取得最大值,并且两侧的曲线形状相同。
峰度正态分布的峰度为3,表示其曲线相对于标准正态分布更加平缓。
尾部衰减正态分布的尾部衰减非常缓慢,远离均值的极端值出现的概率非常小。
累积分布函数正态分布的累积分布函数可以用标准正态分布表来查找,从而计算出给定值的概率。
独立性若多个随机变量服从正态分布,并且它们之间相互独立,则它们的线性组合也服从正态分布。
正态分布的应用正态分布在各个领域都有广泛的应用,下面将介绍其中几个重要的应用。
统计推断正态分布在统计推断中起着重要的作用。
根据中心极限定理,当样本容量足够大时,许多随机变量的和或平均值近似服从正态分布。
这使得我们可以利用正态分布进行参数估计、假设检验等统计推断。
财务分析在财务领域,许多经济指标如股票收益率、利润增长率等都服从正态分布。
通过对这些指标进行建模和分析,可以帮助投资者制定合理的投资策略和风险管理。
生物学在生物学研究中,许多生物特征如身高、体重等都服从正态分布。
通过对这些特征的测量和分析,可以帮助科学家了解人群的生理特征,并进行相关研究。
质量控制正态分布在质量控制中起着重要的作用。
通过对产品质量指标的测量和分析,可以判断产品是否符合质量标准,并采取相应的措施进行改进。
风险管理正态分布在风险管理中也有广泛的应用。
通过对风险因素的建模和分析,可以评估风险的概率分布,并制定相应的风险管理策略。
结论正态分布是一种重要的概率分布,具有许多独特的性质和广泛的应用。
正态分布及其应用

Part
04
正态分布在金融领域的应用
资产收益率的正态分布假设
资产收益率的正态分布假设
在金融领域中,正态分布被广泛用于描述资产收益率的概率分布。这一假设基于大量历史 数据的统计分析,认为资产收益率的分布近似于正态分布。
中心极限定理
中心极限定理是正态分布假设的理论基础,它表明无论总体分布是什么,当样本量足够大 时,样本均值近似服从正态分布。
生物医学研究
在生物医学研究中,许多生理指 标和疾病发生概率的分布并不服 从正态分布,而是呈现出偏态分 布或泊松分布等其他类型。
正态分布在大数据时代的发展
01 02
机器学习算法的改进
随着机器学习算法的不断改进,正态分布在大数据时代的 应用场景将得到进一步拓展。例如,深度学习算法可以处 理大规模、高维度的数据集,并能够自动提取特征,从而 减少对正态分布假设的依赖。
参数估计
在正态分布假设下,可以使用历史数据估计资产的预期收益率和风险波动率等参数,为投 资决策提供依据。
VaR(风险价值)的计算
VaR(风险价值)定义
VaR是指在一定置信水平下,某 一金融资产或投资组合在未来特 定时间段内的最大可能损失。
VaR计算方法
基于正态分布假设,可以使用历 史模拟法、蒙特卡洛模拟法等计 算VaR。这些方法通过模拟资产 价格的随机变动,计算出在给定 置信水平下的潜在损失。
无法处理复杂数据
正态分布在处理具有复杂结构或非线性关系的数据时可能表现不佳, 无法准确描述数据的分布特性。
非正态分布的适用场景
金融领域
自然语言处理
在金融领域中,许多金融变量的 分布并不服从正态分布,而是呈 现出尖峰厚尾的特点。例如,股 票收益率、波动率等金融时间序 列数据的分布往往具有这些特征。
1.5正态分布

1.5正态分布在上一小节中,我们作出了100个产品尺寸的频率分布直方图,并指出了当样本容量无限增大时,这个频率分布直方图无限接近于如图1-3所示的一条总体密度曲线.产品尺寸是一类典型的总体,对于成批生产的产品,如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等条件都相对稳定,而且不存在产生系统误差的明显因素,那么,产品尺寸的总体密度曲线就是或近似地是以下函数的图象:f (x)=22()2x μσ--,x ∈(-∞, +∞) ① 式中的实数μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体,其分布叫做正态分布.正态分布由参数μ,σ唯一确定.因此,正态分布常记作N (μ,σ2).①的图象被称为正态曲线.图1-4中画出了三条正态曲线:(1)μ=-1,σ=0.5;(2)μ=0,σ =1;(3)μ=1,σ =2.正态曲线具有两头低、中间高、左右对称的基本特征. 在实际中遇到的许多随机现象都服从或近似服从正态分布.例如:生产中,在正常生产条件下各种产品的质量指标(如电子管的使用寿命、电容器的电容量、零件的尺寸、铁水的含碳量、纤维的纤度、……)一般都服从正态分布.在测量中,测量结果一般可以表示为ξ=a +η. 其中a 表示被测量的量的真值(未知常数),η表示测量的随机误差,ξ和η一般都服从正态分布.在生物学中,同一群体的某种特征(如某一地区同年龄组儿童的发育特征,如身高、体重、肺活量),在一定条件下生长的小麦的株高、穗长、单位面积产量等,一般也服从正态分布.在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等,水文中的水位,也都服从或近似服从正态分布.总之,正态分布广泛存在于自然现象、生产及科学技术的许多领域之中.正态分布在概率和统计中占有重要地位.在函数①中,当μ=0,σ =1时,正态总体称为标准正态总体,这时相应的函数表示式是 f (x)=22x-,x ∈(-∞, +∞) ② 相应的曲线称为标准正态曲线,如图1-4(2)所示.从图1-4看到,正态曲线具有以下性质:(1)曲线在x 轴的上方,与x 轴不相交;(2)曲线关于直线x=μ对称;(3)曲线在x=μ时位于最高点.(4)当x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.(5)当μ一定时,曲线的形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中(图1-5).由于标准正态总体N(0,1)在正态总体的研究中有非常重要的地位,已专门制作了“标准正态分布表”(见附表2).在这个表中,相应于x0的值中Ф(x0)是指总体取值小于x0的概率,即Ф(x0)=P (x<x0).如图1-6(1)中左边阴影部分所示.由于标准正态曲线关于y轴对称,表中仅给出了对应于非负值x0的值Ф(x0).如果x0<0,那么由图1-6(2)中两个阴影部分面积相等知Ф(x0)=1-Ф(-x0)利用这个表,可求出标准正态总体在任一区间(x1,x2)内取值的概率.例如它在(-1,2)内取值的概率是P=Ф(2)-Ф(-1)= Ф(2)-{1-Ф[-(-1)]}=Ф(2)+ Ф(1)-1=0.9772+0.8413-1=0.818 5.一般的正态总体N(μ,σ 2)均可以化成标准正态总体N(0,1)来进行研究.事实上,可以证明,对任一正态总体N(μ,σ 2)来说,取值小于x的概率F(x)= Ф(xμσ-).例如,对于正态总体N(1,4)来说,取值小于3的概率F(3)= Ф(312-)=Ф(1)=0.8413.例1.分别求正态总体N(μ,σ 2)在区间(μ-σ, μ+σ),(μ-2σ, μ+2σ),(μ-3σ, μ+3σ)内取值的概率.解:F(μ+σ)=Ф(()μσμσ+-)=Ф(1), F(μ-σ)=Ф(()μσμσ--)=Ф(-1),所以正态总体N(μ, σ2)在(μ-σ,μ +σ)内取值的概率是F(μ+σ)-F(μ-σ)=Ф(1)-Ф(-1)= Ф(1)-[1-Ф(1)]=2Ф(1)-1=2×0. 8413-1≈0.683;同理,正态总体N(μ,σ 2)在的(μ-2σ,μ +2σ)内取值的概率是F(μ+2σ)-F(μ-2σ)=Ф(2)-Ф(-2)≈0.954;正态总体N(μ,σ 2)在的(μ-3σ,μ +3σ)内取值的概率是F(μ+3σ)-F(μ-3σ)=Ф(3)-Ф(-3)≈0.997;下面以正态总体为例,说明统计中常用的假设检验方法的基本思想.我们从上表看到,正态总体在(μ-2σ, μ+2σ)以外取值的概率只有4.6%,在(μ-3σ, μ+3σ)以外取值的概率只有0.3%,由于这些概率值很小,通常称这些情况发生为小概率事件.也就是说,通常认为这些情况在一次试验中几乎是不可能发生的.我们来看一个例子.假设工人制造的零件尺寸在正常情况下服从某种分布.为便于说明,不妨假设它服从正态分布N(μ,σ 2),那么从上面知道,零件尺寸在(μ-3σ, μ+3σ)内取值的概率为99.7%,即零件尺寸落在(μ-3σ, μ+3σ)以外的概率只有0.3%.这是一个小概率事件.它表明在大量重复试验中,平均每抽取1000个零件,属于这个范围以外的零件尺寸只有3个.因此在一次试验中,零件尺寸在(μ-3σ, μ+3σ)以外是几乎不可能发生的,而如果这种事件一旦发生,即产品尺寸a满足|a-μ|≥3σ。
正态分布和其应用

肺活量一般只以过低为异常,血铅以
过高为异常,只需要拟定下限或上限, 即单侧界值。
根据资料旳分布类型有下列两种计 算医学参照值范围旳常用措施。
➢正态近似法 合用于服从正态分布或近 似正态分布旳资料
➢双侧1 参照值范围
x u 2s➢单侧 1 源自照值范围x u s 或 x u s
或称 变换u 。
u x
• 实际应用中,经u 变换后,就可把 求解任意一种正态分布曲线下面积旳问 题,转化成原则正态分布曲线下相应旳 面积问题。附表1给出了原则正态分布 曲线下从 到 u旳面积,根据正态分布 旳对称性,我们能够求出任何一种区间 内原则正态分布曲线下旳面积,也就是
u 落在任何一种区间内旳概率。
1
2
exp(
(X )2 2 2
)
其中参数为均值, 为原则差,由此
决定旳正态分布记作 N (, 2 ) 。
正态分布概率密度曲线示意图
➢ 三.特征
➢ 正态分布是单峰曲线,形状呈钟型,中间高,两
端低,以 X 为对称轴,左右完全对称。
➢ 在 X 处,f ( X ) 取得最大值。
➢ 有两个参数:位置参数 和变异度参数 。 一定, 越大,数据越分散,曲线越平坦; 一
➢百分位数法 合用于偏态分布资料、分 布型未知旳资料以及分布末端有不拟定 值旳资料。
➢双侧95%参照值范围
P2.5 ~ P97.5
➢单侧95%参照值范围
P5 或 P95
• 根据正态 分布旳对称性知,外侧尾部面 积 u 2.21 与外侧尾部面积 u 2.21 相同,查附表1,得相应旳概率为0.0136, 体重在50kg以上旳12岁小朋友占1.36%。
第三节 医学参照值范围旳制定
1.5 正态分布

1 且曲线无最低点; ,且曲线无最低点; 2πσ (4)σ 越大,曲线越“瘦高”,σ 越小,曲线越“矮胖”. 越大,曲线越“瘦高” 越小,曲线越“矮胖” 上述说法正确的是( 上述说法正确的是 D ) (A)(1)和(2) (B)(2)和(3) 和 和 (C)(3)和(4) (D)(1)和(3) 和 和
首页
上一页
下一页
末页
瞻前顾后
做一做: 做一做:
要点突破
典例精析
演练广场
考题赏析
1.关于正态曲线性质的叙述: .关于正态曲线性质的叙述: (1)曲线关于直线 x=µ 对称,并且曲线在 x 轴上方; 轴上方; 曲线关于直线 = 对称, (2)曲线关于 y 轴对称,且曲线的最高点的坐标是 , 曲线关于 轴对称,且曲线的最高点的坐标是(0, (3)曲线最高点的纵坐标是 曲线最高点的纵坐标是 1 ); ; 2πσ
解:(1)P(ξ≥2.35)=1-P(ξ<2.35)=1-Φ(2.35) ≥ = - < = - =1-0.9906 - =0.0094. (2)P(ξ<- <-1.24)=Φ(-1.24)=1-Φ(1.24) <- = - = - =1-0.8925 - =0.1075. (3)P(|ξ|<1.54)=P(-1.54<ξ<1.54) < = - < < =Φ(1.54)-Φ(-1.54) - - =2Φ(1.54)-1 - =2×0.9382-1 × - =0.8764.
解:利用正态分布表可得 (1)P(-1<x<2)=Φ(2)-Φ(-1) - = - - =Φ(2)-[1-Φ(1)]=Φ(2)+Φ(1)-1 - - = + - =0.9772+0.8413-1=0.8185. + - = (2)P(x>2.5)=1-P(x≤2.5) = - ≤ =1-Φ(2.5)=0.0062. - =
高三数学 1.5正态分布

查表求下列各值
(0.5)、(2.3)、(1.45) (0.5)=1-Φ(0.5)=1-0.6915=0.3085 (2.3)=0.9893
=0,=1
(2) f ( x )
1 2 2
( x 1 ) 8
2
e
, x ( , )
=1,=2
正态曲线的性质
观察:
性质: (1)曲线在x轴的上方,与x轴不相交
(2)曲线关于直线x=μ对称 (3)曲线在x=μ时位于最高点。
(4)当x<μ时,曲线上升;当x>μ时,曲线下降。并且当曲线
即,可用如图的蓝色阴影部分表示。
由于标准正态曲线关于 y 轴对称,表中仅 给出了对应与非负值 x 的值 x 0 。
0
如果 x 0 0 ,那么由下图中两个阴影部分 面积相等知:
x 0 1 x 0 .
例1.求标准正态总体在(1,2)内取值的概率. 解:利用等式P=(x2) (x1)有
1.5正态分布
一、复习
由于总体分布通常不易知道,我们往往是 用样本的频率分布(例如频率分布直方图)去 估计总体分布。 一般样本容量越大,这种估计就越精确。 从上一节得出的100个产品尺寸的频率分布直 方图可以看出,当样本容量无限大,分组的组距 无限缩小时,这个频率直方图就会无限接近于一 条光滑曲线---- 总体密度曲线。
F(μ+3σ)-F(μ-3σ)=Ф(3)-Ф(-3) ≈0.997;
正态分布的重要性及应用

正态分布的重要性及应用正态分布,又被称为高斯分布,是统计学中最为常见的概率分布之一。
它的形状呈钟形曲线,以均值为中心对称,具有许多重要的性质和广泛的应用。
本文将介绍正态分布的重要性及其在各个领域的应用。
什么是正态分布?正态分布是一种连续型的概率分布,在数理统计学和概率论中扮演着重要角色。
它的特点是以均值为中心,标准差为衡量单位,呈现出典型的钟形曲线。
正态分布具有良好的对称性和稳定性,使得许多自然现象和人类行为能够很好地描述和解释。
正态分布的重要性正态分布在统计学中具有重要性,主要体现在以下几个方面:1.数据分布模型许多实际数据的分布可以被近似看作是正态分布,尤其是当样本量较大时。
在数据分析和预测中,我们经常会假设数据服从正态分布,这有助于进行精确的推断和预测。
2.中心极限定理中心极限定理指出,大量独立同分布的随机变量的和经过适当标准化之后,其分布趋近于正态分布。
这个定理在统计学和概率论中具有广泛的应用,为许多统计推断提供了理论基础。
3.参数估计和假设检验在参数估计和假设检验中,正态分布被广泛应用。
通过对样本数据的分布进行检验和推断,可以对总体参数进行推断,从而进行科学的决策和预测。
4.数据处理和分析许多统计方法和机器学习算法都建立在正态分布的基础之上,通过对数据的正态化处理,降低偏度和峰度,可以提高数据的稳定性和可解释性。
正态分布的应用领域正态分布不仅在统计学理论中被广泛应用,也在各个实际领域中发挥着重要作用,例如:1.金融领域股票价格、汇率变动、利率波动等金融数据通常服从正态分布,通过对这些数据的建模和分析,可以进行风险评估、投资组合优化等工作。
2.医学领域许多生物学指标和医疗数据的分布具有一定的正态性,通过对患者数据的统计分析,可以帮助医生做出合理的诊断和治疗方案。
3.工程领域在工程领域,正态分布常被用于设计和控制系统的参数优化,通过对系统性能数据的分析,可以实现工程目标的精准调控。
正态分布作为统计学中的重要概率分布,不仅在理论研究中具有重要地位,也在各个领域的实际应用中发挥着关键作用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率-曲线下的面积
Pc X d ?
f(X)
cd
举例
Z .00 .01 .02 -0.3 .3821 .3783 .3745
-0.2 .4207 .4168 .4129
-0.1 .4602 .4562 .4522 0.0 .5000 .4960 .4920
Z 0 Z 1
.4168
0
Z = -0.21
对数组段 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 1.3~ 1.4~ 1.5~ 1.6~ 1.7~1.8 合计
频数 4 2 5 9 12 15 18 14 12 5 3 1 100
累计频数 4 6 11 20 32 47 65 79 91 96 99 100 —
• 根据经验已知正常成人的血铅含量 近似对数正态分布,因此,首先对 原始数据作对数变换,进行正态性 检验(p>0.50),并编制对数值频数 表,再利用正态分布法求95%参考 值范围。
• 即该地正常成人血铅含量95% 参考值范围小于38.28ug/dl。
摄取比值 人数
0.75~
1
0.80~
2
0.85~
13
0.90~
15
0.95~
26
1.00~
26
1.05~
18
1.10~
15
1.15~
3
1.20~1.25 1
• 例4. 某年某地测得120名20~50岁正 常成人血浆结合125碘-三碘甲腺原 氨酸树脂摄取比值的资料如下,试 估计95%参考值范围。
一、制定医学参考值范围 • 选定足够数量的同质“正常”人作为研究对象
如制定血清谷丙转氨酶参考值范围,“正常”人的条件是:1)无肝、 肾、心、脑、肌肉等疾病;2)近期未服用对肝脏有损伤的药物 (如氯丙嗪、异烟肼等);3)监测前未作剧烈运动。依据指标的 性质判断是否需要分组。
• 控制误差:严格控制随机误差 • 选择单双侧检验 • 选择适当的百分界值,95%常用 • 选择估计参考值范围的方法
• 同理, P(-2.58<u<2.58)=0.99 ,即x 取值在区间 μ2.58σ上的概率为99%。
2.5% 47.5% 47.5% 2.5%
-1.96 +1.96
0.5% 49.5% 49.5% 0.5%
-2.576 +2.576
• 例2:某年某地150名12岁健康男童体重的均数为36.3 kg, 标准差为6.19 kg,试估计:
4455667777 7888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
• 标准正态分布用N(0,1)表示。
0.1
0.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0
• 实际应用中,经u变换可把求解任意一个正态曲线 下面积的问题,转化成标准正态分布曲线下相应 的面积问题。
• 为应用方便,制成统计用表(附表1):标准正态 分布曲线下的面积,Φ(-u)值。
百分位数法
年龄 人数 累计 累计频
(岁)
人数 率(%)
10~
7
7
0.7
11~ 44 51
5.1
12~ 153 204
20.5
13~ 244 448
45.0
14~ 269 717
72.0
15~ 191 908
91.2
16~ 61 969
97.3
17~ 16 985
98.9
18~
8 993
99.7
19~
正态分布法
• 对服从正态分布的指标,可根据正态曲线 下面积的分布规律进行参考值范围的估计。
• 首先进行正态性检验 • 若服从正态分布,计算均数x与标准差S • 估计参考值范围
– xuα/2S(双侧) – x+uαS或x-uαS (单侧)
• 例3. 某年某地测得100名正常成人的血铅含 量(ug/dl)如下,试确定该地正常成人血铅含 量的95%参考值范围。
• P97.5=17+1/16(996 97.5%969)=17.13(岁)
• 该地女学生月经初潮年龄 95%参考值范围为 11.41~17.13。
正态分布的应用
• 质量控制:
– 为了控制实验中的检测误差,常以x2S作为上、下警 戒值,以x3S作为上、下控制值。
• 正态分布是很多统计方法的理论基础 • 2分布、t分布、F分布等,都是在正态分布的基
举例
P X 8 .3821
正态分布
10
Z X 8 5 .30 10
标准正态分布
Z 1 .3821
8X
5
0.30
Z 0
Z
• 当μ和σ未知时,要用样本均数x和样本标准差S来 估计u值。
• u=(x-x)/S
• 例1: 若x~(μ,σ2),试计算x取值在区间 μ1.96σ上的概率。
• 正态分布的特征是:1)曲线在横轴上方,均数处最高;2)以均数为中心,左右 对称;3)确定正态分布的两个参数是均数μ和标准差σ。正态分布用N(μ,σ2)表 示,为了应用方便,常对变量X作u=(X-μ)/σ变换,使μ=0,σ=1,则正态分布转换 为标准正态分布,用N(0,1)表示。
• 正态曲线下面积的分布有一定规律。理论上μ1 σ,μ1.96σ和μ2.58σ区间的面积 (观察单位数)各占总面积(总观察单位)的68.27%,95%和99%,可用于估计 医学参考值范围和质量控制等方面。
1 994
99.8
20~ 2
996 100.0
合计 996 — —
不满足正态分布时,可用百分 位数法估计参考值范围
• 例5. 某年某地996名女学生月 经初潮年龄分布,确定95% 参考值范围。
• 呈正偏态分布。计算双侧 95%界值P2.5和P97.5
• P2.5=11+1/44(996 2.5%7)=11.41(岁)
(2)分别计算x1=30和x2=40所对应的u值,得到u1=-1.02和u2=0.60,查 附表1得: Φ(-1.02)=0.1539和Φ(-0.60)=0.2743,因此Φ(0.60) - Φ(-1.02)=(1- Φ(-0.60))- Φ(-1.02)=(1-0.2743)0.1539=0.5718,即理论上体重在30kg~40kg者占该地12岁健康男童 总数的57.18%。
u1=(x1- μ)/σ=[(μ-1.96 σ)- μ]/ σ=-1.96 u2=(x2- μ)/σ=[(μ+1.96 σ)- μ]/ σ=1.96 P(-1.96<u<1.96)= Φ(1.96)- Φ(-1.96)
=1-2 Φ(-1.96)=1-2x0.025=0.95
即x 取值在区间μ1.96σ上的概率为95%。
1.5 正态分布及其应用
• 重点掌握: • 正态分布的概念与特征 • 标准正态分布的概念和标准化变换 • 正态分布的应用
– 估计频数分布 – 确定医学参考值范围
正态分布的概念和特征
频数分布示意图 f(X)
概率密度曲线示意图
一、正态分布(Normal 的概念 Distribution)
• 频数分布图,当观察人数足够多,组 段不断分细,图中直条将逐渐变窄, 其顶端将逐渐接近于一条光滑的曲线。 这条曲线称为频数曲线或频率曲线, 略呈钟型,两头低,中间高、左右对 称,近似数学上的正态分布。由于频 率的总和等于100%或1,故横轴上曲 线下的面积等于100%或1。
础上推导出来的。某些分布,如t分布、二项分布、 Poisson分布等的极限均为正态分布,在一定条件 下,均可按正态近似的原理来处理。常用的u检验, 就是以正态分布为理论基础。
小结
• 正态分布是一种很重要的连续性分布,不少医学现象服从正态分布或近似正态分 布,或经变量变换转换为正态分布,可按正态分布规律来处理,它也是许多统计 方法的理论基础。
– σ是变异度参数:当μ恒定
时,σ越大,表示数据越分
散,曲线越“胖”;σ越小,
表示数据越集中,曲线越
“瘦”。
μ
– N(μ,σ2)表示均数为μ,
方差为σ2的正态分布。
• 正态曲线下面积的分布有一定 规律。
标准正态分布
• 为了应用方便,常作如下变换
• 将图A的原点移到µ的位置,横轴尺度以σ为单位,使µ=0,σ=1,则将正态分布变为标准正态分布
(1)该地12岁健康男童体重在50kg以上者占该地12岁健康男童总数 的百分比;
(2)体重在30~40kg者占该地12岁健康男童总数的比例; (3)该地80%的12岁健康男童体重的分布范围。
• 解答:
(1)将x=50代入公式,u=(50-36.3)/6.19=2.21 根据正态分布的对称性可知,u=2.21右侧的尾部面积与u=-2.21左侧 的尾部面积相等,查表Φ(-2.21)=0.0136,即理论上该地12岁健康 男童体重在50kg以上者占该地12岁健康男童总数的1.36%。
• 医学参考值范围的估计方法:
(standard normal distribution)
• u或z称为标准正态变量或标准正态离差(standard normal deviate)。
• 标准正态分布的密度函数
Area = 1.00
-∞<x<+∞