正态分布与医学参考值(修改)
03-医学统计学正态分布与医学参考值范围

1
ze
z2 2
dz
( X
)
2
标准正态分布的应用
实际应用中,经z变换可把求解任意一个正态分布曲线 下面积的问题,转化成标准正态分布曲线下相应面积的 问题。
欲求服从标准正态分布的随机变量在区间(-∞, z)(z≤0) 上曲线下的面积,可直接查表;对(z>0) 可根据对称性 算得,计算公式为:
正态分布的应用
• 制定医学参考值范围 • 质量控制 • 正态分布是很多统计方法的理论基础
医学参考值范围
概述
医学参考值范围(reference value range),指正常人 的解剖、生理、生化、免疫及组织代谢产物的含量等 各种数据的波动范围。
医学参考值范围,习惯上是包含95%的参照总体的 范围。
卫生部“十二五”规划教材
医学统计学
正态分布与医学参考值范围
正态分布
概述
正态分布(normal distribution),是 一种连续型随机变量常见而重要的分 布。
它首先由莫阿弗尔于1733年提出。 之后高斯对其进一步研究,使正态分 布广为人知。
A. de Moivre
Gauss
正态曲线 正态曲线(normal curve),是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。
Φ(z) =1-Φ( -z ) z在区间( z1, z2 )取值概率的计算公式为:
P(z1<z<z2 ) = Φ(z2)- Φ(z1)
【例】由160名7岁男孩身高测量的数据算得样本均数为 122.6cm、样本标准差为4.8cm。已知身高数据服从正态分布, 试估计该地当年7岁男孩身高介于119cm到125cm范围所占的 比例。
正态分布与医学参考值范围

1. 基于临床实践,从个体角度, 作为临床上判定正常与异常的 参考标准,即用于划分界限或 分类。
2. 基于预防医学实践,从人群角 度,可用来评价儿童的发育水 平,如制订不同年龄、性别儿 童某项发育指标的等级标准。
确定95%参考值范围示意图
二、制订医学参考值范围的注意事项
1. 确定同质的参照总体 一般选择“正常”人,主要是排除了对研究指标
例3-1 若X~
,试计算X 取值在区间
上的概率。
Standard normal distribution
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布, =4.78×1012/L, =0.38×1012/L。 ①该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比;
服从正态分布, =4.78×1012/L, =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
查附表1
,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正常成年男子总数的百分比
=
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
医学统计学正态分布及参考值范围

正态分布的特征 位置参数——均数μ
决定正态分布曲线在横轴上 的集中位置。固定形态参数σ ,改变μ的值,曲线沿 x轴平 行移动,曲线形状不变。
1.2 1 0.8 0.6 0.4 0.2 0 3.5 4
μ=4.75
μ=5.95
4.5
5
5.5
6
6.5
7
正态分布位置变换示意图
形态参数——标准差σ
决定正态分布曲线的形状。 固定位置参数μ ,σ值变小 ,曲线变“瘦高”(陡峭), σ值变大,曲线变“矮胖”( 平坦),曲线位置不变 。
应用
估计医学参考值范围 质量控制:临床检验、生物鉴定、食品卫生 监督 其他许多统计方法的基础
医学参考值估计
含义
绝大多数(一般95%或99%)正常人的各 种生理、生化、组织或排泄物中各种成 分的含量
考虑问题
确定目标总体 选择“正常人” 选择一批病人作为制订参考值之参考 统一测量方法和条件 确定观察对象例数 确定单双侧位界 确定参考值组数 选定百分位界
0.8 0.6 0.4 0.2 0
σ=0.5 σ=1 σ=2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 正态分布形态变换示意图
正态分布的特征 (4)正态分布曲线下的面积规律: 服从正态分布的随机变量在一区间上曲线下 的面积与该随机变量在同一区间内取值的概 率相等。 概率分布函数:
两边低
左右对称 呈钟形
两边低
X
中间高,两边低,左右对称,呈钟形
正态分布的数学函数表达式
如果随机变量X的概率密度函数满足
µ为总 体均数
X
σ2 为总 体方差 则称X服从正态分布,记作X~N(µ,σ2)。
1 f(x) e 2
3章 正态分布与医学参考值范围

25
y
0 .2 .4 .6 .8 1
3 4 5 x
5.5
6 7 26
5.5 4.78 4 4.78 P(4.00 X 5.50) ( ) ( ) 0.38 0.38 [1 ( 1.89)] ( 2.05) (1 0.0294) 0.0202 0.9504
该曲线的函数表达式 f(x) 称为正态分布密度函数
(probability density function,PDF)。
5
X
1 f (X ) e 2
( X )2 2 2
习惯上用N(μ,σ2)表示均数为μ, 标准差为σ的正态分布。
6
.08
.02
.04
.06
30
(二)选择足够例数的参照样本
通常情况下,确定参考值范围需要大样本,如果例 数过少,确定的参考值范围往往不够准确。 参照样本含量的确定没有统一的规则,一般认为至 少应在120例以上。
(三)控制检测误差
为保证原始数据可靠,检测过程中要严格控制随机 误差,避免系统误差和过失误差。
31
(四)选择单、双侧界值
单侧下限---过低异常 过低均异常 单侧上限---过高异常 双侧---过高、
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
如肺活量
如尿铅值
如体重
32
(五)选择适当的百分数范围
结合专业知识,根据研究目的、研究指标的性质、 数据分布特征等情况综合考虑。百分数范围的不 同将导致不同的假阳性率和假阴性率。 最常用的百分界限是95%,也可以选80%、90%、 99%等。
统计学课件-正态分布与医学参考值范围

三、醫學參考值範圍
(一)概念
醫學參考值範圍是指大多數正常人的 樣調查正常人的結果,可以確定一個大多數 正常人的某項指標的參考值範圍。最常用的 是95%參考值範圍。
(二)制定方法
1.正態分佈法 如生理指標為正態分佈的資料, 可應用正態分佈理論,制定參考值範圍。 95%參考值範圍如下: (1)雙側95%參考值範圍為: (2)單側95%參考值範圍,如指標值過高為 不正常,其上限為: X 1.64s (3)單側95%參考值範圍,如指標值過低為 不正常,其下限為: X 1.64s
正態分佈與醫學參考值範圍
一、正態分佈
正態分佈曲線是一個以均數為中心,左右兩側對 稱的鐘型曲線,簡稱正態曲線。
(一)正態分佈曲線的特徵:
1.曲線高峰位於中央(均數所在處)。 2.圍繞均數兩側完全對稱。曲線兩側逐漸下降, 兩尾端逐漸靠近橫軸,但永遠不與之相交。
3.正態分佈有兩個參數,即均數和標準差。一 般用N(,2)表示均數為,方差為2的正態
分佈。
(二)正態分佈曲線下麵積分布規律
1.在( - , + )範圍內,占正態分佈曲線下 麵積的68.27%;u在曲線正中間撒 2.在( -1.96 , +1.96 )範圍內,占正態分佈 曲線下麵積的95%; 3.在( -2.58 , +2.58 )範圍內,占正態分佈 曲線下麵積的99%。 熟記這些數據
2.百分位數法 對於某些生理指標,如果呈偏 態分佈的,可用百分位數法制定參考值範圍。 (1)如果指標值過高和過低都不正常,可定 雙側95%參考值範圍P2.5 ~P97.5 ; (2)若指標值過高為不正常,可定單側95% 參考值範圍,其上限為P95; (3)若指標值過低為不正常,其下限為P5 。 (在參考範圍之內,或者在參考範圍以外正常 值偏低或偏高)
03正态分布与医学参考值范围 (1)

44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
X2
1.96
1.96
P1.96 z 1.96 1.96 1.96 1 1.96 1.96
1 2 1.96 1 20.025 0.95
Standard normal distribution
2
e dx X
1 2
X
2
Normal distribution
正态分布是单峰分布,以 X 为中心左右完全对称
正态曲线在 X 处有拐点,呈现为钟型
正态分布由两个参数 和 σ 决定
是位置参数,决定着正态曲线在X轴上的位置
σ 是形状参数,决定着正态曲线的分布形状
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正态分布与医学参考值范围

正态分布与医学参考值范围正态分布是统计学中一种非常重要的概率分布,也被称为高斯分布。
它的图像呈现出钟形曲线,对称地分布在均值附近。
在医学领域中,正态分布的应用非常广泛,特别是在确定医学参考值范围时起到了至关重要的作用。
本文将就正态分布与医学参考值范围进行探讨。
正态分布在医学参考值范围确定中的应用主要是基于以下原因:1. 数据收集的特点:医学实验往往需要收集大量的数据,包括身高、体重、血压、血糖等指标。
这些指标在人群中的分布往往符合正态分布。
通过对数据的收集和统计分析,可以获得数据的平均值和标准差,从而确定参考值范围。
2. 对异常值的处理:在医学实验中,常常会遇到一些异常值,例如极端高或者极端低的数据。
正态分布的特点在于异常值对结果的影响很小,因为正态分布对于极端值的权重较低,大部分的数据都集中在均值附近。
因此,正态分布在医学参考值的确定中能够较好地处理这些异常值。
3. 统计推断的基础:医学研究中常需进行统计推断,例如判断某个治疗方法是否有效,或者不同人群之间是否存在显著差异。
正态分布作为统计学中的基础分布,提供了一种有效的工具来进行统计推断。
通过对数据进行假设检验、置信区间估计等方法,可以对医学参考值范围进行准确的推断。
医学参考值范围在实际应用中的确定过程一般包括以下步骤:1. 数据收集与整理:收集与特定指标相关的数据,如血液数据、生化指标等。
然后对数据进行整理,排除异常值。
2. 数据的分布检验:通过对数据的正态性检验,判断数据是否符合正态分布。
常用的检验方法有 Shapiro-Wilk 检验、Lilliefors 检验等。
若数据不符合正态分布,可能需要进行数据转换或者使用非参数方法来进行分析。
3. 参数估计:对符合正态分布的数据,通过计算平均值和标准差来估计总体的参数。
平均值代表了数据的集中趋势,标准差代表了数据的离散程度。
4. 构建医学参考值范围:根据正态分布的性质,通常采用均值加减2倍标准差的方法来构建医学参考值范围。
03-医学统计学正态分布与医学参考值范围

制订的注意事项
a、抽取足够例数的同质“正常人”样本 ★“正常人”的定义,样本量(n>120),随机化。
b、确定具有实际意义的统一测量标准 ★指标的测量方法等要有规定,控制测量误差。
c、根据指标的性质确定是否要分组 ★根据实际情况、专业知识。
d、根据指标含义决定单、双侧范围 ★单侧下限,过低异常;单侧上限,过高异常;双侧,
正态曲线下面积分布规律
3、所有的正态曲线,在μ左右的任意个标准差范围内面 积相同。
一些特殊情况,在μ±σ范围内的面积约为68.27%,在 μ±1.96σ范围内的面积约为95.00%,在μ±2.58σ范围内的 面积约为99.00%。
标准正态分布
对任意一个服从N (μ, σ2 )分布的随机变量X,经
f (X )
0.9
0.8
σ=0
0.7
0.6
0.5 0.4
σ =1
0.3
σ =2
0.2
0.1
0
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
X
正态曲线下面积分布规律
1、服从正态分布的随机变量在某一区间上的曲线下面 积与其在同一区间上取值的概率相等。
2、曲线下的总面积为1或100%,以μ为中心左右两侧面 积各占50%,越靠近μ 处曲线下面积越大,两边逐渐减 少。
z1=( 119-122.6 )/4.8 = -0.75 z2=( 125-122.6 )/4.8 = 0.5 查标准正态分布表
Φ(z1) = Φ( -0.75 ) = 0.2266 Φ(z2) = Φ(0.5 ) = 1- Φ( -0.5 )=1-0.3085= 0.6915 Φ(z2)- Φ(z1)=0.6915-0.2266= 0.4649 7岁男孩身高介于119cm到125cm范围所占的比例为46.49%
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几个重要区间 双侧 u-1.96,1.96 X X -1.96S, X +1.96S P=0.95 u-2.58,2.58 X X -2.58S, P=0.99
X+
2.58S
单侧 u(-,1.64 X X +1.64S P =0.95 u-1.64,) X X -1.64S P =0.95 u(-,2.33 X X +2.33S P =0.99 u-2.33,) X X -2.33S P =0.99
6.24(10 / L)
12
〖例5〗某市1974年为了解该地居民发汞的基础水 平,调查了留住该市一年以上,无汞作业接触史的 健康居民238人的发汞含量如下表,试估计该市健 康居民发汞值的95%参考值范围。 解:求单侧95%上限,用百分位数法,即求P95。
Pr Lr
i f
r r(n r % 〖例2〗某市1982年110名7岁男童身高,均数 为119.95cm,标准差为4.72cm, 1.试估计 该地7岁男童身高在110cm以下者占该地男童 总数的百分数。2.分别求
X 1s
X 1.96 s
X 2.58s
范围内人数占总数的百分数 解:
x X 110 119.65 u 2.11 s 4.72 Φ(u) Φ(2.11) 0.0174
查表注意
利用均数和标准差先对x做标准化变换,求得 u值 曲线下对称于0的区间,面积相等 曲线下横轴上的总面积为100%或1 如:区间(2.58,∞)的面积 φ(-2.58)=0.005 区间(-∞,2.58)的面积 φ(2.58)=1-φ(-2.58)=0.995 P(∣u∣>1.96)=2φ(-1.96)=0.05 P(∣u∣<2.58)=φ(2.58)-φ(-2.58)=0.99
正态性检验
图示法:多采用分位数图(quantilequantile plot,Q-Q plot)和概率图 (probability- probability plot,P-P plot)。 计算法:常用偏度与峰度进行评定, 其度量指标分别为偏度系数和峰度系 数。
二、正态分布的应用
估计医学参考值范围 质量控制
μ是总体均数;σ是总体标准差(永远大
于零)。这两个参数可完全决定一个正态 分布, 故常简记为N(μ,σ2 ) 当μ=0, σ=1时,这样的正态分布称为 标准正态分布, 简记为N(0, 1)
位置参数对曲线分布的影响
形态参数对曲线分布的影响
正态曲线下面积的分布规律
正态曲线下一定区间的面积
1 P F ( x) 2
确定研究总体,保证研究对象的同质性。 确定样本容量,一般n 100. 确定单侧或双侧(根据专业知识)。 确定适当百分范围。常取90%,95%,99% 等 选定适当统计方法:
正态分布法 百分位数法
二、参考值范围的估计方法
正态分布法(适于正态分布资料) X us 双侧95%参考值范围:X 1.96S 单侧95%参考值范围: X -1.64S 或X +1.64S 百分位数法(适于非正态分布资料) 双侧95%参考值范围: P2.5,P97.5 单侧95%参考值范围: P5 或 P95
标准差单位
任何正态变量X~N(μ,σ2 )经过一个变 换
u
x
便有u~N(0, 1)。这个变换称为标准化 变换, 变换后的 u 称为 标准化正态离 差(standardized deviate)或称 u 值, 实 际上就是用标准差σ作单位来度量离均 差的大小。
正态分布特征
正态曲线在横轴上方均数处最高,即频数 最大 正态分布以均数为中心,左右对称,无限 接近于x轴 曲线与横轴所围面积为1。正态曲线下面 积分布有一定规律
正态分布的概率密度函数
1 ( x )2 /(2 2 ) f ( x) e 2 - x
两个参数:总体均数,总体方差 2
F ( x)
x
1 f ( x)dx 2 - x
x
e
( x )2 /(2 2 )
120名成年男子RBC的实际分布与理论分布比较
XS X 1.00S X -1.64S X 1.96S X 2.58S
RBC范围
4.15~5.28 3.79 3.61~5.83 3.26~6.18
实际分布 % 人数 83 113 114 120 69.17 94.17 95.00 100.00
正态分布与参考值范围
生物统计学系 谭旭辉
第一节 正态分布
一、正态分布曲线(normal distribution)
图4-2 某地150名正常成年男子红细胞数 (1012/L)频数分布图
正态分布的重要性
实践中许多连续型随机变量的频率密度 直方图形状是中间高、两边低、左右对 称的,称这样的变量服从正态分布或高 斯分布 许多分布在一定条件下趋于正态分布 最常见最重要的一种连续性分布 ﹟normal 不是指“正常”,“对称”
〖例4〗某地调查正常成年男子144人的红细 胞数,均数5.38×1012/L ,标准差为 0.44×1012/L 。试估计该地成年男子红细胞 数的95%参考值范围。
下限: X 1.96s 5.38 1.96 (0.44)
4.52(10 / L)
12
上限: X 1.96s 5.38 1.96 (0.44)
得该地男童身高在110cm以下者,估计约占 1.74%
X 1.96 s X X 1.96 s X ( ) ( ) s s (1.96) (1.96) 1 2 (1.96) 1 2 0.025 95%
求某部分面积所对应的变量值
〖例3〗前面例1中,求中间80%成年男子 的红细胞计数范围。 解:P=0.1 u=-1.282 根据对称性得区 间 u-1.282,1.282 X X -1.282S, X +1.282S X3.99, 5.44 1012/L
〖例1〗随机抽取某市120名成年男子测红细胞 计数, 得 X =4.7168, S=0.5665。求红细胞计 数在(4.0~5.0)1012/L 之间的人数及所占比例。 解:已知 X =4.7168, S=0.5665
X =4时,u=(4-4.7168)/0.5665= -1.265 X =5时,u=(5-4.7168)/0.5665= 0.500 P =(0.5)-(-1.265)=(1-0.3085)-0.1029 =0.5886 人数: 1200.5886 71人 (实际人数为70人)
求两个变量之间的面积
一般正态分布概率密度曲线下的面积可 通过标准化变换后按上述方法来计算。 例如: ( 1.96 , 1.96 ) 区间上, 正态分布N(μ,σ2 )曲线下的面积分 别为
( μ 1.96σ ) μ ( μ 1.96σ ) μ Φ Φ σ σ Φ 1.96 Φ 1.96 [1 Φ 1.96 ] Φ 1.96 0.95
dx
u
x
标准正态 分布函数
x x
1 ( x) (u )du 2 - x
e
u 2 / 2
du
标准正态分布
标准正态分布的概率密度函数
(u )
1 2
e
u
2
2
, u
u称为标准正态变量或标准正态离 差,表示x与μ的差相当于多少个
理论分布 % 68.27 95.00 95.00 99.00
为应用方便,将标准正态分布的双侧 尾部面积之和等于α 时所对应的变 量值称为正态分布的双侧临界值,记 为uα/2(zα/2)即P(|u|> uα/2)=α 对数正态分布 原始数据经对数转化后服从正态分布, 如正常成人血铅含量,医院病人的住 院天数等
f
r
)
0.4 P 95 2.3 16 (238 95% 212) 2.65
该市健康居民发汞值的95%参考值范围应小于 2.65g/g。
某市238名健康人发汞含量
发汞值(g/g) 人数 累积频数 累积频率(%)
0.30.71.11.51.92.32.7-
20
66 60 48 18 16 6
正态分布是许多统计方法的理论基础
第二节 医学参考值范围
一、基本概念
同质观察单位某项测定指标按一定 标准确定的波动范围称参考值范围 (range of reference value)也 有称正常值范围(range of normal value),前者较合理。
参考值范围估计的一般原则与步骤
e
x
( x )2 /( 2 2 )
dx
1 P (u ) 2
e
u
t 2 / 2
dt
按标准正态分 布公式计算曲 线下面积
一般统计学书籍均附有标准正态分布的分布 函数Φ(u)表。由概率密度曲线的对称性:
Φ u 1 Φu
借助这个表格可以得到任何区间上标准正态 分布曲线下的面积, 即变量落在该区间上的概 率。
20
86 146 194 212 228 234
8.40
36.13 61.34 81.51 89.08 95.80 98.32
3.13.53.9-4.3 合计
1
0 3 238
235
235 238 -