第三章 统计学正态分布及其应用(医学统计学)
合集下载
医学统计学 正态分布(精)

参考值范围的估计方法:正态分布法
2.5% 95% 2.5%
-1.96
+1.96
【例5.6 】某地调查正常成年男子144人的红细胞 数,近似正态分布,得均数 X =5.38×1012/L,
标准差S=0.44×1012/L。试估计该地成年男子红
细胞数的95%参考值范围。 解:双侧,95%界值u=1.96
X 2S 作为上下警戒值,
X 3S 作为上下控制值
4)正态分布是许多统计方法的理论基础
u 检验是以正态分布为理论基础的假设 检验方法; 统计学中的三大统计分布:卡方分布,t 分布, F 分布都是在正态分布的基础上推 导出来的; 某些分布的极限形式为正态分布:如 t 分 布,二项分布,Poisson分布等。均可按正 态近似的原理来处理。
应用本法的条件是样本含量较多,分布趋于稳定,样本含量 不少于150为宜。 其优点是可用于任何分布甚至分布不明的 资料。
【例5.7 】 用硫酸-高锰酸钾-硝酸消化法和无火焰原子吸 收光谱法测得某市238 名正常人发汞值如表5.6,试确定 该市发汞值的95%正常值范围。
表5.4 238例正常人发汞值的频数分布
X ±us
(cm)
人数
百分数(%)
(%)
────────────────────────────────────
X ±1.00s 119.41±1.00×4.38 X ±1.96s 119.41±1.96×4.38
115.03-123.79 110.83-127.99 108.11-130.71
83 113 119
参考值范围的涵义:绝大多数的正常人在该范围内 绝大多数,习惯上指正常人的80%,90%,95% (最常用)或99%等。 例如,根据正常人样本确定了血清谷草转氨酶正常 值单侧95%上限为37U/L。即容许有5%的正常人被 判为异常,称为假阳性
预防医学统计学正态分布及其应用

2
其中 x
0
x
式中 为实数, >0 .则称X服从参数为 ,2旳正态分 布,记为N(, 2).可表为X~N(, 2).
图象见右上角
二、正态分布图形特征
1、高峰位于中央,两侧逐渐下降并对称,
曲线两端不与横轴相交
f (x)
2、以均数为中心,左右对称
3、正态分布有两个参数:
(1)位置参数 μ (2)形态参数σ
95%参照值范围为(2.96,6.72)(mmol/L)
(2) 3.80-4.84
u=
= - 1.08
0.96
Ф(u) =Ф(-1.08)=0.1401
即血清总胆固醇低于3.80 mmol/L所占旳 百分比为14.01%。
95.00% 2.5%
μ -1.96 σ
μ + 1.96σ
1
2 μ-σ
3
μ+σ
四、 原则正态分布
参数=0,2=1旳正态分布称为原则正态
分布,记作X~N(0, 1)。
(x)
其密度函数为
(x)
1
x2
e2
2
( x )
4 2 0 2 4
2、原则正态分布曲表
Φ(面积,即相应u值左侧原则正态分布曲线 下面积。
N(4,7/5)
2 0 2 4 6 x
三、正态曲线下面积旳分布规律
正态曲线与X轴所夹旳面积恒等于1或100%
面积总 等于1
已知:X服从均数为μ ,原则差为σ旳正态分
布,试估计X取值在μ± σ, μ±1.96 σ,
μ±2.58σ区间上旳概率
f (x)
1
e
(
x )2 2 2
2
医学统计学 正态分布及其应用

26/43
为什么要确定一个范围? 既然同属正常人,就不能以甲的数据为标准, 认为乙异常,亦不能以甲此时的数据为标准, 认为彼时的异常。所以必须确定一个波动范 围。如WBC:4000~10000个/mm3 “正常”是一个相对的概念 “正常人”是指排除了影响所研究指标的疾 病和有关因素的人。
27/43
同质 正常 “足够数量” 例数过少,代表性差;例数过多增加成本, 且易导致正常标准把握不严,影响数据的可 靠性。 一般认为每组100例以上 ;有人认为确定临 床生化指标的正常值应取300~500例。
30/43
控制检测误差
通过人员培训、控制检测条件、重复测 定等措施,严格控制检测误差。
(二)主要特征:
1、正态分布以均值μ为中心,左右对称。 2、正态分布中,曲线下面积集中在以均值μ为中心 的中心部分,越远离中心,曲线越接近 X 轴,曲线 下面积越小,超过一定范围以外的面积可以忽略。
8/43
3、正态分布曲线完全由参数μ和σ决定。
μ是位置参数,决定分布曲线在横轴的偏
移位置。
σ是变异参数,决定分布曲线的形态。
71.67
95.00 98.33
68.27
95.00 99.00
25/43
参考值范围
(reference interval)
又称正常值范围(normal range) 正常人的形态、功能、生化等各种指标的波 动范围。简称正常值。 为什么波动? “个体变异” 同一指标的数据因人而异 同一个体的数据随环境、时间等改变而变
9/43
方差相等、均数不等的正态分布图示
2 1 3
3
1
2
10/43
均数相等、方差不等的正态分布图示
医学统计学-4-正太分布及应用

(u)
1 2 e
u 2 2
,(-∞< u <+∞)
对其定积分:
(u )
1 2
u
e
u 2 2
du
式中 (u)为标准正态变量u的累计分布函数, 反映了横轴自-∞到u的正态曲线下面积,也 就是下侧累计面积(概率)。 引入标准化变换后,对于其他任何正态分 N ( , 2 ) 都可以借助标准正态分布表估计 布 任意(X1,X2)范围内的频数比例。
1、参考值范围确定的注意点
“正常人” 的概念 样本数据大小的问题 检测误差的问题 判断是否分组 单、双侧的问题 “绝大多数”的含义 是否需要确定可疑范围 变量转换的问题
不管将正常界值定在什么位置,都可能出现假 阳性或假阴性,产生这两种误判的根本原因是 正常人的分布与病人的分布有重叠 。
(一)估计频率分布
例、若由某项研究得某地婴儿出生体重为 3100g,标准差为300g,试估计该地区当年出 生低体重儿(出生体重≤2500g)所占比例。 认为当年该地区婴儿出生体重近似服从正态分 布N(3100,3002),作标准化变换:
u X
2500 3100 2.00 300
注意点二
对于非标准正态分布,求曲线下任意(X1, X2)范围内的面积,可先作标准化变换, 再借助标准正态分布表求得。
例、某市120名12岁男童身高的例子中已求得均 数为 143.05cm,标准差s=5.82cm。设该资料服 从正态分布,试求① 该地12岁男童身高在132cm 以下者占该地12岁男童总数的比例,② 分别求 X ±1s、 X ±1.96s和 X ±2.58s范围内12岁男童占 该组儿童总数的实际百分数,并与理论百分数比 较。
1 2 e
u 2 2
,(-∞< u <+∞)
对其定积分:
(u )
1 2
u
e
u 2 2
du
式中 (u)为标准正态变量u的累计分布函数, 反映了横轴自-∞到u的正态曲线下面积,也 就是下侧累计面积(概率)。 引入标准化变换后,对于其他任何正态分 N ( , 2 ) 都可以借助标准正态分布表估计 布 任意(X1,X2)范围内的频数比例。
1、参考值范围确定的注意点
“正常人” 的概念 样本数据大小的问题 检测误差的问题 判断是否分组 单、双侧的问题 “绝大多数”的含义 是否需要确定可疑范围 变量转换的问题
不管将正常界值定在什么位置,都可能出现假 阳性或假阴性,产生这两种误判的根本原因是 正常人的分布与病人的分布有重叠 。
(一)估计频率分布
例、若由某项研究得某地婴儿出生体重为 3100g,标准差为300g,试估计该地区当年出 生低体重儿(出生体重≤2500g)所占比例。 认为当年该地区婴儿出生体重近似服从正态分 布N(3100,3002),作标准化变换:
u X
2500 3100 2.00 300
注意点二
对于非标准正态分布,求曲线下任意(X1, X2)范围内的面积,可先作标准化变换, 再借助标准正态分布表求得。
例、某市120名12岁男童身高的例子中已求得均 数为 143.05cm,标准差s=5.82cm。设该资料服 从正态分布,试求① 该地12岁男童身高在132cm 以下者占该地12岁男童总数的比例,② 分别求 X ±1s、 X ±1.96s和 X ±2.58s范围内12岁男童占 该组儿童总数的实际百分数,并与理论百分数比 较。
医学统计学. 正态分布及其应用

44
表4.6 参考值范围的制定
45
例4.24 某地调查正常成年男子200人的红 细胞数,得均数 X =55.26×1012/L,标准 差S=0.38×1012/L,试估计该地正常成年 男子红细胞数的95%参考值范围。
46
解:该地正常成年男子红细胞数的95%参考值范围为
下限:
X-1.96S =55.26 - 1.96×0.38=54.52(×1012/L)
生不同位置、不同形状正态分布, (x1,x2)范围内的面积也不同, 计算起来很麻烦。
22
三、标准正态分布 为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99%。
16
■μ士σ范围内的面积占正态曲线下面积的68.27%,也
就是说有68.27%的变量值分布在此范围内。
68.27%
-
+
17
μ士1.64σ范围内的面积占正态曲线下面积的90%,也就是 说有90%的变量值分布在此范围内。
90%
5%
线,近似于数学上的正态分布曲线。
7
一.正态分布的概念和特征
1.正态分布的概念
在医学卫生领域中,许多变量的频 数分布是中间(靠近均数处)频数多,两边 频数少,且左右对称。如人体的许多生 理、生化指标等。这种变量的频数分布 规律可用概率论中的一种重要的随机变 量分布—正态分布(Normal distribution)加 以描述。
表4.6 参考值范围的制定
45
例4.24 某地调查正常成年男子200人的红 细胞数,得均数 X =55.26×1012/L,标准 差S=0.38×1012/L,试估计该地正常成年 男子红细胞数的95%参考值范围。
46
解:该地正常成年男子红细胞数的95%参考值范围为
下限:
X-1.96S =55.26 - 1.96×0.38=54.52(×1012/L)
生不同位置、不同形状正态分布, (x1,x2)范围内的面积也不同, 计算起来很麻烦。
22
三、标准正态分布 为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99%。
16
■μ士σ范围内的面积占正态曲线下面积的68.27%,也
就是说有68.27%的变量值分布在此范围内。
68.27%
-
+
17
μ士1.64σ范围内的面积占正态曲线下面积的90%,也就是 说有90%的变量值分布在此范围内。
90%
5%
线,近似于数学上的正态分布曲线。
7
一.正态分布的概念和特征
1.正态分布的概念
在医学卫生领域中,许多变量的频 数分布是中间(靠近均数处)频数多,两边 频数少,且左右对称。如人体的许多生 理、生化指标等。这种变量的频数分布 规律可用概率论中的一种重要的随机变 量分布—正态分布(Normal distribution)加 以描述。
正态分布在医学统计学区间估计的应用

正态分布在医学统计学区间估计的应用
正态分布在医学统计学区间估计中有着重要的作用,下面来看看它具体在医学统计学中的应用:
一、正态分布在病人总死亡评估中的应用
1、采用正态分布加以拟合,以此为基础进行参数的估计,来评估患病的总死亡率;
2、正态分布用于估计患者每一种病的能力,以及每个患者的健康状况,对有效的病人总死亡率的有效性的评估;
3、采用正态分布加以建模,以评估人群特定疾病的潜在病死率。
二、正态分布在病人康复情况评估中的应用
1、用正态分布拟合以此来评价患者在疾病入院状态以及出院状态,以便记录每一个患者的康复情况;
2、用正态分布拟合对比康复情况和病人体重、血压等参数,以便来评估疾病康复速度及相关变量;
3、采用正态分布估计病人疾病康复时间,以及评估病人康复率。
三、正态分布在医療安全性评估中的应用
1、用正态分布运算识别医疗机构中的安全缺陷及其准确性;
2、采用正态分布估计对医疗安全性的危害概率;
3、用正态分布拟合以此来评估医疗安全事件的频率和比例,以此来发现有关的风险因素。
四、正态分布在药物毒性监测中的应用
1、用正态分布评估药物毒副作用出现的概率,评估药物在不同患者身上的作用效果;
2、运用正态分布来收集药物实验结果,以检测出不同的药物的毒性;
3、采用正态分布来评估药物的安全程度及其有效性。
总而言之,正态分布在医学统计学区间估计中有着重要的应用,可以在病人总死亡评估、病人康复情况评估、医療安全性评估以及药物毒性监测中使用,在这些医学领域中都能发挥作用。
医学统计学总复习(刘桂芬主编-研究生使用) (1)

① 绘制散点图,初步判断是否呈直线趋势; ② 计算 a、b。(如果基本呈直线趋势) ③ 对 b 作假设检验:方法:a. F 检验
b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告
b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告
03正态分布与医学参考值范围(医学统计学)

σ 是形状参数,决定着正态曲线的分布形状
正态曲线下的面积分布有一定的规律
图3-3
图3-4
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
正态方程的积分式(分布函数):
F(X)为正态变量X的累计分布函数,反映正态曲线 下,横轴尺度自-∞到X的面积,即下侧累积面积 。
Normal distribution
图3-5
图3-6
正态分布是一种对称分布,其对称轴为直线X=µ,即均 数位置,理论上:
µ±1σ范围内曲线下的面积占总面积的68.27% µ±1.96σ范围内曲线下的面积占总面积的95% µ±2.58σ范围内曲线下的面积占总面积的99% 实际应用中:
±1 S范围内曲线下的面积占总面积的68.27% ±1.96 S范围内曲线下的面积占总面积的95% ±2.58 S范围内曲线下的面积占总面积的99%
属异常,采用双侧界值;有些指标仅过大或者过 小为异常,采用单侧界值。
肺活量参考值范围
白细胞数参考值范围
血铅参考值范围
5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、
数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法
异常
正常
异常
异常
正常
双侧下限
双侧上限
单侧下限
正常
异常
单侧上限
例3-3 已知某地140名正常成年男子红细胞计数近似服 从正态分布, X =4.78×1012/L,S =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。
X z0.05 2S 4.78 1.960.38 4.04 , 5.52
正态曲线下的面积分布有一定的规律
图3-3
图3-4
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
正态方程的积分式(分布函数):
F(X)为正态变量X的累计分布函数,反映正态曲线 下,横轴尺度自-∞到X的面积,即下侧累积面积 。
Normal distribution
图3-5
图3-6
正态分布是一种对称分布,其对称轴为直线X=µ,即均 数位置,理论上:
µ±1σ范围内曲线下的面积占总面积的68.27% µ±1.96σ范围内曲线下的面积占总面积的95% µ±2.58σ范围内曲线下的面积占总面积的99% 实际应用中:
±1 S范围内曲线下的面积占总面积的68.27% ±1.96 S范围内曲线下的面积占总面积的95% ±2.58 S范围内曲线下的面积占总面积的99%
属异常,采用双侧界值;有些指标仅过大或者过 小为异常,采用单侧界值。
肺活量参考值范围
白细胞数参考值范围
血铅参考值范围
5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、
数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法
异常
正常
异常
异常
正常
双侧下限
双侧上限
单侧下限
正常
异常
单侧上限
例3-3 已知某地140名正常成年男子红细胞计数近似服 从正态分布, X =4.78×1012/L,S =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。
X z0.05 2S 4.78 1.960.38 4.04 , 5.52
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诊断界值
(2)正常人分布与病人分布有重叠
假阴性(漏 诊)
假阳性(误 诊)
正常人
病人
诊断界值
a.如需兼顾假阳性和假阴性,取95%较 适当; b.如主要目的是减少假阳性(如用于确
诊病人或选定科研病例),宁取99%。
c.如主要目的是减少假阴性(如用于初 筛搜查病人),宁取80%或90%。
6、选择适当制定方法(见下)。
有的人,而是指排除影响被研究指标的 疾病和因素的人。
例如,制定SGPT(谷丙转氨酶)正常值 范围,“正常人”的条件是: a.无肝、肾、心、脑、肌肉等疾患;
b.近期无服用损肝的药物(如氯丙 嗪,异烟肼) c.测定前未作剧烈运动。
(2)医学参考值范围制定所需的样
本例数一般要求 n>100
2、对选定的正常人进行统一而准确的测 定: (1)测定的方法、仪器、试剂,操作的熟
正常人的某项观察值均在该范围之 内。这个绝大多,习惯上指正常人
的80%、90%、95%、99%(最常
用是95%)。
根据所选定的百分界限,会造成假阳性
或/和假阴性。 如何选定百分位数,以平衡假阳性和假阴
性:
(1)正常人的分布和病人的分布没有重 叠,这是只要求减少假阳性,则取99%较
为理想。
正常人
病人
已知 X=121.95cm, S=4.72cm
欲估计身高界于116.5-119.0cm范 围内的7岁男童比例及人数。
求该面积
116.5
119.0
u1=
116.5-121.95 4.72 119.0-121.95 4.72
= - 1.15
u2=
= - 0.63
例3.3
已知 X=121.95cm, S=4.72cm
1、抽取足够数量的“正常人”作为调查对象
2、对选定的正常人进行统一而准确的测定
3、考虑是否应按性别、年龄、职业等因素分组确定
医学参考值范围
4、确定取单侧还是双侧医学参考值范围
5、选定适当的百分界限
6、选择适当制定方法
(二)医学参考值范围制定的一般原则: 1、抽取足够数量的“正常人”作为调 查对象
“正常人”-不是指任何一点小病都没
2、百分位数法
(1)适用范围:
a.偏态分布资料
b.分布不清资料 c.开口资料
(2)计算公式: 双侧: 95% 99% 单侧: 上限 P2..5~P97.5 P0.5~P99.5 95% 99% P95 P99
下限
95%
99%
P5
P1
二、质量控制
上控制线 警戒线
x+3S
x+2S
x
下控制线
x -2S x -3S
三、正态分布是很多统计方法的 理论基础。
(1)μ-位置参数:
当 σ一定时,μ越大,曲线越向右移动; μ越小,曲线越向左移动。 (2)σ-离散度参数,决定曲线的形态:
当μ一定时,
σ越大,表示数据越分散,曲线越“胖”;
σ越小,表示数据越集中,曲线越“瘦”。
三、正态曲线下面积分布规律
无论μ σ取什么值,正态曲线与横轴间的 面积总等于1 面积 总等 于1
(三)制定医学参考值范围常用方法:
1、正态分布法
(1)适用范围:(近似)正态分布或对数正态分布 资料 (2)计算公式:
x ±uS 双侧: 95% x ±1.96S 99% x±2.58S 单侧: 上限 95% x +1.645S 99% x +2.326S 下限 95% x -1.645S 99% x -2.326S
练程度,方法的精确度均要统一;
(2)要尽量与应用医学参考值范围时的实 际情况一致。
3、考虑是否应按性别、年龄、职业等 因素分组确定医学参考值范围。 原则上,组间差别明显,并有实际意义, 应分开制定,否则应合并。
考察组间差别最简便而有效的方法是:
从频数分布表,直接比较各组的分布
范围,高峰位置,分布趋势等是否相近, 如相近就合并,如差异明显,就分组。或 做两样本均数的假设检验,有差别就分组, 无差别就合并。
4、确定取单侧还是双侧医学参考值范围。 (1)白细胞数过高和过低均属于异常,
需制定下限(最小值)和上限(最大 值),称双侧医学参考值范围。
(2)肺活量只过低为异常,只需制定医学
参考值范围的下限; 尿铅只过高为异常,
只需制定医学参考值范围的上限;均称单
侧医学参考值范围。
5、选定适当的百分界限。 正常值范围的意思:绝大多数
的正态分布。
为了应用方便,令
u
u变换
x
标准正态 分布
u服从均数为0、标准差为1的正态分布
68.27%
-1.0
+1.0
95.00%
2.5%
2.5%
-1.96
+1.96
二、标准正态分布表 附表Ⅰ
Φ(u)
-∞ -3 -2 -1 0 +1 +2 +3 + ∞
查表确定标准正态分布曲线下的面积时 必须注意:
(1)当μ,σ和X已知时,先按u变 换公式求得u值,再用u值查表;
u
x
当μ,σ和X未知时,用样本均数 和样本标准差S代替求u值。
u
x x
s
(2)查表时,可以利用标准正态分布 的两个特征: a.曲线下对称于0的区间,面积相等;
b.曲线下横轴上的总面积为100%或1。
例3.3
卫生统计学
第三章 正态分布及其应用
第一节、正态分布的概念及特征
一、正态分布图形
两头低,中间高,左右对称,呈钟 型的单峰曲线。
正态分布特征
1、曲线在横轴上方均数处最高;
2、以均数为中心,左右对称;
3、正态分布有两个参数: 位置参数μ 、形状参数σ
4、正态分布曲线下的面积有一定的分布 规律。
二、正态分布的两个参数
熟记下列常用的曲线下面积分布规律:
1、μ±σ的区间占总面积的68.27%
2、μ±1.96σ的区间占总面积的95%
3、μ±2.58σ的区间占总面积的99%
68.27%
X-S
X+S
95.00%
2.5%
2.5%
X-1.96S
X+1.96S
第二节
标准正态分布
一、标准正态分布与标准化变换
正态分布是一个分布族。对应于不 同的参数μ和σ会产生不同位置不同形状
欲估计身高界于116.5-119.0cm范 围内的7岁男童比例及人数。
求该面积
-1.15
-0.63
Ф(u1) =Ф(-1.15)=0.1251
Ф(u2) =Ф(-0.63)=0.2643 Ф(u2)- Ф(u1) = 0.2643 - 0.1251 =0.1392=13.92% 即身高界于116.5-119.0cm范围内 的7岁男童比例为13.92%,其人数 为110×13.92%=15(人)。
第三节
正态分布的应用
一、估计频数分布 二、制定参考值范围 三、质量控制
四、统计处理方法的基础
一、估计频数分布
例3.3
Hale Waihona Puke 例3.4(略)二、制定参考值范围
(一)医学参考值范围意义:
医学参考值范围(亦称为正常值 范围)是指正常人的解剖、生理、生
化等各种指标的波动范围。它主要用
于划分正常与异常的界限。
(二)医学参考值范围制定的一般原则: