医学统计学之计量资料的统计描述

合集下载

医学统计学-计量资料的统计描述

医学统计学-计量资料的统计描述
G lg 1( 7 lg 5 11 lg 10 ... 8 lg 80 ) 7 11 22 12 8
lg 1(1.3161 ) 20.705
60人的血清平均抗体效价为1:20.705
2021/9/29
40
2.几何均数
注意事项
▪ 等比资料,如:抗体的平均滴度、药物的平均效价、卫生事 业平均发展速度、人口的几何增长
▪ 直接法: ▪ 频数表法:
❖应用: 正态分布或近似正态分布资料
2021/9/29
25
1.算术均数
计算方法
❖ 直接法:即将所有观察值x1,x2,x3,…,xn直接相加 再除以观察值的个数,写成公式
x x1 x2 x3 ... xn xi
n
n
x为样本均数 n为变量值个数,
i为各变量值, Σ表示求和
▪ 纵坐标:为频数f,必须从0开始(f为每一组段内的人数)
❖直条
▪ 直条的宽度:组距 ▪ 直条的高度:每一组段的频数
❖累计
2021/9/29
15
2.绘制频数分布直方图
2021/9/29
16
2.绘制频数分布直方图
2021/9/29
17
3、频数分布的特征
从频数表可以看到频数分布的两个重要的特征 ❖ 集中趋势(central tendency)
▪ 对数正态分布:是右偏态分布 ▪ 观察值不能有0。因为0不能去对数,不能与任何其他数呈
倍数关系。 ▪ 观察值不能同时有正值和负值。若全是负值,计算是可以把
负号去掉,得出结果后再加上负号。 ▪ 同一组资料求得的几何均数小于算术均数。
2021/9/29
41
2.几何均数
若一组数值变量资料为偏态分布,变量为x,令y=lgx后, 变量y服从正态分布,请问变量x为什么样的偏态分布资料?

医药统计学 第一章 数据的描述与整理

医药统计学 第一章 数据的描述与整理

统计工作的五个步骤紧密相连、不可分割,任何一
步的缺陷,都将影响整个研究结果。
目前,应用广泛,成为医药学研究、疾病防治、卫 生事业管理等多方面的重要手段、工具之一,即成 为方法论。
医药数理统计学(Mathematical statistics of
medicine): 应用概率论与数理统计学的原理与方法研究医 药学以及卫生服务领域中数据的收集、整理、分析 和解释的一门科学。
一.数据分布集中趋势的描述
频数分布表、图显示的集中趋势和离散程度较 粗略,而计算其各指标则是准确、定量描述其 分布特征。
集中趋势指标:平均数,反映观察值的集中位 置或平均水平,即观察值的典型水平或代表值。 描述一组同质观察值的平均水平或中心位置的 常用指标有均数、中位数、众数、几何均数等。
平均水平指标
数分布大致对称。特殊的对称分布为正态分布 (normal distribution)。
eg:体重、身高等生理、生化检测结果等。
偏态分布:频数分布不对称,集中位置偏向一侧。
40 人 数 30 20 10 0 124 132 140 148 身高(cm)
对称分布
156
164
eg:
.236364
Fraction
国际标准通用的统计分析软件,但操作略为繁琐。 (二)SPSS(社会科学统计软件) 全称Statistical Package for Social Science,是当前 最流行,应用最广泛的专业统计分析软件,操作
方便。
(三)EXCEL(电子表格软件) 可进行基本的统计分析。操作简便。
频数分布的特征:
医药统计学
一.基 本 概 念
概率论(probability):是研究随机现象数量规律的 数学学科。

医用统计学-计量资料的统计描述练习题

医用统计学-计量资料的统计描述练习题

医用统计学-计量资料的统计描述练习题一、名词解释1.中位数2.四分位数间距3.标准差4.变异系数5.正态分布二、是非题1.不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。

()2.少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。

()3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。

()4.四分位数间距也是描述连续分布数据离散度的指标。

()5.理论上,对于正态分布资料,总体百分位数的P5~P95和μ±1.96σ范围内都包含95%的变量值。

()三、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。

A.全距B.标准差C.变异系数D.四分位间距E.方差2、用均数和标准差可以全面描述()资料的特征。

A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。

A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4、比较身高和体重两组数据变异度大小宜采用()。

A.变异系数B.方差C.极差D.标准差E.四分位间距5、偏态分布宜用()描述其分布的集中趋势。

A.算术均数B.标准差C.中位数D.四分位间距E.方差6、各观察值同乘以一个不等于0的常数后,()不变。

A.算术均数B.标准差C.几何均数D.中位数E.变异系数7、()分布的资料,均数等于中位数。

A.对数正态B.正偏态C.负偏态D.偏态E.正态8、对数正态分布是一种()分布。

(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9、最小组段无下限或最大组段无上限的频数分布资料,可用()描述集中趋势。

A.均数B.标准差C.中位数D.四分位间距E.几何均数10、血清学滴度资料最常用来表示其平均水平的指标是()。

A.算术均数B.中位数C.几何均数D.变异系数E.标准差11、中位数是表示变量值_______的指标。

医学统计学-第二章 统计描述

医学统计学-第二章 统计描述
变异系数(Coefficient of variation,CV)
1. 首先对资料作分布类型的判定; 2. 针对分布类型先用合适的指标描述:
均值、标准差;常记录为 X S
中位数、四分位间距; 常录为M(Ql, Qu)
一、集中趋势:用于描述一组计量资料的集中位置, 说明这种变量值大小的平均水平(average)表示。
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
2.揭示频数的分布类型
对称 分布
频数 分布
正偏
非对称 分布
负偏
集中部位在中部,两 端渐少,左右两侧的
基本对称,为对称 (正态)分布。
集中部位偏于较小 值一侧(左侧),较大 值方向渐减少,为
正偏态分布。
集中部位偏于较大 值一侧(右侧),较 小值方向渐减少,
为负偏态分布。
(2) 定量资料的描述指标
描述指标: 集中趋势:
累计频数 (4) 1 6 14 31 54 75 89 96 99 100 100
累计频率 (5) 0.01 0.06 0.14 0.31 0.54 0.75 0.89 0.96 0.99 1.00 1.00
频数分布图(frequency distribution figure) :
根据频数分布表,以变量值为横坐标,频数为纵坐 标,绘制的直方图。

医学统计学考题按章节第7题07分计量资料的统计描述

医学统计学考题按章节第7题07分计量资料的统计描述

因此,该地正常成年男性血红蛋白的 正常值范围为(12.014,16.045 ) g/dL 。

统计描血連拾标.TJ吗lid llixiing1QQ< 0 14.030013 7500Stii. Deviati on1 0282 :偏度采数 S kewnE 弱.044Std Error of公1Km-tQsis :喔度丟数Kurtosi s-.320 211, Err ox of4T0 Percentile :百分便?ere entilesL2 0L25£ 12 250025 13 250050 13 7500 75 14 7S0D£5 15 750097.5L6 2500因男性血红蛋白过多或过少均为异常,故按双侧估计, 下限:上限: + 1.96S = 14.03 + 1.96 X 1.0282 = 12.014X 1.0282 = 16.045 取95%界限:(g/dL ) (g/dL )五、其它30分(3~5道题目,每题6~10分)提供某一素材,可能要求:选择正确的统计方法并简述理由。

对错误进行分析,并予以纠正。

对某些数据、指标的含义作出正确的判断 正交试验表头设计及结果分析可能涉及范围:计量资料的统计描述、相对数应用注意事项,秩和检验,随访资料的生存分析,正交试验设计 方差分析。

【06真题、05真题】三、某市100名正常成人男性血红蛋白值(g/dL )频数分布表如下:(7分) 组段 11.5- 12.0- 12.5- 13.0- 13.5- 14.0- 14.5- 15.0- 15.5- 16.0- 频数 2671424121810341. 选用何种指标描述其 集中位置和离散程度 较好?为什么?2. 估计该地正常成年男性血红蛋白的 正常值范围。

SPSS 软件有关分析结果:【答案】jszb1、从SPSS 软件分析结果可知:偏度系数Skewness = 0.044 ;峰度系数 Kurtosis = -0.320 ;两个系数都小于 1,可认为近似于正态分布。

统计学-计量资料的统计描述方法

统计学-计量资料的统计描述方法

统计学-计量资料的统计描述⽅法计量资料的统计描述⽅法怎样表达⼀组数据?描述计量资料的常⽤指标—A 、描述平均⽔平(中⼼位置):均数X 、中位数和百分位数、⼏何均数G 、众数(mode ) B 、描述数据的分散程度:标准差、四分位数间距、变异系数、⽅差、全距(⼀)均数mean 和标准差standard deviation1. (算术)均数X均数是描述⼀组计量资料平均⽔平或集中趋势的指标。

*直接计算公式:12nXX X X X nn+++==∑L应⽤条件:适⽤于对称分布,特别是正态分布资料。

2. 中位数(median )M 和百分位数(percentile )A.中位数M是将⼀组观察值从⼩到⼤排序后,居于中间位置的那个值或两个中间值的平均值。

应⽤条件:⽤于任何分布类型,包括偏态资料、两端数据⽆界限的资料。

计算:n 为奇数时--1()2n M X+=n 为偶数时--()(1)2212n n M X X +?=+9⼈数据:12,13,14, 14, 15, 15, 15, 17, 19天B.百分位数是将N 个观察值从⼩到⼤依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。

中位数是第百分50位数。

四分位数间距(quartile range )= 第25百分位数(P25)~第75百分位数(P75)。

四分位数间距⽤于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的⼀半。

)(天155219===+X X M 8845122221415214.5()M X X X X ??==== +如果只调查了前⼋位中学⽣,则:+(+)(+)天百分位数计算(频数表法):(%)XX XL Xi P L nX f f =+-∑X L :第X 百分位数所在组段下限 L Σf :⼩于X L 各组段的累计频数 X i :第X 百分位数所在组段组距n :总例数 f x :所在组段频数注:有的教材X= r ;L f ∑=C例:求频数表的第25、第75百分位数(四分位数间距)组段频数f 累积频数∑f 56~ 2 2 59~ 5 762~ 12 19 ∑f 25 L 25 65~15 34 P 25在此68~ 25 5971~ 26 85 ∑f 75 L 75 74~19 104 P 75在此77~ 15 119 80~ 10 129 83~851 130130①确定Px 所在组段:P 25所在的组段:n X %=130×25%=32.5,65~组最终的累积频数=34,32.5落在65~组段内;P 75所在的组段:n X %=130×75%=97.5, 此值落在74~组段②确定Px 所在组段的X L 、X i 、f x 、L Σf ③ P 25=65+3x[(130x25%-19)/15]=65.90P 75=74+3x[(130x75%-85)/19]=74.66四分位数间距=65.90~74.66 (次/分)3.⼏何均数G (geometric mean )应⽤:适⽤于成等⽐数列的资料,特别是服从对数正态分布资料。

《医学统计学》统计描述 (1)

《医学统计学》统计描述  (1)

2500 2500 2500 420
500 500 500
甲 乙丙
例4-9,etc
1.极差(Range) (全距)
符号:R 意义:反映全部变量值的
R X max X min
变动范围。
580
优点:简便,如说明传染病、
560 540
食物中毒的最长、最短潜 520
伏期等。
500
缺点:1. 只利用了两个 极端值
表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布
转氨酶含量
人数
12~
2
15~
9
18~
14
21~
23
24~
19
27~
14
30~
11
33~
9
36~
7
39~
4
42~45
3
人数
25
20 15
10 5
0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
lg 表示以10为底的对数;
lg 1表示以10为底的反对数
X 0,为正值 (0,负数?)
几何均数的适用条件与实例
适用条件:呈倍数关系的等比资料或对数正态分 布(正偏态)资料;如抗体滴度资料
例 血清的抗体效价滴度的倒数分别为:10、
100、1000、10000、100000,求几何均数。
XG
lg1
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2. 描述计量资料的分布特征
①集中趋势(central tendency):变量值集中 位置。本例在组段“4.7~4.9”。

《医学统计学》计算题答案

《医学统计学》计算题答案

《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。

(2)描述离散趋势应选择何指标?并计算之。

(3)求该地正常成年女子血清甘油三酯的95%参考值范围。

(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。

(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。

Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。

(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。

某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。

计算过程根据公式s x 96.1±,即1.16±1.96×0.20。

该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学研究中有一类比较特殊的资料,如抗 体滴度等变量值呈倍数变化的数据,宜用 几何均数描述其平均水平。
适用资料: ①对数正态分布,原始数据偏态分布,经
对数变换后成正态分布的资料。 ②等比资料,即呈倍数变化的数据。例如
抗体滴度。
2020/12/16
计量资料的统计描述
21
几何均数的计算方法:
➢ 直接法 ➢ 加权法
计量资料的统计描述
24
2.加权法:
G
lg1
f lg
f
X
2020/12/16
计量资料的统计描述
25
举例:
IgG滴度倒数 40 80 160 320 640 1280
例数 3 22 17 9 0 1
G
lg
1
3
lg
40
22
lg
80
17
lg
160 52
9
lg
320
0
lg
1280
129.3
2020/12/16
2020/12/16
计量资料的统计描述
22
1.直接法:
G n X1 X2
Xn
写成对数形式 :
G
lg 1
lg
X1
lg
X
2 n
lg
X
n
lg 1
lg X n
2020/12/16
计量资料的统计描述
23
举例:
如上例:
G 10 2 2 4 48888 32 32 7
2020/12/16
M 160 10 (50 16) 164.5 20 2
2020/12/16
计量资料的统计描述
n
为偶数时,M
Xn2Βιβλιοθήκη X(n 2
1)
/
2
举例:2,4,5,6,7,8的中位数为5.5
2020/12/16
计量资料的统计描述
28
2.频数表法:
M L iM ( n f )
fm 2
其中L、i、f分别为M所在组段的下
限、组距和频数, f 为M所在组段之前
各组段的累积频数。
举例:以上面数据为例
5. 划记记数
2020/12/16
计量资料的统计描述
5
2020/12/16
计量资料的统计描述
6
2020/12/16
计量资料的统计描述
7
直方图(Histogram) 直观、形象地表示频数分布的形态和特征。
2020/12/16
计量资料的统计描述
8
频数分布的两个特征:
集中趋势
集中位置的描述,即大多数数值落 在什么位置,是现象共性的反映,是 现象规律性的数量上的表现。
标与离散趋势指标)
2020/12/16
计量资料的统计描述
11
第二节 集中趋势
我们用平均数(average)来描述集中趋 势,平均数是描述一组观察值集中位置 或平均水平的统计指标
2020/12/16
计量资料的统计描述
12
平均数 ➢ 算术均数
➢ 几何均数
➢ 中位数
2020/12/16
计量资料的统计描述
频数表(频数分布):表示各组及它们对应 的组频数的表格称为频数表或频数分布。
2020/12/16
计量资料的统计描述
4
频数表编制
1. 计算极差(全距):极差(R)=最大 值-最小值
2. 确定组数、组距:组距=R/组数, 医 学上组数一般在8-15组
3. 确定组限:组限[下限~上限) 4. 计算组中值
13
(一)算术均数(arithmetic mean)
➢ 算术均数:简称均数,用于说明一组观 察值集中位置或平均水平,是描述计量 资料的一种最常用的方法。
➢ 总体均数用μ表示,样本均数用 X 表示。 ➢ 适用资料:对称分布,尤其是正态分布
2020/12/16
计量资料的统计描述
14
算术均数的计算方法:
2020/12/16
计量资料的统计描述
19
举例:
测得10个人的血清滴度的倒数分别为2, 2,4,4,8,8,8,8,32,32,求平均 滴度
用算术均数来计算 :
X 2 2 4 4 8 8 8 8 32 32 10.8 10
2020/12/16
计量资料的统计描述
20
(二)几何均数(geometric mean, G)
计量资料的统计描述
26
(三)中位数(median, M)
把一组数值按大小顺序排列,位于中 间位置上数的值即为中位数。
适用资料:①任何分布,尤其偏态分布 ②分布类型不祥 ③末端无具体值
2020/12/16
计量资料的统计描述
27
1.直接法:
n 为奇数时,M X ( n1) 2
举例:2,4,5,6,7的中位数为5
计量资料的统计描述
主要内容:
1. 频数表 2. 集中趋势 3. 离散趋势 4. 正态分布 5. 医学参考值范围
2020/12/16
计量资料的统计描述
2
第一节 频数分布
频数表的绘制、直方图
频数分布的特点
频数分布的类型
频数分布的用途
2020/12/16
计量资料的统计描述
3
频数:当汇总大量的原始数据时,把数据按 类型分组,其中每个组的数据个数,称为该 组的频数。
➢ 直接法 ➢ 加权法
2020/12/16
计量资料的统计描述
15
1.直接法
当样本中变量值个数不多时,将变量 值相加再除以变量值个数(样本含量), 即得均数。
X X1 X2 n
Xn X
n
2020/12/16
计量资料的统计描述
16
举例:
➢ 计算5个同学的平均成绩,93, 92,95,94,91
X 92 93 95 94 91 93 5
2020/12/16
计量资料的统计描述
17
2.加权法(weighting method):
根据频数表计算均数的一种方法。当变 量值个数较多时,可先将原始数据列成 频数表,然后再做计算。
X X1 f1 X 2 f2 f1 f2
X n fn fX
离散趋势
离散趋势是描述一组数据的变异程
度或偏离集中位置的程度(参差不齐
的程度)
2020/12/16
计量资料的统计描述
9
频数分布的类型:
对称分布(正态分布、t分布)与偏态分布 (集中位置偏向左的一侧叫正偏态,反之 叫负偏态)
2020/12/16
计量资料的统计描述
10
频数表的主要用途:
1. 揭示分布类型 2. 发现可疑值 3. 方便进一步统计计算(计算集中趋势指
fn
f
其中X1、X2……Xn分别为各组段的组中值, 即本组段的上限与下限之和除以2
2020/12/16
计量资料的统计描述
18
举例:
身高
频数f
140~
1
150~
15
160~
20
170~
11
180~190
3
累积频数 1 16 36 47 50
组中值X 145 155 165 175 185
X 145115515 165 20 175111853 165 50
相关文档
最新文档