《医学统计学》统计描述 (2)

合集下载

医学统计学描述

医学统计学描述
将一组数据按从小到大的顺序排列为: x1(最小值), x2, …, xn(最大值)
分位数X*是介于x1(最小值)与xn(最大值)之间的 一个数值,它使得n个数据中的一部分观察值小于 或等于它,另一部分观察值大于或等于它。
x1
X*
xn
精选课件
13
如果将顺序排列的一组数据分为q个相等频数 的区间(即每个区间中有相同的数据个数),这 时共有q-1个分位点,则称这些分位点为q分位数。
精选课件
3
步骤:
求全距 R=max-min= 278.8-97.5=181.3
定组数 K 通常取8~15组为宜。本例取K=10.
求组距 I=R/K (注意取整)。 本例I=181.3/10=18.13≈20
制表
确定各组段的下限、统计各组段内的频 数、算出各组段的频率、累计频数、累计 频率,将所得数据填入表中。
1)全距: R=MAX-MIN 2)四分位数间距 :上下四分位数之差
Q=Q3-Q1
称为四分位数间距。
精选课件
22
3).方差
n 2
S2
1 n n1i1
(xi
X)2
n11in1
xi2
xi i1
n
4).标准差
S
1n n1i1 (xi
X)2
1
n
n1i1
xi2
n
xi
i1
n
2
5).变异系数
n
定义式: Gn xi i1
对 数 式 : Glg11ni n1lgxi
加 权 对 数 式 : Glg11 n flgx
精选课件
10
例2 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16, 1:32,1:32,1:64, 1:64,1:128,1:512。试计算其几 何均数。

医学统计学-第二章 统计描述

医学统计学-第二章 统计描述
变异系数(Coefficient of variation,CV)
1. 首先对资料作分布类型的判定; 2. 针对分布类型先用合适的指标描述:
均值、标准差;常记录为 X S
中位数、四分位间距; 常录为M(Ql, Qu)
一、集中趋势:用于描述一组计量资料的集中位置, 说明这种变量值大小的平均水平(average)表示。
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
2.揭示频数的分布类型
对称 分布
频数 分布
正偏
非对称 分布
负偏
集中部位在中部,两 端渐少,左右两侧的
基本对称,为对称 (正态)分布。
集中部位偏于较小 值一侧(左侧),较大 值方向渐减少,为
正偏态分布。
集中部位偏于较大 值一侧(右侧),较 小值方向渐减少,
为负偏态分布。
(2) 定量资料的描述指标
描述指标: 集中趋势:
累计频数 (4) 1 6 14 31 54 75 89 96 99 100 100
累计频率 (5) 0.01 0.06 0.14 0.31 0.54 0.75 0.89 0.96 0.99 1.00 1.00
频数分布图(frequency distribution figure) :
根据频数分布表,以变量值为横坐标,频数为纵坐 标,绘制的直方图。

医学统计学课后习题答案解析

医学统计学课后习题答案解析

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。

医学统计学2. 定量数据的统计描述

医学统计学2. 定量数据的统计描述
n 10, X 75 76 72 698, X2 752 762 722 48984
S 48984 6982 /10 5.41 10 1
5. 变异系数(CV)
变异系数,标准差和均数比值,多用于观察 指标单位不同
如身高与体重的变异程度的比较;或均数 相差较大时,
如儿童身高与成人身高变异程度的比较。
如何有效地组织、整理和表达数据的信息?
浙江中医药大学考试成绩登记表
1. 频数表
频数表:同时列出观察指标的可能取值区间及 其在各区间内出现的频数。
2.频数图
直观、形象地表示频数分布的形态和特征。
频数表制作过程
1.确定组数k:通常选择在8~15之间 2.确定组距: 参考组距为R/k , R为全距 3.确定组限 : 应符合专业习惯 4.确定频数:划记或由软件完成
一端或两端存在着无确切数值的资料。
举例
如由例2.4 算出,50岁~60岁正常女性血清甘油
三脂含量的百分位数P75和P25的位置分别为63.2
mg/dl和135.7 mg/dl,则 :
Q 135.7 63.2 72.5(mg/dl)
3. 方差 (Variance)
为了利用每个观察值的信息,可计算平均偏差
常值 可用各组段的频率作为概率的估计值
用途:考察分布的类型
对称分布 :
若各组段的频数以频 数最多组段为中心左右两 侧大体对称,就认为该资 料是对称分布
如:人体一些生化指标 (血清总胆固醇)、身 高、体重等的分布
偏态分布 :
1)正偏态分布: 高峰左偏,频数向右侧
拖尾
如:人体中一些重金属 (发汞、尿铅)的分布, 血清转氨酶等。
S CV 100%
X
例2-8

《医学统计学》计算题答案

《医学统计学》计算题答案

《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。

(2)描述离散趋势应选择何指标?并计算之。

(3)求该地正常成年女子血清甘油三酯的95%参考值范围。

(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。

(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。

Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。

(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。

某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。

计算过程根据公式s x 96.1±,即1.16±1.96×0.20。

该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。

《医学统计学》第四章定性资料的统计描述

《医学统计学》第四章定性资料的统计描述

1、不要把构成比与率相混淆。即分析时不能以构成 比代率;这是常见的错误。
某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年 龄增大而减少。该作者把构成比当作率进行分析,犯了以比代率的错误。
2、使用相对数时分母不宜过小。分母过小时相对数 不稳定。
3、注意资料的可比性;
不同时期、不同地区、不同条件下的资料比较时应注意具有 可比性。
12965.2
46.3

265
660291.4
40.1
说明该地市区非吸烟女性饮酒者的肺癌发病率是
非吸烟女性不饮酒者的1.15倍。
3.比数比
比数比( Odds ratio ,OR) : 常用于流行病学
中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为
一般的,两个地方的出生率、死亡率、发病率、不同级别 医院某病的治愈率等不能直接比较。
无可比性的实例:
由表2-7可见,无论有无腋下淋巴结转移,省医院的5年生存 率均高于市医院,但从总生存率看,省医院的5年生存率低于市 医院。这不符合常理。因此,省医院与市医院的总生存率就不能 直接比较(标准化后再比)。
感谢聆听

某事物或现象发生的实 际数 某事物或现象发生的所 有可能数
比例基数
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则

《医学统计学》第1-2章

《医学统计学》第1-2章
21
常用平均数的意义及其应用场合
平均数
意义
应用场合
均数 平均数量水平
几何均数 平均增减倍数
中位数 位次居中的观 察值水平
应用甚广,最适用于对称分布, 特别是正态分布
①等比资料;②对数正态分布 资料
①偏态资料;②分布不明资料; ③分布一端或两端出现不确定 值
22
1. 均数 (mean):
, X
应用:正态分布或近似正态分布的定量资料。
女 B 14.67 37.8
疗效
显效 有效 有效 无效
男B
16.80
37.6 无效
标识变量
用于数据管理
分析变量-表示试验效应或观察结果大小的
分组变量
变量或指标
反应变量
5
处理 复方哌唑嗪 复方降压片 安慰剂
合计
表 3.8 三种药物治疗高血压的疗效
有效
无效
合计
有效率(%)
35
5
40
87.50
20
10
30
15
定量资料的频数表和频数图(直方图)
表2.2 某市120名5岁女孩 身高频数表
组段(cm)
频数(f)
95-
1
98-
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
图2.1 某市城区120名5岁女孩身高频数分布
16
1、 频数分布的特征
如何选用正确的统计指标描述一个定量 资料?
14
第一节 频数分布

第二章 统计描述习题 医学统计学习题

第二章 统计描述习题 医学统计学习题

第二章统计描述习题一、选择题1.描述一组偏态分布资料的变异度,以()指标较好。

A.全距B.标准差C.变异系数D.四分位数间距E.方差2.各观察值均加(或减)同一数后()。

A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对3.偏态分布宜用()描述其分布的集中趋势。

A.算术均数B.标准差C.中位数D.四分位数间距E.方差4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是()。

A.标准差B.标准误C.全距D.四分位数间距E.变异系数5.测量了某地152人接种某疫苗后的抗体滴度,宜用()反映其平均滴度。

A.算术均数B.中位数C.几何均数D.众数E.调和均数6.测量了某地237人晨尿中氟含量(mg/L),结果如下:尿氟值:0.2~0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~频数:7567302016196211宜用()描述该资料。

A.算术均数与标准差B.中位数与四分位数间距C.几何均数与标准差D.算术均数与四分位数间距 E.中位数与标准差7.用均数和标准差可以全面描述()资料的特征。

A.正偏态资料B.负偏态分布C.正态分布D.对称分布E.对数正态分布8.比较身高和体重两组数据变异度大小宜采用()。

A.变异系数B.方差C.极差D.标准差E.四分位数间距9.血清学滴度资料最常用来表示其平均水平的指标是()。

A.算术平均数B.中位数C.几何均数D.变异系数E.标准差10.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。

A.均数B.标准差C.中位数D.四分位数间距E.几何均数11.现有某种沙门菌食物中毒患者164例的潜伏期资料,宜用()描述该资料。

A.算术均数与标准差B.中位数与四分位数间距C.几何均数与标准差D.算术均数与四分位数间距 E.中位数与标准差12.测量了某地68人接种某疫苗后的抗体滴度,宜用()反映其平均滴度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

36 104 140
疾 病 组 的 暴 露 比 数 a / c 34 88
OR
93.5(倍 )
对 照 组 的 暴 露 比 数 b / d 2 16
(二)比率(proportion)
比率(P57): 分子分母都是绝对数,且分子必须是分
母的一部分。无量纲,[0,1] 。
1.率(rate)(强度相对数)
住院号 2025655 2025653 2025830 2025677 2025647 2025848 2019915 2025861 2024601 2000386
年龄 27 22 25 24 30 32 27 29 25 26
职业 无 无 管理人员 知识分子 管理人员 无 无 无 农民 无
文化程度 中学 小学 大学 中学 大学 小学 中学 大学 中学 小学
( 表 5-3 ) 进 行 了 分 析 , 得 出 40~49 岁 组 患 病 率 高 , 0~9岁组和70岁及以上组患病率低的结论。
1、不能以构成比代替率。 2、计算相对数的分母不宜过小。小则 直接叙述。 3、进行率的对比分析时,应注意资料 可比性。如 比较疗效时,比较组间应 病情轻重相同,性别影响,应按性别 分组后再作比较。
第三节 计数资料的常用 统计指标
一、计数资料的数据整理
二、常用相对数指标
三、应用注意事项
计数资料(分类资料): 总体:有限或无限个定性(分类)变量值
样本:从总体中抽取的n 个定性(分类)变量值
整理为:分类个体数,即:计数资料频数表
绝对数
一、计数资料的数据整理
计数资料:按某种属性分类,然后清点每类 的数据(以下是:孕妇分娩资料)
(1)观察对象是否同质,研究方法是否相同,观 察时间是否相等,以及地区、周围环境、风俗习惯 和经济条件是否一致或相近等。
(2)观察对象内部结构是否相同,若两组资料的 年龄、性别等构成不同,可以分别进行同年龄别、 同性别的小组率比较或对总率(合计率)进行标准 化后再作比较。
表5-4 甲、乙两种疗法治疗某病的治愈率比较
分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
9
2
22 28
7
24 50
34
26 50
43
28 34
35
2 两个率之比:如相对危险度(RR)。
R p1
p 2
例 如某地某年龄组男性吸烟和非吸烟的冠心病
死亡资料如表7-2,试分析其相对危害度。
表7-2 某地某年龄组男性吸烟和非吸烟的冠心病死亡资料
吸烟组
非吸烟组



104
12
观察人年数
43248
10673
死 亡 率 ( 1/10 万 人 年 )
240.5
相对数:两个有联系的指标之比,常用的相对数有: 一、相对比 二、比率 三、速率
(一)相对比
相对比简称比,是两个有关指标之比,说明 两指标间的比例关系。
计算公式为
A指标 R
B指标
式中两指标可以是绝对数、相对数或平均数。
1 两个绝对数之比:
A 类发生例数 R
B 类发生例数
如某年某医院出生婴儿中,男性婴儿为370人, 女 性 婴 儿 为 358 人 , 则 出 生 婴 儿 性 别 比 例 为 370/358×100 = 103,说明该医院该年每出生100 名女婴儿,就有103名男性婴儿出生,它反映了男 性婴儿与女性婴儿出生的对比水平。
30 11
14
32 14
2
34
4
2
36
2
1
38
3
1
40
0
0
合计 207 141
6
10
18
0
45
10
24
70
11
150
28
52
153
44
361
25
45
133
70
366
10
34
78
57
248
11
22
39
17
114
3
14
24
3
60
5
பைடு நூலகம்
3
12
2
28
1
4
5
1
14
1
0
2
1
8
2
0
0
0
2
102
208 537 206 1401
11 2 .4
240.5
R
2.139
112.4
说明男性吸烟组的冠心病死亡率是非吸烟组的2.139倍。
3 两个相对比之比:如流行病学常用的比数比(OR)。
例 服用反应停与肢体缺陷关系病例对照研究资料如表7-3所示:
服用反应停
畸形儿组
对照组
合计
有 无 合计
34(a) 16(c) 50
2(b) 88(d) 90
2.构成比(proportion):
表示事物内部某一部分的个体数与该事物 各部分个体数的总和之比,用来说明各构成 部分在总体中所占的比重或分布。
通常以100%为比例基数。其计算公式为
某一组成部分的观察单位数
构成比
100%
(
同一事物各组成部分的观察单位总数
如:教研室16人高级职称有4人,占
25%;中级职称有8人,占50%;初级职
P58 例4-14
三、应用注意事项
表5-3 口腔门诊龋齿患者年龄构成
年龄组(岁) 患者人数
患者构成比(%)
0~
9
3.8
10~
36
15.3
20~
34
14.4
30~
37
15.7
40~
45
19.1
50~
39
16.5
60~
21
8.9
70~
15
6.3
合计
236
100.0
例如某医师对口腔门诊不同年龄龋齿患病情况
说明某现象或某事物发生的频率或强度。
率=(实际发生数/可能发生总数)×比例基数 如:治愈率、病死率、阳性率、人群患病率等
比例基数:100%、1000‰、10000/万、100000(1/10万) 等 (按习惯,使结果保留1-2位整数)
例如:患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以 十万分率表示。
称有4人,占25%。
构成比有两个特点:
(1)说明同一事物的k个构成比的总和应 等于100%,即各个分子的总和等于分母。
(2)各构成部分之间是相互影响的,某 一部分比重的变化受到两方面因素的影响。 其一是这个部分自身数值的变化,其二是 受其它部分数值变化的影响。
(三)速率(rate):
P58 分母中含有时间量纲。
二、常用相对数
绝对数:通过调查或实验得到的原始数据。如某病的出院人数、治 愈人数、死亡人数等。 但绝对数通常不具有可比性: 1. 如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡 人数没有意义 2. 如2007级附一、附二、附三三个临床学院人数不同时,比较各班 医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数
相关文档
最新文档