[医学]研究生班医学统计学-计数资料
合集下载
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
医学统计学第5章计数资料的统计描述

恶性肿瘤
循环系统疾病 呼吸系统疾病 消化系统疾病 传染病 合计
58
44 37 19 32 190
30.53
23.16 19.47 10.00 16.84 100.00
40
44 29 18 18 149
26.85
29.53 19.46 12.08 12.08 100.00
这里可看到构成比有两个特点: (1)说明同一事物的k个构成比的总和应等于 100%,即各个分子的总和等于分母。 (2)各构成部分之间是相互影响的,某一部分 比重的变化受到两方面的影响。其一是这个部 分自身数值的变化,其二是受其他部分数值变 化的影响。
表2
科室
内科 外科 传染科 合计
某年某医院各科室病人数及死亡数
死亡数
40 30 20 90
住院病人数
1000 600 400 2000
病死率%
4.0 5.0 5.0 4.5
死亡病人 构成%
44.5 33.3 22.2 100.0
相 对 比(ratio)
概念:是指两个有联系的指标之比,是对比的最简 单形式。 计算公式:A、B两个指标,A/B(或100%) 若干倍或百分之几。 性别比、CV等。
患病人数 (3) … … … … 322
表 5-8 按式(5-6)用间接法计算标准化患病率(%)
年龄组 标准患病 率 城市
人口数 (岁) Pi ni 预期患病 人数 niPi
农村
人口数 Ni 预期患病 人数 niPi
(1)
50~ 60~ 70~ 80及以上 合计
(2)
21.3 46.1 65.5 71.7 42.1
第二节 应用相对数的注意事项
分母不能太小 比与率不能混用 合并率(总率)的计算 可比性 抽样误差——假设检验
医学研究生医学统计学定性资料的统计描述

百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
针刺合谷治疗胃痛的效果
疗效 治愈
例数 59
百分 比
(%)
60.82
有效
23
23.71
无效
15
合计
97
15.46
100.0 0
治愈 有效 无效
二、定性资料的描述指标 ——相对数(Relative number)
相对数:两个有联系的指标(数值)之比
相对比 A B
A和B可以是绝对数、平均数,也可以是相对数 A和B的量纲可以相同,也可以不同 A和B彼此分离,互不重叠或包含
如:人口出生性别比;每千人口的医生数、每千 人口的病床数、每医生的门诊工作量、变异系 数等。
人口出生性别比国际上一般以每出生100个女
性人口相对应出生的男性人口的数值来表示。 一般在102~107之间。
频率型指标
某 病 病 死 率 = 同 同 年 年 某 患 病 该 死 病 亡 总 人 数 数 100 %频率型指标
发病率(incidence rate,IR)表示一定时期 内,在可能发生某病的一定人群中新发生某病 的强度。
患病率(prevalence rate, PR)又称为现患 率,指某时点上受检人数中现患某种疾病的频 率,患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。
医学研究生医学统计学定性资 料的统计描述
相关概念
定性资料是指将观察单位按照某种属性或类
别进行分组,然后计数各组的观察单位个数 所收集的资料。
根据变量类别之间是否有顺序、等级、大小 关系,分为无序分类变量资料和有序分类变 量资料。
中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d
医学统计学课件:第5章 计数资料的统计描述

5.00 ~
5
3.02 3.70 4.33 3.29 3.25 4.15 4.36
5.30~
2
4.95 3.00 3.26
5.60 ~5.90
1
2020/10/18 5
第五章 计数资料的统计描述
计数资料及其频数表
14名成人的原始数据
14名成人的婚姻状况
编号 性别 身高 婚姻状况
婚姻状况
频数
1 男 175
说明该医院该年每出生100名女婴,就有103名 男婴出生;
男婴与女婴出生的对比水平。
说明此医院女婴出生相对较多,是否有统计学 意义,应作进一步分析。
联合国,明确认定了出生性别比的通常值域 为102~107之间,其他值域则被视为异常。
2020/10/18 19
第五章 计数资料的统计描述
常用相对数
表 5-1 某医院 1990 年和 1998 住院病人的五种疾病死亡人数和构成比
疾病构成
1990 年 死亡人数 构成比(%)
1998 年 死亡人数 构成比(%)
恶性肿瘤
58
循环系统疾病
44
呼吸系统疾病
37
消化系统疾病
19
传染病
32
30.53 23.16 19.47 10.00 16.84
40
26.85
常用相对数
相对数
相对数,relative number 相对数是两个有关的绝对数之比,也可是两个统
计指标之比。通常用百分比、千分比或万分比等表
示,如:每千人中的发病数,每百名某病患者的死
亡人数等。
相对数的意义
计算相对数的意义是把基数化做相等,便于相互
比较。
1.消除基数影响,便于事物间的比较。
医学统计学-计数资料的统计描述

构成比有两个特点:
表5-1中,1990与1998年住院病人五种疾病死因构成的总和均为100%。
01
1998年呼吸系统疾病死亡人数比1990年少,但构成比却比较接近;再看两年的循环系统疾病死亡人数相同,而1998年的构成比却较1990年高,这不能说明1998年循环系统疾病的病死严重程度较1990年高。
01
但值得注意的是所计算的相对数一般都是构成比,不能当作率来分析。
02
正确计算合计率 对分组资料计算合计率或称平均率时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算。
C.[(30+30)/(150+100)]×100%=24%。 A.20%+30%=50% B.(20%+30%)/2=25%, 甲乙两医院某病治疗情况比较
单位
总数
治愈
治愈率
甲医院
150
30
20%
乙医院
100
30
30%
合 计
250
60
?
表 某地妇女各年龄组宫颈癌患者构成比及患病率
年龄
危险人数
患者数
构成比
百万患病率
30以下
100000
3
1.2
0.3
30-
96667
29
11.2
3.0
40-
63000
82
31.8
13.0
50-
24000
96
37.2
40.0
Dynamic series
outline
常用的相对数: 一、率。 二、构成比 三、相对比
单击添加副标题
第五章 计数资料的统计描述
计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。 但绝对数通常不具有可比性: 如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义 如00级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数。
表5-1中,1990与1998年住院病人五种疾病死因构成的总和均为100%。
01
1998年呼吸系统疾病死亡人数比1990年少,但构成比却比较接近;再看两年的循环系统疾病死亡人数相同,而1998年的构成比却较1990年高,这不能说明1998年循环系统疾病的病死严重程度较1990年高。
01
但值得注意的是所计算的相对数一般都是构成比,不能当作率来分析。
02
正确计算合计率 对分组资料计算合计率或称平均率时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算。
C.[(30+30)/(150+100)]×100%=24%。 A.20%+30%=50% B.(20%+30%)/2=25%, 甲乙两医院某病治疗情况比较
单位
总数
治愈
治愈率
甲医院
150
30
20%
乙医院
100
30
30%
合 计
250
60
?
表 某地妇女各年龄组宫颈癌患者构成比及患病率
年龄
危险人数
患者数
构成比
百万患病率
30以下
100000
3
1.2
0.3
30-
96667
29
11.2
3.0
40-
63000
82
31.8
13.0
50-
24000
96
37.2
40.0
Dynamic series
outline
常用的相对数: 一、率。 二、构成比 三、相对比
单击添加副标题
第五章 计数资料的统计描述
计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。 但绝对数通常不具有可比性: 如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义 如00级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数。
医学统计学课件--第五章 计数资料的统计描述(第5章)_OK

(Nipi) (6) = (2)(5)
65.0
260
41.7
167
—
427∑Nipi
甲疗法标准化治愈率
p'
380 100% 47.5% 800
53.8%
乙疗法标准化治愈率 p' 427 100% 53.4% 47.5%
2021/9/17
800
23
(二)间接法(以死亡率为例)
选择年龄别死亡率作标准
1998 年医学期刊中统计学方法的应用情况*
统计学方法
应用例数 误用例数 应用率(%) 误用率(%)
统计表
10295 1413
127.48
17.50
统计图
2283
327
28.27
4.05
平均指标
3687
51
45.65
0.63
变异指标
3210
50
39.75
0.62
相对数
3081
97
38.15
1.20
病型
甲疗法
病人数 治愈数 治愈率(%)
乙疗法 病人数 治愈数 治愈率(%)
普通型 35 35.0
300 125 41.7
合 计 400 215 53.8
400 190 47.5
2021/9/17
20
二、标准化率的计算
标准化方法 1.直接法(被标化组有年龄别××率) 2.间接法(被标化组缺乏年龄别××率)
三、应用标准化时的注意事项
1.标准化法只适用于某因素两组内部构成不同,并有可能影响两组总率比较的情况。对 于因其它条件不同而产生的不具可比性的问题,标准化法不能解决。
2.由于选择的标准人口不同,算出的标准化率也不同。当比较几个标准化率时,应采用 同一标准人口。
医学统计学-计数资料的统计描述

02
相对频数的计算公 式
相对频率 = (某组的频数 / 所有 观察值的总数) × 100%。
03
相对频数分布的应 用
用于比较不同组别之间的相对大 小关系,特别是在样本量差异较 大时。
集中趋势的描述:平均数、中位数、众数
平均数
所有观察值的总和除以观察值的数量,反映 数据的平均水平。
中位数
将数据从小到大排序后,位于中间位置的数 值,反映数据的中心位置。
总结词
Logistic回归分析是一种用于处理因变量 为分类变量(通常是二分类)的统计方 法。
VS
详细描述
Logistic回归分析通过建立数学模型,将 自变量与因变量的关系转化为概率形式, 从而预测因变量的发生概率。它广泛应用 于医学、经济学、社会学等领域,尤其在 医学研究中,常用于疾病发生风险的预测 和诊断模型的建立。
Spearman秩相关与Kendall秩相关
Spearman秩相关和Kendall秩相关是两种常用的非参数相关分析方法, 适用于处理等级数据。
Spearman秩相关是根据变量的秩次来计算相关系数,反映两个变量之间 的线性关系。
Kendall秩相关则是基于排序数据中相邻数据的变化情况来计算相关系数, 反映两个变量之间的单调关系。
1 2 3
早期发展
计数资料统计描述起源于早期的统计学研究,最 初主要用于人口普查和农业统计等领域。
近代发展
随着计算机技术的进步和统计学理论的不断完善, 计数资料统计描述的方法和手段得到了极大的丰 富和发展。
未来趋势
随着大数据时代的到来,计数资料统计描述将更 加注重自动化、智能化和可视化,以提高数据处 理和分析的效率和准确性。
计数资料统计描述的重要性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
71.43 46.15 166.67 16.67
0 0 10.00
49.97
相对比
• 概念:相对比是两个有关联指标之比,用以描述 两者的对比水平,常用R表示。
• 计算公式:
R
A指 标 B指 标
• 注意:A大于B用倍数表示,A小于B时用百分数表 示
相对比的种类
• 1.两类个体例数之比
R
A类发生的例数 B类发生的例数
率
• 概念:率是表示某种现象发生的频率和强度,常以百 分率(%)、千分率(‰)、万分率(/万)、十万分 率(/10万)等表示
• 计算公式:
率某某 事事 物物 或或 现现 象象 有 发际 发 可 生数 生 能 的的 比 数 所实 例基数
• 注意:比例基数”通常依据习惯而定,治愈率、感染 率用百分率,出生率、死亡率用千分率,某些疾病的 死亡率用十万分率。
某医院某月各科室住院病人数及死亡人数
科室 (1)
病人数 病死人数 死亡构成(%) 病死率(‰)
(2)
(3)
(4)
(5)
内科
350
25
外科
650
30
肿瘤科
120
20
妇产科
300
5
皮肤科
56
0
眼科
45
0
小儿科
100
1
合计
1621
81
30.86 37.04 24.69
6.17 0 0
1.24
100.00
risk简写为RR )。
相对比的种类
• 3.两个相对比之比
•
临床医生欲探索某病的病因,在以医院病例为基础作病例对
照研究时,一般不能计算出RR,但可以计算出疾病组暴露比数与
对照组暴露比数之比,称之为比数比或优势比(odds ratio简写
为OR)
• 服用反应停与肢体缺陷关系病例对照研究
服用反应停 畸型儿组 对 照 组 合计
标准
构成 人数
西医疗法组 原治愈率(%) 预期治愈数
80
60
48
80
40
32
40
20
8
合 计 200
88
中西 医 结 合 疗 法组
原治愈率(%) 预期治愈数
65
52
45
36
25
10
98
西医疗法组标准化后的总治愈率为:
中西医结合疗法组标准化后的总治愈率为:
P'8810% 044 % 200
可见,中西医结合疗法组标化后的总治愈率高于西医 疗法组标化后的总治愈率。
• 某地某年龄组男性吸烟和非吸烟的冠心病
死亡资料下表所示,试分析其相对危害度。
分组 吸烟组 非吸烟组
死亡数 观察人年数 死亡率(1/10万人年)
104
43248
240.5
12
10673
112.4
RR = 240.5/112.4 = 2.139
说明男性吸烟的冠心病死亡率是不吸 烟的死亡率的2.139倍。这种指标在流行 病学研究中称为相对危险度(relative
病型
普通型 重率(%)
60
36
60
20
8
40
20
4
20
100
48
48
中西医结合疗法组 病例数 治愈数 治愈率(%)
20
13
65
60
27
45
20
5
25
100
45
45
实例计算
将上表资料中的两组同病型的人数之和作为标 准构成 ,计算如下:
病
型
普通型 重型 暴发型
u0.05/2 1.96
1
p
n
查表法 (n50,特别是p接近于0或1时)
例
• 为了解某药的疗效,对100名患者治疗的结 果进行调查,结果为80人有效,有效率为 80%。
• 则样本率的抽样误差为:
S pP (1 n P )0 .8( 1 1 0 0 0 .8) 0 0 0 .0 4 4 %
• 其总体率95%的可信区间为:
差,对于样本之间的差异应作统计学检验
率的标准化
率的标准化(standardization)是为了 在比较两个不同人群的患病率、发病率、死亡 率等资料时,消除其内部构成(如年龄、性别、 工龄、病程长短等)的影响。如年龄会影响死 亡率,年龄越大,死亡率可能越大;病情越重, 越难治愈,治愈率就越低。
率的标准化
使用 未使用
合计
34(a)
2(b)
36
16 (c)
88(d)
104
50
90
140
O R 疾 对 病 照 组 组 的 的 暴 暴 露 露 比 比 数 数b a//d c
ad bc
本例
OR 34 88 93.5 2 16
相对数使用应注意的问题
• 不要把构成比与率相混淆 • 使用相对数时,分母不宜过小 • 要注意资料的可比性 • 要注意使用率的标准化 • 比较两个样本率或构成比时,应考虑存在抽样误
• 如 我 国 1982 年 人 口 普 查 的 男 性 人 口 数 为
519433369 , 女 性 人 口 数 为 488741919 人 ,
求人口数的男女比例。
R = 519433369/488741919 = 1.063
人口数的男女比为1.063:1。
相对比的种类
• 2.两个率之比
R
P1
P2
医学统计学(研究生班2011)
分类变量资料
分类变量(计数)资料
在临床研究的统计资料中,除了前述的 计量资料外,还有阴性和阳性、有效和无效、 治愈和未治愈、死亡与未死亡及各种疾病的 分类等。
分类变量(计数)资料的统计描述
1. 绝对数: 某病用A法治疗100人,有效80人;B法治疗 150人, 有效100人。 若仅用绝对数80人和 100人比较会得到B法比A法 好的错误结论。
P' 9810% 049 % 200
标准化直接法的计算步骤
1.选取标准构成。标准构成选取方法有三种: (1)另外选取一个包含比较各组(如各地区)的有代 表性的、较稳定的、数量较大的构成为标准。如世界 的、全国的、全省的数据为标准构成。 (2)取比较各组的各层例数的合计为标准构成。 (3)从比较的各组(如各地区)中任选其一的构成作 为标准构成。
标准化直接法的计算步骤
2.在标准构成下,以原分层率计算各组的 预期发生数。 3.计算标准化率。
计数数据的主要分布
• 二项分布 • 泊松分布 • 负二项分布
分类变量(计数)资料的统计推断 ——总体率的估计
• 点估计 p
• 区间估计
正态近似法(n≥50且np≥5,n(1-p) ≥5)
(P uSp,P uSp)
• 各率相互独立,其之和不为1(如是则属巧合)
构成比
• 概念:又称构成指标,表示事物内部各个组成部 分所占整体的比重,通常以100%为比例基数,以 百分比表示
• 计算公式:
构 成 比 其 各 中 组 一 例 组 数 例 之 数 和 100%
• 注意:各组成部分的构成比之和为100%,某一部分比重
增大,则其它部分相应减少。