计数资料的统计分析
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的基本统计方法

0.6520 0.0909 0.0934 0.0768 0.0534 0.0335 1.0000
0
0 1725819 0.6580
12
4.9 289298 0.1103
91 36.2 250480 0.0955
307 148.3 191204 0.0729
460 319.7
114355 0.0436
292 323.5
51670 0.0197
1162 43.12 2622826 1.0000
0 25 125 344 371 170 1035
0 8.6 49.9 179.9 324.4 329.0 39.46
(1)直接法:
•选择标准组的方法 1)大范围内的人口资料 2)两组年龄段人口合并 3)以其中一组为标准组,对另一组作标准化
小鼠存亡的组合方式 死亡数(x) 生存数(n-x)
排列方式 甲乙丙
每种组合的概率
0
3
1
2
2
1
3
0
生
生
生 0.2× 0.2× 0.2 =0.008
死
生
生 0.8 × 0.2 × 0.2
生
死
生 0.2 × 0.8 × 0.2
生
生
死 0.2 × 0.2 × 0.8 } = 0.096
死
死
生 0.8 × 0.8 × 0.2
死
生
死 0.8 × 0.2 × 0.8
生
死
死 0.2 × 0.8 × 0.8 } = 0.384
死
死
死 0.8 × 0.8 × 0.8 = 0.512
P = 1.000
(0.2 +0.8)3=(0.2)3 + 3(0.8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3 三生 二生一死 一生二死 三死
计数资料常用的统计学方法

计数资料常用的统计学方法
对计数资料常用的统计学方法
一、假设检验:
1. Z检验:通过比较一组计数资料与总体分布的拟合程度,来检验样本数据和全体总体数据之间是否存在显著差异。
2. t检验:通过比较两组独立计数资料之间的拟合程度,来检验样本数
据和全体总体数据之间是否存在显著差异。
3. F检验:通过比较多组相同样本的拟合程度,来确定至少有一个处于未知实际总体中的样本均值是和其它样本有显著差别的。
二、数据可视化:
1. 直方图:通过显示计数资料的直方图来表示资料的分位数、最小值、中位数、最大值,以及数据的分布形态。
2. 折线图:利用折线图表示计数资料在比较不同因素因素下的差异情况。
3. 饼图:可以通过饼图展示一组计数资料的比例或结构情况,可以从
整体上窥视计数资料分布情况。
三、贝叶斯统计:
1. 条件概率:又称为贝叶斯定理,通过根据计数资料计算概率,来确
定事件的可能性大小,进而推断概率的变化趋势,以帮助更好地决策。
2. 统计重要性:根据计数资料中的关联性,来发现事件和趋势之间的关系,从而实现计算特定变量的重要性。
3. 模型选择:根据计数资料中各变量的相关性,来判断模型的正确性和可行性,以便判断数据的有效性。
2.spss应用(计数资料分析、非参数检验、统计图绘制)

配伍组设计的秩和检验:例题8-9(P143) Analyze→nonparametric tests →k related samples
→test variables:变量1、变→ok
三、统计图的绘制
1.直条图、误差条图 2.圆图
3.线图、半对数线图
配对四格表资料的2检验:例题7-3(P114)
Data→weight cases → weight cases by: frequency variable:f →ok analyze→descriptive statistics →crosstabs … : row: 法一 column:法二 statistics →选择McNemar →continue →ok
实例分析
P112 P114 P114 P116 P117 P119 P119 P120 例7-1 例7-2 例7-3 例7-4 例7-5 例7-6 例7-7 例7-8
二、非参数检验
配对设计的符号秩检验:例题8-1(P132)
Analyze→nonparametric tests
→2 related samples
例题7-1(P112)数据输入的格式: 组别:分组变量 1-试验组 2-对照组 疗效: 1-有效 0-无效 f:表示频数 组别 1 1 2 2 疗效 1 0 1 0 f 99 5 75 21
1 2 3 4
四格表资料的2检验:例题7-1(P112)
Data→weight cases → weight cases by: frequency variable:f →ok analyze →descriptive statistics →crosstabs … : row: 组别 column:疗效 statistics →选择chi-square →continue → ok
计数资料 两组比较 统计学方法

计数资料两组比较统计学方法计数资料是指能够用数字进行计算和比较的数据,例如频数、比率、百分比等。
在统计学中,比较两组计数资料是非常常见的。
本文将探讨两组计数资料的比较和应用统计学方法进行分析的方法。
一、比较两组计数资料的方法1.绝对数比较法绝对数比较法是比较两组计数资料中,某一指标的绝对数的大小。
例如,两组人群中的患病人数的大小比较,通过比较得出哪一组人的患病率更高。
这种方法的优点在于简单易行,但无法对数据进行标准化,无法消除其他因素的影响。
2.比率比较法比率比较法是通过两组计数资料中某一指标的比率进行比较。
例如,两组人群中男女比例的大小比较,通过比较男女比例的大小得出哪一组男女比例更接近。
这种方法具有较高的精度和客观性,但是需要进行标准化才能比较数据。
3.标准化比较法标准化比较法是通过将两组计数资料进行标准化处理后进行比较。
例如,将两组人群的男女比例标准化,通过比较标准化后的数据得出哪一组男女比例更接近。
这种方法可以消除因素的影响,具有更高的精度和客观性。
二、应用统计学方法进行分析在比较两组计数资料时,还可以应用统计学方法进行进一步分析。
常用的统计学方法包括:1.卡方检验卡方检验是一种用于比较两个或多个分类变量的方法。
以两组人群为例,可以通过卡方检验来比较这两组人群中男女比例是否有显著差异。
如果差异是显著的,则说明这两组人群男女比例不一致。
2. t检验t检验是一种用于比较两组数值型变量的方法。
例如,可以通过t检验来比较两组人群的年龄分布是否有显著差异。
如果差异是显著的,则说明这两组人群年龄分布不一致。
3.方差分析方差分析是一种用于比较三个或更多组数值型变量的方法。
例如,可以通过方差分析来比较三个不同城市中的日均气温是否有显著差异。
如果差异是显著的,则说明这三个城市的气温日均值不同。
结论在比较两组计数资料时,需要根据不同情况选择不同的比较方法。
在进行分析时,可以应用统计学方法来分析数据,从而得出更准确的结论。
医学统计学-计数资料的统计描述

02
相对频数的计算公 式
相对频率 = (某组的频数 / 所有 观察值的总数) × 100%。
03
相对频数分布的应 用
用于比较不同组别之间的相对大 小关系,特别是在样本量差异较 大时。
集中趋势的描述:平均数、中位数、众数
平均数
所有观察值的总和除以观察值的数量,反映 数据的平均水平。
中位数
将数据从小到大排序后,位于中间位置的数 值,反映数据的中心位置。
总结词
Logistic回归分析是一种用于处理因变量 为分类变量(通常是二分类)的统计方 法。
VS
详细描述
Logistic回归分析通过建立数学模型,将 自变量与因变量的关系转化为概率形式, 从而预测因变量的发生概率。它广泛应用 于医学、经济学、社会学等领域,尤其在 医学研究中,常用于疾病发生风险的预测 和诊断模型的建立。
Spearman秩相关与Kendall秩相关
Spearman秩相关和Kendall秩相关是两种常用的非参数相关分析方法, 适用于处理等级数据。
Spearman秩相关是根据变量的秩次来计算相关系数,反映两个变量之间 的线性关系。
Kendall秩相关则是基于排序数据中相邻数据的变化情况来计算相关系数, 反映两个变量之间的单调关系。
1 2 3
早期发展
计数资料统计描述起源于早期的统计学研究,最 初主要用于人口普查和农业统计等领域。
近代发展
随着计算机技术的进步和统计学理论的不断完善, 计数资料统计描述的方法和手段得到了极大的丰 富和发展。
未来趋势
随着大数据时代的到来,计数资料统计描述将更 加注重自动化、智能化和可视化,以提高数据处 理和分析的效率和准确性。
计数资料统计描述的重要性
计数资料的数据分析

计数资料的数据分析1、四格表资料(1)简单四格表资料i.非配对的四格表资料例:比较A、B两种疗法治愈率,数据如下:分析目的:A、B疗法有效率是否有差异?数据如用通用符号表示:分析方法:Pearson 卡方检验其中,Oi 表示观察数,Ei表示理论期望数, n 格子数(这里等于4)Yates'连续性校正关联分析:计算A疗法有效率相对于B疗法的优势比Odds Ratio (比值比)= (a/b) / (b/d) = (ad)/(bc) = (20*14)/(16*10) = 1.75易侕统计软件输入界面:易侕统计软件输出结果:ii. 配对的四格表资料例:比较A、B两种疗法治愈率,配对设计,每个病人与另一个年龄、性别、病程等相同的病人配对,一个用 A疗法治疗,另一个病人用B疗法治疗,数据如下分析目的:A、B疗法有效率是否有差异?: H0:A、B疗法有效率相同,即p b=p c数据如用通用符号表示:McNemar 卡方检验Edwards 连续性校正:McNemar精确检验:总共有b+c (8+4=12)不一致的对子数,按H0,理论上b与c出现的概率相同,即b占(b+c)的比例为50%,相当于OR=b/c=1。
实际观察到的OR = b/c = 8/4 =2,计算出现8/4 或更极端的情况(9/3,10/2,11/1,12/0)的概率。
易侕统计软件输入界面:易侕统计软件输出结果:McNemar 配对四格表卡方检验(2)诊断试验四格表资料分析目的:分析试验结果与真实情况(金标准)的吻合程度。
金标准是指当前公认的诊断疾病最可靠的标准方法,可正确区分“有病”或“无病”。
数据如用通用符号表示:分析指标:1. 检测患病率(prevalence)是指被检测的全部对象中,检测出来的患者的比例。
即:检测患病率 = (a+b)/(a+b+c+d)2. 实际患病率(prevalence)是指被检测的全部对象中,真正患者的比例。
计数资料的统计分析

Fisher确切概率法的应用范围
当四格表中由理论频数小于1或n≤40时,宜用
四格表的确切概率法;
当 2检验所得概率P略大于a时,应用Fisher确 切概率法。
实例
两种药物治疗某病结果见下表,试比较其差别有
无显著性。 表
组别 旧药 新药 合计
两种药物治疗某病结果比较
治愈 2(3.2) 4(2.8) 6 未愈 5(3.8) 2(3.2) 7 合计 7 6 13
缺点:①不利于保密;②不便于比较
表 某季度甲、乙两部队的感冒发生情况 部别 总人数 发病人数 发病率(%)
甲部队
乙部队 合计
1834
1313 3147
58
42 100
3.16
3.20 3.18
相对数指标(relative number ):有联系的两个 指标之比。
意义:便于表达事物出现的普遍程度;
率与构成比
率 构成比 发生的频率或强度 各组成部分所占的比重 随机发生事件 各部分的构成
概念 强调点
资料获得 特点
较难 不一定
容易 合计为100%
率与构成比的例子
年龄 组 ⑴ 40~ 50~ 60~ 70~ ≥80 合计 受检 人数 ⑵ 560 441 296 149 22 1468 白内障 例数 ⑶ 68 129 135 97 19 448 患者年龄构 患病率(%) 成比(%) ⑸=(3)/(2) ⑷ 15.18 12.14 28.79 29.25 30.13 45.61 21.65 65.10 4.24 86.36 100.00 30.52
防护服种类
阳性例数 1 10 11
阴性例数 14 18 32
患病率(%) 6.7 35.7 25.6
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量资料(定量资料)
❖统计资料类型:
计数资料(定性资料)
❖计数资料:按某事物属性或类别分组,清点 各组观察单位数而得到的资料称为分类资料
❖
一、常用的相对数
分类资料常采用相对数进行描述。 收集到的分类资料,表现为绝对数。
绝对数说明事物发生的实际水平,是进行 统计分析的基础,但不便于事物进行深入 分析比较。
、正确计算合计率(总率) 对观察单位数 不等的几个率,不能直接相加求平均率
正确的方法:总的发生数除以总的观 察单位数。
例: 用某疗法治疗肝炎,甲医院治疗人,
治愈人,治愈率为;乙医院治疗人,治愈 人,治愈率为。两个医院合计治愈率应该 是?
正确算法:[()()]× 错误算法:
或 ( ),
、注意资料的可比性
215
治愈率(%) 60.0 35.0 53.8
病人数 100 300 400
乙疗法 治愈数
65 125 190
治愈率(%) 65.0 41.7 47.5
2020/10/17
不能直接比较两医院总生存率 (应标化后再比)
一、标准化的意义和基本思想
❖ 与其合计的差别之所以大,是由于两疗法中 病人中病型构成不同。要正确比较甲、乙两 疗法的总治愈率,需按照统一标准进行校正, 然后进行比较。
❖ 即男性人口数是女性的倍。
表 某市某年各区急性传染病发生数及其相对数
年平均 急性传染 各区与Ⅰ 各区急性传染病发 各区急性传染病发生 市区
人口数 病发生数 区之比 生数构成(%) 率(1/10 万)
⑴
⑵
⑶
⑷
⑸
⑹
Ⅰ 636723 2433
-
18.9
Ⅱ 389540 3033
1.25
23.5
Ⅲ 699712 1相65对0 比 0.38 构成比 12.8
构 成 比 2 A 1 + A 2 + A 2 + A k 1 0 0 %
❖
构 成 比 k A 1 + A 2 + A k + A k 1 0 0 %
9% 12%
14% 17%
脑血管疾病
48%
心血管疾病
恶性肿瘤
意外伤害
呼吸系病
某地某年种慢性疾病的构成
某年中国农村死亡原因构成 ()
消化系病 4%
常用的相对数:率、构成比、相对比
(一)率()
率()又称频率指标,是指在一定时间 内发生某现象的观察单位数与可能发生 该现象的总观察单位数之比。它说明某 现象发生的频率或强度。
率可实能际发发生生该某现现象象单 的 单 的位 观 位 观总 察 数 察 数 K
为比例基数,可以是百分率()、千分率 (‰)、万分率(万)或十万分率(万), 可根据习惯或使计算出的率保持一、二位整 数。
构成该 比 某事 事物 物内 内部 部分 某 单 的的 一 位 所观 组 之 有察 成 和 观单 部 ( 察 ) 位 例 10数 % 数 0( 之
构成比
❖ 设某事物个体数的合计由,,· · ·,个部分 组成,构成比的计算为:
构 成 比 1 A 1 + A 2 A 1 + A k 1 0 0 %
定,不可靠,容易产生误解。 临床资料至少例才好计算率
、构成比不能代替率(分析时不能以比代率 )
在实际应用中经常出现以构成比代替率的错误。
年龄(岁)~ ~ ~ ~ ~ ~ ~ ~ 合计 沙眼人数
某文章作者根据上述资料认为,沙眼在~组 的患病率最高,以后随年龄增大而减少。
犯了以比代率的 错误
要想得到这一结论,应如何做?
()同一地区不同时期资料的相对数比较, 应注意条件有无变化。
、率或构成比的比较要遵循随机抽样的原则, 要做假设检验。
即两组或多组率比较,要作假设检验再下结论。
二、 率的标准化法
例如:
表 5 甲、乙两种疗法治疗某病的治愈率比较
病型 普通型 重型 合计
病人数 300 100 400
甲疗法 治愈数
180 35
例如: 某年甲乙两村发病情况如下: 甲村:发病人数 人。 乙村:发病人数 人。
发病情况乙村比甲村严重?
甲村: 人口数:人 发病人数: 人 发病率:。
乙村: 人口数:人 发病人数: 人 发病率: 。
甲村比乙村严重!
相对数:是两个有联系指标之比,说明事物发 生的相对水平,便于对分类资料进行分析和比 较。
其它 14%
恶性肿瘤 18%
损伤中毒 11%
呼吸系病 23%
心脏病 12%
脑血管病 18%
构成比两个特点
)一组构成比之和等于100%或1; )某部分构成增加或减少,则其它部分 构成就相应减少或增加。
某医院年与年各科病床情况
科别 年
年
病床数 构成比 病床数 构成比
内科
外科
儿科
合计
(三)相对比()
习惯用法:
人口出生率、死亡率、自然增长率、婴 儿死亡率等采用千分率;
肿瘤的死亡率采用十万分率。
例:
❖某单位在年有名职工,该单位每年对职 工进行体检,在这一年新发生高血压病 人例,则
高 血 压 发 病 率 1 2 1 0 0 0 ‰ = 3 .8 4 ‰ 3 1 2 8
(二)构成比
构成比()又称构成指标,说明某事物内部各 组成部分在整体中所占的比重或分布,常以百 分数表示,又称百分比。
382
779
率 236
Ⅳ 328363 1503
0.62
11.6
458
Ⅴ 286967 1282
0.53
10.0
447
Ⅵ 317504 1853
0.76
14.4
584
Ⅶ 153838 1130
0.46
8.8
735
合计 2812647 12884
-
100.0ຫໍສະໝຸດ 458(四)应用相对数的注意事项
、计算相对数的分母不宜过小 分母过小则计算所得的相对数不稳
相对比是、两个有关指标之比,说明是 的多少倍或百分之几。
比A(10% 0 ) B
与的性质可以相同,也可以不同。 可以是绝对数也可以是相对数或平均数。
人口密度、性别比、医护比,医技比
❖ 例: 我国年人口普查的男性人口数为,女性
人口数为人,则
❖ 男女 别 比 性 =68685 1 2 .055722 652872280
两个及以上的率(构成比)相比较时, 其他重要的影响因素要相同或相近(即所谓 的具有可比性),否则就不能直接对率进行 比较。一般的,两个地方的出生率、死亡率、 发病率,不同级别医院某病的治愈率等不能 直接比较。
率(或构成比)的比较是否具有可比性, 通常注意以下两个方面:
()观察对象同质,研究方法相同,观察 时间相等,以及研究对象所处的地区、民族、 职业、生活条件和习惯要一致;影响率的其 它因素在各对比组的内部构成是否相同。