计量资料与计数资料的统计描述.PPT

合集下载

计量资料的统计描述

计量资料的统计描述

分 层 抽 样
整 群 抽 样

7
概率抽样、非概率抽样
• 概率抽样:每个对象被抽中的概率是已知/可计算的,其样本统计量是参数估计 和计算误差的基础;
• 等概率抽样:随机抽样 • 不等概率抽样:多单位被抽取的概率不同,可能会得到更有效的估计量 • 非概率抽样:抽样概率未知/无法计算,按主观、有目的、为方便进行抽样; • 不能计算抽样误差,或一般按简单随机抽样计算误差。配额抽样、滚雪球/识别
计量资料的统计描述
1
统计学中的几个基本概念
1、同质与变异 2、总体与样本 3、普查与抽样 4、参数与误差 5、频率与概率(小概率事件)
2
1. 同 质 与 变 异
• 同质(homogeneity)
指事物某方面的性质、影响条件或背景相同或相 近
• 变异(variation)
同质个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。 是统计学存在的基础。
M
X
8+X
2
8+1 2
2 (X 4+X5)2 (14+15)2 14.5(天)
42
百分位数
• 将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为PX。 中位数是百分位的特殊形式P50 。同样还有四分位数、十分位数等。
TG
31
第二节 计量资料的常用统计指标
一、集中趋势的描述-平均值
平均值是一组数据典型或有代表性的值。由于这样典型 的值趋向于落在根据数据大小排列的数据的波峰位置, 因此可以用于度量集中位置。
常用几种平均值:
1.算术均数 2.几何均数 3.中位数
32
1.算术均数(均数)
• 意义:一组性质相同的观察值在数量上的平均水平。 • 表示: (总体) X(样本) • 计算:直接法、频数表法 • 特征: ∑(X- X)=0 • 注意:应用于正态分布或近似正态分布,才能求均数,

常用统计学方法ppt课件

常用统计学方法ppt课件

三、率(构成比)的统计分析
两样本率或构成比的比较用四格表2 配对设计时用配对2 多组率或构成比比较用行×列2
四格表2检验
1.当n≥40,且T≥5时,直接计算 2值
基本公式 χ2=
(A-T)2 ∑─────

专用公式
( a d-b c ) 2 n χ2= ───────────
(a+b)(c+d)(a+c)(b+d)
学习内容:
一、研究资料类型 二、均数的统计分析 三、率(构成比)的统计分析
一、研究资料类型
➢ 计量资料 ➢ 计数资料 ➢ 等级资料
计量资料:用定量方法对每个观察 单位某指标测量数值大小的资料。
常用表达方法:±s 常用统计方法:t检验
u检验 方差分析
计数资料:将观察单位按属性分组, 清点各观察单位个数的资料。 常用表达方法:率、百分构成等 常用统计方法:2检验
➢ 对同一受试对象分别给予两种处理, 推断两种处理效果有无差别;
➢ 对同一受试对象处理前、后比较,推 断该处理有无作用。
t检验:
样本均数与总体均数比较(P106); 配对设计计量资料比较(P107); 两样本均数比较(P108)。
u检验:
两大样本均数比较(P109)
方差分析(ANOVA):
多个样本均数比较(P109)
等级资料:将观察单位按属性的 不同程度分组,再清点各观察单 位个数的资料。 常用统计方法:秩和检验等
二、均数的统计分析
➢ 成组设计:
两小样本均数比较用t检验;
两大样本均数比较用u检验; 三个以上样本均数比较用方差分析。 对同对和两个受试对象分别给予两种 处理,推断两种处理效果有无差别;
2.当n≥40,且有1≤T<5时,计算校正的 2值

定性资料的统计描述幻灯片PPT

定性资料的统计描述幻灯片PPT

Standardization rate
1.标准化直接法的计算方法
P ' N 1 P 1N 2P 2N kP k N iP i
N
N
式中P’为标准化率,N1 , N2 ,…Nk为某一影响因素 (如病型、年龄等)标准构成的每层例数,P1 , P2 ,…Pk为原始数据中各层的率,N为标准构成的总
例数。上式也可写成:
Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不同 人群的患病率、发病率、死亡率等资料时,为消 除其内部构成(如年龄、性别、工龄、病程长短 、病情轻重等)对率的影响,可以使用标准化率 。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
定性资料的统计描述幻灯片PPT
本PPT课件仅供大家学习使用 请学习完及时删除处理 谢谢!
第四章 定性资料的统计描述
计量资料(定量资料) 统计资料类型:
计数资料(定性资料)
计数资料:先将研究对象按其性质或特征分类,再 分别计数每一类的例数。
描述定性资料的数据特征,通常需要计算相对数。 根据不同的研究目的,常用率、构成比、相对比等 指标来进行统计描述。
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
Prevalence rate
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性 病的发生或流行情况,其计算公式为
某 病 患 病 率 某 该 地 地 某 同 时 期 点 内 某 平 病 均 患 人 病 口 例 数 数 比 例 基 数
三、相对比
相对比( relative ratio ):相对比是A、B两个有关 联指标值之比,用以描述两者的对比水平,说明 A是B的若干倍或百分之几,通常用倍数或分数表 示。这两个指标可以是性质相同,如不同时期的 患病人数;也可以是性质不同,如体重与身高的 平方之比(体重指数,BMI)。其计算公式为

医学统计学第1-2章(2015)

医学统计学第1-2章(2015)
36
3. 方差(variance , 2 , S2)和标准差 (standard deviation , S)
2 X 2
N
S2
2
XX
n1
总体方差
样 本 方 差
37
4.标准差:
X 2
N
总 体 标 准 差
标准差或方差越大,说明个体差异越大,则均数的 代表性越差。
•应用: 对称分布,尤其是正态分布
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
19
115名正常成年女子的血清转氨酶 (mmol/L)含量分布
血清转氨酶含量
人数
12-
2
15-
9
18-
14
21-
23
24-
19
27-
14
30-
11
33-
9
36-
7
39-
4
42-45
3
20
第二节 集中趋势的描述——平均数
66.67
7
25
32
21.88
62
40
102
60.78
6
分组 血栓组 正常组 合计
表 3. 9 正常妇女和血栓形成者的血型分布
A型
B型
AB 型 O 型
合计
32
8
10
9
59
51
19
12
70
152
83
27
22

计量资料的统计描述讲义

计量资料的统计描述讲义
位置的指标常称平均数(average)。
• 平均数反映同类现象的一般水平,是总体内 各单位参差不齐的标志值的代表值,也是对 变量分布集中趋势的测定。
常用的平均数有均数、几何均数、中 位数、众数等。
(一)均数(mean,average)
算术平均数(arithmetic mean),或称为 算术均数,简称为均数,是最重要的平 均数。
由频数表可看出频数分布的两个重要特
征:集中趋势(central tendency)和离 散程度(dispersion)。例如本例,身高有
高有矮,但中等身高居多,此为集中趋 势;由中等身高到较矮或较高的频数分 布逐渐减少,反映了离散程度。
对于数值变量资料,可从集中趋势 和离散程度两个侧面去分析其规律 性。
以例2.1说明其编制方法。
1.求全距(range)
2.定组段和组距: 3.列出频数表
二 频数表的特征
•三、频数表的用途
例2.1 某地1998年抽样调查了100名18岁男大 学生的身高(cm)资料如下,试编制频数表 。
某地1998年100名18岁男大学生的身高(cm)
173.6 165.8 168.7 173.6 173.7 177.8 180.3 173.1 173.0 172.6 173.6 175.3 178.4 181.5 170.5 176.4 170.8 171.8 180.7 170.7 173.8 164.4 170.0 175.0 177.7 171.4 162.9 179.0 174.9 178.3 174.5 174.3 170.4 173.2 174.5 173.7 173.4 173.9 172.9 177.9 168.3 175.0 172.1 166.9 172.7 172.2 168.0 172.7 172.3 175.2 171.9 168.6 167.6 169.1 166.8 172.0 168.4 166.2 172.8 166.1 173.5 168.6 172.4 175.7 178.8 169.1 175.5 170.8 171.7 164.6 171.2 177.1 170.7 173.6 167.2 170.7 174.7 171.8 167.3 174.8 168.5 178.7 177.3 165.9 174.0 170.2 169.5 172.1 178.2 170.9 171.3 176.1 169.7 177.9 171.1 179.3 183.5 168.5 175.5 175.9

计量资料和计数资料的统计方法

计量资料和计数资料的统计方法

计量资料和计数资料的统计方法计量资料和计数资料是统计学中常见的两种数据类型,它们在统计分析中有着不同的处理方法和应用场景。

本文将分别介绍计量资料和计数资料的统计方法,并探讨其在实际问题中的应用。

一、计量资料的统计方法计量资料是指可以用数值表示的数据,例如身高、体重、温度等。

统计学中常用的计量资料分析方法有描述统计和推断统计。

1. 描述统计描述统计是对收集到的数据进行总结和描述的方法。

常用的描述统计量有平均值、中位数、众数、标准差、方差等。

平均值是计量资料最常用的描述统计量,它可以反映数据的集中趋势。

中位数和众数则可以反映数据的位置和分布情况。

标准差和方差则可以衡量数据的离散程度。

2. 推断统计推断统计是基于样本数据对总体进行推断的方法。

在推断统计中,常用的统计分析方法有假设检验和置信区间估计。

假设检验用于验证关于总体的某个参数的假设,例如总体均值是否等于某个特定值。

置信区间估计则可以给出总体参数的一个区间估计,例如总体均值的置信区间。

二、计数资料的统计方法计数资料是指不连续的、以计数形式出现的数据,例如人数、次数、事件发生次数等。

计数资料的统计方法主要包括频数分布、列联表分析和卡方检验。

1. 频数分布频数分布是计数资料最常用的分析方法之一,它将数据按照不同的取值进行分类,并统计每个类别的频数。

通过频数分布可以直观地了解数据的分布情况和特征。

2. 列联表分析列联表分析是用于分析两个或多个分类变量之间关系的方法。

通过构建列联表可以清晰地展示不同变量之间的交叉频数,并计算各个格子的期望频数和卡方值。

列联表分析可以帮助我们判断两个变量之间是否存在相关性。

3. 卡方检验卡方检验是用于检验两个或多个分类变量之间是否存在显著差异的统计方法。

卡方检验基于计数资料的频数分布和列联表,通过计算观察频数与期望频数的差异,并进行假设检验来判断变量之间是否独立。

三、计量资料和计数资料的应用计量资料和计数资料在实际问题中具有广泛的应用。

第3讲 计量资料与计数资料的统计描述

第3讲 计量资料与计数资料的统计描述
一、数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目

总标目
纵标目 纵标目
××× ×××
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ×:

医学统计学PPT课件

医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100

N=5万 → X =118.6cm
• 特点:1)不可避免性
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

等级 资料
8 12 15 17
计量资料
计数资料
以12kPa为界分为正常与异常两组,统计每组例数
二、计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
3、相对数应用注意事项
(1) 不能以构成比代替率。 (2) 计算相对数的分母不宜过小, 小则直接叙述。 (3) 进行率的对比分析时,应注意资料可比性。如比较疗 效时,比较组间应病情轻重相同,性别影响,应按性别 分组后再作比较。 (4) 正确求平均率。 例: 若P1=x1/n1 P2=x2/n2 P3=x3/n3 (错误) P=(x1+ x2+ x3)/ n1+ n2+ n3) (正确) P=(P1+ P2+ P3)/3
2025830 2025677 2025647 2025848 2019915 2025861
22
25 24 30 32 27 29

管理人员 知识分子 管理人员 无 无 无
小学
大学 中学 大学 小学 中学 大学
助产
顺产 顺产 顺产 剖宫产 顺产 剖宫产
足月
足月 早产 足月 足月 死产 足月
2024601
左(负)偏态分布: 频数最多组段左侧组
段数多.(skewed to the right distribution)
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋 势( central tendency ). 常用平均数有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
计数资料和等级资料的SPSS表示
五、统计表与统计图
统计表(statistical table)——数据代替文字描述,便于 统计结果的精确、简洁的表达和对比分析.
统计图(statistical chart)——用图形代替数据,获得直 观、形象的效果.
定义:将统计分析的事物及指 标用表格列出. 特点:避免长篇文字叙述,便 于阅读和对比分析;数据具体.
住院期总病 死率(%) (6)=(4)/(2) 47.1 38.5 46.7 40.0 33.3 41.7
表 2-16 1964~1968 年急性心肌梗塞患者的病死率 年份 1964 1965 1966 1967 1968 合计 病例数 17 13 15 15 12 72 死亡例数 住院数 急性期 8 7 5 4 7 6 6 6 4 4 30 27
2025653
27
22
165
160
71.5
74.0
5
5


中学
小学
顺产
助产
足月
足月
2025830
2022543 2022466 2024535 2025834 2019464 2025783
25
23 25 27 20 24 29
158
161 159 157 158 158 154
68.0
69.0 62.0 68.0 66.0 70.5 57.0
R X max X min
S
四分位间距:QR=P75- P25
X 2 X n
2
n 1
S CV 100% X
三、SPSS实现计量资料的统计描述
四、计数资料的统计描述
1、计数资料数据的整理
住院号
2025655
年龄
27
职业

文化程度
中学
分娩方式
顺产
妊娠结局
足月
2025653
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形. 特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
医学统计学 (Medical Statistics) 第3讲 计量与计数资料的统计描述
西南交通大学峨眉校区基础课部数学教研室
本讲结构
一、数据类型的分类 二、计量资料的统计描述 三、SPSS实现计量资料的统计描述 四、计数资料的统计描述 五、统计表与统计图
一、数据类型的分类
1、计量资料 (measurement data)
X X 1 X 2 X n X n n

X
f1 X 1 fX 2 fX 3 f k X k fX i f1 f 2 f 3 f k f i
n为奇数 n为偶数
G n X1 X 2 X n
fi lg X i G lg 1 f i
备注:
3、统计表的分类
根据分组标目的复杂程度,统计表可大致分为简单表
和复合表。 简单表(simple table):只按一个特征或标志分组。 如表2-8 。 复合表(combinative table) :按两个或两个以上特 征或标志结合起来分组。如表2-9。
3、不良统计表的修改
表 2-15
年份 (1) 1964 1965 1966 1967 1968 合计 病例数 (2) 17 13 15 15 12 72
1.69
1.7 1.71


160
1.77
编制频数表,绘制频数分布图
组段 (1) 0.5~ 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 正 正正 正正 正正正 正正正 正正正正 正正正 划记 (2) 频数,f (3) 3 9 12 13 17 18 20 18 组中值,X ( 4) 0.55 0.65 0.75 0.85 0.95 1.05 1.15 1.25 fX (5)= (3)×(4) 1.65 5.85 9.00 11.05 16.15 18.90 23.00 22.50
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数. 率(rate):说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数 比例基数:100%、1000‰、10000/万、100000(1/10万)等 如:发病率、死亡率、发生率、阳性率、患病率等 构成比(proportion):说明某一事物内部,各组成部分所占的比 重,也叫百分比。 构成比=(某部分观察单位数/各组成部分观察单位总数)×100% 如:教研室20人中高级职称有5人,占25%。 相对比(relative ratio):是A、B两个有关指标之比,说明A是 B的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生: 护士、教师:学生
表2-1: 160名正常成年女子的血清甘油三酯(mmol/L)
编号 1 2 3 4 5 血清甘油三脂 0.51 0.52 0.59 0.61 0.61 编号 … 153 154 155 156 血清甘油三脂 … 1.65 1.66 1.67 1.67
6
7 8
0.62
0.63 0.64
157
158 159
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
实例数据
住院号 年龄 身高 体重 住院 天数 职业 文化 程度 分娩 方式 妊娠 结局
2025655
:TTT(麝香草酚浊度试验), :GPT(谷丙转氨酶)。 (丁建生等. 中国卫生统计 1999; 16(3):166 )
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目 ┋ ┋ ┋ 合 计 总标目 纵标目 ××× ×× ┋ ┋ ××× 纵标目 ××× ×× ┋ ┋ ××× 总 标 目(单位) 纵标目 ××. ×× ×. ×× ┋ ┋ ××. ×× 纵标目 ××. ×× ×. ×× ┋ ┋ ××. ××
(修改表)
病死率(% ) 住院期 急性期 47.1 41.2 38.5 30.8 46.7 47 37.5
x( n1) / 2 Md xn / 2 x1 n / 2 2
3、离散趋势的描述
反映数据的离散度(Dispersion), 即个体观察值的变异 (variation)程度, 常用的统计指标有:
1. 2. 3. 4. 5.
极差(Range) (全距) 四分位数间距 (Quartile range) 方差(Variance) 标准差(Standard Deviation) 变异系数(Coefficient of Variation)
第三组病人各年存活及死亡情况
存活数 (3) 9 8 8 9 8 42 住院期死 亡总例数 (4)=(2)+(3) 8 5 7 6 4 30 急性期 死亡数 (5) 7 4 6 6 4 27
(原表)
急性期病 死率(%) (7)=(5)/(2) 41.2 30.8 40.0 40.0 33.3 37.5
相关文档
最新文档