第3讲 计量资料与计数资料的统计描述

合集下载

医学统计学之计量资料的统计描述

医学统计学之计量资料的统计描述

医学研究中有一类比较特殊的资料,如抗 体滴度等变量值呈倍数变化的数据,宜用 几何均数描述其平均水平。
适用资料: ①对数正态分布,原始数据偏态分布,经
对数变换后成正态分布的资料。 ②等比资料,即呈倍数变化的数据。例如
抗体滴度。
2020/12/16
计量资料的统计描述
21
几何均数的计算方法:
➢ 直接法 ➢ 加权法
计量资料的统计描述
24
2.加权法:
G
lg1
f lg
f
X
2020/12/16
计量资料的统计描述
25
举例:
IgG滴度倒数 40 80 160 320 640 1280
例数 3 22 17 9 0 1
G
lg
1
3
lg
40
22
lg
80
17
lg
160 52
9
lg
320
0
lg
1280
129.3
2020/12/16
2020/12/16
计量资料的统计描述
22
1.直接法:
G n X1 X2
Xn
写成对数形式 :
G
lg 1
lg
X1
lg
X
2 n
lg
X
n
lg 1
lg X n
2020/12/16
计量资料的统计描述
23
举例:
如上例:
G 10 2 2 4 48888 32 32 7
2020/12/16
M 160 10 (50 16) 164.5 20 2
2020/12/16
计量资料的统计描述
n

计量资料的统计描述

计量资料的统计描述

中位数(M)和百分位数(P)
中位数(median, M)是将一组观察值从小到大 按顺序排列,位次居中的数值对应的观察值就是 中位数。因而全部观察值中,大于和小于中位数 的观察值的个数相等。 百分位数(percentile,P)是指把一组资料的全 部观测值分为两部分,理论上讲,有x%的观测值 比Px小,有(100-x)%的观测值比Px大。中位数 是特定的百分位数,即P50,它是表示一组资料集 中位置的指标。
计算器功能简介
MODE或D·R·G:模式转换
DEG:degree 角度 RAD:radian 弧度 GRA:gradient 梯度
INV、 SHIFT或2nd F:第二功能键 SD 或 STAT:统计分析功能 x ,n,Σx,Σx2, σn (σX , σ),σn-1(sX , s)。 X 、 data 或DT:数据储存
标准差的应用
标准差是反映数据变异程度的指标,其大 小受每一个观察值的影响。 常用于描述对称分布,尤其是正态分布或 近似正态分布资料的离散程度。 随着样本量增大,标准差逐渐趋于稳定。
变异系数(CV)
CV =s/ x ×100% 它是反映相对变异度的指标。 变异系数常用于:
测量单位不同的几组资料变异度的比较; 均数相差悬殊的几组资料变异度的比较。
H = R 1 + 3 . 322 lg N
第一组段必须包括最小值,一般取略小于最小值 的整数作为第一组的下限;最后一个组段应该包 括最大值,并且封口,但最后一个组段的上限不 能等于最大值。
频数表的编制
3.列表划记,统计各组段频数。 4.计算频率与累计频率
频数分布的两个特征
体重虽有轻有重,但都向35~组段集中,数据大多 数集中在32~38组段,共83人,占总人数的55%, 这种趋势称为集中趋势 集中趋势。 集中趋势 另一方面,随体重逐渐变大或变小,仍有小部分变 量值存在,称这种特征为离散趋势 离散趋势。 离散趋势 集中趋势和离散趋势是频数分布的两个重要特征。

《医学统计学》教学大纲(医学检验)

《医学统计学》教学大纲(医学检验)

《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。

其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。

本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。

通过实验实习,使学生加深对理论的理解。

三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。

理解:统计工作的基本步骤,医学统计学的主要内容。

了解:学习统计学的目的和要求。

预防医学--计量资料的统计描述 ppt课件

预防医学--计量资料的统计描述  ppt课件

3.列出频数表。采用划记法或计算机
汇总。
PPT课件
10
110名20岁健康男大学生身高(cm)均数计算表(加权法)
身高组段 组中值x
(1)
(2)
162~
163
164~
165
166~
167
168~
169
170~
171
172~
173
174~
175
176~
177
178~
179
180~
181
182~184 183
PPT课件
29
一、 正态分布曲线
(normal distribution curve)
PPT课件
30
频数分布逐渐接PPT课近件 正态分布示意图 31
简称正态曲线(normal
curve),是一条高峰位
于中央(均数所在处),
两侧完全对称,而且逐渐
降低,但永远不与横轴相
交的钟型曲线。横轴上曲
线下的总面积为100%或1,
PPT课件
44
3.确定分组。原则上组间差别明显且 有实际意义者分开,否则可分开。
4.根据ห้องสมุดไป่ตู้标的实际用途确定单、双 侧。
5.选定适当的百分界限。
6.根据资料的分布特点,选用恰当 的界值计算方法。
PPT课件
45
四常用参考值范围估计方法
95%正常值范围:同质总体中包含95%的个体 值所在的范围。
1.正态分布法:适用于正态或近似正态分布资料。 双侧:X±1.96S,
单侧:X+1.645S或X–1.645S
2.对数正常分布法:适用于对数正态分布资料。 双侧:Lg–1(XlgX±1.96SlgX) 单侧:Lg–1(XlgX –1.645SlgX) 或Lg–1(XlgX +1.645SlgX)

计数资料统计描述_科学学位PPT课件

计数资料统计描述_科学学位PPT课件

(3)常见率的计算
病死率 (fatality rate):表示一定时期内,患
某病的全部病人中因该病死亡者的比例。
某年某病的病死率=一定时期内因某病死亡的人数 同期内确证为某病的人数

K
24
(4)率的统计学意义 率是表示频率或强度的指标。 影响因素相同时,率越大则事物发生的频率或强 度越大;对疾病而言,频率越大,对人群的危害 也越大。
25
常用的相对数指标
2、构成比 proportion 定义 公式 特点 构成比的统计学意义
26
(1)定义:构成比说明某一事物内部各 组成部分所占的比重或分布。常以百分比表示。
(2)公式
构成比

某一组成部分的观察单位数 同一事物各组成部分观察单位总数
100%
27
设某事物个体数的合计由A1,A2,…,Ak个部分组成,构 成比计算为:
构成比1
A1
100%
A1 A2 Ak
构成比2
A2
100%
A1 A2 Ak



构成比K
AK
100%
A1 A2 Ak
K个构成比的合计为100%
28
(3) 特 点
a. 一组资料各部分构成比之和为100%; b. 当某一部分构成比增大时,其余部分的构成比相 应减少。
… 2000386
关于孕妇分娩的原始资料记录
年龄 27 22 25 24 30 32 27 29 … 26
职业 无 无
管理人员 知识分子 管理人员
无 无 无 … 无
文化程度 中学 小学 大学 中学 大学 小学 中学 大学 … 小学
分娩方式 顺产 助产 顺产 顺产 顺产

统计学--第二章计量资料的统计描述幻灯片PPT

统计学--第二章计量资料的统计描述幻灯片PPT
甲组 26 28 30 32 34
乙组 24 27 30 33 36
丙组 26 29 30 31 34
课件
36
离散程度(或变异程度)
指数据参差不齐的程度,反映资料的 离散趋势。
将反映平均水平与离散程度的指标结 合起来使用,可全面地描述数据的分 布规律。
课件
37
(一)全距(或极差 , Range )
(53.0 55.0) / 2 54(cm)
数。
课件
28
中位数的应用
中位数可用于任何分布的定量资料; 资料的分布呈明显偏态,特别是负偏态; 分布的一端或两端无确定的数值;
(如:>50, 或 <10)
资料的分布不清。 注意:在完全对称的单峰曲线分布中,同
一组资料的均数与中位数相同, Mean = Median
XX22XX2
XX2 2 XX2
课件
19
(二)几何均数 Geometric mean,
G
反映一组呈倍数关系的观察值的平 均水平
适用:数据呈正偏态分布,经对数 转换后呈正态分布。多用于观察值 之间呈倍数关系,如抗体滴度
计算方法
➢直接法
➢加权法
课件
20
1.直接法
G n X1X2...Xn
lg1lgX1 lgX1 ...lgXn
对称分布
正偏态分布
课件
负偏态分布
9
三、频数表和频数分布图的用途
揭示变量的分布特征和分布类型; 便于进一步计算指标和统计分析处
理; 便于发现某些特大或特小的可疑值

课件
10
频数分布的两个特征
集中趋势,central tendency
指变量值的中心数值或中心位置所在。

医学统计学PPT课件

医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100

N=5万 → X =118.6cm
• 特点:1)不可避免性

2.计量资料的统计描述

2.计量资料的统计描述

20
组 段 (1) 124~ ~ 128~ ~ 132~ ~ 136~ ~ 140~ ~ 144~ ~ 148~ ~ 152~ ~ 156~ ~ 160~ ~ 合 计
频 数 (2) 1 2 10 22 37 26 15 4 2 1 120
累计频数 (3) 1 3 13 35 72 98 113 117 119 120
12
第二节
简称均数
描述集中趋势的指标
算数均数( 算数均数(mean) ) 适用条件:对称分布, 适用条件:对称分布,尤其是正态分布或近似正态分布 表示:总体均数用μ表示;样本均数用 表示:总体均数用μ表示; 意义:描述一组同质资料的平均水平。 意义:描述一组同质资料的平均水平。 计算方法: 计算方法: 直接法 间接法(频数表法) 间接法(频数表法)
19
频数表法:适用于样本量较大的计量资料, 频数表法:适用于样本量较大的计量资料,如频数表 资料。 资料。
M所在组下限 其中 LM:M所在组下限 i:M所在组组距 : 所在组组距 fM:M所在组频数 所在组频数 n:样本例数 : ΣfL:M所在组段之前的累计频数 所在组段之前的 所在组段之前的累计频数
统计描述是统计分析的最基本内容 统计描述的三种形式: 统计描述的三种形式
统计表 统计图 统计指标
2
第一节 频数分布表和频率分布图
岁女孩身高( )资料如下: 例2-1、某市 、某市2005年100名18岁女孩身高(cm)资料如下: 年 名 岁女孩身高 165.1 169.6 163.0 166.5 160.9 156.6 169.3 165.9 162.0 165.3 165.1 164.0 159.9 171.2 169.1 168.0 160.6 157.1 162.5 165.8 161.5 166.3 168.5 167.1 161.0 159.0 167.3 157.2 163.7 163.1 166.1 167.5 166.0 158.5 161.2 167.5 158.2 154.7 155.6 168.2 162.8 163.6 164.2 161.8 160.7 173.6 159.8 158.0 159.4 158.2 166.2 166.1 156.8 166.6 161.5 162.0 160.6 164.3 161.9 167.2 170.2 160.4 163.0 163.5 162.9 167.4 162.2 162.7 169.7 159.9 165.2 169.0 162.3 164.6 163.4 170.6 162.8 163.1 164.0 161.2 161.0 161.3 165.0 160.4 168.9 165.0 164.2 165.2 162.6 164.5 161.5 162.6 158.3 165.1 170.5 166.8 165.8 164.5 167.5 162.8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目

总标目
纵标目 纵标目
××× ×××
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ×:
3、统计表的分类
根据分组标目的复杂程度,统计表可大致分为简单表 和复合表。
率(rate):说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数
比例基数:100%、1000‰、10000/万、100000(1/10万)等 如:发病率、死亡率、发生率、阳性率、患病率等 构成比(proportion):说明某一事物内部,各组成部分所占的比 重,也叫百分比。 构成比=(某部分观察单位数/各组成部分观察单位总数)×100% 如:教研室20人中高级职称有5人,占25%。 相对比(relative ratio):是A、B两个有关指标之比,说明A是 B的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生: 护士、教师:学生
用途:用等宽直条的长短来表示相互独立的各统 计指标的数值大小,也叫直条图. 分单式和复式两种.
单式条形图
复式条形图
圆图(Pie Chart)
用途:以圆的半径将圆面分割成多个大小不等的 扇形,以扇形面积来表达构成比的图形。
线图(Line Chart)
用途:适用于连续变量资料,说明某事物因时间、 条件推移而变迁的趋势。
实例数据
住院号 年龄 身高 体重
2025655 27 165 71.5 2025653 22 160 74.0 2025830 25 158 68.0 2022543 23 161 69.0 2022466 25 159 62.0 2024535 27 157 68.0 2025834 20 158 66.0 2019464 24 158 70.5 2025783 29 154 57.0
正正正
17
1.35
22.95
正正
13
1.45
18.85

9
1.55
12.40

8
1.65
14.85
3
1.75
5.25
160
182.30
对称分布:以频数最多组段为中心左
右大体对称.
右(正)偏态分布: 频数最多组段右侧组
段数多.(skewed to the right distribution)
左(负)偏态分布: 频数最多组段左侧组
(4)=(2)+(3)
急性期 死亡数
(5)
住院期总病 急性期病 死率(%) 死率(%) (6)=(4)/(2) (7)=(5)/(2)
1964
17
9
8
7
47.1
41.2
1965
13
8
5
4
38.5
30.8
1966
15
8
7
6
46.7
40.0
1967 15
9
6
6
40.0
40.0
1968 12
8
4
4
33.3
448
100.00
30.52
3、相对数应用注意事项
(1) 不能以构成比代替率。 (2) 计算相对数的分母不宜过小, 小则直接叙述。 (3) 进行率的对比分析时,应注意资料可比性。如比较疗
效时,比较组间应病情轻重相同,性别影响,应按性别 分组后再作比较。 (4) 正确求平均率。 例: 若P1=x1/n1 P2=x2/n2 P3=x3/n3

小学
2025830 25 管理人员 大学
2025677 24 知识分子 中学
2025647 30 管理人员 大学
2025848 32

小学
2019915 27

中学
2025861 29

大学
2024601 25
农民
中学
2000386 26

小学
分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
例: 率与构成比
白内障 患者年龄
年龄组 受检人数 例数 构成比(%) 患病率(%)




⑸=(3)/(2)
40~ 560
68
15.18
12.14
50~ 441
129
28.79
29.25
60~ 296
135
30.13
45.61
70~ 149
97
21.65
65.10
≥80
22
19
4.24
86.36
合计 1468
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
9
2
6
10
18
0
45
22 28
7
10
24
70
11
150
24 50
34
28
52
153
44
361
26 50
43
25
45
133
70
三类资料间关系
例:一组2040岁成年人的血压
等级 资料
<8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压
计量资料 计数资料
以12kPa为界分为正常与异常两组,统计每组例数
二、计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。
②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
P=(x1+ x2+ x3)/ n1+ n2+ n3) (正确) P=(P1+ P2+ P3)/3 (错误)
计数资料和等级资料的SPSS表示
五、统计表与统计图
统计表(statistical table)——数据代替文字描述,便于 统计结果的精确、简洁的表达和对比分析.
统计图(statistical chart)——用图形代替数据,获得直 观、形象的效果.
简单表(simple table):只按一个特征或标志分组。 如表2-8 。
复合表(combinative table) :按两个或两个以上特 征或标志结合起来分组。如表2-9。
3、不良统计表的修改
表 2-15 第三组病人各年存活及死亡情况 (原表)
年份 (1)
病例数 (2)
存活数 (3)
住院期死 亡总例数
段数多.(skewed to the right distribution)
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋 势( central tendency ).
常用平均数有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
41.2
38.5 46.7
30.8 40.0
40.0 33.3
40.0 33.3
41.7
37.5
3、统计图
统计图(statistical chart 或statistical graph)是用点、线、面等几何图形,直观形象地表达、 描述数据或结果。
SPSS绘制基本图形
条形图(Bar Chart)
定义:将统计分析的事物及指 标用表格列出.
特点:避免长篇文字叙述,便 于阅读和对比分析;数据具体.
相关文档
最新文档