统计学课件--Ch05计数资料的统计描述
合集下载
统计学课件--Ch05计数资料的统计描述

接法。
pi
2)选定甲、乙两种疗法各病型的治疗人数之和作标准
3)求预期治愈人数。将各组标准治疗人数分别乘甲、
乙两种疗法的原治愈率,即得不同病型的甲、乙两
种疗法预期治愈人数。
4)计算甲、乙两种疗法的标准化治愈率。
课件
34
由公式(5-4),得
甲疗法标准化治愈率 p 380 100% 47.5% 800
乙疗法标准化治愈率 p 427 100% 53.4% 800
经标准化后,乙疗法治愈率高于甲疗法,与 分组比较的治愈率结论一致,校正了标准化前 甲疗法治愈率高于乙疗法的不妥结论。
课件
35
病型
(1) 普通型 重型 合计
表 5-5 按式(5-4)用直接法计算标准化治愈率(%)
标准治
甲疗法
乙疗法
疗人数 原治愈率 预期治愈数 原治愈率 预期治愈数
(Ni) (2)
(pi) (3)
(Nipi) (4)= (2)(3)
(pi) (5)
(Nipi) (6) = (2)(5)
400
60.0
240
65.0
260
400
35.0
140
41.7
167
800(N)
—
380∑Nipi
—
427∑Nipi
课件
36
(2)用标准人口构成比计算
例5-5 仍对表5-4资料,求甲、乙两种疗法的标准化 治愈率。其步骤如下:
病型 (1)
标准人 口构成
(Ni/N) (2)
甲疗法
原治愈率 分配治愈率 (pi ) (Ni/N)pi (3) (4)= (2)(3)
普通型 0.5
60.0
《统计描述》课件

05
统计描述的注意事项
数据来源的可靠性
01 确保数据来源的可靠性和权威性,避免使用不可 靠的数据源。
02 在数据收集过程中,应遵循科学的方法和程序, 确保数据的准确性和客观性。
02 对于网络数据,需要注意数据的来源和可信度, 避免使用虚假或错误的数据。
数据的异常值处理
在数据分析前,需要对异常值进 行识别和处理。
《统计描述》ppt课 件 (2)
目录
• 统计描述概述 • 数据收集与整理 • 数值型数据的统计描述 • 分类数据的统计描述 • 统计描述的注意事项
01
统计描述概述
定义与目的
定义
统计描述是对数据进行整理、归纳和总结,以简明的方 式呈现数据的基本特征和规律。
目的
帮助人们更好地理解数据,为进一步的数据分析提供基 础。
03
数值型数据的统计描述
平均数
01 平均数
表示一组数据的总体“平 均水平”的统计量。
03 计算方法
将一组数据加起来,然后
除以这组数据的个数。
02 分类
算术平均数、调和平均数
、几何平均数等。
04 应用场景
分析数据集中各数值的一
般水平,如工资、成绩等。Βιβλιοθήκη 中位数和众数中位数
将一组数据从小到大排列 后,位于中间位置的数。
根据实际情况,可以采用不同的 方法处理异常值,如删除、替换 或保留异常值并对其进行合理的
解释。
处理异常值时应保持客观和科学 ,避免主观臆断或随意处理。
数据的可视化呈现
数据可视化是统计描述的重要 部分,通过图表、图像等形式 呈现数据。
选择合适的图表类型,如柱状 图、折线图、饼图等,以便更 直观地展示数据的特点和趋势 。
第四章 统计描述_PPT幻灯片

4.1 基本概念和原理
统计学的基本内容可分为两大类——统计 描述和统计推断。
➢ 统计描述(Descriptive Statistics)是指运用 各种统计学手段(如统计表、统计图、统计 指标等)对观测数据的数量特征进行客观地 描述和表达。
2021/3/10
1
4.1 基本概念和原理
➢统计推断(Inferential Statistics)是指根据 观测数据(即“样本”——Sample)所提供 的信息,对未知总体的情况做出具有一定概 率保证的估计和推断,包括假设检验和参数 估计两大内容。
2021/3/10
11
4.3 描述性统计量(Descriptive)
专门用于计算各种描述统计量(均值、中位数、 众数、方差、标准差、全距、偏度、峰度),以 反映总体分布的集中趋势和离散趋势。
2021/3/10
12
4.4 探索性数据分析(Explore)
是一种基于数据稳健性和耐抗性的统计分析方法。 基本思路是在统计分析时尽量减小数据中存在的 少量异常值对分析结果的影响。Explore命令提供 了3种非常重要的功能:
i1
Me L 2
Sm1 d
fm
2021/3/10
7
4.1 基本概念和原理
3.众数(Mode)
➢ 上限公式:
m o U (m f f f 1 m ) ( f m 1 f f 1 ) d U Δ 1 Δ 2 Δ 2 d
➢ 下限公式:
m o L (m f f f1 m ) ( f m 1 f f 1 ) d L Δ 1 Δ 1 Δ 2 d
➢ 异常值检查 ➢ 正态分布检验 ➢ 方差齐性检验
2021/3/10
13
2021/3/10
统计学的基本内容可分为两大类——统计 描述和统计推断。
➢ 统计描述(Descriptive Statistics)是指运用 各种统计学手段(如统计表、统计图、统计 指标等)对观测数据的数量特征进行客观地 描述和表达。
2021/3/10
1
4.1 基本概念和原理
➢统计推断(Inferential Statistics)是指根据 观测数据(即“样本”——Sample)所提供 的信息,对未知总体的情况做出具有一定概 率保证的估计和推断,包括假设检验和参数 估计两大内容。
2021/3/10
11
4.3 描述性统计量(Descriptive)
专门用于计算各种描述统计量(均值、中位数、 众数、方差、标准差、全距、偏度、峰度),以 反映总体分布的集中趋势和离散趋势。
2021/3/10
12
4.4 探索性数据分析(Explore)
是一种基于数据稳健性和耐抗性的统计分析方法。 基本思路是在统计分析时尽量减小数据中存在的 少量异常值对分析结果的影响。Explore命令提供 了3种非常重要的功能:
i1
Me L 2
Sm1 d
fm
2021/3/10
7
4.1 基本概念和原理
3.众数(Mode)
➢ 上限公式:
m o U (m f f f 1 m ) ( f m 1 f f 1 ) d U Δ 1 Δ 2 Δ 2 d
➢ 下限公式:
m o L (m f f f1 m ) ( f m 1 f f 1 ) d L Δ 1 Δ 1 Δ 2 d
➢ 异常值检查 ➢ 正态分布检验 ➢ 方差齐性检验
2021/3/10
13
2021/3/10
计数资料的统计描述和推断PPT课件

通过实例演示计数资料假设检验的步骤和方法,包括提出假 设、选择检验方法、确定样本量、收集数据、计算检验统计 量等。
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。
统计学计数资料PPT课件

符号
(2) a0 a1 a2 a3 a4 a5 a6 a7 a8 a9
学生 人数 (3) 4200 4500 4800 4900 5150 5320 5510 5780 5950 ) (5)
--
--
300 300
600 300
700 100
950 250
1120 170
17
治疗分组
成人组 儿童组
合计
治疗人数 100 200 300
旧疗法 痊愈人数
50 20 70
治愈率% 50.0 10.0 23.3
新疗法
治疗人数 痊愈人数 治愈率%
200
100
50.0
100
10
10.0
300
110
36.7
以旧疗法人数为标准人口数
治疗分组
标准治 疗人数
成人组 100
儿童组 200
7
常用率指标:
发病率、患病率、漏诊率、误诊率、治愈率、死亡 率、病死率等。
同期内新发生某病的病例数 发病率 观察期内可能发生某病的平均人口数 k
(时点)患病率
检查时发现的某病现患病例数
该时点受检人口数
k
治愈率
治愈病人数 接受治疗人数 100%
8
(粗)死亡率
同年死亡总数 某年总人口数
1000
28
H0:该批产品合格,即该批产品有害微生物感染率为1% H1:该批产品不合格,即该批产品有害微生物感染率超过1% =0.05
本例,n=100,X=3<5,不满足近似正态分布的条件,不能 用正态分布来近似。可以直接计算H0成立的情况下,得到至 少发生3例的概率P。
P =P(X≥3)=1-P(X<3)=1-(P(X=0)+P(X=1)+P(X=2)) =1-[(1-0.01)100+C1100×0.01×(1-0.01)99+C2100×0.012×(1-0.01)98]
计数资料统计描述_科学学位PPT课件

(3)常见率的计算
病死率 (fatality rate):表示一定时期内,患
某病的全部病人中因该病死亡者的比例。
某年某病的病死率=一定时期内因某病死亡的人数 同期内确证为某病的人数
K
24
(4)率的统计学意义 率是表示频率或强度的指标。 影响因素相同时,率越大则事物发生的频率或强 度越大;对疾病而言,频率越大,对人群的危害 也越大。
25
常用的相对数指标
2、构成比 proportion 定义 公式 特点 构成比的统计学意义
26
(1)定义:构成比说明某一事物内部各 组成部分所占的比重或分布。常以百分比表示。
(2)公式
构成比
某一组成部分的观察单位数 同一事物各组成部分观察单位总数
100%
27
设某事物个体数的合计由A1,A2,…,Ak个部分组成,构 成比计算为:
构成比1
A1
100%
A1 A2 Ak
构成比2
A2
100%
A1 A2 Ak
构成比K
AK
100%
A1 A2 Ak
K个构成比的合计为100%
28
(3) 特 点
a. 一组资料各部分构成比之和为100%; b. 当某一部分构成比增大时,其余部分的构成比相 应减少。
… 2000386
关于孕妇分娩的原始资料记录
年龄 27 22 25 24 30 32 27 29 … 26
职业 无 无
管理人员 知识分子 管理人员
无 无 无 … 无
文化程度 中学 小学 大学 中学 大学 小学 中学 大学 … 小学
分娩方式 顺产 助产 顺产 顺产 顺产
统计学--第二章计量资料的统计描述幻灯片PPT

甲组 26 28 30 32 34
乙组 24 27 30 33 36
丙组 26 29 30 31 34
课件
36
离散程度(或变异程度)
指数据参差不齐的程度,反映资料的 离散趋势。
将反映平均水平与离散程度的指标结 合起来使用,可全面地描述数据的分 布规律。
课件
37
(一)全距(或极差 , Range )
(53.0 55.0) / 2 54(cm)
数。
课件
28
中位数的应用
中位数可用于任何分布的定量资料; 资料的分布呈明显偏态,特别是负偏态; 分布的一端或两端无确定的数值;
(如:>50, 或 <10)
资料的分布不清。 注意:在完全对称的单峰曲线分布中,同
一组资料的均数与中位数相同, Mean = Median
XX22XX2
XX2 2 XX2
课件
19
(二)几何均数 Geometric mean,
G
反映一组呈倍数关系的观察值的平 均水平
适用:数据呈正偏态分布,经对数 转换后呈正态分布。多用于观察值 之间呈倍数关系,如抗体滴度
计算方法
➢直接法
➢加权法
课件
20
1.直接法
G n X1X2...Xn
lg1lgX1 lgX1 ...lgXn
对称分布
正偏态分布
课件
负偏态分布
9
三、频数表和频数分布图的用途
揭示变量的分布特征和分布类型; 便于进一步计算指标和统计分析处
理; 便于发现某些特大或特小的可疑值
。
课件
10
频数分布的两个特征
集中趋势,central tendency
指变量值的中心数值或中心位置所在。
乙组 24 27 30 33 36
丙组 26 29 30 31 34
课件
36
离散程度(或变异程度)
指数据参差不齐的程度,反映资料的 离散趋势。
将反映平均水平与离散程度的指标结 合起来使用,可全面地描述数据的分 布规律。
课件
37
(一)全距(或极差 , Range )
(53.0 55.0) / 2 54(cm)
数。
课件
28
中位数的应用
中位数可用于任何分布的定量资料; 资料的分布呈明显偏态,特别是负偏态; 分布的一端或两端无确定的数值;
(如:>50, 或 <10)
资料的分布不清。 注意:在完全对称的单峰曲线分布中,同
一组资料的均数与中位数相同, Mean = Median
XX22XX2
XX2 2 XX2
课件
19
(二)几何均数 Geometric mean,
G
反映一组呈倍数关系的观察值的平 均水平
适用:数据呈正偏态分布,经对数 转换后呈正态分布。多用于观察值 之间呈倍数关系,如抗体滴度
计算方法
➢直接法
➢加权法
课件
20
1.直接法
G n X1X2...Xn
lg1lgX1 lgX1 ...lgXn
对称分布
正偏态分布
课件
负偏态分布
9
三、频数表和频数分布图的用途
揭示变量的分布特征和分布类型; 便于进一步计算指标和统计分析处
理; 便于发现某些特大或特小的可疑值
。
课件
10
频数分布的两个特征
集中趋势,central tendency
指变量值的中心数值或中心位置所在。
计数资料的 统计学处理PPT课件

某 组 成 部 分 的 观 察 单 位 数
构 成 比
100%
各 组 成 部 分 的 观 察 单 位 总 数
4
特点: (1)总和等于100%或1; (2)不能同时都增大或减小。
5
• 率(rate):又称频率指标,说明某现 象发生的频率或强度。
率
发 生 某 现 象 的 观 察 单 位 数 K
可 能 发 生 某 现 象 的 观 察 单 位 总 数
• 目的意义 • 方法 (1)直接法 适用条件:各小组率已知。
13
步骤: 1. 选定标准 2. 计算预期发生数 3. 求标准化率
例:某医师观察某种病两种方法的治疗 效果,结果见下表。比较这两种方法 的治愈率。
14
某病两种治疗方法的治疗效果
甲法
乙法
组别
治疗 人数
治愈 治愈率 治疗 人数 (%) 人数
病死率 死于某病的人数 100% 该病的患病总人数
治愈率
某病的治愈人数 该病接受治疗的人数
100%
9
漏诊率未被 确诊 实断 为为 该某 病病 的的 病病 人人 数数100% 误诊率确 被实 诊不 断是 该某 病病 的的 病人 人数 数100%
10
• 相对比(ratio):反映指标间的相 对水平。
两组子代的高血压患病率
父或母患病组
患病 人数
101
未患病 人数
104
合计 205
患病率 (%)
49.268
父母均患病组 112
41
153 73.203
合计
213
145
358 59.497
24
七、2检验
• 基本思想
2
(AT)2 T
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年龄组(岁) 患者人数
患者构成比(%)
0~
9
3.8
10~
36
15.3
20~
34
14.4
30~
37
15.7
40~
45
19.1
50~
39
16.5
60~
21
8.9
70~
6.3
合计
236
100.0
例如某医师对口腔门诊不同年龄龋齿患病情况
( 表 5-3 ) 进 行 了 分 析 , 得 出 40~49 岁 组 患 病 率 高 , 0~9岁组和70岁及以上组患病率低的错误结论。
表5-2 已婚育龄妇女不同情况下放环失败率的比较
放环情况 放环人数 失败人数 失败人数比(%) 失败率(%)
(1) (2) (3)
(4)
(5)
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
合计
359
126
100.0
35.1
课件
18
表5-3 口腔门诊龋齿患者年龄构成
n1 n2
课件
21
例如用某疗法治疗肝炎,甲医院
治疗150人,治愈30人,治愈率为20%; 乙医院治疗100人,治愈30人,治愈率 为30%。两个医院合计治愈率应该是 [(30+30)/(150+100)] ×100% =24%。
课件
22
4.注意资料的可比性
(1)观察对象是否同质,研究方法是否相 同,观察时间是否相等,以及地区、周围环境、 风俗习惯和经济条件是否一致或相近等。
第五章
计数资料的统计描述
课件
1
讲述内容
第一节 第二节 第三节 第四节
常用相对数 应用相对数的注意事项 率的标准化法 动态数列及其分析指标
课件
2
计数资料(分类资料): 总体:有限或无限个定性(分类)变量值 样本:从总体中抽取的n个定性(分类)变量值 整理为:分类个体数,即:计数资料频数表
绝对数
课件
·
·
·
构成比 k
Ak A1+A2 + + Ak
100%
k个构成比的合计应为100%。
课件
11
例5-2 某医院1990年和1998年住院病人
死于五种疾病的人数见表5-1。1990年因五种 疾病死亡的人数共190人,其中死于恶性肿 瘤者58人,恶性肿瘤死亡人数占五种疾病死 亡人数的构成比为58/190×100%=30.53%。 同理可分别计算出1990年和1998年循环系统 疾病、呼吸系统疾病等死亡占五种疾病死亡 人数的构成比,结果见下表。
1.意义:说明某现象发生的频率或
强度,又称为率。常以百分率(%)、
千分率(‰)、万分率(1/万)、十万
分率(1/10万)等表示。
课件
6
2.公式
率
某时期内发生某现象的观察单位数 同期可能发生某现象的观察单位总数
比例基数
*:比例基数的选择:
习惯用法
使计算的结果能保留1~2位整数,以便阅读。
课件
9
2.公式:
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
100%
课件
10
设某事物个体数的合计由A1,A2,···, Ak个部分组成,构成比的计算为
构成比1
A1 A1+A2 +Ak
100%
构成比2
A2 A1+A2+ + Ak
100%
课件
19
2.计算相对数分母不宜太小
如果例数较少会使相对数波动较大。如某
种疗法治疗5例病人5例全部治愈,则计算治愈
率为5/5×100% =100%,若4例治愈,则治愈率
为4/5×100% =80%,由100%至80%波动幅度较
大,但实际上只有1例的变化。
课件
20
3. 正确计算合计率
若 p1 X1 n1 , p2 X 2 n2 则合计率p X1 X 2
课件
14
三、相对比(ratio)
即两个有关指标之比,说明两指标间的比
例关系。两个指标可以是性质相同,如不同 时期发病数之比;也可以性质不同,如医院 的门诊人次与病床数之比。通常以倍数或百 分数(%)表示,计算公式为
相对比=甲乙指指标标 (100%)
式中两指标可以是绝对数、相对数或平均数。
课件
15
3
统计描述指标—相对数
相对数即两个有联系的指标之比,分为强度 相对数和结构相对数两种。
常用相对数指标有比、比例和率三种:
比(ratio):两个有关指标之比; 比例(proportion):比的分子是分母的一部分; 率(rate):与时间有关系的比例。
课件
4
第一节 常用相对数
课件
5
一、强度相对数
例如患病率通常用百分率、婴儿死亡率用千 分率、肿瘤死亡率以十万分率表示。
课件
7
例 5-1 某企业 2003 年有 2839 名职工,该
企业每年都对职工进行体检,这一年新发生
高血压病人
5
例,高血压发病率为
5 2839
1000‰ = 1.76‰ 。
课件
8
二、结构相对数
1.意义:表示事物内部某一部分的个 体数与该事物各部分个体数的总和之比, 用来说明各构成部分在总体中所占的比重 或分布,又称为构成比或百分比。
例5-3 某年某医院出生婴儿中,男
性婴儿为370人,女性婴儿为358人,则 出生婴儿性别比例为370/358×100 = 103, 说明该医院该年每出生100名女婴儿,就 有103名男性婴儿出生,它反映了男性婴 儿与女性婴儿出生的对比水平。
课件
16
第二节 应用相对数的注意事项
课件
17
1. 不能以构成比代率
(2)观察对象内部结构是否相同,若两组 资料的年龄、性别等构成不同,可以分别进行 同年龄别、同性别的小组率比较或对总率(合 计率)进行标准化后再作比较。
课件
23
5. 样本率(或构成比)同样 存在抽样误差,故应进行样本率 (或构成比)差别的假设检验。
课件
24
课件
12
表5-1 某医院五种疾病死亡人数和构成比
疾病构成
1990 年 死亡人数 构成比(%)
恶性肿瘤
58
30.53
循环系统疾病
44
呼吸系统疾病
37
消化系统疾病
19
23.16 19.47 10.00
传染病
32
16.84
合计
190
100.00
课件
1998 年 死亡人数 构成比(%)
40
26.85
44
29.53
29
19.46
18
12.08
18
12.08
149
100.00
13
3. 特点:
(1)说明同一事物的k个构成比的总和应 等于100%,即各个分子的总和等于分母。
(2)各构成部分之间是相互影响的,某 一部分比重的变化受到两方面因素的影响。 其一是这个部分自身数值的变化,其二是受 其它部分数值变化的影响。