医学统计学绪论SUN
合集下载
医学统计学绪论

第一章
绪论
第一章
一、重ห้องสมุดไป่ตู้内容
一、重点内容
医学统计学的定义 统计工作的基本步骤 统计资料的变量类型 统计学中的几个基本概念
医学统计学的定义 医学统计学(medical statistics)是运用概率论和数理统计的基本原理
和方法,结合医学实践,研究医疗卫生领域中资料的收集、整理和分析 的一门应用科学。
的影响因素相同或基本相同。 变异(variation):是指同质观察单位个体间某项指标数值上存在的
差异。
总体(population):是根据研究目的所确定的同质观察单位某项变 量值的集合。
样本(sample):是根据随机性原则从总体中抽取出部分具有代表性 的观察单位某项指标变量值的集合。
参数(parameter):就是用来描述总体特征的统计指标,一般是未 知的常数。
随机误差(random error):受偶然因素的影响,对同一对象的多次 测量结果不完全一致。
抽样误差(sampling error):是指在抽样过程中所产生的样本统计量 与总体参数或样本同一统计量之间的差异。
概率(probability):是描述随机事件发生可能性大小的数值。 频率(frequency):是在相同的条件下进行了n次试验,在这n次试 验中事件A发生的次数m称为事件A发生的频数,其比值m/n称为事件A 发生的频率,记为fn(A)=m/n。
第一章
二、疑难知识点
二、疑难知识点
资料类型的判断 三种误差的区分 参数与统计量的区分 小概率事件的认识
第一章
三、常考知识点
三、常考知识点
统计工作的基本步骤 统计资料类型的判别 总体与样本的概念 统计分析的内容 统计推断的内容
第一章
绪论
第一章
一、重ห้องสมุดไป่ตู้内容
一、重点内容
医学统计学的定义 统计工作的基本步骤 统计资料的变量类型 统计学中的几个基本概念
医学统计学的定义 医学统计学(medical statistics)是运用概率论和数理统计的基本原理
和方法,结合医学实践,研究医疗卫生领域中资料的收集、整理和分析 的一门应用科学。
的影响因素相同或基本相同。 变异(variation):是指同质观察单位个体间某项指标数值上存在的
差异。
总体(population):是根据研究目的所确定的同质观察单位某项变 量值的集合。
样本(sample):是根据随机性原则从总体中抽取出部分具有代表性 的观察单位某项指标变量值的集合。
参数(parameter):就是用来描述总体特征的统计指标,一般是未 知的常数。
随机误差(random error):受偶然因素的影响,对同一对象的多次 测量结果不完全一致。
抽样误差(sampling error):是指在抽样过程中所产生的样本统计量 与总体参数或样本同一统计量之间的差异。
概率(probability):是描述随机事件发生可能性大小的数值。 频率(frequency):是在相同的条件下进行了n次试验,在这n次试 验中事件A发生的次数m称为事件A发生的频数,其比值m/n称为事件A 发生的频率,记为fn(A)=m/n。
第一章
二、疑难知识点
二、疑难知识点
资料类型的判断 三种误差的区分 参数与统计量的区分 小概率事件的认识
第一章
三、常考知识点
三、常考知识点
统计工作的基本步骤 统计资料类型的判别 总体与样本的概念 统计分析的内容 统计推断的内容
第一章
《医学统计学》之医学统计学绪论[精品文档].ppt
![《医学统计学》之医学统计学绪论[精品文档].ppt](https://img.taocdn.com/s3/m/e46bd42d0242a8956aece41e.png)
1. 随机变量及其分类 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 概率
第四军医大学卫生统计学教研室 2021年3月3日
1. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
变量值习惯用小写拉 丁字母表示 ,如性别 x1=1 (男) 、x2 =1 (男)、x3 =0 (女) 、…。
5
5 男 59 上 高分化 Ⅲ 阴性 85
35
…… … … … … …
…
…
第四军医大学卫生统计学教研室 2021年3月3日
实例数据2
体重指数 身高 班制 劳动强度 紧张程度 心率 嗜肥肉史 收缩压 舒张压 中风家族史
(1) (2)(3) (4) (5) (6) (7) (8) (9) (10) 12.24 1.62 1 1 3 70 1 146 90 有 16.47 1.63 3 1 3 72 0 110 70 无 15.19 1.64 1 2 2 72 0 100 70 无 15.59 1.63 1 1 3 84 1 114 70 无 12.60 1.64 3 1 3 68 1 116 68 无 … …… … … … … … … …
果(12)
第四军医大学卫生统计学教研室 2021年3月3日
统计工作的基本步骤
1. 统计设计:包括调查、实验设计。 2. 收集资料:取得准确可靠的原始资料 3. 整理资料:对资料进行清理、改错,数量 化 4. 分析资料:统计描述、统计推断
第四军医大学卫生统计学教研室 2021年3月3日
医学统计学
用统计学原理和方法研究医学问题
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月)
第四军医大学卫生统计学教研室 2021年3月3日
1. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
变量值习惯用小写拉 丁字母表示 ,如性别 x1=1 (男) 、x2 =1 (男)、x3 =0 (女) 、…。
5
5 男 59 上 高分化 Ⅲ 阴性 85
35
…… … … … … …
…
…
第四军医大学卫生统计学教研室 2021年3月3日
实例数据2
体重指数 身高 班制 劳动强度 紧张程度 心率 嗜肥肉史 收缩压 舒张压 中风家族史
(1) (2)(3) (4) (5) (6) (7) (8) (9) (10) 12.24 1.62 1 1 3 70 1 146 90 有 16.47 1.63 3 1 3 72 0 110 70 无 15.19 1.64 1 2 2 72 0 100 70 无 15.59 1.63 1 1 3 84 1 114 70 无 12.60 1.64 3 1 3 68 1 116 68 无 … …… … … … … … … …
果(12)
第四军医大学卫生统计学教研室 2021年3月3日
统计工作的基本步骤
1. 统计设计:包括调查、实验设计。 2. 收集资料:取得准确可靠的原始资料 3. 整理资料:对资料进行清理、改错,数量 化 4. 分析资料:统计描述、统计推断
第四军医大学卫生统计学教研室 2021年3月3日
医学统计学
用统计学原理和方法研究医学问题
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月)
《医学统计学》之医学统计学绪论

利用样本数据估计总体参数,如总体均数、总体率等。
研究生存时间、生存率等指标,分析影响因素和预测模型。
多元统计分析
如因子分析、聚类分析、主成分分析等,适用于复杂数据结构的研究。
生存分析
适用于长期观察和随访研究的数据分析。
利用多种统计方法综合分析多个变量之间的关系。
01
02
03
04
05
06
05
医学统计学的报告与解读
置信区间
VS
在解释研究结果时,应注意结果的统计学显著性和实际意义。如果观察到的结果具有统计学显著性,但无实际意义或价值较小,则不应过度强调或夸大其效果。同时,应注意结果的稳健性和可重复性,以评估结果的可靠性和可信度。
研究结果的报告
在报告研究结果时,应遵循准确、客观、完整和可理解的原则。结果应清晰明了地呈现,并附有适当的解释和说明。同时,应注意结果的伦理和法律问题,保护受试者的隐私和权益,避免误导读者或造成不必要的困扰。
《医学统计学》之医学统计学绪论
目录
contents
医学统计学简介医学统计学的基本概念医学统计学的应用领域医学统计学的数据处理与分析方法医学统计学的报告与解读医学统计学的挑战与未来发展
01
医学统计学简介
医学统计学是一门应用数理统计学的原理和方法,对医学实验和调查数据进行整理、分析和推断的学科。它具有数学性质和应用性质,是医学领域中不可或缺的工具。
生物统计学在药物研发过程中起到关键作用,如新药临床试验的设计与分析、药物疗效的评估等。
03
02
01
04
医学统计学的数据处理与分析方法
实验室研究:通过实验手段获取有关生物标志物、病理生理等方面的数据。
去除或纠正错误、异常或不完整的数据。
研究生存时间、生存率等指标,分析影响因素和预测模型。
多元统计分析
如因子分析、聚类分析、主成分分析等,适用于复杂数据结构的研究。
生存分析
适用于长期观察和随访研究的数据分析。
利用多种统计方法综合分析多个变量之间的关系。
01
02
03
04
05
06
05
医学统计学的报告与解读
置信区间
VS
在解释研究结果时,应注意结果的统计学显著性和实际意义。如果观察到的结果具有统计学显著性,但无实际意义或价值较小,则不应过度强调或夸大其效果。同时,应注意结果的稳健性和可重复性,以评估结果的可靠性和可信度。
研究结果的报告
在报告研究结果时,应遵循准确、客观、完整和可理解的原则。结果应清晰明了地呈现,并附有适当的解释和说明。同时,应注意结果的伦理和法律问题,保护受试者的隐私和权益,避免误导读者或造成不必要的困扰。
《医学统计学》之医学统计学绪论
目录
contents
医学统计学简介医学统计学的基本概念医学统计学的应用领域医学统计学的数据处理与分析方法医学统计学的报告与解读医学统计学的挑战与未来发展
01
医学统计学简介
医学统计学是一门应用数理统计学的原理和方法,对医学实验和调查数据进行整理、分析和推断的学科。它具有数学性质和应用性质,是医学领域中不可或缺的工具。
生物统计学在药物研发过程中起到关键作用,如新药临床试验的设计与分析、药物疗效的评估等。
03
02
01
04
医学统计学的数据处理与分析方法
实验室研究:通过实验手段获取有关生物标志物、病理生理等方面的数据。
去除或纠正错误、异常或不完整的数据。
医学统计学绪论

1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数 据分析方法误用达55.7%。
年《中华预防医学杂志 》:中华医学会系列杂志误用约 54% (1995)。
医学统计学绪论
第191页9
3. 伪造统计数据违反科学道德
➢ 1976年New Science 杂志关于科研舞弊 行为调查
(1)74%调查表反应有不正当修改数据情 况
You should always worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.
一、设计
1.专业设计:选题、建立假说、确定 研究对象和技术方法等→个性
2.统计设计:围绕专业设计确定统计 设类型、样本大小、分组方法、统计
分析指标及统计分析方法。
医学统计学绪论
第242页4
二、搜集资料
(一)资料起源
➢ 第一手资料 ① 经常性:统计报表(死亡登记、疫情 汇 报等),工作统计(病历、化验);
(2)17%拼凑试验结果
(3)7%凭空捏造数据
(4)2%有意曲解结果
医学统计学绪论
第20页
A Warning!
Fancy statistical methods cannot rescue garbage data
Fancy statistical methods can help you gain insight into your data, over and above what seems obvious on its face
年《中华预防医学杂志 》:中华医学会系列杂志误用约 54% (1995)。
医学统计学绪论
第191页9
3. 伪造统计数据违反科学道德
➢ 1976年New Science 杂志关于科研舞弊 行为调查
(1)74%调查表反应有不正当修改数据情 况
You should always worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.
一、设计
1.专业设计:选题、建立假说、确定 研究对象和技术方法等→个性
2.统计设计:围绕专业设计确定统计 设类型、样本大小、分组方法、统计
分析指标及统计分析方法。
医学统计学绪论
第242页4
二、搜集资料
(一)资料起源
➢ 第一手资料 ① 经常性:统计报表(死亡登记、疫情 汇 报等),工作统计(病历、化验);
(2)17%拼凑试验结果
(3)7%凭空捏造数据
(4)2%有意曲解结果
医学统计学绪论
第20页
A Warning!
Fancy statistical methods cannot rescue garbage data
Fancy statistical methods can help you gain insight into your data, over and above what seems obvious on its face
《医学统计学》医统-第一章绪论

医学统计中的基本概念
随机测量误差: 由于各种偶然因素的影响也会造成同一对象多次 测定的结果不完全一致。
非人为的偶然因素使得结果时高时低,没有固定倾 向,是不确定、不可预知的。
特点:没有倾向性,多次测量计算平均值可以减 小甚至消除随机测量误差。
(随机测量误差,抽样误差)。
编辑课件
医学统计中的基本概念
编辑课件
医学统计中的基本概念
误差:观测值-真实值、样本统计量-总体参数 包括:系统误差、随机测量误差、抽样误差
系统误差: 指数据搜集和测量过程中由于仪器初 始状态未调零、标准试剂未经校正、 医生掌握疗效标准偏高或偏低等原因, 造成观察结果呈倾向性的偏大或偏小, 这种误差称为系统误差。
必须克服!
编辑课件
编辑课件
第二节 医学统计学的基本内容 统计描述:描述及总结一组数据的重要特征, 目的是使实验或观察得到的数据表达清楚并便 于分析。统计描述结果的表达方式主要是统计 指标、统计表和统计图。
编辑课件
第二节 医学统计学的基本内容
统计推断:指由样本数据的特征推断总体特 征的方法,包括参数估计和假设检验。参数 估计的重要性在于可以给出区间估计;假设 检验重点则是比较参数的大小。
既有计数资料的特性,又兼有半定量的性质。 特点:每一个观察单位没有确切值
各组之间有性质上的差别或程度上的不同。
统计分析方法的选用与数据类型有密切的关系。根 据分析的需要,不同类型的变量或数据之间可以进 行转换。
编辑课件
军训服装:男装 女装 S M L XL
学霸 学酥 学渣 学灰 西安 宝鸡 渭南 咸阳 榆林
编辑课件
医学统计中的基本概念 同质:指根据研究目的所确定的观察单位其性质应大 致相同。 (同一总体中的每一个体都具有相同的性质的特征。)
医学统计学课件-绪论

– 偏倚:志愿参加研究者更关心自己的健康: 注意饮食及营养,禁烟酒、坚持体锻。
2019年9月15日
健康工人偏倚
化学物质接触与白血病发生的队列研究; 研究组:接触苯的工人,对照组:普通工人; 结果:两组发生白血病比例相似; 结论:接触苯与白血病发生无关
2019年9月15日
非同期对照偏倚
2019年9月15日
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
分类资料
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例
数
2019年9月15日
3. 误差 error
误差:实际观察值与客观真实值之差
2019年9月15日
2. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
编号 性别 体重 疗效 (ID) (X) (kg) (Z)
(Y)
张1
1
66
0
李2
1
78
1
王3
0
57
2
…
…
…
…
2019年9月15日
(1). 计量资料
研究监护室建立在心梗中作用; 研究组:2019-2000年监护室建立后死
亡率15%,对照组:2019-2019年监护 室建立前死亡率25%; 结果:建立监护室减少心梗死亡率。
2019年9月15日
(2)随机误差random error
排除上述误差后尚存的误差,受多种无法控制 的因素的影响。976年New Science 杂志关于科研舞弊 行为的调查
2019年9月15日
健康工人偏倚
化学物质接触与白血病发生的队列研究; 研究组:接触苯的工人,对照组:普通工人; 结果:两组发生白血病比例相似; 结论:接触苯与白血病发生无关
2019年9月15日
非同期对照偏倚
2019年9月15日
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
分类资料
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例
数
2019年9月15日
3. 误差 error
误差:实际观察值与客观真实值之差
2019年9月15日
2. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
编号 性别 体重 疗效 (ID) (X) (kg) (Z)
(Y)
张1
1
66
0
李2
1
78
1
王3
0
57
2
…
…
…
…
2019年9月15日
(1). 计量资料
研究监护室建立在心梗中作用; 研究组:2019-2000年监护室建立后死
亡率15%,对照组:2019-2019年监护 室建立前死亡率25%; 结果:建立监护室减少心梗死亡率。
2019年9月15日
(2)随机误差random error
排除上述误差后尚存的误差,受多种无法控制 的因素的影响。976年New Science 杂志关于科研舞弊 行为的调查
医学统计学课件-绪论课件

要点一
卫生资源分配
要点二
医疗质量评估
运用统计学方法分析卫生资源的分配 情况,为资源的合理配置提供依据。
通过统计学方法评估医疗服务的质量 和效率,提高医疗服务的整体水平。
要点三
社会因素对健康的影 响
运用统计学方法研究社会因素对健康 的影响,为制定健康政策和干预措施 提供依据。
05
医学统计学实例分析
临床医学研究实例分析
数据分析与解释
如何对医学数据进行深入的 分析和解释,包括统计检验 、方差分析、回归分析、生 存分析等。
统计方法与应用
如何选择合适的统计方法来 分析不同类型的数据,如计 数资料、计量资料等。
医学统计学在医学中的应用
01
临床试验设计
02
诊断试验评估
03
疾病预后研究
在临床试验设计中,医学统计 学可以帮助制定合理的试验方 案,确定样本量和分组方法。
02
医学统计学基础知识
统计学的概念与特点
统计学是一门研究数据的方法论
统计学是数学的一个分支,它研究如何从数据中提取有用的信息,并对其进行归纳和总结,从而得出结论和预 测趋势。
统计学的主要特点
统计学主要特点包括:1)以数据为研究对象;2)重视数据的质量和可靠性;3)注重运用计算机技术进行分 析;4)提供科学决策的依据。
相关与回归分析
总结词
研究变量之间的相互关系,并建立回归模型进行预测
详细描述
通过相关分析研究变量之间的相互关系,确定自变量与因变量之间的关系类型;通过回归分析建立回归模型, 对因变量进行预测,为进一步分析提供依据
聚类分析
总结词
将相似的对象聚成一类,不同的对象聚成不同的类
详细描述
医学统计学绪论课件

推论性统计是指通过样 本数据来推断总体特征 和规律。
参数估计
假设检验
方差分析
参数估计是指利用样本 数据来估计总体参数, 如平均数、比例等。
假设检验是指通过样本 数据来检验对总体的假 设是否成立。
方差分析是一种常用的 推论性统计方法,它能 够比较不同组数据的均 值是否存在显著差异。
回归分析
回归分析是一种寻找变 量之间关系的统计方法 ,它能够通过自变量来 预测因变量的值。
实验设计
实验设计概述
实验设计是指在研究过程中合理地安排实 验和分析数据的方法。
实验设计的基本类型
实验设计可以分为随机对照试验、非随机 对照试验、交叉试验等类型。
实验设计的基本原则
实验设计应遵循随机化、对照、重复等基 本原则。
实验设计的评估
实验设计完成后,需要对实验的可行性、 可靠性、伦理等方面进行评估。
运用统计学方法监测疾病在人群 中的分布和流行趋势,为制定预 防措施提供依据。
卫生政策评估
通过对相关数据的统计分析,评 估卫生政策的实施效果和效益。
健康状况调查
运用统计学方法对人群的健康状 况进行调查和分析,为制定健康 促进计划提供依据。
生物医学研究应用
遗传学研究
运用统计学方法分析遗传学数据,研究基因 与疾病的关系。
频数分布表是一种常用的描述性统计方法, 它能够将数据按照不同的分组进行统计,并 计算每个分组的频数和频率。
图形描述
集中趋势和离散趋势
图形描述能够通过图表直观地展示数据的分 布情况,如直方图、箱线图等。
描述性统计还涉及计算数据的集中趋势和离 散趋势,如平均数、中位数、标准差等。
推论性统计
推论性统计概 述
现状
参数估计
假设检验
方差分析
参数估计是指利用样本 数据来估计总体参数, 如平均数、比例等。
假设检验是指通过样本 数据来检验对总体的假 设是否成立。
方差分析是一种常用的 推论性统计方法,它能 够比较不同组数据的均 值是否存在显著差异。
回归分析
回归分析是一种寻找变 量之间关系的统计方法 ,它能够通过自变量来 预测因变量的值。
实验设计
实验设计概述
实验设计是指在研究过程中合理地安排实 验和分析数据的方法。
实验设计的基本类型
实验设计可以分为随机对照试验、非随机 对照试验、交叉试验等类型。
实验设计的基本原则
实验设计应遵循随机化、对照、重复等基 本原则。
实验设计的评估
实验设计完成后,需要对实验的可行性、 可靠性、伦理等方面进行评估。
运用统计学方法监测疾病在人群 中的分布和流行趋势,为制定预 防措施提供依据。
卫生政策评估
通过对相关数据的统计分析,评 估卫生政策的实施效果和效益。
健康状况调查
运用统计学方法对人群的健康状 况进行调查和分析,为制定健康 促进计划提供依据。
生物医学研究应用
遗传学研究
运用统计学方法分析遗传学数据,研究基因 与疾病的关系。
频数分布表是一种常用的描述性统计方法, 它能够将数据按照不同的分组进行统计,并 计算每个分组的频数和频率。
图形描述
集中趋势和离散趋势
图形描述能够通过图表直观地展示数据的分 布情况,如直方图、箱线图等。
描述性统计还涉及计算数据的集中趋势和离 散趋势,如平均数、中位数、标准差等。
推论性统计
推论性统计概 述
现状
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26
5、误差(Error)和抽样误差( sampling error)
统计上所说的误差泛指测量值与真值之差,样本指标与总体 指标之差。主要有以下三种:系统误差、随机测量误差、抽 样误差。
系统误差(systematic error) 概念:指数据搜集和测量过程中由于仪器不准确、标准不规范等原
因,造次观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。 流行病学称之为偏倚(bias)。 特点:有累加性。观察值有系统性、方向性、周期性的偏离真值。 可以通过严格的实验设计和技术措施消除
自然界中存在的各种现象可归纳为两类: 必然现象
随机现象
3
医学统计学简介(Introduction to medical statistics)
统计学(statistics)是认识社会和自然界中随机现象 之数量特征的一门科学。 统计学是研究数据收集和分析的一门科学和艺术 ------《大不列颠百科全书》
山东大学 流行病与卫生统计学研究所 孙秀彬
如何学习统计学?
理解基本的统计原理 培养统计思维能力:抽象的逻辑推理 多练习 联系实际:阅读文献、工作和生活实际
2
医学统计学简介(Introduction to medical statistics)
世界上各类现象的发展变化规律,都表现为质与 量的辩证统一。要认识某现象客观存在的规律性, 就必须认识其质与量的辩证关系,认识其数量关 系的特征及度的界限,这一切都离不开统计学。
28
: 概念:由于抽样而引起的样本指标与总体指标之间的差别。 特点:有抽样, 抽样误差就不可避免。 统计上可以计算并在一定范围内控制抽样误差。
不可避免,但有一定的分布规律,可估计。
29
抽样误差( random sampling error)
抽样误差(sample error): 由于随机抽样所引起的样本统计量与 总体参数之间的差异以及样本统计量之间的差别称为抽样误差。 如样本均数与总体均数之间的差别,样本率与总体率的差别等。
医学统计学(medical statistics)是以医学理论为指导,运用
数理统计学的原理和方法研究医学科研设计和医学资料的搜集、整理 与分析,从而掌握事物内在客观规律的一门学科。
4
医学统计学简介(Introduction to medical statistics)
医学统计学的内涵
医学统计学是建立在现代科学方法之上,由统计学理论指导的数据收集、 表达和分析的方法,现代科学方法可以概括为以下几点:问题的识别与表达
样本:从总体中随机抽 取的部分观察单位某变 量值 的集合
22
总体
总体是根据研究目的所确定的同质研究对象中所有观察单位 某变量值的集合。例如,研究2004年某市7岁男童体重的医学 参考值范围,其研究对象是该市的7岁健康男童,观察单位是 每个7岁健康男童,变量是体重,变量值是体重测量值,该市 2004年全体7岁健康男童的体重值构成总体。
总体所包含的范围随研究目的的不同而变化。
23
总体的三个基本特征:
①.同质性。即构成总体的各单位必须具有某种共同性质,这是形成总 体的客观依据,也是我们确定总体范围的标准。各单位必须具有这种共 同性质,是由统计研究的目的决定的。 ②.大量性。即总体是由许多单位组成的。一个或少数单位不能形成总 体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以统计研 究的对象必须包括足够多的个体。 ③.差异性。即总体的各单位除了某一方面的共同性外,在其他方面必 须是有差异的,这些差异是统计研究的基础和前提。
(发现问题、提出问题)。
搜集有关资料。 通过归纳得出假说:因果联系及重要的模式。 从假说作出演绎:进行实验或收集更多的资料。 推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐
与高血压的关系)。
5
医学统计学简介(Introduction to medical statistics)
注意:抽样误差是不可避免的。无论抽样抽得多么好,也会存在 抽样误差。但统计上可以计算并在一定范围内控制抽样误差。
减少抽样误差的方法: (1)改进抽样方法(增加样本的代表性),误差从大到小:
整群抽样单纯随机抽样系统抽样分层抽样 (2) 增加样本量; (3)选择变异程度较小的研究指标。
30
6.概率——随机事件
27
随机测量误差( random measurement error ): 由于非人为的偶然因素,对于同一样本多次测定结果不完全
一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随 机测量误差。 特点:没有倾向性,多次测量计算平均值可以减小甚至消除 随机测量误差。 提高操作者熟练程度可以减少这种误差
变量—观察单位的某一项特征 变量值—某一变量的测量值
13
变量类型 数值变量
变量按其值的性质可分为数值变量和分类变量。
数值变量(numerical variable) 其变量值是定量的,表现为 数值的大小,多有度量衡单位。如身高(cm)、体重(kg)、心 律(次/min)、住院天数(d)、血压(mmHg)等。 由数值变量的测定值组成的资料称为数值变量资料或计量资 料。大多数的数值变量的测定值是连续性的,称之为连续型 变量,如身高、体重、血压等;但有的数值变量的测定值只 是正整数,如心率、白细胞计数等,在统计学中把它们也视 为连续型变量。
统计分析时,要根据研究目的、设计类型、资料类型及其分 布特征选择恰当的统计指标和分析方法。
11
三、统计学中的几个基本概念
变量 同质 变异 总体 样本 概率
12
1. 变量(variable)
在搜集资料时,首先要根据研究目的确定同质观察单位, 再对每个观察单位的某项特征进行测量或观察,该特征 称为变量,如上述的“身高”、“体重”、“疗效”就 是变量。变量的观察结果或测量值称为变量值或观察值。 变量按其值的性质可分为不同类型。
变异是生物体的基本属性之一,也是统计研究的前提。
19
变异——生物多样性
20
变异—生物多样性
21
4. 总体(population)和样本(sample)
统计学中,描述样本特征的指 标称为统计量(statistics);描述 总体特征的指标称为参数 (parameter)。
总体:根据研究目的确 定的同质研究对象的全 体(集合)某变量值的 集合。分有限总体与无 限总体
医学统计学的学科特点
医学+数学,侧重医学,淡化数学。 用数量反映质量,如平均期望寿命,解放前为35
岁,现在70岁,可反映国家医疗卫生服务总体水 平的提高。 大量观察+实验数据分析 → 可以揭示医学规律。
6
二、统计工作的基本步骤
设计(design) 搜集资料(collection of data) 整理资料(sorting data) 分析资料(analysis of data)
随机事件(random event) 对随机现象进行实验或观察称为随机 试验。随机试验的各种可能结果的集合称为随机事件,简称事 件。在一次随机试验中,某随机事件可能发生,也可能不发生; 但在一定数量的重复试验后,该随机事件的发生与否是有规律 的。
随机事件具有: 可重复性:相同条件下可重复进行 随机性:出现两种及两种以上结果 偶然性:实验前不能肯定将出现那种 结果
8
2. 搜集资料
搜集资料须遵循统计学原理采取必要措施得到准确可靠的原 始资料。
搜集资料的原则:及时、准确、完整
统计资料的来源:①统计报表,如医院工作报表、法定传染 病报表等;②经常性工作记录,如疾病监测记录、健康档案、 住院病历等;③专题调查(或实验);④另外还可取自外来 资料,如:公开发表的有关报告、商业性数据库、专题研究 文献以及人口普查、计划生育、妇幼保健资料等。
31
概率(probability)
概率(probability):是描述随机事件发生的可能性大小的数值。 必然事件 P(A)=1、不可能事件 P(A)=0、随机事件:0< P(A)<1
小概率事件: 概率p小于或等于的随机事件,表示一次实验
中该事件发生的可能性很小。
小概率原理:小概率事件在一次试验中几乎不可能发生。利 用该原理可对科研资料进行假设检验。“小概率”的标准是
10
4. 分析资料
分析资料的目的是计算有关指标,反映数据的综合特征,阐 明事物的内在联系和规律。
统计分析包括统计描述(descriptive statistics)和统计推断 (inferential statistics)。
统计描述是用描述性指标、统计表与统计图等,对样本资料的 数量特征及其分布规律进行描述。 统计推断是指如何抽样,以及如何用样本信息推断总体特征。
15
注意:变量类型并非一成不变,可根据统计分析的需要进行转化。 进行统计分析时,需考虑变量类型及其分布特征选取适当的描述 指标和分析方法
16
统计资料类型的表现形式
17
2、 同质(homogeneity)
严格地讲,同质是指被研究指标的影响因素完全相同。但在 医学研究中,有些影响因素往往是难以控制的(如遗传、营 养等),甚至是未知的。因此,在实际工作中只有相对的同 质。
7
1. 设计
设计是在保证科学性、可重复性和高效性的前提下,为验证 研究假说而进行的周密安排。是在广泛查阅文献,全面了解 国内外研究现状的基础上,在实施科学研究之前对研究工作 的全面设想。 包括:明确研究目的和研究假说,确定研究内容、观察对象 与观察单位、样本含量和抽样方法,拟定研究方案、预期分 析指标、误差控制措施、进度与费用等。 根据研究的类型,有调查设计和实验设计之分。
24
有限总体与无限总体
若在某特定的时间与空间范围内,总体中同质研究对象的所 有观察单位的某变量值的个数是有限的,则称之为有限总体 (finite population)。
5、误差(Error)和抽样误差( sampling error)
统计上所说的误差泛指测量值与真值之差,样本指标与总体 指标之差。主要有以下三种:系统误差、随机测量误差、抽 样误差。
系统误差(systematic error) 概念:指数据搜集和测量过程中由于仪器不准确、标准不规范等原
因,造次观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。 流行病学称之为偏倚(bias)。 特点:有累加性。观察值有系统性、方向性、周期性的偏离真值。 可以通过严格的实验设计和技术措施消除
自然界中存在的各种现象可归纳为两类: 必然现象
随机现象
3
医学统计学简介(Introduction to medical statistics)
统计学(statistics)是认识社会和自然界中随机现象 之数量特征的一门科学。 统计学是研究数据收集和分析的一门科学和艺术 ------《大不列颠百科全书》
山东大学 流行病与卫生统计学研究所 孙秀彬
如何学习统计学?
理解基本的统计原理 培养统计思维能力:抽象的逻辑推理 多练习 联系实际:阅读文献、工作和生活实际
2
医学统计学简介(Introduction to medical statistics)
世界上各类现象的发展变化规律,都表现为质与 量的辩证统一。要认识某现象客观存在的规律性, 就必须认识其质与量的辩证关系,认识其数量关 系的特征及度的界限,这一切都离不开统计学。
28
: 概念:由于抽样而引起的样本指标与总体指标之间的差别。 特点:有抽样, 抽样误差就不可避免。 统计上可以计算并在一定范围内控制抽样误差。
不可避免,但有一定的分布规律,可估计。
29
抽样误差( random sampling error)
抽样误差(sample error): 由于随机抽样所引起的样本统计量与 总体参数之间的差异以及样本统计量之间的差别称为抽样误差。 如样本均数与总体均数之间的差别,样本率与总体率的差别等。
医学统计学(medical statistics)是以医学理论为指导,运用
数理统计学的原理和方法研究医学科研设计和医学资料的搜集、整理 与分析,从而掌握事物内在客观规律的一门学科。
4
医学统计学简介(Introduction to medical statistics)
医学统计学的内涵
医学统计学是建立在现代科学方法之上,由统计学理论指导的数据收集、 表达和分析的方法,现代科学方法可以概括为以下几点:问题的识别与表达
样本:从总体中随机抽 取的部分观察单位某变 量值 的集合
22
总体
总体是根据研究目的所确定的同质研究对象中所有观察单位 某变量值的集合。例如,研究2004年某市7岁男童体重的医学 参考值范围,其研究对象是该市的7岁健康男童,观察单位是 每个7岁健康男童,变量是体重,变量值是体重测量值,该市 2004年全体7岁健康男童的体重值构成总体。
总体所包含的范围随研究目的的不同而变化。
23
总体的三个基本特征:
①.同质性。即构成总体的各单位必须具有某种共同性质,这是形成总 体的客观依据,也是我们确定总体范围的标准。各单位必须具有这种共 同性质,是由统计研究的目的决定的。 ②.大量性。即总体是由许多单位组成的。一个或少数单位不能形成总 体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以统计研 究的对象必须包括足够多的个体。 ③.差异性。即总体的各单位除了某一方面的共同性外,在其他方面必 须是有差异的,这些差异是统计研究的基础和前提。
(发现问题、提出问题)。
搜集有关资料。 通过归纳得出假说:因果联系及重要的模式。 从假说作出演绎:进行实验或收集更多的资料。 推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐
与高血压的关系)。
5
医学统计学简介(Introduction to medical statistics)
注意:抽样误差是不可避免的。无论抽样抽得多么好,也会存在 抽样误差。但统计上可以计算并在一定范围内控制抽样误差。
减少抽样误差的方法: (1)改进抽样方法(增加样本的代表性),误差从大到小:
整群抽样单纯随机抽样系统抽样分层抽样 (2) 增加样本量; (3)选择变异程度较小的研究指标。
30
6.概率——随机事件
27
随机测量误差( random measurement error ): 由于非人为的偶然因素,对于同一样本多次测定结果不完全
一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随 机测量误差。 特点:没有倾向性,多次测量计算平均值可以减小甚至消除 随机测量误差。 提高操作者熟练程度可以减少这种误差
变量—观察单位的某一项特征 变量值—某一变量的测量值
13
变量类型 数值变量
变量按其值的性质可分为数值变量和分类变量。
数值变量(numerical variable) 其变量值是定量的,表现为 数值的大小,多有度量衡单位。如身高(cm)、体重(kg)、心 律(次/min)、住院天数(d)、血压(mmHg)等。 由数值变量的测定值组成的资料称为数值变量资料或计量资 料。大多数的数值变量的测定值是连续性的,称之为连续型 变量,如身高、体重、血压等;但有的数值变量的测定值只 是正整数,如心率、白细胞计数等,在统计学中把它们也视 为连续型变量。
统计分析时,要根据研究目的、设计类型、资料类型及其分 布特征选择恰当的统计指标和分析方法。
11
三、统计学中的几个基本概念
变量 同质 变异 总体 样本 概率
12
1. 变量(variable)
在搜集资料时,首先要根据研究目的确定同质观察单位, 再对每个观察单位的某项特征进行测量或观察,该特征 称为变量,如上述的“身高”、“体重”、“疗效”就 是变量。变量的观察结果或测量值称为变量值或观察值。 变量按其值的性质可分为不同类型。
变异是生物体的基本属性之一,也是统计研究的前提。
19
变异——生物多样性
20
变异—生物多样性
21
4. 总体(population)和样本(sample)
统计学中,描述样本特征的指 标称为统计量(statistics);描述 总体特征的指标称为参数 (parameter)。
总体:根据研究目的确 定的同质研究对象的全 体(集合)某变量值的 集合。分有限总体与无 限总体
医学统计学的学科特点
医学+数学,侧重医学,淡化数学。 用数量反映质量,如平均期望寿命,解放前为35
岁,现在70岁,可反映国家医疗卫生服务总体水 平的提高。 大量观察+实验数据分析 → 可以揭示医学规律。
6
二、统计工作的基本步骤
设计(design) 搜集资料(collection of data) 整理资料(sorting data) 分析资料(analysis of data)
随机事件(random event) 对随机现象进行实验或观察称为随机 试验。随机试验的各种可能结果的集合称为随机事件,简称事 件。在一次随机试验中,某随机事件可能发生,也可能不发生; 但在一定数量的重复试验后,该随机事件的发生与否是有规律 的。
随机事件具有: 可重复性:相同条件下可重复进行 随机性:出现两种及两种以上结果 偶然性:实验前不能肯定将出现那种 结果
8
2. 搜集资料
搜集资料须遵循统计学原理采取必要措施得到准确可靠的原 始资料。
搜集资料的原则:及时、准确、完整
统计资料的来源:①统计报表,如医院工作报表、法定传染 病报表等;②经常性工作记录,如疾病监测记录、健康档案、 住院病历等;③专题调查(或实验);④另外还可取自外来 资料,如:公开发表的有关报告、商业性数据库、专题研究 文献以及人口普查、计划生育、妇幼保健资料等。
31
概率(probability)
概率(probability):是描述随机事件发生的可能性大小的数值。 必然事件 P(A)=1、不可能事件 P(A)=0、随机事件:0< P(A)<1
小概率事件: 概率p小于或等于的随机事件,表示一次实验
中该事件发生的可能性很小。
小概率原理:小概率事件在一次试验中几乎不可能发生。利 用该原理可对科研资料进行假设检验。“小概率”的标准是
10
4. 分析资料
分析资料的目的是计算有关指标,反映数据的综合特征,阐 明事物的内在联系和规律。
统计分析包括统计描述(descriptive statistics)和统计推断 (inferential statistics)。
统计描述是用描述性指标、统计表与统计图等,对样本资料的 数量特征及其分布规律进行描述。 统计推断是指如何抽样,以及如何用样本信息推断总体特征。
15
注意:变量类型并非一成不变,可根据统计分析的需要进行转化。 进行统计分析时,需考虑变量类型及其分布特征选取适当的描述 指标和分析方法
16
统计资料类型的表现形式
17
2、 同质(homogeneity)
严格地讲,同质是指被研究指标的影响因素完全相同。但在 医学研究中,有些影响因素往往是难以控制的(如遗传、营 养等),甚至是未知的。因此,在实际工作中只有相对的同 质。
7
1. 设计
设计是在保证科学性、可重复性和高效性的前提下,为验证 研究假说而进行的周密安排。是在广泛查阅文献,全面了解 国内外研究现状的基础上,在实施科学研究之前对研究工作 的全面设想。 包括:明确研究目的和研究假说,确定研究内容、观察对象 与观察单位、样本含量和抽样方法,拟定研究方案、预期分 析指标、误差控制措施、进度与费用等。 根据研究的类型,有调查设计和实验设计之分。
24
有限总体与无限总体
若在某特定的时间与空间范围内,总体中同质研究对象的所 有观察单位的某变量值的个数是有限的,则称之为有限总体 (finite population)。