第一章_医学统计学方法的基本概念和基本步骤..

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计推断,揭示事物内部的规律。 可借助于计算机(常用软件:SPSS、SAS、
STATA)完成。
4、分析资料(data analysis)
统计描述(descriptive statistics)
是指用统计指标和适宜的统计图、统计表等方 法,描述统计资料的分布规律及其数量特征。
统计推断(inferential statistics)
五、概率(probability )
概率( probability ):是反映某一随机事 件发生的可能性大小的一个量度。 记为P,取值[0,1]。
必然事件:P=1 不可能事件:P=0 随机事件:0<P<1
P<0.05或P<0.01的随机事件称为小概率事件
Certain
1
统计学上认为1次抽样中不大可能发生。
特点: 有度量衡单位 多为连续性资料 例如:身高(cm)、体重(kg)
血压(mmHg)、脉搏(次/分)
红细胞计数(1012/L)
26
2.无序分类变量
(计数资料)
定义:用定性的方法得到的资料。 按观察单位某种性质或特征分组后,再分别清点各 组观察单位的个数 特点:没有度量衡单位 多为间断性资料 变量表现为互不相容的类别或属性 例如:肤色(黑、白)——二项分类 血型(ABO)——多项分类 职业(工农兵)——多项分类 性别(男女) ——二项分类
无序分类变量(unordered categorical variable ) 计数资料 有序分类变量(ordinal categorical variable ) 等级资料
1. 计量资料(measurement data):
定义:用定量方法对观察单位准确测量后所得的资料。
变量值是定量的,表现为数值大小 ,多有度量衡单位。
可借助于计算机软件(EpiData, Study Builder, Excel)来完成。


1、编码,将数据输入计算机
2、纠错改错、补漏等
4、分析资料(data analysis)
运用统计学的基本原理和方法,根据研究设计
的目的、要求、资料的类型和分布特征选择正
确的统计分析方法,进行一系列的统计描述和
干预,如动物实验研究 、临床试验,通常建立随机分组 (random allocation)方案。
2、设计(design)的内容
(1)明确研究目的和研究假说。 (2)确定研究对象与观察单位、样本含量和抽样方法。 (3)是否施加干预,如何施加干预?如何设置对照? (4)设置观察指标。 (5)需搜集哪些原始资料,用什么方法 ? (6)如何对取得资料作进一步的整理和汇总,计算统计 指标。 (7)如何控制误差。 (8)预期会得到什么结果。 (9)研究进度和经费的安排等。
0.5
Impossible
0
第二节 统计数据的类型
实验或调查研究中的观察指标称为随机变量
(random variable);
变量的观测值称为变量值(variable value)或观察值
(observed value)
由变量值构成资料(data)
根据变量值是否定量可分为 数值变量(numerical variable):计量资料 分类变量(categorical variable):

Fisher 在他的著作中多次强调,统计学家与科
学研究者的合作应该在实验设计阶段,而不是
在需要数据处理的时候。

“试验完成后再找统计学家,无异于请统计学
家为试验进行“尸体解剖”。 统计学家或许只
能告诉你试验失败的原因。”
2、收集资料(data collection)
资料的来源:
1、统计报表:疫情报表、医院工作报表等;
源自文库27
3.等级资料 (ranked data)
定义:将观察单位按某种属性的不同程度分成等级后 分组计数所得的资料。
是介于计量资料和计数资料之间的一种资料 特点:其变量值具有半定量性质 表现为等级大小或属性程度
例如: ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
3、整理资料(data sorting)
目的是对搜集到的原始资料其系统化和条 理化,便于进一步计算统计指标和深入分 析。 资料整理前要对资料再次检查与核对,发 现缺项或错项较多的调查表,须补查或剔 除。审查无误后,设计分组。
资料整理的过程
1、对原始数据进行核对和检查。 2、设计分组。 (1)质量分组:按属性或类别归类分组; (2)数量分组:按数值大小分组。 3、按分组要求设计整理表,汇总资料。
2、登记和报告卡(单):传染病和职业病发病报告卡,肿瘤发病 及死亡报告卡,出生及死亡报告单等; 3、日常医疗卫生工作记录:如门诊病例、住院病例、健康检查记 录、卫生监测记录等
4、专题调查或实验研究:开展医学科研的主要资料来源前三种都
有局限性。
资料收集计划 ①选择搜集资料的地点、人员和时间; ②搜集资料人员的培训方案; ③预调查或预实验方案拟定; ④资料的记录方式; ⑤调查表的拟订和印刷; ⑥调查或实验仪器、试剂的准备; ⑦调查资料的抽样复核比例和方法; ⑧搜集资料所需经费的准备等。
掌握的,有空间、时间的限制。
无限总体:没有具体的空间、时间的限制,
所包含的个体数目是未知的。(设想的、或
抽象的)
调查某地2002年正常成人的白细胞数 —— 总体 从某地2002年正常成人随机抽取150人,分别测 其白细胞数,组成样本。—— 样本
总体
参 数
抽取部分观察单位
样本
推断inference
在广泛的查阅文献、全面了解现状、广泛征询意见 的基础上,对将要进行的研究工作所作的全面的设想。
1、设计(design)的分类:
调查设计(survey design):对研究对象不施加任
何干预,通常建立随机抽样(random sampling)方案。 搜集资料在整个研究设计中占主要地位.
实验设计(experiment design):对研究对象施加
三、参数和统计量
parameter and statistic
参数:
根据总体个体值计算出来 的描述总体特征的的指标
希腊字母表示:如总体均数μ、
统计量:

根据样本个体值计算出来描
述样本特征的指标

总体标准差σ、总体率π等。

拉丁字母表示:如样本均数、样 本率p等。
x

是固定的常数 但一般未知。
统计量
样本: 是从总体中随机抽取的具有代表性的一部 分观察单位其某项指标的实测值的集合。
抽样(sampling):从总体中抽取部分个体的过程。
抽样时必须遵循随机化原则
如何正确地 由样本反映 总体呢?
随机性: 总体中每个个体都有相同的机会被抽取到样本 随机不等于随意
随机抽样的实现:随机数字表
4. 三类资料间关系
例:一组2040岁成年人的血压 <8 低血压 正常血压 轻度高血压 中度高血压 重度高血压
等级 资料
8 12 15 17
计量 资料 计数 资料
以12kPa为界分为正常与异常两组,统计每组例数
不同资料转化(每分钟脉搏次数) 计量资料 75 82 125 96 56 异常(<60 或>100) 速 脉( >100 ) 正常(60 ~ 100) 正常脉(60~100) 计数资料 等级资料 缓 脉( <60 )
同质基础:同一地区、同一年份、同为正常人、
无限总体 例如:研究用珍菊降压片高血压患者治疗后 的疗效
同质基础:同为高血压患者、同用珍菊降压片治疗 总体:包括设想用该药治疗的所有高血压患者的治 疗效果 这个结果没有时间和空间的限制,观察单位数 无限 无限总体
有限总体和无限总体
有限总体:总体中所包含的个体数目是可以
实例数据1
胆管癌患者部分指标 编号 性别 年龄(岁) 部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月) (1)(2) (3) (4) (5) (6) (7) (8) (9) 1 男 61 上 低分化 Ⅰ 阳性 52 14 2 女 58 中 高分化 Ⅱ 阴性 89 20 3 女 63 上 高分化 Ⅳ 阴性 93 19 4 女 71 下 中分化 Ⅱ 阳性 78 5 5 男 59 上 高分化 Ⅲ 阴性 85 35 … … … … … … … … …
本节主要内容
第一节 统计学的几个基本概念 第二节 医学统计工作的基本步骤
一、什么是医学统计学?
例1:比较两种疗法对活动期十二指肠球部溃 疡
一组:口服呋喃硝铵,有效率90%; 另一组:口服西咪替丁,有效率85%
问:能否立即下结论,呋喃硝铵疗效高于西咪 替丁?
医学统计学:应用概率论和数理统计的基本原 理和方法,研究医学领域中数据的收集、整理 和分析的一门应用性学科。
二、总体和样本
population and sample
总体:是指根据研究目的确定的性质相同的观察单
位的全体。
更确切地说,是同质的所有观察单位某项观
察值(变量值)的集合。
总体和样本
研究目的 观察单位 变 量 值 总 体
研究某地2002年正常成人白细 胞数 每个正常成人 每人测得的白细胞数 该地2002年全部正常成人的白 细胞数
第三节 医学统计学的基本步骤
1. 设 计:包括观察性研究设计和实验性 研究设计
2. 收集资料:取得准确可靠的原始资料
3. 整理资料:对资料进行清理、改错,数量化
4. 分析资料:统计描述、统计推断
1、设计(design)
定义:是在保证科学性、可重复性和高效性的 前提下,为验证研究假说而制定周密的医学研 究计划。
指导人们如何对科研问题进行严密的设计、获取可靠 的数据、正确的归纳、分析与推理判断的科学,帮助 揭示疾病或现象的发生、发展规律,为预防疾病、促 进健康提供客观依据。
二、为什么要学统计学?
1. 采用统计学方法,发现不确定现象背后隐
藏的规律。
变异(variation):是社会和医学中的普遍现象。
3. 保证你的研究论文能通过统计学审查
据国外60~80年代对不同医学杂志发表论文的 调查结果显示,有统计错误的论文所占比例高达 72%,最低也有20%。 某研究者1996年对4586篇论文统计(中华医学
会系列杂志仅占6.9%),数据分析方法误用
55.7%。
第一节 统计学的几个基本概念
同质和变异 homogeneity and variation
同质:是指除了实验因素外,影响被研究指标 的非实验因素相同。即研究对象的性质相同。
变异:是指在同质的基础上,被观察个体之间
观察指标的差异。
一、同质和变异
例1 调查2007年上海市7岁男童的身高和体重 同质:2007年、上海市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同
医学统计学方法的基本概念和 基本步骤
医学统计学的学习要求:
理解基本的统计原理 正确选择、运用统计分析方法 培养基本的统计思维能力
不要求: 公式的推导和记忆、 复杂的手工计算
2
内容:
1、 2、 3、 4、 5、 6、 7、 8、 医学统计学方法的基本概念和基本步骤 数值变量的统计描述 数值变量的统计推断 分类变量的统计描述 分类资料的统计推断 秩和检验 直线相关与回归分析 统计表和统计图

在参数附近随机波动。

普查

抽样调查
四、抽样误差( random sampling error):
由于抽样所引起的样本统计量与总体参数之间的差异 称为抽样误差。 产生的原因: 1.个体之间存在变异 2.抽样时只能抽取总体中的一部分作为样本 不可避免 但有一定的分布规律,可估计;并在一定范围内控 制抽样误差
变异使得实验或观察的结果具有不确定性,如每个人 的身高、体重、血压等各有不同。
2.用统计学思维方式考虑有关医学研究中的问题
“阳性”结果是否是虚假联系?
某感冒药治疗1周后,治愈率为90%,能否说该感冒 药十分有效?
“阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, Med,JAMA等著名医学杂 志上的71篇阴性结果的论文作过分析,发现其中有 62篇( 93%)可能是由于样本含量不足造成的假阴 性。
是通过随机样本信息推断总体特征的过程。 参数估计(parameter estimation) 假设检验(hypothesis test)
相关文档
最新文档