医学科研和论文撰写中常用的数据处理和统计分析方法共45页文档

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9
方差分析
• 方差分析的应用条件(多个样本均数的比较)
– 各样本须是相互独立的随机样本 – 各样本均来自正态总体 – 相互比较的各样本所来自的总体其方差相等,即方差齐
• 方差分析应用
– 两个或多个样本均数间的比较 – 分析两个或多个因素间的交互作用 – 回归方程的假设检验 – 方差齐性检验
• 完全随机设计资料:处理间变异+组内变异(误差) • 配伍组设计资料:处理间变异+配伍组间变异+内变异(误差) • 多个样本均数间的两两比较:q检验(SNK法)
连续型资料(continuous data) : 计量资料
实数范围内任意取值
离散型资料(discrete data)
实数范围内只取整数值
计数资料
离散型计量资料
如:脉搏次数/分;人数/家庭;白细胞计数/L
连续型变量:即连续变化的变量,其取值是数轴上某一区间内的一切数
值,理论上它们是无限可分的。如身高、体重。
• 我们在编审稿件过程中,经常遇到统计学
方法使用不当等问题。
企业资料
2
几个基本概念
• 变量:数值变量(定量变量)、分类变量
(定性变量):无序分类、有序分类(等 级/半定量)
• 概率:随机事件、概率、频率与概率的关
系(样本含量大到总体时,频率就等于概 率)
• 总体与样本:总体、样本、参数
企业资料
3
数学上的分类
组设计资料)
• Fisher精确概率检验法:一格T<1,n<40
企业资料
11
非参数检验
• 适用条件
– 等级顺序资料 – 偏态资料 – 未知分布类型的资料
– 要比较的各组资料变异度相差较大,其方差不齐,且不易变换达到齐 性
– 初步分析 – 特殊情况
• 配对设计差值的符号秩和检验 • 成组设计两样本比较的秩和检验:Wilcoxon秩和检验、
当n逐渐增大时,频率f/n始终在一个常数左右作微小摆动,称 该常数为随机事件A的 概率,记为: P(A) 只要观察单位数足够多,可将频率作为概率的估计值。 0 P 1, P=1 必然事件, P=0 不可能事件。 小概率事件: P 0.05,表示在一次实验或观察中该事件发生 的可能性很小。 小概率原理:小概率事件在一次实验或抽样中不可能发生, 如果发生就怀疑检验假设的正确性。
• t检验的应用条件:样本含量较小(n<30)、正态分布总体的随机样
本、两总体方差齐
• u检验的应用条件:样本含量较大(n>30)或样本含量虽小但总体
标准差已知时样本均数与已知总体均数的比较及成组设计两大样本均 数的比较
• 应用
– 样本均数与已知总体均数 – 配对设计资料 – 成组设计资料两均数间
企业资料
企业资料
6
抽样方法
• 简单随机抽样:从总体抽取样品时,使每个个体被抽到的机
会均等,以使所抽取的样本数据能够很好地代表总体的抽样 方法。(简单/单纯):抽签法、随机数表法
• 系统随机抽样(间隔):将总体按某一标志(如时间)排序,
然后按一定间隔抽取样本单位。
• 分层随机抽样:将总体按产品的某些特征划分为若干层(即
目录
• 前言 • 医学统计方法的基本概念 • 常用医学统计方法的适用条件 • 医用期刊对医学统计学的要求 • 医学统计在期刊中的正确表达
• 医学科研论文中的常见的统计学问题
• 数据的正确书写
企业资料
1
前言
• 卫生统计在医学期刊中占有非常重要的地
位。任何科研设计、实验研究都离不开统 计方法,而统计方法的正确与否直接影响 到论文的质量。
Mann-Whitney秩和检验
• 成组设计多个样本比较的秩和检验:H检验法(Kruskal-
Wallis法)
• 多个样本间两两比较的秩和检验 • 配伍组设计多个样本比较的秩和检验
企业资料
12
医学统计学方法
• 运用统计学的原理和方法研究医学领域中的生物、理化、社会、心理等
因素及机体的内外环境条件对人体健康的影响,认识人群健康和疾病现 象的数量特征。/医学统计学是运用概率论和数理统计的原理、方法紧密 结合医学实践,研究医药卫生领域中资料的收集、整理、分析和推断的 一门应用学科。
– Poisson分布:二项分布的极限分布和特例,某事件发
生率非常小时(小概率事件),则事件发生数X所服从
的概率分布
– 超几何分布:
• 数值变量的分布类型
– 正态分布 – Weibull分布
企业资料ቤተ መጻሕፍቲ ባይዱ
8
t检验、u检验
• 数值变量资料假设检验的最基本最简单的方法: t检验、u检验;仅
适用于两个样本均数的比较
56
速 脉( >100 )
变量转化只能由高级向低级转化,即从计量资料至等级资料至计数资料,但不 能做相反方向的转化。
提示: 在研究设计中,对于能测量的指标,尽可能设计为定量指标,尽 可能减少信息量的损失,并为分析过程中资料转化带来方便。
定性指标可转化为定量指标,但较粗糙 。
企业资料
5
概率 :随机事件发生可能性大小的度量。
• 多个实验组与一个对照组均数间的比较: q’检验(Dunnett t检验)
企业资料
10
卡方检验
• 分类变量资料中的应用
– 推断两个及两个以上总体率或构成比之间有无差别
– 两种属性、两种特征或两变量间相关关系是否存在
– 频数分布的拟合优度检验
• 四格表资料的卡方检验(n1+n2>40,各格T>5) • RXC列联表的卡方检验(多个率及多组构成比) • 配对资料的卡方检验 • 组内分组资料的卡方检验(逐级分组/K层组内分
• 统计资料的收集与整理 • 统计描述性
– 常用统计指标:集中趋势(算术均数X、几何均数G、中位数M、众数等)与 离散趋势(标准差S、方差S2、变异系数CV、极差R、四分位数间距Q、平均 差A等);相对数(率、构成比、动态数列);相关系数r、回归系数b、半 数效量、半数致死量;相对危险性RR以及绝对数等
小批),各层内分别用简单随机抽样法抽取一定数量的个体 组成一个样本的方法。分层按比例随机抽样。
• 整群抽样法:先将总体按某个标志分成若干群,然后随机地
抽取若干群,并由抽中的群中所有个体组成样本。
企业资料
7
几种常见的分布
• 分类变量的分布类型
– 二项分布:观察单位具有互相对立的一种结果,观察 单位的观察结果相互独立(如:治愈/未治愈、传染/未 传染)
离散型变量:其取值是0,1,2等不连续的量,是数轴上有限或无限的可
数的值,两个数之间没有小数。如年新生儿数、月手术病人数、人的牙
齿数等。
企业资料
4
不同类型资料转化举例(每分钟脉搏次数)
计量资料
计数资料
等级资料
75
缓 脉( <60 )
82
正常(60 ~ 100)
125
正常脉(60~100)
96
异常(<60 或>100)
相关文档
最新文档