医学统计知识点整理

医学统计知识点整理
医学统计知识点整理

医学统计学知识点整理

第一节统计学中基本概念

一、同质与变异

同质:统计研究中,给观察单位规定一些相同的因素情况。

如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。

变异:同质的基础上个体间的差异。

“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的

二、总体与样本

1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。

2、样本:是从总体中随机抽取的部分观察单位变量值的集合。

三、参数与统计量

总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π

样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p

总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包

括区间估计和假设检验

四、误差:实测值与真值之差★

1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。

2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。

3.非系统误差:过失误差,可以避免或清除。

五、概率

是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。

统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。

第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。

一、数值变量资料

又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。

二、无序分类变量资料

又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。

分类:二分类:+ -;有效,无效;多分类:ABO血型系统

特点:没有度量衡单位,多为间断性资料

【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )

A.定量资料

B.计量资料

C.计数资料

D.等级资料

【答案】C

【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。

【例题单选】测量正常人的脉搏数所得的变量是()

A.二分类变量

B.多分类变量

C.定量变量

D.定性变量

【答案】C

【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。

三、有序分类变量资料

半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。

特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同

举例:- + ++ +++

第三节统计工作的基本步骤★

1.统计设计

2.收集资料

3.整理资料

4.分析资料:

统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。

统计推断:是使用样本信息来推断总体特征。统计推断包括区间估计和假设检验。第四节统计表与统计图★

一、统计表

统计表的基本结构与要求

标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加表的序号。

标目:横标目和纵标目。

线条:通常采用三线表和四线表的形式。没有竖线或斜线。

数字:表内数字一律用阿拉伯数字。同一指标,小数位数应一致,位次对齐。无数字用“—”表示。暂缺用“…”表示。“0”为确切值。

备注:位于表的下面,通常是对表内数字的注解和说明,必要时可以用“*”等标出。一张统计表的备注不宜太多。

二、制表原则

重点突出,一个表一个中心内容

主谓分明,层次清楚

简单明了,一切文字数字线条尽量从简

【例题单选】统计表内不列的项是( ) (2010.7)

A.标目

B.线条

C.数字

D.备注

【答案】D

【解析】统计表内备注位于表的下面,不列在统计表内,所以本题选择D。

三、统计图

1.(1)标题(2)标目(3)刻度(4)图例:不同颜色或者不同线条表示,需要说明。

2.常用统计图的适用条件与要求

(1)条图:适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。(2)圆图和百分比条图:构成比的比较

(3)线图:描述某统计量随另一连续性数值变量变化而变化的趋势。

(4)直方图:数值变量的频数分布。

(5)散点图:用点的密集程度和趋势描述2个变量间的数量关系

(6)箱式图:多组数据分布的比较

(7)统计地图:用不同的颜色和花纹表示统计量的在地理分布上的变化,适宜描述研究指标的地理分布。

【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。

【答案】线图

数值变量资料的统计分析

第一节数值变量资料的统计描述

一、频数分布表★

1.编制步骤

(1)计算全距(2)确定组距(3)划分组段(3)统计频数(4)确定频率与累计

频率

2.频数分布表的主要用途:

(1)揭示资料的分布类型(2)观察资料的集中趋势和离散趋势(3)便于发现某些特大或特小离群值(4)便于进一步计算统计指标和作统计处理

二、集中趋势指标★

数值变量资料的集中趋势指标是用平均数来描述的,代表一组同质变量值的平均水平。常用的有算术均数、几何均数和中位数。

1.算数均数适用于对称分布(正态分布)或者近似对称分布的资料。习惯上以μ表示总体均数,以表示样本均数。

2.几何均数数值变量呈倍数关系或者呈对数正态分布,如抗体效价及抗体滴度,某些传染病的潜伏期、细菌计数等,宜用几何均数(G)。几何均数常用于等比资料或对数正态分布资料。

3.中位数是指将一组变量值从小到大排列,位次居中的观察值就是中位数。适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。

4.百分位数是一种位置指标,以P x表示,把一组数据从小到大排列后,理论上有x%的变量比P x小,有(100-x)% 的变量值比P x大。

【例题单选】描述正态分布资料集中趋势的指标是()

A.中位数

B.几何均数

C.算术平均数

D.标准差

【答案】C

【解析】算数均数适用于对称分布或者近似对称分布的资料。几何均数常用于等比资料或对数正态分布资料。中位数适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。标准差描述数据的离散趋势指标。所以本题选择C。

三、离散趋势指标★

1.极差和四分位数间距

极差:简记为R,亦称全距,即一组变量值中最大值与最小值之差,反应变量值的离散范围。

四分位数间距Q:一般和中位数一起描述偏态分布资料的分布离散趋势。

3.方差和标准差:

均离散情况。标准差是方差的正平方根。

用途:

(1)用于表示正态或近似正态分布资料的离散度;

(2)反映均数的代表性

标准差越小,数据离散程度越小,均数的代表性越好。

(3)确定医学参考值范围

95%医学参考值范围 3.变异系数(CV )适用条件:①观察指标单位不同,如身高、体重 ②同单位资料,但均数相差悬殊

四、正态分布与参考值范围的制定★ (一)正态分布

1.概念:也称高斯分布,是医学和生物学最常见、最重要的一种连续性分布。

2.特征:(1)在直角坐标的横轴上方呈钟型曲线,两端与X 轴永不相交,且以X=μ为对称轴左右完全对称(2)在x=μ处,f(X)取最大值 (3)正态分布有两个参数,即均数μ和标准差σ。均数μ描述了正态分布的集中趋势位置,若固定σ,改变μ值,曲线沿着X 轴平行移动,其形状不变,故μ称为位置参数。标准差σ描述了正态分布的离散程度,若固定μ,σ越小,曲线越陡峭;反之,σ越大,曲线越平坦.故σ称为形状参数或离散度参数。(4)正态曲线下的面积分布有一定的规律。 4.正态曲线下面积的分布规律 (二)医学参考值范围的制定

医学参考值:是指绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。

s

x 96.1

第二节 数值变量资料的统计推断★ 一、

均数的抽样误差与标准误

抽样误差:由于个体变异和抽样造成的样本统计量与总体参数和样本统计量之间的差异。

均数的抽样误差:由于抽样造成的样本均数与总体均数和样本均数间的差异。 标准误:样本均数的标准差,用来表示。

n

x

σ

σ

=

(σ未知)

二、t 分布

t 分布曲线以0为中心,t 分布为一簇单峰分布曲线,υ不同,曲线形状不同 t 分布与υ有关,υ越小, t 值越分散,t 分布的峰部越低,而两侧尾部翘得越高 t 界值表中一侧尾部面积称单侧概率 (α) 两侧尾部面积之和称双侧概率(α/2) 如:t0.05/2,9=2.262 , t0.05,9=1.833在相同自由度时,〡t 〡 值增大,α减小 在相同α 时,单尾α 对应的t 值比双尾α 的小 三、总体均数的区间估计 统计描述

n S S x =

1

,-=-=

-=n v S x n S

x t x

μ

μ

统计分析参数估计---用样本指标估计总体指标

统计推断

假设检验

总体均数置信区间(可信区间)的计算

区间估计:是按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。(一)小样本或σ 未知----按 t 分布

(二)1.已知σ ----- u分布

2.σ 未知,但大样本(n>60 )----按u 分布

四、假设检验的意义和基本步骤★

假设检验:先对总体的参数或分布做出某种假设,再用适当的统计方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。

基本步骤:

1、建立检验假设,确定检验水准

(无效假设)μ=μ0

(1)H

0:

(2)H

(备择假设)μ≠μ0,μ>μ0 或μ<μ0

1:

(3)确定检验水准α=0.05

2.选定检验方法,计算检验统计量

3.确定P值,作出推断结论

第三节均数的t检验与u检验★

t 检验应用条件:样本与总体/两样本均数的比较

①当n<60时,要求样本取自正态分布的总体,总体标准差未知;

②两小样本均数比较时,要求两样本总体方差相等(σ

12= σ

2

2)。

③n含量较大,u分布

一、单样本t检验

适用于样本均数代表的未知总体均数μ和已知总体均数μ

的比较。

ν=n-1

二、配对样本t检验

适用于配对设计的计量资料,常见的配对设计主要有以下情形:①自身比较:同一受试对象处理前后。②同一受试对象分别接受两种不同的处理。③将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。

前提条件:d变量服从正态分布

【例题单选】作配对样本t检验的前提条件是( )

A.两组数据独立

B.两组数据不独立

C.两组数据的差值服从正态分布

D.两组数据的差值不服从正态分布

【答案】C

【解析】配对样本t检验样本可以是自身配对,也可以异体配对,所以数据可以独立,也可以不独立。它处理的是两样本的差值,所以差值要服从正态分布才可以应用配对样本t检验,所以本题答案选C。

三、两样本t检验

适用条件:完全随机设计的两样本均数的比较。比较两样本所代表的总体均数μ

1和μ

是否相等。完全随机设计是将受试对象完全随机分配到两个不同处理组。

2

要求:独立、正态、方差齐性

四、两样本u检验

完全随机设计的两样本均数的比较。适用于样本量比较大的资料(n1>60且n2>60)

五、假设检验应注意的问题

1、假设检验应有严格的抽样设计-同质

2、要注意选用的假设检验方法的应用条件

3、正确区分差别有无统计意义与有无专业上的实际意义

4、结论不能绝对化

5、假设检验的单侧检验与双侧检验的选择

假设检验的两类错误

,犯第Ⅰ类错误的概率大小为α。

第Ⅰ类错误:拒绝实际上成立的H

第Ⅱ类错误:不拒绝实际上不成立的H

,犯第Ⅱ类错误的概率为β。

当样本含量n一定时,α越小,β越大;若想同时减少α和β,只有增大样本含量。

确有差别时,按检验水准α能1-β称为假设检验的功效当所研究的总体与H

够发现它(拒绝H

)的概率。

分类变量资料的统计分析

第一节分类变量资料的统计描述★

一、常用相对数

率:说明某现象发生的频率或强度。

构成比:说明某一事物内部各组成部分所占的比重或分布。

相对比:说明一个指标是另一个指标的几倍或百分之几。

【例题单选】某医院住院病人中有15%的胃癌患者,该15%是()

A.患病率

B.发病率

C.构成比

D.相对比

【答案】C

【解析】15%的胃癌患者指的是胃癌患者占住院病人的15%,所以是构成比。

【例题填空】构成比是说明________或分布指标。率是说明_________或强度的指标。【答案】比重;频率

二、应用相对数时应注意的问题

(2011.7简答题)

1.计算相对数时,观察单位数应足够多

2.分析时不能以构成比代替率

3.相对数的相互比较应注意可比性,不具有可比性应进行标准化

4.样本率或构成比的比较应做假设检验

第二节分类变量资料的统计推断★

一、率的抽样误差与标准误

二、总体率的区间估计

1.查表法:当n较小,如n≤50,特别是p接近与0或1时(小概率事件),按二项

分布原则估计总体率的可信区间。

2.区间估计 正态近似法:当样本含量n 足够大,样本率p 或1-p 均不太小时[如np 和n(1-p)均大于5],样本率的分布近似正态分布,总体率可信区间在(1-a )可信度下,估计为: P ±u α/2S p

例:总体率95%的可信区间: P ±1.96Sp ;总体率99%的可信区间: P ±2.58Sp 三、两总体率之差的区间估计

条件:当样本含量n 足够大,样本率p 或1-p 均不太小时,即np 和n(1-p)均大于5,样本率的分布近似于正态分布([p 1-p 2 ]-u α/2S p1-p2, ([p 1-p 2 ]+u α/2S p1-p2) 四、率的u 检验

(一)样本率与总体率比较的u 检验 (二)两样本率比较的u 检验 第三节 χ2检验★

一、四格表资料的χ2检验★

(一)四格表资料的χ2检验的基本思想

假设两组资料率的差异来自抽样误差,用χ2 值反映实际频数和理论频数吻合的程度。在H 0(π1=π2)成立的条件下,实际频数与理论频数相差不应该很大,若实际算出的χ2值较大,超过了设定的检验水准,则有理由怀疑H 0的真实性,从而拒绝

H 0,接受H 1(H 1:π1≠π2)

应用:推断两个(或多个)总体率或构成比之间是否有差别和多个样本率间的多重比较

一、四个表资料的卡方检验 四个表χ2检验基本公式: 四个表χ2检验专用公式:

适用条件:两样本率比较时,总例数n ≥40且所有格子T ≥5 (二)四格表资料的χ2检验的校正公式★

T T A 2

2

)

5.0(--∑=χ 或 1.当n ≥40且所有的T ≥5时,用χ2检验的基本公式或四格表资料χ2检验的专用公式;当P ≈a 时,改用四格表资料的Fisher 确切概率法。

2.当n ≥40但有1≤T<5时,用四格表资料χ2检验的校正公式或改用四格表资料的Fisher 确切概率法

3.当n <40,或T <l 时,用四格表资料的Fisher 确切概率法。 (三)四格表资料的确切概率法★

四格表资料的Fisher 确切概率法是一种直接计算概率的方法,理论依据是超几何分

)

)()()(()2/(22

d b c a d c b a n n bc ad ++++--=χ

布,四格表资料的确切概率法不属于χ2检验的范畴,常作为四格表资料假设检验的补充。

二、配对四格表资料的χ2检验

配对设计四个表卡方检验公式:若b+c≥40

,ν=1

若b+c<40

,ν=1

三、行×列表资料的χ2检验

用于多个样本率的比较,两个或多个构成比的比较

理论频数不应小于1,1≤T<5的格子数不应超过总格子数1/5

多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。

一般的χ2检验不适用于有序分类资料(等级资料)——“等级”、“程度”、“优劣”的比较分析。因为检验只利用了两组构成比提供的信息,损失了有序指标包含的“等级”信息。

第四节秩和检验★

秩和检验是将定量数据从小到大、等级从弱到强或从强到弱转换成秩后,求秩和,计算检验统计量——秩统计量,做出统计推断。

应用:

不满足t检验条件的数值变量资料

有序分类变量资料(等级资料)

分布类型不明

一端或二端无确定数值

任何分布类型的资料

秩和检验应用中的注意事项

(1)秩和检验一方面由于其方法的稳健性而具备不受总体分布限制,适用范围广的优点,但另一方面,在秩转换的过程中损失了原数据的部分信息。如果已知计量资料满足(或近似满足)t检验应用条件,这时若选秩和检验,由于没有充分利用资料提供的信息,会降低检验效能。即当H

不真时,秩和检验将不如t检验能较灵敏的

o

,犯第2类错误的概率要比t检验大。

拒绝H

o

(2)对于计量资料,若满足正态和方差齐性条件,应选t检验对总体均数作假设检验;当资料偏离假定条件时,选用秩和检验才是可靠的。

(3)对于大样本资料,通过把原变量值或等级转换成秩后,可采用t检验方法对平均秩次进行检验。

【例题填空】等级资料的比较宜选用______检验。 【答案】秩和

【例题简答】秩和检验的优点

【答案】秩和检验适合任何分布的资料;具有较好的稳健性。

第十八章 直线回归和直线相关

第一节 直线回归

用于分析两变量间依存变化的数量关系 一、直线回归方程

式中的X 为自变量;式中的?是由自变量X 推算应变量Y 的估计值。 a 是回归直线在Y 轴上的截距,即X=0时的Y 值;

b 为样本的回归系数,即回归直线的斜率,表示当X 变动一个单位时,Y 平均变动b 个单位。

a 和

b 的估计常用最小二乘法原则

所有的点离回归线的纵向距离最近;回归线必然通过 求回归方程的的步骤:

①在普通坐标系中作散点图,看是否有直线趋势。

)

,(Y X

医学统计学-名词解释

统计学 1.医学统计学: 是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科。(医学研究的对象主要是人体以及与人体的健康和疾病相关的各种因素) 2.同质: 性质相同的事物成为同质的,否则成为异质的或间杂的。 (观察单位间的同质性的进行研究的前提,也是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的) 3.变异: 是指在同质的基础上各观察单位(或个体)之间的差异。 4.总体: 总体是根据研究目的所确定的同质观察单位的全体。 5.样本: 样本是从总体中随机抽取的部分个体。(样本中包含的个体数称为样本含量) 6.随机: 即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。(包括抽样随机、分组随机、实验顺序随机) 7.统计量: 由样本所算出的统计指标或特征值称为统计量。(反映样本特性的有关指标) 8.参数: 总体的统计指标或特征值称为参数。 (总体参数是事物本身固有的、不变的,为常数) 9.抽样误差: 从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。这种在抽样研究中不可避免。(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异)10.概率: 描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。 11.频率: 用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。显然有 f = m / n 12.小概率事件: 当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。(为进行统计推断的依据) 13.定量资料: 以定量值表达每个观察单位的某项观察指标,如血脂,心率等。 14.定性资料: 以定性方式表达每个观察单位的某项观察指标,表现为互不相容的类别或属性,如血型、性别等。 15.等级资料: 以等级表达每个观察单位的某项观察指标,如疗效分级、血粘度、心功能分级等。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t '检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t 检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果 为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe 法,SNK 法等。 1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal -Wallis 法。如 果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。 1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果 检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。** 绝不能对其中的两 组直接采用t检验,这样即使得出结果也未必正确**

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学-知识梳理

均数±标准差:表示集中位置、离散程度均数±标准误:表示平均水平、抽样误差大小P75 一、标准差的主要作用是估计正常值的范围 实际应用中,估计观察值正常值范围应该用标准差(s),表示为“Mean±SD”。此写法综合表达一组观察值的集中和离散特征的变异情况,说明样本平均数对观察值的代表性。s 的大或小说明数据取值的分散或集中。s与样本均数合用, 主要是在大样本调查研究中, 对正态或近似正态分布的总体正常值范围进行估计。如果不是为了正常值范围估计,一般不用。当数据与正态分布相差很大,或者虽为正态分布, 但样本容量太小(小于30 或100),也不宜用估计正常值范围。 二、标准差还可用来计算变异系数(CV) 当两组观察值单位不同, 或两均数相差较大时,不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。: 标准误的正确使用 一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验, 它们之间的变异程度用。显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。因此,为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。实际应用中应该写成“平均数±标准误”或而英文表示为“Mean±SE”的形式。 二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。 根据正态分布原理,与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用(其中 (n-1) 为样本容量是n的t界值)表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。 三、标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。例如:某当地小麦良种的千粒重=34克,现在从外地引入一新品种,通过多小区的田间试验得到千粒重的平均数=克,问新引进品种千粒重与当地良种有无显著差异新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,而,由于,故,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样 误差引起,因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。 总之,标准差和标准误最常用的统计量,二者都是衡量样本变量(观察值) 随机性的指标,只是从不同角度来反映误差,二者在统计推断和误差分析中都有重要的应用。如果没有标准差,人们就无法看出一组观察值间变异程度有多大,这些数字到底有无代表性,如果没有标准误又很难看出我们的样本平均数是否可以代表总体平均数。所以二者都非常重要。 定量资料的统计描述:

医学统计学知识点梳理

第一章绪论 一、名词解释 1.统计学:是一门关于收集、分析、解释和表达数据的科学。 2.设计(design):根据研究的问题与目的,从统计学的角度对各步提前做出的周密计 划和安排。是整个研究的基础,是关键的一步。 3.收集资料(data collection):获得研究所需要的原始数据的过程。 4.整理资料(data storing):对收集到的原始资料进行归类整理汇总的过程。 5.分析资料(data analysis):对整理的资料进行统计分析,获取资料中有关信息的过程。 6.n同质(homogeneity):对观察指标影响较大且可以控制的主要因素尽可能的相同。 7.n变异(variation):同质基础上个体间的差异。 8.n.总体(population):根据研究目的确定的,所有同质研究对象的某些指标的集合。 9.n样本(sample):从总体中随机抽取的、数量足够的、能代表总体特征的部分研究 对象某些指标的集合。 10.参数(parameter):描述总体特征的指标称为参数。 11.统计量(statistic):描述样本特征的指标 12.变异(variation):对同质研究对象某指标值得波动性称为变异。 13.误差(error):实际观察值与客观真实值之差 14.系统误差(systematic error):在实际观测过程中,由受试对象、研究者、仪器设备、 研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。 15.过失误差:由科研工作者的失误或过错造成的误差。 16.n.抽样误差(Sampling error):由个体变异产生的,由于抽样造成的样本统计量与总 体参数的差异,称为抽样误差。 17.随机误差(random error):在没有过失误差和系统误差的条件下仍存在大量偶然无 法消除的不确定因素所引起的误差为随机误差。 18.n频率(frequency):在相同条件下,独立重复实验n次,其中事件A出现了m次, 那么事件A发生的频率记为f(A)=m/n,0≤f(A)≤1 19.变量(variable):观察结果的取值不能事先确定的某一特征叫随机变量(random variable)简称变量 20.n概率(Probability):描述随机事件发生可能性大小的度量(P)。取值范围:不可能 事件0~1。估计方法:当n足够大时,用频率估计概率。小概率事件:P ≤0.05(5%)或P ≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率原理即某事件发生的概率很小,可以视为只进行一次实验时,我们说这个事件是“不会发生的”,这句话在大多数情况下是正确的,但他一定有犯错误的时候。 21.资料(data):变量全部或部分测量值构成资料 22.计量资料(measurement data):每个研究对象的变量值为一数值,表现出有量的大 小,由这样一组研究对象定量观测值所构成的资料为计量资料。 23.计数资料(enumeration data):每个研究对象的变量值为互不相同的属性之一,由 这样一组研究对象定性变量值组成的资料为技术资料。 24.等级资料(ranked data):每个研究对象变量值为互不相容的属性之一,且这些属性 间有程度的递进或递减关系,有这样一组研究对象变量值组成的资料为等级资料。 25.实验因素(study factor):研究者根据研究目的在实验中需要观察并阐明其效应的因 素

医学统计学选择题大全

医学统计学常见考题 1. 要反映某市连续5年甲肝发病率的变化情况,宜选用 C A.直条图 B.直方图 C.线图 D.百分直条图 2. 下列哪种统计图纵坐标必须从0开始,D A. 普通线图 B.散点图 C.百分分直条图 D.直条图 3. 关于统计表的列表要求,下列哪项是错误的?A A.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧B.线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 4. 医学统计工作的基本步骤是 C A.统计资料收集、整理资料、统计描述、统计推断 B.调查、搜集资料、整理资料、分折资料 C.设计、搜集资料、整理资料、分析资料 D.设计、统计描述、统计推断、统计图表

5. 统计分析的主要内容有B A. 描述性统计和统计学检验 B.统计描述和统计推断 C.统计图表和统计报告 D.描述性统计和分析性统计 6 制作统计图时要求D A.纵横两轴应有标目。一般不注明单位 B. 纵轴尺度必须从0开始 C.标题应注明图的主要内容,一般应写在图的上方 D. 在制作直条图和线图时,纵横两轴长度的比例一般取5:7 7. 痊愈、显效、好转、无效属于C A. 计数资料 B. 计量资料 C. 等级资料 D.以上均不是 8. 均数和标准差的关系是D A.愈大,s愈大 B.愈大,s愈小 C.s愈大,对各变量值的代表性愈好 D.s愈小,对各变量值的代表性愈好 9. 对于均数为,标准差为的正态分布,95%的变量值分布范围为B A. - ~ + B. -1.96~ +1.96 C. -2.58 ~ +2.58 D. 0 ~ +1.96

相关文档
最新文档