医学统计学复习提纲

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《医学统计学》复习提纲

第二章 统计描述

公式:几何均数

(1)直接法:

n

n X X X G ...21= 或 )lg (lg )lg ...lg lg (

lg 1211

n

X n X X X G n ∑--=+++= (2)加权法:

)lg (lg ....lg ...lg lg (lg 12122111

∑--=++++++=f X f f f f X f X f X f G k k k

中位数(median ) (1) 直接法:

n 为奇数 , 2

)

1(+=n X M n 为偶数,)(21

12

2

++=

n n X X M

(2)频数表法:用于频数表资料。 ∑-+

=)2

(L M

f n

f i L M 标准差(standard deviation ): n

X ∑-=

2

)

(μσ 1

)

(2

--=

∑n X X S

离均差平方和

2

)

(∑-X X 常用SS 或l XX 表示。∑∑∑-

=-=

=N

X X X X l SS XX 2

22

)()

(

直接法: 1

)(2

2

--=

∑∑n n X X S 加权法:

1

)(2

2

--

=∑∑

∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。

率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。

3. 应用相对数时应注意哪些问题?

4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。

制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。 (2)选定足够数量的正常人作为研究对象。

(3)用统一和准确的方法测定相应的指标。

(4)根据不同的用途选定适当的百分界限,常用95%。

(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。

(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。 5.正态分布、标准正态分布与对数正态分布的联系与区别。

三种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布,对数正态分布是不对称的,其峰值偏在左边。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。对数正态分布不属于正态分布的范畴,对数正态分布变量经对数转换后的新变量服从正态分布。

6.对称分布在“X ± 1.96S 标准差”的范围内,也包括95%的观察值吗?

不一定。均数±1.96标准差范围内包含95%的变量值是正态分布的分布规律,不是对称分布的规律。对称分布不一定是正态分布。

7.集中趋势的描述有哪些指标?各指标的具体应用条件? 8.离散程度的描述有哪些指标?各指标的具体应用条件/ 9.正态分布的特征有哪些?

10.正态分布下面积有哪些分布规律? 11.正态分布有哪些应用?

12.简述标准化的目的和基本思想;标准化率有哪些计算方法/ 13.简述频数分布表的编制方法及其主要应用。

14.中位数与百分位数在符号,意义,计算和应用有何区别和联系? 15.试比较标准差和变异系数在描述变异程度时的优势。

第三章 抽样分布与参数估计 公式

1.均数标准误的计算公式:n x /σσ= 均数标准误的估计值(x s )n s s x /=

2. t =

x

s x μ

- 3.总体均数的估计

1.σ已知时 总体均数μ的95%可信区间为(x x x x σσ96.1,96.1+-) 2.σ未知,但n 足够大(如n >100)时 总体均数μ的95%可信区间为

(x s x 96.1-,x s x 96.1+)

3.σ未知且n 小时 某自由度的t 曲线下有95%的t 值在±υ,05.0t 之间, 总体均数μ的95%可信区间为 (x s t x υ,05.0-,x s t x υ,05.0+) 4. 二项分布概率公式:X

n X X n X P --⎪⎪⎭

⎝⎛=)1()(ππ 在二项分布资料中,当π和n 已知时, 均数μ: μ=nπ μp =π,

标准差σ: σ=

)

1(ππ-n σp =

n

)1(ππ-

当π未知时,常用样本率p 作为π的估计值,式σp =

n

)1(ππ-变为: s p =

n

p p )1(-

总体率的区间估计 (一)查表法

当样本含量n 较小,如n ≤50,特别是p 很接近于0或1时 (二)正态近似法

当样本含量n 足够大,且样本率p 或1-p 均不太小,如np 与n (1-p )均大于5时, p s u p 2(α-,

)2

p s u p α+。

5. Poisson 分布的概率函数!

)(X e

X P X

μμ

-= X=1,2,3…

μ-=e P )0( 1

)

()1(+=+X X P X P μ

问答题:

1.服从二项分布及Poisson 分布的条件分别是什么?二者有哪些性质?

二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。Poisson 分布成立的条件:①平稳性:X 的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X 的取值与前面各观察单位上X 的取值无关;③普通性:在充分小的观察单位上X 的取值最多为1。

2.二项分布、Poisson 分布分别在何种条件下近似正态分布?

二项分布的正态近似:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π, )1(ππ-n )

。 Poisson 分布的正态近似:Poisson 分布P (μ),当μ相当大时(≥20),其分布近似于正态分布。

3.在何种情况下,可以用率的标准误S p 描述率的抽样误差?

当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p

描述率的抽样误差。

4. 中心极限定理的内容?(样本均数的抽样分布有哪些特点?)

5.t 分布的特征?如何进行总体均数的估计?

6.标准差和标准误的区别?

7.总体均数的可信区间与医学参考值范围的区别? 第四章 数值变量资料的假设检验 公式:

1.单样本检验

n

s

x t 0μ-=

1-=n ν

如果样本含量足够大时,可将样本均数转化为u 值

n

s

x u 0μ-=

相关文档
最新文档