医学统计学公式总结
一 资料的描述性统计
(一)算术均数(mean)
(1)简单算术平均值定义公式为(直接法):
(2)利用频数表计算均数(加权法):
(二)方差(即标准差的平方)
(三)变异系数
二 参数估计与参考值范围
(一)均数的标准误
(二)样本率的标准误 (p 为样本率)
(三)T 分布 (u 为总体均数)
(四)总体均数的区间估计 (一般要
求
计算95%或99%的可信区间)
(五)总体率的区间估计
n
x n x x x x x n ∑=
++++= 321∑∑=
++++++++=
f
fx
f f f f x f x f x f x f x k k k 3213322111
)(22--=
∑n x x s 222
()/1
x x n
s n -=
-∑∑%100?=x
s
CV n
s s x =
n p p s p )
1(-=
n
s x t μ
-=
x x s t x s t x ναναμ,2/,2/+<<-p
p s u p s u p 2/2/ααπ+<<-
(六)参考值范围估计 双侧1-a 参考值范围:
s u x a 2/±
单侧1-a 参考值范围:
s u x a ->或s u x a +<
(可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书)
三 T 检验与方差分析
(一)T 检验
(1)单样本T 检验
检验假设: (假设样本来自均数为0
u 的正态总体)
统计量t 值的计算:
(2)配对T 检验 检验假设:
统计量t 值的计算:
(d 为两组数据
的差值,Sd 为差值的标准差) (3)两样本T 检验
检验假设:
统计量t 值的计算:
其中
两样本方差齐性检验 (即为两样本方
差的比值)
(二)单因素方差分析
μμ=:H 1
,/0
0-=-=-=n n
s x s x t x νμμ0
210==-μμμ:H d d d t s μ-==1-=n ν2
10μμ=:H 2
1)
()(2121x x s x x t ----=
μμ221-+=n n ν????
??+=
-21
2
1121n n s s C
x x 2)()(112
222112-+∑-∑+-=
n n x x x x s C
22
21s s F =111-=n ν1
22-=n ν
SS MS F SS MS νν=
=
B B B
W W W
(1)完全随机设计资料的方差分析
这里 (T 即为该组数据之和)
(2)随机单位组设计资料的方差分析
SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差
(两种方差分析的主要区别在于:从组内变异中分解出单位组变异与误差变异。)
四 列联表分析 卡方检验
基本公式 其中 ν=(R-1)(C-1)
(不太常用,理解)
(一)四格表资料的卡方检验
(1)两样本率的比较
四格表专用公式
组内组间总SS SS SS +=组内
组间总ννν+=2
()/C x N =∑
ij j
T x =∑
表5-7 随机单位组设计资料的方差分析表
来源 SS ν MS F
处理组间
C T SS i n
B -∑=2
11 11-=k B ν 11B B SS ν E
B MS MS 1 单位组间
C B SS j k
B -∑=212 12-=n B ν 22B B SS ν E B MS MS 2
合计 C x SS T -∑=
T
T T A 2
2
)(-∑=χN
n n T C R RC ?=))()()(()(2
2d b c a d c b a N
bc ad ++++?-=
χT A 2
2
)
5.0(--)2/(22N N bc ad ?--
校正公式
(后面为四格表专用校正公式,注意使用条件) Fisher 确切概率法大家自己掌握
(2)配对四格表 (校正公式)
(二)行×列表的 卡方检验
基本公式 ν=(R-1)(C-1)
(三)双向无序资料的关联性检验
列联系数C 取值范围在0~1之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。
(四) 多个样本率间的多重比较 每一个两两比较的检验水准:
注意:1、有1/5以上格子的理论频数小于5;
2、一个理论频数小于1;
3、总样本例数小于40
当有以上三种情况或之一存在时,均不适宜进行卡方检验
五 非参数统计 秩和检验
(一)配对样本比较的秩和检验
当n ≤25时,按秩和检验结果查表可得
当n>25时,正态近似法做u 检验
1,)(22
=+-=νχc
b c b 1,)1(22
=+--=νχc b c b )1(2
2
-=?∑C
R n n A N χ2
2
χχ+=
n C 比较的次数
α
α=
'
()()
122
/1'-=
-=
k k k k αα
α24
)12)(1(5.04)1(++-+-=
n n n n n T u
绝对值相同的数较多时,用校正公式 (j t 为第j 个差值的个数)
(二)两独立样本比较的秩和检验
超出附表范围时,按正太近似法计算
平均秩次较多时,应进行校正
(三)H 、M 检验属于理解内容
六 回归与相关
(一)直线回归方程的求法
yy l 的分解:
222
)?()?()(Y Y Y Y Y Y -+-=-∑∑∑
方差分析
T 检验
48
)
(24)12)(1(5.04)1(3
∑--
++-+-=
j j t t n n n n n T u 12
/)1(5
.02/)1(211+-+-=
N n n N n T u c
u
u c =
)
()(13
3N N t t c j j ---=∑ XX
XY l
l X X Y Y X X b =---=∑∑
)())((X
b Y a -=XX XX XY XY l b l l bl SS 22
/===回XX
XY l l b /=剩
回
剩剩回回MS MS SS SS F =
=
υυ2
1-==n 剩回,υυ
b
S b t 0-= , 2-=n υ
b S =
Y X S ?=
=
SY.X 为回归的剩余标准差,反映了y 在扣除x 的影响后的离散程度;Sb 为样本回归系数标准误。
(二)直线回归方程的区间估计
(1)总体回归系数β的可信区间 b n S t b )2(,2/-±α
(3)个体Y 值的容许区间
公式中Y X
S ?为剩余标准差,为了简化计算,当
X 与X 接近且n 充分大时,可用
Y X
S ?代替
?
Y Y S -。
(三)相关系数的计算
这里
(2) 的估计 Y
?
μ?Y X
Y S S ?=??/2,2/2,2??(,)n n Y
Y Y t S Y t S αα---+YY
XX XY l l l y y x x y y x x r =
----=
∑∑∑2
2
)
()())((n
X X
X X /)()(22
2
∑∑∑-=-n
Y
X XY Y Y X X ∑∑∑∑-
=--)()(??/2,2/2,2??(,)n n Y Y
Y Y Y t S Y t S αα-----
+?Y X
Y Y S S ?-=
(1)相关系数的假设检验
(2)总体相关系数的可信区间
1)首先对r (r 不是正态分布)作如下Z 转换
2)计算Z 的(1- α)可信区间
3)对计算出的Z 的上下限作如下变换,得到r 的(1- α)可信区间
(3)相关系数与回归系数的相互换算
(4)等级相关系数的计算
d --每对观察值Xi 、Yi 所对应的秩次Ui 、Vi 之差; n --对子数。
等级相关系数的假设检验 当 查rs 界值表 当 按下式计算统计量
服从自由度为n-2的t 分布,查t 界值表。
2
102
--=-=
n r r
S r t r 2
-=n υ)
1()1(ln
21tanh 1r r z r z -+=
=-或)
3/,3/(2/2/-+--n z n z ααμμ1
1
)tanh(22+-==z
z e e r z r 或XX YY
r l l =YX
XY b b r =2)
1(6122--
=∑n n d r s 2
/12--=
n r r t s s
r s 50
≤n 50
>n s
r t