生物统计学复习提纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学复习提纲(2008)
第1章 统计学的基本概念
总体:根据研究目的确定的同质研究对象的全体(集合)。 样本:从总体中随机抽取的部分观察单位。
根据观察数据之间有无缝隙(gap ),常将数据分类为离散型变量(有缝隙)与连续型变量(无缝隙)两大类。
参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数
统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 ,为参数附近波动的随机变量。
第2章 统计描述
①集中趋势(central tendency): 变量值集中位置,即平均水平指标。常用描述集中趋势的统计量有:
1. 算术均数(arithmetic mean),简称均数 (mean)
2. 几何均数(geometric mean),适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如增长速度、抗体滴度资料
3. 中位数 (median),反映一批观察值在位次上的平均水平。
4. 众数(mode ),适用于大样本;较粗糙。
5. 调和均数(harmonic mean ),反映变量不同阶段的平均增长率或平均规模。 几种平均数之间的关系
算术平均数 > 几何平均数 > 调和平均数
②离散趋势(tendency of dispersion): 变量值围绕集中位置的分布情况,即个体观察值的变异程度。常用的变异指标有:
1.极差(Range )(全距)。
2.百分位数与四分位数间距Percentile and Quartile range 。 上面两个指标没有考虑到每个观察值的变异。
3.方差V ariance: 也称均方差(mean square deviation ),观察值的离均差平方和的均值。总体和样本的方差分别记为σ2,S 2。
4.标准差Standard Deviation: 方差的正平方根;其单位与原变量X 的单位相同。总体和样本的方差分别记为σ,S 。
5.变异系数 Coefficient of V ariation :x
S CV =
。
6. 标准误(standard error, SE): 样本均数的标准差,记为x S 。可用于衡量抽样误差的大小。样本标准误与总体标准差σ有如下关系:n σS x /=
描述一组数值变量资料的分布特征时,对于正态分布,应选用算术平均数和标准差,对于偏态分布应选用中位数和四分位数间距
S X 、()11)(2
2
2
2
∑----=∑∑n n
X X n X X S =
样本方差
数据标准化的方法是把原始观测值(亦称得分,score)和均值之差除以标准差;得到的度量称为标准得分(standard score,又称为z-score)。
S x
x
score
z -
=
-
例:假定两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。
分数的均值标准差
一班78.53 9.43
二班70.19 7.00
那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢?
张颖的标准得分为(90-78.53)/9.43=1.22
刘疏的标准得分为(82-70.19)/ 7.00=1.69
第3章 常见的概率分布
一、二项分布
若一个随机变量X 的可能取值是k = 0,1,…,n ,且相应的取值的概率为: P (X =k )= k n k k n C --)1(ππ 则称此随机变量X 服从以n 、π为参数的二项分布,记为X ~B (n ,π)。
二、泊松分布
当二项分布中n 很大,π很小时,二项分布就变成为Poisson 分布,所以Poisson 分布实际上是二项分布的极限分布。
三、正态分布
若连续型随机变量x 的概率分布密度函数为
22
2)(21
)(σ
μπ
σ--=
x e
x f
其中μ为平均数,σ2为方差,则称随机变量x 服从正态分布(normal distribution),记为x ~N (μ,σ2)。 正态分布具有以下几个重要特征:
(1)图形呈钟型、中间高、两头低、左右对称
(2)图形最高处对应于X 轴的值就是均数(位置参数) (3)标准差决定曲线的形状(形状参数) (4)曲线下面积为1
(5)是一个正态分布簇,经u 变换可转换为标准正态分布
标准正态分布
将一般的N (μ,σ2)转换为μ=0,σ2=1的正态分布。我们称μ=0,σ2=1的正态分布为标准正态分布(standard normal distribution),记为N (0,1)。
正态曲线下面积分布规律 标准正态分布 正态分布 面积或概率 -1~1 μ±σ 68.27% -1.96~1.96 μ±1.96σ 95.00% -2.58~2.58 μ±2.58σ 99.00%
不论总体的分布形式如何,只要样本含量n 足够大时,样本均数的分布就近似正态分布,此规律称为中心极限定理。
四、χ2分布(chi-square distribution )
假设从标准正态总体N (,)01中抽取k 个独立样本,则2
2
22
1...k Z Z Z +++的分布称自由度为υ=k-1的χ2分布。
{}0,1,2,!
0X P oisson ~()
x e P X x x x X P μμ
μμμ-=== 为大于的常数,服从以为参数的分布