生物统计学复习提纲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物统计学复习提纲(2008)

第1章 统计学的基本概念

总体:根据研究目的确定的同质研究对象的全体(集合)。 样本:从总体中随机抽取的部分观察单位。

根据观察数据之间有无缝隙(gap ),常将数据分类为离散型变量(有缝隙)与连续型变量(无缝隙)两大类。

参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数

统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 ,为参数附近波动的随机变量。

第2章 统计描述

①集中趋势(central tendency): 变量值集中位置,即平均水平指标。常用描述集中趋势的统计量有:

1. 算术均数(arithmetic mean),简称均数 (mean)

2. 几何均数(geometric mean),适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如增长速度、抗体滴度资料

3. 中位数 (median),反映一批观察值在位次上的平均水平。

4. 众数(mode ),适用于大样本;较粗糙。

5. 调和均数(harmonic mean ),反映变量不同阶段的平均增长率或平均规模。 几种平均数之间的关系

算术平均数 > 几何平均数 > 调和平均数

②离散趋势(tendency of dispersion): 变量值围绕集中位置的分布情况,即个体观察值的变异程度。常用的变异指标有:

1.极差(Range )(全距)。

2.百分位数与四分位数间距Percentile and Quartile range 。 上面两个指标没有考虑到每个观察值的变异。

3.方差V ariance: 也称均方差(mean square deviation ),观察值的离均差平方和的均值。总体和样本的方差分别记为σ2,S 2。

4.标准差Standard Deviation: 方差的正平方根;其单位与原变量X 的单位相同。总体和样本的方差分别记为σ,S 。

5.变异系数 Coefficient of V ariation :x

S CV =

6. 标准误(standard error, SE): 样本均数的标准差,记为x S 。可用于衡量抽样误差的大小。样本标准误与总体标准差σ有如下关系:n σS x /=

描述一组数值变量资料的分布特征时,对于正态分布,应选用算术平均数和标准差,对于偏态分布应选用中位数和四分位数间距

S X 、()11)(2

2

2

2

∑----=∑∑n n

X X n X X S =

样本方差

数据标准化的方法是把原始观测值(亦称得分,score)和均值之差除以标准差;得到的度量称为标准得分(standard score,又称为z-score)。

S x

x

score

z -

=

-

例:假定两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。

分数的均值标准差

一班78.53 9.43

二班70.19 7.00

那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢?

张颖的标准得分为(90-78.53)/9.43=1.22

刘疏的标准得分为(82-70.19)/ 7.00=1.69

第3章 常见的概率分布

一、二项分布

若一个随机变量X 的可能取值是k = 0,1,…,n ,且相应的取值的概率为: P (X =k )= k n k k n C --)1(ππ 则称此随机变量X 服从以n 、π为参数的二项分布,记为X ~B (n ,π)。

二、泊松分布

当二项分布中n 很大,π很小时,二项分布就变成为Poisson 分布,所以Poisson 分布实际上是二项分布的极限分布。

三、正态分布

若连续型随机变量x 的概率分布密度函数为

22

2)(21

)(σ

μπ

σ--=

x e

x f

其中μ为平均数,σ2为方差,则称随机变量x 服从正态分布(normal distribution),记为x ~N (μ,σ2)。 正态分布具有以下几个重要特征:

(1)图形呈钟型、中间高、两头低、左右对称

(2)图形最高处对应于X 轴的值就是均数(位置参数) (3)标准差决定曲线的形状(形状参数) (4)曲线下面积为1

(5)是一个正态分布簇,经u 变换可转换为标准正态分布

标准正态分布

将一般的N (μ,σ2)转换为μ=0,σ2=1的正态分布。我们称μ=0,σ2=1的正态分布为标准正态分布(standard normal distribution),记为N (0,1)。

正态曲线下面积分布规律 标准正态分布 正态分布 面积或概率 -1~1 μ±σ 68.27% -1.96~1.96 μ±1.96σ 95.00% -2.58~2.58 μ±2.58σ 99.00%

不论总体的分布形式如何,只要样本含量n 足够大时,样本均数的分布就近似正态分布,此规律称为中心极限定理。

四、χ2分布(chi-square distribution )

假设从标准正态总体N (,)01中抽取k 个独立样本,则2

2

22

1...k Z Z Z +++的分布称自由度为υ=k-1的χ2分布。

{}0,1,2,!

0X P oisson ~()

x e P X x x x X P μμ

μμμ-=== 为大于的常数,服从以为参数的分布

相关文档
最新文档