生物统计:方差分析

生物统计:方差分析
生物统计:方差分析

方差分析

第五章所介绍的t 检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t 检验法就不适宜了。这是因为:

1、检验过程烦琐 例如,一试验包含5个处理,采用t 检验法要进行2

5C =10次两两

平均数的差异显著性检验;若有k 个处理,则要作k (k-1)/2次类似的检验。

2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的

多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t 检验法作两两比较,由于每次比较需计算一个21x x S ,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。例如,试验有5个处理,每个处理重复6次,共有30个观测值。进行t 检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t 检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。

3、推断的可靠性低,检验的I 型错误率大 即使利用资料所提供的全部信息估

计了试验误差,若用t 检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I 型错误的概率,降低推断的可靠性。

由于上述原因,多个平均数的差异显著性检验不宜用t 检验,须采用方差分析法。 方差分析(analysis of variance)是由英国统计学家R.A.Fisher 于1923年提出的。这种方法是将k 个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。

本章在讨论方差分析基本原理的基础上,重点介绍单因素试验资料及两因素试验资料的方差分析法。在此之前,先介绍几个常用术语。

1、试验指标(experimental index ) 为衡量试验结果的好坏或处理效应的高低,在

试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。

2、试验因素(experimental factor ) 试验中所研究的影响试验指标的因素叫试验因

素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A 、B 、C 、…等表示。

3、因素水平(level of factor ) 试验因素所处的某种特定状态或数量等级称为因素水

平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素

的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1,2,…,来表示。如A 1、A 2、…,B 1、B 2、…,等。

4、试验处理(treatment ) 事先设计好的实施在试验单位上的具体项目叫试验处理,简

称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3×3=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。

5、试验单位(experimental unit ) 在试验中能接受不同试验处理的独立的试验载体叫

试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。

6、重复(repetition ) 在试验中,将一个处理实施在两个或两个以上的试验单位上,称

为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。

第一节 方差分析的基本原理与步骤

方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。

一、线性模型与基本假定

假设某单因素试验有k 个处理,每个处理有n 次重复,共有nk 个观测值。这类试验资料的数据模式如表6-1所示。

表6-1 k 个处理每个处理有n 个观测值的数据模式

处理 观 测 值

合计.i x 平均.i x A 1 x 11 x 12 … x 1j … x 1n

.1x .1x A 2 x 21 x 22 … x 2j … x 2n

.2x .2x … …

A i x i1 x i2 … x ij … x in

.i x .i x … … A k x k1 x k2 … x kj … x kn x k . .k x

合计

..x

..x

表中ij x 表示第i 个处理的第j 个观测值(i =1,2,…,k ;j =1,2,…,n );∑==n

j ij i x x 1

.表示第

i 个处理n 个观测值的和;∑∑∑=====

k i i k i n j ij x x x 1

11...表示全部观测值的总和;n

x n x x i n

j ij i /./.1

==∑=表示第i 个处理的平均数;kn x kn x x k

i n

j ij /../..11

==∑∑==表示全部观测值的总平均数;ij x 可以分

解为

ij i ij x εμ+= (6-1)

i μ表示第i 个处理观测值总体的平均数。为了看出各处理的影响大小,将i μ再进行分解,

∑==

k

i i k

1

1

μμ (6-2)

μμα-=i i (6-3)

ij i ij x εαμ++= (6-4)

其中μ表示全试验观测值总体的平均数,i α是第i 个处理的效应(treatment effects )表示处理i 对试验结果产生的影响。显然有

01

=∑=k

i i

α

(6-5)

ε

ij

是试验误差,相互独立,且服从正态分布N (0,σ2

)。

(6-4)式叫做单因素试验的线性模型(linear model )亦称数学模型。在这个模型中ij x 表示为总平均数μ、处理效应αi 、试验误差ε

ij 之和。

由εij

相互独立且服从正态分布N (0,

σ2

),可知各处理A i (i =1,2,…,k )所属总体亦应具正态性,即服从正态分布N (μi ,σ2

)。尽管各总体的均数i μ可以不等或相等,σ2

则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity )、分布的正态性(normality )、方差的同质性(homogeneity )。这也是进行其它类型方差分析的前提或基本假定。

若将表(6-1)中的观测值x ij (i =1,2,…,k ;j =1,2,…,n )的数据结构(模型)用样本符号来表示,则

ij i i ij i ij e t x x x x x x x ++=-+-+=........)()( (6-6)

与(6-4)式比较可知,..x 、i i t x x =-)(...、ij i ij e x x =-)(.分别是μ、(μi -μ)=i α、(x ij -i μ)=ij ε的估计值。

(6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(μi -μ或...x x i -),与误差(i ij x μ-或.i ij x x -),故kn 个观测值的总变异可分解为处理间的变异和处理内的变异两部分。

二、平方和与自由度的剖分

我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(mean squares )来度量资料的变异程度的。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。

(一)总平方和的剖分 在表6-1中,反映全部观测值总变异的总平方和是各观测值x ij 与总平均数..x 的离均差平方和,记为SS T 。即

∑∑==-=k

i n

j ij T x x SS 112

..)(

因为

[]

[]

∑∑∑∑∑∑∑∑∑∑∑===========-+--+-=-+--+-=

-+-=-k

i n

j i ij n

j i ij k

i k

i i i k

i n

j i ij i ij i i

k i n

j k i n

j i ij i ij

x x x x x x x x n x x x x x x x x x x x x x x

11

2

1

1

1

2

112

2

11112

2

.)(].)(..).[(2..).(.)(.)..)(.(2..)

.(.)

(..).(..)(

其中 ∑==-n

j i ij x x 1.0)(

所以 ∑∑∑∑∑=====-+-=-k

i n

j k

i k

i n

j i ij i ij x x x x n x x 11

1

11

2.2

...2

..)()()( (6-7)

(6-7)式中,∑=-k

i i x x n

1

2..).(为各处理平均数.i x 与总平均数..x 的离均差平方和与重复

数n 的乘积,反映了重复n 次的处理间变异,称为处理间平方和,记为SS t ,即

∑=-=k

i i t x x n

SS 1

2..).(

(6-7)式中,∑∑==-k i n

j i ij x x 11

2.)(为各处理内离均差平方和之和,反映了各处理内的变异即

误差,称为处理内平方和或误差平方和,记为SS e ,即

∑∑==-=k

i n

j i ij e x x SS 112.)(

于是有

SS T =SS t +SS e (6-8)

(6-7),(6-8)两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系

式。这个关系式中三种平方和的简便计算公式如下:

C

x n SS C

x SS i k i t ij n

j k

i T -=-=∑∑∑===2

.1

2

111 (6-9)

t T e SS SS SS -=

其中,C=x 2··/kn 称为矫正数。

(二)总自由度的剖分 在计算总平方和时,资料中的各个观测值要受

∑∑===-k i n

j ij

x x

11

0..)(这一条件的约束,

故总自由度等于资料中观测值的总个数减一,即kn-1。总自由度记为df T ,即df T =kn-1。

在计算处理间平方和时,各处理均数.i x 要受∑==-k

i i x x 1...0)(这一条件的约束,故处理间

自由度为处理数减一,即k -1。处理间自由度记为df t ,即df t =k-1。

在计算处理内平方和时,要受k 个条件的约束,即

∑==-n

j i ij

x x

1

.0)((i =1,2,…,k )

。故处理内自由度为资料中观测值的总个数减k ,即kn-k 。处理内自由度记为df e ,即df e =kn-k=k(n-1)。

因为

)1()1()()1(1-+-=-+-=-n k k k nk k nk

所以

e t T d

f df df += (6-10)

综合以上各式得:

t

T e t T df df df k df kn df -=-=-=11 (6-11)

各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为

(MS T 或2T S )、MS t (或2t S )和MS e (或2

e S )。即

T T T T df SS S MS /2== t t t t df SS S MS /2== e e e e df SS S MS /2

== (6-12)

总均方一般不等于处理间均方加处理内均方。

【例6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。

表6-2 饲喂不同饲料的鱼的增重 (单位:10g )

饲料 鱼的增重(x ij ) 合计.i x

平均.i x A 1

31.9

27.9 31.8 28.4

35.9

155.9 31.18

A 2 24.8 25.7 26.8 27.9 26.2 131.4 26.28

A 3 22.1 23.6 27.3 24.9 25.8 123.7 24.74 A 4 27.0 30.8 29.0 24.5 28.5

139.8 27.96 合计 ..x =550.8

这是一个单因素试验,处理数k =4,重复数n =5。各项平方和及自由度计算如下:

矫正数 03.15169)54/(8.550/22

..=?==nk x C

总平方和 C C x SS ijl T -+++=-∑∑=2222

5.289.279.31

67.19903.151697.15368=-=

处理间平方和 27

.11403.151693.15283)8.1397.1234.1319.155(5

1.12

2222=-=-+++=-=∑

C C x n SS i t 处理内平方和 40.8527.11467.199=-=-=t T e SS SS SS 总自由度 191451=-?=-=nk df T 处理间自由度 3141=-=-=k df t 处理内自由度 16319=-=-=t T e df df df

用SS t 、SS e 分别除以df t 和df e 便得到处理间均方MS t 及处理内均方MS e 。 34.516/40.85/09

.383/27.114/======e e e t t t df SS MS df SS MS

因为方差分析中不涉及总均方的数值,所以不必计算之。

三、期望均方

如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即

222

2221,i k σσσσσ==== (i =1,2,…,k )表示第i 个处理观测值总体的方差。如果所分析的

资料满足这个方差同质性的要求,那么各处理的样本方差S 21,S 22,…,S 2k 都是σ2

的无偏估计(unbiased estimate )量。2i S (i =1,2,…,k )是由试验资料中第i 个处理的n 个观测值算得的方差。

显然,各2i S 的合并方差2e S (以各处理内的自由度n -1为权的加权平均数)也是σ2

的无偏估计量,且估计的精确度更高。很容易推证处理内均方MS e 就是各2i S 的合并。

2

221222

221

121212

.)

1()

1()(σ??→?=++++++=

++++++=

-=

--=

=∑∑∑估计e k

k

k k

k i

i ij e

e e S d

f df df S

df S df S df df df df SS SS SS n k S S n k x x df SS

MS

其中SS i 、df i (i =1,2,…,k )分别表示由试验资料中第i 个 处理的n 个观测值算得的平方和与自由度。这就是说,处理内均方MS e 是误差方差σ2

的无偏估计量。

试验中各处理所属总体的本质差异体现在处理效应i α的差异上。我们把

)1/()()1/(22--=-∑∑k k a i i μμ称为效应方差,它也反映了各处理观测值总体平均数i

μ

生物统计学期末考试上机考试部分 复习试卷B

云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0

ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

体育统计学试题

统计学模拟试题 一、名词解释。 1、总体参数:在统计学中,反映总体的一些数量特征称为总体参数 2、样本统计量:由样本所获得的一些数量特征称为样本统计量 3、随机事件:在一定的实验条件下,有可能发生也有可能不发生的事件为随 机事件 4、集中位置量数:反映一群性质相同的观察的平均水平或集中趋势的统计指标 5、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有的数据。 6、统计推断: 7、抽样误差:抽出的样本统计量之间或样本统计量与总体参数间的偏差,立要由于个体间的差异所造成。 8、相对数:相对数也称为相对指标,是两个有联系的指标的比率,它可以从数量上反映两个相互联系的事物(或现象)之间的对比关系。 9、假设检验:在实际检验过程中,主要的问题是要判定被检验的统计量之间的偏差是由抽样误差造成的,还是由于总体参数不同所造成的,要作出判断就需要对总体先建立某种假设,然后通过统计量的计算及概率判断,对所建立的假设是否成立进行检验。这类方法称为假设检验。 10、平均数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。 11、变异系数:也是反映变量离散程度的统计指标,它是以样本标准差与平均数的百分数来表示的!记作:CV 12、总体与样本: 13、离中位置量数:描述一群性质相同值的离散程度的统计指标 14、抽样:指在总体中抽取一定含量的样本。 15、频率: 16、系统误差:宏观世界是由实验对象本身的条件,或或者者仪器不准,场地品格出现故障,训练方法,手段不同所造成的,可使测试结果杨倾向性偏大或偏小。 17、结构相对数:是在分组基础上,以各个分组全计数值与总值对比的相对数。 18、a=0.05或a=0.01:指检验水准称小概率水平

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

贵州大学《生物统计学》考试试卷(含答案)

贵州大学《生物统计学》考试试卷(含答案) 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是___C___。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用__D___。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是___B_____。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-

体育统计学

课本 一,1,统计推断结论都存在出错的可能性,所有的统计结论总是和概率相关系的结论。2,统计分析步骤:根据研究的问题做出研究设计、、根据上述设计手机样本数据、、整理数据资料统计描述、、统计推断、、做统计结论、、结合专业作分析讨论。 3,影响抽样误差大小的因素:样本含量的大小、总体被研究标志的变异程度、抽样的组织方式、抽样方法。 4,常见的抽样方法有单纯随机抽样,机械抽样,分层随机抽样,整群随机抽样。 5,代表总体特征的统计指标称为参数 6,人们把所需要研究的同质对象的全体称为总体 7,从总体中抽出来用以推测总体的部分对象称为样本 二,1,体育统计资料的来源主要有两个方面:常规性资料、、专题性资料。 2,体育统计可分为全面调查和非全面调查,非全面调查又分为抽样调查和典型调查,。体育统计常用的是抽样调查。 3,变量按取值情况可分为离散变量和连续性变量,按性质可分为定类变量、定序变量、定距变量和定比变量。 4,收集资料时应注意的问题:第一:保证资料的完整性、有效性和可靠性;第二:保证样本的代表性。 5,连续型变量频数分布表的编制步骤如下:求全距、、、确定组数和组距、、、确定组限、、、列频数分布表并划记。 三,1,反映集中趋势的数称为集中量数。2,算数平均数是所有的观察总和除以总额说所得之商,简称为平均数或均数。算数平均数是反映同质对象观察值的平均水平与集中趋势的统计量。· 3,反映集中趋势的数称为集中量数。 4.中位数是将数依据数值大小顺序排列后,位于序列中央位置的数,用★表示。偶数,则中间两个的平均数是中位数。 5,标准差是带有与原观察值相同单位的名数。它对两种不同或相同而两个平均数相差较大的资料,都无法比较差异的大小,必须用变异系数进行比较。所谓变异系数是指标准差与平均数的百分比 6,★ 四.1在一定条件下可能发生的可能不发生的现象成为随机现象。对于随机现象的一次观察可以看作一次实验,这样的实验成为随机实验。 2如果事件A发生的可能性的大小可以用一个常数P来表示,则P称为随机事件A在该试验条件下的概率。记作P(A)=P。事件A 的概率取值范围为[0,1]。 3一般正态曲线有如下性质:(1)分布曲线位于X轴的上方,即f(x)>0;(2)分布曲线以μ和σ为正态参数;(3)x的取值范围是整个X轴;(4)曲线与X轴之间的面积为1。 4我们将μ=0,σ=1的正态分布称为标准正态分布,∷∷∷∷∷∷∷∷ 以0为均数,以1为标准差的标准正态分布记为μ~N(0,1)。 5标准正态分布下几个常用的概率:P(-1.96<μ<1.96)=0.9500 P(-2.58<μ<2.58)=0.9902;P(-3<μ<3)=0.9974。 6例题已知x~N(μ,σ2)求: P(μ-σ0为一常数,若Xi’ =m Xi,则下列结论中正确的是(X=X’/m, S=S’/m)2假设检验属于(统计推断)内容 之一3(射击成绩)不属于连续型量变4体 育统计起源于(数理统计)5决定正态分布 曲线形态的参数是(ó) 6已知某人100米成 绩X=14秒S=0.45秒;立定跳远X=221.4厘 米S=18.4厘米,则该人的(100米)成绩更 稳定 7X~N(14.5,0.52),问X落在 区间(15,+∞)的概率为(0.1587) 8整理数据时常采用(直方图)9大样本 时,总体均数的99%的置信区间为(X± 2.58Sx)10 中位数是(百分位数)的特例11 在正态曲线分布下,u±2.58ó之间的面积为 (0.9902)12等级相关系数的自由度是(n) 13方差分析中把由于各种条件的不同引起 的差异称为(条件误差)14如果要评价某 学校学生的运动水平,从各年级中随机抽取 一个班,以这个班做为年级学生的运动水平, 这样的抽样方法是(整体抽样)15若某项 田径成绩X=3.2米,S=0.20米,以X±3S为 研究范围,问3.44米在标准T分法下应得70 分16对于数据8,8,9,9,10,11,0,5,宜采用 (8.5)刻画其集中趋势17竞技体育比赛中, 宜采用(累进评分法)18运动员的年龄属 于(定距变量)19体育统计的研究对象不 具有(典型性)20正态分布曲线以X=(u) 为对称轴21(u=0,ó=1)代表标准正态分 布22多个率的假设检验,常采用(X2)检 验23样本越大,标准误(逐渐减少)24 我们采用(散点图)反映两个量变的相关趋 势25当两个项目单位相同但平均数相差太 大时,宜采用(变异系数)比较他们的离散 程度26X~N(14.5,0.52),问X落在区间(- ∞,15)的概率为(0.8413)27双侧检验的 特点是(检验两个参数是否相等,而不关心 其他差别的方向)28大样本时,总体均数 的95%的置信区间为(X±1.96Sx)29(平 均数)是百分数的特例30在正态曲线分布 下,u±3之间的面积为(0.9974)31对任意 事件A,其概率的取值范围是(0《P(A)《10) 32方差分析法中,组内方差的自由度为(b (a-1))33不属于随机事件的是(三角形的 内角和为180度)34决定正态分布曲线位 置的参数是(u)35若所给资料不服从正态 分布,宜采用(百分位数法)评分方法36 立位体前屈成绩属于(定比变量)37当总 体情况复杂,个体数目多时宜采用(分层抽 样)38标准误用来刻画(抽样误差)的大 小39检查测试数据是否有“缺、疑、误” 等错误,通常在(初审)步骤进行40X~N (14.5,0.52),问X落在区间(14,15) 的概率为(0.6826)41若变量Y与X是正 相关关系,其相关系数r的取值范围为(00为一常数,若Xi’=Xi-m,则下列结 论中正确的是(X=X’+m,S=s’)45对任意 随机事件A,其概率取值范围为(01) 46当极端数据出现时,宜采用(中位数)反 映该数列的集中趋势 47在正态分布的曲线

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

体育统计学资料(1)

体育统计学 名词解释 1、回归、回归直线(第九章: 回归分析) 2、指标、因素、水平(第七章: 方差分析) 3、相关分析线性相关系数正相关负相关(相关分析) 4、随机误差系统误差抽样误差点估计区间估计假设检验第I类错误第二类错误小概率事件原理(第六章统计推断) 5、中位数众数集中位置量数离中位置量数极差四分位间距方差标准差变异系数(第三章样本特征数) 6、简单随机抽样分层抽样整群抽样(第二章统计资料的收集与整理) 7、描述性统计推断性统计体育统计总体随机样本(第一章绪论) 简答题 1、 2、 3、简述相关分析与回归分析的联系与区别(第九章回归分析)简述为什么要进行相关系数的检验(第八章相关分析)简述在什么条件下必须对平均数进行多重比较(第七章方差分析) 4、 5、简述方差分析应用的前提条件(第七章方差分析) 简述假设检验中的两类错误(第六章统计推断)

6、 7、 8、 9、简述假设检验的基本步骤(第六章统计推断) 简述假设检验的基本思想(第六章统计推断) 简述常用的几种统一变量单位的方法(第五章正态分布)正态分布曲线有哪些性质(第五章正态分布) 10、常用的抽样方法有几种(第二章统计资料的收集与整理) 11、体育统计工作的基本过程有哪三个步骤?每步工作的主要任务是什么?(第一章绪论) 12、假设检验时,当P比0.05小时,则拒绝H0,理论依据是什么?(第六章统计推断) 13、对称分布在“平均值±1.96标准差”的范围内,也包括95%的观察值吗?(第三章样本特征数) 14、试述极差、四分间距、标准差及变异系数的适用范围?(第三章样本特征数) 15、同一资料的标准差是否一定小于均数?(第三章样本特征数) 16、某年级甲班、乙班各有男生50人。从两个班各抽取10人测量其身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?(第一章绪论)判断题 1、两变量间的关系越密切,其相关系数r值越大.(错误)第八章相关分析 2、样本均数的标准误越小,则对总体均数的估计越精确(正确) 3、对同一参数的估计,99%置信区间比90%置信区间好。(错误)

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

体育统计学参考资料

、总体参数:在统计学中,反映总体地一些数量特征称为总体参数 样本统计量:由样本所获得地一些数量特征称为样本统计量 随机事件:在一定地实验条件下,有可能发生也有可能不发生地事件为随机事件 集中位置量数:反映一群性质相同地观察地平均水平或集中趋势地统计指标 、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有地数据. 统计推断: 抽样误差:抽出地样本统计量与总体参数间地偏差,立要由于个体间地差异所造成. 相对数:相对数也称为相对指标,是两个有联系地指标地比率,它可以从数量上反映两个相互联系地事物(或现象)之间地对比关系. 文档来自于网络搜索 假设检验:在实际检验过程中,主要地问题是要判定被检验地统计量之间地偏差是由抽样误差造成地,还是由于总体参数不同所造成地,要作出判断就需要对总体先建立某种假设,然后通过统计量地计算及概率判断,对所建立地假设是否成立进行检验.这类方法称为假设检验. 文档来自于网络搜索 平均数:反映一群性质相同地观察值地平均水平或集中趋势地统计指标 、变异系数:也是反映变量离散程度地统计指标,它是以样本标准差与平均数地百分数来表示地!记作:、总体与样本:文档来自于网络搜索 离中位置量数:描述一群性质相同值地离散程度地统计指标、抽样:指在总体中抽取一定含量地样本 、系统误差:宏观世界是由实验对象本身地条件,或者仪器不准,场地品格出现故障,训练方法,手段不同所造成地,可使测试结果杨倾向性偏大或偏小. 文档来自于网络搜索 、结构相对数:是在分组基础上,以各个分组全计数值与总值对比地相对数. 、或:指检验水准称小概率水平、中位数:将样本地观察值按其数值大小顺序排列起来,处于中间位置地那个数值就是中位数,中位数通常用表示,它处于频数分配地中点,不受极端数值地影响. 、组距:组距指地是组与组之间地区间长度.文档来自于网络搜索 二、填空题. 、和在统计学中称为(小概率水平)、抽样误差是由于(个体间地差异)造成地. 、标准误差是反映(数据地离散程度)地指标. 、(随机变量)用来度量随机事件地可能性大小. 、(算术)平均数量是最简单最常用最有效地统计量. 、由样本所获得地数量特征称为样本统计量,反映总体地一些数量特征称为(总体参数)、标准误是反映(度量抽样误差大小)地指标. 、在资料地收集过程中,一般要求(资料地准确性)(资料地齐同性)和(资料地随机性). 、在一组观察值中,最大值与最小值之差叫(极差). 、表示集中位置地指标主要有(中位数)(众数)(平均数). 文档来自于网络搜索 单项选择题. 、以下适合描述定量资料,离散趋势地指标是()、均数、标准差、方差、极差、标准差、中位数、中位数、均数、变异系数、标准差、变异系数文档来自于网络搜索 下列关于标准差地说法中错误地是()、标准差一定大于. 、标准差和方差属于描述变异程度地同类指标、同一资料和标准差一定小于均数、标准差常用于描述正态公布资料地变异程度.文档来自于网络搜索 进行假设检验地目地是()、判断样本统计量地差异仅仅是抽样引起地还是样本与总体原本就不同、由样本统计量估计总体参数、确定发生该观察结果地概率、计算统计文档来自于网络搜索 抽样误差原因是()、观察对象不纯、资料不是正态分布、个体差异、随机方法错误

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

生物统计学简答题

1. 什么是生物统计学?生物统计学的主要容和作用是什么? 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别? 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性?平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S的观测值个数占总个数的68.26%,X-+2s的观测值个数占总个数的95.49%,x-+3s 的观测值个数占总个数的99.73%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布?什么是标准正太分布?正态分布曲线有什么特点?μ和σ对正态分布曲线有何影响?

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

相关文档
最新文档