生物统计学1

生物统计学1
生物统计学1

定量资料的统计描述

在畜牧科学研究和生产中,对定量资料进行统计描述是一项经常性的工作。我们从科学试验或生产实践中获得的数据往往是杂乱无章的,只有对数据资料进行相应的统计处理,如计算出某一样本的平均数、标准差、变异系数、以及最大、最小值等基本统计量,才能得出规律性的结论。

在SAS系统中,对定量资料进行统计描述,可以采用MEANS和UNIVARIATE 两个过程来完成。

2.1 MEANS过程

MEANS过程可提供单个或多个变量的简单统计描述,当对多个变量进行统计描述时,其输出格式较为紧凑,便于阅读。在畜牧试验数据的处理中,计算定量资料的描述性统计量以MEANS过程最为常用。

下面我们可以通过一些具体的例子来了解如何应用MEANS过程对定量资料进行描述性统计。

例2.1 某试验站香猪的6周饲养试验增重结果数据见下表,计算甲乙两种饲料每周各自的平均增重、最大值、最小值、方差、变异系数、标准差各统计量。

1周2周3周4周5周6周

甲种饲料 6.65 6.35 7.05 7.90 8.04 4.45

乙种饲料 5.34 7.00 7.89 7.05 6.74 7.28

Data ok ;

Input siliao $ weekage addweigh @@ ;

cards ;

a 1 6.65

a 2 6.35 a 3 7.05 a 4 7.90 a 5 8.04 a 6 4.45

b 1 5.34 b 2 7.00 b 3 7.89 b 4 7.05 b 5 6.74 b 6 7.28

;

Proc sort out=bigsort;

by siliao ;

run ;

- 1 -

proc means ;

by siliao ;

run ;

2.2 UNIVARIATE过程

UNIVARIATE过程又称为单变量分析过程,可提供单个变量的详细描述及其分布类型的检验。与MEANS过程相比,该过程侧重于对单个变量进行分布类型的描述。

例2.2 12头奶牛的305天产奶量(kg),具体数据如下, 试用UNIVARIATE过程计算产奶量的描述性统计量,并进行正态性检验。

牛号 1 2 3 4 5 6 7 8 9 10 产奶

5480 6370 6310 5180 5090 6390 5600 5380 5360 6420 量

SAS程序为:

Data ok;

Input cownum $ yield@@;

Cards;

1 5480

2 6370

3 6310

4 5180

5 5090

6 6390

7 5600

8 5380

9 5360 10 6420

;

Proc univariate normal plot;

Var yield;

Run;

两均数差异显著性检验——t检验

t检验的SAS过程

在SAS系统中,进行t检验主要有MEANS和TTEST两个过程。

3.2.1 MEANS过程

MEANS过程可用于样本均数与总体(理论)均数的差异显著性检验,以及配

- 2 -

对试验设计资料的t检验。利用该过程进行t检验时,它先计算出可比对的数值,然后对差值均数与0有无显著差异进行检验。

3.2.2 TTEST过程

TTEST该过程可计算出两组变量的平均数和标准差,同时还可对两个样本方差齐性(或同质性)进行检验,并给出总体方差相等和不相等两种情况下的均数差异性检验结果供选择。

3.3 不同实验设计资料的t检验

3.3.1 样本均数与总体均数间的差异显著性检验

在SAS系统中,样本均数与总体均数间的差异显著性检验是通过MEANS过程来完成的。

例3.1 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?

SAS程序为:

Data ok;

Input x@@;

Y=x-114;

Cards;

116 115 113 112 114 117 115 116 114 113

;

Proc means mean std stderr t prt;

Var y;

Run;

3.3.2 配对实验设计资料的t检验

在SAS系统中,配对设计资料的t检验是用MEANS过程来实现的。根据配对实验

设计分为自身配对和同源配对。

例3.2 用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温。设

体温服从正态分布,问注射前后体温有无显著差异?

- 3 -

兔号 1 2 3 4 5 6 7 8 9 10 注射前体温37.8 38.2 38.0 37.6 37.9 38.1 38.2 37.5 38.5 37.9 注射后体温37.9 39.0 38.9 38.4 37.9 39.0 39.5 38.6 38.8 39.0 SAS程序如下:

Data ok;

Input x y@@;

D=x-y;

Cards;

37.8 37.9 38.2 39 38 38.9 37.6 38.4 37.9 37.9

38.1 39 38.2 39.5 37.5 38.6 38.5 38.8 37.9 39

;

Proc means mean std stderr t prt;

Var d;

Run;

例3.3 现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间30天,试验结果见表5-7。问两种饲料喂饲仔猪增重有无显著差异?

1 2 3 4 5 6 7 8

甲饲料10.0 11.2 11.0 12.1 10.5 9.8 11.5 10.8 乙饲料9.8 10.6 9.0 10.5 9.6 9.0 10.8 9.8

Data ok;

Input x y@@;

D=x-y;

Cards;

10 9.8 11.2 10.6 11 9 12.1 10.5

10.5 9.6 9.8 9 11.5 10.8 10.8 9.8

;

Proc means mean std stderr t prt;

Var D;

Run;

3.3.3 非配对实验设计资料的t检验

非配对实验设计资料的t检验可用TTEST过程来完成。

例3.4 某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果- 4 -

如下表所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,问该两品种后备种

猪90kg时的背膘厚度有无显著差异?

品种背膘厚度(cm)

长白 1.20 1.32 1.10 1.28 1.35 1.08 1.18 1.25 1.30 1.12 1.19 1.05

蓝塘 2.00 1.85 1.60 1.78 1.96 1.88 1.82 1.70 1.68 1.92 1.80

SAS程序如下:

Data ok;

Input group $ width@@;

Cards;

1 1.20 1 1.3

2 1 1.10 1 1.28 1 1.35 1 1.08 1 1.18 1 1.25 1 1.30

1 1.1

2 1 1.19 1 1.05 2 2.00 2 1.85 2 1.60 2 1.78 2 1.96 2 1.88

2 1.82 2 1.70 2 1.68 2 1.92 2 1.80

;

Proc ttest;

Class group;

Var width;

Run;

4.2 均衡数据的方差分析——普通方差分析

所谓均衡数据(balanced data),就是在数据结构中对于每个分类因子各水平下或水平的组合下的观测数都相等,即数据均衡,且没有发生缺失。

4.2.1 用于均衡数据方差分析的SAS过程

在SAS系统中,均衡数据的方差分析是采用ANOVA过程来完成的。虽然均衡4.2.2.2 应用示例

以下我们通过两个具体的例子来介绍如何应用ANOVA过程进行单因素方差分析。

例4.1 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。

饲料鱼的增重(x ij)

- 5 -

A131.9 27.9 31.8 28.4 35.9

A224.8 25.7 26.8 27.9 26.2

A322.1 23.6 27.3 24.9 25.8

A427.0 30.8 29.0 24.5 28.5

SAS程序:

Data ok;

Do a=1 to 4;

Do i=1 to 5;

Input y@@;output;

End;end;

Cards;

31.9 27.9 31.8 28.4 35.9

24.8 25.7 26.8 27.9 26.2

22.1 23.6 27.3 24.9 25.8

27.0 30.8 29.0 24.5 28.5

;

Proc anova data=ok;

Class a;

Model y=a;

Means a/t DUNCAN SNK;

Run;

4.2.3 交叉分组资料的多因素方差分析

例4.2 为研究雌激素对子宫发育的影响,现有4窝不同品系未成年的大白鼠,每窝3只,随机分别注射不同剂量的雌激素,然后在相同条件下试验,并称得它们的子宫重量,见下表,试作方差分析。

品系(A)

雌激素注射剂量(mg/100g)(B)

B1(0.2) B2(0.4)B3(0.8)

A1106 116 145

A242 68 115

A370 111 133

A442 63 87

SAS程序如下:

Data ok;

Do a=‘A1’, ‘A2’, ‘A3’;

Do b=‘B1’, ‘B2’, ‘B3’;

- 6 -

Input y@@;output;

End;end;

Cards;

106 116 145

42 68 115

70 111 133

42 63 87

;

Proc anova data=ok;

Class a b;

Model y=a b;

Means a b/t DUNCAN SNK;

Run;

4.2.3.2 多因素有互作的方差分析

例4.3 为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交叉分组试验。先用品种、性别、日龄相同,初始体重基本一致的幼猪48头,随机分成16组,每组3头,用能量、蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果(kg)列于下表,试分析钙磷对幼猪生长发育的影响。

B1(0.8) B2(0.6) B3(0.4) B4(0.2)

A1(1.0) 22.0 30.0 32.4 30.5 26.5 27.5 26.5 27.0 24.4 26.0 27.0 25.1

A2(0.8) 23.5 33.238.0 26.5 25.8 28.5 35.5 24.0 27.0 30.1 33.0 25.0

A3(0.6) 30.5 36.5 28.0 20.5 26.8 34.0 30.5 22.5 25.5 33.5 24.6 19.5

A4(0.4) 34.5 29.0 27.5 18.5 31.4 27.5 26.3 20.0 29.3 28.0 28.5 19.0

SAS程序:

Data CaP;

- 7 -

Do a=1 to 4;

Do b=1 to 4;

Do n=1 to 3;

Input y@@;

Output;

End;

End;

End;

Drop n;

Cards;

22.0 26.5 24.4 30.0 27.5 26.0 32.4 26.5 27.0

30.5 27.0 25.1 23.5 25.8 27.0 33.2 28.5 30.1

38.0 35.5 33.9 26.5 24.0 25.0 30.5 26.8 25.5

36.5 34.0 33.5 28.0 30.5 24.6 20.5 22.5 19.5

34.5 31.4 29.3 29.0 27.5 28.0 27.5 26.3 28.5

18.5 20.0 19.0

;

Proc anova;

Class A B;

Model y=A B A*B;

Run;

4.3 非均衡数据的方差分析——最小二乘分析

与均衡数据资料相反,非均衡数据(unbalanced data)就是数据结构中每个分类因子个水平下(或各水平组合下)的观察值数目不相等。在SAS系统中,这类数据的分析需要采用方差分析的GLM过程(general linear models)来完成。

4.3.3 单因素最小二乘分析

例子4.4 5个不同品种猪的育肥试验,后期30天增重(kg)如下表所示。试比较品种间增重有无差异。

品种增重 (kg)

B121.5 19.5 20.0 22.0 18.0 20.0

- 8 -

B216.0 18.5 17.0 15.5 20.0 16.0

B319.0 17.5 20.0 18.0 17.0

B421.0 18.5 19.0 20.0

B515.5 18.0 17.0 16.0

SAS程序如下:

Data ok;

Input breed$ y@@;

Cards;

B1 21.5 B1 19.5 B1 20.0 B1 22.0 B1 18.0 B1 20.0

B2 16.0 B2 18.5 B2 17.0 B2 15.5 B2 20.0 B2 16.0

B3 19.0 B3 17.5 B3 20.0 B3 18.0 B3 17.0

B4 21.0 B4 18.5 B4 19.0 B4 20.0

B5 15.5 B5 18.0 B5 17.0 B5 16.0

;

Proc glm;

Class breed;

Model y=breed;

Means breed/Duncan;

Run;

结果如下:

4.3.4 交叉分组资料的多因素最小二乘分析

4.3.4.1 多因素无互作最小二乘分析

例4.5 为研究某一基因的不同基因型对某品种猪生长速度的影响,对每一个体的基因型(GENO)和性别(SEX)及其肥育期日增重(GAIN,g)进行了记录得如下数据,试用二因素无互作的最小二乘分析方法对该数据进行分析。

性别

公猪母猪基因型

AA 567 589 600 621 587 558 580 577 612 624 630 654

AB 498 442 465 457 580 611 541 520 511 540 609

BB 632 666 634 670 700 677 682 656 668 694 705 724 630 655 708 800 SAS程序为:

Data ok;

Input geno $ sex $ gain @@;

- 9 -

Cards;

AA M 567 AA M 589 AA M 600 AA M 621 AA M 587

AA F 558 AA F 580 AA F 577 AA F 612 AA F 624 AA F 630 AA F 654

AB M 498 AB M 442 AB M 465 AB M 457 AB M 580 AB M 611

AB F 541 AB F 520 AB F 511 AB F 540 AB F 609

BB M 632 BB M 666 BB M 634 BB M 670 BB M 700 BB M 677 BB M 682 BB M 656 BB F 668 BB F 694 BB F 705 BB F 724 BB F 630 BB F 655 BB F 708 BB F 800

;

Proc glm;

Class geno sex;

Model gain=geno sex;

Lsmeans geno sex/stderr tdiff;

Run;

4.3.4.2 多因素有互作的最小二乘法分析

例4.6:(仍然以例4.5为例)

Data ok;

Input geno $ sex $ gain @@;

Cards;

AA M 567 AA M 589 AA M 600 AA M 621 AA M 587

AA F 558 AA F 580 AA F 577 AA F 612 AA F 624 AA F 630 AA F 654

AB M 498 AB M 442 AB M 465 AB M 457 AB M 580 AB M 611

AB F 541 AB F 520 AB F 511 AB F 540 AB F 609

BB M 632 BB M 666 BB M 634 BB M 670 BB M 700 BB M 677 BB M 682 BB M 656 BB F 668 BB F 694 BB F 705 BB F 724 BB F 630 BB F 655 BB F 708 BB F 800

;

Proc glm;

Class geno sex;

Model gain=geno sex;

Lsmeans geno sex geno*sex/stderr tdiff;

Run;

- 10 -

次数资料的显著性检验

在畜牧试验研究或生产中,所获得的数据资料大致可以分为数量性状资料和质量性状资料两大类。数量性状资料呈现连续(或潜在的连续)分布(如奶牛的产奶量、猪的产肉量等),而质量性状资料则呈现间断性的分布(如家畜角的有无、毛色等)。因而两类资料的统计分析方法也就不同。虽然有些次数资料也可以通过计算出各种相对数(如比率、构成比例和相对比等)来进行处理,但其显著性检验则多采用卡方检验(2x检验)来完成。在次数资料的统计分析中,我们经常会碰到适合(符合)性和独立性检验检验的问题,这也是通过卡方检验来完成的。

5.2 次数资料的适合性及独立性检验

尽管次数资料的适合性检验与独立性检验并非一回事,但检验的基本原理和方法则是大致相同的,两者都是采用2x检验来完成。

5.2.1 适合性检验

适合性检验是检验观察资料的属性类别分配是否符合(或依循)已知属性类别分配的理论或假说。如检验一对等位基因的遗传是否符合盂德尔分离定律的3:l比例,某一畜群的雌雄比例是否符合1:1的理论比例等,就属于适合性检验问题。

例5.1 某猪场204头仔猪中,公猪有108头,母猪有96头,试检验这群仔猪的性别是否符合1:1的理论比例。

这就是一个适合性检验的简单例子。按照1:1的理论比例,该仔猪群的公猪数应等于母猪数,即都是102头。完成这一检验的SAS程序为:

Data ok;

Do A=1 to 2;

Do B=1 to 2;

Input x @@;

Output;

End;end;

Cards;

108 96 102 102

;

Proc freq;

Tables A*B/exact nocol norow;

Weight x;

- 11 -

Run;

结果为:

5.2.2 独立性检验

例5.2 某兽药厂新出丁一种猪瘟疫苗。为检验新疫苗的免疫效果,对300头猪进行了试脸。其中试验组(注射新疫苗)的150头猪中,注射后有8头猪患了猪瘟,142头猪未发病;对照组(注射原疫苗)的150头猪中,注射后有24头猪患了猪瘟,126头猪未发病。试检验新旧疫苗的免疫效果是否有差异。

SAS程序为:

Data ok;

Do A=1 to 2;

Do B=1 to 2;

Input x@@;

Output;

End;end;

Cards;

8 142 24 126

;

Proc freq;

Tables A*B/exact nocol norow;

Weight x;

Run;

相关与线性回归分析

6.1.2.2 简单相关分析

前已述及,所谓简单相关分析,又叫直线相关分析或一元相关分析,就是只涉及一对(两个)变量的相关关系的分析。这是相关分析中一种最简单的情形。

例6.1 10只绵羊的胸围(cm)和体重(kg) ,如下表,试进行相关分析。

编号 1 2 3 4 5 6 7 8 9 10 胸围(x) 68 70 70 71 71 71 73 74 76 76 体重(y) 50 60 68 65 69 72 71 73 75 77

- 12 -

- 13 -

SAS 程序为: Data ok; Input x y@@; Cards;

68 50 70 60 70 68 71 65 71 69 71 72 73 71 74 75 76 77 76 ;

Proc corr; Var x y; Run;

采用回归系数的显著性检验—t 检验也可检验x 与y 间是否存在直线关系。回归系数显著性检验的无效假设和备择假设分别为0H :β=0,A H :β≠0。

t 检验的计算公式为:

,b S b

t =

2-=n df ,x

yx b SS S S =

其中,b S 为回归系数标准误。

例6.2 10只绵羊的胸围(cm )和体重(kg ) ,如下表,试进行相关分析。 编号 1 2 3 4 5 6 7 8 9 10 胸围(x )

68 70 70 71 71 71 73 74 76 76 体重(y ) 50

60

68

65

69

72

71

73

75

77

SAS 程序: Data ok; Input x y@@; Cards;

68 50 70 60 70 68 71 65 71 69 71 72 73 71 74 73 76 75 76 77

;

Proc plot data=ok ;

Plot x*y/ box vpos=30 hpos=70 ; Run;

Proc corr data=ok; Var x y; Run ;

Proc reg data=ok ; Model y=x; Run;

6.2.3 多元线性回归分析

例6.3 根据下述某猪场25头育肥猪4个胴体性状的数据资料,试进行瘦肉量y对眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的多元线性回归分析。

序号瘦肉量

y(kg)

眼肌面积

x1(cm2)

腿肉量

x2(kg)

腰肉量

x3(kg)

瘦肉量

y(kg)

眼肌面积

x1(c m2)

腿肉量

x2(kg)

腰肉量

x3(kg)

1 15.0

2 23.7

3 5.49 1.21 1

4 15.94 23.52 5.18 1.98

2 12.62 22.34 4.32 1.35 15 14.3

3 21.86 4.86 1.59

3 14.86 28.8

4 5.04 1.92 16 15.11 28.9

5 5.18 1.37

4 13.98 27.67 4.72 1.49 17 13.81 24.53 4.88 1.39

5 15.91 20.83 5.35 1.5

6 18 15.58 27.65 5.02 1.66

6 12.4

7 22.27 4.27 1.50 19 15.85 27.29 5.55 1.70

7 15.80 27.57 5.25 1.85 20 15.28 29.07 5.26 1.82

8 14.32 28.01 4.62 1.51 21 16.40 32.47 5.18 1.75

9 13.76 24.79 4.42 1.46 22 15.02 29.65 5.08 1.70

10 15.18 28.96 5.30 1.66 23 15.73 22.11 4.90 1.81

11 14.20 25.77 4.87 1.64 24 14.75 22.43 4.65 1.82

12 17.07 23.17 5.80 1.90 25 14.37 20.44 5.10 1.55

13 15.40 28.57 5.22 1.66

SAS程序如下:

Data ok;

Input x1 x2 x3y;

Cards;

23.73 5.49 1.21 15.02

22.34 4.32 1.35 12.62

28.84 5.04 1.92 14.86

27.67 4.72 1.49 13.98

20.83 5.35 1.56 15.91

22.27 4.27 1.5 12.47

27.57 5.25 1.85 15.8

28.01 4.62 1.51 14.32

24.79 4.42 1.46 13.76

28.96 5.3 1.66 15.18

25.77 4.87 1.64 14.2

- 14 -

23.17 5.8 1.9 17.07

28.57 5.22 1.66 15.4

23.52 5.18 1.98 15.94

21.86 4.86 1.59 14.33

28.95 5.18 1.37 15.11

24.53 4.88 1.39 13.81

27.65 5.02 1.66 15.58

27.29 5.55 1.7 15.85

29.07 5.26 1.82 15.28

32.47 5.18 1.75 16.4

29.65 5.08 1.7 15.02

22.11 4.9 1.81 15.73

22.43 4.65 1.82 14.75

20.44 5.1 1.55 14.37

Proc reg corr;

Model y=x1-x3/stb;

Run;

- 15 -

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

《生物统计学》教学大纲

《生物统计学》教学大纲 课程名称:生物统计学 课程类型:范围选修课-基础课 学时:56学时,3.5学分 适用对象:农学、植物保护、生物技术、生物科学、草业科学等本科专业先修课程:高等数学、线性代数、概率论与数理统计、植物学、植物生理学、遗传学等课程 一、课程性质、目的与任务以及对先开课程要求 统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的一般统计学。统计方法是现代生物学研究不可缺少的工具。正确的统计分析能够帮助我们正确认识事物客观存在的规律性。 概率论与数理统计等先开课程的重点是讲述没有量纲或单位抽象的数量规律,为生物学科应用这些规律打基础。 二、教学重点及难点 本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。本课程的难点是概念较多、理论抽象、系统严密、实践性强、公式复杂、符号繁多、计算量大,因此,教学安排上除精讲48学时外,有针对性的安排上机操作8学时。 三、与其他课程关系 生物统计学与数学有密切关系,现代统计学用到了较多的数学知识,研究理论生物统计学的人需要有较深的数学功底,应用统计方法的人也应具备良好的数学基础。统计学又是一门应用性很强的学科,几乎生物学科所有的门类都要研究和分析数据,掌握生物学类学科专业基础课和专业课程知识有利于对统计分析的结果做出合理的解释和分析。 四、教学内容、学时分配及基本要求 绪论(1学时) 基本要求:理解什么是统计?什么是统计学;统计数据与统计学的关系,描述统计与推断统计内涵;统计方法能解决生物学科中哪些问题,了解生物 统计学的产生与发展。

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学课堂作业及答案

1. 资料可以分为哪几类?它们有何区别? 答:(1)资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中 数量性状资料又包括计量资料和计数资料。 (2)区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系 三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 2. 为什么要对资料进行整理?对于计量资料,整理的基本步骤是什么? 答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。②确定组数,一般根据样本含量及资料的变动范围大小确定组数。③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。④确定组限和组中值,各组的最大值为组上限,最小值为组下限 每一组的中点值称为组中值。⑤归组划线计数,作次数分布表。 3. 在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。 4. 统计表与统计图有何用途?常用统计表、统计图有哪些?列统计表、绘统计图时,应注意什么? 答:(1)统计表用表格形式来表示数量关系 统计图用几何图形来表示数量关 系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形 象地表达出来,便于比较分析。 (2)常用的统计图有长条图、圆图、线图、直方图和折线图等。 (3)常用的统计表有简单表和复合表两大类。 (4)列统计表的注意事项: ①标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。 ②标目分横标目和纵标目两项,横标目列在表的左侧用以表示被说明事物的主要标志,纵标目列在表的上端说明横标目各统计指标内容,并注明计算单位。 ③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。 ④表的上下两条边线略粗、纵、横标目间及合计用细线分开 表的左右边线可以省去表的左上角一般不用斜线。 (5)绘统计图的注意事项: ①标题简明扼要并列于图的下方。 ②纵、横两轴应有刻度,注明单位。 ③横轴由左至右,纵轴由上而下,数值由小到大,图形长宽比例约为5:4或6:5。 ④图中需用不同颜色或线条表示不同事物时应有图例说明。 5. 生物统计中常用的平均数有几种?各在什么情况下应用? 答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学学习心得

生物统计学学习心得 一、《生物统计学》这一门课。你学到什么?谈谈你学习这一门课的心得体会。 (一)、《生物统计学》这门课,首先,我不仅学到了很多生物统计方面的基础知识、基本概念和相关的应用,还学习了如何设计试验。 在第一章,我学了统计数据的收集与整理。首先学习的是总体与样本的概念,统计学研究的核心问题是如何通过样本推断总体,因此,总体与样本是生物统计学中的两个最基本概念。总体是我们研究的全部对象。构成总体的一个研究单位称为个体。样本是总体的一部分,样本内包含的个体数目称为样本含量。接着学习了数据类型及频数分布。生物统计学中经常遇到的数据有两种类型,一种是连续型数据,指与某种标准做比较所得到的数据,采用变量的方法进行分析。另一种是离散型数据,指由记录不同类别的个体的数目所得到的数据,采用属性的方法进行分析。最后学习了样本的几个特征数,平均数、标准差、方差。 在第二章,我学了概率和概率分布。概率是事件所固有的,且不随人的主观意识而改变。总体分布是建立在概率这一概念基础之上的,因此在研究总体分布之前首先应对概率的基本知识有所了解。试验的每一最基本的结果称为基本事件,指不能再分的事件。复合事件指由若干个基本事件组合而成的事件。概率的基本运算法则包括概率加法法则、条件概率、概率乘法法则、独立事件。概率分布包括离散型概率分布和连续型概率分布。 在第三章,我学了几种常见的概率分布律。首先学了二项分布,二项分布的基本情况是:设有一随机试验,每次试验都有两种不同的结果,如成功的(事件A)和失败的(事件A’);生男孩(事件A)和生女孩(事件A’)。显然这两种可能的结果是互不相容的,独立地将此试验重复做n次,求在n次试验中,一种结果出现y次的概率。接着学了泊松分布、超几何分布、负二项分布、正态分布、指数分布等。 在第四章,我学了抽样分布。首先学了从一个正态总体中抽取的样本统计量的分布,学了一些基本概念,如标准误差、样本标准误差、自由度、查表。然后学了从两个正态总体中抽取的样本统计量的分布,包括标准差已知时两个平均数的和与差的分布、标准未知但相等时两个平均数的和与差的分布、两个样本方差比的分布----F分布。 在第五章,我学了统计推断。对总体做统计推断可以通过两条途径进行,一是首先对所估计的总体提出一个假设,称为统计假设检验,二是通过样本统计量估计总体参数,称为总体参数估计。首先学习单个样本的统计假设检验,检验的基本步骤:1.提出假设。2.构造并计算检验统计量:利用原假设所提供的信息,而且抽样分布已知。3.确定否定域(临界值):根据小概率事件原理,比较检验统计量和临界值的关系,确定其落在否定域还是接受域。主要学了t检验,u检验、x2检验。接着学了两个样本的差异显著性检验,包括两个方差的检验----F检验,标准差已知时两个平均数间差异显著性的检验,标准差未知但相等时,两平均数之间差异显著性的检验,标准差未知且可能不等时两平均数之间差异显著性的检验,配对数据的显著性检验-----配对数据的t检验,二项分布数据的显著性检验。 在第六章,我学了参数估计,即由样本统计量估计总体参数。估计量是估计总体参数的统计量,一个好的估计量应该满足三个条件:无偏性、有效性、相容性。对总体参数的估计,可分为点估计和区间估计。区间估计是指在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫置信区间,本章我学习了μ的置信区间、σ的置信区间、平均数差的置信区间、配对数据的置信区间、标准差比的置信区间二项分布总体的置信区间。 在第七章,我学了拟合优度检验,拟合优度检验是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。做拟合优度检验一般需一下各步:1.对数据进行分组。2.计算理论数Ti。3分别合并两个尾区的理论数。4.零假设。5.计算出x2与x2临界值(查附表6)做比较。

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

相关文档
最新文档