生物统计学教案(1)

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《生物统计学》教案

第一章统计数据的收集和整理

教学时间:2学时

教学方法:课堂板书讲授

教学目的:重点掌握样本特征数平均数、样本方差、标准差的概念和计算方法,掌握数据类型及频数(率)分布,了解众数、中位数、变异系数。

讲授难点:样本方差、标准差的概念和计算方法

1.1 总体与样本

1.1.1 统计数据的不齐性

1、变异性是自然界存在的客观规律。

2、自然界如果没有变异,也就不需要统计学了。

3、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象,于是引出以下概念。

1.1.2 总体与样本

总体:研究的全部对象。

个体:总体中的每个成员。

样本:总体的一部分。

样本含量:样本所包含的个体数目。

1.1.3 抽样

抽样:从总体中获得样本的过程。

随机抽样:总体中的每一个个体被抽中的机会都相同的一种抽样方法。

放回式抽样:从总体中抽出一个个体,记下其特征后,放回原总体中,再做第二次抽样。

非放回式抽样:从总体中抽出个体后,不再放回,即做第二次抽样。

抽样的目的:从总体中获得一个有代表性的样本,以便通过样本推断总体。

应注意的问题:①样本必须有代表性。②样本含量与可实施性之间的平衡。

1.2 数据类型及频数(率)分布

1.2.1 连续型数据和离散型数据

连续型数据:与某种标准比较所得到的数据。又称为度量数据。

离散型数据:由记录不同类别个体的数目所得到的数据。又称为计数数据。

1.2.2 频数(率)分布表和频数(率)分布图的编绘

例1.1 调查每天出生的10名新生儿中体重超过3公斤的人数,

共调查120天,结果如下:

表 1-1 每10名新生儿中体重超过3Kg的人数的

频数(率)分布表

频数(率)分布:把频数(率)按组值的顺序排列起来,便得到离散型数据的频数(率)分布。

频数(率)分布还可以用图形表示,见图1-1。

图1-1 每10名新生儿中体重超过3Kg的人数的频数分布图

下面介绍连续型数据的频数(率)分布表和分布图的编绘方法。

例 1.2 表1-2列出了高粱“三尺三”提纯时所调查的100个数据。

表1-2 “三尺三”株高测量结果

155 153 159 155 150 159 157 159 151 152

159 158 153 153 144 156 150 157 160 150

150 150 160 156 160 155 160 151 157 155

159 161 156 141 156 145 156 153 158 161

157 149 153 153 155 162 154 152 162 155

161 159 161 156 162 151 152 154 157 162

158 155 153 151 157 156 153 147 158 155

148 163 156 163 154 158 152 163 158 154

164 155 156 158 164 148 164 154 157 165

158 166 154 154 157 167 157 159 170 158 从上表中除可以看出最大值为170,最小值为141,以及平均高度大约在150-160之外,很难再看出什么规律出来。但将以上数据列成频数分布表以后,便可以清楚地看出数据的变化规律。

表1-3 “三尺三”株高频数(率)分布表

频数(率)分布:把频数(率)按组界的顺序排列起来,便得到了连续型数据的频数(率)分布。

从频数分布表中可见到的规律性:

1、植株矮的频数低,植株高的频数也低,植株中等高度的频数最高。

2、频数分布基本是两侧对称的。

3、植株平均高度在156-158厘米范围内。

编制连续型数据频数(率)分布表的要点:

1、求出极差R,R = max x– min x,根据极差决定划分的组数,一般以10 – 15组为宜。

2、根据极差和组数求出组距,按照组距划分组限。组限是按实验记录数据划分的每一组的上下限。

3、确定组界,组界是每一组实际值的上下界。

4、计算中值,中值是每一组组限的平均值。

5、以唱票的方式把原始数据添入相应的组限内,统计出每组的频数并计算出相应的频率。

连续型数据的频率分布同样可以用频数(率)分布图表示。下面是频数(率)分布的直方图。

图1-2 “三尺三”株高直方图

横轴表明组界,纵轴标明频数(率),以每一组的组界为一边,相应的频数(率)为另一边,作成连续的矩形,构成直方图。

连续型数据的频数(率)分布还可以用多边形图表示。

图1-3 “三尺三”株高多边形图

横轴为中值,纵轴为频数(率),标上各点,连接各点构成多边形图。

第三种频数(率)图是累积频数图。首先编制出累积频数(率)表。再以横轴为中值,纵轴为频数(率)绘图。

表1-4 “三尺三”株高的累计频数分布表

中值累积频数(率)中值累积频数(率)

142 1 157 71

145 3 160 86

图1-4 “三尺三”株高累计频数分布图

1.2.3 研究频数(率)分布的意义

1、可以描述数据的集中点,以平均值表示。

2、可以描述数据变异的情况。

3、可以描述数据分布的形状。

4、可以显示数据中的不规则的情况。

1.2.4 频数(率)分布的不恒定性

频数(率)分布是样本分布,由于不同次抽样的随机误差,造成样本间的波动。见下例。

表1-5 每10名行人中男性人数分布表

样本1 样本2

男性人数频数男性人数频数

0 1 0 0

1 2 1 1

2 9 2 6

3 17 3 18

4 27 4 25

5 4

6 5 40

6 29 6 30

7 12 7 20

8 4 8 9

9 3 9 1

10 0 10 0

总计 150 总计 150

1.3 样本的几个特征数

样本特征数:描述样本分布特征的数字。如,平均数、标准差、偏斜度和峭

相关文档
最新文档