生物统计第二章 补充习题及答案
生物统计学习题集2

生物统计学习题集生物统计学课程组编写第一章概论1.什么是生物统计学?生物统计学的主要内容和作用是什么?2.解释并举例说明以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
3.误差与错误有何区别?4.田间试验有哪些特点?保证田间试验质量的基本要求有哪些?第二章试验资料的整理与特征数的计算1.试验指标试验因素因素水平试验处理试验小区总体样本样本容量随机样本总体准确性精确性2.什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有那些?制表和绘图时应注意什么?3.标准误与标准差有何联系与区别?4.算术平均数与加权平均数形式上有何不同?为什么说他们的实质是一致的?5.平均数与标准差在统计分析中有什么用处?他们各有哪些特征?6.试验资料分为哪几类?各有何特点?7.简述计量资料整理的步骤。
8.常用的统计表和统计图有哪些?9.算术平均数有哪些基本性质?10.总体和样本差的平均数、标准差有什么共同点?又有什么联系和区别?11.在对果树品种调查研究中,经观测所得的干周、冠高、冠幅、新梢生长量、萌芽率、花数、果数、座果率、单果重、产量等一系列数量资料,哪些是连续性数量,哪些是非连续性数量?-1试根据所给资料编制次数分布表。
13.根据习题12的次数分布表,绘制直方图和多边形图,并简述其分布特征。
14.根据习题12的资料,计算平均数、标准差和变异系数。
15.根据习题12的资料,计算中位数,并与平均数进行比较。
16.试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19金皇后:16,21,24,15,26,18,20,19,22,19第三章概率与概率分布1.试解释必然事件、不可能事件、随机事件。
生物统计学(第3版)杜荣骞 课后习题答案 第二章 概率和概率分布

第二章概率和概率分布2.1做这样一个试验,取一枚五分硬币,将图案面称为A,文字面称为B。
上抛硬币,观察落下后是A向上还是B向上。
重复10次为一组,记下A向上的次数,共做10组。
再以100次为一组,1 000次为一组,各做10组,分别统计出A的频率,验证2.1.3的内容。
答:在这里用二项分布随机数模拟一个抽样试验,与同学们所做的抽样试验并不冲突。
以变量Y表示图向上的次数,n表示重复的次数,m表示组数,每次落下后图向上的概率φ=1/2。
SAS程序如下,该程序应运行3次,第一次n=10,第二次n=100,第三次n=1000。
options nodate;data value;n=10;m=10;phi=1/2;do i=1 to m;retain seed 3053177;do j=1 to n;y=ranbin(seed,n,phi);output;end;end;data disv;set value;by i;if first.i then sumy=0;sumy+y;meany=sumy/n;py=meany/n;if last.i then output;keep n m phi meany py;run;proc print;title 'binomial distribution: n=10 m=10';run;proc means mean;var meany py;title 'binomial distribution: n=10 m=10';run;以下的三个表是程序运行的结果。
表的第一部分为每一个组之Y的平均结果,包括平均的频数和平均的频率,共10组。
表的第二部分为10组数据的平均数。
从结果中可以看出,随着样本含量的加大,样本的频率围绕0.5做平均幅度越来越小的波动,最后稳定于0.5。
binomial distribution: n=10 m=10OBS N M PHI MEANY PY1 10 10 0.5 5.7 0.572 10 10 0.5 4.5 0.453 10 10 0.5 5.1 0.514 10 10 0.5 6.1 0.615 10 10 0.5 6.1 0.616 10 10 0.5 4.3 0.437 10 10 0.5 5.6 0.568 10 10 0.5 4.7 0.479 10 10 0.5 5.2 0.5210 10 10 0.5 5.6 0.56binomial distribution: n=10 m=10Variable Mean ---------------------- MEANY 5.2900000 PY 0.5290000 ----------------------binomial distribution: n=100 m=10 OBS N M PHI MEANY PY1 100 10 0.5 49.71 0.49712 100 10 0.5 49.58 0.49583 100 10 0.5 50.37 0.50374 100 10 0.5 50.11 0.5011 5 100 10 0.5 49.70 0.49706 100 10 0.5 50.04 0.50047 100 10 0.5 49.20 0.49208 100 10 0.5 49.74 0.49749 100 10 0.5 49.37 0.4937 10 100 10 0.5 49.86 0.4986binomial distribution: n=100 m=10Variable Mean ---------------------- MEANY 49.7680000 PY 0.4976800 ----------------------binomial distribution: n=1000 m=10 OBS N M PHI MEANY PY1 1000 10 0.5 499.278 0.499282 1000 10 0.5 499.679 0.499683 1000 10 0.5 499.108 0.499114 1000 10 0.5 500.046 0.50005 5 1000 10 0.5 499.817 0.49982 6 1000 10 0.5 499.236 0.49924 7 1000 10 0.5 499.531 0.499538 1000 10 0.5 499.936 0.499949 1000 10 0.5 500.011 0.50001 10 1000 10 0.5 500.304 0.50030binomial distribution: n=1000 m=10Variable Mean ---------------------- MEANY 499.6946000 PY 0.4996946 ----------------------2.2 每个人的一对第1号染色体分别来自祖母和外祖母的概率是多少?一位男性的X 染色体来自外祖父的概率是多少?来自祖父的概率呢?答: (1)设A 为一对第1号染色体分别来自祖母和外祖母的事件,则()41211211=⨯⨯⨯=A P(2)设B 为男性的X 染色体来自外祖父的事件,则()21211=⨯=B P(3)设C 为男性的X 染色体来自祖父的事件,则 ()0=C P2.3 假如父母的基因型分别为I A i 和I B i 。
生物统计学答案

生物统计学答案第一章绪论一、名词释义1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研究单位称为个体。
3.样本:人口的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5.随机抽样:从人群中随机抽取的样本称为随机抽样,随机抽样是指人群中的每个个体都有相同的机会被选择形成一个样本。
6.参数:由总体计算的特征数称为参数。
7.统计学:样本计算出的特征数称为统计学。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9.系统误差:也称为单侧误差,由一些可控但不可控的因素引起,影响测试的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11.准确度:亦称准确度,指在调查或实验研究中,同一测试指标或特征的重复观测值彼此接近的程度。
二、简答题1.什么是生物识别?它在畜牧业和水产科学研究中扮演什么角色?答:(1)生物统计学是数理统计原理和方法在生物科学研究中的应用。
这是一门应用数学。
(2)生物统计学在畜牧业和水产科学研究中的作用主要体现在两个方面:一是提供实验或调查设计的方法,二是提供整理和分析数据的方法。
2、统计分析的两个特点是什么?① 人口分析的特点有两个。
② 它具有很高的可靠性,但也有一定的错误率。
3、如何提高试验的准确性与精确性?答:在调查或测试中,我们应该严格遵守调查或测试计划,准确观察和记录,努力避免错误。
特别是要注意试验条件的一致性,即除了研究的各种处理外,还应通过合理的调查或试验设计,尽可能地控制试验畜禽的初始条件,如品种、性别、年龄、健康状况、饲养条件和管理措施等,努力提高测试的准确性和准确性。
4、如何控制、降低随机误差,避免系统误差?答:随机误差是由一些不可控的偶然因素引起的,这些因素很难消除,只能尽可能地加以控制和减少;主要是实验动物的初始条件、饲养条件和管理措施应在实验中保持一致,以尽量减少差异。
生物统计学课后答案

生物统计学课后答案【篇一:生物统计学经典习题(期末复习)个人整理】class=txt>【例5.1】母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。
1.提出无效假设与备择假设2、计算值经计算得:=114.5,s=1.581:=114,:≠114所以==10-1=9==1.0003、查临界值,作出统计推断由|t|,p0.05,故不能否定=9,查值表(附表3)得:=2.262,因为=114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为114天的总体。
【例5.2】按饲料配方规定,每1000kg某种饲料中维生素c不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素c含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素c含量服从正态分布,问此产品是否符合规定要求?按题意,此例应采用单侧检验。
1、提出无效假设与备择假设经计算得:=252,s=9.115:=246,:246、计算值所以==12-1=11==2.2813、查临界值,作出统计推断因为单侧(11),p0.05,否定:=246,接受=双侧=1.796,|t|单侧t0.05:246,表明样本平均数与总体平均数差异显著,可以认为该批饲料维生素c含量符合规定要求。
第三节两个样本平均数的差异显著性检验【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。
设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg 时的背膘厚度有无显著差异?表5-3长白与蓝塘后备种猪背膘厚度:=,:≠=0.0998、=0.1096,1、提出无效假设与备择假设2、计算值此例=1.817、、=12、=11,经计算得=1.202、=0.1508=0.123、分别为两样本离均差平方和。
生物统计学习题集答案

.. 生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为 连续 变量和 非连续 变量。
2 样本统计数是总体 参数 的估计量。
3 生物统计学是研究生命过程中以样本来推断 总体 的一门学科。
4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5 统计学的发展过程经历了 古典记录统计学、 近代描述统计学现代推断统计学 3个阶段。
6 生物学研究中,一般将样本容量 n大于等于 30称为大样本。
7 试验误差可以分为__随机误差 、系统误差 两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
(-)2 资料的精确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。
总体:具有相同的个体所构成的集合称为总体。
连续变量:是指在变量范围内可抽出某一范围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章 试验资料的整理与特征数的计算一、填空1 1 资料按生物的性状特征可分为资料按生物的性状特征可分为资料按生物的性状特征可分为_________数量性状资料数量性状资料数量性状资料__变量和变量和______变量性变量性状资料状资料__变量。
2 2 直方图适合于表示直方图适合于表示直方图适合于表示______计量计量计量 、、 连续变量连续变量__资料的次数分布。
3 3 变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即__集中性集中性__和____离散性离散性离散性__。
4 4 反映变量集中性的特征数是反映变量集中性的特征数是反映变量集中性的特征数是______平均数平均数平均数______,反映变量离散性的特征,反映变量离散性的特征数是数是______变异数(标准差)变异数(标准差)变异数(标准差)__。
生物统计学课后习题解答

第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
生物医学研究的统计学方法 课后答案(思考与联系)

第1章绪论思考与练习参考答案一、最佳选择题1. 研究中的基本单位是指( D)。
A.样本 B. 全部对象C.影响因素D. 个体E. 总体2. 从总体中抽取样本的目的是( B )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。
A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。
A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量2. 同质与变异3. 总体与样本4. 参数与统计量5. 误差6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。
而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。
2. 某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
生物统计学各章题目(含答案)

生物统计学各章题目一填空1.变量按其性质可以分为(连续)变量和(非连续)变量。
2.样本统计数是总体(参数)的估计值。
3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。
4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。
5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。
6.生物学研究中,一般将样本容量(n ≥30)称为大样本。
7.试验误差可以分为(随机误差)和(系统误差)两类。
判断1.对于有限总体不必用统计推断方法。
(×)2.资料的精确性高,其准确性也一定高。
(×)3.在试验设计中,随机误差只能减小,而不能完全消除。
(∨)4.统计学上的试验误差,通常指随机误差。
(∨)二填空1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。
2. 直方图适合于表示(连续变量)资料的次数分布。
3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。
4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。
5.样本标准差的计算公式s=( )。
判断题1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
(×)2. 条形图和多边形图均适合于表示计数资料的次数分布。
(×)3. 离均差平方和为最小。
(∨)4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
(∨)5. 变异系数是样本变量的绝对变异量。
(×)单项选择1. 下列变量中属于非连续性变量的是( C ).A.身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示.A. 条形B.直方C.多边形D.折线 3. 关于平均数,下列说法正确的是( B ).122--∑∑n n x x )(A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章习题及答案(来源:《生物统计学学习指导》李春喜等,科学出版社,2008:p14-15)一、填空1.变量的分布有两个明显的基本特征,即和。
二、判断1.计数资料也称为连续性变异资料。
计量资料也称为不连续性变异资料或间断性变异资料。
()三、选择题(《生物统计学题解及练习》杜荣赛高等教育出版社。
2003.p164)1.下面的变量属于非连续性变量的是( )。
A. 身高B. 体重C. 血型D. 血压2.身高、体重、年龄这一类数据属于()。
A. 离散性数据B. 计数数据C. 连续性数据D. 质量性状资料3.身高、体重、年龄这一类数据属于()。
A. 离散性数据B. 计数数据C. 计量资料D. 质量性状资料4.每十人中男性人数,每一万人中得H1N1流感人数,每亩麦田中杂草株数等,这一类数据属于()。
A. 离散性数据B. 连续性数据C. 计量资料D. 质量性状资料5.每十人中男性人数,每一万人中得H1N1流感人数,每亩麦田中杂草株数等,这一类数据属于()。
A. 计数数据B. 连续性数据C. 计量资料D. 质量性状资料6.频数按其组值的次序排列起来,称为()。
A. 频数排列B. 频数分布C. 组值排列D. 二项分布四、计算题1. 现以50枚受精种蛋孵化出雏鸡的天数为例,说明计数资料的整理。
21 20 20 21 23 22 22 22 21 22 20 23 22 23 22 19 22 2324 22 19 22 21 21 21 22 22 24 22 21 21 22 22 23 22 22小鸡出壳天数在19─24天范围内变动,有6个不同的观察值。
用各个不同观察值进行分组,共分为6组,可得表2-3形式的次数分布表。
表2-3 50枚受精种蛋出雏天数的次数分布表孵化天数划线计数次数(f)19 ║ 220 ║│ 321 ╫╫╫╫1022 ╫╫╫╫╫╫╫╫║║2423 ╫╫║║924 ║ 2合计50从表2-3可以看出:种蛋孵化出雏天数大多集中在21−23天,以22 天的最多,孵化天数较短(19−20天)和较长(24天)的都较少。
f200−209 ║ 2210−219 ╫╫║│8220−229 ╫╫╫╫╫╫15230−239 ╫╫╫╫╫╫╫╫20240−249 ╫╫╫╫╫╫╫╫║│23250−259 ╫╫╫╫╫╫║17260−269 ╫╫║│8270−279 ║║ 4280−289 ║ 2290−299 │ 1合计100有些计数资料,观察值较多,变异范围较大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。
对于这样的资料,可扩大为以几个相邻观察值为一组,适当减少组数,这样资料的规律性就较明显,对资料进一步计算分析也比较方便。
例如观测某品种100只蛋鸡每年每只鸡产蛋数(原始资料略),其变异范围为200−299枚。
这样的资料如以每个观察值为一组,则组数太多(该资料最多可分为100组),如间隔10枚为一组,则可使组数适当减少。
经初步整理后分为10组,资料的规律性就比较明显,见表2-4。
从表2-4可以看到,大部分蛋鸡的年产蛋数在220−259枚,但也有少数蛋鸡每年产蛋数少到200−209枚,多到290−299枚。
2. 将126头基础母羊的体重资料(见表2-5)整理成次数分布表。
1、求全距全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即R=Max(x)-Min(x)表2-5中,基础母羊的最大体重为65.0kg,最小体重为37.0kg,因此R=65.0-37.0=28.0kg。
2、确定组数组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。
组数要适当,不宜过多,亦不宜过少。
分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。
一般组数的确定,可参考表2-6。
表2-5 126头基础母羊的体重资料单位:kg 53.0 50.0 51.0 57.0 56.0 51.0 48.0 46.0 62.0 51.0 61.056.0 62.0 58.0 46.548.0 46.0 50.0 54.5 56.0 40.0 53.0 51.0 57.0 54.0 59.052.0 47.0 57.0 59.0 54.0 50.0 52.0 54.0 62.5 50.0 50.053.0 51.0 54.0 56.0 50.0 52.0 50.0 52.0 43.0 53.0 48.050.0 60.0 58.0 52.0 64.0 50.0 47.0 37.0 52.0 46.0 45.042.0 53.0 58.0 47.0 50.0 50.0 45.0 55.0 62.0 51.0 50.043.0 53.0 42.0 56.0 54.5 45.0 56.0 54.0 65.0 61.0 47.052.0 49.0 49.0 51.0 45.0 52.0 54.0 48.0 57.0 45.0 53.054.0 57.0 54.0 54.0 45.0 44.0 52.0 50.0 52.0 52.0 55.050.0 54.0 43.0 57.0 56.0 54.0 49.0 55.0 50.0 48.0 46.056.0 45.0 45.0 51.0 46.0 49.0 48.5 49.0 55.0 52.0 58.054.5本例中,n=126,根据表2-6,初步确定组数为10组。
3、确定组距每组最大值与最小值之差称为组距,记为i。
分组时要求各组的组距相等。
组距的大小由全距与组数确定,计算公式为:组距(i)=全距/组数本例i=28.0/10≈3.0。
4、确定组限及组中值各组的最大值与最小值称为组限。
最小值称为下限,最大值称为上限。
每一组的中点值称为组中值,它是该组的代表值。
组中值与组限、组距的关系如下:组中值=(组下限+组上限)/2=组下限+1/ 2组距=组上限-1/2组距由于相邻两组的组中值间的距离等于组距,所以当第一组的组中值确定以后,加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推。
组距确定后,首先要选定第一组的组中值。
在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近于或等于资料中的最小值为好。
第一组组中值确定后,该组组限即可确定,其余各组的组中值和组限也可相继确定。
注意,最末一组的上限应大于资料中的最大值。
表2-5中,最小值为37.0,第一组的组中值取37.5,因组距已确定为3.0,所以第一组的下限=37.5-(1/2)×3.0=36.0;第一组的上限也就是第二组的下限为36.0+3.0 =39.0;第二组的上限也就是第三组的下限为39.0+3.0=42.0,……,以此类推,一直到某一组的上限大于资料中的最大值为止,于是可分组为:36.0 −39.0,39.0 −42.0,……。
为了使恰好等于前一组上限和后一组下限的数据能确切归组,约定将其归入后一组。
通常将上限略去不写。
如第一组记为36.0 −,第二组记为39.0 −,……。
5、归组划线计数,作次数分布表分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。
如表2-5中,第一个观察值53.0,应归入表2-7中第六组,组限为51.0 −54.0;第二个数50.0,应归入第五组,组限为48.0 −51.0;依次将126个观察值都进行归组划线计数,制成次数分布表,见表2-7。
表2-7 126头基础母羊的体重的次数分布表组别组中值划线计数次数(f)36.0 −37.5 │ 139.0 −40.5 │ 142.0 −43.5 ╫╫│ 645.0 −46.5 ╫╫╫╫╫╫║│1848.0 −49.5 ╫╫╫╫╫╫╫╫26│2751.0 −52.5 ╫╫╫╫╫╫╫╫║2654.0 −55.5 ╫╫╫╫╫╫╫╫│57.0 −58.5 ╫╫╫╫║1260.0 −61.5 ╫╫║763.0 −64.5 ║ 2合计126次数分布表不仅便于观察资料的规律性,而且可根据它绘成次数分布图及计算平均数、标准差等统计量。
从表2-7可以看出126头基础母羊体重资料分布的一般趋势:体重的变异范围在37.0 − 65.0kg,大部分母羊的体重在45.0−60.0kg之间。
在归组划线时应注意,不要重复或遗漏,归组划线后将各组的次数相加,结果应与样本含量相等,如不等,证明归组划线有误,应予纠正。
在分组后所得实际组数,有时和最初确定的组数不同,如第一组下限和资料中的最小值相差较大或实际组距比计算的组距为小,则实际分组的组数将比原定组数多;反之则少。
3.现以某小麦品种的每穗小穗数为例,随机采取100个麦穗,计数每穗小穗数,未加整理的资料列成表3.1。
表3.1 100个麦穗的每穗小穗数18 15 17 19 16 15 20 18 19 1717 18 17 16 18 20 19 17 16 1817 16 17 19 18 18 17 17 17 1818 15 16 18 18 18 17 20 19 1817 19 15 17 17 17 16 17 18 1817 19 19 17 19 17 18 16 18 1717 19 16 16 17 17 17 15 17 1618 19 18 18 19 19 20 17 16 1918 17 18 20 19 16 18 19 17 1615 16 18 17 18 17 17 16 19 17上述资料为间断性变数资料,每穗小穗数在15—20的范围内变动,把所有观察值按每穗小穗数多少加以归类,共分为6组,组与组间相差为1小穗,称为组距。
这样可得表3.2形式的次数分布表。
从表3.2中看到,一堆杂乱的原始资料,经初步整理后,就可了解资料的大致情况,如每穗小穗数以17个为最多等。
另外,经过整理的资料也便于进一步的分析。
有些间断性变数资料,观察值个数较多,变异幅度较大,不可能如上例那样按每一观察值归一组的方法整理。
例如研究某早稻品种的每穗粒数,共观察200个稻穗,每穗粒数的变异幅度为27—83粒。
这样的资料如以每一观察值为一组,则组数太多,资料的规律性就显示不出来。
如每组包含若干粒数的幅度,例如以5粒为一组,则可使组数适当减少。
经初步整理后分为12组(这里要求组距相等),资料的规律性就较明显,如表3.3。
从表3.3可以看出,半数多的稻穗的每穗粒数在46—60粒间,大部分稻穗的每穗粒数在41—70间;但也有少数稻穗少到26—30粒的,多到81—85的。
4. 兹以表3.4的100行水稻试验的产量为例,说明整理方法。