生物统计附实验设计复习题及答案

生物统计附实验设计复习题及答案
生物统计附实验设计复习题及答案

总体:根据研究目的确定的研究对象的全体

个体:总体中的一个研究单位

样本:实际研究中的一类假象总体

样本含量:样本中所包含的个体数目称为样本含量或大小

随机样本:一类从总体中随机抽得到的具有代表性的样本

统计量:由样本计算的特征数

参数:由总体计算的特征数

精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度

系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。

偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。

连续性变数资料:指用量测方式获得的数量性状资料

离散型变数资料:指用计数方式获得的数量性状资料

算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数

平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数

标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。

方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。

离均差平方和:样本各观测值变异程度大小的另一个统计数

试验:在一定条件下对自然现象所进行的观察或试验统称为试验

随机事件:随机试验的每一种可能结果

概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率

小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理

正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布

标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,

记为N(0,1)

双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率

单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率

二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n 和p的二项分布

标准误:反映样本平均数的抽样误差的大小的一种指标

t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t分布。

假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。

t检验:两总体方差未知但相同,用以两平均数之间差异显著性的检验。

无效假设:被检验的假设,通过检验可能被否定,也可能未被否定。备择假设:是在无效假设被否定时准备接受的假设。

显著水平:用来确定无效假设是否被否定的概率标准。

Ⅰ型错误:把非真实差异错判为真实差异。

Ⅱ型错误:把真实差异错判为非真实差异。

双侧检验(双尾检验):利用两侧尾部的概率进行的检验。

单侧检验(单尾检验):利用一侧尾部的概率进行的检验。

否定区:

接受区:

分位数:又称百分位点。若概率0Za)=α的实数

配对设计:是指先根据配对的要求将试验单位两两配对,然后将配对成子的两个实验单位随机分配到两个处理组中。

区间估计:是指在一定概率保证下指出总体参数的可能范围。

置信区间:是指在进行区间估计时所给出的可能范围。

置信度(置信概率):是指在进行区间估计时所给出的概率保证。

方差分析:实质上是关于观测值变异原因的数量分析。

试验指标:用来衡量试验结果的好坏或处理效应的高低,在试验中具

有测定的性状或观测的项目。

试验因素:实验中所研究的影响试验指标的因素。

因素水平:试验因素所处的某种特定状态或数量等级。

试验处理:率先设计好的实施在试验单位上的具体项目。

试验单位:在试验中能够接受不同试验处理的独立的试验载体。

多重比较:统计学上指多个平均数两两之间的相互比较称为多重比较。

主效应:由于因素水平的改变而引起试验指标观测值平均数的改变量称为主效应。

简单效应:在某因素同一水平上,另一因素不同水平试验指标观测值之差称为简单效应。

交互作用:在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上的简单效应不同。

适合性检验:判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。

独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验。

相关变量:存在相关关系的变量叫做相关变量。

回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。

相关分析:研究随机变量之间相关性的统计分析方法。

直线回归分析:如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为直线回归分析

直线相关分析:对两个相关变量间的直线关系进行相关分析称为直线相关分析

决定系数:在Y的总平方和中,由X引起的平方和所占的比例,记为r2(r的平方)

相关系数:统计学上把决定系数r2的平方根称为x与y的相关系数试验设计:以概率论和数理统计为理论基础,经济地,科学地安排试验的一项技术。

试验方案:叙述试验的背景、理论基础和目的,试验设计、方法和组织,包括统计学考虑、试验执行和完成的条件。方案必须由参加试验的主要研究者、研究机构和申办者签章并注明日期。

唯一差异原则:指除了试验处理不同外,其他所有条件应相同,以保

证试验处理具有可比性

随机:使用随机方法对试验动物分组,使参试动物分入各试验处理组的机会相等,以避免

试验动物分组事试验人员主观倾向的影响

重复:试验的每一个处理都实施在两个或两个以上的试验单位上

局部条件一致原则:在试验环境或试验差异较大的情况下,将试验环境或试验单位分成若干个小组,在小组内是非处理因素尽可能一致,实现试验条件的局部一致性

完全随机设计:根据试验处理将全部试验动物随机分成若干组,然后再按组实施不同处理的设计

随机单位组设计:同一单位组内各头试验动物的初始条件尽可能一致,不同单位组间试验动物的初始条件允许有差异

拉丁方设计:从横行和直列两个方向进行局部控制,比随机单位组设计多一个单位租的设计

二、填空

1、生物统计分描述性统计和分析性统计。描述性统计是指运用分类、制表、图形以及计算概括性数据(平均数、标准差等)来描述数据特征的各项活动。分析性统计是进行数据观察、数据分析以及从中得出

统计推断的各项活动。

2、统计分析的基本过程就是由样本推断总体的过程。该样本是该总体的一部分。

3、由样本获取总体的过程叫抽样。常用的抽样方法有随机抽样、顺序抽样、分等按比例抽样、整群抽样等。

4、样本平均数与总体平均数的差异叫抽样误差。常用 S/√N表示。

5、只有降低抽样误差才能提高试验结果的正确性。试验结果的正确性包括准确性和精确性。

6、试验误差按来源分为系统误差(条件误差)和随机误差(偶然误差)。系统误差(条件误差)影响试验结果的准确性,随机误差(偶然误差)影响试验结果的精确性。

7、系统误差(条件误差)可以控制,可通过合理的试验设计方法降低或消除。随机误差(偶然误差)不可控制,可通过理论分布来研究其变异规律,或相对比较其出现的概率的大小。

8、样本推断总体分假设检验和区间估计两大内容。常用的检验方法有t检验、F检验和卡方检验。

9、置信区间指在一定概率保证下总体平均数的可能范围。

10、t检验是通过样本平均数差值的大小来检验处理效应是否存在,

两样本平均数的差值代表了试验的表观效应,它可能由处理效应(真实效应)和误差效应引起,要检验处理效应是否存在,常采用反证法。此法先建立无效假设:即假设处理效应不存在,样本平均数差值是由误差引起,根据差异在误差分布里出现的概率(即可能性大小的衡量)来判断无效假设是否成立。

11、判断无效假设是否成立的依据是小概率事件实际不可能原理,即假设检验的基本依据。用来肯定和否定无效假设的小概率,我们称之为显著水平,通常记为α。

12、t检验通常适合两样本连续性(非间断性)随机变量资料的假设检验,当二项分布逼近正态分布时,百分数资料也可用t检验。13、F检验也叫方差分析。通常适合三个或三个以上样本连续性(非间断性)随机变量资料的假设检验。顾名思义,F检验是用方差的变异规律(即F分布)来检验处理效应是否存在。

14、F检验是从总离均差平方和与自由度的剖分开始,将总变异剖分为组间变异和组内变异。因为组间变异由处理效应和误差效应共同引起,组内变异由误差效应引起。因而,将计算出的组间方差和组内方差进行比较,就可判断处理效应是否存在。

15、F检验显著或极显著说明组间处理效应存在,但并不能说明每两组间都存在差异,要知道每两组间是否有差异,必须进行多重比较,常采用的比较方法有最小显著差数法(LSD法)和最小显著极差法(LSR

法),后一种方法又分为q法和新复极差法(SSR法)。生物试验中常采用新复极差法(SSR法)。

16、两因素无重复观测值方差分析只能分析试验因素的简单效应和主效应,不能分析出互作效应,因此时计算的误差自由度为0。当两因素有互作效应时,试验设计一定要在处理组(水平组合)内设立重复。

17、两因素有重复观察值方差分析,既可分析出两因素的主效应,还可分析出互作效应。当互作效应显著存在时,可通过多重比较找出最佳水平组合。

18、35、多重比较的结果通常用字母表示,平均数右上角具有相同英文字母表示差异不显著,具有不同英文字母表示差异显著。用小写英文字母表示差异显著,用大写英文字母表示差异极显著。

19、当二项分布接近于正态分布时,两次数资料样本的差异,可通过计算百分数,用t检验。

20、次数资料也可用2χ检验法进行假设检验,2χ检验可分为适合性检验和独立性检验。

21、独立性检验要先设计出联列表,然后用2χ检验,检验两因子是相互独立还是相互依赖,即两因子有无相关性。

22、2χ分布是随自由度变化的一簇曲线,任一曲线皆是连续的。在次数资料的显著性检验中,当检验资料的自由度等于1时,算得的χ2值

将有所偏大,因此应予以矫正,统计上称为连续性矫正。

23、独立性检验中,当某一单元格所计算的理论次数在5以下时,要进行相近单元格合并处理。

24、三种统计分析能得出两试验因素有无相关性的结论,它们是:两因素有重复观测值方差分析,通过互作效应检验说明、独立性检验和相关回归分析。

25、假设检验差异显著或极显著,通常用“*”或“**”表示,说明:有95%或99%的把握说明处理效应存在,但要犯5%或1%的Ⅰ型错误,即有5%或1%的可能将处理效应不存在判定为存在,或将非真实效应判定为真实效应。

26、假设检验差异不显著说明试验结果有两种可能:一是真实效应的确不存在,二是由于犯Ⅱ型错误将真实性差异判定为非真实性差异,其可能性大小受显著水平α、样本平均数之间的差异、试验误差的大小有关。

27、假设检验的两个类型错误相互制约,处理好它们之间的矛盾的措施是加大样本含量、降低试验误差。

28、试验误差既影响样本观测值的准确性,又影响假设检验的可靠性,因而试验之前应采用合理的方法设计试验尽量减少或降低试验误差。试验设计的基本原理是随机、重复、局部条件一致。

29、常采用的试验设计方法有:完全随机试验设计、配对或随机单位组设计、拉丁方设计、交叉设计和正交试验设计。

30、完全随机试验设计只用随机和重复两个原理,适合样本变异不大时应用。配对或随机单位组设计应用了试验设计的随机、重复和局部条件一致三个原理,可以降低试验误差,当样本变异较大时应用。但组对和组单位组要求严格,不能勉强组对和组单位组。

31、正交试验设计适合多因子多水平试验设计。

32、试验计划的核心内容是试验方案、试验方法、样本含量的确定。

33、试验方案中各因素水平的设置常采用等差、等比和随机法确定。

34、多个处理(处理数为三或三以上时)比较试验中,各处理的重复数按误差自由度为12以上的原则来估计,因这以后临界F值减小的幅度已很小。

35、随机单位组单因素试验设计,试验结果的统计分析时,应将单位组看作一试验因子,采用两因素无重复观察值的方差分析。

36、两因素试验设计中,为了估计互作效应,降低误差效应,各处理组必须设立重复。

三、单项选择题

1、反映抽样误差的统计量是()A、标准差 B、变异系数C、

标准误 D、均方

2、算术平均数的重要特性之一是离均差平方和()。

A、最小

B、最大

C、等于零

D、接近零

3、在一个平均数和方差均为10的正态总体N(10, 10)中,以样本容

量10进行抽样,其样本平均数服从()分布。A. N(10, 1) B.

N(0, 10) C. N(0, 1) D. N(10, 10)

4、F检验后的最小显著差数多重比较检验法又可记为()。

A、LSD法

B、PLSD法

C、SSR法

D、DLSD

5、正态分布不具有下列()之特征。

A、左右对称

B、单峰分布

C、中间高、两头低

D、概率处处相

6、两个样本方差的差异显著性一般用()测验。

A、t

B、F

C、u

D、2 测验

7、一批种子的发芽率为75%,每穴播5粒,出苗数为4的概率()。

A、 B、 C、 D、

8、方差分析基本假定中除可加性、正态性外,尚有()假定。否则要对数据资料进行数据转换。

A、无偏性

B、无互作

C、同质性

D、重演性

9、若否定

H,则()。

A、犯α错误

B、犯β错误

C、犯α错误或不犯错误

D、犯β错误或不犯错误

10、系统误差与随机误差的区别在于。()

A、系统误差主要是由测量仪器或方法偏差所造成的;而随机误差则是由偶然不可控的因素造成的

B、系统误差是不可以控制的,随机误差是可以避免的

C、在相同条件下,重复测量一动物体高的结果不尽一致的原因是由系统误差造成的

D、系统误差是不定向的,随机误差是定向的

11、科技论文中,如果同行两个平均数右上角有相同的大写字母,有不同的小写字母,表示两个平均数()。A、差异不显著 B、差异极显著C、差异显著 D、不清楚

五、简答题:

1、假设检验的基本原理

可从试验的表面差异与实验误差与试验误差(或抽样误差)的权衡比

较中间接地推断试验的真实差异是否存在,这就是假设检验的基本思想

k≥个样本平均数,能否利用u或t测验进行两两独立比较2、对于k()3

为什么

不能

一,检验工作量大二,无统一的试验误差,误差估计的精确性和检验的灵敏性低

三,推断的可靠性低,检验的I型错误率大

3、推导离均差之和等于0,离均差平方和最小

4、如何提高试验的准确性与精确性

5、如何控制、降低随机误差,避免系统误差

答:进行多次平行试验能控制和降低随机误差,虽然单次测量的随机误差没有规律,但多次测量的总体却服从统计规律,通过对测量数据的统计处理,能在理论上估计起对测量结果的影响。只要试验工作做得精细,系统误差容易克服。

6、统计表与统计图有何用途常用统计图、统计表有哪些三线表的意义

答:统计表使用表格形式来表示数量关系,统计图是用几何图形来表

示数量关系,可以把研究对象的特征、内部构成、相互关系等简明、形象的表达出来,便于比较分析

统计表:简单表、复合表

统计图:长条图、圆图、线图、直方图、折线图

7、为什么变异系数要与平均数、标准差配合使用

答:因为变异系数的大小,同时受到平均数和标准差两个统计数的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出

8、标准误与标准差有何联系与区别

答:标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。

9、样本平均数抽样总体与原始总体的两个参数间有何联系

10、显著性检验的基本步骤是什么根据什么确定显著水平

答:基本步骤:

1,首先对试验样本所在作假设

2,在无效假设成立的前提下,构造合适的统计数,并研究试验所得统计数的抽样分布,计算无效假设正确的概率

3,根据“小概率事件实际不可能原理”否定或接受无效假设在假设检验中,无效假设是否被否定的依据是“小概率事件不可能原理”。

11、均数差异显著性检验中,肯定和否定无效假设的依据是什么

12、什么是统计推断为什么统计推断的结论有可能发生错误有哪两类错误如何降低犯两类错误的概率

一:统计推断是指根据样本和假定模型对总体作出的以概率形式表述的推断

二:由试验的真实差异跟抽样误差引起的

三:第一类错误:把非真实差异错判为真实差异

第二类差异:把真实差异错判为非真实差异

四:适当样本含量

13、进行显著性检验应注意什么问题如何理解显著性检验结论中的“差异不显著”、“差异显著”、“差异极显著”

答:注意:

1,要有合理的试验或抽样设计,保证试验结果的可靠、正确、且处理间要有可比性。

2,选用的假设检验方法应符合其应用条件

3,要正确理解差异显著或极显著的统计意义

4,合理建立统计假设,正确计算检验统计数

“差异不显著”:有两种可能:一:它们所在的总体平均数不相同,但被试验误差所掩盖,表现不出差异的显著性二:它们所在的总体平均数的确无差异

“差异显著”或:“差异极显著”:表面上如此差异的不同样本来自同一总体的可能性小于或,已到达了可以认为它们所在的总体平均数不相同的显著水平。但有些试验结果虽然差异大,但误差大,也许得不出“差异显著”的结论,而有些试验结果虽然差异小,但由于试验误差小,反而可能推断为“差异显著“

14、配对试验设计与非配对试验设计有何区别

区别:非配对试验设计是指当进行有两个处理的试验时,将试验单位随机分成两个组,然后对两组随机实施一个处理。

配对试验设计是先根据配对的要求将试验单位两两配对,然后将配对成子的两个试验单位随机分配到两个处理组中。要求配对成子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异

15、多个处理平均数间的相互比较为什么不宜用t检验法

第一:检验工作量大

第二:无统一的试验误差

第三:推断的可能性低检验的I型错误率大

16、推导总离均差平方和=组间离均差平方和+组内离均差平方和

17、为何要进行多重比较如何选用多重比较的方法

答:F值显著或极显著,否定了无效假设H0,表明实验的总差异主要来源于处理间的变异,实验中各处理平均数之间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些处理平均数间差异不显著。因而,有必要进行两两平均数间的比较,以具体判断两两处理平均数间的差异显著性。

一般的讲,一个实验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。如果否定正确的H0事关重大或后果严重的,或对实验要求严格时,用q法较稳妥;如果接受一个不正确的H0是事关重大或后果严重的,则宜用SSR法。生物实验中,由于实验误差较大,常采用SSR法;F 检验显著后,为了简便,也可采用LSD法。

18、在什么条件下方差分析之前要作数据转换常用的数据转换方法有哪几种各在什么条件下应用

答:分布的非正态性和方差的不同质经常相伴出现,对这类资料不能直接进行方差分析,而因考虑采用非参数方法分析或进行适当数据转换后再作方差分析。

常用的数据转换方法有三种:

平方根转换此法适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。

对数转换如果各组数据的标准差或全距与其平均数大体成比例,或者效应为相乘性或非相加性。

反正弦转换反正弦转换也称角度转换。此法适用于如发病率、感染率、病死率、受胎率等服从二项分布的资料

19、2检验与t检验、F检验在应用上有什么区别

生物统计试题 答案分析

生物统计试题 一. 名词解释(每小题3分,共15分) 1试验方案: 2 I 型错误 3总体 4显著水平: 5回归系数 1试验方案:根据试验目的与要求,所拟进行比较的全部处理的总称,是整个试验的核心部分。 2 I 型错误:在显著性检验中,无效假设H0本来成立而被否定,这类错误成为I型错误,亦称“弃真”错误. 3总体根据研究目的确定的研究对象的全体称为总体 4显著水平:在显著性检验(假设检验)中用来确定否定或接受无效假设的概率标准称为显著水平,常用α表示. 5单因数试验::在一个试验中,只研究某一因素不同水平的效果. 二. 选择题(每小题1分,共15分) 1 B 2 A 3 C 4 A 5 D 6 B 7 B 8 C 9 B 10 D 11 B 12 A 13 B 14 C 15 B 1.试验设计中遵循局部控制原则的主要作用是( )。 A.估计误差 B.降低误差 C.消灭误差 D.减少土壤差异 2 A 正态分布曲线是以参数μ和σ的不同而表现的一系列曲线( ) B正态分布曲线是以参数X和σ的不同而表现的一系列曲线 C正态分布曲线是以参数X和σ的不同而表现的一系列曲线 D正态分布曲线是以参数μ的不同而表现的一系列曲线 3.算术平均数的离均差平方之和为( )。 A. 1 B. 0 C. 最小 D. 最大

4.样本容量为n的样本方差自由度( )。 A.n-1 B. n+2 C. n D. n-2 5.总体平均数和总体方差都是()。 A.变数 B. 变异数 C. 统计数 D. 参数 6.保证总体参数位于一定区间范围的概率称为( )。 A.显著水平 B. 置信度 C. 临界值 D.置信限 7.比较观察与理论次数是否相等的假设测验称为( ) A.独立性测验 B. 适合性测验 C. t测验 D. F测验 8.X2独立性测验中自由度的计算方法为( ) A.k-1 B. k C. (r-1)(c-1) D. rc-1 9有一正态总体,其中σ=2、μ=30 ,求该总体x<26.08z中的概率() A 0.01 B 0.025 C 0.05 D 0.001 10 A第二类错误是指统计假设测验中否定了一个正确假设所犯的错误()B第二类错误是指这在统计假设检验中一般不会发生 C第一类是指统计假设检验中接受了一个错误假所设犯的错误 D第一类错误是指统计假设检验中否定了一个正确假设所犯的错误 11 以下那一个是样本标准误差() A: S B: S/n C: σ D:S2/n 12 以下的那一个分布与自由度无关() A 正态分布 B t分布 C X2分布 D F分布 13 在α=0.05水平上拒绝时要冒------的风险() A 0.01 B 0.05 C 0.95 D 0.99 14 单因数方差分析中,检验处理效应的方法是() A SS A除以SS e B SS e除以SS A C MS A除以 MS e D MS e除以 MS A 15 X2检验的矫正方法方法是() A 理论值减0.5 B 观察值与理论值之差的绝对值减0.5 C 观察值减理论值减0.5 D 观察值减0.5 三填空题(每空一分,共15分) 1试验设计是以————————、————————、、——————————三个原则为依据的。

《生物统计附试验设计》第五版-课后习题[前六章]

生物统计 第一章绪论 1.什么是生物统计?它在动物科学研究中有何作用? 2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么? 3.什么是参数、统计数?二者有何关系? 4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性? 5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差? 6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费 舍尔对统计学有何重要贡献? 第二章资料的整理 1.资料可以分为哪几种类型?它们有何区别与联系? 2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么? 3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有 何基本要求? 4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表, 并绘制次数分布直方图与折线图。 表格1 4某品种100头猪的血红蛋白含量(g/100ml) 13. 4 13. 8 14. 4 14. 7 14. 8 14. 4 13. 9 13. 13. 12. 8 12. 5 12. 3 12. 1 11. 8 11. 10. 1 11. 1 10. 1 11. 6 12. 12. 12. 7 12. 6 13. 4 13. 5 13. 5 14. 15. 15. 1 14. 1 13. 5 13. 5 13. 2 12. 7 12. 8 16. 3 12. 1 11. 7 11. 2 10. 5 10. 5 11. 3 11. 8 12. 2 12. 4 12. 8 12. 8 13. 3

生物统计学 实验报告 大肠杆菌

A 题 细胞体内代谢物浓度预测 随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。 对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM 数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。 活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质? 试根据附件中的数据完成如下问题: 1 根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。 2 筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价; 1.线性插补法处理缺失数据 原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺失点在线性插值函数的函数值填充该缺失值,即: 在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 代谢物浓度:取对数 代谢物理化性质:标准差标准化法 )1,1( m j n i S x x x j j ij ij ≤≤≤≤-=' 式中:.)(11,1121∑∑==--= =n i j ij j n i ij j x x n S x n x 3.SAS 软件建立多元线性回归方程 回归模型一般形式: u X b X b X b b Y k k +++++= (22110)

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

贵州大学《生物统计学》考试试卷(含答案)

贵州大学《生物统计学》考试试卷(含答案) 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是___C___。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用__D___。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是___B_____。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-

生物统计附试验设计

《生物统计附试验设计》 习题集 (动物医学专业用) 第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 二、简答题 1、什么是生物统计?它在畜牧、水产科学研究中有何作用? 2、统计分析的两个特点是什么? 3、如何提高试验的准确性与精确性? 4、如何控制、降低随机误差,避免系统误差? 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 二、简答题 1、资料可以分为哪几类?它们有何区别与联系? 2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样? 3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好? 4、统计表与统计图有何用途?常用统计图、统计表有哪些? 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题

1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 4、为什么变异系数要与平均数、标准差配合使用? 三、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10 96—100 29 104—108 28 112—116 20 120—124 15 128—132 13 136—140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 甲地137 133 130 128 127 119 136 132 乙地128 130 129 130 131 132 129 130 第四章常用概率分布 一、名词解释 随机事件概率的统计定义小概率原理正态分布标准正态分布双侧概率(两尾概率)单侧概率(一尾概率)二项分布波松分布标准误t分布

生物统计学实验指导

《生物统计学》实验教学教案 [实验项目] 实验一平均数标准差及有关概率的计算 [教学时数] 2课时。 [实验目的与要求] 1、通过对平均数、标准差、中位数、众数等数据的计算,掌握使用计算机计算统计量的方法。 2、通过对正态分布、标准正态分布、二项分布、波松分布的学习,掌握使用计算机计算有关概率和分位数的方法。为统计推断打下基础。 [实验材料与设备] 计算器、计算机;有关数据资料。 [实验内容] 1、平均数、标准差、中位数、众数等数据的计算。 2、正态分布、标准正态分布有关概率和分位数的计算。 3、二项分布有关概率和分位数的计算。 4、波松分布有关概率和分位数的计算。 [实验方法] 1、平均数、标准差、中位数、众数等数据的计算公式。 平均数=Average(x1x2…x n) 几何平均数=Geomean(x1x2…x n) 调和平均数=Harmean(x1x2…x n) 中位数=median(x1x2…x n) 众数=Mode(x1x2…x n) 最大值=Max(x1x2…x n) 最小值=Min(x1x2…x n) 平方和(Σ(x- )2)=Devsq(x1x2…x n) x 样本方差=Var (x1x2…x n) 样本标准差=Stdev(x1x2…x n) 总体方差=Varp(x1x2…x n) 总体标准差=Stdevp(x1x2…x n) 2、正态分布、标准正态分布有关概率和分位数的计算。 一般正态分布概率、分位数计算:

概率=Normdist(x,μ,σ,c) c 取1时计算 -∞-x 的概率 c 取0时计算 x 的概率 分位数=Norminv(p, μ, σ) p 取-∞到分位数的概率 练习: 猪血红蛋白含量x 服从正态分布N(12.86,1.332),(1) 求猪血红蛋白含量x 在11.53—14.19范围内的概率。(0.6826)(2) 若P(x <1l )=0.025,P(x >2l )=0.025,求1l ,2l 。 (10.25325) L1=10.25 L2=15.47 标准正态分布概率、分位数计算: 概率=Normsdist(x) c 取1时计算 -∞--x 的概率 c 取0时计算 x 的概率 分位数=Normsinv(p) p 取-∞到分位数的概率 练习: 1、已知随机变量u 服从N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 参考答案: (0.080757,0.06811,0.00988,0.5605) 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1; 0.52 (2) P(-αu ≤u <αu )=0.42; 0.95 参考答案: [1.644854, 0.63345; 0.553385, 1.959964] 3、二项分布有关概率和分位数的计算。 概率=Binomdist(x,n,p,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: 1、已知随机变量x 服从二项分布B (100,0.1),求μ及σ。 参考答案: 见P48,μ= np, σ=(npq)0.5 2、已知随机变量x 服从二项分布B(10,0.6),求P(2≤x ≤6),P(x ≥7),P(x<3)。 参考答案: 0.6054, 0.38228, 0.012295 4、波松分布有关概率和分位数的计算。 概率=Poisson(x,λ,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: ),(m n Permut C m n =

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计附实验设计(明道绪__第四版)题库及答案

,生物统计 1,总体:根据研究目的确定的研究对象的全体 2、个体:总体中的一个研究单位 3、样本:实际研究中的一类假象总体 4、样本含量:样本中所包含的个体数目称为样本含量或大小 5、随机样本:一类从总体中随机抽得到的具有代表性的样本 6、统计量:由样本计算的特征数 7、参数:由总体计算的特征数 8、精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度9、系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 10、偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 11、连续性变数资料:指用量测方式获得的数量性状资料 12、离散型变数资料:指用计数方式获得的数量性状资料 13、算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 14、平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 15、标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 16、方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 17、离均差平方和:样本各观测值变异程度大小的另一个统计数 18、试验:在一定条件下对自然现象所进行的观察或试验统称为试验 19、随机事件:随机试验的每一种可能结果 20、概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 21、正态分布:若连续性随机变量X的概率分布密度函数,则X服 从正态分布 22、标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0, 1) 23、双侧概率:我们把随机变量X在平均 数u加减不同倍数标准差σ区间 (u-kσ,u+kσ)之外,取值的概率称为双 侧概率 24、单侧概率:对应于两尾概率可以求得 随机变量x小于小于u-kσ或大于u+kσ的 概率 标准误:反映样本平均数的抽样误差的大 小的一种指标 25、假设检验(显著性检验):假设检验是 数理统计学中根据一定假设条件由样本推 断总体的一种方法。 26、t检验:两总体方差未知但相同,用 以两平均数之间差异显著性的检验。 27、无效假设:被检验的假设,通过检验可 能被否定,也可能未被否定。 28、备择假设:是在无效假设被否定时准 备接受的假设。 29、显著水平:用来确定无效假设是否被 否定的概率标准。 30、Ⅰ型错误:把非真实差异错判为真实 差异。 31、Ⅱ型错误:把真实差异错判为非真实 差异。 32、双侧检验(双尾检验):利用两侧尾部 的概率进行的检验。 33、单侧检验(单尾检验):利用一侧尾部 的概率进行的检验。 34、分位数:又称百分位点。若概率 0Za)=α的 实数 35、配对设计:是指先根据配对的要求将 试验单位两两配对,然后将配对成子的两 个实验单位随机分配到两个处理组中。 36、区间估计:是指在一定概率保证下指 出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出 的可能范围。 37、置信度(置信概率):是指在进行区间 估计时所给出的概率保证。 38、方差分析:实质上是关于观测值变异 原因的数量分析。 39、试验指标:用来衡量试验结果的好坏 或处理效应的高低,在试验中具有测定的 性状或观测的项目。 40、试验因素:实验中所研究的影响试验 指标的因素。 41、因素水平:试验因素所处的某种特定 状态或数量等级。 42、试验处理:率先设计好的实施在试验 单位上的具体项目。 43、试验单位:在试验中能够接受不同试 验处理的独立的试验载体。 44、多重比较:统计学上指多个平均数两两 之间的相互比较称为多重比较。 45、主效应:由于因素水平的改变而引起 试验指标观测值平均数的改变量称为主效 应。 46、简单效应:在某因素同一水平上,另 一因素不同水平试验指标观测值之差称为 简单效应。 47、适合性检验:判断实际观察的属性类 别分配是否符合已知属性类别分配理论或 学说的假设检验。 48、独立性检验:根据次数资料判断两类 因子彼此相关或相互独立的假设检验。 49、相关变量:存在相关关系的变量叫做 相关变量。 50、回归分析:是确定两种或两种以上变 数间相互依赖的定量关系的一种统计分析 方法。 51、相关分析:研究随机变量之间相关性 的统计分析方法。 52、直线回归分析:如果在回归分析中, 只包括一个自变量和一个因变量,且二者 的关系可用一条直线近似表示,这种回归 分析称为直线回归分析 53、直线相关分析:对两个相关变量间的 直线关系进行相关分析称为直线相关分析 54、相关系数:统计学上把决定系数r2 的平方根称为x与y的相关系数 55、试验设计:以概率论和数理统计为理 论基础,经济地,科学地安排试验的一项 技术。 56、随机:使用随机方法对试验动物分组, 使参试动物分入各试验处理组的机会相 等,以避免试验动物分组事试验人员主观 倾向的影响 57、重复:试验的每一个处理都实施在两

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计附试验设计题目

《生物统计附试验设计》复习题 (考试共有五种题型:其中名称解释5道共10分,单选10道共10分,判断题10道共10分,计算题4道共60分,问答题2道共10分) 一、名词解释题 1.总体: 4.准确性: 7.系统误差: 8.样本: 11.随机样本: 12.样本容量: 13.假想总体:, 15.数量性状资料: 17.全距: 18.简单表: 20.众数: 21.样本标准差: 22.几何平均数: 23.算术平均数: 24.调和平均数: 26.离均差: 28.变异系数: 29.统计推断: 30.小概率事件实际不可能性原理: 31.显著水平: 32.I型错误: 34.非配对设计: 35.配对设计:, 37.试验处理: 38.试验指标: 39.重复: 40.试验单位:

41.因素水平: 42.多重比较。 44.独立性卡方检验: 46.相关分析: 47.回归分析: 51.相关系数: 52.试验设计(狭义): 53.试验方案: 56.局部控制: 57.完全随机设计: 59.多因素试验: 试验中只进行一种因素的测定 62.完全随机抽样: 二、单项选择题 1、单因素方差分析的数学模型是()。 ①x ij =μ+αi+εij ②x ij =μ+αi③x i =μ+αi+βj +εij ④x ij =αi +εij 2、.在单因素方差分析中一定有() ①SST=SSt+SSe②SSt〉SSe③SSt=SSe④SSt<SSe 3、一元线性回归的假设检验()。 ①只能用t检验②只能用F检验③两者均可④两者均不可 4、在单因素方差分析中一定有() ①dfT=dft+dfe②dfT≠dft+dfe ③dfT=dft ④dft=dfe 5、简单相关系数的取值范围是() ①-1MSe②MST≠MSt+MSe ③MST=MSt+MSe④MSt<MSe 8、生物统计学创始人的是()

卫生统计学试卷B(含答案)

卫生统计学试卷 适用范围:__________ 出题教师:__________ 试卷满分 100 分,考试时间 60 分钟;书写要工整、清楚、标点符号使用正确。 一、单选题,以下各题有多个选项,其中只有一个选项是正确的,请选择正确答案(本大题满分40分,每小题1分) 1. 某研究属于观察性研究抑或试验性研究是根据确定的。 A. 是否给予研究对象干预措施 B. 是否遵循随机化原则 C. 研究者的工作属性 D. 研究对象所提供的信息 E. 在现场工作,还是在实验室工作 2. 为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用( )。 A. 普通线图 B. 直方图 C. 复式直条图 D. 直条图 E. 半对数线图 3. 统计中所说的总体是指:( ) A. 根据地区划分的研究对象的全体。 B. 据研究目的确定的同质的研究对象的全体。 C. 根据时间划分的研究对象的全体。 D. 随意想象的研究对象的全体。 E. 根据人群划分的研究对象的全体。 4. 对两样本均数作t检验,n1=20,n2=20,其自由度等于:( ) A. 39 B. 40 C. 20 D. 19 E. 38 5. 标化后的总死亡率:( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 仅仅作为比较的基础,它反映了一种相对水平 D. 它反映了实际水平

E. 它不随标准选择的变化而变化 6. 计量资料编制频数表时,一般分组数目为:( ) A. 8~15组 B. 15~20组 C. 5~10组 D. 10~15组 E. 随便分几组 7. 均数与标准差适用于:( ) A. 偏态分布 B. 不对称分布 C. 正偏态分布 D. 负偏态分布 E. 正态分布的资料 8. 某地区抽样调查1000名成年人的血压值,此资料属于:( ) A. 有序分类资料 B. 离散型资料 C. 无序分类资料 D. 数值变量资料 E. 集中型资料 9. 120名10岁男孩身高资料是:( ) A. 定量不连续资料 B. 定性连续资料 C. 定性二分类资料 D. 定量连续性资料 10. 偏态分布资料宜用下面那一项描述其分布的集中趋势:( ) A. 标准差 B. 算术均数 C. 四分位数间距 D. 中位数 E. 方差 11. 两样本均数比较时,分别取以下检验水准,以所犯第二类错误最小:( ) A. α=0.02 B. α=0.01 C. α=0.05 D. α=0.15 E. α=0.10

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3个阶段。 生物学研究中,一般将样本容量n≥30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 样本标准差的计算公式s=。 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P(AB)=P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,μ确定曲线在x轴上的中心位置,σ确定曲线的展开程度。 等于σ/√n。 样本平均数的标准误 x t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。 统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计。 假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作μ-uασ?x_ μ+uασ?x 在频率的假设检验中,当np或nq<30时,需进行连续性矫正。 2 χ检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2 χ检验中,在自由度df=(1)时,需要进行连续性矫正,其矫正的2 χ=(p85)。 c 2 χ分布是连续型资料的分布,其取值区间为[0.+∞)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]。

本科《生物统计附实验设计》2793

本科《生物统计附试验设计》课程代码:02793 一,名词解释题 1.中位数:将资料所有观测值按从小到大的顺序排列,处于最中间的数. 2.I型错误:是拒绝H0时犯下的错误,其错误是把真实差异错叛为非真实差异. 3.总体:是由研究目的的确定的研究对象的个体总和. 4.参数:是指由总体计算的特征数. 5.相关分析:即两个以上的变量之间共同受到另外因素的影响. 6.回归分析:即一个变量的变化受到一个或几个变量的影响. 7.精确性:是重复观测值之间彼此接近的程度. 8.显著水平:是检验无效假设的水准.但另一方面它也是进行检验时犯错误概率大小. 9.随机单位组设计:它的原理与配对设计类似,抽每一头试验动物具有相等的机会,接受任一处理而不受人为影响. 10.统计量:由样本计算的特征数. 11.准确性:是观察值与真实值间的接近程度. 12.随机误差:是由试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的. 13.系统误差:是由于试验处理以外的其它条件明显不一致所产生的带有倾向性的偏差. 14.样本:是在总体中进行抽样,从中抽取的部分个体. 15.众数:资料中出现最多的观测值或次数最多的一组中值. 16.样本标准差:统计学中样本平方差S^2的平方根 17.试验处理:在一项试验中,同一条件下所做的试验称为一个处理.

18.几何平均数:几个观测值相乘之积开n次方所得的方根称为几何平均数. 19.顺序抽样法:是将有限总体内所有个体编号,然后按照一定顺序每隔一定的数目,均匀抽出一个个体,组成样本,对样本进行调查. 20.试验指标:用来平衡量试验效果的量. 21.随机抽样法:是将总体内所有的个体编号,然后采取抽签,拈阄或用随机数字表的方法将部分个体取出而做为样本进行调查. 22.小概率原理:小概率事件在一次试验中实际不可能发生的原理. 23.重复:在试验中,同一处理内设置的动物数量,称为重复. 24.局部控制:在试验设计时采用各种技术措施,控制和减少非试验因素对试验指标的影响. 25.算术平均数:资料中各观测值的总和除以观测个数所得的商. 26.变异系数:是标准差相对平均数的百分数,用CV表示. 27.II型错误:在接受H0时犯下的错误,其错误是把真实差异错判为非真实差异. 28.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平. 29.配对设计:是指将条件一致的两头动物酿成对子,然后采取随机的方法在同一对子内两头动物进行分配处理. 30.试验处理:指对受试对象给予的某种外部干预或措施,是试验中实施的因子水平的一个组合. 31.调和平均数:资料中各观测值倒数的算术平均数的倒数称调和平均数. 32.效应:是指因素对某试验指标所起的增进或减退的作用. 33.顺序抽样:它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构

生物统计学实验

渤海大学学生实验报告 课程名称:生物统计学实验任课教师:何余堂 实验室名称:计算机室房间号:理工Ⅱ--205 实验时间:2012-6-14 学院化学化工与食品安全学院专业食品质量与安 全 班级10-10 姓名宋帅婷学号10150142同组人其余19人 实验项目统计数据的整理及次数分布 表/图的制作 组 别第二组 实验成绩 一、实验目的 1、掌握Excel数据输入、输出与编辑方法; 2、掌握Excel用于描述性统计的基本菜单操作及命令; 3、掌握数据整理的基本方法; 4、熟练制作次数分布表/图。 二、实验原理 当观测值较多(n>30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。 连续性资料的整理,需要先确定全距、组数、组距、组中值及组限,然后将全部观测值计数归组。分组结束后,将资料中的每一观测值逐一归组,统计每组内所包含的观测值个数,制作次数分布表。利用Excel的数据统计工具可以辅助完成上述工作。 三、实验步骤 1、加载分析工具库 单击Excel程序“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。 2、练习 某地80例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 5.21

相关文档
最新文档