生物统计部分复习

合集下载

生物统计学复习要点

生物统计学复习要点

1、生物统计学主要包括试验设计和统计分析2、统计学的发展经历了3个阶段:古典记录统计学,近代描述统计学和现代推断统计学3、生物统计学是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。

4、英国统计学家R.A.Fisher于1923年发展了显著性检验及估计理论,提出来F分布和F 检验,创立了方差和方差分析,在从事农业试验及数据分析研究时,他提出了随机区组法、拉丁方法和正交试验的方法5、常用的统计学术语有:总体与样本,参数与统计数,变量与资料,因素与水平,处理与重复,效应与互作,准确性与精确性,误差与错误6、总体按所含个体的数目可分为有限总体和无限总体,n小于30的样本称为小样本,n大于等于30的为大样本7、参数也称参量,是对一个总体特征的度量。

统计数也称统计量,是由样本计算所得的数值。

8、准确性反映测定值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度9、生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征2)判断试验结果的可靠性3)提供由样本推断总体的方法4) 提供试验设计的一些重要原则10、试验资料具有集中性和离散性两种基本特征。

平均数是反映集中性的特征数,主要包括算术平均数,中位数,众数,几何平均数等;反映离散性的特征数是变异数,主要包括极差,方差,标准差和变异系数11、资料可分为数量性状资料和质量性状资料12、数量性状资料分为计数资料(非连续变量资料)和计量资料(连续变量资料)13、资料的来源(资料的搜集方法)一般有两个,调查和试验14、常用的抽样方法有随机抽样,顺序抽样,典型抽样15、随机抽样的方法:简单随机抽样,分层随机抽样,整体抽样,双重抽样16、计量资料的整理步骤:1,计算全距2.确定组数和组距(样本容量30--60,分组数为5--8)3,确定组限和组中值4,分组,编制次数分布表17、常用的统计图有条形图,饼图,直方图,多边形图,散点图(会辨认)18、算术平均数的算法:直接计算法,减去(或加上)常数法,加权平均法19、算术平均数的重要特性:1)样本中各观测值与其平均数之差称为离均差,其总和等于零2)样本中各观测值与其平均数之差平方的总和,较各观测值与任一数值(不包括平均数)之差的平方和最小,即离均差平方和为最小20、标准差的特性:1,标准差的大小受多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小2,计算标准差时,如将各观测值加上或减去一个常数a,其标准差不变,将各观测值乘以或除以一个常数a,则标准差扩大或缩小了a倍3,在正态分布情况下,一个样本变量的分布情况可作如下估计:在平均数两侧的1s范围内,观测值个数约为观测值总个数的68.26%,在平均数两侧的2s范围内,观测值个数约为观测值总个数的95。

生物统计学复习提纲

生物统计学复习提纲

复习提纲一、名词解释1、变异系数:变数的相对变异量,CV=S/y×1002、总体与样本:总体是指具有相同性质的个体组成的集团,样本是指从总体中抽出的一部分个体的集合。

3、统计假设测验:根据于某种实际需要,对未知的或不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的测验。

4、显著水平:用来测验假设的概率标准5%或1%等,称为显著水平,一般以α表示。

5、适合性测验:比较实验数据与理论假设是否符合的假设测验。

6、单因素试验:整个试验中只变更、比较一个试验因素的不同水平,其它作为试验条件的因素均严格控制一致的试验。

7、连续型数据与离散型数据:连续型数据是指称量、度量或测量方法得到的数据,离散型数据是指用计数方法获得的数据。

8、零假设与备择假设:零假设是指假设总体平均数μ等于某一指定值μ0,记为H0:μ=μ0或μ-μ0=0。

备择假设,和零假设相对立的一个假设,也称为对应假设。

记作H A:μ≠μ0。

9、第一类错误(α错误):如果H0是真实的,我们通过测验却否定了它,就犯了一个否定真实假设的错误,这叫第一类错误(α错误)。

10、第二类错误(β错误):如果H0是错误的,我们通过测验没有发现其不真实而接受了它,即犯了一个接受不真实的H0的错误,这叫第二类错误(β错误)。

11、回归分析:对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y 随X 的改变而改变的方程过程称为回归分析。

12、重复:在试验中同一处理设置的试验单位数。

13、样本容量:样本中包含的个体数,用n表示。

14、生物统计学:生物统计学是以概率理论为基础,研究生命科学中随机现象规律性的方法论科学。

15、有限总体:总体中包含的个体数目有限,这种总体称为有限总体。

16、处理与水平:处理是指试验过程中设置的所有试验因素的所有水平,是试验的具体条件或状态,水平是指每一个因素根据其质或量所分的等级或所处的状态。

生物统计学 复习资料

生物统计学 复习资料
按题意,此例应采用单侧检验。
A提出无效假设与备择假设
H0:= 246,HA:> 246
B计算t值
经计算得:=252,S=9.115
所以
= == 2.281
C查临界t值,作出统计推断
t=2.281 >单侧t0.05(11),P< 0.05,否定H0:=246,接受HA:>246,可以认为该批饲料维生素C含量符合规定要求。
P(-∞<t<-2.131)+(2.131<t<+∞)=0.05。
由附表4可知,当df一定时,概率P越大,临界t值越小;概率P越小,临界t值越大。当概率P一定时,随着df的增加,临界t值在减小,当df=∞时,临界t值与标准正态分布的临界u值相等。
第三章
1、用山楂加工果冻儿,传统工艺平均每100g山楂出果冻儿500g.现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻儿平均数为520g,标准差为S=12g,问新工艺与传统工艺之间有无显著差异?
在此例中,总体方差未知,而样本容量又不大,所以应该用t测验。其测验步骤如下:
A提出假设.H0:=0,即新工艺和传统工艺之间无显著差异;对HA:0,即新工艺和传统工艺之间存在显著差异.
B确定显著水平.
C检验计算
均数标准差:
统计量t值:
自由度:df=n-1=16-1=15(t0.01(df=15)=2.947)
【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异?
表5-3长白与蓝塘后备种猪背膘厚度

生物统计复习资料(精品)

生物统计复习资料(精品)

第一章 统计数据的搜集与整理1.1.3 抽样从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。

抽样方法有随机抽样、分类抽样等。

1.1.4 随机抽样要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。

1.1.5 放回式抽样和非放回式抽样放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。

非放回式抽样:从总体中抽出个体后,不再放回。

1.2.1 连续型数据和离散型数据连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。

对连续型数据进行分析的方法,通常称为变量的方法。

离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。

1.3 样本的几个特征数1.3.1 平均数:数据集中点的度量 1.3.2 标准差:数据的变异程度平均离差 样本方差 标准差1.3.3 偏斜度和峭度偏斜度:度量数据围绕众数呈不对称的程度。

用三阶中心矩m3 :nx x MD ∑-=||1)(22--=∑n x x s 1)(2--=∑n x x s nx x m ∑-=33)(m 3 =0 ,说明曲线对称于平均数,此时平均数等于中位数也等于众数。

m 3 >0,说明曲线向左偏斜,称左偏或正偏,此时众数小于中位数,而中位数小于平均数。

m 3<0,说明曲线向右偏斜面,称右编或负偏,此时平均数小于中位数,而中位数小于众数。

偏斜度 判断方法同m 3 峭度1.3.4 变异系数CV:用来表明样本标准差对平均数的变异幅度。

可以用来判断数据整齐程度,变异系数比较小的数据组比较整齐。

第二章 概率和概率分布2.1 概率的基本概念自然现象:确定性现象和非确定性现象(随机现象),统计学所研究的是非确定性现象. 2.1.1 概率的统计定义设k 次随机试验,成功事件A 出现l 次,则称l /k 是K 次随机试验中成功的频率。

《生物统计学》复习资料

《生物统计学》复习资料

《生物统计学》复习资料一、填空题1.变量之间的相关关系主要有两大类:(正相关)和(负相关)。

2.试验误差可以分为(随机误差)和(系统误差)两类。

3.样本标准差的计算公式( )。

解析:4.方差分析必须满足(正态性)、(方差齐性)和可加性3个基本假定。

5.在假设检验中,如果检验样本间差异是否极显著,则显著水平a取值为(0.05)。

6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(自变量),Y称为(因变量)。

二、单项选择题1.抽取样本的基本首要原则是(B)A、统一性原则B、随机性原则C、完全性原则D、重复性原则2.如果对各观测值加上一个常数a,其标准差(D)A、扩天√a倍B、扩大a倍C、扩大a²倍D、不变3.在一组数据中,其中一个数据9的离均差是3,那么该组数据的平均数是(B)A、12B、10C、6D、34.平均数是反映数据资料(B)0的代表值。

A、变异性B、集中性C、差异性D、独立性5.方差分析适合于(A)数据资料的均数假设检验。

A、两组以上B、两组C、一组D、任何6.在假设检验中,是以(A)为前提。

A、肯定假设B、备择假设C、无效假设D、有效假设7.统计学研究的事件属于(D)事件。

A、不可能事件B、必然事件C、小概率事件D、随机事件8.下列属于大样本的是(A)。

A、40B、25C、20D、109.在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是(B)A、18B、12C、10D、510.已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是(C)A、9、1和8B、1、8和9C、8、1和9D、9、8和1三、判断题(正确的打√,错误的打×。

)1.对于有限总体不必用统计推断方法。

(×)2. 资料的精确性高,其准确性也一定高。

(×)3. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。

生物统计考试复习

生物统计考试复习

一、名词解释1、总体:指客观存在的、在同一性质根底上结合起来的许多个别单位的整体,即研究对象的*项指标的取值的集合或全体。

2、统计量:统计量是统计理论中用来对数据进展分析、检验的变量。

3、独立事件:在概率论里,说两个事件是独立的,是指在一次实验中,一个事件的发生不会影响到另一个事件发生的概率。

4、小概率事件:我们把概率很接近于0〔即在大量重复试验中出现的频率非常低〕的事件称为小概率事件,一般将事件发生的概率在0.01以下或0.05以下的事件称为小概率事件。

5、假设检验:是数理统计学中根据一定假设条件由样本推断总体的一种方法,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差异造成。

6、样本:是观测或调查的一局部个体。

7、参数:描述总体特征的概括性数字度量,它是研究者想要了解的总体的*种特征值。

8、对立事件:其中必有一个发生的两个互斥事件叫做对立事件。

9、概率:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在*一数值p附近,则数值p称为事件A在该条件下发生的概率,记做P(A)=p。

这个定义成为概率的统计定义。

10、参数估计:根据从总体中抽取的随机样本,来估计总体分布中未知参数的过程。

二、填空1、相关系数的取值范围是〔[-1,1]〕的。

2、用来说明回归方程代表性大小的统计分析指标是〔估计标准误〕。

3、试验设计的三大根本原则是〔完全重复、随机化、区组化〕。

4、在其他条件不变的情况下,样本容量和抽样误差的关系是样本容量越大,抽样误差〔越小〕。

5、参数估计包括〔点〕估计和〔区间〕估计。

6、假设检验首先要对总体提出假设,一般应作两个假设,一个是〔检验假设〕,一个是〔备择假设〕。

7、统计上常用〔回归〕分析来研究呈因果关系的两个变量间的关系,用〔相关〕分析来研究呈平行关系的两个变量间的关系。

8、试验设计包括3个根本要素,即〔受试对象、处理因素、试验效应〕。

生物统计学复习资料

总体:根据研究目的而确定的、具有共同性质的个体所组成的集合,称为总体.变异系数:变异系数为该样本标准差对平均数的百分比标准误:平均数的标准差也称为标准误,它表示了平均数的抽样误差的大小。

参数:由总体的全部观察值算得的特征数,称为参数极差:极差又称全距,记为R,是资料中最大观察值与最小观察值的差数。

离均差:在一个样本中,观察值与该样本平均数的差称为离均差。

统计量:测定样本中的各个体所得的特征数称为统计量,是总体的相应参数的估计值。

算数平均数:一个数量资料中各个观察值的总和除以观察值个数所得的商,称为算术平均数。

几何平均数:一组观察值的连乘积再开这群数值的个数次方所得的值,称为几何平均数,记为G。

中位数:中数又称为中位数,即在同一性质资料内,将所有观察值按大小顺序排列,居中间位置的观察值称为中数,记作Md。

众数:在同一性质的资料中,如某一观察值出现的次数最多,即称该观察值为众数,记作M0抽样:从总体中获得样本的过程。

显著性水平:保证参数在该区间的概率以P =(1-a)表示,称为置信系数或置信度,a称为显著水准或显著水平。

零假设:假设总体平均数u等于某个给定值u0(u=u0),或u-u0=0,这样的假设称为的零假设H0。

离散型数据:指用计数方法得到的数据,其各个观察值必以整数表示。

连续性数据:指由称量、度量或测量等方法得到的数据。

各个观察值并不限于整数。

频率分布:把频率值按要求进行分组归类,则制成频率分布表频数分布:把观察值按数值大小进行分组归类,则制成频数分布表随机抽样:从总体中随机抽取的样本称为随机样本。

无限总体:根据研究目的而确定的、具有共同性质的个体所组成的集合,称为总体.相关系数:描述两个变量间直线趋势好坏程度的量,值越接近1,X、Y直线相关的程度就越真切回归系数:b是直线的斜率,即b是X每增加一个单位时,平均地将要增加(b>0)或减少(b<0)的单位数,样本:由总体的若干个体所组成的集合,称为样本样本标准差:是离均差平方和平均后的方根,用σ表示。

生物统计学复习资料

生物统计学复习资料一、名词解释准确性(accuracy):在试验中某一指标的观测值与真实值的接近程度,也称准确度。

(反映观测值偏离目标值的程度)精确性(precision):在相同试验条件下,对同一指标重复测量时所得观测值之间的接近程度,也称精确度。

(反映观测值之间的变异程度)准确性和精确性合称正确性。

随机误差(random error):由无法控制的偶然因素导致的误差。

(随机误差影响精确性,扩大样本容量或增加试验重复次数有助于减少但无法消除随机误差)系统误差(systematic error):由测量工具不精准、试验方法不完善、操作人员水平差异等因素导致的误差。

(既影响准确性又影响精确性,可消除)总体(population):研究对象的全体成员(有限总体、无限总体)个体(individual):构成总体的各个成员样本(sample):从总体中抽取的部分个体所组成的集合。

样本容量(sample size):样本包含的个体数量。

随机抽样(random sampling):采用随机方式从总体中获取样本的过程。

放回式抽样(sampling with replacement):从总体抽取一个个体,记录特征后放回总体,再抽取下一个个体。

非放回式抽样(sampling without replacement):从总体抽取一个个体,不放回总体就继续抽取下一个个体。

连续型数据(continuous data):与某种标准相比较获得的非整数数据。

(可以提高精确度,采用变量方法分析)离散型数据(discrete data):由记录不同类别个体数目而得到的整数数据。

(不能提高精确度,采用属性方法分析)极差(range,R):数据资料中最大值与最小值的差值。

组距(class interval, i):对频数资料分组时,每个组区间的高限和低限之差,即组区间极差。

样本特征数(sample characteristics):描述频率分布特征的数值总体特征数(population characteristics):描述概率分布特征的数值样本统计数(statistic):由样本数据计算而来的描述样本特征的数值。

生物统计学复习资料

1.生物统计学(Biostatistics):用统计学的原理和方法研究生命科学中的问题的学科。

2.Variable 变量、个体(individual)、样本含量(sample size),随机抽样(random sampling)、总体(population)、平均值(average value, mean)、算术平均数(arithmetic mean)、中位数(median)和众数(mode)。

平均数(mean)、标准差(Standard deviation, s or SD)、样本方差(sample variance),用符号s2表示。

概率(probability)、随机试验(random trial)3.定量变量(quantitative variable):亦称为数值变量,变量值是定量的,表现为数值大小,一般有度量衡单位。

e.g. 身高、体重。

4.定性变量(qualitative variable):亦称为分类变量,其变量值是定性的,表现某个体属于几种互不相容的类型中的一种。

e.g. 血型,豌豆花的颜色。

5.对随机变量的取值过程为测量。

取值所采用的标准为测量尺度。

6.样本(sample):从总体中随机抽取的若干个个体所构成的集合。

7.总体参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。

固定的常数8.样本统计量:样本的统计指标,如样本均数、标准差,采用英文字母分别记为。

参数附近波动的随机变量9.测量值=真实值+随机误差+非随机误差10.随机误差(随机抽样误差):由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的,不能消除的。

11.系统误差:受确定因素影响,大小变化有方向性。

某种程度上可以控制。

12.非系统误差(错误):研究者偶然失误而造成的误差。

13.统计工作的基本步骤:一、研究设计;二、搜集数据;三、整理数据;四、分析数据‘五、结果呈报与解释14.实验设计的三个基本原则1.随机化(randomization)2. 对照(control)3.重复(replication)15.搜集资料要遵循准确、完整、及时三个原则。

关于生物统计学复习题

生物统计学复习题一、名词解释交互作用:表示当两种或几种因素水平同时作用时的效果较单一水平因素作用的效果加强或者减弱的作用。

当因素间的互作效应为零时,称该因素间无交互作用,此时的因素是相互独立的因素。

回归系数:回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。

整群抽样:就是将总体划分为若干个小群体,再随机抽取部分小群体组成样本。

F检验:即统计假设的显著性检验,用于推断处理间的差异是否存在。

在计算F值时,以被检验因素的均方(即处理间均方S t2)作分子,以误差均方(即处理内均方S e2)作分母。

(没找到)无效假设:不管样本是否真的属于总体A,都首先假设是,即假定“X与μ间的差异源自误差,并非本质差异”,这就是无效假设,记H0。

相关变量:统计学把存在关联但并非确定的数量关系称为相关关系, 把存在相关关系的变量称为相关变量。

决定系数:是变量X引起Y变异的回归平方和占Y变异总平方和的比率,为相关系数r的平方。

取值范围:0~1。

独立变量:一个量改变不会引起除因变量以外的其他量的改变,则称这个量为独立变量。

相关系数:就是两变量离均差乘积和平均数的标准化值。

分层抽样:又叫分类抽样。

先按某种特征将总体分为若干个层次(strata),在每一层内随机抽取亚层,直到最后一层对观察单位随机抽样。

(比如资源调查中按片区→地区→局部区域等分成若干个地域层次。

)单位组:(相当于一个区组) 在盆栽和动物试验中,为随机分配到各个处理而挑选出来的尽可能一致的一组试验单位。

不同单位组可分别安排在有条件差异的场所。

随机样本:在抽样过程中, 通过一定的方法和条件控制, 尽可能确保总体中的每一个体都有同等的机会被抽到, 这样的抽样方法叫随机抽样(random sampling)。

通过随机抽样所得到的样本叫随机样本, 通常简称样本。

概率抽样:又叫随机抽样,就是调查研究对象的总体中每个部分都有被抽中的相同几率,是一种完全依照机会均等的原则进行的等概率抽样。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

两个样本平均数的假设检验(两个样本平均数假设检验的目的在于比较两个样本所属总体的平均数是否有显著差异。

)例4-4 已知优质早稻品种“佳辐占”小区产量的。

采用取样,A 法取15 B 法取9A 、B (1) 两尾u 检验 1.1 提出假设H 0:µ1=µ2, H A :µ1≠ µ2。

H 0:µ1- µ2 =0,H A :µ1 - µ2≠ 0。

1.2 α=0.05 或α=0.011.3 统计计算(在假设H 0成立的前提)1.4 统计推断拒绝H 0,接受HA 。

1.5 结论A 、B 两种取样法测得的小区平均产量不相同(差异显著 p<0.05)成对资料的t 检验——两法测定12份血铅含量的结果 ● 1. 提出假设● H 0: μd =0 H A : μd ≠0● 2.α=0.05,临界值t 0.05(11)=2.201● 否定域(-∞,-2.201), (2.201, +∞)● 3.统计计算 2.2045u ===-0.05/2 1.96u u >=0.05P <2 1.35σ= 1.34d =∑22.6314d =∑ 1.34/120.112d ==0.475d S ===● t 值落入接受区,故接受H 0,拒绝H A 。

● 两种方法的测量结果的差值为零,即两种方法没有显著差异。

成组资料的检验● 两总体方差已知——u 检验● 两总体方差未知,且为小样本——t 检验● 如方差相等——t 检验● 如方差不等——近似t 检验● 方差相等与否的检验——F 检验 ● 成组资料的检验= F 检验+t 检验样本方差的抽样分布● 单样本方差的抽样分布分布 ● 两样本方差的抽样分布F 分布两样本方差齐性检验——F 分布图●两尾检验由于F 分布左右不对称,F(α)与F(1-α)不是相反数,但是F 分布的理论指出F(α)与F(1-α)互为倒数即F(α)=1/ F(1-α)22S F S =大小12,0.05(5,8)df df F F α()=F≥1(一)方差齐性检验——F 检验1. 提出假设H 0: H A :2. α=0.05,临界值F 0.05(11,11)=2.82● 否定域(2.82, +∞),接受域[1,2.82]● 3. 统计计算● 在H 0成立的条件下,1.21 ∈ [1,2.82] 落入接受域4.统计推断接受H 0,拒绝H A 。

两样本所属总体的方差相等(二)t 检验——等方差● 1. 提出假设H 0: μ1=μ2 H A : μ1≠μ2● 2. α=0.05,临界值t 0.05(22)=2.074 df=df 1+df 2 ● 否定域(-∞, -2.074),(2.074, +∞) ● 3. 统计计算●t =0.095 ∈ [-2.074, 2.074] 落入接受域● 4.统计推断● 接受H 0,拒绝H A 。

● 两种方法没有显著差异。

(三)近似t 检验——方差不等自由度公式:● 成对资料将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,以这种设计方法获得的数据称为成对数据。

(两个样本的容量必然相等)● 成组资料2212σσ=2212σσ≠22S F S =大小221111()/(1)8.983s x x n =--=∑227.395s =2212228.9831.217.395s s F ss====大小1212x x t s --==t =1 3.799x =2 3.688x =1.168=== 3.799 3.6880.0951.168t -==● 方差不等,近似t 检验某种子公司声称其所销售种子的发芽率达到90%的标准,如未达到,可要求赔偿。

现有一农户从该公司购买了一批种子,取其中200粒,播种后有173粒发芽。

试从农户的播种试验结果判断这批种子是否达到标准, 可否要求赔偿?(一)二项总体的抽样分布1. 二项总体的分布参数 平均数: 方差 标准差:2. 二项总体的样本平均数的抽样分布从二项总体进行抽样得到样本,样本平均数抽样总体且有: 平均数: 方差:标准误:3. 二项分布的特点在n 较大,np 、nq 较接近时,二项分布接近于正态分布;当n →∞时,二项分布的极限分布是正态分布。

统计计算公式:(二)二项资料的百分数假设检验● 1、假设:H 0:p =0.90;H A :p ≠0.90。

2、显著水平α=0.05,作两尾测验u 0.05=1.96 3、计算:因为:│u │<u 0.05,所以p>0.05。

推断:接受H 0:p =0.90,即该试验中这批种子属于合格产品。

试验中的p =0.865与p =0.90的差别属于随机误差。

(三)单个样本百分数的假设测验● 功用:测试百分数所属总体百分数与某一理论值或期望值p 0的差异显著性。

● 样本百分数的标准误为:pq p p =-=)(12σp=μpq p p =-=)(1σ2ˆˆˆ~(,)p p p N μσˆp p μμ==22ˆppq σσ==ˆˆp p p u σ-=173ˆ0.865200p ==ˆ0.02p σ==ˆˆ0.8650.90 1.750.02p p p u σ--===-p ˆnp p )1(00ˆ-=ρσp p pu ˆ0ˆσ-=单个样本百分数假设测验时的连续矫正● 以上所分析的事例在性质上属于间断性变数,其分布是间断性的二项分布。

将其按照连续性的正态分布或t 分布,一般容易发生第一类错误。

补救的办法是假设测验时进行连续矫正。

这种矫正工作当np 和nq 大于5,但小于或等于30时,必须进行。

● 若符合下表的情况,可不作矫正,用u 测验处理。

●单个样本百分数连续校正的计算公式为:式中u c 为校正后的u 值。

● 例题:用基因纯合的糯玉米合非糯玉米杂交,预期F1植株上糯性花粉粒的p 0=0.5,现在一个视野中检测20粒花粉,得糯性花粉8粒,问此结果与理论百分数p 0=0.5是否相符?● 1. H 0:p =0.5,H A :p≠ 0.5 ● 2.α=0.05,作两尾测验。

● 3.计算:n=20, ●计算得|u c |<u 0.05,故P >0.05,推断:实得百分数0.4与理论值0.5没有显著差异。

0ˆ0.5ˆc p pp nu σ--=ˆp σ=105.020=⨯==nq np ˆ 2.24(四)两个样本百分数相比较的假设测验测验两个样本百分数和所属总体百分数p 1 和p 2 的差异显著性由于H 0假设:p 1=p 2=p ,q 1=q 2=q ,故:● 在两个总体百分数p1 和p2 未知时,在两个总体方差相等的前提下(),可用两样本百分数的加权平均值作为p 1和p 2的估计。

即:故有:即可对H 0:p 1=p 2作出假设测验。

● 例题:调查一低洼地,小麦378株,其中有锈病355株,病株率93.92%,一高地调查396株,有346株发病,病株率为87.37%。

问两块田发病情况有无差异? ● n 1=378,a 1=355,n 2=396,a 2=3461. 假设:H 0:p 1=p 2;H A :p 1 ≠ p 2;2. 显著水平α=0.05,作两尾测验u .05=1.96。

计算:因为:u 0.05=1.96,│u │>u 0.05,所以p<0.05。

推断:否定H 0:p 1=p 2,接受HA :p 1≠p 2,即该试验中两块麦田锈病的发生程度有显著差异。

两个样本百分数相比较假设测验的连续矫正● 服从二项分布的两个样本百分率的假设检验,当两样本的np 、nq 均大于5时,可1ˆp 2ˆp 12ˆˆp p S -=12ˆˆp p S -=2ˆ2ˆ21p p σσ=1212ˆˆˆˆp p p p u S --=1ˆ0.9392p =2ˆ0.8737p =12123553460.906378396a a p n n ++===++10.9060.094q =-=12ˆˆ0.021p p S -===● 例题:用新农药处理25头棉铃虫,死亡17头,存活8头;用乐果处理24头,死亡9头,存活15头。

问两种农药处理结果是否相同? ● 假设:H 0:p 1=p 2:H A :p 1 ≠ p 2。

α=0.05,作两尾测验。

● 计算:计算得|u c |=1.85 <u 0.05,故P > 0.05,推断:接受H 0,即两种农药处理结果没有显著差异。

若不进行连续校正,则何时使用参数估计当假设检验H 0被拒绝时,结论是处理有效应,但效应的大小是多少呢? 可以使用估计回答问题。

当已知存在效应并只是想找出效应大小时,使用估计;如某种药剂存在副作用当需要一些关于未知总体的基本信息时,如想根据一个样本信息了解相应总体的信息1-α是置信度,置信度也称为置信概率 α称为显著性水平2、正态总体平均数μ的置信区间标准正态总体(0,12)P{-u 0.05≤u≤u 0.05} = P{-1.96≤u≤1.96} = 95% 一般正态总体(μ, σ2)P{-u 0.05≤≤u 0.05} = 95%53.02425917=++=p 47.053.01=-=q 1250.5313.25n p =⨯=1250.4711.75n q =⨯=2240.5312.72n p =⨯=1240.4711.28n q =⨯=1ˆ17/250.68p ==2ˆ9/240.375p ==1426.025124147.053.021=⎪⎪⎭⎫ ⎝⎛+⨯=-p p S 121212ˆˆ0.50.5ˆˆC p p p p n n u S ----=0.680.3750.5/250.5/241.850.1426---==0.680.375 2.140.1426c u -==2、正态总体平均数μ的置信区间总体方差已知μ的95%置信区间为[] 总体方差未知,大样本μ的95%置信区间为[总体方差未知,小样本μ的95%置信区间为[,例题:棉花株行圃中,36个单行的皮棉平均产量 =4.1kg,已知σ=0.3kg ,求99%置信度下该株行圃单行皮棉产量μ的置信区间。

在置信度p =1-α=99%时,由附表2查得u 0.01=2.5758; 计算得故99%的置信区间为(4.1-2.58×0.05) ≤μ≤ (4.1+2.58×0.05), 即4.0 ≤μ≤ 4.2推断:估计单行皮棉产量在4.0~4.2之间,可靠度为99%。

例:自外地引入一新品种,在8个小区种植,得其千粒重为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问在95%概率保证下新引入品种的千粒重的范围?查附表4,df=7时t 0.05(7)=2.365,故:35.2-2.365×0.58 ≤μ ≤ 35.2+2.365×0.58 即:33.8 ≤μ ≤ 36.6,置信度为95%。

相关文档
最新文档