实验设计与数据处理:3回归分析

实验设计与数据处理:3回归分析
实验设计与数据处理:3回归分析

第3章回归分析

3.1 什么叫回归分析

一、问题的提出

回归分析是数理统计中的一种常用方法,是处理变量之间的相关关系的一种数学方法。通常将变量之间的关系分为以下两类:

1.确定性关系——函数关系

例如,在研究自由落体的运动规律中,我们知道物体下落的高度h与所需时间t之间,就有确定的关系h=0.5gt2 (0≤t<T)

又如正方形的面积S与边长a之间,当边长a确定时,面积S=a2,也就确定了,这类变量间关系的特点是,当自变量的值确定之后,因变量的值也随之确定,我们称变量间的这种关系为函数关系。

2.非确定性关系——相关关系

例如,人的身高与体重这两个变量间的关系,一般来说,身高者体也重,但是,体重却难以由身高确定。这说明这两个变量之间的不确定性。我们称变量间的这种关系为相关关系。

相关关系虽然不能用精确的函数关系表达,但通过对大量观测数据的分析,可以发现它们之间存在着一定的统计规律。

二、回归分析的内容——研究相关关系

回归分析是研究变量间相关关系的一种数理统计方法,它主要解决以下几个问题:

(1)从一组数据出发,确定相互间是否存在相互关系,如果存在,那么就确定他们之间的数学表达式——经验公式,并对所建立公式的可信程度作统计

检验;

(2)从许多变量中找出主要变量,判断哪些变量的影响是显著的,哪些变量的影响是不显著的。

(3)利用所找到的数学表达式(即经验公式)对变量进行预测或控制

3.2 一元线性回归分析

一、一元线性回归分析的数学模型

研究两个变量之间的相关关系的回归分析,称为一元回归。若其相关关系的统计规律性呈线性关系,则称为一元线性回归分析。

在一元线性回归中,我们要考察随机变量y与普通变量x之间的相互关系,称y为因变量,x为自变量。

例3-1 用银盐法测定食品中的砷时,吸光度y 与砷含量x 之间有一定的相关关系,了解其相关关系的步骤如下:

1.通过试验收集n组y与对应的x值,如表3-1所示。

表3-1 银盐法测定食品中砷的试验数据

2. 画散点图。这是表示两个变量间相关关系的一种直观办法。以x 为横坐标,以y 为纵坐标,每一对数据(x k ,y k )作为一个点在坐标纸上以“⊙”表示出来,k=1,2,……,n 。

3. 观察散点图。从图中可以看出,6个点分布在一条直线附件。因此可认为y ~x 基本上服从线性关系,而这些点与直线的偏离是由于其它随机因素造成的。

因此,可以假定表3-1中的数据有如下关系:

εββ++=x y 0 (3-1)

ε~N(0,σ2)

其中(β0+βx )表示y 随x 的变化而线性变化的部分。ε是一切随机因素影响的总和,有时也成为随机误差。它是不可观测其值的随机变量,并假定ε服从正态分布N (0,σ2)。x 是一般变量,即它是可以精确测量或严格控制的,y 是随机变量,但其值是可以观测的,其数学期望是x 的线性函数:

x y E ββ+=0)( (3-2)

这就是y 与x 相关关系的形式。y ~N(β0+βx, σ2) 对表3-1中的几组观测值,由式(3-1)可得:

k k k x y εββ++=0 (3-3)

各εi 相互独立。

E(εk )=0,D(εk )=σ2,k=1,2,3,·····,n. 式(3-3)称为一元线性回归的数学模型。

一元线性回归的首要任务,就是要根据表3-1去求式(3-2)中未知参数

β0和β的估计值b 0和b ,由此可得E(y)的估计值为

bx b y

+=0? (3-4) 式(3-4)称为y 关于x 的一元线性回归方程.其图像如图3-1中的直线所示,该直线称为回归直线,b 0和b 称为回归系数,b 是回归直线的斜率,b 0是截距。

二、参数β0 和β的最小二乘估计

求回归方程(3-4),就是求β0 和β的估计b 0和b ,使得对一切x k ,观测

值y k 与回归值k bx b y +=0?的偏离达到最小。为此,我们用最小二乘法来求β0 和

β的估计。令

Q(β0,β)=∑=+-n

k k k bx b y 10)]([2 (3-5)

所谓β0和β的最小二乘估计,是指使下式成立的b 0和b : Q(b 0,b)=β

β,0min Q(β0,β)

的函数。和是为已知,和ββ0∴Q y x k k 下面,求使Q(β0 ,β)取得极小值时的

b 0和b

()()???

??

??

=---=??=---=??∑∑======02021

0,10,0

0000k n

k k k b b n

k k k b

b x bx b y Q

bx b y Q ββββββ (3-6)

整理后,得

??

?

?

?

??=??? ??+??? ??=???

??+∑∑∑∑∑k k k k k k k k k k k y x b x b x y b x nb 200 (3-7)

式(3-7)称为正规方程组,其中∑k

表示∑=n

k 1

正规方程组(3-7)可化为另一种形式:

b 0 + b -

x = -

y (3-7a)

∑∑=+-

k

k k

k k y x x b b x n 2

(3-7b)

其中-

-

y x 和分别是样本均值。由式(3-7a )解得: x b y b -=0 代入(3-7b )式,得

∑∑--

---=

k

k

k k k

x

n x

y

x n y x

b 2

2 (3-8)

令 =∑--=可证明

))((k

k x xy y y x x l ∑-k

k k y x n y x

∑∑=--=k

k

k

k xx x n x

x x l 2

2

2)

(可证明

其中 ∑=

k k x n x 1 ∑=k

k y n y 1

故最小二乘估计为

???

????

=

-=xx

xy l l b x

b y b 0 (3-9)

于是,所求的回归直线方程为:

bx b y +=∧

显然,),0(0b 和),(y x 都是在回归直线上。

下面,我们来求例3-1的回归直线方程。计算过程通常用表格形式给出,如表3-2和表3-3所示。

表3-2 回归方程计算表(I )

表3-3 回归方程计算表(II )

在散点图3-1中,通过),0(0b 和),(y x 两点,即(0,0.001)和(4.167,0.184)两点引一条直线,即为所求的回归直线,其回归方程为

x y 044.0001.0+=∧

在表3-3中 ∑∑-=-=k

k

k k yy y n y y y l 2

2

2)(

附件 -- 标准曲线x b y

s =?的回归分析 因标准曲线受必须过坐标原点(0,0)的约束条件限制,故回归方程的形式简化为

x b y

s =? 用最小二乘法求β的估计,令

Q(β)=∑=-n

k k s k x b y 1][2

所谓β的最小二乘估计,是指使下式成立的s b : Q(s b )=β

min Q(β)

的函数。是为已知,和βQ y x k k ∴ 下面,求使Q(β)取得极小值时的s b

()021

=--=??∑==k n k k s k b x x b y Q

ββ

整理后,得

∑∑=

k

k k

k

k s

x

y x b 2

求出回归方程后,还必须对回归方程进行显著性检验。检验不显著的回归方程无意义。回归方程的显著性检验方法,通常有方差分析和相关系数分析两种。

三、回归方程的显著性检查(F 检验, 即回归方程的方差分析)

由前面的讨论可知,对任意两个相关变量,即使他们不存在线性关系,也可以通过他们的一组观测值),,3,2,1)(,(n i y x i i =用最小二乘法求得y 对x 的回归直线方程。实际上如果y 与x 没有线性相关关系,那么所求出的线性相关方程是毫无实际意义的。

因此,建立了回归直线方程之后,还需要判断y 与x 之间是否真有线性相关关系,这就是回归效果的检验问题,称为回归方程的显著性检验。只有当“n 个点落在一条直线附近”时,才能认为y 与x 之间可配一元线性回归方程。从统计学观点来看“n 个点落在一条直线附近”就是要求E(y )是x 的线性函数{E(y )=β0+βx },即在式(3-2)中β≠0,所以问题就转化为检验

H 0:β=0

是否为真。若否定H 0则认为所建立的回归方程式(3-4)有实际意义;若接受H 0,则所建立的回归方程毫无意义。

1、 总的偏差平方和总S 的分解

(

)

2

∑-==k

yy y

y k l S 总

=()()[]2

??∑

-+-k

y y y

y k

k

k

=()()()

()∑

-∑

-+--+k

k

k

k

k

k

y y

y y

y k

y y y k k 2

2

???

?2

由式(3-6)可知

()()

(

)

0??00=???

? ?

?

-

+--=--∑∑-

k

k k k k

k k k y bx b bx b y y y y

y 令

()

()∑

-∑

-==k

k

k k k

y

y s

y

y

s

??2

2

s s s

剩回总

+= (3-10)

可以证明∑=k

k y n y ?1

,因此()∑-=k

y y

S k

?2

回反映回归值n

y y y ?,,?,?21 的离散程度,故称为S 回回归平方和。而且n y y y

?,,?,?21 的离散程度又是来源于x 1,x 2,···x n 的离散性,实际上

S 回=2

002)]()[()?(∑∑+-+=-k

k

k x b b bx b y y

=()()

xx

xy

xy xx k

k

l l bl l b k

k

x x b x x b

222

2

2

2

=

===

∑-∑- (3-11) 这里()∑-=

k

xx x x k

l 2

反映了x 1、x 2、……..x n

离散的程度,从而可知,S 回

际上反映了由x 变化所引起y 的波动大小。这是通过x 对y 的线性相关性而引起的。

S 剩=∑-k

k k y y )?(2 反映了观测值与回归值之间的偏离,且等于Q (β0,

β)的最小值()∑

--k

k k bx b y 02

。反映除了x 对y 的线性影响之外的剩余因

素对y 所引起的波动大小。故

S

剩为剩余平方和(或残差平方和)

。 若回归方程有意义,即引起y 波动主要是由于x 变化而引起的,其他一切因素是次要的。即要求S 回尽可能大,而

S

剩则尽可能小。

2. 回归方程的显著性检验(即回归方程的方差分析)

为了检验H 0,很自然想到用S 回(线性影响)与S

剩(其他影响)进行比

较。在数理统计学中,用统计量F ()

2S -=

n F S

剩回

来体现x 对y 的影响的相对程度。可以证明,在假设H 0:β=0成立的条件下,统计量F 服从第一自由度为1,第二自由度为(n-2)的F 分布 即

()

)

2,

1(2S --=

n F n F S

~剩

(3-12)

显然,F 值越大(即S 回相对S 剩越大),y 与x 的线性相关关系越密切。对给定的显著性水平α,若F>F α(1,n-2)则拒绝接受H 0,我们称回归方程是显著的;若F ≤F α(1,n-2),则接受H 0,回归方程不显著。

回归方程的显著性检验过程,可由一张“方程分析表”来进行,如表3-7所示。

表3-7 方差分析表

例3-1的方差分析表见表3-8。

表3-8 例3-1的方差分析表

注意:本题的S 剩=0.001太小了,从而导致S 剩微小误差就会引起F 值的很

大波动(因为V 剩很小),因此解的稳定性很差。所以,书上这一题例题出的不好!

四、一元线性回归的相关系数及其显著性检验 1、相关系数

前面所讨论的用F 检验法,对回归方程进行显著性检验的方法称为方差分析,或者称为回归方程的方差分析。

文献中在讨论一元线性回归时,常应用相关系数这一重要指标来衡量两个变量(x,y)之间的线性关系的密切程度。相关系数(r )定义为:

∑∑??

? ??-??? ??-∑--???

?

??-??? ?

?-=

=

-

-k

k

k k k yy

xx

xy y y x x y y x x l

l l

k k r 2

2

上式中r 的符号与l xy 有关,而且与回归系数b 符号一致。(b=l xy /l xx ) r 的绝对值总小于1,即 0≤|r|≤1

当相关系数r 的值不同时,可以说明不同的情况:

(1)r=0, 此时l xy =0,∴b=0,说明x 与y 无线性关系。即此时y=b 0+bx=b 0,是平行于x 轴的一条直线,说明y 的变化与x 无关。

(2)0<|r|<1,这是绝大多数情况,说明x 与y 之间存在着一定的线性关系。 当r >0时,b >0,此时称为正相关,y 随x 单调上升; 当r <0时,b <0,称为负相关,y 随x 增加单调下降。 |r|越小,说明数据点越分散;|r|越大,说明数据点越靠近回归线。

(3) |r|=1,说明所有的数据点均落在直线上,此时x 与y 完全线性相关。

实际上,此时x 与y 间存在着确定的线性函数关系(不只是相关关系)。 (板书相关系数与两个变量间的关系)

需要说明的是,当r 很小甚至等于0点,只表示数据点不是线性关系,并不表示x 与y 不成其他关系,如图E 所示。 对于例3-1,l

l l

yy

xx

xy r =

=0.994;对于例3-2,l

l l yy

xx

xy r =

=

4

.241994.67?=0.967。

显然,两个例子的相关系数r 均比较大,说明两个变量间的线性相关程度是很显著的。

那么,如果0<|r|<1,究竟|r|与1接近到什么程度才能说明x 与y 间存在线性相关关系呢?这就要对相关系数进行显著性检验。

2、相关系数的显著性检验

由概率论与数理统计知道,由于抽样误差的影响,一般来讲,使相关系数γ达到显著的值与抽样个数n 有关。许多书上都给出了“相关系数表”,供相关系数的显著性检验使用,相关系数表与抽样个数(n )或自由度(f=n-2)有关,通常列出在两种信度α(0.05及0.01)下相关关系达到显著的最小值,超过此值时,就说x 与y 的相关关系在1-α水平上显著,α愈小,显著程度愈高。

由相关系数表查得,对于3-1(n=6),在α=0.05下相关系数达到显著的最小值0.811,而在α=0.01下达到显著的最小值为0.917;对于例3-2(n=10),在α=0.05下查得0.632,在α=0.01时查得0.765。因为两个例子的r 分别为0.994和0.967,所以它们均在α=0.01下达到显著,或者说两个相关系数均在0.99水平上高度显著,因而在x 、y 之间配回归直线是合理的。

注意:相关系数检验法与F 检验法,只是形式上的不同,实质上是一回事。 因为

xy bl S =回

)1()1(222

r l l l l l l l l bl l S S S yy yy

xx xy

yy xx

xy

yy xy yy -=-

=-

=-=-=回总剩

所以

()2

2

2

2

21)2()1()2()1()2(2S

r r n r l l l n r l bl n n F yy xx xy

yy xy

S --=--=--=-=

2

2-+=n F F

r

关于r 的临界值表,可以利用上式根据F 的临界值反算出来。

因为对F 分布的临界值)2,1(-n F α,有

αα=->--=))2,1(1)2((2

2

n F r

r n F P 则容易得到 αα=->))2((n r r

P

其中,相关系数临界值与F 分布临界值的关系如下:

2

)2,1()

2,1()2(-+--=

-n n F n F n r ααα

如n =24和α=0.05时,

查相关系数临界值表得

0.3809<r α(n -2)=r 0.05(22)<0.4227. 查F 分布临界值表得:

F α(1,n -2)=F 0.05(1,22)=4.3. ∴ 由

2

)2,1()

2,1()2(-+--=

-n n F n F n r ααα

计算得: 404.0163.02

243.43

.4)22(05.0==-+=r .

五、可化为一元线性回归的问题

线性回归虽然很简单,但它有很广泛的应用。即使是非线性回归问题,只要范围适当地小,也可以用线性回归解决,因为一条曲线在小范围内是可用直线段来代替的。另外,一些非线性回归问题,可用适当的变量代换化成线性回归问题。

求y 对x 的回归方程,一般是先根据样本值作出散点图,然后看散点图的变化趋势;如果是线性的,我们就先用线性回归;如果不是线性趋势的,我们就选用适当的曲线拟和,即将散点图与各种函数曲线进行比较。根据最相适的曲线性状,选择一函数,然后,通过变量代换将非线性回归问题化成线性回归问题,我们就可按线性回归办法解决。

例3-3(see p74~76)

六、利用一元线性回归进行预测与控制(略,见葛炎等人的专著) 1. 点预测

给定x 。,由bx b y 000+=∧

求得 y 的一个点预测值y 0∧

。剩余标准差S=()2n S -剩

,S 愈小,预测精度越高。

2. 区间预测

对给定的x 。,在一定的置信度1-α下,寻找一个正数δ,使得实际观测

值y 。以1-α的概率落在区间???

? ??+-∧

∧δδy y 0,0内,这个区间即称为y 。的置信度为1-α的预测区间。δ用t 分布确定。(具体方法略)

3. 控制

控制是预测的反问题。即如果要求观测值在一定范围y 1

我们只讨论当n 很大的情况,y 的1-α预测区间近似为

()S bx b S bx b S S y y λλλλ++-+=???

?

??+-∧

∧000,, 由 ???

??++=-+=S S

bx b y bx b y λλ2

02101

分别解出x 1和x 2,即得x 的控制范围 当b>0时,控制区间为(x 1,x 2); 当b<0时,控制区间为(x 2,x 1)。

其中的λ为自由度为(n-2)的t 分布表的分位数。(S=

()2n S -剩

;λ

为查t 分布表所得到的分位数,即P{|t|<λ}=1-α,f=n-2.)又∵n 很大时,t (n-2)分布接近N (0,1),∴λ可用在N (0,1)表中查α/2得到的λ0代替。

实验设计与数据处理心得

实验设计与数据处理心得体会 刚开始选这门课的时候,我觉得这门课应该就是很难懂的课程,首先我们做过不少的实验了,当然任何自然科学都离不开实验,大多数学科(化工、化学、轻工、材料、环境、医药等)中的概念、原理与规律大多由实验推导与论证的,但我觉得每次到处理数据的时候都很困难,所以我觉得这就是门难懂的课程,却也就是很有必要去学的一门课程,它对于我们工科生来说也就是很有用途的,在以后我们实验的数据处理上有很重要的意义。 如何科学的设计实验,对实验所观测的数据进行分析与处理,获得研究观测对象的变化规律,就是每个需要进行实验的人员需要解决的问题。“实验设计与数据处理”课程就就是就是以概率论数理统计、专业技术知识与实践经验为基础,经济、科学地安排试验,并对试验数据进行计算分析,最终达到减少试验次数、缩短试验周期、迅速找到优化方案的一种科学计算方法。它主要应用于工农业生产与科学研究过程中的科学试验,就是产品设计、质量管理与科学研究的重要工具与方法,也就是一门关于科学实验中实验前的实验设计的理论、知识、方法、技能,以及实验后获得了实验结果,对实验数据进行科学处理的理论、知识、方法与技能的课程。 通过本课程的学习,我掌握了试验数据统计分析的基本原理,并能针对实际问题正确地运用,为将来从事专业科学的研究打下基础。这门课的安排很合理,由简单到复杂、由浅入深的思维发展规律,先讲单因素试验、双因素试验、正交试验、均匀试验设计等常用试验设计

方法及其常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识,最后将得出的方差分析、回归分析等结论与处理方法直接应用到试验设计方法。 比如我对误差理论与误差分析的学习:在实验中,每次针对实验数据总会有误差分析,误差就是进行实验设计与数据评价最关键的一个概念,就是测量结果与真值的接近程度。任何物理量不可能测量的绝对准确,必然存在着测定误差。通过学习,我知道误差分为过失误差,系统误差与随机误差,并理解了她们的定义。另外还有对准确度与精密度的学习,了解了她们之间的关系以及提高准确度的方法等。对误差的学习更有意义的应该就是如何消除误差,首先消除系统误差,可以通过对照试验,空白试验,校准仪器以及对分析结果的校正等方法来消除;其次要减小随机误差,就就是要在消除系统误差的前提下,增加平行测定次数,可以提高平均值的精密度。 比如我对方差分析的理解:方差分析就是实验设计中的重要分析方法,应用非常广泛,它就是将不同因素、不同水平组合下试验数据作为不同总体的样本数据,进行统计分析,找出对实验指标影响大的因素及其影响程度。对于单因素实验的方差分析,主要步骤如下:建立线性统计模型,提出需要检验的假设;总离差平方与的分析与计算;统计分析,列出方差分析表。对于双因素实验的方差分析,分为两种,一种就是无交互作用的方差分析,另一种就是有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但就是总体步骤都与单因素实验的方差分析一样。

实验设计与数据处理

《实验设计与数据处理》大作业 班级:环境17研 姓名: 学号: 1、 用Excel (或Origin )做出下表数据带数据点的折线散点图 余浊(N T U ) 加量药(mL) 总氮T N (m g /L ) 加量药(mL ) 图1 加药量与剩余浊度变化关系图 图2 加药量与总氮TN 变化关系图 总磷T P (m g /L ) 加量药(mL) C O D C r (m g /L ) 加量药(mL) 图3 加药量与总磷TN 变化关系图 图4 加药量与COD Cr 变化关系图 去除率(%) 加药量(mL)

图5 加药量与各指标去除率变化关系图

2、对离心泵性能进行测试的实验中,得到流量Q v 、压头H 和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式(要求作双Y 轴图)。 η H (m ) Q v (m 3 /h) 图6 离心泵特性曲线 扬程曲线方程为:H=效率曲线方程为:η=+、列出一元线性回归方程,求出相关系数,并绘制出工作曲线图。 (1) 表1 相关系数的计算 Y 吸光度(A ) X X-3B 浓度(mg/L ) i x x - i y y - l xy l xx l yy R 10 -30 2800 20 -20 30 -10 40 ()() i i x x y y l R --= = ∑

50 10 60 20 70 30 平均值 40 吸光度 X-3B浓度(mg/L) 图7 水中染料活性艳红(X-3B )工作曲线 一元线性回归方程为:y=+ 相关系数为:R 2= (2) 代入数据可知: 样品一:x=样品二:x=、试找出某伴生金属c 与含量距离x 之间的关系(要求有分析过程、计算表格以及回归图形)。 表2 某伴生金属c 与含量距离x 之间的关系分析计算表 序号 x c lgx 1/x 1/c 1 2 2 3 3 4 4 5 5 7 6 8 7 10 1

实验设计与数据处理试题库

一、名词解释:(20分) 1. 准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2. 重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部 就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4?总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5. 试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1. 资料常见的特征数有:(3空)算术平均数方差变异系数 2. 划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3. 方差分析的三个基本假定是(3空)可加性正态性同质性 4. 要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5. 减小难控误差的原则是(3空)设置重复随机排列局部控制 6. 在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式 阶梯式 7. 正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8. 在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2. 统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3. 变异系数的计算方法是(B) 4. 样本平均数分布的的方差分布等于(A) 5. t检验法最多可检验(C)个平均数间的差异显著性。 6. 对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7. 进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8. 进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9. 进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10. 自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1. 回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次 效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2. 一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3. 田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争 差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1. 研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy =60, l yy=300,r=0.6。根

试验设计与数据处理

试验设计与数据处理方法总述及总结 王亚丽 (数学与信息科学学院 08统计1班 081120132) 摘要:实验设计与数据处理是一门非常有用的学科,是研究如何经济合理安排 试验可以解决社会中存在的生产问题等,对现实生产有很重要的指导意义。因此本文根据试验设计与数据处理进行了总述与总结,以期达到学习、理解、掌握的以及灵活运用的目的。 1 试验设计与数据处理基本知识总述 1.1试验设计与数据处理的基本思想 试验设计与数据处理是数理统计学中的一个重要分支。它是以概率论、数理统计及线性代数为理论基础,结合一定的专业知识和实践经验,研究如何经济、合理地安排实验方案以及系统、科学地分析处理试验结果的一项科学技术,从而解决了长期以来在试验领域中,传统的试验方法对于多因素试验往往只能被动地处理试验数据,而对试验方案的设计及试验过程的控制显得无能为力这一问题。 1.2试验设计与数据处理的作用 (1)有助于研究者掌握试验因素对试验考察指标影响的规律性,即各因素的水平改变时指标的变化情况。 (2)有助于分清试验因素对试验考察指标影响的大小顺序,找出主要因素。(3)有助于反映试验因素之间的相互影响情况,即因素间是否存在交互作用。(4)能正确估计和有效控制试验误差,提高试验的精度。 (5)能较为迅速地优选出最佳工艺条件(或称最优方案),并能预估或控制一定条件下的试验指标值及其波动范围。 (6)根据试验因素对试验考察指标影响规律的分析,可以深入揭示事物内在规律,明确进一步试验研究的方向。

1.3试验设计与数据处理应遵循的原则 (1)重复原则:重可复试验是减少和估计随机误差的的基本手段。 (2)随机化原则:随机化原则可有效排除非试验因素的干扰,从而可正确、无偏地估计试验误差,并可保证试验数据的独立性和随机性。 (3)局部控制原则:局部控制是指在试验时采取一定的技术措施方法减少非试验因素对试验结果的影响。用图形表示如下: 2试验设计与数据处理方法总述和总结 2.1方差分析 (1)概念:方差分析是用来检验两个或两个以上样本的平均值差异的显著程度。并由此判断样本究竟是否抽自具有同一均值的总体。 (2)优点:方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。 (3)缺点:对所检验的假设会发生错判的情况,比如第一类错误或第二类错误的发生。 (4)基本原理:方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的第一个估计值;另一方面再考虑在同一水平下不同试验数据对于这一水平的均值的方差,由此计算出对由所有试验数据所组成的全部数据的总体方差的第 二个估计值。比较上述两个估计值,如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设;否则,说明因素的不同水平下的均值间的差异比较大。

实验设计与数据处理试题库

一、名词解释:(20分) 1.准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2.重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4.总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5.试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1.资料常见的特征数有:(3空)算术平均数方差变异系数 2.划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3.方差分析的三个基本假定是(3空)可加性正态性同质性 4.要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5.减小难控误差的原则是(3空)设置重复随机排列局部控制 6.在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式阶梯式 7.正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8.在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2.统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3.变异系数的计算方法是(B) 4.样本平均数分布的的方差分布等于(A) 5.t检验法最多可检验(C)个平均数间的差异显著性。 6.对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7.进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8.进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9.进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10.自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1.回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2.一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3.田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1.研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy=60, l yy=300,r=0.6。根据所得数据建立直线回归方程。(5分)a=2 b=1.8 y=2+1.8 x 2.完成下列方差分析表,计算出用LSR法进行多重比较时各类数据填下表:

数据处理与实验设计小论文

上海大学2014~2015学年秋季学期研究生课程考试课程名称:数据处理与实验设计课程编号:11S009003论文题目:正交实验在锂离子电极材料制备中的应用 研究生姓名:李艳峰学号:14722191 论文评语: 成绩:任课教师: 评阅日期:

正交实验在锂离子电极材料制备中的应用 李艳峰 (上海大学环境与化学工程学院,上海200444) 摘要:锂源、反应温度、反应时间和锂钛摩尔比是影响锂离子电极负极材料Li4Ti5O12制备的重要因素,本文利用正交实验L9 (34)的方法对液相法制备Li4Ti5O12的各种影响因素进行进一步优化,从而得到最优水平组合,并对各种影响因素进行权重分析。最后,利用正交实验确定了液相法制备Li4Ti5O12的最佳工艺:烧结温度为750℃,烧结时间为8h,LiOH·H2O 为锂源,原料中锂钛摩尔比为0.85。 关键词:正交实验设计;液相法;影响因素; 中图分类号:O242.1文献标识码:A The application of orthogonal experimental design on liquid method in the production of Lithium-ion electrode materials Yanfeng Li (School of Environmental and Chemical Engineering, Shanghai University, Shanghai 200444, China) Abstract:lithium source, reaction temperature, reaction time and lithium titanium molar ratio are important factors for the preparation of Li4Ti5O12 conditions of liquid method. Based on the single factor experiment, this study use L9 (34) orthogonal experiments to optimized the removal of the preparation of Li4Ti5O12 of liquid method. The optimal technological parameters of solution method determined by the orthogonal experiment were as follows: sintering temperature was 750℃, sintering time was 8 h, the lithium resource was LiOH·H2O and the mole ration of Li to Ti was 0.85. Key words: Orthogonal experimental design;Liquid method; Factors;

试验设计与数据处理课程论文

课 程 论 文 课程名称试验设计与数据处理 专业2012级网络工程 学生姓名孙贵凡 学号201210420136 指导教师潘声旺职称副教授

成绩 科学研究与数据处理 学院信息科学与技术学院专业网络工程姓名孙贵凡学号:201210420136 摘要:《实验设计与数据处理》这门课程列举典型实例介绍了一些常用的实验设计及实验数据处理方法在科学研究和工业生产中的实际应用,重点介绍了多因素优化实验设计——正交设计、回归分析方法以对目标函数进行模型化处理。其适于工艺、工程类本科生使用,尤其适用于化学化工、矿物加工、医学和环境学等学科的本科生使用。其对行实验设计可提供很大的帮助,也可供广大分析化学工作者应用。关键字:优化实验设计; 标函数进行模型化处理; 正交设计; 回归分析方法 1 引言 实验是一切自然科学的基础,科学界中大多数公式定理是由试验反复验证而推导出来的。只有经得起试验验证的定理规律才具有普遍实用性。而科学的试验设计是利用自己已有的专业学科知识,以大量的实践经验为基础而得出的既能减少试验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法,就必然涉及到数据处理,也只有对试验得出的数据做出科学合理的选择,才能使实验结果更具说服力。实验设计与数据处理在水处理中发挥着不可估量的作用,通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使水处理原理,内在规律性被很好的发现,从而更好的应用于生产实践。 2 材料与方法 2.1 供试材料 1. 论文所围绕的目标和假设 研究的目标就是实验的目的,我们设计了这个实验是想来做什么以及想得到什么样的结论。要正确的识别问题和陈述问题,这些需要专业知识和大量的阅读文献综述等方法来获得我们所要提出的问题。需要对某一个具体的问题,并且对这个具体的问题提出假设。如水处理中混凝剂的最佳投加量,混凝剂的最佳投加量有一个适宜的PH值范围。

实验设计与数据处理论文2

医学中的实验设计与数据处理 摘要:实验是一切自然学科的基础。实验设计与数据处理在医学中更是发挥着不可估量的作用。正交实验设计中,对实验进行改进,采用极差分析和方差分析法,研究不同改性条件对大豆蛋白乳化性的影响,并找出主要影响因素。通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使医学中更多的生理机制被探索发现,使更多的药物疗法被发明应用,从而更好地拯救患者,造福人类。 关键词:医学实验,实验设计,数据处理 一,引言 实验是自然学科的基础,任何自然科学都离不开实验。科学界中大多数的公式定理都是由实验反复验证而推导出来的,只有经得起实验验证的定理定律才具有普遍实用性。而科学的实验设计是利用已有的专业学科知识,以大量的实践经验为基础而得出的既能减少实验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法。这就必然涉及到实验的数据处理,也只有对实验得出的数据作出科学合理的处理,才能使实验结果更具说服力。实验设计方法最早应用于农业、生物学、遗传学方面。早在20世纪中期,就有一些欧美国家将实验设计应用于工业生产,以达到减少成本而获取最大利益的目的。随着时间的推移,实验设计越来越受到人们的重视,也开始在各个领域开始广泛的应用。 医学是一门将科学和生活紧密结合的学科,因此医学中的实验设计显得尤为的重要。科学的实验设计不仅能起到节约时间,节约成本的作用,还能使分析更具普遍适用性,或减少药物风险,或增强药物疗效,更加福泽患者。 二,. 试验设计与数据分析 (一)完全随机试验设计与单因素方差分析 完全随机试验设计比较简单,处理数与重复数都不受限制,适用于试验条件,、环境、试验动物差异较小的试验【1】,完全随机试验设计只设置1个试验因素,可采取单因素方差分析,如果有协变量影响,则考虑单因素协方差分析。 方差分析的前提条件是样本独立性、正态性和方差齐性【2-3】,若不满足这 3个条件,则需进行平方根转换#对数转换和反正弦转换( 在Excel中通过插入函数或利用 Spss的数据转换命令进行转换) ,或者选择非参数检验( 如秩和检验、符号检验等) 。以上条件中,对独立性要求最严格,但一般都可满足,根据

实验设计与数据处理

试验设计与数据处理 学院 班级 学号 学生姓名 指导老师

第一章 4、 相对误差18.20.1%0.0182x mg mg ?=?= 故100g 中维生素C 的质量范围为:±。 5、1)、压力表的精度为级,量程为, 则 max 0.2 1.5%0.00333 0.375 8 R x MPa KPa x E x ?=?==?=== 2)、1mm 的汞柱代表的大气压为, 所以 max 2 0.1330.133 1.662510 8 R x KPa x E x -?=?===? 3)、1mm 水柱代表的大气压为gh ρ,其中2 9.8/g m s = 则: 3max 33 9.8109.810 1.22510 8 R x KPa x E x ---?=???===? 6. 样本测定值 算数平均值 几何平均值 调和平均值 标准差s 标准差σ 样本方差S 2 总体方差σ2 算术平均误差△ 极差R 7、S ?2=,S ?2= F =S ?2/ S ?2== 而F ()=,= 所以F ()< F < 两个人测量值没有显著性差异,即两个人的测量方法的精密度没有显著性差异。 |||69.947|7.747 6.06 p p d x =-=>

分析人员A分析人员B 8样本方差1 8样本方差2 10Fa值 104F值 6 68 4705 6 6 88 8.旧工艺新工艺 %% %% %% %% %% %% %% %% %% % % % % t-检验: 双样本异方差假设 变量 1变量 2 平均 方差 观测值139假设平均差0 df8 t Stat-38. P(T<=t) 单尾0 t 单尾临界 P(T<=t) 双尾0 t 双尾临界 F-检验双样本方差分析

实验设计与数据处理课后答案

《试验设计与数据处理》 专业:机械工程班级:机械11级专硕学号:S110805035 姓名:赵龙 第三章:统计推断 3-13 解:取假设H0:u1-u2≤0和假设H1:u1-u2>0用sas分析结果如下:Sample Statistics Group N Mean Std. Dev. Std. Error ---------------------------------------------------- x 8 0.231875 0.0146 0.0051 y 10 0.2097 0.0097 0.0031 Hypothesis Test Null hypothesis: Mean 1 - Mean 2 = 0 Alternative: Mean 1 - Mean 2 ^= 0 If Variances Are t statistic Df Pr > t ---------------------------------------------------- Equal 3.878 16 0.0013 Not Equal 3.704 11.67 0.0032 由此可见p值远小于0.05,可认为拒绝原假设,即认为2个作家所写的小品文中由3个字母组成的词的比例均值差异显著。 3-14 解:用sas分析如下: Hypothesis Test Null hypothesis: Variance 1 / Variance 2 = 1 Alternative: Variance 1 / Variance 2 ^= 1 - Degrees of Freedom - F Numer. Denom. Pr > F ---------------------------------------------- 2.27 7 9 0.2501 由p值为0.2501>0.05(显著性水平),所以接受原假设,两方差无显著差异 第四章:方差分析和协方差分析 4-1 解: Sas分析结果如下: Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F

实验设计与数据处理

Fisher传统的试验设计被誉为第一个里程碑。正交表的构造和开发是第二个里程碑,日本学者田口玄一开开发的SN比试验设计则称为第三个里程碑。 第一章试验设计 1.试验包括:验证性试验、探索性试验。 2.试验设计的要求:效率、精度。(效率由设计保证,精度由数据处理、分析保证。) 3.试验方案设计的4个基本要素:目标、目标函数、因素、水平。 4.目标:进行试验所要达到的目的。 目标可以定量也可定性。 5.目标函数:表示目标的函数Y(x)。有显示目标函数、隐式目标函数。 6.因素:对目标产生影响的自变量或试验条件,也称因子。分为可控因素与不可控因素。 7.水平:每个因素所处的状态,也称位级。 8.选取因素的原则:抓住主要因素及多因素之间的交互作用;抓住非主要因素,在试验中保持不变,消除其干扰。因素用大写字母表示。

9.按所取因素的多少,可把试验分为单因素试验、两因素试验、多因素试验。 10.交互作用:就是这些因素在同时改变水平时,其效果会超过单独改变某一因素水平时的效果。 11.水平的选取原则:等间距;三水平为宜;是具体的;技术上可行。 12.误差包括:系统误差、随机误差。 13.费希尔Fisher三原则(作用:进行误差控制):重复测试、随机化、区组控制。 14.重复测试,作用:减小误差。 15.随机化是使系统误差转化为偶然误差的有效方法。原则:进行随机化,使其转化为随机误差。 16.区组控制,原则:机会均等,公平原则。区组控制原则实质上是机会均等原则,实行区组控制,可使设备条件由存在差异转化为没有差异,在区组控制中也把区组当做因素来对待,并称之为区组因素。 17.试验设计法和现行做法的不同点:对于不能实现控制的环境条件及未知原因对试验数据产生的干扰和影响程度,可以做出客观

《实验设计与数据处理》教学大纲

《实验设计与数据处理》教学大纲 (Experiment Design and Data Analysis) 一、基本信息 课程代码: 学分:2 总课时:32 课程性质:硕士专业必修课 适用专业:环境工程 先修课程:高等数学、概率论、线性代数 二、本课程教学目的和任务 本课程是环境工程硕士生的专业课。数据分析作为一种研究手段,主要是通过从系统设计、参数设计和允许误差设计入手,运用一定的物质手段,在人为控制或模拟自然现象的条件下,使环境过程以纯粹的、典型的形式表现出来,以便进行观察、研究、探索环境本质及其规律,使试验设计建立在统计理论基础之上,试验设计与数据处理相并重。 三、大纲的教学体系 以课堂教学和上机操作为主,采用多媒体教学,辅以课堂讨论、专题讲解等内容。主要开展环境试验的优化设计、环境数据的展示分析、环境数据的比较分析、环境数据的关系分析、环境数据的类别分析、环境数据的序列分析、环境数据的序列分析、正交试验的数据分析、回归分析、数据分析软件学习等内容。 四、教学内容及要求 第一章环境实验设计与数据处理概论 要求掌握(1)环境试验研究的目的与任务;(2)环境试验研究的类型;(3)环境试验研究的程序 重点内容:准确理解环境试验研究类型的区分;理解环境试验研究的设计步骤,以及试验设计的基本要求。 难点内容:理解环境试验因子、水平、处理、重复、响应指标等要素,了解准确度、精密度等概念。 第二章环境试验的优化设计 要求掌握(1)非均分设计;(2)黄金分割设计;(3)纵横对折设计;(4)平行线设计;(5)环境试验的正交设计;(6)环境试验点均匀设计;熟悉单因子、双因子优选设计的基本方法,熟悉正交表的定义和类型;了解均匀设计与正交设计的区别。 重点内容:正交试验的设计步骤,常见的正交设计运用方法,均匀设计的步骤 难点内容:了解分数法设计;旋升设计;逐步提高设计;陡度法设计;单纯形法设计等。 第三章环境数据的展示分析

实验设计与数据处理(第二版部分答案)教学内容

实验设计与数据处理(第二版部分答案)

试验设计与数据处理 学院 班级 学号 学生姓名 指导老师

第一章 4、相对误差18.20.1%0.0182x mg mg ?=?= 故100g 中维生素C 的质量范围为:18.2±0.0182mg 。 5、1)、压力表的精度为1.5级,量程为0.2MPa , 则 max 0.2 1.5%0.00333 0.375 8 R x MPa KPa x E x ?=?==?=== 2)、1mm 的汞柱代表的大气压为0.133KPa , 所以 max 2 0.1330.133 1.6625108 R x KPa x E x -?=?===? 3)、1mm 水柱代表的大气压为gh ρ,其中29.8/g m s = 则: 3max 33 9.8109.810 1.22510 8 R x KPa x E x ---?=???===? 6. 样本测定值 3.48 算数平均值 3.421666667 3.37 几何平均值 3.421406894 3.47 调和平均值 3.421147559 3.38 标准差s 0.046224092 3.4 标准差σ 0.04219663 3.43 样本方差S 2 0.002136667 总体方差σ2 0.001780556 算术平均误差△ 0.038333333 极差R 0.11 7、S ?2=3.733,S ?2=2.303 F =S ?2/ S ?2=3.733/2.303=1.62123 而F 0.975 (9.9)=0.248386,F 0.025(9.9)=4.025994 所以F 0.975 (9.9)< F

试验设计与数据处理试验报告

试验设计与数据处理试验报告 正交试验设计 1.为了通过正交试验寻找从某矿物中提取稀土元素的最优工艺条件,使稀土元素提取率最高,选取的水平如下:

需要考虑交互作用有A×B,A×C,B×C,如果将A,B,C分别安排在正交表L8(2)的 1,2,4列上,试验结果(提取量/ml)依次是1.01,,1,33,1,13,1.06,,1.03,0.08,,0.76,0.56. 试用方差分析法(α=0.05)分析实验结果,确定较优工艺条件 解:(1)列出正交表L8(27)和实验结果,进行方差分析。 试验号 A B A×B C A×C B×C 空号提取量(ml) 1 1 1 1 1 1 1 1 1.01 2 1 1 1 2 2 2 2 1.33 3 1 2 2 1 1 2 2 1.13 4 1 2 2 2 2 1 1 1.06 5 2 1 2 1 2 1 2 1.03 6 2 1 2 2 1 2 1 0.8 7 2 2 1 1 2 2 1 0.76 8 2 2 1 2 1 1 2 0.56 K1 4.53 4.17 3.66 3.93 3.5 3.66 3.63 K2 3.15 3.51 4.02 3.75 4.18 4.02 4.05 k1 2.265 2.085 1.83 1.965 1.75 1.83 1.815 k2 1.575 1.755 2.01 1.875 2.09 2.01 2.025 极差R 1.38 0.66 0.36 0.18 0.68 0.36 0.42 因素主次 A A×C B A×B B×C 优选方案 A1B1C1 SS J 0.23805 0.05445 0.0162 0.00405 0.0578 0.0162 0.02205 Q 7.7816 总和T 7.68 P=T^2/n 7.3728 SS T 0.4088 差异源SS df MS F 显著性 A 0.23805 1 0.23805 19.5925 9259 * B 0.05445 1 0.05445 4.48148 1481 A*B 0.0162 1 0.0162 1.33333 3333 C 0.00405 1 0.00405 0.33333 3333 A*C 0.0578 1 0.0578 4.75720 1646

试验设计与数据分析

1.方差分析在科学研究中有何意义?如何进行平方和与自由度的分解?如何进行F检验和 多重比较? (1)方差分析的意义 方差分析,又称变量分析,其实质是关于观察值变异原因的数量分析,是科学研究的重要工具。方差分析得最大公用在于:a. 它能将引起变异的多种因素的各自作用一一剖析出来,做出量的估计,进而辨明哪些因素起主要作用,哪些因素起次要作用。b. 它能充分利用资料提供的信息将试验中由于偶然因素造成的随机误差无偏地估计出来,从而大大提高了对实验结果分析的精确性,为统计假设的可靠性提供了科学的理论依据。 (2)平方和及自由度的分解 方差分析之所以能将试验数据的总变异分解成各种因素所引起的相应变异,是根据总平方和与总自由度的可分解性而实现的。 (3)F检验和多重比较 ①F检验的目的在于,推断处理间的差异是否存在,检验某项变异原因的效应方差是否为零。实际进行F检验时,是将由试验资料算得的F值与根据df1=df t(分子均方的自由度)、df2=df e(分母均方的自由度)查附表4(F值表)所得的临界F值(F0.05(df1,df2)和F0.01(df1,df2))相比较做出统计判断。若F< F0.05(df1,df2),即P>0.05,不能否定H0,可认为各处理间差异不显著;若F0.05(df1,df2)≤F<F0.01(df1,df2),即0.01

实验设计与数据处理习题练习

09印刷工程5班方桂森 090210526 1、某饮料生产企业研制出一种新型饮料。饮料的颜射共有四种,分别为橘黄色、 粉色、绿色和物色透明。随机从超市市场收集了前一期该种饮料的销售量(万元),如下表所示,试问饮料的颜色是否对销售产生影响。 答:实验数据处理如下表: 实验分析:其中F-crit是显著性水平为0.05时F的临界值,也就从F分布表中查到的F0.05(3,16),在本次试验中,F=10.4>F-crit=3.23,所以颜色因素对实验指标销售有显著影响,而 P-value=0.000466<0.01,说明颜色因素对销售有显著影响,因为P-value表示的是因素对实验结果无显著影响的概率。 2、在用原子吸收分光光度法测定镍电解液中微量杂质铜时,研究了乙炔和空气流量变 化对铜在某波长上吸光度的影响,得到下表所示的吸光度数据。试根据表中数据分

析乙炔和空气流量的变化对铜吸光度的影响。 答:实验数据分析如下表: 实验分析:表中行代表的是乙炔流量,列代表的是空气流量。在乙炔流量因素中,我们可以看到,F=23.39361>F-crit=3.490295且P-value=0.000026586498341<0.01,所以乙炔流量这个因素对铜吸光度的影响非常显著,而在空气流量中F0.01,所以空气因素对铜吸光度的影响不大。 3、为了研究铝材材质的差异对于它们在高温水中的腐蚀性能的影响,用三种不同的铝 材在去离子水和自来水中于170°C进行了一个月的腐蚀试验,测得的深蚀率(μm)如下表所示。试由下表所述结果考察铝材材质和水质对铝材腐蚀的影响。

实验设计与数据处理心得

实验设计与数据处理心 得 Company Document number:WTUT-WT88Y-W8BBGB-BWYTT-19998

实验设计与数据处理心得体会刚开始选这门课的时候,我觉得这门课应该是很难懂的课程,首先我们做过不少的实验了,当然任何自然科学都离不开实验,大多数学科(化工、化学、轻工、材料、环境、医药等)中的概念、原理和规律大多由实验推导和论证的,但我觉得每次到处理数据的时候都很困难,所以我觉得这是门难懂的课程,却也是很有必要去学的一门课程,它对于我们工科生来说也是很有用途的,在以后我们实验的数据处理上有很重要的意义。 如何科学的设计实验,对实验所观测的数据进行分析和处理,获得研究观测对象的变化规律,是每个需要进行实验的人员需要解决的问题。“实验设计与数据处理”课程就是是以概率论数理统计、专业技术知识和实践经验为基础,经济、科学地安排试验,并对试验数据进行计算分析,最终达到减少试验次数、缩短试验周期、迅速找到优化方案的一种科学计算方法。它主要应用于工农业生产和科学研究过程中的科学试验,是产品设计、质量管理和科学研究的重要工具和方法,也是一门关于科学实验中实验前的实验设计的理论、知识、方法、技能,以及实验后获得了实验结果,对实验数据进行科学处理的理论、知识、方法与技能的课程。 通过本课程的学习,我掌握了试验数据统计分析的基本原理,并能针对实际问题正确地运用,为将来从事专业科学的研究打下基础。这门课的安排很合理,由简单到复杂、由浅入深的思维发展规律,先讲单因素试验、双因素试验、正交试验、均匀试验设计等常

用试验设计方法及其常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识,最后将得出的方差分析、回归分析等结论和处理方法直接应用到试验设计方法。 比如我对误差理论与误差分析的学习:在实验中,每次针对实验数据总会有误差分析,误差是进行实验设计和数据评价最关键的一个概念,是测量结果与真值的接近程度。任何物理量不可能测量的绝对准确,必然存在着测定误差。通过学习,我知道误差分为过失误差,系统误差与随机误差,并理解了他们的定义。另外还有对准确度与精密度的学习,了解了他们之间的关系以及提高准确度的方法等。对误差的学习更有意义的应该是如何消除误差,首先消除系统误差,可以通过对照试验,空白试验,校准仪器以及对分析结果的校正等方法来消除;其次要减小随机误差,就是要在消除系统误差的前提下,增加平行测定次数,可以提高平均值的精密度。 比如我对方差分析的理解:方差分析是实验设计中的重要分析方法,应用非常广泛,它是将不同因素、不同水平组合下试验数据作为不同总体的样本数据,进行统计分析,找出对实验指标影响大的因素及其影响程度。对于单因素实验的方差分析,主要步骤如下:建立线性统计模型,提出需要检验的假设;总离差平方和的分析与计算;统计分析,列出方差分析表。对于双因素实验的方差分析,分为两种,一种是无交互作用的方差分析,另一种是有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但是总体步骤都和单因素实验的方差分析一样。

《实验设计与数据处理》大作业2017

《实验设计与数据处理》大作业2017 篇一:《实验设计与数据处理》大作业 《实验设计与数据处理》大作业及答案 班级:姓名:学号: 1、用Excel作出下表数据带数据点的折线散点图: (1)分别作出加药量和余浊、总氮T-N、总磷T-P、COD的变化关系图(共四张图,要求它们的格式大小一致,并以两张图并列的形式排版到Word中,注意调整图形的大小); (2)在一张图中作出加药量和浊度去除率、总氮T-N去除率、总磷T-P去除率、COD去除率的变化关系折线散点图。 2、对离心泵性能进行测试的实验中,得到流量Qv、压头H和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式。(要求作双Y轴图) 流量Qv、压头H和效率η的关系数据 序号 1 0.0 15.00 2 0.4 14.84 3 0.8 14.56

4 1.2 14.33 5 1. 6 13.96 6 2.0 13.65 Qv(m3/h) H/m η 序号 0.0 7 2.4 13.28 0.385 0.085 8 2.8 12.81 0.416 0.156 9 3.2 12.45 0.446 0.224 10 3.6 11.98 0.468 0.277 11 4.0 11.30 0.469 0.333 12 4.4 10.53 0.431 Qv(m3/h) H/m η 3、用荧光法测定阿司匹林中的水杨酸(SA),测得的工作曲线和样品溶液的数据如下表: (1)列出一元线性回归方程,求出相关系数,并给出回归方程的

精度;(2)求出未知液(样品)的水杨酸(SA)浓度。 4、对某矿中的13个相邻矿点的某种伴生金属含量进行测定,得到如下一组数据: 试找出某伴生金属c与含量距离x之间的关系(要求有分析过程、计算表格以及回归图形)。 提示:⑴作实验点的散点图,分析c~x之间可能的函数关系,如对数函数y=a+blgx、双曲函数(1/y)=a+(b/x)或幂函数y=dxb等;⑵对各函数关系分别建立数学模型逐步讨论,即分别将非线性关系转化成线性模型进行回归分析,分析相关系数:如果R≦0.553,则建立的回归方程无意义,否则选取标准差SD最小(或R最大)的一种模型作为某伴生金属c与含量距离x之间经验公式。 5、在玻璃防雾剂的配方研究中,考察了三种主要成分用量对玻璃防雾性能的影 响,三个因素的水平取值如下: 因素 PVA x1/g ZC x2/g LAS x3/g 试验结果y 1 0.5 3.5 0.1 3.8 2 1.0 4.5 0.5 2.5 3 1.5 5.5 0.9 3.9 4 2.0 6. 5 1.3 4.0 5 2.5 7.5 1.7 5.1

相关文档
最新文档