实验数据处理

实验数据处理
实验数据处理

第3章实验数据处理

实验数据处理,就是以测量为手段,以研究对象的概念、状态为基础,以数学运算为工具,推断出某量值的真值,并导出某些具有规律性结论的整个过程。因此对实验数据进行处理,可使人们清楚地观察到各变量之间的定量关系,以便进一步分析实验现象,得出规律,指导生产与设计。

数据处理的方法有三种:列表法、图示法和回归分析法。

3.1 列表法

将实验数据按自变量和因变量的关系,以一定的顺序列出数据表,即为列表法。列表法有许多优点,如为了不遗漏数据,原始数据记录表会给数据处理带来方便;列出数据使数据易比较;形式紧凑;同一表格内可以表示几个变量间的关系等。列表通常是整理数据的第一步,为标绘曲线图或整理成数学公式打下基础。

3.1.1 实验数据表的分类

实验数据表一般分为两大类:原始数据记录表和整理计算数据表。以阻力实验测定层流λ~Re关系为例进行说明。

原始数据记录表是根据实验的具体内容而设计的,以清楚地记录所有待测数据。该表必须在实验前完成。层流阻力实验原始数据记录表如表3-1所示。

表3-1 层流阻力实验原始数据记录表

实验装置编号:第__套管径__m 管长__m 平均水温__℃实验时间__年__月__日

序号水的体积

ml

V/

时间

s

t/

压差计示值

备注

左mm

/右mm

/mm

R/

?

1

2

n

整理计算数据表可细分为中间计算结果表(体现出实验过程主要变量的计算结果)、综合结果表(表达实验过程中得出的结论)和误差分析表(表达实验值与参照值或理论值的误差范围)等,实验报告中要用到几个表,应根据具体实验情况而定。层流阻力实验整理计算数据表见表3-2,误差分析结果表见表3-3。

表3-2 层流阻力实验整理计算数据表

序号

流量

]

[

/3s

m

V/

平均流速

]

[

/s

m

u/

层流沿程损失值

O

H

/2

m

h f

2

10

Re?2

10-

?

λλ~Re关系式

1 2 ┋n

表3-3 层流阻力实验误差分析结果表

层流

实验λ

理论λ

相对误差%

3.1.2 设计实验数据表应注意的事项

(1)表格设计要力求简明扼要,一目了然,便于阅读和使用。记录、计算项目要满足实验需要,如原始数据记录表格上方要列出实验装置的几何参数以及平均水温等常数项。

(2)表头列出物理量的名称、符号和计算单位。符号与计量单位之间用斜线“/”隔开。斜线不能重叠使用。计量单位不宜混在数字之中,造成分辨不清。

(3)注意有效数字位数,即记录的数字应与测量仪表的准确度相匹配,不可过多或过少。

(4)物理量的数值较大或较小时,要用科学记数法表示。以“物理量的符号×10±

n /

计量单位”的形式记入表头。注意:表头中的10

±n

与表中的数据应服从下式:

物理量的实际值×10±

n =表中数据

(5)为便于引用,每一个数据表都应在表的上方写明表号和表题(表名)。表号应按出现的顺序编写并在正文中有所交代。同一个表尽量不跨页,必须跨页时,在跨页的表上须注“续表×××”。

(6)数据书写要清楚整齐。修改时宜用单线将错误的划掉,将正确的写在下面。各种实验条件及作记录者的姓名可作为“表注”,写在表的下方。 3.2 图示法

实验数据图示法就是将整理得到的实验数据或结果标绘成描述因变量和自变量的依从关系的曲线图。该法的优点是直观清晰,便于比较,容易看出数据中的极值点、转折点、周期性、变化率以及其他特性,准确的图形还可以在不知数学表达式的情况下进行微积分运算,因此得到广泛的应用。

实验曲线的标绘是实验数据整理的第二步,将在工程实验中正确作图必须遵循如下基本原则,才能得到与实验点位置偏差最小而光滑的曲线图形。 3.2.1 坐标纸的选择 3.2.1.1坐标系

化工中常用的坐标系为直角坐标系、单对数坐标系和对数坐标系。下面仅介绍单对数坐标系和对数坐标系。

(1)单对数坐标系。如图3-1所示。一个轴是分度均匀的普通坐标轴,另一个轴是分度不均匀的对数坐标轴。

(2)对数坐标系。如图3-2所示。两个轴都是对数标度的坐标轴。 3.2.1.2选用坐标纸的基本原则 1.直角坐标纸

变量x 、y 间的函数关系式为: bx a y +=

即为直线函数型,将变量x 、y 标绘在直角坐标纸上得到一直线图形,系数a 、b 不

难由图上求出。

(1(2 (3)当需要变换某种非线性关系为线性关系时,可用单对数坐标。如将指数型函数变换为直线函数关系。若变量x 、y 间存在指数函数型关系,则有:

bx ae y =

式中a 、b 为待定系数。

在这种情况下,若把x 、y 数据在直角坐标纸上作图,所得图形必为一曲线。若对上式两边同时取对数

则 e bx a y log log log += 令 Y y =log

k e b =log

则上式变为 kx a Y +=log 经上述处理变成了线性关系,以Y y =log 对x 在直角坐标纸上作图,其图形也是直线。为了避免对每一个实验数据y 取对数的麻烦,可以采用单对数坐标纸。因此可以说把实验

数据标绘在单对数坐标纸上,如为直线的话,其关联式必为指数函数型。 3. 双对数坐标

在下列情况下,建议使用双对数坐标纸: (1)变量x 、y 在数值上均变化了几个数量级。 (2)需要将曲线开始部分划分成展开的形式。

(3)当需要变换某种非线性关系为线性关系时,例如幂函数。变量x 、y 若存在幂函数关系式,则有

b ax y = 式中a 、b 为待定系数。

若直接在直角坐标系上作图必为曲线,为此把上式两边取对数 x b a y log log log += 令 Y y =l o g , X x =log

则上式变换为 bX a Y +=log 根据上式,把实验数据x 、y 取对数X x =log Y y =log 在直角坐标线上作图也得一条直线。同理,为了解决每次取对数的麻烦,可以把x 、y 直接标在双对数坐标纸上,所得结果完全相同。 3.2.2 坐标分度的确定

坐标分度指每条坐标轴所代表的物理量大小,即选择适当的坐标比例尺。

(1)为了得到良好的图形,在x 、y 的误差x ?、y ?已知的情况下,比例尺的取法应使实验“点”的边长为2x ?、2y ?(近似于正方形),而且使mm y x 2~122=?=?,若mm 222=?=?y x ,则它们的比例尺应为:

y mm y

y mm M y /1

22?=?=

(3-1) x mm x

x mm M x /1

22?=?=

(3-2) 如已知温度误差C T 05.0=?,则

C mm C

mm M T

/2005.01==

此时温度1℃的坐标为20mm 长,若感觉太大可取mm 122=?=?y x ,此时1℃的坐标为10mm 长。

(2)若测量数据的误差不知道,那么坐标的分度应与实验数据的有效数字大体相符,即最适合的分度是使实验曲线坐标读数和实验数据具有同样的有效数字位数。其次,横、纵坐标之间的比例不一定取得一致,应根据具体情况选择,使实验曲线的坡度介于300~600之间,这样的曲线坐标读数准确度较高。

(3)推荐使用坐标轴的比例常数M =(1、2、5)×10±

n (n 为正整数),而3、6、7、

8、9等的比例常数绝不可选用,因为后者的比例常数不但引起图形的绘制和实验麻烦,也极易引出错误。

3.2.3 图示法应注意的事项

(1)对于两个变量的系统,习惯上选横轴为自变量,纵轴为因变量。在两轴侧要标明变量名称、符号和单位,如离心泵特性曲线的横轴须标明:流量Q /(m 3/h)。尤其是单位,初学者往往因受纯数学的影响而容易忽略。

(2)坐标分度要适当,使变量的函数关系表现清楚。

对于直角坐标的原点不一定选为零点,应根据所标绘数据范围而定,其原点应移至比数据中最小者稍小一些的位置为宜,能使图形占满全幅坐标线为原则。

对于对数坐标,坐标轴刻度是按1,2,…,10的对数值大小划分的,其分度要遵循对数坐标的规律,当用坐标表示不同大小的数据时,只可将各值乖以10n (n 取正、负整数)而不能任意划分。对数坐标的原点不是零。在对数坐标上,1,10,100,1000之间的实际距离是相同的,因为上述各数相应的对数值为0,1,2,3,这在线性坐标上的距离相同。

(3)实验数据的标绘。若在同一张坐标纸上同时标绘几组测量值,则各组要用不同符号(如:ο,Δ,×等)以示区别。若n 组不同函数同绘在一张坐标纸上,则在曲线上要标明函数关系名称。

(4)图必须有图号和图题(图名),图号应按出现的顺序编写,并在正文中有所交待。必要时还应有图注。

(5)图线应光滑。利用曲线板等工具将各离散点连接成光滑曲线,并使曲线尽可能通过较多的实验点,或者使曲线以外的点尽可能位于曲线附近,并使曲线两侧的点数大致相等。 3.3 实验数据数学方程表示法

在实验研究中,除了用表格和图形描述变量间的关系外,还常常把实验数据整理成方程式,以描述过程或现象的自变量和因变量之间的关系,即建立过程的数学模型。其方法是将实验数据绘制成曲线,与已知的函数关系式的典型曲线(线性方程、幂函数方程、指数函数方程、抛物线函数方程、双曲线函数方程等)进行对照选择,然后用图解法或者数值方法确定函数式中的各种常数。所得函数表达式是否能准确地反映实验数据所存在的关系,应通过检验加以确认。运用计算机将实验数据结果回归为数学方程已成为实验数据处理的主要手段。 3.3.1 数学方程式的选择

数学方程式选择的原则是:既要求形式简单,所含常数较少,同时也希望能准确地表达实验数据之间的关系,但要满足两者条件往往是难以做到,通常是在保证必要的准确度的前提下,尽可能选择简单的线性关系或者经过适当方法转换成线性关系的形式,使数据处理工作得到简单化。

数学方程式选择的方法是:将实验数据标绘在普通坐标纸上,得一直线或曲线。如果是直线,则根据初等数学可知,bx a y +=,其中a 、b 值可由直线的截距和斜率求得。如果不是直线,也就是说,y 和x 不是线性关系,则可将实验曲线和典型的函数曲线相对照,选择与实验曲线相似的典型曲线函数,然后用直线化方法处理,最后以所选函数与实验数据的符合程度加以检验。

直线化方法就是将函数)(x f y =转化成线性函数bX a Y +=的方法。如3.2.1.2节所述的幂函数和指数函数转化成线性方程的方法。

常见函数的典型图形及线性化方法列于表3-4。 3.3.2 图解法求公式中的常数

当公式选定后,可用图解法求方程式中的常数,本节以幂函数和指数函数、对数函数为例进行说明。

1. 幂函数的线性图解

幂函数b ax y =经线性化后成为bX a Y +=log (见3.2.1.2节所述)

(1)系数b 的求法

系数b 即为直线的斜率,如图3-3所示的AB 线的斜率。在对数坐标上求取斜率方法与直角坐标上的求法不同。因为在对数坐标上标度的数值是真数而不是对数,因此双对数坐标纸上直线的斜率需要用对数值来求算,或者在两坐标轴比例尺相同情况下直接用尺子在坐标纸上量取线段长度来求取。

1

21

2log log log log x x y y x y b --=??=

(3-3

式中:x y ??与线段长度。

(2)系数a 的求法

在双对数坐标上,直线1=x 相交处的y 值,即为方程b ax y =中的a 若所绘的直线在图面上不能与1=x 轴相交,则可在直线上任取一组数值x 和(而不是取一组测定结果数据)斜率b ,代入原方程b ax y =中,得a 值。

2. 指数或对数函数的线性图解法

当所研究的函数关系呈指数函数bx ae y =或对数函数x b a y log +=时,将实验数据标绘在单对数坐标纸上的图形是一直线。线性化方法见表3-4中的(3)和(6)。

(1)系数b 的求法

对bx ae y =,线性化为kx a Y +=log ,式中e b k log =,其纵轴为对数坐标,斜率为:

121

2log log x x y y k --=

(3-4)

e

k

b log =

(3-5) 对x b a y log +=,横轴为对数坐标,斜率为:

1

21

2log log x x y y b --=

(3-6)

(2)系数a 的求法

系数a 的求法与幂函数中所述方法基本相同,可用直线上任一点处的坐标值和已经求出的系数b 代入函数关系式后求解。

3. 二元线性方程的图解

若实验研究中,所研究对象的物理量是一个因变量与两个自变量,它们必成线性关系,则可采用以下函数式表示:

21cx bx a y ++= (3-7)

在图解此类函数式时,应首先令其中一自变量恒定不变,例如使1x 为常数,则上式可改写成:

2cx d y += (3-8)

式中: const 1=+=bx a d

由y 与2x 的数据可在直角坐标中标绘出一条直线,如图3-4(a )所示。采用上述图解法即可确定2x 的系数c 。

图3-4 二元线性方程图解示意

在图a 中直线上任取两点),(1211y x e ,)(2,222y x e ,则有:

21

221

2x x y y c --=

(3-9)

当c 求得后,将其代入式(3-7)中,并将式(3-7)重新改写成以下形式:

12bx a cx y +=- (3-10)

令2cx y y -='于是可得一新的线性方程:

1bx a y +=' (3-11)

由实验数据2,x y 和c 计算得y ',由y '与1x 在图b 中标绘其直线,并在该直线上任取

),(1

111y x f '及),(2122y x f '两点。由21,f f 两点即可确定a 、b 两个常数。 111212

x x y y b -'-'=

(3-12) 11

12112121

x x x y x y a -'-'=

(3-13) 应该指出的是,在确定b 、a 时,其自变量21,x x 应同时改变,才能使其结果覆盖整个实验范围。

薛伍德(Sherwood )利用七种不同流体对流过圆形直管的强制对流传热进行研究,并取得大量数据,采用幂函数形式进行处理,其函数形式为:

n m B Nu Pr Re = (3-14)

式中Nu 随Re 及Pr 数而变化,将上式两边取对数,采用变量代换,使之化为二元线性方程形式:

Pr log Re log log log n m B Nu ++= (3-15)

令Nu y log =;Re log 1=x ;Pr log 2=x ;B a log =,上式即可表示为二元线性方程式:

21nx mx a y ++= (3-16)

现将(3-15)式改写为以下形式,确定常数n (固定变量Re 值,使Re=const ,自变量减少一个)。

Pr log Re log log log n m B Nu ++=)( (3-17)

薛伍德固定410Re =,将七种不同流体的实验数据在双对数坐标纸上标绘Nu 和Pr 之间的关系如图3-5(a )。实验表明,不同Pr 数的实验结果,基本上是一条直线,用这条直线

决定Pr 准数的指数n ,然后在不同Pr 数及不同Re 数下实验,按下式图解法求解:

Re l og l og )Pr /l og m B Nu n +=( (3-18)

以n Nu Pr /对Re 数,在双对数坐标纸上作图,标绘出一条直线如图3-5(b )所示。由这条直线的斜率和截距决定B 和m 值。这样,经验公式中的所有待定常数B 、m 和n 均被确定。

b )4

.0Pr /Nu ~Re 关系图

n

m B Pr Re 图解法示意

3.3.3 联立方程法求公式中的常数

此法又称“平均值法”,仅适用于实验数据精度很高的条件下,即实验点与理想曲线偏离较小,否则所得函数将毫无意义。

平均值法定义为:选择能使其同各测定值的偏差的代数和为零的那条曲线为理想曲线。具体步骤是:

(1) 选择适宜的经验公式:)(x f y = (2) 建立求待定常数和系数的方程组。

现假定画出的理想曲线为直线,其方程为bx a y +=,设测定值为i x 、i y ,将i x 代入上式,所得的y 值为i y ',即i i bx a y +=',而i i bx a y +=,所以应该是i i y y ='。然而,一般由于测量误差,实测点偏离直线,使i i y y ≠'。若设i y 和i y '的偏差为i ?,则

)(bx a y y y i i i i +-='-=? (3-19)

最好能引一使这个偏差值的总和为零的直线,设测定值的个数为N ,由下式

0=∑--∑=∑?i i i x b Na y (3-20)

定出a 、b ,则以a 、b 为常数和系数的直线即为所求的理想直线。

由于式(3-20)含有二个未知数a 和b ,所以需将测定值按实验数据的次序分成相等或近似相等的两组,分别建立相应的方程式,然后联立方程,解之即得a 、b 。

例3-1 以转子流量计标定时得到的读数与流量关系为例,求实验方程。

解:把上表数据分成A 、B 两组,前面5对x 、y 为A 组,后面4对x 、y 为B 组。 20

86420=++++=∑A x )( 55.16201.3571.3358.3225.3100.30=++++=∑A y )( 5216141210)(=+++=∑B x

34.15204.4079.3831.3720.36)(=+++=∑B y 把这些数值代入式(3-20)

???=--=--0

52534.1520

20555.162b a b a

联立求解得 620.00.30=b a = 所求直线方程为:x y 620.00.30+=

平均值法在实验数据精度不高的情况下不可使用,比较准确的方法是采用最小二乘法。 3.3.4 实验数据的回归分析法

在3.3.2节介绍了用图解法获得经验公式的过程。尽管图解法有很多优点,但它的应用范围毕竟很有限。本节将介绍目前在寻求实验数据的变量关系间的数学模型时,应用最广泛的一种数学方法,即回归分析法。用这种数学方法可以从大量观测的散点数据中寻找到能反映事物内部的一些统计规律,并可以用数学模型形式表达出来。回归分析法与计算机相结合,已成为确定经验公式最有效的手段之一。

回归也称拟合。对具有相关关系的两个变量,若用一条直线描述,则称一元线性回归,

用一条曲线描述,则称一元非线性回归。对具有相关关系的三个变量,其中一个因变量、两个自变量,若用平面描述,则称二元线性回归,用曲面描述,则称二元非线性回归。依次类推,可以延伸到n 维空间进行回归,则称多元线性回归或多元非线性回归。处理实验问题时,往往将非线性问题转化为线性来处理。建立线性回归方程的最有效方法为线性最小二乘法,以下主要讨论用最小二乘法回归一元线性方程。 3.3.4.1 一元线性回归方程的求法

在科学实验的数据统计方法中,通常要从获得的实验数据),,2,1,,(n i y x i i ???=中,寻找其自变量i x 与因变量i y 之间函数关系)(x f y =。由于实验测定数据一般都存在误差,因此,不能要求所有的实验点均在)(x f y =所表示的曲线上,只需满足实验点),(i i y x 与

)(i x f 的残差)(i i i x f y d -=小于给定的误差即可。此类寻求实验数据关系近似函数表达式)(x f y =的问题称之为曲线拟合。

曲线拟合首先应针对实验数据的特点,选择适宜的函数形式,确定拟合时的目标函数。

例如在取得两个变量的实验数据之后,若在普通直角坐标纸上标出各个数据点,如果各点的分布近似于一条直线,则可考虑采用线性回归求其表达式。

图3-6 一元线性回归示意图 图3-7 实验曲线示意图

设给定n 个实验点 ) , , ,) , ,) ,2211n n y x y x y x (((???,其离散点图如图3-6所示。于是可以利用一条直线来代表它们之间的关系

bx a y +=' (3-21)

式中y '――由回归式算出的值,称回归值;

b a , ――回归系数。

对每一测量值i x 可由式(3-21)求出一回归值y '。回归值y '与实测值i y 之差的绝对值)(i i i i i bx a y y y d +-='-=表明i y 与回归直线的偏离程度。两者偏离程度愈小,说明直线与实验数据点拟合愈好。i i y y '-值代表点 ,) ,11y x (沿平行于y 轴方向到回归直线的距离,如图3-7上各竖直线i d 所示。

曲线拟合时应确定拟合时的目标函数。选择残差平方和为目标函数的处理方法即为最小二乘法。此法是寻求实验数据近似函数表达式的更为严格有效的方法。定义为:最理想的曲线就是能使各点同曲线的残差平方和为最小。

设残差平方和Q 为:

[]∑∑==+-==n

i i i n

i i bx a y d 1

2

1

2)(Q (3-22)

其中i x 、i y 是已知值,故Q 为b a 和的函数,为使Q 值达到最小,根据数学上极值原理,只要将式(3-22)分别对b a 和求偏导数b

Q a ???? ,Q ,并令其等于零即可求b a 和之值,

这就是最小二乘法原理。即

???????=∑---=??∑=---=??==0

)(20)(211i n

i i i n i i i x bx a y b

Q bx a y a Q

(3-23) 由式(3-23)可得正规方程:

??

???∑=∑+=+==n i i i n i i y x b x a x n y

b x a 112

)( (3-24)

式中 ∑=∑=

==n

i i n i i y n x n x 1

11y 1 (3-25) 解正规方程(3-24),可得到回归式中的a (截距)和b (斜率)

2

2)

( )(x n x y x n y x b i i i -∑∑?=- (3-26) x b y a -= (3-27)

例3-2 仍以转子流量计标定时得到的读数与流量关系为例,用最小二乘法求实验方程。

解:

∑=58.2668

)(i i y x 8=x 9878.34=y 8162=∑i x 623.0898169878.348958.2668

)

( )(22

2=?-??-=-∑∑?=

x n x y x n y x b i i i - 0.308623.09878.34=?-=-=x b y a

∴ 回归方程为:x y 623.00.30+=

3.3.

4.2 回归效果的检验

实验数据变量之间的关系具有不确定性,一个变量的每一个值对应的是整个集合值。当x 改变时,y 的分布也以一定的方式改变。在这种情况下,变量x 和y 间的关系就称为相关关系。

在以上求回归方程的计算过程中,并不需要事先假定两个变量之间一定有某种相关关系。就方法本身而论,即使平面图上是一群完全杂乱无章的离散点,也能用最小二乖法给其配一条直线来表示x 和y 之间的关系。但显然这是毫无意义的。实际上只有两变量是线性关系时进行线性回归才有意义。因此,必须对回归效果进行检验。

1.相关系数

我们可引入相关系数r 对回归效果进行检验,相关系数r 是说明两个变量线性关系密切程度的一个数量性指标。

若回归所得线性方程为:bx a y +='

则相关系数r 的计算式为(推导过程略):

∑∑--∑--=

2

2)

()())((y y x x y x r i i i i (3-28) r 的变化范围为11≤≤-r ,其正、负号取决于∑--))((y y x x i i ,与回归直线方程的斜率b 一致。r 的几何意义可用图3-8来说明。

当1±=r 时,即n 组实验值),(i i y x ,全部落在直线bx a y +=上,此时称完全相关,

如图3-8的中(4)和(5)。

当10<<||r 时,代表绝大多数的情况,这时x 与y 存在着一定线性关系。当0>r 时,

散点图的分布是y 随x 增加而增加,此时称x 与y 正相关,如图3-8中的(2)。当0>r 时,散点图的分布是y 随x 增加而减少,此时称x 与y 负相关,如图3-8中的(3)。||r 越小,散点离回归线越远,越分散。当||r 越接近1时,即n 组实验值),(i i y x 越靠近bx a y +=,变量与x 之间的关系越接近于线性关系。

当0=r 时,变量之间就完全没有线性关系了,如图3-8中的(1)。应该指出,没有线性关系,并不等于不存在其它函数关系,如图3-8中的(6)。

图3-8 相关系数的几何意义图

2.显著性检验

如上所述,相关系数r 的绝对值愈接近1,x 、y 间愈线性相关。但究竟||r 接近到什么程度才能说明x 与y 之间存在线性相关关系呢?这就有必要对相关系数进行显著性检验。只有当||r 达到一定程度才可以采用回归直线来近似地表示x 、y 之间的关系,此时可以说明相关关系显著。一般来说,相关系数r 达到使相关显著的值与实验数据的个数n 有关。因此只有min ||r r >时,才能采用线性回归方程来描述其变量之间的关系。min r 值可以从表3-5中查出。利用该表可根据实验点个数n 及显著水平系数α查出相应的min r 。显著水平系数α一般可取1%或5%。在转子流量计标定一例中,n=9则n-2=7,查表3-6得:

 =01.0α时,798.0min =r ;05.0=α时,666.0min =r

若实际的798.0||≥r ,则说明该线性相关关系在 =01.0α水平上显著。当

666

.0||789.0≥≥r 时,则说明该线性相关关系在05.0=α水平上显著。当实验的666.0||≤r ,则说明相关关系不显著,此时认为x 、y 线性不相关,配回归直线毫无意义。

α越小,显著程度越高。

例3-3 求转子流量计标定实验的实际相关系数r 解: 8=x 9878.34=y 46.149)()(=-∑-y y x x i i

240)(2

=∑-x x i

∑=-12.93)(2

y y i 798.099976.012

.9324046.149)

()())((2

2

≥=?=

∑∑--∑--=

y y x x y y x x r i i i i

说明此例的相关系数在 =01.0α的水平仍然是高度显著的。

表3-5相关系数检验表

软件学院大数据实验室建设方案-2017

xxxx大数据实验室 建设方案 1

目录 1建设目标 (3) 2配置方案 (3) 2.1已有资源 (3) 2.2扩容资源需求 (4) 2.3物理服务器扩容配置 (4) 2.4磁盘阵列扩容配置 (5) 2.5FC SAN网络扩容配置 (6) 2.6IP网络扩容配置 (6) 2.7扩容配置清单 (7) 3部署方案 (8) 3.1系统架构 (8) 3.2IP网络部署 (9) 3.3Hadoop集群部署 (9) 3.4部署计划 (10) 4Hadoop教学培训方案 (11) 4.1Hadoop教学优势 (11) 4.2课程以及考核安排 (11) 4.2.1相关教材 (11) 4.2.2课程大纲 (13) 4.2.3考核安排 (16) 4.2.4证书认证 (16)

1建设目标 xxxx软件学院已经建设了云实验平台,在该平台上实现了编程教学实验、数据库实验以及网盘应用系统;该平台技术上采用服务器虚拟化技术通过云管理平台实现了实验环境的快速部署;虚拟化平台基于磁盘阵列集中存储,采用FC SAN 网络架构。 现规划建设一个Hadoop 大数据实验室,使用已经建设好的平台,通过扩展资源池的方式部署,利用现有服务器虚拟化平台虚拟出大量虚拟机用于构建Hadoop 集群,主要用于学生实验以及科研用途。假定建设目标和规模如下:建设目标:建设成校级实验室,满足学生做大数据实验和教师大数据科研。 建设规模:系统支持100个左右的虚机同时运行,性能满足学生大数据实验需求。 扩展性需求:系统需具备良好扩展能力,可以方便扩展系统容量和性能,以满足更多实验和科研需求。 2配置方案 本章节对构建大数据实验室所需要的硬件资源进行配置,从大数据实验资源需求出发来分析构建大数据实验室需要对现有物理服务器、磁盘阵列、FC交换机、IP网络交换机的资源做哪些扩容。 2.1 已有资源 云实验平台已经部署了10多台2路物理服务器,通过1台FC交换机与1台磁盘阵列连接;现有物理计算资源可以支撑同时运行200个虚机(1个LCPU、

试验设计与数据处理作业 333333.

试验设计与数据处理 题目正交实验方差分析法确定优方案 学院名称化学化工学院 指导教师范明舫 班级化工081班 学号20084540104 学生姓名陈柏娥

2011年04月20日 《实验设计与数据处理》课程的收获与体会 《实验设计与数据处理》课程具有公式多、计算多、图表多等特点,涉及较多概率论基础知识,课程本身的繁杂性决定了理解和掌握起来难度较大。一开始的时候,我还有点担心这一门课会学不好,因为我的概率论和数理统计的知识基础薄弱,可能会对里面的内容产生难以理解的心理,有点感觉他是郁闷枯燥乏味的课程。不过,在老师的指导下我否认了之前的观点。 这门课的安排很合理,从简单到复杂,由浅入深的思维发展规律,现将单因素试验、双因素试验、正交试验、均匀实验设计等常用实验设计方法及常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识、最后讲得出的方差分析、回归分析等结论和处理方法直接应用到实验设计方法。老师也让我们先熟悉实验设计方法,并掌握常规数据处理方法,使我较早的感受到应用试验设计方法指导实践的“收获”,从而激发并维持学习兴趣。 通过学习,我初步认识了这一门课。这门课是研究如何合理而有效地获得数据资料的方法。讨论如何合理安排实验、取得数据、然后进行综合的科学分析,从而达到尽快获得最优方案的目的,即实验的最优设计。实验设计方法是数据统计学的应用方法之一。一般的数据统计方法主要是对已获得的数据资料尽可能精确的判断。如果试验安排得好且分析得当,就能以较少的试验次数、较短的试验时间、较低的费用,得到较满意的实验结果;反之,如果试验安排的不得当,分析不得当,则试验次数增加,试验时间延长,浪费人力、物力、财力,难以达到预期的结果,甚至导致实验失败。通过这门课程的学习,是我对误差理论、方差分析、正交试验设计与应用、回归分析都有了一个很好的理解,并且将它们做了笔记。 比如方差分析的理解:方差分析市实验设计中的重要分析方法,应用非常广泛,它是将不同因素,不同水平组合下的实验数据作为不同总体的样本数据,进行统计分析,找出对实验结果影响大的因素及其影响程度。对于单因素试验的数据进行统计分析,找出对试验指标影响大的因素及其影响程度。对于单因素试验的方差分析,主要步骤如下:1,建立线性统计模型,提出需要检验的假设。2,总离差平方和的分析与计算。3,统计分析,列出方差分析表。对于双因素试验的方差分析,分为两种,一种无交互作用的方差分析,另一种有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但是总体步骤都和单因素试验的方差分析一样。 我们又通过正交试验设计合理安排实验,他是尽快有效的获得最优方案的一种设计方法。了解了他是避免做全面试验,再多因素多水平实验中选择最有代表性的搭配。否则花费时间过长,人力,物力,财力消耗太多。尤其是一些长周期、高费用或破坏性试验,更不要

数据处理的基本方法

第六节数据处理的基本方法 前面我们已经讨论了测量与误差的基本概念,测量结果的最佳值、误差和不确定度的计算。然而,我们进行实验的最终目的是为了通过数据的获得和处理,从中揭示出有关物理量的关系,或找出事物的内在规律性,或验证某种理论的正确性,或为以后的实验准备依据。因而,需要对所获得的数据进行正确的处理,数据处理贯穿于从获得原始数据到得出结论的整个实验过程。包括数据记录、整理、计算、作图、分析等方面涉及数据运算的处理方法。常用的数据处理方法有:列表法、图示法、图解法、逐差法和最小二乘线性拟合法等,下面分别予以简单讨论。 列表法是将实验所获得的数据用表格的形式进行排列的数据处理方法。列表法的作用有两种:一是记录实验数据,二是能显示出物理量间的对应关系。其优点是,能对大量的杂乱无章的数据进行归纳整理,使之既有条不紊,又简明醒目;既有助于表现物理量之间的关系,又便于及时地检查和发现实验数据是否合理,减少或避免测量错误;同时,也为作图法等处理数据奠定了基础。 用列表的方法记录和处理数据是一种良好的科学工作习惯,要设 计出一个栏目清楚、行列分明的表格,也需要在实验中不断训练,逐步掌握、熟练,并形成习惯。 一般来讲,在用列表法处理数据时,应遵从如下原则:

(1) 栏目条理清楚,简单明了,便于显示有关物理量的关系。 (2) 在栏目中,应给出有关物理量的符号,并标明单位(一般不重复写在每个数据的后面)。 (3) 填入表中的数字应是有效数字。 (4) 必要时需要加以注释说明。 例如,用螺旋测微计测量钢球直径的实验数据列表处理如下。 用螺旋测微计测量钢球直径的数据记录表 从表中,可计算出 D i D = n = 5.9967 ( mm)

高校大数据实验室建设解决方案

高校大数据实验室建设方案 一、建设目标 章鱼大数据实验室的建设目的是作为大数据教学实验及科研平台,包括数据挖掘与大数据分析平台。实验室的设计全面落实“产、学、研、用”一体化的思想和模式,从教学、实践、科研和使用多方面注重专业人才和特色人才的培养。 利用虚拟化教学资源,搭建教学系统和集群平台,将理论学习、实践教学和大数据项目实战融为一体,由难而易、循序渐进,逐步提升学生的学习技能和实践水平,提高“学”的质量和成效。利用大数据分析主流软件框架,搭建与业界主要用户一致的实验与科研环境,将理论课程中学到的数据挖掘算法运用到实际的数据分析过程中,提升学生的动手操作和项目实践能力。使得学生所学与企业项目人才需求无缝衔接,与教师的科研工作紧密配合。 通过专业的大数据分析计算资源搭建的开放式大数据分析平台,可以充分的融合教师的科研需求,教师可以在开放的平台环境下开展大数据科研工作,提升教师的科研创新能力,充分提高“研”的成效。 二、产品优势

交互式学习模式 提供体系完整、简单易用的在线教学课堂;以基础知识学习、在线视频教学、习题、线上测试、评估等为主线的一系列方法,确保学生在短时间内掌握大数据虚拟仿真实验、分析部署技能。 真机实验训练 实验训练体系设计成各模块相对独立的形式,各模块交互式的实验任务、大数据实验机、实际项目上机操作,通过多方位的训练,最终灵活的、渐进式地掌握大数据生态体系。 大数据实战及案例分析 提供实验数据,包括网站流量数据、租房及二手房数据、电商商品交易数据、搜索引擎访问等多种行业数据,数据内容超过20TB,同时周期更新数据内容。 充分支撑科研工作

提供行业数据及案例解剖用于基础研究,提供数据分析方案及流程,提供数据更新接口,可以对行业数据进行分析统计,按需求生成数据报表,为科研工作提供数据支撑。例如某地区经济数据分析、股市数据分析、全国地震数据分析、食品价格行业数据分析等。 三、建设规模 按照60台大数据实验机容量进行同时在线使用进行建设为基础,整体系统提供快速扩容升级服务。 四、硬件配置 采用十六台高性能品牌服务器作为大数据节点进行建设,采用企业级全千兆三层交换机进行网络数据交换。 每台节点的配置如下:

实验数据处理的基本方法

实验数据处理的基本方法 数据处理是物理实验报告的重要组成部分,其包含的容十分丰富,例如数据的记录、函数图线的描绘,从实验数据中提取测量结果的不确定度信息,验证和寻找物理规律等。本节介绍物理实验中一些常用的数据处理方法。 1列表法 将实验数据按一定规律用列表方式表达出来是记录和处理实验数据最常用的方法。表格的设计要求对应关系清楚、简单明了、有利于发现相关量之间的物理关系;此外还要求在标题栏中注明物理量名称、符号、数量级和单位等;根据需要还可以列出除原始数据以外的计算栏目和统计栏目等。最后还要求写明表格名称、主要测量仪器的型号、量程和准确度等级、有关环境条件参数如温度、湿度等。 本课程中的许多实验已列出数据表格可供参考,有一些实验的数据表格需要自己设计,表1.7—1是一个数据表格的实例,供参考。 表1.7—1数据表格实例 氏模量实验增减砝码时,相应的镜尺读数

2作图法 作图法可以最醒目地表达物理量间的变化关系。从图线上还可以简便求出实验需要的某些结果(如直线的斜率和截距值等),读出没有进行观测的对应点(插法),或在一定条件下从图线的延伸部分读到测量围以外的对应点(外推法)。此外,还可以把某些复杂的函数关系,通过一定的变换用直线图表示出来。例如半导体热敏电阻的电阻与温度关系为,取对数后得到 ,若用半对数坐标纸,以lgR为纵轴,以1/T为横轴画图,则为一条直线。 要特别注意的是,实验作图不是示意图,而是用图来表达实验中得到的物理量间的关系,同 时还要反映出测量的准确程度,所以必须满足一定的作图要求。 1)作图要求 (1)作图必须用坐标纸。按需要可以选用毫米方格纸、半对数坐标纸、对数坐标纸或极坐标纸等。

实验设计与数据处理第三次课后作业答案.docx

现代实验方法及数据处理 作业三 1、用乙醇水溶液分离某种废弃农作物中的木质素,考察了三个因素(溶剂浓度、温度和时间)对木质素得率的影响,因素水平如下表所示。将因素 A,B,C 依次安排在正交表 L9(34)的 1,2,3 列,不考虑因素间的交互作用。 9 个试验结果 y(得 率/%)依次为: 5.3、 5.0、 4.9、 5.4、 6.4、 3.7、 3.9、 3.3、 2.4。试用直观分析法确定因素主次和优方案,并画出趋势图。 水平(A)溶剂浓度 /%(B)反应温度 / ℃(C)保温时间 /h 1601403 2801602 31001801 解:下表展示了分析过程及结果: 试验号 因素 得率A B C 11111 5.3 212225 31333 4.9 42123 5.4 52231 6.4 62312 3.7 73132 3.9 83213 3.3 93321 2.4 K115.214.612.314.1 K215.514.712.812.6 K39.61115.213.6 k1 5.07 4.87 4.10 4.70 k2 5.17 4.90 4.27 4.20 k3 3.20 3.67 5.07 4.53优水平A2B2C3 极差 R 1.97 1.230.970.50 主次顺序A、B、 C 因素主次为: A、 B、C,最优方案为:A2B2C3 即溶剂浓度取 80%,反应温度取 160℃,保温时间取1h。

而各因素的趋势图如下所示: 2.采用直接还原法制备超细铜粉的研究中,需要考察的影响因素有反应温度、 cu2+与氨水质量比和 CuSO4溶液浓度,并通过初步试验确定的因素水平如下表: 水平(A)反应温度 / ℃ 2+ (C)CuSO4溶液浓度 /(g/mL) (B)Cu 与氨水质量比 1701:0.10.125 2801:0.50.5 3901:1.5 1.0 试验指标有两个:( 1)转化率,越高越好;(2)铜粉松密度,越小越好。用正交表 L9(34 )安排试验,将 3 个因素依次放在 1,2,3 列上,不考虑因素间的交互作用, 9 次试验结果依次如下: 转化率 /%: 40.26,40.46, 61.79,60.15,73.97, 91.31,73.52, 87.19,97.26; 松密度 /(g/mL): 2.008,0.693,1.769,1.269,1.613,2.775,1.542,1.115,1.824。试用综合平衡法对结果进行分析,找出最好的试验方案。

大学物理实验数据处理基本方法

实验数据处理基本方法 实验必须采集大量数据,数据处理是指从获得数据开始到得出最后结 论的整个加工过程,它包括数据记录、整理、计算与分析等,从而寻找出 测量对象的内在规律,正确地给出实验结果。因此,数据处理是实验工作 不可缺少的一部分。数据处理涉及的内容很多,这里只介绍常用的四种方 法。 1列表法 对一个物理量进行多次测量,或者测量几个量之间的函数关系,往往 借助于列表法把实验数据列成表格。其优点是,使大量数据表达清晰醒目, 条理化,易于检查数据和发现问题,避免差错,同时有助于反映出物理量 之间的对应关系。所以,设计一个简明醒目、合理美观的数据表格,是每 一个同学都要掌握的基本技能。 列表没有统一的格式,但所设计的表格要能充分反映上述优点,应注意以下几点:1.各栏目均应注明所记录的物理量的名称(符号 )和单位; 2.栏目的顺序应充分注意数据间的联系和计算顺序,力求简明、齐全、有条理; 3.表中的原始测量数据应正确反映有效数字,数据不应随便涂改,确实要修改数据时, 应将原来数据画条杠以备随时查验; 4.对于函数关系的数据表格,应按自变量由小到大或由大到小的顺序排列,以便于判 断和处理。 2图解法 图线能够明显地表示出实验数据间的关系,并且通过它可以找出两个 量之间的数学关系,因此图解法是实验数据处理的重要方法之一。图解法 处理数据,首先要画出合乎规范的图线,其要点如下: 1.选择图纸作图纸有直角坐标纸 ( 即毫米方格纸 ) 、对数坐标纸和 极坐标纸等,根据 作图需要选择。在物理实验中比较常用的是毫米方格纸,其规格多为17 25 cm 。 2.曲线改直由于直线最易描绘 , 且直线方程的两个参数 ( 斜率和截距 ) 也较易算得。所以对于两个变量之间的函数关系是非线性的情形,在用图解法时 应尽可能通过变量代换 将非线性的函数曲线转变为线性函数的直线。下面为几种常用的变换方法。 ( 1) xy c ( c 为常数 ) 。 令 z 1,则 y cz,即 y 与 z 为线性关系。 x ( 2) x c y ( c 为常x2,y 1 z ,即 y 与为线性关系。

实验1-2常用的数据处理方法

常用的数据处理方法 实验数据及其处理方法是分析和讨论实验结果的依据。常用的数据处理方法有列表法、作图法、逐差法和最小二乘法(直线拟合)等。 列表法 在记录和处理数据时,常常将所得数据列成表。数据列表后,可以简单明确、形式紧凑地表示出有关物理量之间的对应关系;便于随时检查结果是否合理,及时发现问题,减少和避免错误;有助于找出有关物理量之间规律性的联系,进而求出经验公式等。 列表的要求是: (1)要写出所列表的名称,列表要简单明了,便于看出有关量之间的关系,便于处理数据。 (2)列表要标明符号所代表物理量的意义(特别是自定的符号),并写明单位。单位及量值的数量级写在该符号的标题栏中,不要重复记在各个数值上。 (3)列表的形式不限,根据具体情况,决定列出哪些项目。有些个别的或与其他项目联系不大的数据可以不列入表内。列入表中的除原始数据外,计算过程中的一些中间结果和最后结果也可以列入表中。 (4)表中所列数据要正确反映测量结果的有效数字。 列表举例如表1-2所示。 表1-2铜丝电阻与温度关系 铜丝电阻R / 作图法 作图法是将两列数据之间的关系用图线表示出来。用作图法处理实验数据是数据处理的常用方法之一,它能直观地显示物理量之间的对应关系,揭示物理量之间的联系。 1.作图规则 为了使图线能够清楚地反映出物理现象的变化规律,并能比较准确地确定有关物理量的量值或求出有关常数,在作图时必须遵守以下规则。 (1)作图必须用坐标纸。当决定了作图的参量以后,根据情况选用直角坐标纸、极坐标纸或其他坐标纸。 (2)坐标纸的大小及坐标轴的比例,要根据测得值的有效数字和结果的需要来定。原则上讲,数据中的可靠数字在图中应为可靠的。我们常以坐标纸中小格对应可靠数字最后一位的一个单位,有时对应比例也适当放大些,但对应比例的选择要有利于标实验点和读数。最小坐标值不必都从零开始,以便做出的图线大体上能充满全图,使布局美观、合理。 (3)标明坐标轴。对于直角坐标系,要以自变量为横轴,以因变量为纵轴。用粗实线在坐标纸上描出坐标轴,标明其所代表的物理量(或符号)及单位,在轴上每隔一定间距标明

物联网大数据分析实验室建设方案章鱼大数据

物联网大数据分析实验室建设方案 一、项目背景 “十三五”期间,随着我国现代信息技术的蓬勃发展,信息化建设模式发生根本性转变,一场以云计算、大数据、物联网、移动应用等技术为核心的“新 IT”浪潮风起云涌,信息化应用进入一个“新常态”。章鱼大数据为积极应对“互联网+”和大数据时代的机遇和挑战,适应经济社会发展与改革要求,开发建设物联网大数据平台。 物联网大数据平台打造集数据采集、数据处理、监测管理、预测预警、应急指挥、可视化平台于一体的大数据平台,以信息化提升数据化管理与服务能力,及时准确掌握社会经济发展情况,做到“用数据说话、用数据管理、用数据决策、用数据创新”,牢牢把握社会经济发展主动权和话语权。 二、物联网行业现状 数字传感器的大量应用及移动设备的大面积普及,才会导致全球数字信息总量的极速增长。根据工信部的统计结果,中国物联网产业规模在2011年已经超过2300亿元,虽然和期望的“万亿规模产业”还有一定距离,但已经不可小视。其中传感器设备市场规模超过900亿元,RFID产业规模190亿元,M2M终端数量也已超过2100万个。另一个方面,我国的物联网企业也呈现出聚集效应,例如北京中关村

已有物联网相关企业600余家,无锡国家示范区有608家,重庆、西安等城市也有近300家。从区域发展来看,形成了环渤海、长三角、珠三角等核心区以及中西部地区的特色产业集群。 在2009年以前,可能没有哪家企业说自己是物联网企业。一夜之间产生的上千家物联网企业,他们的核心能力、产品或服务价值定位、目标客户和盈利模式都是如何呢?首先来看这些物联网企业从哪里来。现在的物联网企业主要分为三类,第一类是以前的公用企业转型,最典型的是电信运营商,他们有自己的基础设施,有客户资源,因此自然转型到物联网行业。除了电信运营商,一些交通基础设施运营商、甚至是气象设施运营商,也都转型为物联网企业。第二类是传统IT企业,例如华为、神州数码,以及众多上市公司等。这一类公司也是在传统的优势积累基础上开拓物联网新业务。第三类是一些制造企业,包括传感设备制造企业,网络核心设备制造企业,还包括如家电等一批传统制造企业。这一类企业不能说没有大企业,但是绝大多数都是中小型企业。这些企业的核心能力主要体现在三个方面,第一是传感器和智能仪表,第二是嵌入式系统和智能装备,第三是软件与集成服务。 再来看我国物联网应用的领域。通过对多个部委和地区的物联网专项进行汇总,下图列出了目前提到最多,也是应用最成熟的八个领域。但是换个角度再看,不管是工业控制、供应链管理、精准农业,还是建筑自动化、远程抄表、ETC,其实都并不是新的技术领域,而是在物联网这个大概念下重新包装后再次引起了人们的兴趣。总的来

实验数据处理的几种方法

实验数据处理的几种方法 物理实验中测量得到的许多数据需要处理后才能表示测量的最终结果。对实验数据进行记录、整理、计算、分析、拟合等,从中获得实验结果和寻找物理量变化规律或经验公式的过程就是数据处理。它是实验方法的一个重要组成部分,是实验课的基本训练内容。本章主要介绍列表法、作图法、图解法、逐差法和最小二乘法。 1.4.1 列表法 列表法就是将一组实验数据和计算的中间数据依据一定的形式和顺序列成表格。列表法可以简单明确地表示出物理量之间的对应关系,便于分析和发现资料的规律性,也有助于检查和发现实验中的问题,这就是列表法的优点。设计记录表格时要做到:(1)表格设计要合理,以利于记录、检查、运算和分析。 (2)表格中涉及的各物理量,其符号、单位及量值的数量级均要表示清楚。但不要把单位写在数字后。 (3)表中数据要正确反映测量结果的有效数字和不确定度。列入表中的除原始数据外,计算过程中的一些中间结果和最后结果也可以列入表中。 (4)表格要加上必要的说明。实验室所给的数据或查得的单项数据应列在表格的上部,说明写在表格的下部。 1.4.2 作图法 作图法是在坐标纸上用图线表示物理量之间的关系,揭示物理量之间的联系。作图法既有简明、形象、直观、便于比较研究实验结果等优点,它是一种最常用的数据处理方法。 作图法的基本规则是: (1)根据函数关系选择适当的坐标纸(如直角坐标纸,单对数坐标纸,双对数坐标纸,极坐标纸等)和比例,画出坐标轴,标明物理量符号、单位和刻度值,并写明测试条件。 (2)坐标的原点不一定是变量的零点,可根据测试范围加以选择。,坐标分格最好使最低数字的一个单位可靠数与坐标最小分度相当。纵横坐标比例要恰当,以使图线居中。 (3)描点和连线。根据测量数据,用直尺和笔尖使其函数对应的实验点准确地落在相应的位置。一张图纸上画上几条实验曲线时,每条图线应用不同的标记如“+”、“×”、“·”、“Δ”等符号标出,以免混淆。连线时,要顾及到数据点,使曲线呈光滑曲线(含直线),并使数据点均匀分布在曲线(直线)的两侧,且尽量贴近曲线。个别偏离过大的点要重新审核,属过失误差的应剔去。 (4)标明图名,即做好实验图线后,应在图纸下方或空白的明显位置处,写上图的名称、作者和作图日期,有时还要附上简单的说明,如实验条件等,使读者一目了然。作图时,一般将纵轴代表的物理量写在前面,横轴代表的物理量写在后面,中间用“~”

实验设计与数据处理分析大作业(正交试验)

枣果皮中酚类物质提取工艺优化及抗氧化活性分析 1.实验数据背景叙述。 一:实验关于枣果皮中酚类物质提取工艺优化及抗氧化活性分析。酚类物质是植物体内重要的次生代谢产物,主要通过莽草酸和丙二酸途径合成,广泛分布于植物界。许多的酚类物质具有营养保健功效。现代流行病学研究证明,经常食用富含酚类物质的果蔬能够预防由活性氧导致的相关疾病如癌症、糖尿病、肥胖症等的发生。 二:实验问题:为提高枣果皮中的酚类物质的提取效率,该文以马牙枣为试验材料,对枣果皮中酚类物质提取条件进行了优化。同时分析枣果皮提取物中酚类物质的抗氧化活性。 三:实验目的:要通过实验得到枣果皮中酚类物质提取的最优条件。并对提取物中酚类物质清除DPPH,2,2'-连氮基双(3-乙基苯并噻唑啉)-6-磺酸(ABTS)自由基及铁还原能力进行探讨,同时与合成抗氧化剂2,6-二叔丁基对甲酚(BHT)的抗氧化能力进行比较。 2. 实验数据处理方法选择及论述。 一:单因素试验(获得数据,将数据输入excel中,使用excel绘制图表,以便直观感受影响因素对实验的影响趋势。)

以冻干枣果皮为材料,分别以甲醇浓度、提取温度、提取料液比和提取时 间作为因素,分析不同的提取条件对枣果皮中酚类物质提取效果的影响,检测 指标为提取物中总酚含量。 二:正交试验(设计正交试验以便获得到枣果皮中酚类物质提取的最优条件, 用excel进行结果直观分析,见表2。) 以冻干枣果皮为材料,以提取溶剂浓度(A)、提取温度(B)、料液比(C)、和浸提时间(D)作4 因素3水平的L9(34)正交设计(见表1),检测指标为 提取物中总酚含量。 表1 枣果皮中酚类物质提取因素水平表 三:统计分析 所有提取试验均重复3 次,每次提取液的测定均重复3 次。结果表示为平 均值±标准偏差。应用excel软件对所有数据进行方差分析。 3. 实验数据的处理的过程叙述。 一:在单因素试验中,将每次试验结果输入excel中,选中表格,点击“插入”柱形图。

大学物理实验数据处理方法总结

有效数字 1、有效数字不同的数相加减时,以参加运算各量中有效数字最末一位位数最高的为准,最后结果与它对其,余下的尾数按舍入规则处理。 2、乘除法以参与运算的数值中有效位数最少的那个数为准,但当结果的第1位数较小,比如1、2、3时可以多保留一位(较小:结果的第一位数小于 有效数字最少的结果第一位数)! 例如:n=tg56° θ=56° d θ=1° θθθθθ2cos d d d dtg dn == 为保留) (,带入848.156n 15605.018056cos 1cos 22=?=∴?=??=≈?=?= ?tg n θθπθθ 3、可以数字只出现在最末一位:对函数运算以不损失有效数字为准。 例如:20*lg63.4 可疑最小位变化0.1 Y=20lgx 01.04 .631.010ln 2010ln 20ln 10ln 20≈===x dx dx dx x d dy 04.364.63lg 20=∴ 4、原始数据记录、测量结果最后表示,严格按有效数字规定处理。(中间过程、结果多算几次) 5、4舍5入6凑偶 6、不估计不确定度时,有效数字按相应运算法则取位;计算不确定度时以不确定度的处理结果为准。 真值和误差 1、 误差=测量值-真值 ΔN=N-A 2、 误差既有大小、方向与政府。 3、 通常真值和误差都是未知的。 4、 相对约定真值,误差可以求出。 5、 用相对误差比较测量结果的准确度。 6、 ΔN/A ≈ΔN/N 7、 系统误差、随机误差、粗大误差 8、 随机误差:统计意义下的分布规律。粗大误差:测量错误 9、 系统误差和随机误差在一定条件下相互转化。 不确定度 1、P (x )是概率密度函数 dx P dx x x P p )x (之间的概率是测量结果落在+当x 取遍所有可能的概率值为1. 2、正态分布且消除了系统误差,概率最大的位置是真值A 3、曲线“胖”精密度低“瘦”精密度高。 4、标准误差:无限次测量?∞∞-=-2 )()(dx X P A X x )(σ 有限次测量且真值不知道标准偏

大学物理实验数据处理作业答案

路漫漫其修远兮,吾将上下而求索 - 百度文库 五、用分度值为0.01mm的一级千分尺测得钢球的直径为15.561mm、15.562mm、15.560mm、15.563mm、15.564mm 、15.560mm ,千分尺的零点读数为0.011mm ,试求钢球体积的测量结果。 解:数据列表 1 2 3 4 5 6 平均值 标准差 d'(mm) 15.561 15.562 15.560 15.563 15.564 15.560 15.562 0.00163 d(mm) 15.550 15.551 15.549 15.552 15.553 15.549 15.551 0.00163 肖维涅系数C6=1.73,0016.073.16?=?d S C 30028.0= d ’数据有效范围:下限:559.150028.0562.15=- 上限:565.150028.0562.15=+ 数据全部有效 mm d 551.15= mm S d u d a 0007.06/)(== 3/004.0)(=d u b =0.0023 220023.00007.0)(+=d u =0.0024mm 最终结果 330.196961 mm d V ==π 329.0)(21 )()(mm d u d d u d V V u ==??=π ()% 046.0%100) ()() 683.0(9.00.1969)(3=?==±=±=V V u V E P mm V u V V 六、利用单摆测重力加速度g,当摆角很小时有2 24T L g π= ,式中L 为摆长,T 为周期,它们的测量 结果用不确定度分别表示为:L =(97.69±0.02)cm (P=0.683);T =(1.9842±0.0002)s (P=0.683)试求重力加速度g 的测量结果。 解: 22 4T L g π==979.58m/s 2 T L g ln 2ln )4ln(ln 2-+=π, T dT L dL g dg 2-=

实验数据的处理

实验数据的处理 在做完实验后,我们需要对实验中测量的数据进行计算、分析和整理,进行去粗取精,去伪存真的工作,从中得到最终的结论和找出实验的规律,这一过程称为数据处理。实验数据处理是实验工作中一个不可缺少的部分,下面介绍实验数据处理常用的几种方法。 一、列表法 列表法就是将实验中测量的数据、计算过程数据和最终结果等以一定的形式和顺序列成表格。列表法的优点是结构紧凑、条目清晰,可以简明地表示出有关物理量之间的对应关系,便于分析比较、便于随时检查错误,易于寻找物理量之间的相互关系和变化规律。同时数据列表也是图示法、解析法的数值基础。 列表的要求: 1、简单明了,便于看出有关量之间的关系,便于处理数据。 2、必须注明表中各符号所代表的物理量、单位。 3、表中记录的数据必须忠实于原始测量结果、符合有关的标准和规则。应正确地反映测量值的有效位数,尤其不允许忘记未位为“0”的有效数字。 4、在表的上方应当写出表的内容(即表名) 二、图示法 图示法就是在专用的坐标纸上将实验数据之间的对应关系描绘成图线。通过图线可直观、形象地将物理量之间的对应关系清楚地表示出来,它最能反映这些物理量之间的变化规律。而且图线具有完整连续性,通过内插、外延等方法可以找出它们之间对应的函数关系,求得经验公式,探求物理量之间的变化规律;通过作图还可以帮助我们发现测量中的失误、不足与“坏值”,指导进一步的实验和测量。定量的图线一般都是工程师和科学工作者最感兴趣的实验结果表达形式之一。 函数图像可以直接由函数(图示)记录仪或示波器(加上摄影记录)或计算机屏幕(打印机)画出。但在物理教学实验中,更多的是由列表所得的数值在坐标纸上画成。为了保证实验的图线达到“直观、简明、清晰、方便”,而且准确度符合原始数据,由列表转而画成图线时,应遵从如下的步骤及要求: 1、图纸选择 依据物理量变化的特点和参数,先确定选用合适的坐标纸,如直角坐标纸、双对数坐标纸、单对数坐标纸、极坐标纸或其他坐标纸等。原则上数据中的可靠数字在图中也应可靠,数据中的可疑位在图中应是估计的,使从图中读到的有效数字位数与测量的读数相当。例如:作电阻R(Ω)与温度T(?C)的图时,可以选用直角坐标纸或单对数坐标纸作图。选择何种坐标纸要看需要,若

最新实验数据与处理大作业题目及答案

1、用Excel作出下表数据带数据点的折线散点图: (1)分别作出加药量和余浊、总氮T-N、总磷T-P、COD的变化关系图(共四张图,要求它们的格式大小一致,并以两张图并列的形式排版到Word中,注意调整图形的大小); (2)在一张图中作出加药量和浊度去除率、总氮T-N去除率、总磷T-P去除率、COD 去除率的变化关系折线散点图。

2、对离心泵性能进行测试的实验中,得到流量Q v 、压头H和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式。(要求作双Y轴图) 流量Qv、压头H和效率η的关系数据 序号 1 2 3 4 5 6 Q v(m3/h) H/m 0.0 15.00 0.4 14.84 0.8 14.56 1.2 14.33 1.6 13.96 2.0 13.65 η0.0 0.085 0.156 0.224 0.277 0.333 序号7 8 9 10 11 12

Q v(m3/h) H/m η 2.4 13.28 0.385 2.8 12.81 0.416 3.2 12.45 0.446 3.6 11.98 0.468 4.0 11.30 0.469 4.4 10.53 0.431 3、用荧光法测定阿司匹林中的水杨酸(SA),测得的工作曲线和样品溶液的数据如下表: (1)列出一元线性回归方程,求出相关系数,并给出回归方程的精度; (2)求出未知液(样品)的水杨酸(SA)浓度。 (1) C(SA)/μg.mL-10.50 1.00 1.50 2.00 3.00 1.75 1.80 F(荧光强度) 10.9 22.3 33.1 43.5 65.4 38.2 39.2

试验设计及数据分析第一次作业习题答案知识分享

试验设计及数据分析第一次作业习题答案

习题答案 1.设用三种方法测定某溶液时,得到三组数据,其平均值如下: 试求它们的加权平均值。 解:根据数据的绝对误差计算权重: 因为 所以 2.试解释为什么不宜用量程较大的仪表来测量数值较小的物理量。 答:因为用量程较大的仪表来测量数值较小的物理量时,所产生的相对误差较大。如 3.测得某种奶制品中蛋白质的含量为,试求其相对误差。解: 4.在测定菠萝中维生素C含量的测试中,测得每100g菠萝中含有18.2mg 维生素C,已知测量的相对误差为0.1%,试求每100g菠萝中含有维生素C的质量范围。 解:,所以 所以m的范围为 或依据公式

5.今欲测量大约8kPa(表压)的空气压力,试验仪表用1)1.5级,量程0.2MPa 的弹簧管式压力表;2)标尺分度为1mm的U型管水银柱压差计;3)标尺分度为1mm的U形管水柱压差计。 求最大绝对误差和相对误差。 解:1)压力表的精度为1.5级,量程为0.2MPa, 则 2)1mm汞柱代表的大气压为0.133KPa, 所以 3)1mm水柱代表的大气压:,其中,通常取 则 6.在用发酵法生产赖氨酸的过程中,对产酸率(%)作6次评定。样本测定值为3.48,3.37,3.47,3.38,3.40,3.43,求该组数据的算术平均值、几何平均值、调和平均值、标准差s、标准差、样本方差、总体方差、算术平均误差和极差。 解: 数据计算公式计算结果3.48 算术平均值 3.421667

7.A与B两人用同一种分析方法测定金属钠中的铁,测得铁含量()分别为: 分析人员A:8.0,8.0,10.0,10.0,6.0,6.0,4.0,6.0,6.0,8.0 分析人员B:7.5,7.5,4.5,4.0,5.5,8.0,7.5,7.5,5.5,8.0 试问A与B两人测定铁的精密度是否有显著性差异?() 解:依题意,检验A与B两人测定铁的精密度是否有显著性差异,采用F双侧检验。根据试验值计算出两种方法的方差以及F值: 3.37 几何平均值 3.421407 3.47 调和平均值 或 3.421148 3.38 标准样本差 0.046224 3.40 总体标准差 0.042197 3.43 样本方差0.002137 总体方差0.001781 算术平均误差0.038333 极差0.11

实验数据处理的几种方法

1.4 实验数据处理的几种方法 物理实验中测量得到的许多数据需要处理后才能表示测量的最终结果。对实验数据进行记录、整理、计算、分析、拟合等,从中获得实验结果和寻找物理量变化规律或经验公式的过程就是数据处理。它是实验方法的一个重要组成部分,是实验课的基本训练内容。本章主要介绍列表法、作图法、图解法、逐差法和最小二乘法。 1.4.1 列表法 列表法就是将一组实验数据和计算的中间数据依据一定的形式和顺序列成表格。列表法可以简单明确地表示出物理量之间的对应关系,便于分析和发现资料的规律性,也有助于检查和发现实验中的问题,这就是列表法的优点。设计记录表格时要做到:(1)表格设计要合理,以利于记录、检查、运算和分析。 (2)表格中涉及的各物理量,其符号、单位及量值的数量级均要表示清楚。但不要把单位写在数字后。 (3)表中数据要正确反映测量结果的有效数字和不确定度。列入表中的除原始数据外,计算过程中的一些中间结果和最后结果也可以列入表中。 (4)表格要加上必要的说明。实验室所给的数据或查得的单项数据应列在表格的上部,说明写在表格的下部。 1.4.2 作图法 作图法是在坐标纸上用图线表示物理量之间的关系,揭示物理量之间的联系。作图法既有简明、形象、直观、便于比较研究实验结果等优点,它是一种最常用的数据处理方法。 作图法的基本规则是: (1)根据函数关系选择适当的坐标纸(如直角坐标纸,单对数坐标纸,双对数坐标纸,极坐标纸等)和比例,画出坐标轴,标明物理量符号、单位和刻度值,并写明测试条件。 (2)坐标的原点不一定是变量的零点,可根据测试范围加以选择。,坐标分格最好使最低数字的一个单位可靠数与坐标最小分度相当。纵横坐标比例要恰当,以使图线居中。 (3)描点和连线。根据测量数据,用直尺和笔尖使其函数对应的实验点准确地落在相应的位置。一张图纸上画上几条实验曲线时,每条图线应用不同的标记如“+”、“×”、“·”、“Δ”等符号标出,以免混淆。连线时,要顾及到数据点,使曲线呈光滑曲线(含直线),并使数据点均匀分布在曲线(直线)的两侧,且尽量贴近曲线。个别偏离过大的点要重新审核,属过失误差的应剔去。 (4)标明图名,即做好实验图线后,应在图纸下方或空白的明显位置处,写上图的名称、作者和作图日期,有时还要附上简单的说明,如实验条件等,使读者一目了然。

【实验室】大数据实验室解决方案 -2020版本

实验室 https://www.360docs.net/doc/7d9782893.html, 精品资源 极简方案智能助手 实训无忧大数据智能实验室解决方案

产品概述 锐捷大数据智能实验室立足于当前大数据时代背景,深入研究高校大数据教学实训场景,深挖教学需求,自主研发的一款集教学、实验、实训、培训、测评、学情分析于一体的大数据专业教学产品。产品融合业界前沿的云计算、大数据、人工智能技术,通过对接大数据产业人才需求和高校大数据人才培养方案,平台提供了大数据教学管理、实验实训环境、技能评测模块、岗位胜任力分析等功能。 平台采用云平台(Docker)模式和客户端(VM)模式相融合的方案,全面满足不同院校教学需求,同时,平台融合应用AI技术,显著提升大数据教学和学习效率。 建设目标 锐捷大数据智能实验室,全面落实“产、学、研、训”一体化的思想,从教学、实训和科研应用等方面,培养行业特色和专业的人才,并做出相应的科研成果。 具体目标是: 深度对接产业用人需求和高校人才培养目标,制定特色大数据人才培养方案; 提供一套一流的大数据教学、实训和科研的平台环境,帮助师生提高大数据学习和科研的效率和成果; 配备完善课程体系、丰富的课程资源、真实的行业案例以及海量的数据资源,帮助师生夯实的大数据技术的学习和应用; 借助大数据教学实训平台、配套资源、资深大数据讲师团队,加强对骨干教师、学科带头人的培养,以及科研、学术交流等合作工作,加快师资队伍的建设步伐; 对接企业大数据真实项目,企业导师导师驻校开展项目式大数据实训,帮助学生无缝掌握企业用人标准,提升就业竞争力; 人才岗位

业务应用 用户功能 特色功能 A.人工智能教学与实训 B.大数据教学与实训 C.云计算教学与实训 课程资源管理 | 学生管理 | 教师管理权限管理 | 账号管理 | 教学资源更新 管理员 教师 学生 排课管理 | 课程管理 | 测评管理实验管理 | 过程监控 | 实验报告管理实验督导 | 视频管理 | 学情分析课程自定义 AI实验帮手AI督导助手AI学情分析 实验进度看板与详情 实验进度智能提醒登录状态 | 实验进度 督导提醒 | 学习效率AI测评助手 试题配置 | 测评计划发布 | 成绩管理自动评分(客观题、程序题、实操题)测评训练 | 测评考试 | 成绩查询 学习成绩分析 | 学习行为分析综合能力分析 | 学生画像技能提升路径 课程学习 | 视频学习实验操作 | 实验报告测评考试 | 技能训练成绩跟踪 | 互动交流 教学服务 专业建设服务 实训周服务 系统功能

大数据技术实验室建设探索与研究

龙源期刊网 https://www.360docs.net/doc/7d9782893.html, 大数据技术实验室建设探索与研究 作者:王振华洪泓陈春丽 来源:《电脑知识与技术》2017年第12期 摘要:该文分析了大数据技术的前景与重要性,高校建设大数据实验室的意义和必要性。大数据技术是以数据存储、加工、分析为主,向企业或单位提供决策和预测。该文同时探讨了高校大数据技术课程体系,从科学研究和工程项目两个方向,分别设置相关课程。针对大数据技术实验室建设的几个关键要素进行分析,包括实验室基础平台建设,实验室队伍建设,数据资源建设等。 关键词:大数据;实验室建设;机器学习 信息技术与经济社会的快速发展促进了数据量的爆发性增长,数据已成为国家基础性战略资源。利用数据辅助决策、合理配置资源,将是未来企业创造价值的重要方法,也是未来新兴产业创建的重要依据。国家从战略的角度,已经开始重视大数据的发展。2015年8月31日,国务院印发了《促进大数据发展行动纲要》系统部署大数据发展工作。2016年12月18日工业和信息化部印发《大数据产业发展规划(2016-2020年)》。随着大数据技术的快速发展,对该类人才的培养也逐步成为高校信息技术教学的重要内容。 大数据技术数据分析处理是从数据中挖掘关键信息,达到辅助决策,提升运作效率的目标。大数据技术目前在各个行业和跨行业之间存在广泛的应用空间,其重要的应用之一,是预测性分析,从数据中挖掘出特点,建立模型,迭代验证,确立模型,最终实现预测。其中数据分析包括检查、清洗、转换和建模等方法,即根据特定目标,对数据进行收集与存储,数据筛选,算法分析与预测,提出有建设性的意见,进而辅助决策。 大数据技术包含两个方面,即数据存储技术和计算分析技术。存储技术包括非结构化数据收集架构,数据分布式存储集群,MPP架构的新型数据库集群等。大数据中常用的分析技术有:关联规则挖掘、聚类、遗传算法、自然语言处理、神经网络、优化、模式识别、预测模型等。 1大数据课程体系 目前,高校大数据相关专业没有统一的课程体系,大数据技术相关的课程比较多。根据其应用的侧重点不同,可将大数据技术课程体系分为科学研究型和工程项目型两类。具体课程体系见下表1。 2大数据技术实验室建设理念 在高校培养大数据人才,利用高等学校的多学科优势建立大数据技术实验室尤为必要,不仅可以服务于高校的教学和科研,通过大数据技术的科研与实验,使学生掌握主流的大数据存

实验数据的记录和处理

讲座 实验误差及数据处理 教学要求 1、了解实验误差及其表示方法; 2、掌握了解有效数字的概念,熟悉其运算规则; 3、初步掌握实验数据处理的方法。 重点及难点 重点:实验误差及其表示方法;有效数字;实验数据处理。 难点:有效数字运算规则;实验数据的作图法处理。 教学方法与手段 讲授,ppt演示。 教学时数 4学时 教学内容 引言 化学实验中经常使用仪器对一些物理量进行测量,从而对系统中的某些化学性质和物理性质作出定量描述,以发现事物的客观规律。但实践证明,任何测量的结果都只能是相对准确,或者说是存在某种程度上的不可靠性,这种不可靠性被称为实验误差。产生这种误差的原因,是因为测量仪器、方法、实验条件以及实验者本人不可避免地存在一定局限性。 对于不可避免的实验误差,实验者必须了解其产生的原因、性质及有关规律,从而在实验中设法控制和减小误差,并对测量的结果进行适当处理,以达到可以接受的程度。 一、误差及其表示方法 1.准确度和误差 ⑴准确度和误差的定义 准确度是指某一测定值与“真实值”接近的程度。一般以误差E表示, E=测定值-真实值 当测定值大于真实值,E为正值,说明测定结果偏高;反之,E为负值,说明测定结果偏低。误差愈大,准确度就愈差。 实际上绝对准确的实验结果是无法得到的。化学研究中所谓真实值是指由有经验的研究人员同可靠的测定方法进行多次平行测定得到的平均值。以此作为真实值,或者以公认的手册上的数据作为真实值。 ⑵绝对误差和相对误差 误差可以用绝对误差和相对误差来表示。 绝对误差表示实验测定值与真实值之差。它具有与测定值相同的量纲。如克、毫升、百分数等。例如,对于质量为0.1000g的某一物体。在分析天平上称得其质量为0.1001g,则称量的绝对误差为+0.0001g。 只用绝对误差不能说明测量结果与真实值接近的程度。分析误差时,除要去

相关文档
最新文档