2012数学建模A题论文:葡萄酒的评价

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员(打印并签名) :1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):

全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价

摘要

葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。

本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。对于本题,我们主要采用SPSS软件对模型进行求解。

针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。最后,我们通过T检验,在SPSS中可其相应的标准差,通过比较标准差来确定哪个组更可靠。

针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法,在SPSS中实现对酿酒葡萄的分类。

针对问题三,首先,我们利用SPSS计算出酿酒葡萄与葡萄酒的理化指标的相关系数。由于葡萄的理化指标较多,通过整理数据,在Excel中得到某个葡萄酒的理化指标与若干个酿酒葡萄的理化指标的相关系数,并且规定相关系数大于等于0.6表示两者相关性显著;最后,在SPSS中分别求出回归方程。

针对问题四,首先利用SPSS分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后通过分析其相关系数,分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。

关键词:SPSS T检验聚类分析法相关系数回归分析原理相关分析原理偏相关系数 EXCEL 判别分析

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄

和葡萄酒的理化指标来评价葡萄酒的质量?

二、问题分析

2.1针对问题一,我们将它分成两个问题去解决

1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在SPSS 中利用T检验去判断。在这之前,我们对附录1中数据进行处理,利用excel 分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。

2、针对问题一中选择哪组结果更加可靠,我们利用SPSS求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差,从而确定出第几组的结果更可靠。

2.2针对问题二

首先我们将附录2和附录3中的一些数据进行了处理(例如:求平均值),然后通过聚类分析的原理,在SPSS实现对酿酒葡萄的分类。

2.3针对问题三,我们分两个问题去解决

1、针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,我们先计算酿酒葡萄和葡萄酒理化指标之间的相关系数,通过SPSS实现。由于酿酒葡萄的理化指标远远多于葡萄酒的理化指标,通过整理数据,在excel中得到一个葡萄酒的理化指标与多个酿酒葡萄的理化指标之间的相关系数的数据。规定两者的相关系数大于0.6(酿酒红葡萄与红葡萄酒的理化指标)时,认为两者的相关性显著。从而筛选出与葡萄酒理化指标相关性显著的酿酒葡萄的理化指标。

2、针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,最后我们利用上面整理好的数据,采用回归分析原理,在SPSS中得到酿酒葡萄与葡萄酒的理化指标之间的联系。

2.4针对问题四

首先我们知道,葡萄酒的理化指标若理想,葡萄酒的质量就较高;但葡萄的理化指标理想,葡萄酒的质量不一定高。因此我们在SPSS中,运用相关分析,分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后通过对相关系数的比较,分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。从而论证葡萄和葡萄酒的理化指标能否评价葡萄就的质量。

三、基本假设

1、假设制作葡萄酒的工艺是一样且稳定的;

2、假设两组评酒员是随机分配的;

3、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的;

4、假设酿造葡萄酒的环境是相同的;

5、假设酿酒葡萄与葡萄酒中的芳香物质主要成分是:低醇、酯类、苯等,其余

成份忽略;

6、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;

7、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可

酿制白葡萄酒;

8、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质

量;

9、假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄

不一定能酿制成质量高的葡萄酒;

10、假设本文所引用的数据、资料均真实可靠。

四、符号说明

x i1——第一组每种红葡萄酒的平均得分

y

i1

——第二组每种红葡萄酒的平均得分

x i2——第一组每种白葡萄酒的平均得分

y

i2

——第二组每种白葡萄酒的平均得分

1-y

1

——两组红葡萄酒平均数之差

x2-y

2

——两组白葡萄酒平均数之差

r z xy,——是控制了z条件下,x,y之间的偏相关系数

r z z xz21,——是控制了z1,z2条件下,x,y之间的偏相关系数

r xy——是变量x,y之间的简单相关系数(零阶相关系数)

r xz,r yz——分别是变量x,z之间和y,z之间的简单相关系数r——特定的偏相关系数

n——观测值个数

k——控制变量个数

n-k-2——自由度

五、模型建立与求解

5.1两组评酒员的评价结果有无显著性差异,选择哪一组更可靠

5.1.1两组评酒员的评价结果有无显著性差异——配对样本的T检验

1.1配对样本T检验的概念

若实验设计是将条件、性质相同或相近的两个供试单元配成一对,并设有多个配对,然后对每一个配对的两个供试单元分别随机的基于不同处理,这样的实验叫做配对实验。它的特点是配成对子的两个试验单元的非处理条件尽量

一致,不同对子的试验单元之间的非处理条件允许有差异,每一个对子就是试验处理的一个重复。

SPSS 配对样本的T 检验主要解决来自配对样本数据的两个总体均值有否显著差异的问题。所谓配对样本,通常是指对同一观察对象在使用某种新方法的有效性。配对样本的T 检验对数据的要求:

(1)是抽取样本数据的两个总体必须服从正态分布。 (2)两个样本的样本容量相同。 1.2建立模型:

1.基本数学原理: 成对样本的均值比较t 检验,假设这两个样本之间的均值差异为零,用于检验的统计量为:

t=)

1(/]

)([)

(1

2

1

2

--

---∑∑==n n n

n

i n

i i

i i

i

y x y x

(式中,n-1为自由度,n 为数据对数) 2.建立检验假设:

0:,0:10≠=d d H H μμ (其中μd

为均值差异)其假设的意义为,当

差异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试验方法在发生作用或有效。

1.3模型求解:

(1)在SPSS 中对两组红葡萄酒质量的平均值运行配对样本的T 检验,得到如下图一所示:

图一

对表中的分析结论表明:两个样本平均数分别为73.056、70.515 ,相关系数为0.700 ,T检验的临界值为2.458 。我们可以得到检验结论为:拒绝原假设H0,即可认为两组评酒员对红葡萄酒的评价结果有显著性差异。

(2)用同样的方法对两组白葡萄酒质量的平均值运行配对样本的T检验,如图二所示,我们得到的检验结果是:两组评酒员对白葡萄酒的评价结果有显

著性差异。

图二

综合(1)、(2)我们得到的结果是:两组评酒员的评价结果有显著性差异。 5.1.2 结果可靠性的选则 通过对5.1.1的解答,我们可以清楚的看到第一组、第二组红葡萄酒质量的平均值的标准差分别是:7.3426、3.9780。第一组、第二组白葡萄酒质量的平均值的标准差分别是:5.201、3.1709。

通过比较我们得到的结果是:第二组评酒员的评价结果更可信。

5.2 根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级——聚类分析-分层聚类-凝聚法

1.聚类分析的概念

聚类分析是根据事物本身的特性研究个体分类的方法。在这里我们采用分层聚类中的凝聚法,即聚类开始把参与聚类的每个个体视为一类,根据两类之间的距离或相似性逐步合并,直到合并为一个大类为止。

2.建立模型:

(1)将所要分析的数据转变为矩阵: a a a a a a a a a np

n n p p 212222111211............(其中a ij

表示样品i 的第j 个指标)

(2)写出样品间的距离矩阵 D 1 (欧氏距离为例)

d(a a j

i ,)=∑=-

p

k a a jk ik

1

2

)

(

a i =(a i 1

, ,a

ip

)’ a j

=(a j 1, ,a jp )’ (3)将每一个样品看作一个类,即为:G 1,G 2,……G n ,

观察比较),(G G j i D 哪个最小,将G G j i ,聚为一类,计算新类与其余各类

之间的距离,得到新距离矩阵D2。

(4)依此类推,最终将样品G1,G2,……G n分出类来。

3.模型求解:

(1)对酿酒红葡萄进行分类:

在SPSS中运行聚类分析的程序,得到如下图表:

Cluster Membership

Case

4 Clust ers

1:葡萄样品1 1 2:葡萄样品2 1 3:葡萄样品3 2 4:葡萄样品4 3 5:葡萄样品5 3 6:葡萄样品6 3 7:葡萄样品7 3 8:葡萄样品8 1 9:葡萄样品9 1 10:葡萄样品10 3 11:葡萄样品11 4 12:葡萄样品12 3 13:葡萄样品13 3 14:葡萄样品14 3 15:葡萄样品15 3 16:葡萄样品16 3 17:葡萄样品17 3 18:葡萄样品18 3 19:葡萄样品19 3 20:葡萄样品20 3 21:葡萄样品21 2 22:葡萄样品22 3 23:葡萄样品23 1 24:葡萄样品24 3 25:葡萄样品25 3 26:葡萄样品26 3 27:葡萄样品27 3

聚类分析图示(一)

根据图表内容,将酿酒红葡萄分为4类:

(2)对酿酒白葡萄进行分类:

同3(1),在SPSS中运行程序,得到如下图表(详见附录一):Cluster Membership

Case

4 Clus ters

1:葡萄样品1 1 2:葡萄样品2 1

3:葡萄样品3 1

4:葡萄样品4 1

5:葡萄样品5 1

6:葡萄样品6 1

7:葡萄样品7 1

8:葡萄样品8 2

9:葡萄样品9 1

10:葡萄样品10 3

11:葡萄样品11 1

12:葡萄样品12 4

13:葡萄样品13 3

14:葡萄样品14 4

15:葡萄样品15 1

16:葡萄样品16 2

17:葡萄样品17 1

18:葡萄样品18 1

19:葡萄样品19 2

20:葡萄样品20 1

21:葡萄样品21 1

22:葡萄样品22 2

23:葡萄样品23 1

24:葡萄样品24 3

25:葡萄样品25 2

26:葡萄样品26 1

27:葡萄样品27 3

28:葡萄样品28 1

根据图表内容,将酿酒白葡萄分为4类:

5.3 分析酿酒葡萄与葡萄酒的理化指标之间的联系

5.3.1 计算酿酒葡萄与葡萄酒的理化指标的相关系数—偏相关系数

1.偏相关的有关概念

在研究多个变量之间的相关关系时,由于变量间常常是相互影响的,因而两个变量间的简单相关(直线相关)系数往往不能正确确定两个变量间的真正关系,有时甚至是假象。只有在排除其他变量影响的情况下,计算它们之间的偏相关系数(partial correlation coefficient),才能真正地解释他们之间的内在联系。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时,分别同因变量线性相关程度指标。偏相关系数的取值范围亦在-1到+1之间。

2.建立模型

(1)偏相关系数的计算公式:

当有一个控制变量z 时,变量x 与y 的偏相关公式(或称零阶相关系数)为:

r

z

xy ,=

()()

r r r r r

yz

xz

yz

xz xy

2

2

11---

当有两个控制变量z 1,z 2时,变量x 与y 的偏相关公式如下:

r

z z xy 2

1,=

()()

r

r r

r r z yz z xz z yz z

xz z xy 221

21

2121

21

11?????---

(2)对相关系数的检验方法

再偏相关分析中,由于两个变量之间相关系数是在固定(控制)了一个或某几个变量后进行的,考虑到这种因素及抽样误差的影响,其检验统计量为:

t =

r

k n r

2

12

---

3.模型求解:

(1)分析酿酒红葡萄与红葡萄酒的理化指标之间的偏相关系数:

通过SPSS ,利用相关分析,计算出酿酒红葡萄与红葡萄酒的理化指标之间的相关系数,如表:

酿酒葡萄与葡萄酒的理化指标之间的相关系数--红葡萄

我们规定两者的相关系数绝对值大于0.6时,认为两者的相关性显著。从而筛选出与红葡萄酒理化指标相关性显著的酿酒红葡萄的理化指标。

从表中可以发现:

○1酿酒红葡萄中的花色苷、苹果酸、褐变度、总酚、单宁与红葡萄酒中的花色苷的相关性较为显著;

○2酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮与红葡萄酒中的单宁的相关性较为显著;

○3酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮与红葡萄酒中的总酚的相关性显著;

○4酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮与红葡萄酒中的酒总黄酮的相关性显著;

○5酿酒红葡萄中葡萄总黄酮与红葡萄酒中白藜芦醇的相关性显著;

○6酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁与葡萄酒中的DPPH 半抑制积的相关性显著;

○7酿酒红葡萄中花色苷、DPPH自由基、总酚、单宁葡萄总黄酮与红葡萄酒中色泽L*呈现较大相关性;

8酿酒红葡萄中苹果酸与红葡萄酒色泽A*的相关性较为显著; ○

9酿酒红葡萄中还原糖与红葡萄酒色泽B*的相关性较为显著。 (2)分析酿酒白葡萄与白葡萄酒的理化指标之间的联系:

同上,通过SPSS ,利用相关分析,计算出酿酒白葡萄与白葡萄酒的理化指标之间的相关系数,如表(见附录二):

我们规定两者的相关系数绝对值大于0.5时,认为酿酒白葡萄中的某项理化指标与白葡萄酒中的某种成分的相关性显著。从而筛选出与白葡萄酒理化指标相关性显著的酿酒白葡萄的理化指标。

我们发现:

1酿酒白葡萄中的单宁、葡萄总黄酮与白葡萄酒中的单宁的相关性显著; ○2酿酒白葡萄中的单宁、葡萄总黄酮、总酚与白葡萄酒中的总酚的相关性显著;

3酿酒白葡萄中的蛋白质、总酚、葡萄总黄酮与白葡萄酒中的酒总黄铜的相关性显著;

4酿酒白葡萄中的可溶性固形物、干物质含量与白葡萄酒中的色泽L*的相关性显著;

5酿酒白葡萄中的果梗比、果穗与白葡萄酒中的色泽A*的相关性显著; ○

6酿酒白葡萄中的可溶性固形物、干物质含量、出汁率与白葡萄酒中的色泽B*的相关性显著。

5.3.2分析酿酒葡萄与葡萄酒的理化指标之间的联系———回归分析模型(多元线性回归)

1.多元线性回归分析概念

多元线性回归分析是多元回归分析(multiple regression analysis )中最为简单而又最常用的一种分析方法。其原理与直线回归分析的完全相同,但是要涉及到一些新概念,在计算上要复杂得多,当自变量较多时要借助于电脑进行计算。许多非线性回归(no-linear regression )问题都可转变为线性回归来解决。进行多元线性回归分析的基本任务是根据各自变量的实现观察值建立依变量与各自变量之间的线性回归方程,以揭示依变量与各自变量之间的具体线性联系形式,其目的在于所建立的线性回归方程进行预测和控制。

2.模型建立

(1)多元线性回归方程的建立

设变量αααm ,,,21 ,β有n 组观察数据,其中αααm ,,,21 为自变量,

β

为依变量。第k 组观察值(k =1,2,n , )可表示为(

αα

αm k k

k

,,,21 ,

β

k

),是m +1维空间中的一个点。 如果依变量β同时受到m 个自变量

α

ααm

,,,2

1

的影响,且这m 个自变

量都与β成线性关系,则这m +1个变量的关系就形成m 元线性回归。因此,一个m 元线性回归的数学模型为

εαααβk mk m k

k

k

a a a a +++++= 22

11

()

n k

,,2,1 =

式中,a

a a a m

,,,,210 为1+m 个待估参数;

α

ααm

,,,2

1

为可精确测

量或可控制的一般变量,也可以是可观察的随机变量;βk

为可以观察的随机

变量,随

α

ααm

,,,2

1

而变,并受实验误差影响;

ε

k

为随机变量,相互独立,

且服从同一正态分布N (0,

δ

2

) 。

一个m 元线性回归方程可给定为:β?=αα

αm m b b b b ++++ 2

2

1

1

(式中,b b b b m ,,,,210 是a a a a m ,,,,210 的最小二乘法。)

3.模型求解

3.1红葡萄的理化指标与红葡萄酒的理化指标的回归分析

(1)在SPSS 中,利用回归分析,计算出酿酒红葡萄中的花色苷、苹果酸、褐变度、总酚、单宁与红葡萄酒中的花色苷的多元线性回归方程(SPSS 的分析结果见附录三):

y

?1

=-33.887+1.718x 1+8.474x 2+0.116x 3-2.263x 4+4.73x 5 (2)同理,我们在SPSS 中得到其他酿酒红葡萄与红葡萄酒的理化指标的多元线性回归方程:

y

?2

=0.814+0.04x 1+0.262x 4+0.088x 5+6.689x 6-0.169x 7 y ?3=1.333+0.008x 1+0.098x 4+0.035x 5+3.359x 6+0.119x 7 y ?4=-0.254+0.06x 1+0.25x 4+0.05x 5-1.729x 6+0.162x 7 y ?5=0.87+0.336x 7

y ?6=-0.41+6.115exp(-5)x 1+0.13x 4+0.02x 5+0.118x 6 y ?7=79.106-0.127x 1-0.911x 4-0.271x 5-41.146x 6+0.812x 7 y ?8=60.2+60.2x 2 y

?9

=-6.246+0.125x 8

(y ?1

:酒-花色苷

y

?2

:酒-单宁 y ?3

:酒-总酚 y ?4

:酒-黄酮 y

?5

:酒-白藜芦醇 y ?6

:酒-DPPH y ?7

:酒-果皮颜色L* y

?8

:酒-果皮颜色A* y ?9

:酒-果皮颜色B* x 1:花色苷 x 2:苹果酸 x 3:褐变度 x 4

:总酚 x 5:单宁 x 6:DPPH x 7:黄酮 x 8

:还原糖)

3.2白葡萄的理化指标与白葡萄酒的理化指标的回归分析

同 3.1,我们也利用回归分析,得到酿酒白葡萄与白葡萄酒的理化指

标的多元线性回归方程:

h

?1=0.856+0.178n 1+0.086n 2

h

?2=0.717+0.108n 1

+0.109n 2

+0.011n 3

h?3=-5.296+0.056n2+0.372n3+0.009n4

h?4=104.922-0.004n5-0.099n6

h?5=-0.455-0.095n7+0.001n8

h?6=4.692+0.009n5-0.211n6-0.113n9

(n1:单宁n2:葡萄总黄酮

n3:总酚n4:蛋白质

n5:可溶性固形物n6:干物质含量

n7:果梗比n8:果穗

n9:出汁率

h?1:酒-单宁h?2:酒-总酚

h?3:酒-酒总黄酮h?4:酒-果皮颜色l*

h?5:酒-果皮颜色a* h?6:酒-果皮颜色b*)

5.4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

5.4.1利用相关分析原理,算出酿酒葡萄的理化指标与葡萄酒质量的偏相关系数,分析分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。

1.模型建立

与5.3.1的大致相同。

2. 模型求解

(1)葡萄酒的理化指标与葡萄酒质量的相关系数

1

其余都与红葡萄酒的质量有正相关,尤其是单宁、总酚、酒总黄酮、白藜芦醇、DPPH半抑制体积。由此可以分析出,红葡萄酒的理化指标对红葡萄酒的质量有

较大的影响。

2

对较小,即白葡萄酒中的理化指标和白葡萄酒的质量的相关性不是很显著。由此可以分析出,与红葡萄酒的相关系数相比,白葡萄酒中的理化指标对白葡萄酒的质量的影响较小。

(2)葡萄的理化指标与葡萄酒质量的相关系数

○1红葡萄的理化指标与葡萄酒质量的相关系数

对SPSS计算结果中的相关系数的分析,在红葡萄的理化指标中,有些与红葡萄酒的质量成正相关,像蛋白质、DPPH自由基、总酚、葡萄总黄酮、PH值与红葡萄酒的质量有显著的相关性,但其余成分的相关性不明显;也有一些与红葡萄酒的质量成负相关,但只有个别与其相关性显著。由此可以分析出,与红葡萄酒的理化指标对红葡萄酒的质量的影响,红葡萄的理化指标对红葡萄酒的质量没有明显的影响。

○2白葡萄的理化指标与葡萄酒质量的相关系数

对SPSS计算结果中的相关系数的分析,在白葡萄的理化指标中,只有极少数的指标与酒的质量相关性显著。因此类似上面的结论,白葡萄的理化指标对白葡萄酒的质量没有明显的影响。

5.4.2 利用5.4.1的相关结论,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

(1)通过分析5.4.1中葡萄酒的理化指标与葡萄酒质量的相关系数,可以发现葡萄酒的理化指标与葡萄酒的质量相关性显著,可以认为能够用葡萄酒的理化指标来评价葡萄酒的质量是比较客观的。

(2)通过分析5.4.1中葡萄的理化指标与葡萄酒质量的相关系数,可以发现葡萄的理化指标与葡萄酒的质量相关性很低,可以认为不能够用葡萄的理化指标来评价葡萄酒的质量。

六、结果分析、验证与模型检验及修正

本文主要应用数理统计、多元回归分析、相关分析、聚类分析以及判别分析等知识。根据数理统计知识,我们利用SPSS进行数据处理研究,判断出两组评酒员的评酒结果有显著性差异,并选择出数据较为可靠的一组。根据聚类分析、判别分析对数据处理研究,基本得到需要的答案。但依旧存在很多不足之处:(1)假设评酒员对每种葡萄酒的评价结果大致符合正太分布;

(2)假设酿造葡萄酒的环境是相同的;

(3)只考虑低醇、酯类、苯等芳香物质影响酒的香气,忽略了其他成分的

影响。

七、模型的推广

本文利用聚类分析、判别分析对给定的数据进行处理,在SPSS中实现等级的划分。该模型用于生活实践中,也可以解决很多实际问题,例如医学实践中根据各种化验结果、疾病症状、体征判断患者患的是什么病;体育选材中根据运动员的体形、运动成绩、生理指标心理素质指标、遗传因素判断是否选入运动队继续培养,等等。它在生活中有广泛的适用性。

八、模型的评价

8.1模型的优点

本文首先依据数理统计的相关知识,在SPSS中对两组数据进行T检验,快速而又直观地看出两组数据是否有显著差异性。其次,本文也利用多元回归分析、相关分析把较庞大的数据变得较直观、简洁,便于处理问题。

8.2模型的缺点

但是限于题目所给数据的不足和存在的误差,模型建立所假设的稳定条件以及现实中偶然因素的发生,在实际中需要进行合理的调整。

九、参考文献

[1] 孙祝岭徐晓岭,数理统计,北京:高等教育出版社,2009;

[2] 茆诗松王静龙,数理统计,上海:华东师范大学出版社,1990;

[3] 沈学桢,现代数据分析技术,上海:立信会计出版社,2005;

[4] 卢纹岱,统计分析,北京:电子工业出版社,2000;

[5] 王颉,试验设计与SPSS应用,北京:化学工业出版社,2007;

[6] 袁志发,周静芋,多元统计分析,北京:科学出版社,2002。

十、附录

附录一:在SPSS中运行聚类分析的程序,对酿酒白葡萄进行分类;

Agglomeration Schedule

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2

1 4 21 .566 0 0 4

2 5 20 .726 0 0 15

3 10 2

4 .742 0 0 18

4 4 23 .771 1 0 12

5 1 11 .901 0 0 14

6 2 15 1.003 0 0 17

7 6 18 1.095 0 0 10

8 12 14 1.105 0 0 25

9 8 16 1.273 0 0 22

10 6 7 1.297 7 0 17

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3.

指导教师或指导教师组负责人(打印并签名): ?(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

全国数模竞赛优秀论文

一、基础知识 1.1 常见数学函数 如:输入x=[-4.85 -2.3 -0.2 1.3 4.56 6.75],则: ceil(x)= -4 -2 0 2 5 7 fix(x) = -4 -2 0 1 4 6 floor(x) = -5 -3 -1 1 4 6 round(x) = -5 -2 0 1 5 7 1.2 系统的在线帮助 1 help 命令: 1.当不知系统有何帮助内容时,可直接输入help以寻求帮助: >>help(回车) 2.当想了解某一主题的内容时,如输入: >> help syntax(了解Matlab的语法规定) 3.当想了解某一具体的函数或命令的帮助信息时,如输入: >> help sqrt (了解函数sqrt的相关信息)

2 lookfor命令 现需要完成某一具体操作,不知有何命令或函数可以完成,如输入: >> lookfor line (查找与直线、线性问题有关的函数) 1.3 常量与变量 系统的变量命名规则:变量名区分字母大小写;变量名必须以字母打头,其后可以是任意字母,数字,或下划线的组合。此外,系统内部预先定义了几个有特殊意 1 数值型向量(矩阵)的输入 1.任何矩阵(向量),可以直接按行方式 ...输入每个元素:同一行中的元素用逗号(,)或者用空格符来分隔;行与行之间用分号(;)分隔。所有元素处于一方括号([ ])内; 例1: >> Time = [11 12 1 2 3 4 5 6 7 8 9 10] >> X_Data = [2.32 3.43;4.37 5.98] 2 上面函数的具体用法,可以用帮助命令help得到。如:meshgrid(x,y) 输入x=[1 2 3 4]; y=[1 0 5]; [X,Y]=meshgrid(x, y),则 X = Y =

美国大学生数学建模竞赛优秀论文翻译

优化和评价的收费亭的数量 景区简介 由於公路出来的第一千九百三十,至今发展十分迅速在全世界逐渐成为骨架的运输系统,以其高速度,承载能力大,运输成本低,具有吸引力的旅游方便,减少交通堵塞。以下的快速传播的公路,相应的管理收费站设置支付和公路条件的改善公路和收费广场。 然而,随着越来越多的人口密度和产业基地,公路如花园州公园大道的经验严重交通挤塞收费广场在高峰时间。事实上,这是共同经历长时间的延误甚至在非赶这两小时收费广场。 在进入收费广场的车流量,球迷的较大的收费亭的数量,而当离开收费广场,川流不息的车辆需挤缩到的车道数的数量相等的车道收费广场前。因此,当交通繁忙时,拥堵现象发生在从收费广场。当交通非常拥挤,阻塞也会在进入收费广场因为所需要的时间为每个车辆付通行费。 因此,这是可取的,以尽量减少车辆烦恼限制数额收费广场引起的交通混乱。良好的设计,这些系统可以产生重大影响的有效利用的基础设施,并有助于提高居民的生活水平。通常,一个更大的收费亭的数量提供的数量比进入收费广场的道路。 事实上,高速公路收费广场和停车场出入口广场构成了一个独特的类型的运输系统,需要具体分析时,试图了解他们的工作和他们之间的互动与其他巷道组成部分。一方面,这些设施是一个最有效的手段收集用户收费或者停车服务或对道路,桥梁,隧道。另一方面,收费广场产生不利影响的吞吐量或设施的服务能力。收费广场的不利影响是特别明显时,通常是重交通。 其目标模式是保证收费广场可以处理交通流没有任何问题。车辆安全通行费广场也是一个重要的问题,如无障碍的收费广场。封锁交通流应尽量避免。 模型的目标是确定最优的收费亭的数量的基础上进行合理的优化准则。 主要原因是拥挤的

2014年数学建模国家一等奖优秀论文设计

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参 赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等) 与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或 其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文 引用处和参考文献中明确列出。 我们重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违 反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3.

指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月 15日赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

2011年全国数学建模大赛A题获奖论文

城市表层土壤重金属污染分析 摘要 本文旨在对城市土壤地质环境的重金属污染状况进行分析,建立模型对金属污染物的分布特点、污染程度、传播特征以及污染源的确定进行有效的描述、评价和定位。 对于重金属空间分布问题,首先基于克里金插值法,应用Surfer 8软件对各数据点的分布情况进行模拟,得到了直观的重金属污染空间分布图形;随后,分别用内梅罗综合污染指数以及模糊评价标准和模型对城区内不同区域重金属的污染程度进行了评判。 对于金属污染的主要原因分析问题,基于因子分析法、问题一的结果和对各个金属污染物的来源分析等因素,判断出金属污染的主要原因有:工业生产、汽车尾气排放、石油加工并推测该区域是镍矿富集区。随后讨论了污染源之间的相互关系和不同金属的污染贡献率。 针对污染源位置确定问题,我们建立了两个模型:模型一以流程图的形式出现,基于污染传播的一般规律建立模型,求取污染源范围,模型作用更倾向于确定污染源的位置;模型二基于最小二乘法原理,建立了拟合二次曲面方程,在有效确定污染源的同时也反映了其传播特征,模型更加清楚,理论性也更强。 在研究城市地质环境的演变模式问题中,我们对针对污染源位置确定问题所建模型的优缺点进行了评价,同时建立了考虑了时间,地域环境和传播媒介的污染物传播模型,从而反映了地质的演变。 综上所述,本文模型的特点是从简单的模型建立起,强更准确的数学模型发展,逐步达到目标期望。 关键词:重金属污染,克里金插值最小二乘法因子分析流程图

一、问题重述 1.1问题背景 随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。评价和研究城市土壤重金属污染程度,讨论土壤中重金属的空间分布,研究城市土壤重金属污染特征、污染来源以及在环境中迁移、转化机理,并对城市环境污染治理和城市进一步的发展规划提出科学建议,不仅有利于城市生态环境良性发展,有利于人类与自然和谐,也有利于人类社会 健康和城市可持续发展[1] 。按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,不同的区域环境受人类活动影响的程度不同。 现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10 厘米深度)进行取样、编号,并用GPS 记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。 1.2 目标任务 (1) 给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。 (2) 通过数据分析,说明重金属污染的主要原因。 (3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。 (4) 分析所建立模型的优缺点,为更好地研究城市地质环境的演变模式,分析还应收集的信息,并进一步探索怎样利用收集的信息建立模型及解决问题。 二、 模型假设 1)忽略地下矿源对污染物浓度的影响; 2)认为海拔对污染物的分布较小,故只在少数模型中讨论其作用; 3)认为题目中的采样方式是科学的,能够客观反映污染源的分布。 三、 符号说明 3.1第一问中的符号说明 i p ——污染物i 的环境污染指数 i C ——污染物i 的实测值 i S ——污染物i 的背景值 m ax (/)i i C S ——土壤污染指数的最大值 (/)i i avg C S ——土壤污染指数的平均值

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.360docs.net/doc/6618726333.html,/journal/aam https://www.360docs.net/doc/6618726333.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/6618726333.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

相关文档
最新文档