2012数学建模葡萄酒评价B题

A题:葡萄酒的评价

摘要

本文研究了酿酒葡萄、葡萄酒的理化指标和葡萄酒质量之间的关系,讨论了利用理化指标判断葡萄酒质量的方法。以主成分分析法、主成分估计和聚类分析法为基础,得出三者间的量化关系,并对模型的准确性和方法的可靠性进行了检验,结果合理可靠。

对问题一,为了确定两组评酒员评价结果的差异显著性和可信度,在判断出两组评分的均值基本服从正态分布的基础上,用ttest语句进行显著性水平为0.05的t检验,证实了两组评分具有显著性差异。接着,我们又对两组评分的均值进行显著性水平为0.05的秩和检验,进一步证实了两组评分具有显著性差异。利用方差分析做可信度比较和两组评分中单项评价的比较,得到的结果为第二组更可信。

对问题二,基于主成分分析法得到主成分的综合评价,由于取值范围较大,指标灵敏性不高,所以对其进行了标准化处理,消除了量纲的影响。利用主成分估计法,求出回归函数,由此得到了综合评价值标准化后的评分。用R型聚类分析对标准化后的评分进行处理,得到阀值为66.58、73.53、78.41、82.78,并依据国际标准的3D1W 体系[1]给出了评分标准,对附件中的葡萄进行了分级,得到的结果符合实际。

对问题三,通过分析附件可知,葡萄酒的理化指标明显少于酿酒葡萄的理化指标。以花色苷为例,通过将葡萄酒的花色苷和酿酒葡萄中除花色苷外的其他指标进行聚类分析,找出与其关系显著相关的指标。这些指标即为对葡萄酒花色苷的影响较大的因素。之后对所得到的指标进行拟合,即可得出葡萄酒花色苷与这些指标间的函数关系式。利用回归分析检验,得到的预测值与实际值的平均绝对误差为0.1738。

对问题四,基于问题二中使用的方法,利用相关性分析找出与葡萄酒质量的相关系数最大的15个指标,分析所得结果是葡萄总黄酮和DPPH对红葡萄酒感官质量起着极为重要的作用。之后利用主成分分析法对相关系数最大的15个指标进行主成分分析,得到6个主成分(累计贡献率为90.49 %)。由此得出,在数据充足时,理论上可用葡萄与葡萄酒的理化指标来评价葡萄酒的质量。但由于在实际生活中,因为外界环境变化复杂、酿酒工艺千差万别,起着主要作用的是主观质量,是不能用数字精确测量和表达的,而是用消费者的满意度来衡量的。因此葡萄酒的质量差异,很大程度上体现在感官特征上,感官特征是衡量葡萄酒质量最有效、最直接的发法。所以,目前无法跳过人的感官评价直接利用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词:葡萄酒;主成分分析;聚类分析;感官评价

一、问题的重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

题目给出了某一年份一些葡萄酒的评价结果,同时分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二、模型假设与符号说明

2.1基本假设

1)所有葡萄酒样品不考虑储藏条件的影响;

2)葡萄酒的质量得分只取决于葡萄酒的质量和评酒员的业务素质,与主观、环境等因素无关;

3)分析葡萄与葡萄酒的各类关系时,不考虑加工工艺的影响;

4)葡萄分级时只考虑理化指标,不考虑外观等其它因素。

2.2符号说明

符号字母 符号解释

ijk x 项指标的评分个酒样的号评酒员对第第一组的k i j

ijk y

项指标的评分个酒样的号评酒员对第第二组的k i j ij Z

个酒样的总评分号评酒员对第第一组的i j ij Z 个酒样的总评分号评酒员对第第二组的i j

pq a 个理化指标的值号葡萄的第q p

pq r 个指标的相关系数个理化指标与第第q p

m

合评价值标准化后的酿酒葡萄综

w 酿酒葡萄的分级评分

三、模型的建立与求解

3.1问题一

3.1.1问题分析

问题一要求,分析两组评价结果有无显著性差异,并判断哪一组结果更可信。葡萄酒的感官评价中,由于评酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,从而不能真实地反映不同酒样间的差异。因此,在对感官评价结果进行统计分析时,必须对评酒员的原始数据进行相应的处理,以真实反映样品间的差异。

对一组数据而言,除需要了解他们的平均水平外,常常还需要了解它们的波动大小;极差(一阶统计量)、方差(二阶统计量)都能刻画一组数据的离散程度;一般情况下,一组数据的极差、方差越小,这组数据就越稳定。所以本题两组评分间差异应用平均值、方差和极差来描述,并进行显著性检验。

3.1.2数据处理

分析附表1发现,酒样数据并非顺序排列,所以先对酒样进行了排序。同时,观察到某些不合理数据,例如,第一组9号评酒员对8号白葡萄酒样的持久性评分并不满足要求。对于这些不合理数据,我们用相应指标的平均值代替,以降低评酒员的偶然误差,真实反映样品间的差异。

3.1.3问题求解

由附表1中的数据,可知第j 号评论员对第i 个红葡萄酒样的评价总分为:

∑==10

1k ijk ij x Z

第一组对第i 种红葡萄酒的总评分的平均值为:

∑==10

1

101j ij ij Z Z

第一组对第i 种红葡萄酒的总评分的样本方差:

∑=-=10

1

2][91)(j ij ij ij Z Z Z S

式中:ijk x 为第一组的j 号评酒员对第i 个红葡萄酒样的k 项指标的评分;

.10,2,1;27,,2,1,

??=??=j i 同理可得,第二组对第i 种红葡萄酒的总评分的平均值'ij Z 和第二组对第i 种红葡

萄酒的总评分的方差)('ij Z S 。

下面对两组评酒员的评分进行显著性差异的检验和可信度的比较:

1)显著性差异的检验

运用Matlab 根据附表1中红葡萄酒的两组感官评价数据进行作图分析,得到图1。

从图1中我们可以很直观的观察到,第二组的均值波动明显小于第一组,两组感官评价的总评分在直观上有一定差异。

随后进行定量计算,由于并不明确红葡萄酒所属的分布类型,所以我们使用Matlab 中的normoplot 语句,判断第一、二组对第i 种红葡萄酒的总评分的平均值是否服从正态分布。

图 2 第一组对红葡萄酒总评分的正态检验

图 3 第二组对红葡萄酒总评分的正态检验

分析图2,图3,图中样本点在概率图中呈线性,故可以认为评酒员对红葡萄酒的评分基本服从正态分布。

接下来进行基于成对数据的t 检验,设D 为两组评分差的均值。假设检验为,

图 1 红葡萄酒的总评分均值

:0

:10≠=D D H H μμ

在显著性水平为0.05的情况下使用Matlab 中的ttest 语句进行检验,得到Ans=1,即拒绝原假设,说明两组评酒员对红葡萄酒的评价结果有显著性差异。

同理,我们对两组评酒员对白葡萄酒的评价结果进行检验,在显著性水平为0.01的情况下使用Matlab 中的ttest 语句进行检验,得到Ans=1,即拒绝原假设,说明两组评酒员对白葡萄酒的评价结果有显著性差异。

为了进一步检验评酒员评价结果的差异性,我们用ranksum 语句进行秩和检验。设所需检验的假设是:

:0:10≠=D D H H μμ 对于红葡萄酒,在显著性水平为0.05的情况下,得10158

.0==h p ,,故拒绝原假设,即两组评酒员的评价结果有显著性差异。

对于白葡萄酒,在显著性水平为0.05的情况下,得10438

.0==h p ,,故拒绝原假设,即两组评酒员的评价结果有显著性差异。

2)可信度比较

方差能够很好的刻画一组数据的离散程度。一般情况下,一组数据的方差越小,这组数据就越稳定,所以我们利用Matlab 作图进行方差分析,如图4所示。

由图4我们可以明显的观察到,第二组的波动明显小于第一组,所以可以认为第二组相较于第一组评价结果更为稳定。

图 4红葡萄酒总评分的方差

其次,第二组红、白葡萄酒的定量计算结果如表1所示。从中对比可知,第二组的极差和与方差和均小于第一组,表明第二组的波动范围和波动程度更小,从另一方面证明了第二组的评价结果更为稳定。

表 1评价总分的方差和与极差和

组 别 方差和 极差和

第一组红葡萄酒 1578.2 613.00

第二组红葡萄酒912.34 492.00

第一组白葡萄酒3617.3 983.00

第二组白葡萄酒1568.5 653.00 通过上面的显著性检验和可信度比较我们可以得出,第二组评价结果优于第一组评价结果的结论。但由于总评分是各单项评分的求和,又评酒员给出的单项评分可能也存在着判断偏差,所以我们又选取了香气分析的质量等指标,进行单项评价的比较。如图5所示.

图5红葡萄酒香气分析的质量的方差比较

由图5可观察到,第二组香气分析的质量评分的波动小于第一组,所以第二组评分的稳定性较好,可信度高。

综上所述,两组评酒员的评价结果有显著性差异,第二组结果更为可信。

3.2问题二

3.2.1问题分析

由问题一确定了葡萄酒质量更可信的感官评价,又已知酿酒葡萄的理化指标,通过这两组数据对酿酒葡萄进行分级。

查阅资料可知,目前酿酒葡萄并没有统一的分级标准,在此我们提出了基于主成分分析和聚类分析的对酿酒葡萄进行分级的方法。

首先我们通过主成分分析法得出几个主要的理化指标,然后使用主成分估计得到标准化评价值函数。再用聚类分析,将理化指标分为若干等级,从而给出综合评价。最后与问题一中可靠的感官评价总分进行对比,给出酿酒葡萄分级体系,对这些酿酒葡萄进行分级。

3.2.2主成分分析的步骤

主成分分析(PCA)是将多项指标重新组合成一组新的互相无关的几个综合指标,根据实际需要从中选取尽可能少的综合指标,以达到尽可能多的反映原指标信息的分析方法。

主成分分析法进行评价的步骤如下:

1)对原始数据进行标准化处理

假设进行主成分分析的指标变量有m 个:m a a a ,,21,共有n 个评价对象,即红葡萄样品。第p 个评价对象的第q 个指标取值为pq a ,将各指标值pq a 转换成标准化指标pq

a ~: ),,2,1;,,2,1(,~m q n p s a a a q

q pq pq ==-= 其中),,,2,1(,)(11,111

2m q a a n s a n a n p n

p q pq q pq q =--==∑∑==即q a ,q s 为第q 个指标的样本均值和样本标准差。对应地,

),,2,1(,~m p s a a a p

p p p =-=

为标准化指标变量。

2)计算相关系数矩阵R

相关系数矩阵m m pq r R ?=)(

),,2,1,(,1

~~1m q p n a a r n k kq kp pq =-?=∑=

式中pq qp pq pp r r r r ,,==1是第p 个指标与第q 个指标的相关系数。

3)计算特征值和特征向量

计算相关系数矩阵R 的特征值021≥≥≥≥m λλλ ,及对应的特征向量m u u u ,,,21 ,其中T nj j j j u u u u ),,,(21 =,由特征向量组成m 个新的指标变量

???????+++=+++=+++=n

nm m m m n n n n a u a u a u b a u a u a u b a u a u a u b ~~~~~~~~~22112222112212211111

式中1b 是第1主成分,2b 是第2主成分,……,m b 是第m 主成分。

4)选择l 个)(m l ≤个主成分,计算综合评价值。

a.计算特征值),,2,1(m q q =λ的信息贡献率和累计贡献率。称

),,2,1(1m q c m k k

q

q ==∑-λ

λ与∑∑===m k k l k k l 11λλα 分别为主成分q b 的信息贡献率、主成分1b ,2b ,……,l b 的累计贡献率,当l α接近于1(95.0,90.0,85.0=l α)时,则选择前选择l 个指标变量1b ,2b ,……,l b 作为l 个主成分,代替原来m 个指标变量,从而可对l 个主成分进行综合分析。

b.计算综合得分

∑==l

q q q b c m 1

其中q c 为第q 个主成分的信息贡献率,根据综合得分值就可进行评价。

3.2.3基于主成分分析法的综合评价

我们对红葡萄的理化指标进行主成分分析,表2给出了相关系数矩阵的前10个特征值及其贡献率。 表 2 红葡萄理化指标的主成分分析结果

主成分序号 特征值 贡献率(%) 累计贡献率(%)

1 6.966

2 23.2207 23.2207

2 4.9400 16.4667 39.6874

3 3.7371 12.4570 52.1444

4 2.8400 9.4668 61.6112

5 1.9988 6.6628 68.2739

6 1.7424 5.8079 74.0818

7 1.4185 4.7282 78.8100

8 1.2701 4.2335 83.0435

9 0.9609 3.2031 86.2466

10 0.7384 2.4614 88.7080

可以看出,前十个特征根的累计贡献率就达到85%以上,主成分分析效果很好。下面选取前十个主成分(累计贡献率已达到88.7%)进行综合评价。前十个特征值对应的特征向量如表3所示。 表 3 酿酒葡萄样品的特征向量 1~a 2~a

3~a …… 30~a 第1特征向量 0.1421 0.2325 -0.0539 ……

-0.0524 第2特征向量 0.2445 -0.2247 -0.1788 ……

0.2197 第3特征向量 0.008 0.0935 0.0486 ……

0.3111 第4特征向量 0.2701 0.1615 -0.0054 ……

-0.0134 第5特征向量 -0.1704 0.1364 -0.3859 ……

0.1349 第6特征向量 -0.2248 -0.0974 0.1001 ……

0.3443 第7特征向量 0.1405 0.068 -0.0188 ……

0.2479 第8特征向量 -0.0082 -0.1121 0.1421 ……

0.0802 第9特征向量 0.1065 0.0024 0.6263 ……

-0.0108 第10特征向量 0.0767 -0.1295 0.1814 ……

-0.0853

从主成分的系数可以看出主成分中包含的成分,

表4 酿酒葡萄样品的主成分分析

主成分 包含成分名称 累计贡献率(%)

一 蛋白质、花色苷、褐变度、DPPH 、单宁、总酚和葡萄总黄酮

23.22

氨基酸总量、总糖还原糖、可溶性物质和干物质含量的比例 39.69 三

白藜芦醇和果皮颜色a* 52.14 四

氨基酸、酒石酸、PH 值和苹果酸 61.61 五

柠檬酸、多酚氧化酶活力、固酸比、果穗和百粒质量 68.27 六

果皮颜色b*、黄酮醇 74.08 七

可滴定酸和果皮质量 78.81 八

L* 83.04 九

VC 含量和出汁率 86.25 十 果梗比 88.71

把各种葡萄原始的30个指标),,(3021a a a A =与各成分所对应的特征向量T nj j j j u u u u ),,,(21 =相乘,即得到10个主成分分别为

???????+++=+++=+++=n

nm m m m n n n n a u a u a u b a u a u a u b a u a u a u b ~~~~~~~~~22112222112212211111

其中:103,2,1 =m ;30,2,1 =n .

把十个主成分值代入综合指标∑==l

q q q p b c m 1,可以得到各红葡萄酒的综合评价值

以及排序结果如表5所示。 表 5 主成分分析的综合评价

名 次 1 2 3 4 5 6 7 酿酒葡萄编号 1 26 27 25 10 13 14 综合评分 289.7 119.5 169.7 174.0 181.3 199.6 204.8 名 次 8 9 10 11 12 13 14 酿酒葡萄编号 24 17 16 5 20 4 15 综合评分 206.6 216.3 219.8 223.1 253.0 258.1 258.8 名 次 15 16 17 18 19 20 21 酿酒葡萄编号 8 18 11 23 7 2 19 综合评分 271.2 281.0 282.9 288.4 289.9 292.7 292.8 名 次 22 23 24 25 26 27 酿酒葡萄编号 9 12 22 6 21 3 综合评分 295.0 300.3 309.5 376.2 639.7 840.9

上表可以看出,最大综合评分为840.9,最小为119.5。取值范围较大,指标灵敏度不高。所以必须对其做标准化处理。由于对酿酒葡萄的综合评价不可能为0,应有一个评价底分,不妨取底分为50分。

构造综合评价值的标准化函数:

50))

min()((100+-=M M Max m M p 标准

式中,M 为综合评价值;p m 为酿酒葡萄p 的综合评分。

得到结果见于表6。

表 6 标准化后的综合评价值 酿酒葡萄

1 2 3 4 5 6 7 综合评价值

90.18 90.59 166.6 85.79 80.94 102.1 90.21 酿酒葡萄

8 9 10 11 12 13 14 综合评价值

87.61 90.91 75.14 89.23 91.65 77.68 78.41 酿酒葡萄

15 16 17 18 19 20 21 综合评价值

85.89 80.49 80.00 88.96 90.61 85.08 138.72 酿酒葡萄

22 23 24 25 26 27 综合评价值 92.92 89.99 78.64 74.13 66.57 73.53

3.2.4基于主成分估计的评分函数

主成分估计采用的方法是将原来的回归自变量变换到另一组变量,即主成分。选择其中一部分重要的主成分作为新的自变量(此时丢弃了一部分影响不大的自变量,实际达到了降维的目的),然后用最小二乘法对选取主成分后的模型参数进行估计。最后再变换回原来的模型求出参数的估计。

根据表2的主成分分析结果计算,得到前十个特征值之和所占比例(累计贡献率)已达到88.7%,主成分分析结果较好,所以我们丢弃后20个影响不大的成分。

根据表3中给出的这十个特征值对应的特征向量计算,得到系数向量和常数分别为()3021ηηηη,,, =、31.31=d 。系数向量η的具体值,如表7所示. 表 7 系数向量的具体值 序号

1 2 3 4 5 6 7 8 系数值

0.0003 0.0211 -0.0801 0.0003 0.0762 -0.2290 -0.9221 -0.0189 序号

9 10 11 12 13 14 15 16 系数值

-0.0015 9.8967 0.1030 0.0045 0.1599 0.0989 0.0232 0.0023 序号

17 18 19 20 21 22 23 24 系数值

0.0022 -0.0090 4.4129 -0.3986 0.0203 -0.0884 0.0023 0.0060 序号

25 26 27 28 29 30 系数值

0.5370 0.0250 4.6657 0.2904 0.0267 -0.2651

回归函数即为D A W +?=η,其中??????

? ??=nm n n m m a a a a a a a a a A 212222111211;m d d d D ?=1),,( .

计算评分w 的值如表8.

表 8 综合评价值标准化后所得评分

酿酒葡萄 1 2 3 4 5 6 7

评 分

68.62 79.67 82.39 69.05 75.56 68.70 64.95 酿酒葡萄

8 9 10 11 12 13 14 评 分

69.61 85.39 74.47 70.58 66.18 79.50 75.12 酿酒葡萄

15 16 17 18 19 20 21 评 分

65.74 69.15 72.85 66.10 76.49 76.54 74.74 酿酒葡萄

22 23 24 25 26 27 评 分 69.57 80.89 71.60 72.89 76.56 69.65

3.2.5 基于R 型聚类分析的评分标准

聚类分析又称群分析,是对多个样本(或指标)进行定量分类的一种多元统计分析方法。对样本进行分类称为Q 型聚类分析,对指标进行分类称为R 型聚类分析。本题运用R 型聚类分析方法对酿酒葡萄的标准化综合评分进行分析。通过上述步骤,可以知道各个红葡萄样品的标准化综合评分,这些评分之间可能存在着较强的相关性。为了验证这种想法,运用MATLAB 软件计算27个指标之间的相关系数,表9给出酿酒葡萄理化指标的相关系数矩阵的部分数据。 表 9 红葡萄样品的部分相关系数

1a 2a 3a 4a 5a 6a 7a 8a 1a

1.0000 0.9821 0.8647 0.8809 0.8787 0.8763 0.9339 0.9917 2a

0.9821 1.0000 0.9289 0.9491 0.9314 0.9429 0.9806 0.9648 3a

0.8647 0.9289 1.0000 0.9782 0.9332 0.9931 0.9757 0.8274 4a

0.8809 0.9491 0.9782 1.0000 0.9760 0.9947 0.9871 0.8432 5a 0.8787 0.9314 0.9332 0.9760 1.0000 0.9648 0.9571 0.8471 6a

0.8763 0.9429 0.9931 0.9947 0.9648 1.0000 0.9864 0.8396 7a 0.9339 0.9806 0.9757 0.9871 0.9571 0.9864 1.0000 0.9075 8a 0.9917 0.9648 0.8274 0.8432 0.8471 0.8396 0.9075 1.0000

可以看出某些评分之间确实存在很强的相关性,因此可以考虑从这些评分中选取几个有代表性的评分进行聚类分析。

根据其相关性将27个评分进行聚类分析,再从每个类中选取代表性的评分。首先对各个评分分别进行标准化处理。变量间相近性由相关系数度量,类间相近性的计算选用类平均法。聚类树型图如图6所示。

图 6 综合评分聚类树形图

由聚类树形图分析得,将第26个指标化为第一类,第1、8、14化为第二类、第27个指标归为第三类、其余为第四类。

对这四类利用标准化后的综合评价值,计算出对红葡萄样品进行分级的阀值。分析综合评价表,发现第3个、第6个和第21个数据与其他数据相差较大,首先予以剔除。最后计算各组分类的平均值,作为对红葡萄样品分级的阀值。所得阀值为66.58、73.53、78.41、82.78。对酿酒葡萄进行分级的标准如表10所示。

表10 红葡萄样品分级标准

评分w酿酒葡萄等级

w>82.78 绝佳

78.41

73.53

66.58

w<66.58 一般

其中,w为标准化后的评分值;分级标准参考文献[1]。

3.2.6评价结果

按前面的方法对酿酒葡萄进行分级,结果如表11所示。

表11 红葡萄的分级结果

酿酒葡萄等级酿酒葡萄样品

绝佳9

非常优秀2、3、13、23

很好5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26

好1、4、6、8、11、12、16、17、22、24、25、27 一般7、15、18

同理,可得到白葡萄的分级标准和分级结果,分别见于表12、表13。

表12 白葡萄样品分级标准

评分w酿酒葡萄等级

w>82.56 绝佳

76.65

73.18

67.91

w<67.91 一般

表13 白葡萄的分级结果

酿酒葡萄等级酿酒葡萄样品

绝佳

非常优秀1、3、4、5、6、10、17、20、21、22、23、24、25、26、27 很好2、7、9、11、12、13、14、15、18、19

好16

一般8

本问中,我们主要以酿酒葡萄的理化指标和葡萄酒的质量为标准进行分级。在对酿酒葡萄品质的具体评价中,上述指标虽均有不同程度的涉及,但通过主成分分析可知,评级指标主要还是集中于糖、酸、PH值等项目上。如果仅仅利用这几个少数指标,往往难以真正区分某个品种品质的优劣。如两个糖、酸相同的品种,其品质和加工品的质量常有比较大的差异。而且在实际应用中,有关品种的加工特性,如抗氧化性能、酚类浸渍程度、酚类构成、花色素苷浓度、香味类型、适宜酿酒类型等等,都是在品质的评价中必须予以考虑的。但这些指标附件并没有提供,因此,我们只能给出基于较少理化指标的分级方式。

通过观察,我们发现被评为绝佳的红葡萄样品9比被评为非常优秀的红葡萄样品23所对应的葡萄酒评分要低。但比较两者的几个重要理化指标如:酒石酸,柠檬酸,还原糖等。我们可以看出,红葡萄样品9的得分高于红葡萄样品23。综合各项指标,红葡萄样品9比样品23的等级高。同理,分析其它葡萄样品的分级,均较为合理。

并且,附表2中酿酒葡萄的级别集中在“很好”“好”等级上,比较符合实际情况。综上可知,这种分级指标是合理,准确的。

3.3问题三

3.3.1问题分析

问题三要求我们分析酿酒葡萄与葡萄酒的理化指标之间的联系。分析所给附件了解到,葡萄酒的理化指标是少于酿酒葡萄的理化指标的。又知道,酿酒葡萄中的理化指标,例如单宁,必然对葡萄酒中的单宁有影响。因此我们主要是要寻找酿酒葡萄中除单宁外还有哪些理化指标对葡萄酒的单宁含量有影响。

通过将葡萄酒的单宁含量和酿酒葡萄中除去单宁的其他指标进行聚类分析,找出与其关系最密切的有关指标,这些指标即为对葡萄酒单宁的影响较大的因素。之后对所得到的指标进行拟合,得出葡萄酒单宁与这些指标之间的关系。同理,找到其他葡萄酒的理化指标受酿酒葡萄的理化指标的主要影响成分。

3.3.2问题求解

首先我们对红葡萄酒与酿酒葡萄中花色苷的关系进行分析求解。图7中,30号表示的是红葡萄酒的花色苷,8号表示的是红葡萄的褐变度,从图中明显看出两者有较为密切的关系,从而找到了对酒中花色苷影响较大的两个指标。

图 7 红葡萄酒花色苷与酿酒葡萄其他理化指标的聚类分析

运用多元线性回归得到:

7269.01647.09359.1++=褐变度花色苷花色苷a a f 拟合度为8814.02=R ,说明了拟合的可靠性较高。

进一步分析拟合结果的可信程度。我们对其进行残差检验,结果如图8所示,从残差图可以看出,除第8,9,14数据点外,其余数据的残差离零点均较近,且残差的置信区间均包括零点。而第8,14的置信区间距离零点较远,可视为异常点。其余数据均良好可信。这说明回归模型D A W +?=η能较好的符合原始数据。

图 8 红葡萄酒花苷素的残差分析图

同理,对其他指标进行相同的工作,我们可以得到表14。

表14 红葡萄酒的多元线性回归结果

回归方程

拟合度2R 7269.01647.09359.1++=褐变度花色苷花色苷a a f 0.8814

3954.02133.01085.03065.06133.7+-++=葡总黄酮单宁总酚单宁a a a a f D PPH 0.7255

7839.0044.02324.09672.4+++=葡总黄酮总酚总酚a a a f D PPH 0.7827

8234.00996.03319.0-+=葡总黄酮总酚酒总黄酮a a f

0.7851 0451.00018.00136.01242.0-++=单宁总酚白醇a a a f D PPH 0.7716

综上所述,我们可以得知,红葡萄酒的理化指标跟酿酒葡萄中的DPPH 自由基、总酚、丹宁、花色苷、葡萄总黄酮有密切关系。根据资料可知,酚类物质包括单宁、花色苷、酚酸和黄酮类化合物,是葡萄果实的重要品质成分之一,决定着葡萄及其加工的颜色、涩感、苦味、氧化性能等;另一方面,它也作为一种补充体内被消耗掉的抗氧化剂而成为对健康有益的成分。所以长期以来, 酚类一直被认为是葡萄酒中的功能性物质[2]。因此,所得结论正确可信。

3.3.3回归分析检验

我们选取红葡萄酒的酒总黄酮作为检验对象,将后8组数据作为检验组,利用前19个理化指标的数据,进行回归分析。模拟得到,红葡萄酒的酒总黄酮与酿酒葡萄的总酚、葡萄总黄酮之间的线性回归方程

0044.11103.04651.0--=葡总黄酮总酚酒总黄酮a a f

红葡萄酒的酒总黄酮预测值与实际值的绝对误差,如图9 所示。

图9 真实值和预测值的绝对误差

红葡萄酒的酒总黄酮预测值与实际值的绝对误差,如表15 所示。

表15 红葡萄酒总黄酮的模拟检验结果

真实值 4.0443 4.4398 5.8266 12.1444 3.7310 3.0222 2.1541 3.2841 预测值 3.9922 5.6978 5.7775 10.1313 2.1606 3.7527 2.0398 2.6140 绝对误差0.0129 0.2833 0.0084 0.1658 0.4209 0.2417 0.0531 0.2041

由于葡萄酒的成分之间存在着复杂的关系,它们又与感官质量之间有着密切的联系,葡萄酒最终的质量则是葡萄酒中各种成分协调平衡的结果。所以找到一个准确定量的关系式描述酿酒葡萄与葡萄酒的理化指标之间的联系,是很困难的。

运用上述的处理方法,通过模拟。对于红葡萄酒,看到预测值与实际值的最大绝对误差为0.4209,平均绝对误差为0.1738。说明回归函数在某种程度上能反映酿酒葡萄与葡萄酒的理化指标之间的联系,回归是有效的。

3.4问题四

3.4.1问题分析

问题四要求,通过分析葡萄与葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。在问题二中,我们对酿酒葡萄的理化指标与葡萄酒的质量间的联系进行了讨论。在问题三中,我们对酿酒葡萄的理化指标与葡萄酒的理化指标间的关系进行了讨论。通过前两问的分析,我们知道,在评价过程中,人的主观因素起到了重要的作用。所以在问题四中,我们应当建立起三者之间的联系。

3.4.2相关性分析

在数据分析的过程中,常需要分析两个或两个以上变量之间的因果关系,通常采用相关性分析法。通过这种方法分析酿酒葡萄的理化指标和葡萄酒理化指标对葡萄酒

质量的影响。调用Matlab 中的corrcoef 命令作出相关系数矩阵,找到与葡萄酒质量相关系数最大的15个指标,结果如表16所示。

表 16 红葡萄酒中前15项理化指标的相关系数

序 号 1 2 3 4 5 6 7 8

理化指标 葡萄总黄酮 DPPH 酒DPPH 酒白藜芦醇 酒总黄酮 总酚 蛋白质

PH 相关系数 0.61 0.58 0.52 0.52 0.48 0.47 0.47 0.45 序 号 9 10 11 12 13 14 15 理化指标 酒总酚 酒单宁 果梗比 黄酮醇 酒石酸 出汁率 单宁 相关系数 0.43 0.42 0.37 0.33 0.32 0.31 0.28

通过相关分析可知,葡萄总黄酮和DPPH 与葡萄酒质量的相关系数排在前两位,表明这两种指标对红葡萄酒感官质量起着极为重要的作用。

3.4.3主成分分析

由问题二给出的主成分分析步骤,对15个红葡萄和红葡萄酒的指标经过主成分分析,给出标准化前的6个主成分对应的特征向量,如表17所示。

表 4 标准化前的6个主成分的特征向量

第一特征向量 第二特征向量 第三特征向量 第四特征向量 第五特征向量 第六特征向量

1~a -0.3122 -0.3191 -0.3239 -0.1746 -0.3155 -0.3312 2~a 0.1794 -0.1118 0.1655 0.3106 0.1853 0.0834 3

~a 0.1128 0.0773 -0.0990 0.0626 -0.0155 0.0595 4~a -0.0018 0.0478 -0.1156 -0.5954 0.0693 0.0421 5~a 0.0418 0.0895 -0.1369 0.5327 -0.1623 -0.0216 6~a -0.0972 0.0803 0.1753 -0.1110 0.2179 0.0820 7~a 0.3188 0.4185 -0.1353 0.0011 -0.0064 0.1011 8~a -0.2886 -0.0978 0.0274 -0.2238 0.2141 0.0757 9~a 0.0991 -0.0287 0.2154 -0.0504 0.1603 -0.1684 10

~a -0.4702 0.3617 0.0857 0.2195 -0.2410 -0.4752 11~a 0.1056 0.2013 -0.0454 -0.1632 -0.7042 0.4440 12~a 0.0513 -0.6263 -0.1247 0.2379 -0.0929 0.1952 13

~a -0.6346 0.0586 0.1744 0.1414 0.0713 0.5924 14~a 0.0654 0.0996 0.5993 -0.0279 -0.0889 -0.0744 15

~a 0.0990 -0.3169 0.5613 -0.1169 -0.3743 -0.0949

据贡献率的计算公式∑∑===

m k k

l k k l 11λλα,得到6个主成分,其累计贡献率为90.49 %,具有统计学上的意义。

6个主成分结果如表18所示,

表 18 六个主成分的结果

主成分 包含成分名称 累计贡献率(%)

一 PH 值、酒DPPH 、单宁、酒石酸 54.45

二 蛋白质、黄酮醇、丹宁 64.65

三 出汁率 74.39

四 白藜芦醇、DPPH 、酒总黄酮 80.93

五 总酚、酒总酚、果梗比 85.86

六 葡萄总黄酮 90.49

在不考虑外部环境和酿造工艺的情况下,我们将葡萄与葡萄酒的理化指标结合为一个理化指标整体,并将其与葡萄酒质量进行相关系数检验,得到相关系数最大的15个指标。再通过主成分分析法,求得6个主成分的累计贡献率已高达90.49 % 。所以在理想状态下,可用葡萄与葡萄酒的理化指标来评价葡萄酒的质量。但在实际生活中,因为外界环境变化复杂、酿酒工艺千差万别,所以评价体系只能在一定程度上评价葡萄酒的质量。

3.4.4用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性分析

在上一节中已经分析了酿酒葡萄的理化指标和葡萄酒理化指标对葡萄酒质量的影响。本节用主成分估计法回归出葡萄酒的感官评价函数。用前二十个数据回归,得到结果为 表19 红葡萄酒感官评价函数回归结果

d

1a 2a 3a 4a 5a 6a 7a 40.15 0.0937 4.2174 1.9749 0.3352 0.0874 0.0584 4.594 8a 9a 10a 11a 12a 13a

14a 15a 4.5940 0.0138 0.0407 -0.0166 0.0007 0.1187 -0.0359 -0.722

其中d 表示常数,1a 表示酿酒葡萄的理化指标和葡萄酒的理化指标。

利用后七个数据做检验,得到预测数据和实际数据的绝对误差,定性定量分析的结果如表20和图10所示。

表 20 红葡萄酒感官评价函数预测值和实际值的相对误差

预测值 准确值 相对误差

68.723 72.200 2.90%

73.658 71.600 0.92%

75.815 77.100 1.10%

69.817 71.500 1.33%

68.154 68.200 0.70%

70.578 72.000 2.38%

72.356 71.500 3.64%

图 10红葡萄酒感官评价函数预测值和实际值的相对误差

表20反映出,真实值与预测值较为接近,最大相对误差为3.64%;图10则反映了真实值与预测值的相对误差都在0.06以下。这说明回归结果良好,可较好的反映酿酒葡萄的理化指标和葡萄酒理化指标与葡萄酒质量间的关系。

接下来,选取评价标准中香气分析和附表3里的红葡萄和酒的芳香物质作如上的分析。以红葡萄酒第二组香气分析的总分的平均值为因变量,红葡萄酒和红葡萄的芳香物质为自变量,作多元线性回归分析;又由于芳香物质不仅影响葡萄酒的香气分析,还在某种程度上影响葡萄酒的总体评价,所以取红葡萄酒第二组的总分的平均值为因变量,红葡萄酒和红葡萄的芳香物质为自变量,作多元线性回归分析。用前二十个数据回归,后七个数据做检验,得到预测数据和实际数据的最大相对误差分别为6.80%,

1.20%。

通过查阅资料得知,总酚、单宁、柠檬酸和色泽等对红葡萄酒质量有最为直接的作用。取红葡萄酒第二组葡萄酒质量的总分的平均值、单宁、总酚、柠檬酸和色泽的理化指标为因变量,作多元线性回归分析。同样用前二十个数据回归,后七个数据做检验。发现这时9954.7,3647.7,5725.02===P F R 。根本通不过拟合检验,回归是无效的。

在前三个回归模型中,数据充足可靠,回归方程能够较好的判断葡萄酒的质量;而在第四个回归模型中,由于数据匮乏,即使用已经证实的对葡萄酒质量有较重要影响的指标,也不能合理评价这些指标对葡萄酒质量的影响。所以,若用葡萄和葡萄酒

的理化指标来评价葡萄酒的质量,必须收集较多数据,得到对葡萄酒质量的经验函数,才能对葡萄酒的质量进行合理评价。

综上所述,用理化指标判断葡萄酒的质量理论上是可行的,但是准确度需要由大量的数据进行保证,所以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量在现实意义下是不可行的。

四、模型评价

突出优点:使用了多种方法,从不同的角度进行分析求解,例如,问题一给出了两种显著性检验法,秩和检验与t检验;问题四中描述了两个不同角度的模型,问题四中,模型的优点在于,比较精确地描述了原问题与上文求解过程较一致,结果相对误差小。

不足之处:问题一对葡萄酒感官评价结果的统计分析中,使用了方差分析等方法,该方法是建立在同质基础上的。但在实际生活中,由于各种因素的共同作用,专家组成员间存在异质性。这就需要将感官评价专家作为可能影响感官评价结果的因素来考虑,而且这一因素甚至会掩盖被分析样品的显著性差异[3]。

五、模型改进与推广

对于问题四,本文研究目的在于寻求一种通过理化指标判断葡萄酒质量的方法和评价体系,用来代替通过人的感官评价的评价标准。现行的是以感官评价为主,理化指标为辅的判断方法。但由于评酒员人数、专业性、个人差异、费用等因素影响,总会出现不同程度的评判偏差。所以新的方法应包含快速、准确、便捷、廉价等方面,通过建立统一标准,规范化评判。

由此我们提出了“机器感官评价”的概念,通过对理化指标的测量分析,为用户提供评价数据。我们知道,感官评价的评判内容分为外观分析、香气分析、口感分析和平衡评价,而每项又不同程度的与几类理化指标存在关系。根据资料对理化指标进行分类,例如,乙醇、单宁、糖分等归入平衡评价。通过对附表中所给数据分析,建立出主成分关系表达式,例如,

平衡状态:由乙醇+单宁+酸+柔软指数+糖分

柔软指数=酒精度-(总酸+单宁类)

根据柔软指数的值,得出柔软指数的分值,再根据其他成分分析得到总分,由此得出平衡评价的分数。通过上述四个项目分数,综合给出“机器感官评价”。因为其中理化分析,分数等级均为定量处理,所以给出的评价结果具有受主观影响小,偏差小的特点。

因为食品对之于人,其质量的优劣无法统一。人们把质量标准分为两类,一类是客观标准,它是本质的规定,被详细明确的指标所限定,是强制性标准。另一类是主观质量,是不能用数字精确测量和表达的,是用消费者的满意度来衡量的,是各种成分的完全平衡调和,如酒的状态,香气等。葡萄酒的质量差异,很大程度上体现在感官特征上,感官特征是衡量葡萄酒质量最有效、最直接的发法。所以,目前无法跳过人的感官评价直接利用理化指标分析化验对葡萄酒的质量进行判断。[2]

参考文献

[1]《葡萄酒评价标准》,2012年9月8日

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.360docs.net/doc/ad16183836.html,/journal/aam https://www.360docs.net/doc/ad16183836.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/ad16183836.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

葡萄酒评语

葡萄酒评语 篇一:葡萄酒评价 葡萄酒的评价 摘要 对于解决葡萄酒的评价问题及其之间的联系,需要运用到统计学中不同的分析方法,同时建立模型,再利用相应的软件进行求解。 针对问题一,通过分析十位评酒员对不同葡萄酒的打分进行统计整理,得到每位评酒员对所有酒样品的总得分,利用个spss软件,通过对总得分进行T检验分析得到均值,标准差,误差等相应的数据,可以得出两组评酒员的评价结果存在的差异性,根据数值比较可知,第二组评酒员评价结果之间的浮动较小,因此确定第二组的评价结果比较可信。 针对问题二,采用主成分分析和聚类分析对酿酒葡萄进行分级,首先通过spss软件对酿酒葡萄的理化指标进行主成分分析,对主成分累计贡献率进行归一化分析得出其权重和酿酒葡萄中的主要物质的相关系数矩阵。再通过相关数据利用maTLaB得出聚类图。因为酿酒葡萄的组数较多,可将其分为4类,以便聚类图能清晰表明酿酒葡萄的等级。 针对问题三,运用spss软件及问题二的模型对酿酒葡萄和葡萄酒理化指标分析,从红葡萄和红葡萄就中提取9中主要物质(见表三1),

白葡萄与白葡萄酒中提取8中主要物质(见表四1)。再对酿酒葡萄和葡萄酒理化指标进行通过典型相关分析。更加准确的反应出酿酒葡萄与葡萄酒理化指标之间联系。 针对问题四,建立多元线性回归模型分析葡萄和葡萄酒的理化指标及芳香物质对葡萄酒的影响,利用spss软件得出图四和图六,由图中数值分析得出拟合线性回归的残差浮动区间为[-1,1],因此葡萄酒的质量可以由酿酒葡萄和葡萄酒的理化指标以及芳香物质共同反应。 关键字:T检验、主成分分析、聚类分析、典型相关分析、多元线性回归分析 一问题重述 1.1问题背景与条件 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。 1.2预解决的问题 1、问题一分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结信? 2、问题二根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3、问题三分析酿酒葡萄与葡萄酒的理化指标

全国大学生数学建模竞赛题葡萄酒的评价答案全解

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析

相关文档
最新文档