2012年全国大学生数学建模竞赛A题葡萄酒评价分析

2012年全国大学生数学建模竞赛A题葡萄酒评价分析
2012年全国大学生数学建模竞赛A题葡萄酒评价分析

对葡萄酒的评价分析

摘要

本文主要应用数理统计中的t检验法,回归分析法等方法对葡萄酒的评价的相关问题进行了分析,建立相应的模型。

针对问题一,首先,对样本进行K-S检验得出数据取自的总体服从正态分布,进而运用成对数据t检验法进行检验,得出两组评酒员对每种葡萄酒的总评分有显著差异;在此基础上,采用两种方法分别判断哪组评酒员的可信度更高。方法一是计算出每组评酒员对每种葡萄酒的总评分的置信区间,评分处于置信区间内的人次百分比较高的一组可信度较高;方法二是比较两组评酒员对每种葡萄酒的总评分的方差的大小,总体方差分布较小的一组,可信度较高。两种方法均得出了同一结论,即第二组评酒员的结果更可信。

针对问题二,基于问题一得到的结论,建立了酿酒葡萄品质的综合评价模型。首先,对数据指标进行归一化处理,并计算出酿酒葡萄与各指标因素间的相关系数。然后,分别用层次分析法和因子分析法确定了各指标因素的权重。最后,利用确定的权重,建立了酿酒葡萄品质的综合评价模型,对葡萄进行分级。如,优质的红葡萄样品是8、23、3、1。

针对问题三,从两个层次建立相关性系数模型。首先,运用Excel软件分析葡萄酒各理化指标与酿酒葡萄成分的相关性;然后,进一步分析酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的联系。得出结论:酿酒葡萄的花色苷成分与葡萄酒的花色苷呈显著正相关。

针对问题四,分别建立回归分析模型和综合评价模型,其中综合评价模型建立方法同问题二,回归分析模型则先将葡萄和葡萄酒的各理化指标进行因子分析法降维后得数量较少的因子变量,对简化后的新指标进行回归分析,此处尝试用SPSS软件的回归分析中5种回归拟合方法,继而选取拟合度最佳的模型,得回归系数,建立多元线性回归方程分析各理化指标对葡萄酒质量的影响;将新指标得分带入方程,可求得线性拟合后的葡萄酒质量评分。进一步引入芳香物质作为评判指标,同样建立线性回归模型求得葡萄酒质量评分,将有无引入芳香物质作为指标的质量评价结果分别与可信度较高的评酒员对葡萄酒的评价结果进行回归模型检验比较和差值平方和比较,得到结论用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是完全可行的,但加入芳香物质作为评价指标更能准确合理地评价葡萄酒的质量。

关键词:葡萄酒评价;层次分析法;综合评价模型;因子分析法;SPSS;回归模型

一.问题重述

葡萄酒质量一般由每个评酒员对葡萄酒进行品尝后的得分来评判。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。由附件1某一年份一些葡萄酒的评价结果,附件2和附件3该年份这些葡萄酒的和酿酒葡萄的成分数据,现要求建立数学模型分析以下问题:

1. 附件1中两组评酒员的评价结果有无显著性差异,并判断可信度。

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

二.问题分析

1. 欲尽量减小分析工作量和评分员主观因素的影响,应先进行数据预处理。

2. 欲判定两组评酒员的评价结果的差异是否显著,可用统计学的t检验方法,从而需要对样本数据进行正态性检验;比较可信度,需利用置信区间或方差。

3. 欲对酿酒葡萄分级,可建立综合评价模型,其中需要进行权重分配。可运用相关性系数基础上的层次分析法(AHP)结合matlab软件,也可运用因子分析法结合SPSS 软件。

4. 欲分析酿酒葡萄与葡萄酒的理化指标之间的联系,可以直接对各指标进行相关性分析,也可以在此基础上进行优化,将葡萄的综合评价得分与葡萄酒的理化指标进行相关性分析。

三.模型的基本假设与说明

1. 假设第一级理化指标影响比第二级理化指标更为显著,那么可以只考虑第一级理化指标的影响;

2.假设给两组评酒员提供的同种葡萄酒样品是从同一瓶葡萄酒中同时取出的;

3.用K-S检验出一组样本呈正态分布后,因另一组样本与之品质相同,故可假设这组样品也呈正态分布;

4. 假设所有的关联程度均是线性关系的体现。

四. 符号说明

五. 模型的建立与求解

5.1 问题1的模型建立与求解

5.1.1第一小问模型的建立

欲判断两组评酒员的评价结果的差异是否显著,应建立两组评酒员的非参数检验模型,横向比较,验证样本服从正态分布后,对两组评酒员的评分进行t 检验。

首先,对数据进行预处理、选择样本,并运用SPSS 软件检验其正态分布性; 然后,用matlab 计算两个样本X 、Y 的平均值。当两个平均值相差不大时,统计量

w X-Y

T=

11S m n

+

应该服从自由度为m+n-2的t 分布; 1X 、1Y

两组评酒员对每种红葡萄酒的平均评分的样本 1X 、1Y 两组评酒员对每种红葡萄酒的平均评分的样本平均值 2X 、2Y

第一组评酒员对每种白葡萄酒的平均评分的样本 2X 、2Y

两组评酒员对每种白葡萄酒的平均评分的样本平均值

m 样本X 的数据个数 n

样本Y 的数据个数

α

置信度

max λ

判断矩阵的最大特征值 μ

判断矩阵的最大特征值的特征向量

W 权重系数向量 K 指标数值向量

Z

综合评价指标1122Z k w k w ki wi =?+?+????

2221

21

(1)(1)11()11()1x y w m x i i n

y i i m S n S S m n S X X m S Y Y n ==?-+-?=

++?

??

=-?-??=-?-??

∑∑

接着,使用函数[h,sig,ci]=ttest2(X,Y ,α,tail) 进行此种检验,先默认tail=0进行双边检验,若h=0, 则根据X-Y 的理论值所在的1-α区间来判定tail 为1或-1,继续进行单边检验;

最后,若检验得出接受备选假设,那么,两样本的差异显著。

第一小问模型的求解

步骤:

○1对数据进行预处理,剔除异常数据,如第一组第7名评酒员对第三种白葡萄酒口感分析的评分异常(见表5.1),将其总分剔除 。

表5.1 第一组评酒员对白葡萄酒的样品三的持久力的评分

第一组评酒员序 号 1 2 3 4 5 6 7 8 9

10

对白葡萄酒样品3的持久性评分

7 5 7 5 6 7 77 5 6 7

再对数据进行正态性检验,利用SPSS 中的K-S 检验功能,例如取第二小组的红葡萄评分为例。输入SPSS 软件后,进行分析,得到如下输出:

得到P 值为0.801,P>0.05,即数据具有正态性。同理,数据处理后,得到两组评分

均按正态分布。

以红葡萄酒为例,运用Excel 软件,计算出每组评酒员对每种红葡萄酒的总评分的平均值,并统计数据构成2组样本X1、Y1,即两组评酒员对每种葡萄酒的平均评分,运用matlab 编程(见附录一),得出两组样本的平均值,即1X =73.0556,1Y =70.5148。

2发现两个样本X1、Y1的平均值相差不大,故,统计量w X-Y

T=11S m n

+

应该服从自由度为52的t 分布。(m=27,n=27,则,m+n-2=52) ○3使用函数[h,sig,ci]=ttest2(X1,Y1)(见附录一),得出结果h=0,sig=0.1200,ci= -0.6842 5.7657 。

其中,“h=0”说明不能在显著水平α=0.05时拒绝原假设1X =1Y (即可以考虑接受原假设);

“sig=0.1200”说明只有12.00%的可能统计量T ≥0,表明不能接受原假设1X =1Y ; “ci= -0.6842 5.7657”说明X1-Y1的理论值所在的1-α区间是[-0.6842

5.7657],可信度为95%。这个区间不对称,偏向大于0的方向。

以上三条中有2条指示不能接受原假设:1X =1Y ,应该考虑接受备选假设1X >1Y 。 ○4使用函数[h,sig,ci]=ttest2(X1,Y1,α,tail)进行单边检验(见附录一) 得出结果h=0,sig=0.0600,ci= -0.8448 Inf 。

其中,“h=0”说明不能在显著水平a=0.02时拒绝原假设1X >1Y (即可以考虑接受原假设);

“sig=0.0600”说明只有6.00%的可能统计量T ≥0,表明应该接受备选假设1X =1Y ; “ci=-0.8448 Inf ”说明1X =1Y 的理论值所在的1-α区间是[-0.8448 +∞],可信度为98%。这个区间不对称,偏向大于0的方向。

以上三条中有2条指示不能接受原假设:1X =1Y ,应该考虑接受备选假设1X =1Y 。 ○5同理,可得出白葡萄酒的两样本X2、Y2的平均值2X 、2Y ,并判断出 2X >2Y 。 结论:两组评酒员的评价结果有显著性差异。

5.1.2第二小问模型的建立

欲判断哪组评价结果的可信度更高,应建立两组评酒员的可信度检验模型。分开考虑两组,纵向分析,有两种方法。

方法一:

首先,计算每组评酒员对每种葡萄酒的总评分的置信区间。运用matlab 软件,针对每组评酒员对每种红葡萄酒的总评分的标准差S1、S2和平均数1X 、2X ,使用公式

2(1)S

X t n n α±

-

然后,运用Excel 得出评分处于置信区间内的人次,比较两组所占的人次百分比,

较高的一组可信度较高。 方法二:

运用matlab 编程绘出每组10名评酒员对每种葡萄酒的评分方差的分布图。由图判断出方差总体较小的一组结果,此组即为可信度较高的一组。

第二小问模型的求解 方法一:

首先,运用matlab 软件,针对每组评酒员对每种红葡萄酒的总评分的标准差S1、S2和平均数1X 、,使用公式

2

(1)S

X t n n α±

-

计算每组评酒员对每种葡萄酒的总评分的置信区间;然后,运用Excel 得出评分处于置信区间内的人次,其中所占的人次百分比较高的一组可信度较高。

由计算结果发现,第一组有276人次评的总分在相应的置信区间内,占50.18%,第二组有302人次评的总分在相应的置信区间内,占54.91%。易有结论:第二组的结果更可信。

结论: 第二组的结果更可信。 方法二:

运用matlab 编程(见附录二)计算并绘出每组10名评酒员对每种葡萄酒的评分方差的分布图。见图5.1,由图可直观清晰地判断出方差总体较小的一组结果,此组即为可信度较高的结果。

图5.1 评酒员对每种红葡萄酒的总评分的方差分布图

第一组 第二组

图中,红线代表第一组,蓝线代表第二组,易看出,第二组评价结果的内部方差相对较小,即第二组10名评价员的评分差异较小,于是有结论:第二组的结果更可信。

5.2 问题2的模型建立与求解 5.2.1模型的建立

要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,需要进行权重分配来建立综合评价模型。

首先,对数据指标进行归一化处理,并对酿酒葡萄与各指标因素间的关系,建立相关性系数模型;

然后,运用相关系数基础上的层次分析法(AHP )结合matlab 软件来排出各指标的影响力顺序和对应的的权重,并对其一致性进行检验。或运用因子分析法结合SPSS 软件用较少的相互独立的因子变量来代替原来指标的大部分信息,再对降维后的指标变量进行归一化处理、相关性分析,确定变量的权重,设权重系数向量为W ;

接着,对权重系数向量W 进行一致性检验; 最后,构建综合评价指标Z ,Z=K*W, K 表示每种葡萄酒的质量和酿酒葡萄的指标数值向量,即有1122Z k w k w ki wi =?+?+????。再按每种酿酒葡萄的具体综合评价指标数值进行排序,从而对葡萄分级。

以下求解过程以红葡萄酒为例。 5.2.2模型的求解 方法一:(相关系数基础上的层次分析法) Step1:各指标的权重分配

1) 排出各个指标的影响力顺序。首先,分析附件2中的酿酒葡萄的理化指标表,忽略

二级指标,筛选出一级指标,将其标准化(无量纲化),运用Excel 软件中的数据分析功能得出各指标(包括红葡萄酒总分)之间的相关性系数列表;然后,以红葡萄酒质量作为首要指标,再由相关性系数列表,找出与红葡萄酒质量相关系数最大的指标排列其后,以此类推(此过程的每一步均不考虑已排好序的指标),排出各个指标的影响力顺序。见表5.4。 2) 构造判断矩阵。主要是通过比较同一层次上的各因素对上一层相关因素的影响作用。

即将同一层的各因素仅进行两两对比,比较时可采用相对尺度标准度量,如,1~9标度,见表5.2。这样可尽可能地避免不同性质的因素之间相互比较的困难。同时要尽量依据实际问题具体情况,减少由于决策人主观因素对结果的影响。

表5.2 1~9标度

因素 比因素 量化值 同等重要 1 稍微重要 3 较强重要 5 强烈重要 7 极端重要 9 两相邻判断的中间值 2,4,6,8

对已排好顺序的指标,构造的判断矩阵A ,如下:

A=[1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 7 7 7 8 8 8 8 9 9 9 ; 1 1 2 2 2 3 3 ...... 9 9; 1/2 1/2 1 2 2 3 ......8 9;

... ... ... ... ... ... ... ... 1/9 ...... 1/3 1/2 1/2 1/2 1 2; 1/9 ...... 1/3 1/3 1/2 1/2 1/2 1];

3) 求解各指标的权重系数向量。可以用matlab 编程(见附录三)求出该矩阵的最大

特征值max λ为9.02336,此特征值对应的特征向量为u ,再对u 进行归一化处理,得出各指标的权重系数向量为

W=[0.1569 0.1335 0.1130 0.0955 0.0806 0.0679 0.0572 0.0481 0.0404 0.0340 0.0285 0.0239 0.0201 0.0168 0.0141 0.0118 0.0099 0.0083 0.0069 0.0058 0.0049 0.0041 0.0034 0.0029 0.0025 0.0021 0.0018 0.0015 0.0014 0.0012 0.0011]’

4) 对各指标的权重系数向量进行一致性检验。通常情况下,由实际得到的判断矩阵不

一定都是一致的,实际中也不必要求一致性绝对成立,但要求大体上是一致的,即不一致的程度应在容许的范围内。主要考察以下指标。

a. 一致性指标:max 1

n

CI n λ-=-

b. 随机一致性指标:RI,通常由实际经验给定的,如表5.3。

表5.3 随机一致性指标

c.一致性比率指标:CR=CI/RI,当CR<0.10时,认为判断矩阵的一致性是可以接受的 ,λ对应的特征向量可以作为排序的权重向量。

此题中,n 取9,经计算得,CR 为0.002,满足要求,即此权重系数向量是一致的。 5) 各指标与其权重系数对应的表格5.4如下:

表5.4 全部指标的权重系数排列表

n 1 2 3 4

5

6

7

8

9

10

11

12

13

14

15

RI 0 0

0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51 1.54 1.56 1.58 1.59

指标 红葡萄酒质量 蛋白质 氨基酸总量 VC 含量 葡萄总黄酮 总酚 权重系数

0.1569

0.1335

0.1130

0.0955

0.0806

0.0679

Step2: 对酿酒葡萄进行综合评价分级

构造综合评价指标Z 。Z=K*W,其中,K 表示每种葡萄酒的质量和酿酒葡萄的指标数值向量。从而有1122Z k w k w ki wi =?+?+????,代入具体指标值,得出各种酿酒葡萄的综合评价指标值,并用Excel 软件进行降序排列。相应的每种酿酒葡萄的综合评价指标值表5.3见附录三。

再按以下规则进行分级:

葡萄级别 优质 较好 普通 劣质

Z 值范围

≥3.5 3.5~2.5,不含3.5 2.5~1.5,不含2.5 r ≤1.5

从而分级如下:

红葡萄:优质----样本9

较好----样本3,2,21,1,8

普通----样本23,14,5,16,17,19,24,10,22,20,13,26 劣质----样本27,4,15,12,6,11,7,18,25 白葡萄:优质----样本3,28,5,27,

较好----样本20,9,25,15,24,10,

普通----样本6,4,22,7,21,2,23,19,17,18,26,14,1,8,11,12 劣质----样本13,16

方法二:(使用SPSS 软件进行因子分析) Step1: 减维后指标的权重分配

1) 同样,先以红葡萄酒为例,忽略二级指标,筛选出一级指标,结合红葡萄酒的质量,

DPPH 自由

基 PH 值 固酸比 出汁率 褐变度 花色苷 0.0572 0.0481 0.0404 0.340 0.0285 0.0239 单宁 白藜芦醇 a* L* b* 果穗质量 0.0201

0.0168

0.0141 0.0118 0.0099 0.0083 百粒质量 果皮质量 可滴定酸 可溶性 总糖 干物质 0.0069 0.0058 0.0049 0.0041 0.0034 0.0029 还原糖 黄酮醇 果梗 多酚 苹果酸 柠檬酸 0.0025 0.0021 0.0018 0.0015

0.0014 0.0012

酒石酸

0.0011

使用SPSS软件对其自动进行标准化,并对标准化后的数据矩阵进行因子分析,使之降维,将多变量化为少变量,最后得到8个综合变量结果y1、y2、y3、y4、y5,y6,y7,y8。

2)经SPSS分析计算后的结果见表5.5。表中,第2列到第4列分别是因子变量的方差

贡献(特征值)、方差贡献率、累积方差贡献率。第5列到第7列分别是旋转后的因子变量的方差贡献(特征值)、方差贡献率(权重系数)、累积方差贡献率(累积权重系数)。将第3列因子变量的方差贡献率作为各指标的权重系数。

表5.5 因子分析后因子提取结果(红葡萄)

3)同理,对于白葡萄酒,使用spss软件最终得出的结果见表5.6。

表5.6 因子分析后因子提取结果(白葡萄)

Step2: 对酿酒葡萄进行综合评价分级

设红、白葡萄酒的权重系数矩阵分别为V1,V2。构造综合评价指标Z。对红葡萄酒,Z=K1*V1,其中,K1表示标准化后的指标矩阵。同理,对白葡萄酒,Z=K2*V2,其中,K2表示标准化后的数据矩阵。

于是,得出各种酿酒红葡萄的综合评价指标值,并用Excel软件进行降序排列。相应的表格5.7见附录四。

再对红、白葡萄按以下相同规则进行分级:

葡萄级别优质较好普通劣质

Z值范围≥0.4 0.4~0,不含0.4 0~-0.5,不含0 ≤-1.5

从而分级如下:

红葡萄:优质----样品8,23,3,1

较好----样品2,17,9,11,14,5,24,12

普通----样品22,20,6,26,21,19,18,16,13,15,27,4,7

劣质----样品25,10

白葡萄:优质----样品5,27,20,28,25,3

较好----样品23,7,26,14,12,10,9

普通----样品6,24,22,21,15,23,2,19,4,16

劣质----样品18,8,1,17,11.13

5.2.3 结论的进一步分析

综合以上两种方法所得出的结果,我们可以发现:葡萄的总糖、还原糖、蛋白质、氨基酸含量越高,等级越优。

5.3 问题3的模型建立与求解

5.3.1模型的建立

要求分析酿酒葡萄和葡萄酒的理化指标之间的关系,可以分别研究红、白葡萄酒,多方面、多层次地建立相关性系数模型。

根据相关性分析法理论基础可知:对有多个变量的关系,可设其中任意两个随机变量X与Y,对其进行了n次随机试验,得到的观测值分别为

i i ???

(X Y)(i=1,2,n),

X Y、:分别为各自的平均值,R为随机变量和Y对于以上样本的相关性系数,称之为样本相关系数。在实际中,常常用样本相关系数R作为相关系数r的估计值。

根据以上理论知识可建立以下相关性系数模型:

对有多个变量间的关系,其中随机变量X和Y可表示其中任意两个随机变量。

对这个问题,首先,研究葡萄酒各理化指标与酿酒葡萄成分的相关性;

然后,结合问题2中的结论,进一步研究酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的相关性。

5.3.2模型的求解

Step1:分析葡萄酒各理化指标与酿酒葡萄理化指标的相关性

以红葡萄为例:

1)使用Excel,对葡萄酒各理化指标与酿酒葡萄理化指标间的关系进行很好的相关性分析,所得结果见表5.8(详细见附录五)。

表5.8 酿酒葡萄的理化指标与葡萄酒理化指标间的相关系数列表(红葡萄)

酒葡萄花色

单宁......

色泽

a*

色泽

b*

氨基酸0.106 0.496 ...... -0.100 0.356

蛋白质0.296 0.471 ...... -0.033 0.047

...... ...... ...... ...... ...... ......

苹果酸0.693 0.298 ...... -0.559 -0.310

果皮颜色a* -0.369 -0.298 ...... -0.542 -0.064

果皮颜色b* -0.129 -0.121 ...... -0.626 0.025

2)通过纵向比较,可以得出葡萄酒各理化指标与酿酒葡萄理化指标的联系:

(1)红葡萄酒花色苷与酿酒葡萄各理化指标的相关性分析

从分析结果的第一列中,我们可以看出酿酒葡萄的花色苷成分与葡萄酒的花色苷呈显著正相关,且相关系数绝对值最大,联系最为密切;葡萄的苹果酸、褐变度、自由基、总酚、单宁也与葡萄酒的花色苷呈正相关。

(2)红葡萄酒单宁与酿酒葡萄各理化指标的相关性分析

由上表第二列可知,酿酒葡萄的花色苷、总酚、单宁、葡萄总黄酮、黄酮醇均

与葡萄酒的单宁呈显著正相关,其中总酚和单宁与之联系最密切;葡萄的色泽

L*与葡萄酒的单宁呈负相关。

(3)红葡萄酒总酚与酿酒葡萄各理化指标的相关性分析

由上表第三列可知,葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的总酚呈显著正相关,其中葡萄总酚的相关系数绝对值最大,联系最为密切;色泽L*与之呈负相关。

(4)红葡萄酒的酒总黄酮与酿酒葡萄各理化指标的相关性分析

由上表第四列可知,葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的总酚呈显著正相关,其中葡萄总黄酮的相关系数绝对值最大,联系最为密切;

色泽L*与之呈负相关。

(5)红葡萄酒的白藜芦醇与酿酒葡萄各理化指标的相关性分析

由上表第四列可知,葡萄总黄酮与葡萄酒的白藜芦醇呈正相关,但值得注意的

是,葡萄的白藜芦醇含量与葡萄酒的白藜芦醇含量并无显著关系。

(6)红葡萄酒的DPPH半抑制体积与酿酒葡萄各理化指标的相关性分析

由上表第四列可知,葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒

的DPPH半抑制体积呈显著正相关,其中葡萄总酚的相关系数绝对值最大,联系最为密切;

(7)红葡萄酒的色泽与酿酒葡萄各理化指标的相关性分析

葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的色泽L*呈显著负相关,其中花色苷的相关系数绝对值最大,联系最为密切;葡萄果皮颜色L*、a*、b*呈正相关,其中色泽a*的相关系数绝对值较大,联系较为密切;

葡萄的苹果酸、果皮颜色b*与葡萄酒色泽a*呈显著负相关;葡萄的还原糖与葡萄酒的色泽b*呈显著正相关;

Step2:分析酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的相关性

1)综合以上7条具体分析,我们还可以做适当总结归纳:葡萄的花色苷、自由基、总

酚、单宁、葡萄总黄酮之间的相关性很强,所以可以将之归为一类,从而将葡萄的理化指标降维,将多变量化为少变量,从而优化了模型三,对应的葡萄酒各理化指标与酿酒葡萄质量的相关系数,见表5.9。

表5.9 酿酒葡萄质量与葡萄酒理化指标间

的相关系数列表(红葡萄)

葡萄酒理化指标花色

单宁总酚

酒总

黄酮

白藜

芦醇

DPPH

半抑制

体积

色泽

L*

a* b*

酿酒葡萄质量0.634 0.704 0.698 0.633 0.171 0.579 -0.586

-0.49

6

0.14

由表5.9可知,葡萄酒的花色苷、单宁、总酚、酒总黄酮、DPPH半抑制体积与酿酒红葡萄的综合评价指标呈明显正相关,其中单宁的相关系数绝对值最大,联系最为密切;白藜芦醇、色泽b*与之呈正相关,但联系不大;色泽L*、a*与酿酒葡萄的综合评价指标呈明显负相关。

○2同理,白葡萄酒的各理化指标与酿酒葡萄的综合评价指标的相关系数关系,见

表5.10。

表5.10 酿酒葡萄质量与葡萄酒理化指标间

的相关系数列表(白葡萄)

葡萄酒理化指标单宁总酚

酒总

黄酮

白藜芦

DPPH半

抑制体

色泽

L*

a* b*

酿酒葡萄

质量

0.271 0.286 0.322 -0.023 0.038 -0.482 -0.190 0.466

由表5.10可知,,葡萄酒的单宁、总酚、酒总黄酮、色泽b*与酿酒白葡萄的综合评价指标呈正相关,其中单宁的相关系数绝对值最大,联系最为密切;DPPH体积抑制比也与之呈正相关,但联系不大;白藜芦醇、色泽L*、a*与酿酒葡萄的综合评价指标呈负相

关,其中色泽L*与之联系最密切。

5.4 问题4的模型建立与求解 5.4.1第一小问模型的建立

欲分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可对酿酒葡萄、葡萄酒的理化指标与葡萄酒质量做回归分析,建立回归模型。也可用SPSS 或Matlab 对酿酒葡萄、葡萄酒的理化指标与葡萄酒质量进行相关性分析。

多元线性回归模型如下:

ε

ββββ+++++=p p X X X Y (22110)

Y 表示因变量,Xi (i=1,…,p )表示自变量,ε表示随机误差项。 对于n 组观测值,其方程组形式为

εβ+=X Y 即

模型假设: ⑴零均值假设:

()0

i E ε= i=1,2,…,n

⑵同方差:

()2

i Var εσ=

⑶无自相关:

⑷误差与自变量不相关:

(),0

ik i Cov X ε= i=1,2,…,n , k=0,1,…,p

⑸自变量之间无多重共线性

()1

rank X p =+

此题,采用两种方法来分析。 方法一:回归分析法

首先,进行数据预处理。运用SPSS 软件结合因子分析法简化指标,得到相应的自变量和因变量,对其做回归分析,建立回归模型;

然后,运用SPSS 软件对其进行数据拟合分析。设定其多元线性回归模型为:

1281270.515 1.1490.378...0.076 1.1720.519W X X X Y Y =+-++++

运用SPSS 软件对此进行拟合调试与分析,由于测试数据存在不全面及缺漏现象,这将会影响到整体的拟合优度,所以在建立回归模型时,分别采用强迫引入法、逐步回归法、强迫剔除法、向后逐步法、向前逐步法进行多元线性回归尝试,通过分析其拟合优度、回归方程显著性、回归系数显著性,选择最佳模型;

接着,比较分析,确定最佳模型。将降维后的各因子得分作为葡萄样本的分析数据,做上述5种方法的尝试,比较得出效果最好的模型。

最后,检验模型。分别进行回归方程的拟合优度R 2的检验、回归方程的显著性F 与回归系数显著性sig 的检验、残差检验。 方法二:综合评价法(和问题2的方法二类似)

确定降维后各因素的权重,再建立综合评价模型。 首先,运用matlab 对数据指标进行归一化处理;

然后,运用因子分析法结合SPSS 软件来用较少的相互独立的因子变量来代替原来指标的大部分信息;

接着,运用层次分析法(AHP )结合matlab 软件来排出各新指标的影响力顺序和对应的的权重,设权重系数向量为W ;

接着,对权重系数向量Q 进行一致性检验;

最后,构建综合评价指标W ,*W K Q =,K 表示新指标数值向量,即有

1122...i i W k q k q k q =+++

第一小问模型的求解 方法一:回归分析法

1数据预处理 分析酿酒葡萄和葡萄理化指标对葡萄酒质量的影响,因附件2中的各理化指标过多,所以用SPSS 软件用因子分析法将酿酒葡萄的理化指标(一级指标)简化得8个因子1X 、2X …8X ,葡萄酒的理化指标(一级指标)简化得2个因子1Y 、2Y ,因此得到10个自变量,与应变量葡萄酒质量W 。

2运用SPSS 软件对其进行数据拟合分析 设定其多元线性回归模型为:

1122881122...W k a X a X a X b Y b Y =++++++

建立回归模型时,分别采用强迫引入法、逐步回归法、强迫剔除法、向后逐步法、向前逐步法进行多元线性回归尝试,通过分析其拟合优度、回归方程显著性、回归系数显著性,选择最佳模型。 ○3比较分析,确定最佳模型

将降维后的各因子得分作为27种葡萄样本的分析数据,做了上述5种方

法的尝试后,得出的结果见表5.11。

图5.11 五种方法的结果表

从图中,发现采用强迫引入法效果最好。从而,具体模型为:

1281270.515 1.1490.378...0.076 1.1720.519W X X X Y Y =+-++++

结论:由模型可知,公共因子1X 、6X 、1Y 与葡萄酒质量呈正相关,3X 、5X 与葡萄酒质量呈负相关,又由SPSS 软件因子分析法所得引自相关表可知,1X 、6X 与酿酒葡萄的自由基、单宁、总酚、葡萄总黄酮,1Y 与葡萄酒的单宁、总酚、酒总黄酮、DPPH 体积抑制比相关,因此,这些物质成分有助于提高葡萄酒的质量;而公共因子3X 、5X 与酿酒葡萄的白藜芦醇、固酸比、果穗质量、色泽a*、b*相关,因此这些成分将导致葡萄酒质量下降。

4模型检验 (1) 回归方程的拟合优度R 2的检验:(如表5.12)

图5.12 回归方程的拟合优度R2的检验结果表

发现:由于回归方程的拟合优度R2越接近1,拟合效果越好,此题中的拟合优度为78.3%,在5种线性回归方法中优度值最大,效果较好。

(2)回归方程的显著性F与回归系数显著性sig的检验:(如表5.13)

表5.13 显著性F与sig的检验结果表

发现:由于回归方程显著性F越大越好,回归系数显著性sig<0.05就越显著,此题中F=5.821比较大,且sig=0.01,可见显著性较高。

(3)残差检验:(如图5.2)

图5.2 残差检验的结果图

发现:当残差图均匀分布时,效果最好,而此题中残差图分布得较均匀,可见拟合得相当好。

方法二:综合评价法

Step1:降维后的指标的权重分配

○1先以红葡萄酒为例,运用matlab 将数据归一化,再使用SPSS 软件结合因子分析法将酿酒葡萄的理化指标(一级指标)简化得8个因子1X 、2X …8X ,葡萄酒的理化指标(一级指标)简化得2个因子1Y 、2Y ,因此得到10个自变量,与应变量葡萄酒质量W 。并由SPSS 直接得出这十个变量的相关性系数矩阵。

2由相关性系数矩阵,排出这10个自变量对因变量的影响力顺序,即,从最重要到最不重要的顺序为:

y1、x6、x1、x4、y2、x7 x8、x2、x3

3构造判断矩阵。 对已排好顺序的指标,构造的判断矩阵A ,如下: A=[1 2 3 4 5 5 6 7 8 9 ; 1/2 1 2 3 4 5 5 5 7 8; 1/3 1/2 1 2 3 4 5 5 6 7; 1/4 1/3 1/2 1 2 3 4 5 5 6; 1/5 1/4 1/3 1/2 1 2 3 4 5 5; 1/5 1/5 1/4 1/3 1/2 1 2 3 4 5;

1/6 1/5 1/5 1/4 1/3 1/2 1 2 3 4; 1/7 1/6 1/5 1/5 1/4 1/3 1/2 1 2 3; 1/8 1/7 1/6 1/5 1/5 1/4 1/3 1/2 1 2; 1/9 1/8 1/7 1/6 1/5 1/5 1/4 1/3 1/2 1 ]

○3求解各指标的权重系数向量。可以用matlab 编程(类似于附录三中程序),求出该矩阵的最大特征值max λ为9.4880,此特征值对应的特征向量为u ,再对u 进行归一化处理,得出各指标的权重系数向量为

W=[0.2866 0.2085 0.1530 0.1098 0.0784 0.0569 0.0404 0.0289 0.0212 0.0162] ○

4对各指标的权重系数向量进行一致性检验。 此题中,n 取9,经计算可得,CR 为0.061,满足要求,即此权重系数向量是一致的。 从而有模型:

Z=0.1530x1+0.0289x2+…+0.0404x8+0.2866y1+0.0784y2

5.4.2 第二小问模型的建立

欲论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,可以建立拟合比较模型。

首先,由上述第一小问的方法一,可得到葡萄酒质量关于各理化指标的线性回归模型为

1281270.515 1.1490.378...0.076 1.1720.519W X X X Y Y =+-++++

然后,将1X 、2X …8X 、1Y 、2Y 带入具体因子得分,算出回归分析法质量

得分,再将此得分与第二组评酒员所评质量得分进行比较,运用matlab 软件做两种得分归一化后的比较图。 第二小问模型的求解

1将1

X 、2X …8X 、1Y 、2Y 带入具体因子得分,可以算出回归分析法质量

得分为68.1、77.2、76.5…95.0。

○2将此得分与第二组评酒员所评质量得分进行比较,运用matlab 软件做两

种得分归一化后的比较图,发现基本拟合。见图5.3。

图5.3 两种得分归一化后的比较图

结论:因此可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量;但是结合附件一评酒员评分标准,评价指标中外观分析与葡萄酒色泽、葡萄果皮颜色有关,口感分析与葡萄酒、葡萄的内部成分有关,但是香气分析并没有明确的理化指标与之对应,由此考虑将附件三中葡萄与葡萄酒的芳香物质作为指标进行葡萄酒质量的评价。

第二小问模型的深化(引入芳香物质) ○

1数据预处理 首先,红葡萄酒中的1-丙醇仅在2个葡萄样本中检测到,正十一烷仅在3个葡萄样本中检测到,数据量过小,不具代表性,因此可将其剔除;

然后,因葡萄和葡萄酒的芳香物质的具体指标过多,同样考虑运用SPSS 软件因子分析法将芳香物质指标降维,化多变量为少变量,因理化指标、芳香物质指标的公共因子数总和后指标依旧过多,所以进一步简化,用主成分分析法提取每种指标累计贡献率达70%的公共因子,得到葡萄的理化指标6公共因子

1X 2X …6X ,葡萄酒理化指标2个公共因子1Y 、2Y 葡萄芳香物质5个公共因子

1U 、2U …5U ,葡萄酒芳香物质7个公共因子1V 、2V …7V ,一共20个自变量,

同样将葡萄酒的质量作为因变量,建立回归模型,利用SPSS 软件进行多元线性回归分析。

○2运用SPSS 软件对其进行数据拟合分析

设定其多元线性回归模型为:

1122661122112255112277.........W k a X a X a X b Y b Y c U c U c U d V d V d V =++++++++++++++

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

12年全国数学建模大赛A题获奖作品

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题. 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出. 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性.如有违反竞赛规则的行为,我们将受到严肃处理. 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等). 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 年月日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

基于统计分析的葡萄酒评价模型 摘 要 本文针对葡萄酒评价问题, 指出了两组评酒员评价结果差异, 给出了更可信的小组,根据酿酒葡萄的理化指标和葡萄酒的质量确定了酿酒葡萄的分级, 然后建立了酿酒葡萄与葡萄酒理化指标之间的回归方程组, 得出了酿酒葡萄和葡萄酒理化指标对葡萄酒质量影响的方程, 最后论证了葡萄酒质量不能完全用这两种理化指标评价. 问题一:首先对两组评酒员打分数据进行预处理,采用了两个独立样本的非参数统计方法进行Mann-Whitney U 检验,证明了两组评酒员评价结果存在显著差异,并通过比较两组打分样本的方差,异常值点等离散型度量,认为第二组的评价结果更加合理. 问题二:首先选取能代表所有葡萄理化指标的变量,利用聚类分析法验证了所选变量具有代表性,然后通过主成分分析得出每种葡萄的理化指标综合得分,依据综合得分将酿酒红葡萄分为3类、白葡萄分为5类,并根据每一类中葡萄所酿造的酒的质量确定该类葡萄的等级. 问题三:应用SPSS 软件,利用回归分析方法建立了酿酒葡萄和葡萄酒理化指标之间的回归方程组. 问题四:首先利用Matlab 软件对酿酒葡萄和葡萄酒理化指标运用功效系数法进行无量纲量的转换,综合考虑这两方面因素,得到一个关于量化指标的综合指数,最后将葡萄酒质量作为因变量,量化综合指数作为自变量,利用回归分析方法建立两者的联系,得到回归方程为121317105.001.010*302.9171.10N N N M +-+=-,证明了葡萄酒质量不能完全用这两种理化指标评价. 关键词: Mann-Whitney U 检验 聚类分析 主成分分析 回归分析 功效系数法

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

2012年数学建模A题优秀论文

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):S55001 所属学校(请填写完整的全名):郑州科技学院 参赛队员(打印并签名) :1. 刘超 2. 赵芬芳 3. 尹峰 指导教师或指导教师组负责人(打印并签名):闫天增 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文通过对27种红葡萄酒和28种白葡萄的理化指标数据进行分析,采用显著性差异分析法、可靠度分析、因子分析法、相关系数分析、主成分分析法以及聚类分析法,借助统计软件SPSS和数学软件MATLAB,分析了两组评酒员的评价结果有无显著性差异和可信度,给出了酿酒葡萄与葡萄酒的理化指标之间的联系,建立了基于酿酒葡萄理化指标和葡萄酒质量的聚类分析模型确定了葡萄酒质量的影响因素,最后通过补充相关信息,建立基于分析模型确定了葡萄酒质量的影响因素。 针对问题一,首先对所有样品的10位评酒员打分的加权平均值进行显著性差异检验,显著性水平取为0.05,通过两组评酒员分别对红葡萄酒和白葡萄酒的显著性检验得出两组评酒员的评价结果有明显差异,最后运用可靠性分析,得到两组评酒员的评价结果的可靠度,结果表明第二组评酒员的评价结果更加可信。 针对问题二,以第二组评酒员的评价结果作为相应葡萄酒样品的质量指标,根据酿酒葡萄理化指标对比葡萄酒的质量利用SPSS软件进行聚类分析,得到酿酒葡萄的聚类树状图,从而将酿酒葡萄分成5个等级。 针对问题三,对葡萄酒的理化指标进行主成分分析,得到葡萄酒的主要成分,然后将每一个主成分与酿酒葡萄的理化指标进行多元回归分析,根据SPSS软件运行结果得出主成分与酿酒葡萄的理化指标的相关性。 针对问题四,利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较前后两者结果中由样品中的芳香指标导致的影响差异来确定不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,还需要结合感官指标,感官指标是评价葡萄酒质量的最终及最有效的指标。 关键词:理化指标主成分分析法可信度分析显著差异聚类分析芳香物质

2012年数学建模A题范文

2013高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):

2013高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

2012年数学建模大赛A题解题思路

首先纠正一下对于数学建模的看法,数学建模重要的是一种数学思想,即使是没有牢固的数学根底,一样可以在建模的赛场上大放异彩。 下面先把试题读一下,个人认为的重点词汇已经标出出来。(不要盲目听从任何人所谓的专家建议) A题葡萄酒的评价 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某 一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的 和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 附件1:葡萄酒品尝评分表(含4个表格) 附件2:葡萄和葡萄酒的理化指标(含2个表格) 附件3:葡萄和葡萄酒的芳香物质(含4个表格) 解题思路: 1、众所周知,对于同一事物的评价,如果大家的意见越一致,那么评 价的可信度就越高。所以对于问题1的解题思路也就清晰明了了。

我们可以通过离散度(所谓离散程度,即观测变量各个取值之间的 差异程度。它是用以衡量风险大小的指标。)这一概念来对每一组评 酒员作出的评估作出风险分析。显而易见的是若风险评估的值越高,这组评酒员的评价就存在问题了。若风险评估值大小相当,这说明 这两组评酒员是没有明显差异的。 2、题目中要求对葡萄作出评级。看起来似乎没有思路,那么我们可以 动一下我们的小脑筋。既然对于评级我们没有参考标准,那么我们 可以参考评酒员的评价。即使用逆向思维,从评酒员的评分发出, 那么大体上葡萄的分级基本上就能确定下来,根据确定先来的葡萄 分级进行逆推,就可以得出结论。 3、对于这个问题,最直观也是最基本的思路就是看两者之间的趋势。 (作出两者的趋势图)。通过对趋势图的直接观察,两者之间的大体 关系即可确定,然后根据曲线拟合的方法可得出两者间的函数关系。 4、对于问题4的这中学术中称之为白痴型问题,大家肯定一眼就能得 出结论,那就是肯定能用理化指标来评价葡萄酒的质量。但这里有 个前提,就是先分析葡萄和葡萄酒理化指标之间的关系,显然这是 解题的关键。对于这种大量数据的问题,只要通过计算机实现,基 本上不要考虑认为分析,因为在浪费大量时间的前提下基本上不会 得出结论。言归正传,谈一下解题的关键点或者是捷径,可以通过 附件一种的数据来作出评价。至于具体的方法,因为只是初步的讲 解还未作出具体判断。估计会在后续的评论中作出判断。 谢谢大家,小马过河预祝大家考出理想成绩。

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

数学建模A题

2012年暑期培训数学建模第二次模拟 承诺书 我们仔细阅读了数学建模联赛的竞赛规则。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与本队以外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其它公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们愿意承担由此引起的一切后果。 我们的参赛报名号为: 参赛队员(签名) : 队员1: 队员2: 队员3:

2012年暑期培训数学建模第二次模拟 编号专用页 参赛队伍的参赛号码:(请各个参赛队提前填写好): 竞赛统一编号(由竞赛组委会送至评委团前编号): 竞赛评阅编号(由竞赛评委团评阅前进行编号): 数学课程的成绩分析 摘要 本文针对大学甲、乙两个专业数学成绩分析问题,进行建模分析,主要用到统计分析的知识和 excel以及matlab软件,建立了方差分析、相关分析的相关模型,研究了影响学生成绩的相关因素, 以及大学生如何进行数学课程的学习。 问题一针对每门课程分析两个专业的数学成绩可以通过excel工具得出各门功课的平均值、方差

进行比较分析。 问题二针对专业分析两个专业的数学成绩的数学水平有无明显差异,可以运用平均数、方差进行 比较。并对两专业的数学成绩进行T检验,进一步分析其有无显著性差异。 问题三针对各班高数成绩和线代、概率论成绩进行散点图描述建立一元回归线性模型,然后对模 型进行求解,对模型进行改进。包括分析置信区间,残差等。 关键词:平均值方差 T检验一元回归线性模型置信区间 残差 excel matlab 一、问题重述 附件是甲专业和乙专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计等三门数学课程的成绩数据,请根据数据分析并回答以下问题: (1)针对每门课程分析,两个专业的分数是否有明显差异? (2)针对专业分析,两个专业学生的数学水平有无明显差异? (3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况? (4)根据你所作出的以上分析,面向本科生同学阐述你对于大学数学课程学习方面的看法。 二、模型假设 1.假设附件中所给的数据为学生真实考试成绩(由于数据的来源要符合真实可靠的原则); 2.每位学生的成绩之间是相互独立的; 3.同一个专业不同班之间学生的成绩是相互独立的; 4.假设显著性水平是a=0.05; 三、符号约定 X:甲专业高数平均成绩 Y:乙专业高数平均成绩 :回归系数 :回归系数 四、问题分析 问题一分析:比较两个专业成绩是否有明显差异可以通过分别求出各自的成绩平均值以及方差等方法,并画出柱状图来形象表示。 问题二分析:比较两个专业数学水平可以在平均值与方差的基础上进行T检验,从而得出结论。 问题三分析:根据处理后的数据分析高数成绩对其他两科的影响,首先根据数据画出散点图进行模型建立,再用matlab进行回归分析,求出回归系数并分析模型的残差,对模型进行改进直至得到较为满意的模型;并根据模型对问题进行分析得出结论。

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

相关文档
最新文档