关于葡萄酒问题的数学建模.

关于葡萄酒问题的数学建模.
关于葡萄酒问题的数学建模.

葡萄酒评价模型

摘要本文讨论了葡萄酒的评价问题。

对问题一,分别求出两组评酒员对各葡萄酒样品的平均评分,通过SPSS软件对同一类酒的两组得分进行T检验,检验结果表明两组评酒员的评价结果有显著性差异。再建立评酒员和样品葡萄酒得分的典型相关分析模型,运用MATLAB 求解,以样品葡萄的得分与评酒员的相关系数越大评分越不可信为依据,得出第二组的评分更可信的结论。

对问题二,以第二组的评分为准,对葡萄酒的质量进行排序,得出排序向量,对酿酒葡萄中各个理化指标进行排序,得出排序矩阵,排序向量与排序矩阵的各列进行点乘,得到葡萄酒质量与酿酒葡萄中各个理化指标的内积,以此内积作为葡萄酒的质量与酿酒葡萄中各个理化指标的相似度指标,选出相似度较高的五项指标作为酿酒葡萄分级的参考指标。根据参考指标对酿酒葡萄进行分级,分别得出了依香气、口感、外观进行分级的酿酒葡萄分级结果(见表五,表六)。

对问题三,建立非线性回归模型,讨论酿酒葡萄与葡萄酒理化指标的联系。将葡萄和葡萄酒的理化指标进行无量纲化处理,利用最短距离法,选出葡萄理化指标中对葡萄酒理化指标影响最大的五项作为回归自变量,以葡萄酒的理化指标为回归因变量,运用MATLAB求解得到酿酒葡萄与葡萄酒的理化指标之间的4次函数关系式(见表七,表八)。

对问题四,建立酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量的多重T检验模型。应用SPSS软件进行T检验,通过检验结果所体现出的向量整体差异程度表明,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响较大,故可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量。

关键词理化指标;T检验;典型相关系数;回归模型;葡萄酒评价

一、问题重述

由于葡萄酒不仅饮用口感佳,而且还具有延缓衰老、滋补养颜、预防心脑血管病、预防癌症等功效,因而受到越来越多人的亲睐。葡萄酒厂在对葡萄酒质量进行鉴定时,一般是通过聘请一批有专业知识和资质的评酒员对葡萄酒进行品评。每名评酒员品评后会根据评判标准对所品葡萄酒进行打分,然后求其所有评酒员的打分之和,从而确定葡萄酒的质量。酿酒行业很多人把葡萄园作为葡萄酒厂的第一车间,这个比喻充分说明了原料质量对成品质量的重要性,所以说酿酒葡萄的好坏直接影响着葡萄酒的质量。葡萄酒和酿酒葡萄的理化指标在一定程度上反映了葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。根据记录的数据,通过数学模型完成如下问题:问题一:分析附件1中两组评酒员的评价结果有无明显差异,如果有差异,进一步讨论哪一组结果更可信。

问题二:根据酿酒葡萄的理化指标和葡萄酒的质量的对应关系,对这些酿酒葡萄进行分级。

问题三:根据不同酒样分析酿酒葡萄与葡萄酒的理化指标之间的联系。

问题四:分别分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。并以此判断能否利用酿酒葡萄和葡萄酒的理化指标判断葡萄酒的好坏。

二、问题分析

针对问题一,为比较分析两组评酒员的评价结果有无显著性差异,需先分别求出每组中各葡萄酒质量的平均值。再将所求的第一组红葡萄酒质量的平均值与第二组红葡萄酒质量的平均值、第一组白葡萄酒质量的平均值与第二组白葡萄酒质量的平均值分别进行T检验,进而可确定两组评酒员的评价结果是否存在显著差异。

确定哪一组结果更可信问题。由于影响各葡萄酒评分大小的因素主要有评酒员打分差异与葡萄酒自身质量。根据实际可知可信度越高的组别,其打分与评酒员的相关关系越小,故以评酒员编号与该评酒员所打分数做为变量,可建立典型相关分析模型。然后根据模型计算出每组评酒员编号与所得分的相关系数,判断其可信度。

针对问题二,由于酿酒葡萄的分级与其自身各项理化指标的大小有关,而酿酒葡萄中各项理化指标大小对酿酒葡萄的影响会在葡萄酒质量的好坏中体现,所以本文将根据葡萄酒质量的好坏来判断酿酒葡萄中各理化指标的大小,而后以葡萄中对葡萄影响较大的理化指标为酿酒葡萄分级的依据。用问题一中更可信一组的评分对葡萄酒的质量进行排序,得出排序向量,对酿酒葡萄各理化指标进行排序得到排序矩阵,用排序向量和排序矩阵各列的点乘值表示相似度,相似度越高则该理化指标对酿酒葡萄的影响越大。将按照相似度的大小对酿酒葡萄受各项理化指标的影响程度进行排序,选出排在前面5个理化指标作为酿酒葡萄分级的依据,从而进行分级。

针对问题三,由于酿酒葡萄和葡萄酒的理化指标的量纲不同,所以为讨论酿酒葡萄与葡萄酒的理化指标之间的联系,需将原始表格中各数据转化为无量纲,进而得到一组新数据表,再运用最短距离法将新葡萄酒数据表中每一组数据与新

酿酒葡萄的数据求差的平方和,平方和越小,两组数据近似度大,进而将得到一个关于差平方和的279?阶矩阵P ,对矩阵中每一列按从大到小进行排序,取前五行数据进行拟合,建立非线性回归模型,从而可确定酿酒葡萄与葡萄酒的理化指标之间的联系。

针对问题四,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可先将酿酒葡萄、葡萄酒的理化指标与葡萄酒质量无量纲化,可利用SPSS 软件,对酿酒葡萄和葡萄酒的各项理化指标与葡萄酒质量进行T 检验,可进一步分析与葡萄酒质量存在显著性差异的理化指标数目。从而确定根据酿酒葡萄与葡萄酒是否能判断葡萄酒质量。

三、基本假设

1.假设葡萄酒的质量基本服从正态分布; 2.原始数据真实可靠;

3.未被测量出来的指标对葡萄酒质量的影响忽略不计。

四、符号表示

符号表示

符号说明

-

1x 第一组样本数据的平均数 -

2x 第二组样本数据的平均数

21

x σ

第一组样本方差 22

x σ

第二组样本方差

p 评酒员的编号

q

分数

λ 相关矩阵的特征根

ij ω

第i 组数据与第j 组数据的方差和

ε

拟合过程的随机误差

五、模型建立与求解

葡萄酒评价结果受多方面因素影响,葡萄酒的质量与原材料酿酒葡萄有直接影响,酿酒葡萄和葡萄酒的理化指标确定着葡萄酒的质量,以及影响葡萄酒最终评价结果的因素是多方面,现就针对酿酒葡萄好坏与葡萄酒质量以及酿酒葡萄和葡萄酒的理化指标之间的关系,来讨论题目中的四个问题。 5.1 两组评酒员评价的选择

首先分析两组评酒员的评价结果有无显著差异,再进行可信度分析,选可信度高的一组为葡萄酒质量的评判标准。

5.1.1分析两组评酒员的评价结果有无显著性差异

为分析两组评酒员的评价结果有无显著性差异,本文首先运用EXCEL 求得每组中各红葡萄酒的平均分(见附录一)以及白葡萄酒的平均分(见附录一),而后运用T 检验方法进行双重比较。这种方法为比较第一组与第二组平均数,即

检验

210:μμ=H

方法采用配对样本均值T 检验

1

2662

122

21

2

1--+-=

-

-

n x x x x t x x σγσ

由于本题中两组数据来自于相同样本,所以,1=γ。 再利用SPSS 软件对问题进行求解得到如下数据结果:

表一 附件1中各表成对样本统计量

成对样本统计量

均值

N 标准差 均值的标准误差

对1 一组红 73.1967 30 7.46216 1.36240 二组红 70.7067 30 3.89331 0.71082 对2

一组白 74.4129 31 4.83175 0.86781 二组白 76.4452

31 3.06005 0.54960

表二 附件1中各表成对样本相关系数

成对样本相关系数

N 相关系数 Sig 对1 一组红&二组红 30 0.715 0 对2 一组白&二组白 31 0.239 0.196

表三 附件1中各表成对样本检验

成对样本检验

成对差分

t df Sig

均值 标准差

均值的标准误差

差分的95%置信区

下限

上限

组一红——组二红 2.4900

5.41335

0.98834

0.46862

4.51138

2.519

29

0.018

组一白——组二白

-2.0322 5.06421 0.90956 -3.8898 -0.17469 -2.234 30 0.033

在T 检验中,当Sig 大于等于0.05时,即05.0≥Sig ,两者间无显著性差异;反之,当Sig 小于0.05时,即05.0≤Sig ,两者间有明显的显著性差异。

由表三的数据可知,第一组红葡萄酒与第二组红葡萄酒之间的样本检验结果

05.0018.0<=Sig ,故针对第一组红葡萄酒与第二组的红葡萄酒,两组评酒员的

评价结果有显著性差异。第一组白葡萄酒与第二组白葡萄酒之间的检验结果的

05.0033.0<=Sig ,故针对第一组白葡萄酒与第二组白葡萄酒评分过程中,两组

评酒员的评价结果仍有显著性差异。 5.1.2确定哪一组结果更可信问题

在大量的实际问题中,葡萄酒样品的得分与该葡萄酒的质量、评分员的自身因素有关。判断可信度可转化为判断评分与评分人的相关系数大小。

将27种葡萄酒样品看成27次观测,由葡萄酒的得分与评分员编号作为变量,建立典型相关分析模型:

设有两组变量'21),..,(p x x x X =和'21),...,(q y y y Y =,分别进行了n 次观测,构成样本矩阵(Y X ,):

??

?

?

?

?

?

??=np p p n np

n p p y y y y x x y x x y x x Y X ....................................),(2111

21221

11111

(1)

其中,27,10===n q p 。

首先,将样本数据的元素进行标准化处理,利用离差标准化后所得内积为相关系数得相关矩阵:R

???

? ??=22211211R R

R R R 再由分块矩阵,得到矩阵乘积:2112212R R R -和121

1121R R R -,而后又可得到特征方程,进而求得特征向量,此时的特征向量即为所求的典型相关系数,对典型相关系数的检验本文采用2χ检验法进行显著性检验,从而选出有应用意义的相关系数。相关系数越小,评分越公平,可信度越高。本题以第一组红葡萄酒为例进行求解:

将原始数据记为矩阵形式,标准化之后计算出相关矩阵。根据相关矩阵R 得出特征根i λ(101 =i )。

利用2χ检验法进行显著性检验,方法是求其2i Q 的最大值,进而确定与2i Q 最大值对应的特征根。下表表四中给出针对i λ,其中10...2,1=i .

对第i 个典型相关系数i λ进行显著性检验时,先假设0H :i λ=0,令:

∏=-=∧k

i

j j i )1(2λ

在U 和V 的情况下,统计数i q p i n Q ∧??

?

??++---=ln )1(212

如果i λ通过了显著性检验,则表明第i 个典型相关系数i λ显著,或称为第i 对

典型变量i i V U ,有显著相关[1]。

运用MATLAB 求出对应的i ∧和2i Q (见下表四)。

表四 第一组红葡萄酒的显著性检验

0.0560 0.1374 0.2370 0.3094 0.4588 0.5068 0.6510 ∧ 0.4189 0.4202 0.4283 0.4538 0.5019 0.6357 0.8553 2Q

31.7595

30.7794

29.2536

26.4683

22.4040

14.2704

4.7672

10λ

0、9256 1.1605

5.5575

1.4842

10.3643 29.8856 2Q 11.6488

66.6435 93.4279 由表四可知,2Q 最大值为93.4279时,对应10λ的值。同理可以利用相同的

办法,分别求第一组白葡萄酒,第二组红葡萄酒以及白葡萄酒当2Q 取的值最大时,所对应的λ值。通过求解得到第一组白葡萄酒2Q =66.6751,3723.3=λ;第二组红葡萄酒2Q =82.7456,6115.4=λ;第二组白葡萄酒2Q =65.7723,0523.10=λ。对于同一颜色的葡萄酒,λ值越大,说明显著性差异越大,可信度越低,综上所述,第二组的评分较第一组更可信。

5.2酿酒葡萄的理化指标和葡萄酒质量对酿酒葡萄分级。

本文将先对葡萄酒的质量依照问题一中更可信的一组的评分进行从大到小排序,由第一问的结果知第二组的评分更可信,所以本题将采用第二组的数据(见题目附录一)作为原始数据来对酿酒葡萄进行分级。

设有向量),...,,(21m φφφφ=,h m h ?=),...,,(21????,其中φ表示第二组红葡萄酒评分的平均值按从大到小以此排列,?表示酿酒葡萄中各成分依次排列,30,27==h m 。葡萄酒质量与酿酒葡萄中各个理化指标排序的相似度:?φ?=B 。其中,B 为一个301?向量。

现按照B 向量中元素的大小对酿酒葡萄受各项理化指标的影响程度进行从大到小的排序,具体排序结果见附录二。然后选出排在前面5个理化指标作为酿酒葡萄分级的依据。酿酒葡萄分级方法为:对酿酒葡萄分别就其外形、香气、口感进行分级,其中,当某种酿酒葡萄的该5个理化指标均排在所有样品酿酒葡萄的前5名时,该酿酒葡萄为一级酿酒葡萄,若只有4个理化指标排在所有样品酿酒葡萄的前5名时,该酿酒葡萄为二级酿酒葡萄,依次类推,共分六级。白葡萄酒的酿酒葡萄等级划分与红葡萄一致,以下为对红、白酿酒葡萄分级结果:

表五 第二组红酿酒葡萄的等级划分结果

第二组红酿酒葡萄的等级划分结果

分级标准

一级 二级 三级 四级 五级 六级

外形

17、5、26

10、20、24

11、18、27、7、8、14、9、3、1、25 2、4、6、12、13、15、16、19、21、22、23

香气 17 5

20、26、24、6、12、25

8、14、15、3、18、

22 1、2、4、7、9、10、

11、13、16、19、21、

23、27

口感

2、9、3

20、21、22 16、13、12、6、

17、5、11、14、8、

26

1、4、7、10、15、18、

19、23、24、25、27

表六第二组白酿酒葡萄的等级划分结果

分级标准

第二组白酿酒葡萄的等级划分结果

一级二级三级四级五级六级

外形13 15、6

18、10、8、

24

11、1、5、27、7、

14

2、3、4、9、12、13、

16、17、19、20、21、

22、23、25、26、28

香气13 6、18 15、8、14

11、1、10、26、

2、27、24、21、

7

3、4、5、9、12、13、

16、17、19、20、22、

23、25、28

口感13、9 11、6、27、3

15、18、24、7、

5、20、28、19、

16、8

1、2、4、10、12、13、

14、17、21、22、23、

25、26

5.3酿酒葡萄与葡萄酒的理化指标之间的联系

为讨论酿酒葡萄与葡萄酒的理化指标之间的联系,首先将题目中附录2的原始数据统一量纲。

本题将原始数据转化为无量纲化的方法为:

--

-=

j j

ij ij

x x

x

p

其中,27

...,

2,1

,9

...,

2,1=

=j

i.

转化后得到一个新数据表(见源程序),而后运用最小距离法求方差和

2

27

1

) (

∑=-

=

s

js is

ij

x x

w

其中,9

,...,

2,1

,9

...,

2,1=

=j

i.

将新表格中的元素看成一个矩阵,并对新表格的数据进行排序,进而可得到一27

9?阶矩阵P而后取矩阵的前五行,具体见下表七:

表七葡萄酒理化指标前五行的数据表

花色苷单宁总酚酒总黄

白藜芦

醇DPPH

色泽

L*

色泽

a*

色泽

b*

第一影

响指标

5 10 10 7 14 10 5 5 5 第二影

响指标

2 12 12 10 21 12 26 26 26 第三影

响指标

3 7 7 12 20 7 15 15 15 第四影

响指标

6 8 8 8 24 8 3 3 3 第五影

响指标

4 11 11 11 1

5 11 24 24 24

从图中可得出对红葡萄酒各类理化指标影响最大的5种葡萄理化指标,而后

对表七中数据按每列分别进行拟合,建立线性回归模型来分析酿酒葡萄与葡萄酒的理化指标之间的联系。

这里以红葡萄酒为例,分析酿酒葡萄与葡萄酒的理化指标之间的联系,白葡萄酒与酿酒葡萄的理化指标与红葡萄酒方法类似。

假设,54321,,,,x x x x x 为每列各理化指标的影响指标。首先,我们建立

54321,,,,x x x x x 之间线性模型,即

ε+++++=5544332211x a x a x a x a x a y (2) 此时,利用MATLAB 统计工具箱的命令REGRESS 求解,得到检验统计量1396.02=R ,即因变量可由模型确立的百分比太小,此时不符合实际情况。再考虑当自变量之间有相互影响时,在(2)式的基础之上,再加上54321,,,,x x x x x 之间的交互项,这时,重新建立54321,,,,x x x x x 之间二次模型,即

ε+++++++++=5544332211514413312211x a x a x a x a x a x x b x x b x x b x x b y (3) 此时,利用MATLAB 统计工具箱的命令REGRESS 求解,得到检验统计量3067.0.02=R ,此时还是不符合实际情况。在(3)式的基础上,再考虑

2

5

24232221,,,,x x x x x 项的影响,得到如下模型 115144133122112

55244233222211x a x x b x x b x x b x x b x c x c x c x c x c y +++++++++=

ε+++++55443322x a x a x a x a (4)

利用MATLAB 软件求解,得到检验统计量7693.02=R ,此时依然不符合实

际情况。在(4)式的基础上,再考虑3

534333231,,,,x x x x x 项的影响,得到如下回归模型

2112

55244233222211355344333322311x x b x c x c x c x c x c x d x d x d x d x d y ++++++++++=

ε+++++++++5544332211514413312x a x a x a x a x a x x b x x b x x b (5)

利用MATLAB 软件对模型进行求解,得到检验统计量8584.02=R ,此时仍

旧与实际情况不相符。在(5)式的基础上,再考虑4

544434241,,,,x x x x x 项的影响,得到如下回归模型

++++++++++=3

55344333322311455444433422411x d x d x d x d x d x e x e x e x e x e y +++++++++5144133122112

55244233222211x x b x x b x x b x x b x c x c x c x c x c

ε+++++5544332211x a x a x a x a x a (6)

利用MATLAB 软件对模型进行求解,得到检验统计量9650..02=R ,与实际

问题相符。故可以选择不同指数综合考虑的回归模型,具体的拟合曲线的系数如下表八:

表八 葡萄指标对红葡萄酒指标拟合曲线系数表

葡萄酒 葡萄

花色苷 单宁 总酚

酒总黄酮 白藜芦醇 DPPH 色泽 L* 色泽 a* 色泽 b* 1a -2.0810 -3.264 -3.485 -3.482 2.5813 -5.717 2.3207 -0.7539 -1.6898 2a 5.5774 -1.554 -3.294 0.6879 -4.4878 -5.936 -6.3168 0.6808 0.0882 3a -1.113 -1.111 -1.655 -6.335 -14.665 -1.020 -0.4018 1.6233 -0.4428 4a 2.0687 -2.009 -2.738 -3.811 4.5194 -4.760 -2.4851 0.7981 0.5245 5a -7.497 -2.053 -2.658

-1.681

12.1852

-3.356

-1.0232

0.0999

-0.7205

1b 0.7238 3.2862 3.1035 -21.30 22.4428 4.1435 4.4274 -7.8805 4.8534 2b 4.6867 -7.071 0.9299 2.0524 5.4876 -1.721 -14.048 8.4737 -2.5039 3b -2.409 -4.709 -11.58 18.465 -111.42 -11.89 -4.5711 6.4387 -9.4114

4b 1.3635 13.909 13.686 10.463 44.9664 24.584 2.4973 -0.0614 -2.4710 1c -49.69 -1.214 -0.630 -2.002 27.9148 -0.008 -4.2847 1.1068 -1.0702 2c -1.928 5.3578 1.6304

7.6467 1.1135 7.5892 3.8575 -2.0229 3.1407 3c -9.730 -5.043 -8.450 8.9047 15.7181 4.7836

-4.3010 6.1883 -10.108 4c 6.8525 2.7181 3.1818

-5.124 -32.589 -12.57 -4.6746 3.2614 -4.6475 5c

-22.80

-7.966 -9.072 -1.128 -13.466 -15.44 1.3226 2.2006 1.4848 1d -4.702 20.357 20.111 57.159 -28.365 35.581 16.438 -0.7395 6.7168 2d -10.31 -8.252 8.4945 3.7666 11.8532 23.526

-2.3239 6.0519 -5.6060 3d 3.0575 16.884 25.664 65.522 6.8677 30.838 -10.261 4.1206 -6.145 4d -11.64 -16.22

-17.85

-7.554 32.4977 -30.46 -1.3453 -0.2448 0.8775 5d -21.01

0.2350 0.1999

0.2168

-13.429

0.2041

-15.557

5.2348

5.9583

1e -4.016 -1.042 -1.029 98.729 6.4630 -1.817 -27.692 26.3769 -17.54 2e 2.9456 3.5910 15.652 -0.1958 -8.5158 37.109 4.6856 -4.9077 1.2969 3e -0.8098 25.995 46.172 21.473 143.684 52.574 23.8807 -19.1232 22.0618

4e -7.1069 4.3132 4.9865 1.7031 -61.050 8.3423 0.2032 0.0821 -0.1181 5e 44.828 0.007 -0.0016 0.0284 -27.318 -0.0200 6.2635

-9.8567

21.3643

2R 0.9650 0.937 0.9075 0.7632 0.9164 0.9300 0.9138 0.9291 0.9082 注:51~a a 表示一次项系数,

41~b b 表示各指标与第一重要指标交互影响的系数,51~c c 表示二次项系数,51~d d 表示三次项系数,51~e e 表示四次项系数。

从表中可得出红葡萄酒理化指标与5种对葡萄酒理化指标最具影响力的葡萄理化指标之间的函数关系,由于这其余的葡萄理化指标对红葡萄酒的某一指标影响不大,故该函数关系基本可以描述葡萄的所有理化指标与红葡萄酒某一指标的关系。

5.4酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响问题

算出酿酒葡萄与葡萄酒的各理化指标与其平均值之比,可将理化指标无量纲化,得到各个指标的新数据。利用第二组所打分数,计算每瓶葡萄酒的最终得分与其平均分的比值。为了找出理化指标与葡萄酒质量的关系,建立酿酒葡萄和葡萄酒的理化指标序列、葡萄酒质量序列两个向量],,,[1p k k k K i 与

],,[1q j l l l L =,其中p 为样品数,q 为理化指标编号,j l 为第j 个理化指标关于p 个样品的向量。建立多重T 检验模型,即比较K 与第j L 组平均数,即检验

j l K H μμ=:0,.,,1q j =

采用两个正态总体均值的T 检验,取检验统计量

q j q p MS l k t E j

Kj ,,1,)

/1/1( =+-=

当0H 成立时,),(~r p t t Kj -所以当)(2r p t t Kj ->α

时,说明K μ与j μ差异显

著。定义相应的P 值为

{}

Kj Kj t r p t P p >-=)(。

即服从自由度为r p -的t 分布的随机变量大于Kj t 的概率。若P 值小于指定的α值,则认为K μ与j μ有显著差异[2]。

应用SPSS 软件通过分别判断向量X 和j Y 之间出是否存在显著差异,以红葡萄酒的理化指标为例,将理化指标做为其中一个变量,红葡萄酒的质量为另一变量,求解结果如下表:

表九 利用SPSS 软件解出的t 值

成对差分

t

df

Sig.(双侧) 均值 标准差

均值的标

准误 差分95% 置信区间 下限 上限 红1 - 红 .58933 .83651 .16099 .25842 .92025 3.661 26 .001 红2 - 红 .00274 .69469 .13369 -.27207 .27755 .021 26 .984 红3 - 红 -.00004 .72524 .13957 -.28693 .28686 .000 26 1.000 红4 - 红 .00015 .80900 .15569 -.31988 .32018 .001 26 .999 红5 - 红 .00000 1.13259 .21797 -.44804 .44803 .000 26 1.000 红6 - 红 .22348 .58767 .11310 -.00899 .45596 1.976 26 .059 红7 - 红 .37484 1.92434 .37034 -.38640 1.13608 1.012 26 .321 红8 - 红 .49804 2.36282 .45473 -.43666 1.43275 1.095 26 .283 红9 - 红 .41185

2.28530

.43981

-.49219

1.31588

.936

26 .358

分析表中数据,并计算红葡萄的理化指标对红葡萄酒质量的显著性,白葡萄与白葡萄酒的理化指标对白葡萄酒质量显著性的计算过程与红葡萄酒一致,得到如下结果:

1.红葡萄的各项理化指标与红葡萄酒的质量均无显著性差异,红葡萄的单宁含量对红葡萄酒质量影响最大;

2.红葡萄酒的氨基酸含量与红葡萄酒的质量有显著性差异,其余各项均不显著,红葡萄酒的酒总黄酮含量对红葡萄酒的质量影响最大;

3.白葡萄的Vc 、果穗质量、出汁率与果皮质量的含量有显著性差异,其余

各项均不显著,白葡萄的总黄酮与总糖含量对白葡萄酒质量影响最大;

4. 白葡萄的色泽与白葡萄酒的质量有显著性差异,其余各项均不显著,白葡萄的酒总黄酮含量对白葡萄酒的质量影响最大。

通过以上分析可得,与葡萄酒质量有显著性差异的指标数目远小于无显著差异的指标数目,故可以用葡萄和葡萄酒的理化指标来衡量葡萄酒的质量。

六、模型评价与推广

模型评价:

模型一中第一问应用了T检验方便易操作,同时也因忽略数据的细微差别不够精确;第二问将可信度转化为相关性,分析问题较为明了。

模型二中通过排名序列相似度的比较,确定各项理化指标对葡萄酒总质量的影响,思路简单,易于理解。

模型三中先将葡萄的理化指标进行筛选,依据其对葡萄酒理化指标影响程度,使得数据更易处理;回归分析时对数据进行了多次拟合,使得结果更为合理可信;但回归分析的自变量过多,不易清晰的看出某个自变量与因变量的对应关系。

模型四中运用多重T检验,将复杂问题清晰化,问题明了。

模型推广:

绿色食品是现在热门食品,对于食品原料的分类也显得尤为重要,模型二是对样品酿酒葡萄的等级划分,所以,模型二可以推广至对食品等原料的等级划分。

参考文献

[1] 李春喜,王文林,生物统计学[M],北京:科学出版社,1997,209,227—230.

[2] 薛毅,数学建模基础[M],北京:科学出版社,2011,399.

[3] 姜启源,谢金星,叶俊,数学模型[M],北京:高等教育出版社,2011.

[4] 韩忠庚,数学建模方法及其应用[M],北京,:高等教育出版社,2005.

附录一:

第一组各编号红葡萄酒得分平均值

1 2 3 4 5 6 7 8 9 10 总和平均值

1 85 80 88 61 76 93 83 80 95 79 820 82

2 78 47 86 54 79 91 85 68 7

3 81 742 74.2

3 85 67 89 75 78 75 66 79 90 79 783 78.3

4 7

5 77 80 65 77 83 88 78 85 8

6 794 79.4

5 84 47 77 60 79 62 74 74 79 74 710 71

6 61 45 83 65 78 56 80 66

7 65 84 684 68.4

7 84 81 83 66 74 80 80 68 77 82 775 77.5

8 75 46 81 54 81 59 73 77 85 83 714 71.4

9 79 69 81 60 70 55 73 81 76 85 729 72.9

10 75 42 86 60 87 75 83 73 91 71 743 74.3

11 79 46 85 60 74 71 86 62 88 72 723 72.3

12 64 42 75 52 67 62 77 56 68 70 633 63.3

13 82 42 83 49 66 65 76 62 65 69 659 65.9

14 78 48 84 67 79 64 78 68 81 73 720 72

15 74 48 87 71 81 61 79 67 74 82 724 72.4

16 69 49 86 65 70 91 87 62 84 77 740 74

17 81 54 90 70 78 71 87 74 92 91 788 78.8

18 86 44 83 71 72 71 85 64 74 81 731 73.1

19 75 66 83 68 73 64 80 63 73 77 722 72.2

20 80 68 82 71 83 81 84 62 87 80 778 77.8

21 84 49 85 59 76 86 83 70 88 84 764 76.4

22 65 48 90 58 72 77 76 70 80 74 710 71

23 71 66 80 69 80 82 78 71 87 75 759 75.9

24 82 56 79 73 67 59 68 78 86 85 733 73.3

25 86 80 82 69 74 67 77 78 77 81 771 77.1

26 75 66 82 75 93 91 81 76 90 84 813 81.3

27 58 40 79 67 59 55 66 74 73 77 648 64.8

28 66 75 89 69 88 87 85 76 88 90 813 81.3

总和213

6

158

8

233

8

180

3

213

1

203

4

221

8

257

8

227

1

222

6

2072

3

3822.36

36

平均值76.2

857

1

56.7

142

9

83.5

64.3

928

6

76.1

071

4

72.6

428

6

79.2

142

9

92.0

714

3

81.1

071

4

79.5

1429.

172

76.1535

7

第一组各编号白葡萄酒得分的平均分

1 2 3 4 5 6 7 8 9 10 总和平均值

1 51 66 49 54 77 61 7

2 61 74 62 627 62.7

2 71 81 86 74 91 80 8

3 79 85 73 803 80.3

3 80 85 89 76 69 89 73 83 8

4 76 804 80.4

4 52 64 6

5 6

6 58 82 76 63 83 7

7 686 68.6

6 72 69 71 61 82 69 69 64 81 84 722 72.2

7 63 70 76 64 69 84 72 59 84 84 715 71.5

8 64 76 65 65 76 72 69 85 75 76 723 72.3

9 77 78 76 82 85 90 76 92 80 79 815 81.5

10 67 82 83 68 75 73 75 68 76 75 742 74.2

11 73 60 72 63 63 71 70 66 90 73 701 70.1

12 54 42 40 55 53 60 47 61 58 69 539 53.9

13 69 84 79 59 73 77 77 76 75 77 746 74.6

14 70 77 70 70 80 59 76 76 76 76 730 73

15 69 50 50 58 51 50 56 60 67 76 587 58.7

16 72 80 80 71 69 71 80 74 78 74 749 74.9

17 70 79 91 68 97 82 69 80 81 76 793 79.3

18 63 65 79 65 52 57 62 68 70 68 599 59.9

19 76 84 84 66 68 87 80 78 82 81 786 78.6

20 78 84 76 68 82 79 76 76 86 81 786 78.6

21 73 90 96 71 69 60 79 73 86 74 771 77.1

22 73 83 72 68 93 72 75 77 79 80 772 77.2

23 83 85 86 80 95 93 81 91 84 78 856 85.6

24 70 85 90 68 90 84 70 75 78 70 780 78

25 60 78 81 62 70 67 64 62 81 67 692 69.2

26 73 80 71 61 78 71 72 76 79 77 738 73.8

27 70 77 63 64 80 76 73 67 85 75 730 73

总和186

7

202

8

201

2

178

9

202

9

197

9

194

197

4

213

8

202

9

1972

5

1972.5

平均值69.1

481

5

75.1

1111

74.5

185

2

66.2

592

6

75.1

481

5

73.2

963

71.8

518

5

73.1

1111

79.1

851

9

75.1

481

5

730.5

556

73.0555

6

第二组各编号红葡萄酒得分平均分

1 2 3 4 5 6 7 8 9 10 总和平均值

1 68 71 80 5

2 5

3 76 71 73 70 67 681 68.1

2 75 76 76 71 68 74 8

3 73 73 71 740 74

3 82 69 80 78 63 75 72 77 7

4 76 746 74.6

4 7

5 79 73 72 60 77 73 73 60 70 712 71.2

5 6

6 68 7

7 75 76 73 72 72 74 6

8 721 72.1

6 65 6

7 75 61 5

8 66 70 67 67 67 663 66.3

7 68 65 68 65 47 70 57 74 72 67 653 65.3

8 71 70 78 51 62 69 73 59 68 59 660 66

9 81 83 85 76 69 80 83 77 75 73 782 78.2

10 67 73 82 62 63 66 66 72 65 72 688 68.8

11 64 61 67 62 50 66 64 51 67 64 616 61.6

12 67 68 75 58 63 73 67 72 69 71 683 68.3

14 71 71 78 64 67 76 74 80 73 72 726 72.6

15 62 66 73 54 59 71 71 70 68 69 663 66.3

16 71 65 78 70 64 73 66 75 68 69 699 69.9

17 72 73 75 74 75 77 79 76 76 68 745 74.5

18 67 65 80 55 62 64 62 74 60 65 654 65.4

19 72 65 82 61 64 81 76 80 74 71 726 72.6

20 80 75 80 66 70 84 79 83 71 70 758 75.8

21 80 72 75 72 62 77 63 70 73 78 722 72.2

22 77 79 75 62 68 69 73 71 69 73 716 71.6

23 79 77 80 83 67 79 80 71 81 74 771 77.1

24 66 69 72 73 73 68 72 76 76 70 715 71.5

25 68 68 84 62 60 66 69 73 66 66 682 68.2

26 68 67 83 64 73 74 77 78 63 73 720 72

27 71 64 72 71 69 71 82 73 73 69 715 71.5

总和192

7

189

207

1

177

9

173

5

196

2

194

4

196

6

189

4

187

7

1904

5

3462.7

273

平均值71.3

037

04

70

76.7

037

04

65.8

888

89

64.2

592

59

72.6

666

67

72

72.8

148

15

70.1

481

48

69.5

185

19

705.

3703

7

70.5

第二组各编号白葡萄酒得分的平均值

1 2 3 4 5 6 7 8 9 10 总和平均值

1 84 78 8

2 75 79 84 81 69 75 72 779 77.9

2 79 76 77 85 77 79 80 59 64 70 746 74.6

3 85 7

4 71 87 79 79 80 4

5 83 73 75

6 75.6

4 84 78 74 83 69 82 84 66 77 72 769 76.9

5 83 79 79 80 77 87 82 73 84 91 815 81.5

6 83 75 74 69 75 7

7 80 67 77 7

8 755 75.5

7 78 79 74 69 69 82 80 61 72 78 742 74.2

8 74 78 74 67 73 77 79 66 73 62 723 72.3

9 77 78 89 88 84 89 85 54 79 81 804 80.4

10 86 77 77 82 81 87 84 61 73 90 798 79.8

11 79 83 78 63 60 73 81 61 60 76 714 71.4

12 73 81 73 79 67 79 80 44 64 84 724 72.4

13 68 78 79 81 78 72 75 62 65 81 739 73.9

14 75 77 76 76 78 82 79 68 78 82 771 77.1

15 83 77 88 80 84 83 80 63 76 70 784 78.4

16 68 63 75 60 67 86 67 71 52 64 673 67.3

17 77 69 79 83 79 87 88 75 78 88 803 80.3

18 75 83 82 79 74 84 78 71 74 67 767 76.7

19 76 75 78 70 81 80 83 66 78 77 764 76.4

21 81 80 79 85 83 76 80 58 85 85 792 79.2

22 80 76 82 88 75 89 80 66 72 86 794 79.4

23 74 80 80 80 74 79 75 73 83 76 774 77.4

24 67 80 77 77 79 78 83 65 72 83 761 76.1

25 79 76 79 86 83 88 83 52 85 84 795 79.5

26 80 72 75 83 71 83 83 53 62 81 743 74.3

27 72 79 84 79 76 83 77 63 79 78 770 77

28 75 82 81 81 78 84 79 71 76 89 796 79.6

总和2106

207

5

211

2112

205

7

2206

216

5

169

3

1993

210

4

2062

1

76.4892

9

平均值77.89

286

77.

035

71

78.

25

78.32

143

76.

25

81.78

571

80.

142

86

63

73.8

9286

78.

321

43

764.8

929

76.4892

9

附录二:

第二组红葡萄酒质量与酿酒葡萄中各个理化指标的相似度

红葡萄酒 1 2 3 4 5 6 外观 a 百粒质量果皮质量果穗质量VC含量L

香气百粒质量果穗质量可滴定酸果皮质量总糖DPPH自由

口感固酸比PH值可溶性固

形物

酒石酸黄酮醇L

红葡萄酒7 8 9 10 11 12

外观还原糖总糖 b 固酸比苹果酸可滴定酸

香气L b 氨基酸总

a 苹果酸VC含量

口感还原糖蛋白质黄酮总酚DPPH自由

氨基酸总

红葡萄酒13 14 15 16 17 18

外观白藜芦醇多酚氧化

酶活力

PH值

干物质含

氨基酸总

酒石酸

香气花色苷总酚果梗比黄酮褐变度还原糖

口感果皮质量花色苷柠檬酸白藜芦醇果梗比干物质含

红葡萄酒19 20 21 22 23 24

外观褐变度蛋白质柠檬酸黄酮醇可溶性固

形物

果梗比

香气可溶性固

形物

单宁PH值

干物质含

黄酮醇出汁率

口感总糖单宁多酚氧化

酶活力

百粒质量果穗质量苹果酸

红葡萄酒25 26 27 28 29 30

外观DPPH自由

花色苷出汁率黄酮总酚单宁

香气多酚氧化

酶活力

白藜芦醇蛋白质固酸比柠檬酸酒石酸

口感褐变度出汁率可滴定酸 b VC含量 a 附录三:

1.1 求出各组评分与评酒员编号的相关系数:

xdiyi

ydiyi

r=[x,y];

a=zscore(r);

R=cov(a)

p=10;q=10;n=27;%p,q为X,Y的列数,n为行数

R11=R(1:p,1:p);R12=R(1:p,p+1:p+q);R22=R(p+1:p+q,p+1:p+q);R21=R(p+1:p+q,1:p);

[v1,d1]=eig(R11),

[v2,d2]=eig(R22)

p1=inv(v1*sqrt(d1)*v1');

p2=inv(v2*sqrt(d2)*v2');

T1=p1*R12*inv(R22)*R21*p1;

T2=p2*R21*inv(R11)*R12*p2;

[va,da]=eig(T1),[vb,db]=eig(T2),

A1=p1*va,

B1=p2*vb,

r=sqrt(sum(da))

3.1 找出对葡萄酒理化指标影响最大的部分葡萄酒指标:

azhi

bzhi

czhi

x=cat(1,a',b',c');

yzhi

z=y';

for i=[1,2,3,4,5,6,7,8,9,16]

for j=1:9

t(j)=sum((x(i)-z(j)).^2)

end

end

3.2 葡萄理化指标对葡萄酒理化指标拟合(以红葡萄酒的花色苷指标为例):azhi

bzhi

czhi

x=cat(1,a',b',c');

yzhi

z=y';

x=cat(2,x(:,5),x(:,2),x(:,3),x(:,6),x(:,4),x(:,5).^2,x(:,2).^2,x(:,3).^2,x(:,6).^2,x(:,4).^2, x(:,5).*x(:,2), x(:,5).*x(:,3),x(:,5).*x(:,6),x(:,5).*x(:,4),x(:,5).^3,x(:,2).^3,x(:,3).^3,x(:,6).^3,x(:,4).^3,x(:,5).^4,x(:, 2).^4,x(:,3).^4,x(:,6).^4,x(:,4).^4);

y=z(1,:)';

[b,bint,r,rint,stats]=regress(y,x)

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

国赛数学建模A题葡萄酒论文

葡萄酒的评价 一、摘要 对于问题一,考虑到分数间不存在相关性,样本量偏小,需要对两组数据进行比较分析,我们采用了非参数检验中的Wilcoxon符号秩检验,评判结果均有显著性差异。在此情况下,比较同组内十名品酒员对同一样品酒给出的总分的方差,再令得到的多组方差取平均,无论红葡萄酒和白葡萄酒,都是第一组方差较大,故第二组的评分较为可信。另外由于所给数据大量且复杂,需预先对数据进行预处理,排除明显错误数据,用组内均值替代缺失数据。 对于问题二,先用SPSS对芳香物质和香气指标总分进行简单相关分析,筛选芳香物质中与香气评分相关性较大的成分。将保留的芳香物质和葡萄的理化指标与葡萄的质量进行逐步回归分析,得到回归方程。在得到结果后,我们也检验了数据满足逐步回归分析的条件。最后将不同组葡萄的指标系数代入,根据分数值对葡萄分级,最终红、白葡萄酒都被分为六级。 对于问题三,我组首先对葡萄酒与酿酒葡萄当中相同的指标进行了简单相关性检验,得出其中大部分指标是强相关的,但是有一些指标(例如白酒的色素)是不相关的。为了对这些指标进行进一步的分析,我组对含有二级指标的指标组进行了典型相关性分析,分析多个指标与多个指标间的关系。而像酒总黄酮这类的单独指标,则进行了逐步线性回归,探究与所有可能有联系的指标间的联系。 对于问题四,我组以品酒员测定的指标等级为依据,希望通过逐步线性回归与Topsis排序的方法归纳出葡萄酒和葡萄理化指标间的数量关系,进而还原出品酒员所评定的等级。但是在具体实践过后,两种方法的分级都与品酒员的分级有较大的误差,故认定不能直接通过理化指标去确定葡萄酒的等级。 关键词:葡萄酒质量符号秩检验主成分分析逐步回归主成分分析 二、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.360docs.net/doc/5c13379526.html,/journal/aam https://www.360docs.net/doc/5c13379526.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/5c13379526.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

全国大学生数学建模竞赛题葡萄酒的评价答案全解

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析

大学生数学建模竞赛A题优秀论文A题葡萄酒

葡萄酒质量的评价 摘要 葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。 首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01 -数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。综合来看,主观因素对葡萄酒质量的评价具有不确定性。 结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。 为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。 由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。研究葡萄酒理化指标与葡萄酒质量的联系,需要运用变量间的相关性及Pearson系数法分析葡萄酒的理化指标与葡萄酒质量评价指标的相关性,通过比较选出与葡萄酒评价的一级指标相关性程度大的葡萄酒成分,进行回归分析法,建立酿酒葡萄的理化指标与葡萄酒质量之间的拟合方程,结合各个质量一级指标的权重,从而完成了从葡萄酒成分对葡萄酒质量的客观评价。综合计算结果,与酿酒葡萄分级的结果吻合,所以分析结果较客观。 关键词:葡萄酒双重多因素分析01 -数据分析 Alpha模型聚类分析及欧式距离相关性分析多元回归Pearson系数法

相关文档
最新文档