2012高教社杯全国大学生数学建模竞赛 葡萄酒的评价

2012高教社杯全国大学生数学建模竞赛  葡萄酒的评价
2012高教社杯全国大学生数学建模竞赛  葡萄酒的评价

葡萄酒的评价

摘要

对于问题一,用双总体t 检验法来分析两组评酒员的评价结果有无显著性差异。通过计算统计量t 值并与理论T 值比较,推断T t ≤发生的概率,即差异不显著发生的概率,用方差分析的方法分析两组数据的可信度,得到的结果为:两组评测结果均存在显著性差异,第二组得出的结果更可信。

对于问题二,根据酿酒葡萄的理化指标和葡萄酒的质量数据运用聚类分析法对酿酒葡萄进行分级。根据问题一以第二组评酒组给出的葡萄酒评分数据为葡萄酒质量评测基础。运用主成分析法对酿酒葡萄的质量情况进行综合分析,得出衡量葡萄质量的指标分数。运用SP SS 对酿酒葡萄的理化指标得分和葡萄酒的质量评分数据进行聚类分析,得到各个葡萄样品在理化指标评价以及成品酒的质量比较下得到的分级情况为:

酿酒红葡萄中特级品有21,一级品有4,6,7,9,11,12,15,18,19,20,22,23;二级品有3;三级品有1,2,5,8,10,13,14,16,17,24,25,26,27。酿酒白葡萄中特级品有1,2,8,13,16,17,18,19,22;一级品有2,6,7,9,11,12,14,21,23;二级品有3,28;三级品有4,5,10,15,20,24,25,26,27。

对于问题三,采用多元线性回归分析的方法将没有严格的、确定性的函数关系的酿酒葡萄与葡萄酒的理化指标之间的联系转化为最能代表它们之间关系的数学表达形式。令葡萄酒的几个理化指标为随机变量Y ,酿酒葡萄的各项指标为普通变量()12,,,1n x x x n ???>,随机变量与普通变量关系的利用SP SS 软件将附件二给出的指标相关数据与多元线性回归模型:

()2

01122,~0,n n Y b b x b x b x N εεσ

=+++???++

进行拟合,得到葡萄酒的几个理化指标与酿酒葡萄的各项指标间的关系方程,并通过显著性检验来确定获得的回归方程的相关显著。

对于问题四,用灰色关联分析方法来算出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量间的关联度,关联度越高说明因素间的影响程度越大。得到的结论为:酿酒葡萄和葡萄酒的大部分理化指标对葡萄酒质量的影响非常大,能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词 葡萄酒 t 检验 聚类分析 分级

1.1背景分析

葡萄酒是一种色香味俱佳的饮品,它既能给人们带来较优的感官享受,又具有相当高的营养和保健价值。

葡萄酒是唯一的碱性酒精饮料,糖类、蛋白质、果胶、氨基酸、维生素等营养物质含量丰富,并含有锰、锌、钼、硒等多种人体必需微量元素。红葡萄酒中富含的活性物质——白藜芦醇具有降低血液中胆固醇和甘油三脂浓度的作用,能够有效预防动脉粥样硬化症、冠心病以及血栓,降低患骨质疏松等老年病的发生率,所以葡萄酒被誉为老年人的“牛奶”;红葡萄酒含有的强抗氧化剂D P P H以及总黄酮,具有强的抗氧化性,可清除身体中产生的自由基,有很强的防癌、抗衰老及防止血小板凝结造成血管阻塞的作用;葡萄酒酿造过程中产生而具有的单宁酸,能够预防心脏血管疾病。葡萄酒中含有的氨基酸种类及其含量分布与人体血液中氨基酸的种类及含量极为接近,因此,葡萄酒又被称为“天然氨基酸”。葡萄酒凭借其具有的较好地防癌的效用而被联合国卫生食品组织批准为“最健康、最卫生的食品”。

不同品质的葡萄酒的营养与保健价值具有重大差异,因而分出葡萄酒质量的优劣具有重要意义。

与标准产品不同,由于影响葡萄酒风味的因素有很多,种植地的气候、水文、土壤均会对葡萄酒的质量造成明显影响,每一个葡萄酒产区生产的葡萄酒都有其独特的风味,因而没有统一的评价标准。同样,由于各地生产的葡萄酒的气味、口感、色泽具有很大不同,各种葡萄酒在不同层面上各有千秋,故葡萄酒的质量确定具有很多困难。为较好地确定葡萄酒的质量,人们付出了很多努力。人们曾致力于用现代仪器分析来确定葡萄酒的质量,但由于葡萄酒的种类繁多,仪器判别总是有较大的误差,因而传统的感官评价仍然是目前评价葡萄酒质量的主要方式。

1.2问题重述

感官评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

要求根据问题所给数据建立数学模型对下列问题进行讨论:

1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3、分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

附件1:葡萄酒品尝评分表(含4个表格)

附件2:葡萄和葡萄酒的理化指标(含2个表格)

附件3:葡萄和葡萄酒的芳香物质(含4个表格)

为保证解题思路清晰,确立正确的解题方向,对给出的问题分别进行分析。 2.1问题一的分析

用双总体t 检验法来分析两组评酒员的评价结果有无显著性差异。第一步:建立虚无假设0H ,第二步:计算统计量t 值,第三步:根据自由度df n 1=-,查t 值表,找出规定的T 理论值并进行比较,第四步:比较计算得到的t 值和理论T 值,推断T t ≤发生的概率,即差异不显著发生的概率,根据已知的T 值对两组评酒员的评价结果间的显著性差异做出判断。将附件中给出的评酒员对葡萄酒酒样品的评测总分导入SP SS 进行方差分析,运算得到评酒员对葡萄酒评分数据的F 值,继而比较得出哪组数据可信度更高。 2.2问题二的分析

根据酿酒葡萄的理化指标和葡萄酒的质量数据用聚类分析法对酿酒葡萄进行分级。

葡萄酒质量情况选用问题一中选取的可信度较高的评测组给出的评测数据。由于酿酒葡萄具有众多理化指标,要综合所有理化指标来对酿酒葡萄的质量情况进行分级存在很多困难。为简化计算,选取几个主要的理化指标对葡萄质量等级进行判定。运用主成分析法选取对葡萄质量等级确定贡献率大于80%的理化指标,选择作为主成分,确立其与原理化指标间关系,得出衡量葡萄质量的指标分数。用SP SS 对酿酒葡萄的理化指标和葡萄酒的质量数据进行聚类分析,对葡萄的质量进行聚类分级,得到各个葡萄样品在理化指标评价以及成品酒的质量比较下得到的等级情况。 2.3问题三的分析

要分析酿酒葡萄与葡萄酒的理化指标之间的联系,需要将没有严格的、确定性的函数关系的酿酒葡萄与葡萄酒的理化指标之间的联系转化为最能代表它们之间关系的数学表达形式,从而对其间关系进行研究。

令葡萄酒的几个理化指标为随机变量Y ,酿酒葡萄的各项指标为普通变量()12,,,1n x x x n ???>,由于自变量和因变量之间没有严格的、确定性的函数关系, 我们采用多元回归分析来找出最能代表它们之间关系的数学表达形式,并通过回归方程的显著性检验来确定获得的回归方程的相关性,最终确定酿酒葡萄与葡萄酒的理化指标之间的联系方程式。 2.4问题四的分析

我们采用灰色关联分析方法来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。

运用灰色关联分析方法第一步确定分析数列,确定反映系统行为特征的参考数列和影响系统行为的比较数列;第二步由于系统中各因素列中的数据可能因量纲不同,不便于比较或在比较时难以得到正确的结论,为消除这一不定因素,对变量进行无量纲化;第三步计算关联系数;第四步求取关联系数平均值,作为比较数列与参考数列间关联程度的数量表示,作为各因素间关联度。

根据这一步骤分别计算出红葡萄酒质量与酿酒红葡萄的各项理化指标、白葡萄酒质量与酿酒白葡萄的各项理化指标、红葡萄酒质量与红葡萄酒的各项理化指标、白葡萄酒质量与白葡萄酒的各项理化指标的关联度大小,从而确定酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度。根据葡萄理化指标对红葡萄酒质量的影响程度以及红葡萄酒的芳香物质也会对红葡萄酒的质量产生重要影响判

断能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

三、问题假设

1、假设问题所给数据真实可靠,不存在错误记录。

2、假设每一组评酒员在对葡萄酒样品打分时是客观公正的。

3、假设葡萄酒的质量仅受酿酒葡萄质量的影响,不考虑酿造工艺对葡萄酒品质的影响。

4、假设酿酒葡萄及葡萄酒的品质由其所含的花色苷、单宁、总酚等物质含量来判别。

四、符号说明

1、感官评价:又称为感官分析、感官检验,是通过视觉、嗅觉、触觉、味觉和听觉客观地测量、分析、解释产品所引起反应的一种科学的方法。

2、灰色关联分析:是灰色系统理论中的一个重要组成部分,是一种新的因素分析方法,是根据各因素变化曲线几何形状的相似程度,来判断因素之间关联程度的方法。

五、模型的建立与求解

5.1问题一模型的建立与求解

因为双总体t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著,且该检验可用于检验两组非相关样本被试所获得的数据的差异性,所以可用该方法分析两组评酒员的评价结果有无显著性差异。双总体t 检验具体步骤如下:

第一步:建立虚无假设01H :μμ=2,即先假定两个总体平均数之间没有显著差异;

第二步:计算统计量t 值。如果要评断两组样本平均数之间的差异程度,其统计量t 值的计算公式为:

t =

其中1X ,2X 分别为两样本平均数,1

2

X σ、2

2X σ分别为两样本方差,γ为相关样本

的相关系数。

第三步:根据自由度df n 1=-,查t 值表,找出规定的t 理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为()T df 0.01和()T df 0.05。

第四步:比较计算得到的t 值和理论T 值,推断T t ≤发生的概率,依据下表给出的T 值与差异显著性关系表做出判断。

平均分,从而可以计算出第一组评酒员与第二组评酒员对红葡萄酒打分的统计量t 值,如下表所示:

P 0.05与第二组的评酒员的评价结果有显著性差异。

P0.05

与第二组的评酒员的评价结果有显著性差异。

将附件中给出的评酒员对葡萄酒酒样品的评测总分导入SP SS进行运算得到评酒员对葡萄酒评分数据的方差分析表(SP SS所求表格见附录一到四)

表四评酒员对葡萄酒评分数据的方差分析表

测结果计算获得的F比值显然要较第一组的评测结果F比值要小,因而可以认为第二组评酒员的评测结果较第一组评酒员的评测结果可信度要高。

5.2问题二模型的建立与求解

5.2.1红葡萄的分级

分析附件二中红葡萄的理化指标,可以发现二级理化指标包含在一级理化指标中,为简化分析,我们选用一级理化指标作为红葡萄的理化指标,但是这样处理过后,红葡萄的理化指标仍然过多,所以我们可以用主成分分析的方法简化这些理化指标。利用SP SS对红葡萄的一级理化指标进行主成分分析,得到红葡萄的一级理化指标主成分析表:

表五红葡萄的一级理化指标主成分析表

达到80.324%,所以可用这七个新变量来代替原来的二十七个变量。

为具体表达原变量间的关系,用这七个新变量()

x n=???来表示原二十

1,2,,7

n

七个变量()

1,2,,27

Y i=???,从而计算出各个变量的得分,并选取得分较高的变量

i

作为红葡萄的理化指标。则原来的二十七个变量可用七个新变量表示的关系式为:

123456724.48141.67852.43362.93170.21575.21580.324i Y x x x x x x x =++++++

( 1...27)i =

在利用SP SS 对红葡萄的一级理化指标进行主成分分析时得到这二十七个变量对应的七个变量的值(得到的成分矩阵具体如附录五所示)。将成分矩阵中的数据代入主成分与原变量的关系方程,得到这二十七个理化指标的得分(具体数据见附表2)。分析这二十七个理化指标的得分发现可滴定酸、果皮质量、白藜芦醇、果穗质量、百粒质量、V C 含量这六个指标得分比较低,所以我们选取另外二十一个理化指标作为红葡萄的理化指标。根据第一问的结果确定红葡萄酒的质量。在第一问中,第二组的品酒员的结果比较可信,所以选取第二组十个品酒员对某一样品酒的平均得分来确定该种红葡萄酒的质量。

因为聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程[2],所以我们根据红葡萄的二十七个理化指标和红葡萄酒的得分采用聚类分析的方法对这些酿酒红葡萄进行分级。利用SP SS 进行聚类分析得到红葡萄等级聚类结果如下表所示(下表中的聚类1表示葡萄属于特级其质量最优、聚类2表示葡萄属于一级质量较优、聚类3表示葡萄属于二级质量中等、聚类4表示葡萄属于三级质量较差):

表六 红葡萄等级聚类表

5.2.2酿酒白葡萄的分级

对酿酒白葡萄的分级方法与红葡萄的分级方法相同。利用主成分分析的方法选出二十七个理化指标中得分较高的几个理化指标,通过分析这二十七个理化指标得分的大小发现可滴定酸、百粒质量、花色苷、出汁率、V C 含量、果梗比、多酚氧化酶活力这七个理化指标的得分比较低,所以可以把这七个理化指标忽略,选取另外二十个理化指标作为酿酒白葡萄的理化指标。同样,我们根据白葡萄的二十个理化指标和白葡萄酒的得分采用聚类分析的方法对这些酿酒白葡萄进行分级。根据酿酒白葡萄的理化指标利用SP SS 对白葡萄质量进行聚类分析,得到白葡萄等级聚类表,如下表所示(下表中的聚类1表示葡萄属于特级其质量最优、聚类2表示葡萄属于一级质量较优、聚类3表示葡萄属于二级质量中等、聚类4表示葡萄属于三级质量较差):

在分析酿酒葡萄与葡萄酒的理化指标之间的联系之前,我们从化学角度分析酿酒葡萄的某项理化指标与葡萄酒的某些理化指标是否具有相关性。

对于红葡萄和红葡萄酒来说,红葡萄酒中的花色苷与红葡萄中的花色苷、总酚、总糖、还原糖、可溶性固形物、干物质含量、果穗质量、百粒质量、果梗比、出汁率、果皮质量之间的相关性比较大;红葡萄酒中的单宁与红葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量之间的相关性比较大;红葡萄酒中存在的总酚与红葡萄中含有的滴石酸、苹果酸、柠檬酸、多酚氧化酶活力、D P P H 自由基、总酚、总糖、还原糖、pH 值、可滴定酸、固酸比之间的相关性比较大。

同样,在分析白葡萄和白葡萄酒的理化指标之间的联系时,可以建立多元线性回归模型来描述白葡萄和白葡萄酒的理化指标之间的联系。从化学角度分析可以发现,白葡萄酒中的单宁与白葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量之间的相关性比较大,而白葡萄酒中的其余理化指标与白葡萄的物质成分相关性较小。

要具体研究葡萄酒理化指标与酿酒葡萄的关系,我们回归分析法对红葡萄酒中的花色苷、单宁、总酚,白葡萄酒中的单宁这四个因素与酿酒葡萄的成分关系进行具体的研究。

回归分析是一种处理变量的统计相关关系的一种数理统计方法,而且回归分析的基本思想是:虽然自变量和因变量之间没有严格的、确定性的函数关系, 但可以设法找出最能代表它们之间关系的数学表达形式[3]。

葡萄酒理化指标Y 与酿酒葡萄的多项指标有关。令葡萄酒理化指标为随机变量Y ,酿酒葡萄的各项指标为普通变量()12,,,1n x x x n ???>,据此建立多元线性回归模型来描述酿酒葡萄与葡萄酒的理化指标之间的联系。

随机变量Y 关于普通变量x 的多元线性回归模型的基本框架为:

()2

01122,~0,n n Y b b x b x b x N εεσ=+++???++ 其中201,,,,n b b b σ???都是与12,,,n x x x ???无关的未知参数。

由于模型是一种假定,为考察这一假定是否符合实际观察结果,确立两个对立假设进行检验:

012:n H b b b ==???=

1:0

n H b 不全为

若在显著性水平α下拒绝0H ,则可认定回归效果是显著的。问题一中求得

的拒绝域表示为:

()()

()11,A E

S s F F s n s S n s α-=

≥---

其中n s -为E S 的自由度,1s -为A S 的自由度(n 为每一水平下的样本量,s 为存在的样本水平量)。

考虑到问题中可取的存在的误差较大,显著性水平α仍然取值为0.05。 5.3.1红葡萄酒中花色苷含量与葡萄指标关联 (1)回归分析求解

首先以红葡萄酒中的花色苷含量为随机变量Y ,红葡萄中的花色苷、总酚、总糖、还原糖、可溶性固形物、干物质含量、果穗质量、百粒质量、果梗比、出汁率、果皮质量为普通变量()12,,,11n x x x n ???=。利用SP SS 软件将多元线性回归模型:01122n n Y b b x b x b x ε=+++???++与从附件二中筛选出这十二个指标的相关数据进行拟合,得到SP SS 的多元回归方程的系数表(具体表格如附录六所示)。

根据表格可以得到红葡萄酒中的花色苷与红葡萄中的花色苷、总酚、总糖、还原糖、可溶性固形物、干物质含量、果穗质量、百粒质量、果梗比、出汁率、果皮质量之间的联系方程为:

()

12345678910112.548 4.653 1.403 1.179 2.614.4410.0280.11527.333 4.727460.173163.078

3.1Y x x x x x x x x x x x =---+++-+

-+-(2)回归方程的显著性检验

显著性水平α取值为0.05时,多元回归方程显著性检验门槛值为()0.0511,15F ,根据查阅的F 分布表可以确定0.052.48(11,15) 2.54F <<。 根据给出的红葡萄酒中的花色苷含量与红葡萄中的花色苷、总酚、总糖、还原糖、可溶性固形物、干物质含量、果穗质量、百粒质量、果梗比、出汁率、果皮质量数据用SP SS 软件对方程()3.1进行回归方程的显著性检验,得到回归方程的显著性分析表,如下表所示(SP SS 所求表格见附录六):

19.137F =0.052.48(11,15) 2.54F <<0.05α=0H ,所以回归方程相关非常显著。

5.3.2红葡萄酒中单宁含量与葡萄指标关联 (1)回归分析求解

分析红葡萄酒中的单宁含量为随机变量Y ,红葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量为普通变量()12,,...,11n x x x n =之间的联系。利用SP SS 软件对附件二中的红葡萄酒中的单宁与红葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量的相关数据进行多元线性回归分析,得到多元回归的标准系数表(具体系数表见附录七)。

从而可得红葡萄酒中的单宁与红葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量之间的多元回归方程为:

()1234560.2510.0610.0430.0030.9367.54413.477

3.2Y x x x x x x =++++--

(2)回归方程的显著性检验

显著性水平α取值为0.05时,多元回归方程显著性检验门槛值为()0.05

6,20F ,根据查阅的F 分布表可以确定0.05(6,20)=2.60F 。 利用SP SS 软件对方程()3.2进行回归方程的显著性检验,得到回归方程的显著性分析表,如下表所示(SP SS 所求表格见附录七):

8.646F =0.05(6,20)F F >0.05α=0H ,可以认为回归方程相关显著。

5.3.3红葡萄酒中总酚含量与红葡萄指标关联 (1)回归分析求解

分析红葡萄酒中的总酚含量为随机变量Y ,红葡萄中的滴石酸、苹果酸、柠檬酸、多酚氧化酶活力、D P P H 自由基、总酚、总糖、还原糖、pH 值、可滴定酸、固酸比为普通变量()12,,...,11n x x x n =之间的联系。利用SP SS 软件对附件二中的红葡萄酒中的总酚与红葡萄中的滴石酸、苹果酸、柠檬酸、多酚氧化酶活力、DPPH 自由基、总酚、总糖、还原糖、pH 值、可滴定酸、固酸比相关数据进行多元线性回归分析,得到SP SS 多元回归系数表(具体系数表见附录八)。

由上表可得红葡萄酒中的总酚与红葡萄中的滴石酸、苹果酸、柠檬酸、多酚氧化酶活力、D P P H 自由基、总酚、总糖、还原糖、pH 值、可滴定酸、固酸比之间的多元回归方程为:

()

12345678

910110.3990.02215.9960.1220.0110.006 2.0150.3930.0900.0470.051 2.968

3.3Y x x x x x x x x x x x =-++++-++-+-(2)回归方程的显著性检验

显著性水平α取值为0.05时,多元回归方程显著性检验门槛值为()0.0511,16F ,根据查阅的F 分布表可以确定0.052.42(11,16) 2.49F <<。对方程()3.3的相关性进行检验,得到回归方程的显著性分析表,如下表所示(SP

SS 所求表格见附录八):

11.802F =0.05(11,16)F F >0.05=绝0H ,所以回归方程相关显著。

5.3.4白葡萄酒中单宁含量与白葡萄指标关联

(1)回归分析求解

从而可以用多元线性回归的方法来分析以白葡萄酒中的单宁含量为随机变量Y ,白葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量为普通变量()12,,,7n x x x n ???=之间的联系。利用SP SS 软件对附件二中的这七个指标的数据进行多元线性回归分析,得到SP SS 多元回归系数表(具体系数表见附录九)。

从而可得白葡萄酒中的单宁与白葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量之间的多元线性回归方程为:

()1234560.1890.0140.0140.0020.085 3.417 2.832

3.4Y x x x x x x =+++-+-

(2)回归方程的显著性检验

显著性水平α取值为0.05时,多元回归方程显著性检验门槛值为()0.056,21F ,根据查阅的F 分布表可以确定0.05(6,21)=2.57F ,对方程()3.4进行回归方程的显著性检验,得到回归方程的显著性分析表,如下表所示(SP SS 所求表格见附录九):

4.291F =0.05(6,21)=2.57F 0.05(6,21)F F >平0.05α=下拒绝0H ,所以回归方程相关显著[4]。

5.3.5结论分析

综上可以得到红葡萄酒中的花色苷、单宁、总酚,白葡萄酒中的单宁这四个因素与酿酒葡萄的成分关系函数分别为:

红葡萄酒中的花色苷含量1Y 与红葡萄中的花色苷1x 、总酚1x 、总糖1x 、还原糖1x 、可溶性固形物1x 、干物质含量1x 、果穗质量、百粒质量、果梗比、出汁率、果皮质量之间的联系方程为:

112345678910112.548 4.653 1.403 1.179 2.614.4410.0280.11527.333 4.727460.173163.078

Y x x x x x x x x x x x =---+++-+

-+- 红葡萄酒中的单宁含量2Y 与红葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量之间的多元回归方程为:

21234560.2510.0610.0430.0030.9367.54413.477Y x x x x x x =++++-- 红葡萄酒中的总酚3Y 与红葡萄中的滴石酸、苹果酸、柠檬酸、多酚氧化酶活力、D P P H 自由基、总酚、总糖、还原糖、pH 值、可滴定酸、固酸比之间的多元回归方程为:

312345678

910110.3990.02215.9960.1220.0110.006 2.0150.3930.0900.0470.051 2.968

Y x x x x x x x x x x x =-++++-++-+- 白葡萄酒中的单宁4Y 与白葡萄中的单宁、可溶性固形物、干物质含量、果穗质量、果梗比、果皮质量之间的多元线性回归方程为:

41234560.1890.0140.0140.0020.085 3.417 2.832Y x x x x x x =+++-+-

5.4问题四模型的建立与求解

我们采用灰色关联分析方法来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。灰色关联分析方法的关键是算出系统各因素间的关联度,关联度越高说明因素间的影响程度越大,因而可以对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响进行研究。

灰色关联分析具体步骤如下:

第一步:确定分析数列。确定反映系统行为特征的参考数列和影响系统行为的比较数列。反映系统行为特征的数据序列,称为参考数列。影响系统行为的因素组成的数据序列,称比较数列。设参考数列(又称母序列)为:

()Y { | 1,2,,}Y k k n ==??? 比较数列(又称子序列)为:(){ | 1,2,,}( 1,2,,)i i X X k k n i m ==???=???。 第二步:变量的无量纲化。由于系统中各因素列中的数据可能因量纲不同,不便于比较或在比较时难以得到正确的结论。因此在进行灰色关联度分析时,一般都要进行数据的无量纲化处理,即:

()()()

i i i X k x k X l =

(1,2,,;0,1,2,,)k n i m =???=???

第三步:计算关联系数。0()x k 与()i x k 的关联系数为:

min min ()()max max ()()

()()()max max ()()

i i i

k

i

k

i i i i

k

y k x k y k x k k y k x k y k x k ρξρ-+-=

-+-

记()()()i i k y k x k ?=-,则

m in m in ()m ax m ax ()

()()m ax m ax ()

i i i

k

i

k

i i i i

k

k k k k k ρξρ?+?=

?+?

其中(0,)ρ∈∞称为分辨系数。ρ越小,分辨率越大,一般ρ的取值区间为(0,1),具体取值可视情况而定。当0.5463ρ≤时,分辨率最好,通常取0.5ρ=。 第四步:计算关联度 。因为关联系数是比较数列与参考数列在各个时刻(即曲线中的各点)的关联程度值,所以它的数不止一个,而信息过于分散不便于进行整体性比较。因此有必要将各个时刻(即曲线中的各点)的关联系数集中为一个值,即求其平均值,作为比较数列与参考数列间关联程度的数量表示,关联度i r 公式如下:

1

1()n

i i

k r k n

ξ

==

∑ (1,2,,)k n =???

通过比较各个比较序列与参考序列的关联度,得出各个比较序列与参考序列

的相关程度,从而得出系统内各因素间的影响大小[5]

首先分析酿酒红葡萄的理化指标对红葡萄酒质量的影响。根据上述步骤计算出红葡萄酒质量与酿酒红葡萄的各项理化指标的关联度大小如下表所示:

酸、苹果酸、苹果酸、柠檬酸、多酚酶活力、褐变度、D P P H自由基、总酚、单宁、葡萄总黄酮、白藜芦醇、酮醇、PH值、可滴定酸、固酸比、干物质含量、果梗比、出汁率、果皮质量这几项理化指标与红葡萄酒质量的关联度比较大,而还原糖等几项理化指标与红葡萄酒质量的关联度比较小,所以酿酒红葡萄的氨基酸总量、蛋白质、V C含量、花色苷、酒石酸等二十三项理化指标对红葡萄酒的质量影响比较大。

其次分析酿酒白葡萄的理化指标对白葡萄酒质量的影响。根据灰色关联分析方法的步骤计算出白葡萄酒质量与酿酒白葡萄的各项理化指标的关联度大小如下表所示:

百粒质量这几项理化指标与白葡萄酒质量的关联度比较小,另外二十二个理化指标与白葡萄酒质量的关联度比较大,所以酿酒白葡萄的氨基酸总量、蛋白质、VC 含量、花色苷、酒石酸等二十二个理化指标对葡萄酒质量的影响比较大。

然后分析红葡萄酒的理化指标对红葡萄酒质量的影响。红葡萄酒质量与红葡萄酒的各项理化指标的关联度大小如下表所示:

由上表可知,红葡萄酒的花色苷、单宁、总酚、酒总黄酮、白藜芦醇、DPPH 半抑制体积这几项理化指标与红葡萄酒质量的关联度比较大,所以这几项理化指标对红葡萄酒质量的影响比较大;红葡萄酒的色泽与红葡萄酒质量的关联度比较小,所以红葡萄酒的色泽对红葡萄酒质量的影响比较小。

最后分析白葡萄酒的理化指标对白葡萄酒质量的影响。根据灰色关联分析方法的步骤计算出白葡萄酒质量与白葡萄酒的各项理化指标的关联度大小如下表所示:

表十六 白葡萄酒质量与白葡萄酒的各项理化指标的关联度

泽这几项理化指标与白葡萄酒质量的关联度比较大,所以这几项理化指标对白葡萄酒质量的影响比较大;白葡萄酒的酒总黄酮与白葡萄酒质量的关联度相对较小,所以白葡萄酒的酒总黄酮对白葡萄酒质量的影响相对较小。

综上所述,酿酒葡萄和葡萄酒的大部分理化指标对葡萄酒质量的影响非常大。

由以上分析红葡萄酒的理化指标对红葡萄酒质量的影响的结果中可知,红葡萄酒的花色苷、单宁、总酚、酒总黄酮、白藜芦醇、D P P H 半抑制体积这几项理化指标对红葡萄酒质量的影响非常大,影响效果几乎全部达到98%以上,同时,红葡萄酒的芳香物质也会对红葡萄酒的质量产生重要影响,因而可以认定能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。用SP SS 对相关数据进行多元线性回归分析,可得红葡萄酒的质量与花色苷、单宁、总酚、酒总黄酮、白藜芦醇、D P P H 半抑制体积、红葡萄酒的芳香物质之间的多元回归方程为:

5

12345670.0060.8760.3420.6550.5177.209 2.19210

64.518

y x x x x x x x -=-+-++-+?+同理得到白葡萄酒的质量与单宁、总酚、酒总黄酮、白藜芦醇、DPPH 半抑制体积、白葡萄酒的芳香物质之间的多元回归方程为:

1234560.9160.454 1.71525.4740.4070.00765.736y x x x x x x =---++++

六、模型的评价

本文中为解决问题分别建立了双总体t 检验模型、多元线性回归分析模型、为了论文的严谨性对本文所建模型进行客观评价。 6.1论文模型的优点

1、本文根据每一问题的特点分别建立科学模型进行求解,体现了随机应变的原则,使得文章的内容丰富性极大提高。

2、在求解问题的过程中,我们灵活应用SP SS 软件对数据进行回归与相关性分析,保证了问题结果求解的科学性与正确性。

3、本文研究问题的随机变量与普通变量间的关系错综复杂,为明确随机变

量与普通变量间的关系并使研究简化,对其实际关系进行简化分析最终得到了明确的结果。

6.2论文模型的缺点

1、性质各异的模型使得问题间的磨合产生了一定的困难。

2、文中采用的灰色关联度分析方法要求需要对各项指标的最优值进行现行确定,主观性过强,同时部分指标最优值难以确定。

3、在回归分析中,选用何种因子和该因子采用何种表达式只是一种推测,这影响了因子的多样性和不可测性,使得回归分析在某些情况下受到限制。

七、模型的推广

本文所建模型除了在解决本文问题上具有优异的效果,还可以推广运用到其他问题的研究中。

7.1双总体t检验模型的推广

在科学试验和生产实践中,在研究事物变化影响因素时可以发现影响一事物变化的因素众多。例如,在化工生产中,有原料成分、原料计量、催化剂、反映温度、压力、溶液浓度、反应时间、机器设备以及人员水平等诸多因素。每一因素的改变都有可能影响产品的数量和质量。有些因素影响较大,有些较小。为使生产过程得以稳定,保证优质、高产,就有必要找出对产品质量有显著影响的那些因素。为此,人们需要进行试验。双总体t检验是能根据试验结果进行分析,鉴别各个有关因素对实验结果影响的有效方法。

运用双总体t检验可以明确地分析出试验中对结果具有显著影响的相关因素,确定各个因素与整体的相关性。例如,在随机选取用于计算器的四种类型的电路相应时间的单因素试验分析问题中,以考察各种电路类型响应时间有无显著差异为目的,以电路的相应时间为试验指标,电路类型为因素(因素包含四个水平),对电路响应时间进行方差分析,考察考察电路类型这一因素对响应时间有无显著影响。

双总体t检验在分析影响最终结果主要因素的优异性使得其能够广泛地运用到试验因素变化分析的问题中。

7.2聚类分析模型的推广

聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中

7.3多元线性回归分析模型的推广

多元回归分析是一种处理变量的统计相关关系的一种数理统计方法。回归分析的基本思想是:虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式。

多元回归分析是研究多个变量之间关系的回归分析方法,按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析及多个因变量对多个自变量的回归分析,按回归模型类型可划分为线性回归分析和非线性回归分析分析。

回归分析有很广泛的应用,例如实验数据的一般处理,经验公式的求得,

因素分析,产品质量的控制,气象及地震预报,自动控制中数学模型的制定等等。

多元线性回归的还在影响因素分析、估计与预测、统计控制、逆估计等问题上有广泛应用。

7.4灰色关联分析模型的推广

灰色关联度分析法是一种多因素统计分析方法,它是以各因素的样本数据为依据用灰色关联度来描述因素间关系的强弱、大小和次序,若样本数据反映出的两因素变化的态势(方向、大小和速度等)基本一致,则它们之间的关联度较大;反之,关联度较小,该方法不仅可用于分析各项因素是否具有相关性问题,还可应用于社会、经济、工业、农业、军事等领域,解决了日常生活和生产中的大量实际问题。

八、参考文献

[1] 盛骤等,概率论与数理统计第四版,北京:高等教育出版社,2008。

[2] 郭科龚澋,多元统计方法及其应用,成都:电子科技大学出版社。

[3] 李蕊,SP SS多元回归分析实例,

https://www.360docs.net/doc/1d12749762.html,/view/51abbc155f0e7cd1842536b8.html,2012/9/9。

[4] 白厚义,回归设计及多元统计分析,南宁市:广西科学技术出版社。

[5] 党耀国等,灰色预测与决策模型研究,北京:科学出版社,2009。

九、附录附录一

附录二

附录三

SP SS

附录四

第二组白葡萄酒评总分SP SS方差分析表

附录五

附录六

SP SS

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

大学生数学建模竞赛组队方案

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B中选择一项填写): B 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):成都纺织高等专科学校 参赛队员(打印并签名) :1. XXX(机电XXX) 2. XXX国贸XXX) 3. XXX(电商XXX) 指导教师或指导教师组负责人(打印并签名): 日期: 2014 年 06 月 06 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

目录 一、问题的重述 (1) 1.1 背景资料与条件 (1) 1.2 需要解决的问题 (1) 二、问题的分析 (2) 2.1 问题的重要性分析 (2) 2.2问题的思路分析 (3) 三、模型的假设 (4) 四、符号及变量说明 (4) 五、模型的建立与求解 (4) 5.1建立层次结构模型 (4) 5.2构造成对比较矩阵 (5) 5.3成对比较矩阵的最大特征根和特征向量的实用算法 (6) 5.4一致性检验 (7) 5.5层次分析模型的求解与分析 (8) 5.5.1 构造成对比较矩阵 (8) 5.5.2计算25优秀大学生的综合得 (9) 六、模型的应用与推广 (11) 七、模型的评价与改进 (12) 7.1模型的优点分析 (12) 7.2模型的缺点分析 (12) 7.3模型的进一步改进 (12) 八、参考文献 (13) 附件一 (14) 附件二 (16)

全国大学生数学建模竞赛的准备方法

全国大学生数学建模竞赛的准备方法 全国大学生数学建模竞赛于每年9月上旬(今年是9月7日)举行。但是在此之前,需要做好哪些准备,让各个参赛队员在竞赛中做到有备无患呢?在总结过去多年培训指导各种数学建模竞赛的基础上,仅就个人观点,介绍一些关于如何准备数学建模竞赛的经验和体会,仅供参考。在这里主要向大家介绍竞赛的基本情况,包括如何组队、如何选题以及在竞赛中如何合理分配时间。通过本次学习,希望大家能够了解数学建模竞赛的基本情况,为全国大学生数学建模竞赛以及其他各类数学建模竞赛做好准备。 一、如何组建优秀数学建模队伍 进入大学阶段参加各种科技竞赛,可以体会到一种和中学竞赛不同的感受,这种感受来自团队合作。以前的各项赛事都是以个人为单位参加竞赛,它们都是考查个人的能力。但是在大学中,由于难度和任务量的加重以及对团队合作精神的关注,因此大部分的赛事都是以团队为单位参加的。竞赛在考查个人能力的同时,还考查团队成员的合作精神。在数学建模竞赛中,团队合作精神是能否取得好成绩的最重要的因素,一队三个人要分工合作、相互支持、相互鼓励。从历年的统计数据可以看出,竞赛成绩优秀的队员往往并不是每个人在各个方面都特别擅长的队伍,而是团队相处得最融洽的队伍。从这一点也可以看出团队合作的重要性。 在竞赛的过程中,切勿自己只管自己的那一部分,一定要记住这是一个集体的竞赛。很多时候,往往一个人的思考是不全面的,只有大家一起讨论才有可能把问题搞清楚。因此无论做任何事情,三个人一定要齐心才行,只靠一个人

的力量,要在3天之内写出一篇高水平的论文几乎是不可能的。让三人一组参赛一方面是为了培养合作精神,其实更为重要的原因是这项工作确实需要多人合作,因为一个人的能力是有限的,知识掌握也往往是不全面的。一个人做题,经常会走向极端,得不到正确的解决方案。而三个人相互讨论、取长补短,可以弥补一个人所带来的不足。 在队伍组建的时候,需要强调“队长”这个名词概念。虽然在全国大学生数学建模竞赛中并没有设立队长,作为队长在获得的证书上也没有特别标注。但是在队内设立“队长”是非常有必要的。因为在比赛中可能会碰到各种突发状况,队长是很重要的,他的作用就相当于计算机中的CPU,是全队的核心。如果一个队的队长不得力,往往影响一个队的正常发挥。竞赛是非常残酷的,在3天3夜(72h)的比赛中,大家睡眠时间都得不到保障,怎样合理安排团队时间就是队长需要做的事情。在比赛过程中,由于睡眠不足,大家脾气都会很急躁。在这种情况,往往会为了一些小事而发生争吵,如果没有适当的处理,有些队伍将会放弃比赛,而队长就应该在这个时候担起责任。 在明确“队长”这个概念后,接下去谈谈怎样科学选择队友。在数学建模竞赛中,题目要求完成的工作量是很大的,因此这项任务是必须分工完成的,各有侧重、相互帮助,这样才能获得好成绩。而科学地选择队友则显得非常重要,也是走向成功的第一步。一般情况下选择队友可以从以下几个方面考虑着手: 1. 在组队的时候需要考虑队伍成员的多元化,尽量和不同专业、不同特长的同学组队。因为同系同专业甚至同班的话大家的专业知识一样,如果碰上专业知识以外的背景那会比较麻烦的。所以如果是不同专业组队则有利的多。因为数学建模题有可能出现在各个领域,这也是数学建模适合各个专业学生参加的原因所在,也是数学建模竞赛赛事的魅力所在。

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

全国大学生数学建模竞赛论文

2009高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名):1. 2. 3. 指导教师或指导教师组负责人(打印并签名):指导教师组 日期:年月日 赛区评阅编号(由赛区组委会评阅前进行编号):

2009高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

论文标题 摘要 摘要是论文内容不加注释和评论的简短陈述,其作用是使读者不阅读论文全文即能获得必要的信息。 一般说来,摘要应包含以下五个方面的内容: ①研究的主要问题; ②建立的什么模型; ③用的什么求解方法; ④主要结果(简单、主要的); ⑤自我评价和推广。 摘要中不要有关键字和数学表达式。 数学建模竞赛章程规定,对竞赛论文的评价应以: ①假设的合理性 ②建模的创造性 ③结果的正确性 ④文字表述的清晰性 为主要标准。 所以论文中应努力反映出这些特点。 注意:整个版式要完全按照《全国大学生数学建模竞赛论文格式规范》的要求书写,否则无法送全国评奖。

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

为什么要参加大学生数学建模竞赛

为什么要参加大学生数学建模竞赛 大学生数学建模竞赛是培养学生创新能力和竞争能力的极好的、具体的载体。 1.对于学校的领导(校长、教务处长等)来说,全心全意把学校搞好(高质量的教学、高百分比的就业率、高水平的教师队伍以及提高知名度等)肯定是他们追求的办学目标而且会采取各种措施。但是就选派学生参加大学生数学建模竞赛来说,不少领导(甚至数学教师)会非常犹豫:我们数学课时少,教学任务重,即使参加了,拿不到奖的话,不但不能提高学校的知名度,甚至会招致一些负面的议论等等。实际上,领导们有三个问题考虑不够,它们是: ⑴对数学的极端重要性要有充分的认识。学生将来的发展和成就是和他们坚实的数学基础密切相关的。但是现在的数学教学确实有许多不足之处有待改革,特别是怎么做到不仅教知识,而且要教知识是怎样用来解决实际问题的能力是有待加强的。让部分师生参加到数学建模活动,特别是大学生数学建模竞赛肯定是有利于推动教学改革的。 ⑵ 办好学校的关键之一是提高教师的教学水平。怎样提高呢?鼓励教师组织学生参加大学生数学建模竞赛等数学建模活动,既可以帮助教师进一步了解怎样用数学来解决实际问题,更有助于数学教师到其他专业系科了解他们要用什么样的数学以及怎样用这些数学,互相学习,进行切磋,从而对怎样提高自己的教学水平,数学教学怎样更好为其他专业后继课,甚至对专业课题研究服务产生具体的想法,提出切实可行的措施,最终能够提高教师的专业水平和教学水平,从而也就提高了学校的水平。 ⑶ 学生要求参加大学生数学建模竞赛的积极性是很高的,关键是怎样组织好,培训好。实际上,即使是高职高专院校,也一定有一部分学生的数学基础是相当坚实的,他们之间又有一部分对数学,特别是用数学来解决实际问题有强烈的兴趣。为什么不组织他们参赛呢?培养一些数学基础好对应用又有能力的高职高专院校的学生,今后他们在工作中做出好成绩的可能性肯定会比较大。毕业生事业有成者多也标志了学校办得好、有水平。此外,对于怎样贯彻因材施教也会产生一些很好的想法。 2.对于数学教师来说,组织、指导学生参加大学生数学建模竞赛对自己也会有极大的好处。

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

对中国大学生数学建模竞赛历年成绩的分析与预测

2012年北京师范大学珠海分校数学建模竞赛 题目:对中国大学生数学建模竞赛历年成绩的分析与预测 摘要 本文研究的是对自数学建模竞赛开展以来各高校建模水平的评价比较和预测问题。我们将针对题目要求,建立适当的评价模型和预测模型,主要解决对中国大学生数学建模竞赛历年成绩的评价、排序和预测问题。 首先我们用层次分析法来评价广东赛区各校2008年至2011年及全国各大高校1994至2011年数学建模成绩,从而给出广东赛区各校及全国各大高校建模成绩的科学、合理的评价及排序;其次运用灰色预测模型解决广东赛区各院校2012年建模成绩的预测。 针对问题一,首先我们对比了2008到2011年参加建模比赛的学校,通过分析我们选择了四年都参加了比赛的学校进行合理的排序(具体分析过程见表13),同时对本科甲组和专科乙组我们分别进行排序比较。在具体解决问题的过程中,我们先分析得出影响评价结果的主要因素:获奖情况和获奖比例,其中获奖情况主要考虑国家一等奖、国家二等奖、省一等奖、省二等奖、省三等奖,我们采用层次分析法,并依据判断尺度构造出各个层次的判断矩阵,对它们逐个做出一致性检验,在一致性符合要求的情况下,通过公式与matlab求得各大学的权重,总结得分并进行排序(结果见表11);在对广东赛区各高校2012建模成绩预测问题中,我们采用灰色预测模型,我们以华南农业大学为例,得到该校2012年建模比赛获奖情况为:省一等奖、省二等奖、省三等奖及成功参赛奖分别为5、9、8、8(其它各高校预测结果见表10)。 针对问题二,我们对全国各院校的自建模竞赛活动开展以来建模成绩排序采用与问题一相同的数学模型,在获奖情况考虑的是全国一等奖、全国二等奖。运用matlab求解,结果见表12。 针对问题三,我们通过对一、二问排序的解答及数据的分析,得出在对院校进评价和预测时还应考虑到各院的师资力量、学校受重视程度、学生情况、参赛经验等因素,考虑到这些因素,为以后评价高校建模水平提供更可靠的依据。 关键词:层次分析法权向量灰色预测模型模型检验 matlab

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

相关文档
最新文档