2012年全国大学生数学建模竞赛A题一等奖论文

合集下载

2012年全国大学生数学建模竞赛A题国一

2012年全国大学生数学建模竞赛A题国一
葡萄酒的评价模型
摘要
在问题一中,首先根据 T 检验、方差显著性检验和 Wilcoxon 秩和检验对两组评酒 员给葡萄酒的评价结果的差异的显著性检验。在大多数评酒员评分可靠的假设下,分别 利用评分方差比较模型,说明第二组结果可靠。在此基础上引入了评酒员“失误度”概 念来衡量每位评酒员与所有评酒员总体评价的差异, 对各组失误度求和得到第二组结果 更可靠。为了进一步优化评酒员评分,利用根据失误度对评酒员排序,跨组选取失误度 最小的 10 位评酒员组成新的评分组,其平均值认为比第二组更可靠,作为整个文章中 评价葡萄酒质量的标准指标。 在问题二中,由于红、白葡萄的理化指标有较大差异,分开考虑红白两种葡萄酒: 对于红葡萄酒,对应问题一得出的葡萄酒质量指标,从三个角度,即外观分析(又分为 由大分子因子决定的澄清度和基于 LAB 色彩模型的色调考虑到指标间存在的竞争关系 采用非线性回归分析和逐步回归分析) 、香气分析(Fisher 线性判别分析)和口感分析 (主成分分析和因子分析) ,后进行异常点检验,逐一剔除异常点来求解酿酒葡萄的量 化指标。对于白葡萄酒的三个指标采用 Fisher 判别分析求解。最后将三个方面得分加权 平均得到酿酒葡萄量化的总分,进行聚类分析,根据聚类分析结果将红葡萄和白葡萄各 分为四级。 在问题三中,为研究酿酒葡萄与葡萄酒的理化指标之间的联系,将葡萄酒的理化指 标用酿酒葡萄的理化指标来表示。根据指标间的相关性,剔除部分相关性不强的指标, 选择部分相关性较好的酿酒葡萄的指标作为自变量, 对不同的葡萄酒指标分别进行多元 线性回归、逐步回归和回归检验。根据指标本身的特点及 AIC 信息统计量,剔除不显著 的自变量,而达到用尽量少的葡萄的理化指标来表示葡萄酒的理化指标的目的。在求解 过程中,建立典型相关分析模型来分析红葡萄酒色泽指标间的关系,利用主成分分析将 白葡萄的多个指标综合为少数几个主成分,再进行回归分析。模型求解结果显示,葡萄 酒的每个指标都能用部分葡萄的指标来线性表示,且具有较好的拟合效果。 在问题四中,为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,结合问 题一、二、三的结果以及理化指标和芳香物质的化学意义,综合评估各个广义上的理化 指标(附件二和附件三) ,针对红葡萄酒和白葡萄酒的区别分别在酿酒葡萄和葡萄酒的 理化指标中选取对葡萄酒质量影响较大的指标, 通过线性回归分析将理化指标和葡萄酒 质量进行拟合,从而得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。为进一步 论证结果,首先,对模型进行残差分析以及拟合情况分析;其次,用分组样本检验方法, 将白葡萄酒的 28 个样本数据分成两组,采用用一组进行拟合,另一组进行结果回带分 析的方式,进一步论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可靠性。通过 论证分析得出结论:葡萄和葡萄酒的理化指标可以用来评价葡萄酒的质量,但也有其不 足之处,如当从葡萄酒食用性方便角度考虑,用评酒员评价方法就更直接。 关键词:葡萄酒质量 识别聚类 失误度 非线性回归 逐步回归 Fisher 判别分析 主成 分分析 因子分析 显著性检验 残差分析 异常点检测

2012年数学建模A题优秀论文

2012年数学建模A题优秀论文

基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。

得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。

接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。

首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。

然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。

得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。

对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。

一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。

另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。

最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。

对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。

对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。

2012高教社杯全国大学生数学建模竞赛全国一等奖A题

2012高教社杯全国大学生数学建模竞赛全国一等奖A题

2011高教社杯全国大学生数学建模竞赛城市表层土壤重金属污染分析摘要本文主要研究重金属对城市表层土壤污染的问题,我们根据题目所给定的一些数据和信息分析并建立了扩散传播模型、权重分配模型、对比模型和转换模型解决问题。

首先,我们利用Matlab 软件拟出该城区地势图(图1),根据所给数据绘出该地区的三维地势及采样点在其上的综合空间分布图。

之后将8种重金属的浓度等高线投影到该地区三维地形图曲面上,接着分别计算8种重金属在五个区域的平均值,立体图和平面图(图1附件)相结合便可得出8种重金属元素在该城区的空间分布。

其次,在确定该城区内不同区域重金属的污染程度时,我们运用两种方法进行解答。

先假设各重金属毒性及其它性质相同,运用公式ijij P C P ='求出各区域各金属相对于背景平均值的比值作为金属污染程度,再运用1ji ij j C C ==∑求出各区域重金属污染程度,并将各区进行比较。

之后,我们加上各重金属的毒性,对各重金属求出权数,再结合国标重金属污染等级和已知的各组数据来确定金属的污染程度。

由上述两种方法的对比,更准确地得出重金属对各区的影响程度。

即: 工业区>交通区>生活区>公园绿地区>山区 并根据第一个模型的数据来说明重金属污染的主要原因。

再次,对重金属污染物的传播特征进行了分析,判断出重金属污染物主要是通过大气、土壤和水流进行传播。

在分析之中,我们得出这三种状态的传播并不是孤立存在的,而是可以相互影响和叠加的,因此,我们分别建立三个传播模型,再对这三个传播模型进行了时间和空间上的拟合,得出重金属浓度最高的区域图,并结合各重金属的分布图(图6)来确定各污染源的位置。

最后,本题中只给出了重金属对土壤的污染,对于研究城市地质环境的演变模式,还需要搜集一些信息(图7)。

根据每种因素对地质环境的影响程度进行由定性到定量的转化。

建立同一地质时期地质环境中各因素的正影响和负影响的权重分配模型,再对这些权重进行验算和修正。

2012年全国大学生数学建模大赛一等奖论文

2012年全国大学生数学建模大赛一等奖论文

葡萄酒的评价摘要随着人民生活水平的提高,葡萄酒开始走进千家万户,而葡萄酒的优劣评定也成了人们热议的话题。

葡萄酒的优劣评价一般通过聘请有经验的评酒员进行品评并做出评分。

本文围绕葡萄酒的评价问题进行研究分析。

针对问题一,首先我们对附录1数据进行整理分析。

先利用matlab编程对数据进行正态性检验,得出样本均满足正态分布这一条件之后进一步运用SPSS对数据进行配对样本T检验,检验得出的两组p值都小于标准0.05,判定两组品酒员的评价结果存在显著性差异。

接着,对所给评分数据进行方差分析,并进一步运用组间离均平方和方法比较第一、二组P值和F值的波动性,并最终得出结论:第二组评酒员所给的评分更为可信。

针对问题二,我们结合原问题附件中的数据,先采用因子分析方法提炼出对葡萄总体理化指标有显著影响的因子,分红葡萄和白葡萄两类之后采用聚类分析方法将葡萄分为五类。

在问题一的基础上,利用可信度高的品酒员所评分数作为葡萄酒质量的衡量标准,为五类葡萄划分好坏。

最终我们将红白葡萄都分为五个级别,分别是A级(极好),B级(较好),C级(普通),D级(较差),E级(最差)。

图-红葡萄的分类针对问题三,由于葡萄的理化指标众多,首先利用sas软件分析葡萄与葡萄酒的理化指标之间的相关系数,选取与葡萄酒理化指标相关性较显著的葡萄理化指标,做典型相关分析。

并对典型相关分析的结果进行分析。

红葡萄和红葡萄酒间的典型相关分析结果说明:两组变量间,花色苷、苹果酸、褐变度、色泽L*相关密切,特别是葡萄与葡萄酒间的花色苷指标可见显著相关;白葡萄与白葡萄酒的结果说明:白葡萄指标的黄酮醇、褐变度、单宁指标与白葡萄酒的总黄酮、单宁、总酚可见显著相关。

针对问题四,针对问题四,利用酿酒葡萄和葡萄酒的理化指标与葡萄酒的质量构建多元线性回归模型,从而分析出哪些理化指标对葡萄酒的质量有显著影响。

在最后,我们将酿酒葡萄和葡萄酒的感官指标当作变量引入回归方程,得到回归方程的拟合度为98.62%,而没加上感官指标时的拟合度为78.89%,所以加上感官指标后回归方程的拟合度明显变高,而且各个参数都通过了显著性检验,论证了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

2012年数学建模大赛论文A题答案

2012年数学建模大赛论文A题答案

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):A题我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):曲阜师范大学日照校区参赛队员(打印并签名) :1.王战海2.高延太3.李智超指导教师或指导教师组负责人(打印并签名):黄宝贵日期:2012年09月10日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要确定葡萄酒的质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的检测的理化指标会在一定的程度上反映葡萄酒和葡萄的质量。

本论文对葡萄酒的评价问题进行了分析研究,主要判断了已有评价的显著性差异和评价的可信性,分析了如何对酿酒葡萄进行分级,寻找了酿酒葡萄与葡萄酒的理化指标之间的联系,以及解决了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响等问题,建立了相应的数学模型,并且充分运用MATLAB和SPSS等数学工具,分别就题目所给的为题进行了解答。

2012年全国大学生数学建模竞赛A题一等奖论文

2012年全国大学生数学建模竞赛A题一等奖论文

关键词:配对样本 t 检验 数据可信度评价 主成分分析 模糊数学评价 综合评分 信息熵 偏相关分析 多元线性回归
1
1 问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 附件中给出了某 一年份一些葡萄酒的评价结果, 并分别给出了该年份这些葡萄酒的和酿酒葡萄的 成分数据。我们需要建立数学模型并且讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,并确定哪一组的 评价结果更可信。 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
2012 高教社杯全国大学生数学建模竞赛



我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮 件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问 题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他 公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正 文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反 竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会, 可将我们的论文以任何形式进 行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发 表等) 。

2012全国数学建模论文a题(葡萄酒)省一等奖范文

2012全国数学建模论文a题(葡萄酒)省一等奖范文

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):指导组日期:2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):2葡萄酒的评价摘要本文主要根据评酒员对葡萄酒的一系列指标的打分,从而对葡萄酒的质量作出判别。

考虑到酿酒葡萄的好坏、所酿葡萄酒的质量和酿酒工艺、陈酿技术等约束条件,为此我们建立模型来确定影响葡萄酒评价的各种因素。

在这模型中利用excel,spss,matlab等一系列的数学工具对模型进行求解,综合统计分析的应用对所给的结果进行比较,从而得出最终的结果。

首先,对于问题1,分析两组评酒员的评价结果,每个评酒员对外观、口感、香气、平衡/整体四个方面指标得分进行求和,得到其总分,确定葡萄酒的质量。

由于葡萄酒的质量满足正态分布,为了能分辨出两组的差异,所以利用spss进行配对T检验,从而得出两组评酒员有显著的差异。

其次,用excel对两组进行方差分析,根据所得到的P值大小,得出第一组的评价结果更为可信。

对于问题2,在问题1的基础下,根据所给的理化指标和葡萄酒的质量利用spss统计分析软件进行分析,相关性分析对数据进行预备分析,剔除与葡萄酒质量无显著性相关的指标,再利用系统聚类的方法对酿酒葡萄进行分级。

2012年数学建模A题优秀论文

2012年数学建模A题优秀论文

基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。

得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。

接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。

首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。

然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。

得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。

对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。

一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。

另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。

最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。

对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。

对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
澄清度 (1 组均值) (2 组均值)
白葡萄酒配对样品数据表 澄清度
平衡/整 平衡/整 体评价(1 组 体评价(2 组 均值) 均值)
4
白1 白2
2.3 2.9
3.1 3.1


7.7 9.6
8.4 9.1

白 26 白 27

3.6 3.7

3.7 3.7



8.9 9

8.8 8.8

从上表中我们能看出, 将白葡萄酒和红葡萄酒中的每个指标分别进行样 品的配对后,每一个指标的配对结果有 27 对,每一对的双方分别是 1 组和 2 组 的评酒员对该指标的评分的平均值。 3.3.1 样本总体的 K-S 正态性检验 配对样品的 t 检验要求两对应样品的总体满足正态分布, 则总体中的样品应 该满足正态性或者近似正态性,样本的正态性检验如下: 以红葡萄酒的澄清度的 27 组数据为例分析:利用 SPSS 软件绘制两样品的直 方图和趋势图如图 1 所示:
澄清度 (1 组均值) (2 组均值) 红1 红2
平衡/整 平衡/整 体评价(1 组 体评价(2 组 均值) 均值)
2.3 2.9
3.1 3.1


7.7 9.6
8.4 9.1

红 26 红 27

3.6 3.7

3.7 3.7



8.9 9

8.8 8.8

白葡萄酒配对样品表格部分数据如表 2: 表2
2 模型的假设与符号的约定
2.1 模型的假设与说明 (1)评酒员的打分是按照加分制(不采用扣分制) ; (2)假设 20 名评酒员的评价尺度在同一区间(数据合理,不需要标准化) ; (3)每位评酒员的系统误差较小,在本问题中可以忽略不计; (4)假设附件中给出的葡萄和葡萄酒理化指标都准确可靠。 2.2 符号的约定与说明 符号
关键词:配对样本 t 检验 数据可信度评价 主成分分析 模糊数学评价 综合评分 信息熵 偏相关分析 多元线性回归
1
1 问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 附件中给出了某 一年份一些葡萄酒的评价结果, 并分别给出了该年份这些葡萄酒的和酿酒葡萄的 成分数据。我们需要建立数学模型并且讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,并确定哪一组的 评价结果更可信。 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
H 0 : d 0 ,两种处理没有差别, H 0 : d 0 两种处理存在差别。
3.3 葡萄酒配对样品的 t 检验 问题一中配对样品为 27 组两个完全相同的酒样品在两组不同评酒员的检测 下得到的两组数据,其中两组中各个指标的数据为各组 10 个评酒员对该指标打 分的平均值。该问题中的 10 个指标分别为:外观澄清度、外观色调、香气纯正 度、香气浓度、香气质量、口感纯正度、口感浓度、口感持久性、口感质量、平 衡/总体评价。 根据 t 检验的原理, 对葡萄酒配对样品进行 t 检验之前我们要对样品进行正 态性检验。 首先我们根据附件一并处理表格中的数据, 得到配对样品的两组数据, 绘制红葡萄酒配对样品表格部分数据如表 1: 表1 红葡萄酒配对样品数据表 澄清度
我们参赛选择的题号是(从 A/B/C/D 中选择一项填写) : 我们的参赛报名号为(如果赛区设置报名号的话) : 所属学校(请填写完整的全名) : 参赛队员 (打印并签) :1. 2. 3. 指导教师或指导教师组负责人 重庆大学 邵伟华 杨余鸿 肖春明 (打印并签名): 日期: 日 肖剑 2012 年 9
基于数理分析的葡萄及葡萄酒评价体系 摘要
葡萄酒的质量评价是研究葡萄酒的一个重要领域, 目前葡萄酒的质量主要由 评酒师感官评定。 但感官评定存在人为因素,业界一直在尝试用葡萄的理化指标 或者葡萄酒的理化指标定量评价葡萄酒的质量。 本题要求我们根据葡萄以及葡萄 酒的相关数据建模,并研究基于理化指标的葡萄酒评价体系的建立。 对于问题一, 我们首先用配对样品 t 检验方法研究两组评酒员评价差异的显 著性,将红葡萄酒与白葡萄酒进行分类处理,用 SPSS 软件对两组评酒员的评分 的各个指标以及总评分进行了配对样本 t 检验。得到的部分结果显示:红葡萄酒 外观色调、 香气质量的评价存在显著性差异, 其他单指标的评价不存在显著差异, 白葡萄、红葡萄以及整体的评价存在显著性差异。 接着我们建立了数据可信度评价模型比较两组数据的可信性, 将数据的可信 度评价转化成对两组评酒员评分的稳定性评价。 首先我们对单个评酒员评分与该 组所有评酒员评分的均值的偏差进行了分析, 偏差不稳定的点就成为噪声点,表 明此次评分不稳定。 然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定 性。得到第 2 组的方差 10.6 明显小于第 1 组的 33.3 ,从而得出了第 2 组评价数据 的可信度更高的结论。 对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分 级。一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分 析法对其进行了因子分析,并且得到了 27 种葡萄理化指标的综合得分及其排序 (见正文表 5) 。另一方面,我们又对附录给出的各单指标百分制评分的权重进 行评价,并用信息熵法重新确定了权重,用新的权重计算出 27 种葡萄酒质量的 综合得分并排序(见正文表 6) 。最后我们对两个排名次序用基于模糊数学评价 方法将葡萄的等级划分为 1-5 级(见正文表 8) 。 对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。对葡萄的 6 个主因子,以及葡萄酒 的 10 个指标用 SPSS 软件进行偏相关分析, 得到酒黄酮与葡萄的等级正相关性较 强等结论。之后对相关性较强的主因子和指标作多元线性回归。得到了葡萄酒 10 个单指标与主因子之间的多元回归方程,该回归方程定量表示两者之间的联 系。 对于问题四, 我们首先将葡萄酒的理化指标标准化处理,对葡萄酒的质量与 葡萄的 6 个主因子和葡萄酒的 10 个单指标作偏相关分析,并求出多元线性回归 方程。该方程就表示了葡萄和葡萄酒理化指标对葡萄酒质量的影响。之后,我们 通过通径分析方法中的逐步回归分析得到葡萄与葡萄酒的理化指标只确定了葡 萄酒质量信息的 47%。 从而得出了不能用葡萄和葡萄酒的理化指标评价葡萄酒的 质量的结论。 接着我们还采用通径分析中的间接通径系数分析求出各自变量之间 通过传递作用对应变量的影响,得到单宁与总酚传递性影响较强等结论。 最后,我们对模型的改进方向以及优缺点进行了讨论。
3
配对样品的 t 检验可检测配对双方的结果是否具有显著性差异, 因此就可以 检验出配对的双方(第一组与第二组)对葡萄酒的评价结果是否有差异性。 配对样品 t 检验具有的前提条件为: (1)两样品必须配对 (2)两样品来源的总体应该满足正态性分布。 配对样品 t 检验基本原理是:求出每对的差值如果两种处理实际上没有差 异,则差值的总体均数应当为 0,从该总体中抽出的样本其均数也应当在 0 附近 波动;反之,如果两种处理有差异,差值的总体均数就应当远离 0,其样本均数 也应当远离 0。这样,通过检验该差值总体均数是否为 0,就可以得知两种处理 有无差异。该检验相应的假设为:
H0
符号的意义 原假设 显著性概率 第 1 组评酒员对第 n 号品种葡萄酒评分的平均值,n=1, 2……27 第 2 组评酒员对第 n 号品种葡萄酒评分的平均值,n=1, 2……27 第一组评酒员 i 对指标 j 评分的偏差的方差, i 1, 2,……10 , 第二组评酒员 i 对指标 j 评分的偏差的方差, i 1, 2,……10 , j =1, 2 ……27 第 1组 j =1, 2 …… 2710 位评酒员对 n 号酒样品第 j 项指标评分的平均分 第 1 组第 i 号评酒员对 n 号酒样品第 j 项指标评分与平均值的偏 差 值 第 1 组第 i 号评酒员对其 j 项指标评分与平均值的偏差的平均 第 2 组第 i 个评酒员的总体指标偏差的方差
yn j
xi
Fi
Mj
3 问题一的分析与求解
3.1 问题一的分析 题目要求我们根据两组评酒员对 27 种红葡萄酒和 28 种白葡萄酒的 10 个指 标相应的打分情况进行分析, 并确定两组评酒员对葡萄酒的评价结果是否有显著 性差异,然后判断哪组评酒员的评价结果更可信。 初步分析可知:由于评酒员对颜色、气味等感官指标的衡量尺度不同,因此 两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关, 不同的评 价指标的显著性差异可能会不同。同时,由于红葡萄酒和白葡萄酒的外观、口味 等指标差异性较大, 处理时需要将白葡萄酒和红葡萄酒的评价结果的显著性差异 分开讨论。 基于以上分析, 我们可以分别两组品尝同一种类酒样品的评酒员的评价结果 进行两两配对, 分析配对的数据是否满足配对样品 t 检验的前提条件,而且根据 常识可知评酒员对同一种酒的同一指标的评价在实际中是符合 t 检验的条件的。 接着我们就可以对数据进行多组配对样品的 t 检验, 从而对两组评酒员评价 结果的显著性差异进行检验。 由于对同一酒样品的评价数据只有两组, 我们只能通过评价结果的稳定性来 判定结果的可靠性。 而每组结果的可靠性又最终决定于每个评酒员的稳定性,因 此将问题转化为对评酒员稳定性的评价。 3.2 配对样品的 t 检验简介 统计知识指出:配对样本是指对同一样本进行两次测试所获得的两组数据, 或对两个完全相同的样本在不同条件下进行测试所得的两组数据。 在本问中我们 可以把配对样品理解为有 27 组两个完全相同的酒样品在两组不同评酒员的检测 下得到的两组数据,两组中各个指标的数据为每组评酒员对该指标打分的平均 值。
相关文档
最新文档