2012数学建模A题
2012年全国大学生数学建模竞赛A题国一

摘要
在问题一中,首先根据 T 检验、方差显著性检验和 Wilcoxon 秩和检验对两组评酒 员给葡萄酒的评价结果的差异的显著性检验。在大多数评酒员评分可靠的假设下,分别 利用评分方差比较模型,说明第二组结果可靠。在此基础上引入了评酒员“失误度”概 念来衡量每位评酒员与所有评酒员总体评价的差异, 对各组失误度求和得到第二组结果 更可靠。为了进一步优化评酒员评分,利用根据失误度对评酒员排序,跨组选取失误度 最小的 10 位评酒员组成新的评分组,其平均值认为比第二组更可靠,作为整个文章中 评价葡萄酒质量的标准指标。 在问题二中,由于红、白葡萄的理化指标有较大差异,分开考虑红白两种葡萄酒: 对于红葡萄酒,对应问题一得出的葡萄酒质量指标,从三个角度,即外观分析(又分为 由大分子因子决定的澄清度和基于 LAB 色彩模型的色调考虑到指标间存在的竞争关系 采用非线性回归分析和逐步回归分析) 、香气分析(Fisher 线性判别分析)和口感分析 (主成分分析和因子分析) ,后进行异常点检验,逐一剔除异常点来求解酿酒葡萄的量 化指标。对于白葡萄酒的三个指标采用 Fisher 判别分析求解。最后将三个方面得分加权 平均得到酿酒葡萄量化的总分,进行聚类分析,根据聚类分析结果将红葡萄和白葡萄各 分为四级。 在问题三中,为研究酿酒葡萄与葡萄酒的理化指标之间的联系,将葡萄酒的理化指 标用酿酒葡萄的理化指标来表示。根据指标间的相关性,剔除部分相关性不强的指标, 选择部分相关性较好的酿酒葡萄的指标作为自变量, 对不同的葡萄酒指标分别进行多元 线性回归、逐步回归和回归检验。根据指标本身的特点及 AIC 信息统计量,剔除不显著 的自变量,而达到用尽量少的葡萄的理化指标来表示葡萄酒的理化指标的目的。在求解 过程中,建立典型相关分析模型来分析红葡萄酒色泽指标间的关系,利用主成分分析将 白葡萄的多个指标综合为少数几个主成分,再进行回归分析。模型求解结果显示,葡萄 酒的每个指标都能用部分葡萄的指标来线性表示,且具有较好的拟合效果。 在问题四中,为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,结合问 题一、二、三的结果以及理化指标和芳香物质的化学意义,综合评估各个广义上的理化 指标(附件二和附件三) ,针对红葡萄酒和白葡萄酒的区别分别在酿酒葡萄和葡萄酒的 理化指标中选取对葡萄酒质量影响较大的指标, 通过线性回归分析将理化指标和葡萄酒 质量进行拟合,从而得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。为进一步 论证结果,首先,对模型进行残差分析以及拟合情况分析;其次,用分组样本检验方法, 将白葡萄酒的 28 个样本数据分成两组,采用用一组进行拟合,另一组进行结果回带分 析的方式,进一步论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可靠性。通过 论证分析得出结论:葡萄和葡萄酒的理化指标可以用来评价葡萄酒的质量,但也有其不 足之处,如当从葡萄酒食用性方便角度考虑,用评酒员评价方法就更直接。 关键词:葡萄酒质量 识别聚类 失误度 非线性回归 逐步回归 Fisher 判别分析 主成 分分析 因子分析 显著性检验 残差分析 异常点检测
2012数学建模A题论文:葡萄酒的评价

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。
对于本题,我们主要采用SPSS软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
2012年全国数学建模竞赛A题第一问数据综合整理

0.27
0.516398
第二组
10
9
9
9
8
9
10
9
9
9
91
9.1
0.32
0.567646
酒样品3
第一组
9
10
10
9
8
10
9
10
10
9
94
9.4
0.49
0.699206
第二组
10
9
9
9
8
9
8
9
9
9
89
8.9
0.32
0.567646
酒样品4
第一组
7
9
9
8
7
8
9
8
10
9
84
8.4
0.93
0.966092
0.40
0.632456
酒样品16
第一组
9
10
10
9
8
8
10
9
9
9
91
9.1
0.54
0.737865
第二组
9
9
9
9
9
8
8
9
9
9
88
8.8
0.18
0.421637
酒样品17
第一组
8
10
10
8
11
9
7
10
10
9
92
9.2
1.51
1.229273
第二组
9
9
9
9
9
8
10
9
9
9
全国大学生数学建模优秀论文A题

2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):S55001所属学校(请填写完整的全名):郑州科技学院参赛队员(打印并签名) :1. 刘超2. 赵芬芳3. 尹峰指导教师或指导教师组负责人(打印并签名):闫天增日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本文通过对27种红葡萄酒和28种白葡萄的理化指标数据进行分析,采用显著性差异分析法、可靠度分析、因子分析法、相关系数分析、主成分分析法以及聚类分析法,借助统计软件SPSS和数学软件MATLAB,分析了两组评酒员的评价结果有无显著性差异和可信度,给出了酿酒葡萄与葡萄酒的理化指标之间的联系,建立了基于酿酒葡萄理化指标和葡萄酒质量的聚类分析模型确定了葡萄酒质量的影响因素,最后通过补充相关信息,建立基于分析模型确定了葡萄酒质量的影响因素。
2012年数学建模A题资料

(一)葡萄酒观察方法1 酒液总体观察1.1 澄清度观察衡量葡萄酒澄清程度的指标有透明度、浑浊度等,与之相关的指标还有是否光亮、有无沉淀等。
优良的葡萄酒必须澄清、透明(色深的红葡萄酒例外)、光亮。
a.澄清:是衡量葡萄酒外观质量的重要指标。
澄清表示的是葡萄酒明净清澈、不含悬浮物。
通常情况下,澄清的葡萄酒也具有光泽。
b.透明度:表示的是葡萄酒允许可见光透过的程度。
红葡萄酒如果颜色很深,则澄清的葡萄酒也不一定透明。
c.浑浊度:表示的是葡萄酒的浑浊程度,浑浊的葡萄酒含有悬浮物。
葡萄酒的浑浊往往是由微生物病害、酶破败或金属破败引起的。
浑浊的葡萄酒其口感质量也差。
d.沉淀:指的是从葡萄酒中析出的固体物质。
沉淀是由于在陈酿过程中,葡萄酒构成成份的溶解度变小引起的,一般不会影响葡萄酒的质量。
1.2 颜色观察葡萄酒的颜色受酒龄影响,新红葡萄酒由于源于果皮花色素苷的作用,通常颜色鲜艳,为紫红色和宝石红色,带紫色色调;在葡萄酒的成熟过程中,丹宁逐渐与游离花色素苷等结合而使成年葡萄酒带有黄色色调。
瓦红或砖红色为成年红葡萄酒的常有的颜色,而棕红色则为在瓶内陈酿10年以上的红葡萄酒的颜色。
因此,可根据颜色,判断葡萄酒的成熟状况。
葡萄酒的颜色和口感的变化存在着平行性,颜色和口感之间必须相互协调平衡。
颜色的深浅反应葡萄酒的结构、丰满度以及尾味和余味。
如在红葡萄酒中,颜色的深浅与丹宁的含量往往正相关。
如果红葡萄酒颜色深而浓,几乎处于半透明状态,多数情况下它必然醇厚、丰满、丹宁感强。
相反,色浅的葡萄酒,则味淡、味短。
当然,如果较柔和,具醇香,仍不失为好酒。
例如瓦红色的红葡萄酒,必须与浓郁的醇香和柔顺的口感同时存在,否则表明该酒是人工催熟条件下陈酿而未能表现出最佳感官质量。
带紫色的新葡萄酒往往口味平淡、瘦弱、尖酸、粗糙;褐色过重的成年葡萄酒,氧化过重、老化。
1.3 浑浊度观察观察葡萄酒有无下列情况:略失光,失光,欠透明,微混浊,极浑浊,雾状混浊,乳状混浊;1.4 沉淀观察观察葡萄酒有无下列情况:有无沉淀,沉淀类型:纤维状沉淀,颗粒状沉淀,絮状沉淀,酒石结晶,片状沉淀,块状沉淀。
2012年数学建模A题解题思路

2012年数学建模A题解题思路1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?要分析两组评酒员的评价结果是否有显著性差异,可以使用统计方法进行分析。
一种常用的方法是使用t检验来比较两组平均值的差异,确定是否有统计学意义上的差异。
首先,对于每个评酒员,计算他们对每种葡萄酒的评分的平均值。
然后,对于每组评酒员,计算他们对每种葡萄酒的平均评分的平均值。
接下来,使用t检验来比较两组评酒员对每种葡萄酒的平均评分的平均值是否有显著性差异。
如果t检验的结果显示两组评酒员对某种葡萄酒的评分存在显著性差异,那么可以认为这种葡萄酒的评分更可信的那组评酒员的结果更可信。
1. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,可以使用聚类分析或者判别分析等方法。
聚类分析可以根据酿酒葡萄的理化指标和葡萄酒的质量将它们分为几个不同的类别。
这样可以根据每个类别的平均质量评分来进行分级。
判别分析可以建立一个数学模型,根据酿酒葡萄的理化指标预测葡萄酒的质量等级。
这样可以根据酿酒葡萄的理化指标将其进行分级。
1. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
要分析酿酒葡萄与葡萄酒的理化指标之间的联系,可以使用相关性分析来确定它们之间的相关性。
首先,计算每个理化指标与葡萄酒质量评分之间的相关性系数。
可以使用皮尔逊相关系数或者斯皮尔曼相关系数等方法。
相关性分析的结果可以告诉我们哪些理化指标与葡萄酒质量评分有显著相关性,从而可以了解酿酒葡萄的哪些理化指标对葡萄酒的质量有重要影响。
1. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可以使用回归分析等方法。
回归分析可以建立一个数学模型,根据酿酒葡萄和葡萄酒的理化指标来预测葡萄酒的质量评分。
这样可以分析每个理化指标对葡萄酒质量的影响程度,并确定哪些指标对葡萄酒的质量影响最为重要。
2012全国数学建模A题分析

2012全国数学建模竞赛A题详细分析1.问题重述在设计太阳能小屋时,需在建筑物外表面(屋顶及外墙)铺设光伏电池,光伏阵列件所产生的直流电需要经过逆变器转换成220V交流电才能供家庭使用,并将剩余电量输入电网。
不同种类的光伏电池每峰瓦的价格差别很大,且每峰瓦的实际发电效率或发电量还受诸多因素的影响。
因此,在太阳能小屋的设计中,研究光伏电池在小屋外表面的优化铺设是很重要的问题。
对下列三个问题,分别给出小屋外表面光伏电池的铺设方案,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,并计算出小屋光伏电池35年寿命期内的发电总量、经济效益(当前民用电价按0.5元/kWh计算)及投资的回收年限。
在同一表面采用两种或两种以上类型的光伏阵列件时,同一型号的电池板可串联,而不同型号的电池板不可串联。
在不同表面上,即使是相同型号的电池也不能进行串、并联连接。
应注意分组连接方式及逆变器的选配。
问题1:请根据山西省大同市的气象数据,仅考虑贴附安装方式,选定光伏阵列件,对小屋(见附件2)的部分外表面进行铺设,并根据电池组件分组数量和容量,选配相应的逆变器的容量和数量。
问题2:电池板的朝向与倾角均会影响到光伏电池的工作效率,请选择架空方式安装光伏电池,重新考虑问题1。
问题3:根据附件7给出的小屋建筑要求,请为大同市重新设计一个小屋,要求画出小屋的外形图,并对所设计小屋的外表面优化铺设光伏电池,给出铺设及分组连接方式,选配逆变器,计算相应结果。
2.问题的分析2.1 问题一的分析问题一中要求根据山西省大同市的气象数据,选定光伏阵列件对小屋的部分外表面以贴附安装方式进行铺设,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,最后给出铺设方案,包括电池组件分组数量和容量,以及相应的逆变器的容量和数量。
首先,附表中提供的大同地区的光照数据并未直接告知每个面获得的光照总量,需要根据光散射和直射的关系,建立光照模型,确定每个面的总的光照强度。
高教杯2012年数学建模A题

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): a我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文利用SPSS和MATLAB软件对葡萄酒评价问题进行了分析,综合采用了t检验、主成分分析、聚类分析和灰色关联度分析等方法,建立了数学模型,并设计了一套对葡萄酒质量的评价体系。
关于问题一:首先,对两组评酒员对同一种葡萄酒给出的评分结果进行处理;其次,采用t检验判断出两组评分结果存在显著性差异;最后,利用每一组评酒员对同一种葡萄酒的评分方差作为衡量依据,建立评分机制,评估两个小组所给结果的可信性,经分析第一组、第二组得分分别为13分、42分。
因此,第二组评酒员的评分结果更可信。
关于问题二:首先,对酿酒葡萄的理化指标进行主成分分析,挖掘出若干个影响酿酒葡萄理化指标的主要成分;其次,根据第一问的结果,将第二组评酒员的评分作为衡量葡萄酒质量的量化指标;最后,通过聚类分析将酿酒葡萄分为4个等级。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的误差。
在此基础上,还可以得到组间均方差和组内均方差:
(4) (5)
在方差相等的假定下,要检验n个总体的均值是否相等,须首先给定原 假设和备择假设。
原假设
:均值相等即
备择假设
:均值不完全不相等
则可以应用统计量进行方差检验:
(6) 该统计量服从分子自由度,分母自由度为的分布。给定显著性水
平,如果根据样本计算出的统计量的值小于等于临界值,则说明原假设
我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 杨晓宇
2. 梁 言 3. 李玉珠 指导教师或指导教师组负责人 (打印并签名):
日期: 年 月 日
赛区评阅编号(由赛区组委会评阅前进行编号):
三 模型的假设
3.1 假设题目所给的数据真实可靠; 3.2 评酒员的评价尺度相同; 3.3 二级指标里的因素对酿酒葡萄分级的影响不大,可忽略不计; 3.4 测试理化指标用的葡萄和相应酒样的酿酒葡萄是同一批; 3.5 附件所给的理化指标具有代表性;
四 符号说明
—— 总方差; ——组内方差; ——组间方差; ——实验次数; ——组间均方差; ——组内均方差; ——酿酒葡萄的主成分即为新的指标; ——葡萄酒的第项理化指标; ——酿酒红葡萄的前十二个主成分; ——红葡萄酒的各理化指标; ——酿酒白葡萄的前十三个主成分; ——第种葡萄样品的第个指标的值; ——葡萄样品的第个理化指标的值; ——无量纲化处理后的第种葡萄样品的第个理化指标的值; ——第个品酒员给第类葡萄酒的评分; ——第个品酒员给第类葡萄酒的第项指标的评分; ——第类葡萄酒的平均总得分。
针对问题一,要分析两组评酒员的评价结果有无显著性差异以及哪 一组结果更可信。首先对葡萄酒的得分数据进行无量纲化处理,然后运 用单因素方差分析法,将各样品酒的总分作为唯一的因子,取显著性水 平为0.05,通过计算可信度指标值来判断差异性,最后通过计算出的方 差来判断出第二组的评价结果更可信。
针对问题二,首先用因子分析法,对酿酒葡萄的理化指标进行选 择,得到十种因子。再用0-1规划模型,对酿酒红葡萄进行分级:一级 (优)包含样品9,25,20,2,17,3;二级(良)包含样品26,5, 21,14,19;三级(中)包含样品4,24,27,22;四级(合格)包含 样品1,25,12,10,13,16;五级(不合格)包含样品11,7,18, 15,8,6。酿酒白葡萄分级:一级(优)包含样品17,15,9,1,22;二级 (良)包含样品6,18,7,27,13;三级(中)包含样品 5,20,28,4,14,21;四级(合格)包含样品23,26,2,12,10,24;五级 (不合格)有样品8,11,19,25,16,3。
二 问题分析
2.2.1问题一的分析 根据附件1的数据可知:两组评酒员分别对27组红葡萄酒和28组白
葡萄酒进行评分,相当于每件样品都进行了两次评分,故可以求出平均 的评分。此问题要求分析两组评酒员的评价结果有无显著性差异以及哪 一组结果更可信,对于分析显著性的差异,我们用单因素方差分析法, 取显著性水平为0.05,运用Excel求出值,根据值与0.05的关系来判断 有无显著差异性。方差是描述数据波动的大小的,求出方差,比较两组 数据方差的大小来判断哪一组结果更可信。 2.2.2问题二的分析
组内方差 908.51 54
16.82426
总方差 994.02 55
通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之 间具备了差异显著或是极显著。在作结论时,应确实描述方向性(例如 显著大于或显著小于),在此我们取0.05作为显著性水平标准。
根据以上两表可知:红葡萄酒中表中值为0.119961>0.05,故接受,且 对应的也很小,故可知品酒员对红葡萄酒的评分没有显著性差异。白酒 表中的值为0.028247<0.05,故拒绝,则评酒员对白酒的评分具有显著 性差异。 5.1.2评价结果的可信度
关键词: 单因子方差分析 0--1规划 主成分分析法 多元回归模型
一 问题重述
随着我国经济的快速发展,葡萄酒市场竞争也日趋激烈。虽然国家 已经对葡萄酒的质量做了规定,但由于相应规范的制定工作的限制,我 国关于葡萄酒质量等级划分的标准还未完善,所以国家需要制定统一的 质量等级制度。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其 总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有 直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡 萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附 件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请 尝试建立数学模型讨论下列问题:
利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质 量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求 和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较 前后两者结果中由样品中的芳香指标导致的影响差异来确定,不能只用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量,最后结合感官指标做出 分析。
第三因子:(Z)-2-庚烯醛,(E)-2-己烯-1-醇,1-庚醇,反式-2-壬 烯酸; 第四因子:三氯甲烷,(E)-2-壬烯-1-醇; 第五因子:柠檬烯; 第六因子:á-蒎烯,(Z)-3,7-二甲基-2,6-辛二烯醛,(R)-3,7-二甲
以就需要进行主成分分析。
主成分的理论分析:因为在所有的线性组合中所选取的应该是方差
最大的,故称为第一主成分。如果第一主成分不足以代表原来个变量的
信息,再考虑选取即第二个线性组合,为了有效地反映原来信息,已有
的信息就不需要再出现在中,用数学语言表达就是要求,称为第二主成
分,依此类推可以构造出第三、四……第个主成分。
对于哪组数据更加可信,我们知道方差是考察数据的波动性的,方 差小就说明数据比较稳定,方差大就是波动性比较大。故我们将红酒, 白酒每组样品酒的平均组内方差求出来,比较方差和的大小,则可知道 哪组数据更加可信。
平均组 内方差
红葡萄酒 第一组 第二组 51.92 15.24
白葡萄酒 第一组 第二组 22.75 9.70
分。主成分又叫主分量。这里我们称为主成分系数。
上述模型可用矩阵表示为:
,其中
(13) 称为主成分系数矩阵。 基于因子分析法的理论,运用SPSS软件,分析酿酒红葡萄的理化指标, 可得以下结果: 第一因子:乙醛,乙酸甲酯,乙酸乙酯,乙醇,丙酸乙酯,2-戊酮,甲 苯,乙酸 丁酯,3-甲基-1-丁醇乙酸酯,乙酸戊酯,乙酸己酯,2-辛 酮,4-己烯-1-醇-乙酸盐,1-己醇,(Z)-3-己烯-1-醇, 乙酸辛酯,5-甲基糠醛,甲氧基苯基丙酮肟; 第二因子:花色苷鲜重,DPPH自由基,总酚,单宁,葡萄总黄酮;
(7) 对葡萄酒的评分进行无量纲化处理:
(8) (2)对量化指标进行选择
因子分析法应用原理:在这个问题中,需要研究多个变量,并且
这多个变量之间存在一定的相关性。为了从多个变量中综合为少数几个
代表性变量,既能够代表原始变量的绝大多数信息(80%或85%)以上,
又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,所
主成分分析的数学模型:对于一个样本资料,观测个变量
(10)
主成分分析就是将个观测变量综合成为个新的变量(综合变量),即
(11)
简写为:
(12)
要求模型满足以下条件:
①互不相关(,)
②的方差大于的方差大于的方差,依次类推
③
于是,称为第一主成分,为第二主成分,依此类推,有第个主成
针对问题三,分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运 用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成 分,进而通过多元回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系 的模型。
针对问题四,首先利用因子分析法分别给出酿酒葡萄和葡萄酒的理 化指标对葡萄酒质量的影响因素,再将每类葡萄和葡萄酒中的芳香物质 总和作为样品中的芳香指标,与葡萄酒的理化指标一并进行因子分析, 根据前后两者结果中由样品的芳香指标导致的影响差异,再结合感官指 标,最终确定感官指标是评价葡萄酒质量的最有效指标。
不成立,总体均值不完全相等,差异并非仅由随机因素引起。在本题
中,分析红酒时,分析白酒时,此题设显著性水平,
说明:值反应了可以以多大的把握认为原假设成立。如果计算的值
小于给定的显著性水平0.05则应该接受原假设,否则应拒绝原假设。如
果值小于显著性水平,则均值相等,否则不相等。 首先我们对数据进行处理,附件1里有四组数据:红葡萄酒和白葡萄酒
方差
自由度 均方差 F值
P值
组间方差 87.50
1
87.15
2.499297 0.119961
组内方差 1813.23 52
34.86981
总方差 1900.38 53
(2)根据一、二组对白葡萄酒的综合评价可以得到表二:
方差
自由度 均方差 F值
P值
组间方差 85.51
1
85.51
5.082542 0.028247
首先对附件一中的数据进行无量纲化处理,得到每种葡萄酒的平均 得分,用因子分析法,对酿酒葡萄的理化指标进行选择,得到十种因 子,再用0-1规划模型,最后对酿酒红葡萄进行分级。 2.2.3问题三的分析
要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的30 个理化指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。 然后我们建立葡萄的理化指标与葡萄酒的7个理化指标之间的多元线性 回归方程,得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。 2.2.4问题四的分析
2012高教社杯全国大学生数学建模竞赛