2012年数学建模竞赛-葡萄酒的评价模型
2012年全国大学生数学建模竞赛A题 附件1-葡萄酒品尝评分表

2 葡萄酒样品2
外观分析 澄清度 色调
香
6
7
7
7
6
7
7
19
16
16
16
10
9
9
8
3
4
4
4
8
8
8
8
5
4
5
4
7
6
7
7
14
12
12
12
4
5
5
5
6
6
7
7
7
6
6
7
16
16
16
22
9
9
9
10
4
4
3
4
8
8
6
8
5
5
4
5
7
7
6
6
14
12
12
12
5
5
4
5
7
6
7
7
6
6
7
7
19
16
16
7
14
12
12
14
5
4
5
5
6
6
6
6
6
6
6
6
16
16
16
19
9
9
9
10
4
4
4
4
8
8
6
8
4
4
5
4
6
7
6
6
12
12
12
12
4
5
5
4
6
6
7
2012全国竞赛论文评分建议2012全国赛A题:葡萄酒的评价

2012全国赛A题:葡萄酒的评价评阅要点解读与评分建议[广东赛区提供]总体评分分布:摘要10分●写作5分●总体评价5分●问题1 35分●问题2 15分●问题3 15分●问题4 10分●数据处理(缺失、异常)5分问题1:(35分)同一酒样评酒员之间差距小20分=原理5分+模型和方法 10分+结果与说明5分不同酒样之间区分度明显15分=原理5分+模型和方法 5分+结果与说明5分问题2:(15分)分级原则5分模型5分算法和结果5分问题3:(15分)分析关系的原理、结论评价5分模型和方法5分理化指标的分类和筛选5分问题4:(10分)建立模型5分结论及详细说明5分关于2012-A题评分要点的具体分析(至少17处)看到了网上几乎所有的参考答案,也听了一些老师的建议,现在结合评分要点来谈下自己的分析:在问题一中,答案是固定的,也就是显著和可信的问题,不管什么方法,但关键的还是说明假设检验的原理的依据,为什么要用这种方法,合适吗?所以,评分要点有以下几处:(1)数据的处理,包括缺失和异常数据,说明你处理的方法。
(2)检验模型的假设进行检验,例如样本的正态分布检验等(3)在前面的基础上,有些统计的方法不太适用,这时候要介绍你的方法原理和为什么要这么做。
(4)显著性分析和可信性分析。
这里面可能不同的方法结果不太一致,这时候要利用多个检验方法进行综合分析和考虑,给出较好的结果。
(5)由于评酒员都是感官评价的结果,前面是分两组样本分析的,这里可以针对每组评酒员的差异进行分析,即给出每个评酒员的品酒差异进行分析。
所以,第一问应该越详细越好。
这一问解决的感官评价的问题。
在问题二中,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
这里的方法较多,例如模糊综合评判,神经网络,聚类等。
每种方法都有自己的局限性,而且分级的个数也会有很大差异,这时候就要对自身的模型进行分析和判断。
关键点(1)无论哪种方法,酿酒葡萄的理化指标和葡萄酒的质量必须要说明清楚(2)模型本身的优缺点和适用范围进行分析明确(3)分级结果中应该对不同的酿酒葡萄进行明确的区分,例如哪种葡萄能造哪种级别的酒可以分析出来。
2012数学建模A葡萄酒地评价与衡量

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规如此.我们完全明白,在竞赛开始后参赛队员不能以任何方式〔包括、电子、网上咨询等〕与队外的任何人〔包括指导教师〕研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规如此的, 如果引用别人的成果或其他公开的资料〔包括网上查到的资料〕,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们X重承诺,严格遵守竞赛规如此,以保证竞赛的公正、公平性。
如有违反竞赛规如此的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进展公开展示〔包括进展网上公示,在书籍、期刊和其他媒体进展正式或非正式发表等〕。
我们参赛选择的题号是〔从A/B/C/D中选择一项填写〕: A我们的参赛报名号为〔如果赛区设置报名号的话〕:所属学校〔请填写完整的全名〕:参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012 年 9 月 7 日赛区评阅编号〔由赛区组委会评阅前进展编号〕:编号专用页赛区评阅编号〔由赛区组委会评阅前进展编号〕:全国统一编号〔由赛区组委会送交全国前编号〕:全国评阅编号〔由全国组委会评阅前进展编号〕:葡萄酒的评价摘要目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。
葡萄酒的质量与酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反响葡萄酒和酿酒葡萄的质量。
对于问题1,我们采用方差分析的方法建模解决。
根本思路是:对两组评酒员的评价结果进展单因素方差分析,然后再用F检验对得出的结果进展进一步验证,得出两组评酒员的评价结果无显著性差异,通过比拟两组评酒员评价结果的方差值,得出第二组的结果更可信。
对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进展分级。
根本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指标的8种主成分,在此根底上把综合因子作为一项排名指标,结合问题1得出的葡萄酒的质量,对酿酒葡萄进展排名,用两种排名的名次之和作为对酿酒葡萄分级的主要依据。
2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)

葡萄酒理化指标与质量的评鉴分析摘要用好的葡萄也许酿不出好酒,但没人能用劣质葡萄酿出好酒。
巧妇难为无米之炊,再优秀的酿酒师,如果没有优质的葡萄,也很难酿出好酒。
不同葡萄品种酿制出的葡萄酒是不同的,但是,除了品种间的差异,葡萄自身的质量是酿制高品质葡萄酒的关键。
本文通过建立meansK-聚类模型、典型相关分析等模型,逐步探求用葡萄和葡萄酒的理化指标来评鉴葡萄酒质量的方法。
问题一要求我们分析附件1中两组评酒员的评价结果是否存在显著性差异,为此我们依据小概率原理建立模型Ⅰ-显著性检验模型。
首先我们利用F检验求解两组评酒员之间是否存在显著性差异,再利用配对t检验对检验样本做再次检验,以提高研究效率,确保评价结果的准确性。
利用Excel软件处理数据后,进行t、F的联合检验,当联合检验均被接受,得到两组评酒员的评价结果有显著性差异的结论。
同时通过对两组品酒员对55种葡萄酒样品评分的稳定性、统一性分析,确定第二组品酒员的评价结果更可信。
针对问题二本文根据附件2提供的数据,利用模糊数学原理[3],建立模型ⅢK-聚类模型,对酿酒葡萄进行分类,再以葡萄酒品尝评分作为质量评价依据,means对酿酒葡萄进行分级。
首先,考虑到酿酒葡萄的理化指标过多,不便分类,我们利用多元统计分析原理对红、白酿酒葡萄进行主成分分析,得出红、白酿酒葡萄分别有8个和11个主成分,从而大大减少了分类指标。
再利用meansK-算法求出最佳聚类数k,建立meansK-聚类模型对各种葡萄样品在各个主成分上的得分进行聚类,将红、白葡萄样品分别划分为3类和4类。
最后,根据每个类别中葡萄样品对应的葡萄酒的品尝评分,对各类酿酒葡萄进行分级。
针对问题三建立模型Ⅳ-典型相关分析模型,定量分析酿酒葡萄与葡萄酒的理化指标之间的联系。
我们首先选取酿酒葡萄与葡萄酒皆含有的花色苷、单宁等成分作为理化指标,然后构建典型相关分析模型,研究酿酒葡萄与葡萄酒两组样品的理化指标之间的相关性。
2012数学建模竞赛附件1-葡萄酒品尝评分表

酒样品19 澄清度 5 色调 10 纯正度 6 香气分析 浓度 8 30 质量 16 纯正度 6 浓度 8 口感分析 44 持久性 8 质量 22 平衡/整体评价 11 外观分析 15
品酒员1号 分数 4 8 4 7 12 4 6 6 16 9
品酒员2号 分数 4 8 5 6 14 4 7 7 19 10
酒样品13 澄清度 5 色调 10 纯正度 6 香气分析 浓度 8 30 质量 16 纯正度 6 浓度 8 口感分析 44 持久性 8 质量 22 平衡/整体评价 11 外观分析 15
品酒员1号 分数 3 8 4 6 12 4 6 5 13 8
品酒员2号 分数 3 8 5 7 14 5 7 6 19 10
7 14 5 6 6 19 9
6 10 5 6 6 16 8
6 12 3 6 6 13 9
8 16 6 8 6 19 10
6 10 5 6 5 16 9
酒样品17 澄清度 5 色调 10 纯正度 6 香气分析 浓度 8 30 质量 16 纯正度 6 浓度 8 口感分析 44 持久性 8 质量 22 平衡/整体评价 11 外观分析 15
品酒员3号 分数 4 8 4 6 12 5 8 8 19 10
品酒员4号 分数 5 4 4 6 10 4 6 6 13 8
品酒员5号 分数 2 10 3 6 12 4 4 6 13 8
品酒员6号 分数 5 8 5 7 14 5 8 7 19 9
酒样品18 澄清度 5 色调 10 纯正度 6 香气分析 浓度 8 30 质量 16 纯正度 6 浓度 8 口感分析 44 持久性 8 质量 22 平衡/整体评价 11 外观分析 15
6 4 6 10 4 6 6 13 8
8 4 7 12 5 6 7 19 10
数学建模-葡萄酒评价

2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量?
2问题的分析
日期: 年 月
日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时便用):
评阅人
评分
n
n
n
n
n
n
n
n
n
n
备注
o
o
o
o
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
红葡萄酒的评价结果有显著性差异。
同理,正秩与负秩均值分别为11.06与16.13,大致相当。因此,Wilcoxon符号平均秩检验是可行的。由于P = .0018 <0.05 (a =0.05),拒绝原假设与日口 无显著差异,即两组评酒员的对白葡萄酒的评价结果有显著性差异。
由于两组品酒员对红葡萄酒与白葡萄酒的品尝评分均存在显著差异,因此, 可认为两组评酒员的评价结果由显著差异。
2.2问题二
将酿酒葡萄理化指标进行单因子方差分析,选取出在聚类分析中发挥明显作 用的m个指标。根据酿酒葡萄的好坏与所酿葡萄酒的质量关系有直接关系,把 对葡萄酒质量的评分当做特殊的第m+1个指标。由于各指标的对酿酒葡萄分级 所发挥作用的效果不同,而传统聚类分析把各指标放在了等同的地位。基于这点, 本文提出了考虑权重的聚类分析方法。通过网络査阅资料,对各指标在分级中所 起的重要性进行评分。最后对赋权的指标进行聚类分析,对所分类样品数据加权求平均分来分级。
2012数学建模A题---葡萄酒评价---国家奖

葡萄酒的评价摘要本文主要运用统计分析方法,解决与所酿葡萄酒有关的问题。
对于问题一,,分别对白酒和红酒的两组数据进行差异性检验。
构建一个能反应葡萄酒本身质量的量,对两组数据分别进行相关性分析,得到第二组评酒员的结果更可信。
对于问题二,先做聚类分析,再做线性回归分析,得到白、红葡萄分为4级和3级。
对于问题三,利用问题二中聚类得到的7个主成分,把每种葡萄酒的理化指标与酿酒葡萄之间的7个主成分进行相关性分析,得到7个回归方程,即为酿酒葡萄与葡萄酒的理化指标之间的联系。
对于问题四,首先建立模型:12W=a *Y +b *Y 。
其中a,b 分别为酿酒葡萄和葡萄酒对葡萄酒质量的贡献率,1Y ,2Y 分别为两种因素的贡献值。
然后,通过确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。
问题一中,本文运用excel 做两组数据的显著性差异检验,得到两组评酒员在评论白酒和红酒都存在显著性差异,且通过了F 检验。
接着本文通过确定各指标的权重,构建一个能反应各葡萄酒实际平分的量,把两组数据与之做相关性分析,发现第二组与之相关性更大,故第二组评酒员的结果更可信。
问题二中,本文通过SPSS 做理化指标的聚类分析,得到7个主成分;再做指标与评分的线性回归分析,得到白葡萄的分级结果为4级:一级:白酿酒葡萄14,22;二级:白酿酒葡萄4,5,9,19,23,25,26,28;三级:白酿酒葡萄24,27;四级:白酿酒葡萄1,2,3,6,7,8,10,11,12,13,15,16,17,18,20。
红葡萄酒为3级:一级:红酿酒葡萄2,9;二级:红酿酒葡萄3,4,10,22,24;三级:红酿酒葡萄1,5,6,7,8,11,12,13,14,15,16,17,18,19,20,21,23,25,26,27。
问题三中,本文运用excel 将葡萄酒的一级指标分别与7个主成分进行相关性分析然后对每种主要成分利用SPSS 进行线性回归分析得到以下7个回归方程:()()()()()r1134r21367r3137r4136r6137r71Y =-39.542+1.727+21.850+3.9463Y =4.044+0.026-0.156-0.005-0.1954Y =2.807+0.021-0.030-0.1895Y =2.700+0.024-0.169-0.0056Y =0.069+0.001-0.006-0.0077Y =70.028-0.188+x x x x x x x x x x x x x x x x x ()()2347r8123560.841+0.280-0.187+1.7048Y =58.545-0.021-1.028+1.666+27.045-0.0049x x x x x x x x x 即为每种酿酒葡萄与葡萄酒理化指标之间的联系。
2012年全国数学建模大赛 A题葡萄酒的评价

葡萄酒的评价摘要本文就影响葡萄酒的质量的因素进行了探究。
在问题一中,评酒员间存在评价尺度、评价位置以及评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,于是我们需要探讨两组评酒员的可信度。
对此,我们建立了单元素方差模型对其进行了显著性差异的判断,最后我们得出结论:两组评酒员的评价结果有显著性差异,并且第二组评酒员评价的结果更加可信。
在问题二中,我们首先将大量的数据进行了样本住分析塞选,大大减少了计算量,就红、白葡萄酒前17组样本葡萄酒的分数进行训练,由后十组的理性指标进行检验,也可检验俩个的准确性。
最后我们认为可以给酿酒葡萄分为一、二、三、四四个等级。
在问题三中,因为要讨论酿酒葡萄与葡萄酒的理化指标之间的联系,我们就其两者的重要理化指标进行了探讨,应用了回归模型将其各项重要指标进行了多元拟合处理,最后得出了葡萄酒和酿酒葡萄中的重要指标的等式关系。
在问题四中,我们首先利用了回归原理求得葡萄酒质量与葡萄酒和酿酒葡萄的理化指标之间的等式关系,由等式和图像细致的分析了葡萄酒和酿酒葡萄理化指标对葡萄酒质量的影响。
在一定范围内,理化指标的与葡萄酒的质量呈正相关,达到一定的量后呈现负相关趋势。
关键词:显著性差异判别主成分分析 BP神经网络回归模型1.问题的重述现今社会,随着人们生活水平的提高,人们对葡萄酒的质量要求也越来越高。
在确定葡萄酒质量的时候,一般聘请一批资深的评酒员进行评比,根据不同的指标所得的分数从而求得总分,以此确定葡萄酒的质量。
其中酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本题给出了3份材料,材料1是某一年份一些葡萄酒的评价结果,材料2和材料3分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据。
我们必须解决以下问题:问题一:分析材料1中两组评酒员的评价结果是否有明显的差异,并且求出哪组评酒员的评价结果更可信。
问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄的品质进行分级。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
葡萄酒的评价模型摘要本题主要讨论了酿酒葡萄与葡萄酒的理化指标之间的关系,并得出结论能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,这对于盛行的葡萄酒的鉴赏具有重要意义。
从建模的角度来说,这道题偏重于统计学的知识,因此,我们利用应用广泛的统计学软件SPSS19.0来进行分析。
问题一用独立样本T检验判断两组有无显著性差异。
对红、白葡萄酒分别检验,则两组评分均有显著性差异,并且第二组评酒员的评分更为可信。
对于问题二,我们利用了问题一的结果作为葡萄酒的质量,使之与葡萄的理化指标相结合进行聚类分析,分别将红白葡萄酒都分为四个等级。
对于问题三,要研究葡萄与葡萄酒理化指标之间的联系,用多元统计中的典型相关分析研究两个变量组之间的联系。
由于两组变量存在组内多重共线性,因而先用因子分析缩减变量,使分析结果准确可靠。
得到结果葡萄的各指标对葡萄酒的综合影响大于个体指标的影响。
问题四则在问题三因子分析的基础上,对公因子变量和葡萄酒质量进行回归分析,得出可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键字:独立样本T检验聚类分析因子分析典型相关分析综合影响回归分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1问题1的分析分析两组打分结果有无显著性差异,实质是对这两个独立样本均值的t检验。
我们先不区分红酒还是白酒,统一对两组评酒员对55个酒样本的评分进行两个独立样本均值的t检验:如果结果显示无显著性差异,则可能是实际两组评分无显著差异,也可能是红酒和白酒的评分差异互相抵消的结果,需要将红酒评分和白酒评分进一步分开,分别做显著性检验;如果结果显示有显著性差异,则可以直接由离散趋势的相关指标判断出哪一组更可信。
在判断哪一组的结果可信度更高时,我们认为同一组评酒员对同一个酒样本的评分差别越大,即离散程度越大,则他们的评分越不可信。
考虑到每组评分的总体水平不同,我们选用标准差系数来进行比较判断。
2.2问题2的分析本题要求对酿酒葡萄进行分级。
我们有两种解决思路,聚类分析法和因子得分分析。
题目附件2中给出了葡萄的各理化指标,又已知每个评酒员对葡萄酒的打分可看做是葡萄酒的质量,所以我们可以用葡萄的理化指标和葡萄酒的分数作为标准,利用SPSS聚类分析法评定葡萄的等级。
聚类分析是根据事物本身的特性研究个体分类的方法,聚类分析的原则是同一类中的个体有较大的相似性,不同类中的个体差异很大,它是一种探索性的分析,在分类的过程中,不必事先给出一个分类的标准,而能够从样本数据出发,自动进行分类。
因子分析是将酿酒葡萄的理化指标反映到可以综合它们的公因子上,然后按各公因子对应的方差贡献率为权重计算综合统计量,对此进行排序分级。
2.3问题3的分析根据题意,要求分析酿酒葡萄与葡萄酒的理化指标之间的联系。
根据题目附件2的葡萄酒和葡萄的理化指标可看出,题中给出的指标数量多,指标的等级不同,且相互之间可能存在较强的相关性而并不相互独立,使得直接用这些指标进行分析并不合理。
因此,我们首先使用原始数据得出二级指标是从一级指标中分离出来的,可以只对一级指标进行分析,直接剔除二级指标;其次,使用因子分析和典型相关分析相结合的方法,消除组内多重共线性的影响,使分析结果准确可靠。
2.4问题4的分析:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可以通过SPSS 软件作线性回归分析,评分作为因变量,各理化指标作为自变量。
在问题3我们得知酿酒葡萄中的一些指标与葡萄酒的指标存在多重共线性,所以在将各指标进行回归时,为了减少此影响,可以通过6个公因子,用此来进行回归分析。
因为红白葡萄酒在理化指标上有所不同,我们可以再分别分析红,白两种葡萄酒质量受到哪些因子的影响。
三、模型假设 1.做典型相关分析时,假设两组变量之间为线性关系,即每对典型变量之间为线性关系;2. 在做多元线性回归模型中,假设各自变量序列之间完全不相关。
四、符号说明i x (1=i 、2、3……、10) 葡萄各指标变量j y (1=j 、2、3……、8) 葡萄酒各指标变量U 第一对典型变量为V 第二对典型变量F 1, F 2, F 3, F 4, F 5, F 6 主成份变量五、问题一的解答5.1统一对两组评酒员对55个酒样本的评分进行两个独立样本均值的t 检验由题目附件1的原始数据,我们首先在SPSS 软件中将两组评酒员对这55种酒样品的打分情况进行输入,根据题意,分类指标的总和即为各样品的总分,我们对原始数据做了分类汇总,得到每位评酒员对每种酒样本的评分汇总表(见附件1:表1.1)。
要对汇总表中的数据的均值进行显著性检验,首先建立原假设和备择假设如下:210:μμ=H 211:μμ≠H利用SPSS 软件中比较均值中的“独立样本t 检验”,得到如下结果:由于Levene’s方差齐性检验结果小于0.05,因此方差不相等,选用方差不相等的t检验结果,P值(Sig.)显示为0.959,大于0.05,从而最终得到的统计结果为接受原假设,可以认为这两组评酒员对55个酒样本的评价结果无显著性差异。
由检验变量的基本情况,用标准差比均值计算出标准差系数,第一组标准系数为0.147,第二组为0.107,所以第二组打分的结果更可信。
5.2两组评酒员对红葡萄酒样品评分的差异性检验用同5.1的方法,可以整理出个评酒员对红葡萄酒的评分,同样的方法,求由于Levene’s方差齐性检验结果小于0.05,因此方差不相等,选用方差不相等的t检验结果,P值(Sig.)显示为0.001,小于0.05,从而最终得到的统计结果为拒绝原假设,可以认为这两组评酒员对红葡萄酒的评价结果有显著性差异。
数为0.14,第二组为0.096。
所以第二组打分的结果更可信。
5.3两组评酒员对白葡萄酒样品评分的差异性检验采用与红葡萄酒相同的方法,求得如下结果:表(5):组统计量组别N 均值标准差均值的标准误评分_sum 1 280 74.0107 11.37484 .67978.464182 280 76.5321 7.76716相等的t检验结果,P值(Sig.)显示为0.002,小于0.05,从而最终得到的统计结果为拒绝原假设,可以认为这两组评酒员对白葡萄酒的评价结果有显著性差异。
由检验变量的基本情况,用标准差比均值计算出标准差系数,第一组标准系数为0.154,第二组为0.101。
所以第二组打分的结果更可信。
5.4模型结果分析:由模型得到,在对55种样品的检验中,P值(Sig.)为0.959,大于0.05,说明两组评分的均值相等,那么两组评酒员评价结果无显著性差异。
第二组标准系数为0.107,第一组为0.147,显然第二组的离散程度比第一组小,说明第二组打分的结果更可信。
在对红葡萄酒的打分分析中,P值为0.001,小于0.05,则表明两组评酒员评价结果有显著性差异。
由标准系数得知,第二组打分的结果更可信。
在对白葡萄酒的打分分析中,P值为0.002,小于0.05,则表明两组评酒员评价结果有显著性差异。
由标准系数得知,第二组打分的结果更可信。
综上,我们认为第二组的打分结果更可信。
六、问题二的解答6.1.选定葡萄的理化指标考虑到此题中大多数二级指标和一级指标之间的包含关系,我们在葡萄的理化指标中将二级指标直接剔除,只考虑一级指标。
但是由于数据庞大,我们依然需要对一级指标进行筛选。
查找检验葡萄的一般理化指标和相关论文中认为重要的指标,我们对于酿酒葡萄[1]选出了总糖,还原糖,可溶性固形物等10种指标。
(见附件2:指标)6.2. 确定葡萄酒的质量表示在问题一中,我们在不区分红白葡萄酒,直接对两组评酒员对所有55种酒样本的评分进行显著性检验时,求得两组评酒员的打分不存在显著的差异。
并且两组评酒员评分的均值和标准差都差别不大,为了使数据更准确,我们将每个酒样品的质量用20位评酒员对该样品打分的均值来表示。
(见附件2:评分)6.3葡萄的理化指标和葡萄酒质量的聚类分析[2]为了在SPSS中进行聚类分析的需要,我们将葡萄的理化指标表和葡萄酒质量表合并到一个表中(见附件2:合并之后)。
考虑到不同的成分数值差异显著,我们先对变量进行标准化处理(见附件2:标准化之后),然后利用SPSS软件中系统聚类分析方法,分别对红白两种酿酒葡萄进行分类。
其中系统聚类分析中用到了ward联接方法,红白葡萄酒的聚类表(见附件2:聚类表)。
可以选择不同的联接方法,进行多次测试,选出合理的等级分法。
6.4模型结果及分析(1)对红葡萄的分级等级一:葡萄样品1,葡萄样品6,葡萄样品7,葡萄样品8,葡萄样品12,葡萄样品15,葡萄样品18等级二:葡萄样品2,葡萄样品3,葡萄样品9,葡萄样品17,葡萄样品21,葡萄样品23,葡萄样品24等级三:葡萄样品4,葡萄样品5,葡萄样品11,葡萄样品13,葡萄样品14,葡萄样品16,葡萄样品19,葡萄样品20,葡萄样品22,葡萄样品25,葡萄样品26,葡萄样品27等级四:葡萄样品10用树状图更形象的表现为:图(1):红葡萄的树状图(2)对白葡萄的分级等级一:葡萄样品1,葡萄样品6,葡萄样品7,葡萄样品13,葡萄样品14,葡萄样品15,葡萄样品17,葡萄样品18,葡萄样品22等级二:葡萄样品2,葡萄样品3,葡萄样品9,,葡萄样品12,葡萄样品19,葡萄样品23,葡萄样品26,葡萄样品27等级三:葡萄样品4,葡萄样品5,葡萄样品10,葡萄样品20,葡萄样品21,葡萄样品24,葡萄样品25,葡萄样品28等级四:葡萄样品8,葡萄样品11,葡萄样品16用树状图更形象的表现为:图(2):白葡萄树状图:(3)模型结果分析由上图,我们对红白葡萄都采用了四级分法。
将27种红葡萄和28种白葡萄进行分级。
对于四个等级,分析各项指标的特征值,可以检验样品归为一类的原因以及各等级的特征。
以红葡萄为例,利用SPSS软件中描述功能,对各等级下成分特征进行分析。
描述统计见附件2:红葡萄的描述统计量。