2012高教社杯全国大学生数学建模竞赛A题论文
2012高教社杯全国大学生数学建模竞赛A题

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):20122125所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):教练组日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文要研究的是酿酒葡萄和葡萄酒理化指标与葡萄酒质量之间的关系。
对于问题一:首先从外观分析、香气分析、口感分析、平衡/整体评价以及各类指标总得分五个方面进行方差分析得到有显著性差异,然后进行T检验验证出第二组品酒员的结果更可信。
对于问题二:首先分析附件2中一级指标的数据,运用主成份分析法得出综合评价值,然后用聚类分析法得到葡萄样本的冰柱图,再综合第二组的评分进行酿酒葡萄的分级(升级排序),等级1样本:27,11,26,25,10等级1样本:18,12,25,28,27,24等级2样本:19,14,16,13,4,20等级2样本:3,26,10,15,5,7等级3样本:22,24,7,5,18,8,15等级3样本:9,23,20,2,14,6等级4样本:21,6,23,17,12等级4样本:13,19,21,4,11等级5样本:1,2,9,3等级5样本:17,16,1,8,22酿酒红葡萄酿酒白葡萄对于问题三:首先运用主成分分析法得到各主成分的贡献率,取贡献率最高的主成分列出关系式进行分析,进而筛选出重要理化指标,然后再进行典型相关分析,运用matlab进行编程,求得反应酿酒葡萄与葡萄酒的理化指标之间联系的典型相关系数,再进行典型相关系数的显著性检验,得到两者有显著性关系。
2012年数学建模A题优秀论文

基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。
得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。
接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。
首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。
然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。
得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。
对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。
一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。
另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。
最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。
对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。
对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。
2012高教社杯全国大学生数学建模竞赛全国一等奖A题

2011高教社杯全国大学生数学建模竞赛城市表层土壤重金属污染分析摘要本文主要研究重金属对城市表层土壤污染的问题,我们根据题目所给定的一些数据和信息分析并建立了扩散传播模型、权重分配模型、对比模型和转换模型解决问题。
首先,我们利用Matlab 软件拟出该城区地势图(图1),根据所给数据绘出该地区的三维地势及采样点在其上的综合空间分布图。
之后将8种重金属的浓度等高线投影到该地区三维地形图曲面上,接着分别计算8种重金属在五个区域的平均值,立体图和平面图(图1附件)相结合便可得出8种重金属元素在该城区的空间分布。
其次,在确定该城区内不同区域重金属的污染程度时,我们运用两种方法进行解答。
先假设各重金属毒性及其它性质相同,运用公式ijij P C P ='求出各区域各金属相对于背景平均值的比值作为金属污染程度,再运用1ji ij j C C ==∑求出各区域重金属污染程度,并将各区进行比较。
之后,我们加上各重金属的毒性,对各重金属求出权数,再结合国标重金属污染等级和已知的各组数据来确定金属的污染程度。
由上述两种方法的对比,更准确地得出重金属对各区的影响程度。
即: 工业区>交通区>生活区>公园绿地区>山区 并根据第一个模型的数据来说明重金属污染的主要原因。
再次,对重金属污染物的传播特征进行了分析,判断出重金属污染物主要是通过大气、土壤和水流进行传播。
在分析之中,我们得出这三种状态的传播并不是孤立存在的,而是可以相互影响和叠加的,因此,我们分别建立三个传播模型,再对这三个传播模型进行了时间和空间上的拟合,得出重金属浓度最高的区域图,并结合各重金属的分布图(图6)来确定各污染源的位置。
最后,本题中只给出了重金属对土壤的污染,对于研究城市地质环境的演变模式,还需要搜集一些信息(图7)。
根据每种因素对地质环境的影响程度进行由定性到定量的转化。
建立同一地质时期地质环境中各因素的正影响和负影响的权重分配模型,再对这些权重进行验算和修正。
2012CUMCM全国大学生数学建模竞赛A题论文

2012CUMCM全国大学生数学建模竞赛A题论文D进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话): 132所属学校(请填写完整的全名)大连海事大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号)赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要:本文主要需要解决的问题是将葡萄酒从评酒师感官方面的定性评价通过一定的数据处理与数学模型的建立转化为由酿酒葡萄和葡萄酒理化指标做基础的定量的葡萄酒评价方法。
考虑到红葡萄酒和白葡萄酒之间的差异性,我们对它们分别进行讨论。
针对题目中的问题,我们通过如下的方法去解决:(1)第一问是对评酒员评分的差异性的分析与可信度的分析。
我们通过传统统计学的平均数与标准差的计算方法,计算各葡萄样品评酒员所打分数的平均值与每组评酒员之间所打分数的标准差,再进行作图比较,得出我们想要的结论。
(2)第二问是根据酿酒葡萄的理化指标对酿酒葡萄进行分级。
我们首先通过计算各理化指标的Pearson相关系数矩阵,分析各指标之间的Pearson相关系数,得到高度相关的理化指标。
再通过聚类的方法,将这些理化指标聚合成一类因子。
最后通过对各因子与葡萄酒质量的数据拟合,得出一定的函数关系式,结合前苏联对葡萄酒的评价模型与张大鹏检验模型对关系式进行检验。
(3)第三问是分析酿酒葡萄和葡萄酒理化指标之间的联系。
我们首先选取一些含量大且对葡萄酒质量有较大影响的理化指标。
对这些指标进行数据拟合与修正,得出我们想要的函数关系式。
高教杯2012年数学建模A题

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): a我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文利用SPSS和MATLAB软件对葡萄酒评价问题进行了分析,综合采用了t检验、主成分分析、聚类分析和灰色关联度分析等方法,建立了数学模型,并设计了一套对葡萄酒质量的评价体系。
关于问题一:首先,对两组评酒员对同一种葡萄酒给出的评分结果进行处理;其次,采用t检验判断出两组评分结果存在显著性差异;最后,利用每一组评酒员对同一种葡萄酒的评分方差作为衡量依据,建立评分机制,评估两个小组所给结果的可信性,经分析第一组、第二组得分分别为13分、42分。
因此,第二组评酒员的评分结果更可信。
关于问题二:首先,对酿酒葡萄的理化指标进行主成分分析,挖掘出若干个影响酿酒葡萄理化指标的主要成分;其次,根据第一问的结果,将第二组评酒员的评分作为衡量葡萄酒质量的量化指标;最后,通过聚类分析将酿酒葡萄分为4个等级。
2012全国数学建模论文a题(葡萄酒)省一等奖范文

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):指导组日期:2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):2葡萄酒的评价摘要本文主要根据评酒员对葡萄酒的一系列指标的打分,从而对葡萄酒的质量作出判别。
考虑到酿酒葡萄的好坏、所酿葡萄酒的质量和酿酒工艺、陈酿技术等约束条件,为此我们建立模型来确定影响葡萄酒评价的各种因素。
在这模型中利用excel,spss,matlab等一系列的数学工具对模型进行求解,综合统计分析的应用对所给的结果进行比较,从而得出最终的结果。
首先,对于问题1,分析两组评酒员的评价结果,每个评酒员对外观、口感、香气、平衡/整体四个方面指标得分进行求和,得到其总分,确定葡萄酒的质量。
由于葡萄酒的质量满足正态分布,为了能分辨出两组的差异,所以利用spss进行配对T检验,从而得出两组评酒员有显著的差异。
其次,用excel对两组进行方差分析,根据所得到的P值大小,得出第一组的评价结果更为可信。
对于问题2,在问题1的基础下,根据所给的理化指标和葡萄酒的质量利用spss统计分析软件进行分析,相关性分析对数据进行预备分析,剔除与葡萄酒质量无显著性相关的指标,再利用系统聚类的方法对酿酒葡萄进行分级。
2012年数学建模A题优秀论文

基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。
得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。
接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。
首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。
然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。
得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。
对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。
一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。
另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。
最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。
对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。
对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。
2012年数学建模A题一等奖获奖论文

秩和得到一个新的排序。由于此排序综合了 20 个评酒员的结果,因此,更能反 应酒样的排序真实性,即认为该综合排序为理想排序。记样品 j 在第一组、第二 组排序内的秩次为 X j (1) , X j (2) ,综合之后排序秩次为 X j 。红葡萄酒三种排序的 比较图如下:
关键词:葡萄酒评价
排序检验法
符号秩检验
TOPSIS 法
多重比较
1
一、问题重述
对于葡萄酒质量的确定,现如今通常采用感官评价的方法,即聘请一批有资 质的品酒员对葡萄酒进行品评,然后对其外观、口感等分类指标进行打分。最后 通过求和得到每种葡萄酒的总分,从而确定葡萄酒的质量。附件 1 中给出了某一 年份一些葡萄酒的打分结果。 同时,酿酒葡萄的好坏又直接影响着所酿葡萄酒的质量。除了感官评价的方 法之外,在某种程度上,葡萄酒和酿酒葡萄检测的理化指标也能反映葡萄酒和葡 萄的质量。附件 2 和附件 3 即给出了同一年份中,这些葡萄酒的和酿酒葡萄的成 分数据。 请分析题目,试建立合适的数学模型解决以下问题: 1. 对于附件 1 中的红葡萄酒与白葡萄酒, 每种葡萄酒均由两组评酒员对其进 行打分。试分析这两组品酒员的评价结果有无显著性差异,并判断哪一组的结果 更为可信。 2. 综合感官评价所得到的葡萄酒质量与酿酒葡萄的理化指标,对酿酒葡萄 进行分级。 3. 试分析酿酒葡萄、葡萄酒的两组理化指标之间有何关系。 4. 分析酿酒葡萄的理化指标、葡萄酒的理化指标对葡萄酒质量的影响,论 证能否只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
3
分的差异是否在一定的置信区间内,若不在,则认为评分差异性显著。 考虑到本题的背景,两组评分的差异可体现在对样本酒的排名差异上。由于 该问属于食品评价中的感官评价问题,因此,可结合感官评价中的排序检验与非 参数检验中的符号秩检验,对两组评分的显著性进行评价。 1.1.1 样品秩次和秩和的求解 评酒员对每一个酒样均从四大方面进行了评分。根据题意,葡萄酒的质量由 总分所确定。 因此, 我们将每一个方面的评分加和, 得到 i 品酒员对葡萄酒样品 j 的总评分。 以红葡萄酒的评价为例,对于品酒员 i ,将其对 27 种样品的评分进行排序, 评分最高的酒样秩次为 1,当多个样品有相同秩次时,则取平均秩次。记在 i 品 酒员的评价排序中, j 酒样的秩次为 xij ,可得到秩次矩阵为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文讨论的是葡萄酒的评价,首先把两组品酒员对27种葡萄酒的感官评分的算术平均值作为27种葡萄酒的两组质量得分,然后把每一种葡萄酒的两组得分作为一对数据它们差的值作为一个随机变量的27个取值,因为这27组值可以看成是仅由品酒员的差异引起的,然后利用基于成对数据的检验(t检验)进行显著性检验,得出的结论是两组品酒员的评价结果有显著性差异,然后通过认为品酒员对同一种葡萄酒的评分的方差越小越可信,确定第二组结果更可信。
第二问是通过葡萄酒的质量得分确定葡萄的等级,然后再利用酿酒葡萄的理化指标进行聚类分析得出分类,最后将酿酒葡萄的分类与葡萄酒的评分综合考虑最终得出酿酒葡萄的等级。
第三问先通过主成分分析把多个理化指标转化为几个综合的指标,然后与对应葡萄酒的理化指标做典型性相关分析,得出两者之间的关系。
第四问则是把酿酒葡萄的综合理化指标和葡萄酒的理化指标与葡萄酒的得分做多元线性回归,得出回归方程,最终的出结论可以通过酿酒葡萄与葡萄酒的理化指标来评价葡萄酒的质量。
关键词:基于成对数据的检验主成分分析聚类分析典型性相关分析多元线性回归分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
现要求建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
二、问题分析本问题是关于葡萄酒质量分析,首先通过对附录一的观察,先要对其中的数据进行处理,我们采用假设检验中,基于成对数据的检验(t 检验),利用t 检验的方法分别求出第一组和第二组评酒员对红、白葡萄酒总评分,进而求得均值、方差。
利用t 检验所求的t 值是否落在拒绝域内,评定结果是否具有显著性差异。
然后利用两组标准差的均值,通过对两组数据的对比,判断出哪一组结果更可靠,从而解决了问题一。
三、模型假设1 在进行聚类分析和主成分分析时忽略二级指标对于理化性质的影响;2 在对样本进行t 检验室时,要将样本均值作为一对随机变量。
四、符号说明i x :第一组评酒员对一种红葡萄酒评定总分的均值 i y :第二组评酒员对一种红葡萄酒评定总分的均值 j x :第一组评酒员对一种白葡萄酒评定总分的均值 jy :第二组评酒员对一种白葡萄酒评定总分的均值n :葡萄酒种数d :样本均值的观察值is :样本的标准差:F 主成分五、模型的建立与求解5.1问题一5.1.1 对附件一的数据进行整合为了比较两组数据的差异,我们需要在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出判断。
本题附件一中的数据是成对的,即是两组人对此酒样品评出的两组数据。
首先,我们对两组数据进行了整理,将每个评酒员的各项评分进行求和,再将每组十个评酒员对同一酒样的总评分求平均值。
5.1.2问题一的模型建立与求解一般,设有n 对相互独立的观察结果:()1,1Y X ,()2,2Y X ,…,()n Y X ,n ,令111Y -X =D ,222Y -X =D ,…n n n D Y -X =,则1D ,2D ,…,n D 相互独立。
又由于1D ,2D ,…,nD 是有同一因素所引起的,可认为他们服从统一分布。
今假设()DD i N D 2~σμ,,.21n i ,,,Λ=这就是说1D ,2D ,…,n D 构成正态总体()D D N 2,σμ的一个样本,其中D D 2,σμ未知。
我们需要基于这一样本检验假设:;0:,0:10≠=D D H H μμ分别记1D ,2D ,…,n D 的样本均值和样本方差的观察值为-d ,Ds2,关于单个正态总体均值的t 检验。
知检验问题的拒绝域分别为(显著性水平为05.0=α):(),12/-≥=-n t nS d t a D根据此模型,讨论本题的检验问题,由公式分别求出两组的id ,'i d ,i s ,'i s 公式如下:,11∑=-=ni i D n d.1121∑=-⎪⎭⎫⎝⎛--=n i i d D n s把以上两式代入t 检验方程,根据excel 中的计算数据(见附录),可分别求出第一组和第二组的拒绝域为≥t )26(025.0t 和≥t )27(025.0t .红葡萄酒有二十七种样品,当=a 0.05时,由t 分布表可知()=-12/n t a 0555.2,通过上述计算数据可明显看出 6138.2t =,因为)26(t 2αt ≥,所以拒绝原假设,接受备择假设,即认为两组评分有显著性差异。
白葡萄酒有二十八种样品,当=a 0.05时,由t 分布表可知()=-12/n t a 0518.2.通过上述计算数据可明显看出 5117.2t =因为)26(t 2αt ≥,所以拒绝原假设,接受备择假设,即认为两组评分有显著性差异。
现t的值落在拒绝域内,故认为两组数据有显著性差异。
通过对所有酒样品总分求方差,再对一二组的红白葡萄酒的所有方差求平均值,由所得的数据可明显看出,第一组的方差均值大于第二组的方差均值(见附录)。
所以第二组结果更可信。
5.2.1初步分析通过第一问的求解,我们确定了以第二组数据为葡萄酒质量的理论依据,要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,根据酿酒葡萄的理化指标进行聚类分析,求出树状图与1问中代表葡萄酒质量的数据进行对比,从而得到酝酿葡萄的分级。
应用SPSS 软件计算结果如下:红葡萄酒树状图白葡萄酒树状图通过树状图和葡萄酒的质量进行综合分析,可把酿酒葡萄分为四级,分别为:红葡萄酒优质酒样品号:2,17,3,20,23,9良好酒样品号:4,24,27,22,20,26,5,21,14,19中等酒样品号:1,25,12,13,10,16一般酒样品号:11,7,18,15,8,6白葡萄酒优质酒样品号:21,22,25,28,10,17,9,5良好酒样品号:24,19,20,18,4,2,7,14,23,1,15中等酒样品号:13,7,26,6,3,2一般酒样品号:16,11,8,125.2 问题三我们利用第二问中主成分分析的结果,和葡萄酒的理化指标进行多元统计分析中的从红葡萄特征值及主成分贡献表可知前八个成分的累计贡献率84.159%,按照累计方差贡献率大于80%的原则,选入了八个主成分。
分别为第一主成分1F 第二主成分2F ……第八主成分8F :30211417.0172.0573.0x x x F ++-=Λ30212512.0380.0558.0x x x F +--=Λ……30218089.0034.0104.0x x x F +++=Λ用主成分可计算出各样品的主成分值。
然后利用酿酒葡萄的各个主成分值和所酿葡萄酒的成分含量,作为两组数据,进行典型相关分析。
5.3 问题四通过第三问的求解,我们了解了酿酒葡萄和葡萄酒的联系,运用SPSS 将酿酒葡萄与葡萄酒的理化指标,与葡萄酒的感官质量得分,进行多元线性回归分析,并得出多元线性方程,进行显著性检验,最终得出结论可以通过酿酒葡萄和葡萄酒的理化指标来确定葡萄酒的质量。
参考文献[1] 胜骤谢式千潘承毅,概率论与数理统计(第四版),浙江大学,2011。
[2] 袁志发宋世德,多元统计分析(第二版),科学出版社,2008。
[3] 李卫东,应用多元统计分析,北京大学出版社,2008.[4] 佟昕宋捷,谈统计学中的相关与回归分析,经济视野,1672—5646(201 1)05—0017—02。
[5] 中国统计年鉴,2009。
[6] 谢辉樊丁宇张雯郭春苗周晓明严鹏卢春生,统计方法在葡萄理化指标简化中的应用,新疆农业科技,1001-4330{2011}08143404。
[7] 姜启源谢金星叶俊,数学模型,北京:高等教育出版社,2003。
附录样品号一组二组样品号红葡萄酒白葡萄酒红葡萄酒白葡萄酒平均值X i样品方差X j样品方差Y i样品方差Y j样品方差X i-Y i X j-Y j1 62.79.63882.9.60368.19.04977.95.08714.1 -5.42 80.36.30874.214.18074.4.02875.87.0052-1.6 6.33 80.46.76979.219.10874.65.54275.611.93733.6 5.84 68.610.39479.46.68771.26.42676.96.48842.5 -2.65 73.37.87571.11.24572.13.69581.55.1265-10.5 1.26 72.27.72968.412.75666.34.59675.54.7676-7.1 5.97 71.510.17977.56.25865.37.91774.26.49473.3 6.28 72.36.63470.412.78266.8.06972.35.5798-1.9 6.39 81.55.74072.99.63278.25.07380.410.3099-7.5 3.310 74.25.51474.314.58368.86.01579.88.39010-5.5 5.411 73.8.41272.313.30961.66.16871.49.371110.9 11.412 53.98.92563.310.76168.35.01272.411.83412-9.1-14.413 74.66.70365.913.06868.83.91073.96.83913-8.0 5.814 73.6.00072.10.68772.64.81277.13.98514-5.1 0.415 58.79.25072.411.47265.76.43078.47.35115-6.0 -7.016 74.94.25474.13.34269.94.48367.39.068166.7 5.017 79.39.38178.812.00774.53.02880.36.20117-1.5 4.818 59.96.87173.112.51265.47.09076.75.49818-3.6 -5.519 78.66.88372.26.81272.67.42776.45.10319-4.2 6.020 79.23.93877.88.02575.86.25076.67.074201.2 3.421 77.110.77576.413.14272.25.95979.28.02521-2.8 4.922 77.27.11571.11.77671.64.92679.47.32122-8.4 5.623 85.65.70075.96.60777.14.97777.43.40623-1.5 8.524 78.8.65473.310.54171.53.27476.16.20824-2.8 6.525 69.28.03977.15.82068.26.61379.510.32025-2.4 1.026 73.85.59481.38.53872.6.44674.310.144267.0 1.827 73.7.05564.812.01771.54.52877.5.96327-12.2 1.528 81.38.97079.65.038281.7方差平均值平均值d2.67-2.525 7.420 10.937 5.634 7.140方差S5.5245.112。