数学建模 葡萄酒评价
数学建模之葡萄酒的评价

葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对于本题,我们主要采用SPSS和MATLAB软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
最后,我们通过T检验,在SPSS中可其相应的标准差,通过比较标准差来确定哪个组更可靠。
针对问题二,首先利用主成分分析法对酿酒葡萄的指标进行简化,将问题转化成一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。
一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
二、问题分析2.1针对问题一,我们将它分成两个问题去解决1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在SPSS 中利用T检验去判断。
在这之前,我们对附录1中数据进行处理,利用excel 分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。
数学建模葡萄酒评价优秀论文

葡萄酒的评价模型摘要近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增。
特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平。
如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。
本文通过对感官评价分析,结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据,建立了客观可靠的葡萄酒质量综合评价模型。
针对问题一:本题需要检验两组品酒员的评价结果是否存在显著差异,并选出更可靠的一组。
我们将各种葡萄酒的10个二级指标得分,相加得到每种酒的总分。
在判断知每组品酒员的评价总分均服从正态分布后,用t检验分析两组品酒员对各葡萄酒评价的差异性,由此计算得到两组评价的显著性差异率为13.36%,即总体上两组品酒员的评价不存在显著差异。
但由于两组品酒员的评价仍存在部分差异,我们比较两组品酒员对55种葡萄酒评价的方差,发现第二组评分的方差普遍小于第一组,所以第二组的评价结果更可信。
针对问题二:为了对酿酒葡萄进行分级,我们将葡萄的理化指标作为媒介。
先根据国际指标制定适用于本题评分的分级标准,将葡萄酒进行分级,再根据理化指标经标准化之后的数值,利用欧氏距离对酿酒的55种酿酒葡萄进行Q型聚类分析。
聚类得到红白葡萄各六个分类后,再把各类酿酒葡萄对应至相应葡萄酒的等级,将酿酒红葡萄和酿酒白葡萄各分为五级。
针对问题三:由于各种酿酒葡萄的理化指标种类复杂,我们用主成分分析的方法,从酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分。
考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,我们建立多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。
关键词:显著性检验;聚类分析;主成分分析;多元回归。
一、问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
数学建模毕业论文--葡萄酒的评价

数学建模毕业论文--葡萄酒的评价
葡萄酒的评价是一项复杂的任务,涉及多个因素,包括葡萄品种、酿造过程、年份、产地和存储条件等。
在数学建模中,我们可以利用统计分析和机器学习算法来对葡萄酒进行评价,以预测其质量和特征。
首先,我们可以采集一定数量的葡萄酒样本,并测量其相关属性,如酒精含量、酸度、pH值、残留糖分、挥发性酸、柠檬
酸等。
利用统计分析方法,我们可以探索这些属性与葡萄酒质量之间的关系,建立相应的数学模型。
例如,可以使用线性回归分析来确定具体属性与葡萄酒得分之间的相关性。
另一方面,机器学习算法可以帮助我们构建更复杂的评价模型。
可以使用聚类算法将葡萄酒样本分成不同的类别,以发现具有相似特征的葡萄酒群体。
此外,可以使用分类算法或回归算法来预测葡萄酒的质量评分。
这些算法可以利用已知的葡萄酒样本数据进行训练,并在新样本上进行预测。
除了属性数据,我们还可以考虑其他因素对葡萄酒评价的影响。
例如,可以考虑葡萄酒的价格、评分和消费者评价等因素,以构建更综合的评价模型。
可以使用模糊数学方法来处理这些不确定性和主观性因素,以得出更准确的评价结果。
最后,为了验证模型的准确性和稳定性,可以使用交叉验证或留一验证的方法进行模型评估。
这些方法可以帮助我们评估模型的泛化能力,并进行必要的调整和改进。
数学建模可以帮助我们对葡萄酒进行评价,为葡萄酒生产商、消费者和酒评人提供有关葡萄酒质量和特征的有价值信息。
葡萄酒的评价 (数学建模提纲)

威尔科克森符号秩检验:定义:威尔科克森符号秩检验是由威尔科克森(F·Wilcoxon)于1945年提出的。
该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。
Wilcoxon符号秩检验的步骤:正负符号检验和威尔科克森符号秩检验,都可看作是就成对观察值而进行的参数方式的T检验的代用品,非参数检验具有无需对总体分布作假定的优点,而就成对观察值作的参数方式的T检验,必须假定有关的差别总体服从正态分布。
该方法具体步骤如下:(1)对i=1,...,n,计算∣X i-M0∣,它们代表这些样本点到M0的距离。
(2)把上面的n个绝对值排序,并找出它们的n个秩,如果它们有相同的样本点,每个点取平均秩(如1,4,4,5的秩为1,2.5,2.5,4)。
(3)令W+等于X i-M0>0的∣X i-M0∣的秩的和,而W-等于X i-M0<0的∣X i-M0∣的秩的和。
(4)对双边检验H0:M=M0<=>H1:M≠M0,在零假设下,W+和W-应差不多。
因而,当其中之一很小时,应怀疑零假设。
在此,取检验统计量W=min(W+,W-(5)根据得到的W值,利用统计软件或查Wilcoxon符号秩检验的分布表以得到在零假设下的p值。
如果n很大要用正态近似:得到一个与W有关的正态随机变量Z的值,再用软件或查正态分布表得到p值。
(6)如果p值较小(比如小于或等于给定的显著性水平,譬如0.05)则可以拒绝零假设。
如果p值较大则没有充分的证据来拒绝零假设,但不意味着接受零假设。
[1]威尔科克森符号秩检验的应用举例下面是分别用高锰酸钾法和EDTA法对某生长期蛋鸡配合料钙含量进行的7次测定结果(湖北省饲料质量监督检验站2002年常规检测样品),比较两种方法测定结果差异是否显著。
首先按大小顺序对两对观测值之差di进行等级排序,并加上正负号,分别计算正负等级之和:T+=21,T-=-7。
葡萄酒评价数学建模matlab

葡萄酒评价数学建模matlab【原创实用版】目录一、引言二、葡萄酒评价的数学模型介绍三、数学建模在葡萄酒评价中的应用案例四、MATLAB 在葡萄酒评价数学模型中的应用五、结论正文一、引言随着人们生活水平的提高,对葡萄酒的需求也日益增加。
葡萄酒的品质不仅取决于酿酒葡萄的品种、产地、气候等条件,还与酿酒工艺紧密相关。
为了对葡萄酒的质量进行客观评价,数学建模方法被广泛应用于葡萄酒评价领域。
本文将介绍葡萄酒评价的数学模型,并探讨如何利用 MATLAB 进行葡萄酒评价数学模型的实现。
二、葡萄酒评价的数学模型介绍葡萄酒评价的数学模型主要基于葡萄酒的理化指标,如花色苷、总酚、单宁等,以及葡萄酒的外观、香气和口感等感官评价指标。
通过建立数学模型,可以客观地评价葡萄酒的质量,并为酿酒师提供参考意见。
常用的数学模型包括多元线性回归模型、逐步回归模型、主成分分析模型等。
三、数学建模在葡萄酒评价中的应用案例数学建模在葡萄酒评价中的应用案例有很多,其中之一是利用逐步回归分析找出对葡萄酒理化指标影响显著的因素,得出酿酒葡萄与葡萄酒理化指标之间的函数关系。
另一个案例是基于多目标优化模型研究酿酒葡萄的分级方法,同时考虑酿酒葡萄和葡萄酒的理化指标,建立以误差平方和最小为目标的多目标优化模型。
四、MATLAB 在葡萄酒评价数学模型中的应用MATLAB 是一种强大的数学计算软件,可以方便地实现葡萄酒评价数学模型。
例如,通过 MATLAB 可以轻松地完成多元线性回归模型的参数估计、逐步回归模型的变量筛选等任务。
此外,MATLAB 还可以绘制葡萄酒理化指标与感官评价指标的关系图,便于酿酒师直观地了解葡萄酒的质量状况。
五、结论数学建模方法在葡萄酒评价领域具有广泛的应用前景,可以提高葡萄酒评价的客观性和准确性。
MATLAB 作为一种有效的数学计算工具,在葡萄酒评价数学模型的实现中发挥着重要作用。
数学建模葡萄酒评价问题

数学建模葡萄酒评价问题葡萄酒作为一种重要的饮品,在许多场合都扮演着重要的角色。
但在选择和鉴赏葡萄酒时,往往需要一定的专业知识和经验。
如何评价葡萄酒的品质,成为一个重要的问题。
通过数学建模,可以对葡萄酒评价问题进行深入研究。
一、葡萄酒评价的一些基本概念在对葡萄酒进行评价时,我们需要了解一些基本概念。
其中有几个核心概念,包括:1.口感:葡萄酒口感主要包括甜度、酸度、单宁和酒精度四个方面。
其中,甜度和酸度是相反的两个方面,而单宁和酒精度则是影响葡萄酒深度和复杂度的关键因素。
2.香气:葡萄酒香气是葡萄酒评价中非常重要的部分,其中包括了果香、花香、木香等多种因素。
3.口感平衡度:葡萄酒口感的平衡度是评价葡萄酒品质的重要指标,它包括了口感中甜度、酸度、单宁和酒精度四个因素之间的和谐程度。
二、对葡萄酒品质的数学建模通过对葡萄酒的评价指标进行分析和量化,我们就可以建立一种数学模型,来对葡萄酒的品质进行评价。
其中的一些关键步骤包括:1.建立评价指标的量化模型:通过对葡萄酒评价指标的分析,我们可以建立相应的量化模型。
例如,将单宁的口感评价量化为0-10分,将香气的评价量化为0-5分等等。
2.确定评分标准:针对不同类型的葡萄酒,我们可以设定相应的评分标准。
例如,某种类型的葡萄酒,其平衡度得分要高于80分,香气得分要高于90分等等。
3.对葡萄酒样品进行测量和评分:在具体的评分过程中,我们需要对葡萄酒样品进行测量和评分,以得出相应的评价分数。
三、葡萄酒品质的数据分析通过对大量葡萄酒样品的评价数据进行收集和整理,我们可以进行相应的数据分析,以得到一些关于葡萄酒品质的重要结论。
例如:1.不同类型的葡萄酒在各项评价指标上存在差异。
例如,红葡萄酒相对白葡萄酒来说,具有更重的单宁和更鲜明的果香和木香。
2.葡萄酒品质在不同地区和不同产年之间也存在差异。
例如,同一品种的葡萄,在不同地区以及不同产年中,会产生明显的差异。
3.葡萄酒品质和价格之间的关系并不一定单调。
葡萄酒评价数学建模matlab
葡萄酒评价数学建模matlab摘要:I.引言- 介绍葡萄酒评价数学建模matlab 的意义和目的- 说明本文的主要内容和结构II.葡萄酒评价数学建模概述- 数学建模的定义和作用- 葡萄酒评价数学建模的基本流程和方法III.matlab 在葡萄酒评价数学建模中的应用- matlab 的介绍和特点- matlab 在葡萄酒评价数学建模中的具体应用和实现IV.葡萄酒评价数学建模matlab 实例分析- 一个具体的葡萄酒评价数学建模问题- 使用matlab 进行求解和分析的过程V.结论- 总结葡萄酒评价数学建模matlab 的重要性和优势- 展望葡萄酒评价数学建模matlab 的发展前景正文:I.引言葡萄酒评价是葡萄酒行业中的一个重要环节,对于葡萄酒的品质、口感、价格等方面具有重要的影响。
数学建模是一种基于数学和统计学的方法,可以对葡萄酒评价问题进行量化和分析,为葡萄酒的评价和分级提供科学依据。
matlab 是一种功能强大的数学软件,可以用于求解各种数学问题,包括葡萄酒评价数学建模问题。
本文将介绍葡萄酒评价数学建模matlab 的意义和作用,以及matlab 在葡萄酒评价数学建模中的应用和实现。
II.葡萄酒评价数学建模概述葡萄酒评价数学建模是一种利用数学和统计学方法对葡萄酒进行评价和分析的过程。
其基本流程包括问题定义、模型建立、模型求解和结果分析等步骤。
问题定义阶段是明确葡萄酒评价的具体问题和目标,例如葡萄酒的品质、口感、价格等。
模型建立阶段是根据问题定义阶段的结果,建立数学模型,例如利用回归分析、聚类分析等方法建立葡萄酒评价模型。
模型求解阶段是将建立的数学模型进行求解,得到评价结果。
结果分析阶段是对求解结果进行分析,例如利用图表等方式对葡萄酒的品质、口感、价格等进行可视化分析。
III.matlab 在葡萄酒评价数学建模中的应用matlab 是一种功能强大的数学软件,可以用于求解各种数学问题,包括葡萄酒评价数学建模问题。
数学建模中葡萄酒评价模型(秩和检验 主成份分析 置信区间法 多元线性回归 相关性分析)
三、模型假设
(1)两组评酒员在评论时相互之间不会受到令一组的影响; (2)所有同种葡萄酒的酿造工艺完全相同; (3)所给数据的测量都不受外部因素的影响; (4)评酒员评分时的标准都是相同的。
四、符号说明
总体观察值的秩和; T: n1 n 2 : 分别代表相同种类酒的总数;
x j , j : 评酒员对同一酒样的均值和标准差;
关键字
秩和检验
主成份分析
置信区间法
多元线性回归
相关性分析
1
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 需要建立数学模 型讨论下列问题: 1. 分析两组评酒员的评价结果有无显著性差异,判断哪一组结果更可信; 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并考虑能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量。
初始因子载荷矩阵主成份f1主成份f2主成份f3主成份f4主成份f5主成份f6主成份f7主成份f8氨基酸01292560214164014102028805801338702013502076180007092蛋白质02321820107030239632014029601250710001717016527011575vc含量004797011823014383700136904039300620910051160021634花色苷03212390023950004422017672005180801208180145090055696酒石酸012914301397190125499021730102400410065790226743037352苹果酸01332860192018003772038379005168101672630259270092096柠檬酸01005280186970081038022581025851700070190257026031042多酚氧化酶活力0124439000935012086034749016068400974301973220087214褐变质02244320010385003935304234002255004783005383007744dpph0288052012355016211101204670039601395710088888016599503284840062020013499014050700184400957930123930150099单宁02927440071620054610023201389022979600929050025719葡萄总黄027690901113400399790173841000244902146890059040144198白藜芦醇000882022360203519690023328016924012243201102630217942黄酮醇02056990036880024135004469011936022019046170602658100826070259406027065018373301018520062290064330226268可溶性固0085623021233603376201236990117750054640035650244496ph00986780056630186289039440101
数学建模经典案例分析以葡萄酒质量评价为例
数学建模经典案例分析以葡萄酒质量评价为例一、本文概述本文旨在通过深入剖析数学建模在葡萄酒质量评价中的应用,展示数学建模的经典案例。
我们将首先简要介绍数学建模的基本概念及其在各个领域的应用,然后聚焦葡萄酒质量评价这一具体问题,阐述如何通过数学建模对其进行科学、客观的分析。
文章将详细分析数据的收集与处理、模型的建立与求解、模型的验证与优化等关键环节,并探讨不同数学模型在葡萄酒质量评价中的优缺点。
我们将总结数学建模在葡萄酒质量评价中的实际应用效果,展望其在未来葡萄酒产业中的发展前景。
通过阅读本文,读者将能够了解数学建模在葡萄酒质量评价中的重要作用,掌握相关数学建模方法和技术,为类似问题的解决提供有益的参考和借鉴。
本文也将促进数学建模在葡萄酒产业中的应用与发展,推动葡萄酒产业的科技进步和产业升级。
二、数学建模基础数学建模是一种将实际问题抽象化、量化的过程,通过数学工具和方法来求解问题的近似解。
在葡萄酒质量评价这一案例中,数学建模提供了从复杂的实际生产环境中提取关键信息,并建立预测模型的可能。
这需要我们具备一定的数学基础,如统计学、线性代数、微积分等,同时也需要理解并掌握数据处理的基本技术,如数据清洗、特征提取和选择等。
在葡萄酒质量评价问题中,我们首先需要收集大量的葡萄酒样本数据,这些数据可能包括葡萄品种、产地、气候、土壤、酿造工艺、化学成分等多个方面的信息。
然后,我们需要对这些数据进行预处理,如去除缺失值、异常值,进行数据标准化等,以提高模型的稳定性和准确性。
接下来,我们可以选择适合的模型进行训练。
在这个案例中,我们可以选择线性回归、决策树、随机森林、神经网络等模型进行尝试。
我们需要根据数据的特性和问题的需求,选择最合适的模型。
同时,我们还需要进行模型的训练和验证,通过调整模型的参数,提高模型的预测能力。
我们需要对模型进行评估和优化。
这可以通过交叉验证、ROC曲线、AUC值等评估指标来进行。
如果模型的预测能力不足,我们需要对模型进行优化,如改进模型的结构、增加更多的特征等。
数学建模 葡萄酒评价模型
A题葡萄酒的评价摘要随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。
针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。
针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。
但主成分法去掉了一部分数据,我们有用最小二乘法进行。
针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词:SPSS T 检验 聚类分析法 原理 偏相关系数 EXCEL 判别分析
相关系数
回归分析原理
相关分析
一、问题重述
葡萄酒的质量一般通过聘请一批有资质的评酒员对葡萄酒进行品尝后, 对其 分类指标打分及求和获得总分而确定。葡萄酒的质量受酿酒葡萄的直接影响,且 葡萄酒和酿酒葡萄的质量可在一定程度上由其检测的理化指标反映。 请参照某年份一些葡萄酒的评价结果(附件 1)和这些葡萄酒和其酿酒葡萄 的成分数据(附件 2、附件 3),建立数学模型分析研究下列问题: 1.分析附件 1 中两组评酒员的评价结果有无显著性差异,并判断哪一组结 果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
三、基本假设
1、假设制作葡萄酒的工艺是一样且稳定的; 2、假设两组评酒员是随机分配的; 3、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的; 4、假设酿造葡萄酒的环境是相同的; 5、假设酿酒葡萄与葡萄酒中的芳香物质主要成分是:低醇、酯类、苯等,其余 成份忽略; 6、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒; 7、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可 酿制白葡萄酒; 8、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质 量; 9、假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄 不一定能酿制成质量高的葡萄酒; 10、假设本文所引用的数据、资料均真实可靠。
理化指标理想,葡萄酒的质量不一定高。因此我们在 SPSS 中,运用相关分析, 分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、 葡萄的理化指标与葡萄 酒质量的相关系数。 然后通过对相关系数的比较,分析葡萄和葡萄酒的理化指标 对葡萄酒质量的影响。从而论证葡萄和葡萄酒的理化指标能否评价葡萄就的质 量。
(1) 在 SPSS 中对两组红葡萄酒质量的平均值运行配对样本的 T 检验,得到 如下图一所示:
图一 对表中的分析结论表明:两个样本平均数分别为 73.056、70.515 ,相关系 数为 0.700 ,T 检验的临界值为 2.458 。我们可以得到检验结论为:拒绝原假设
H
0
,即可认为两组评酒员对红葡萄酒的评价结果有显著性差异。
x y
( xi
i 1
n
y ) 2 [ ( xi
i
n
n ( n 1)
i 1
y )]
i
2
/n
(式中,n-1 为自由度,n 为数据对数) 2.建立检验假设:
H
0
: d 0, H 1 : d 0 (其中 为均值差异)其假设的意义为,当差
d
异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试 验方法在发生作用或有效。 1.3 模型求解:
r
xz , z1z2
r r
xy
——是变量 x , ,
y
之间的简单相关系数(零阶相关系数)
xz
r
yz
——分别是变量 x , z 之间和 y , z 之间的简单相关系数
r ——特定的偏相关系数 n ——观测值个数
k
——控制变量个数 -2——自由度
n -k
五、模型建立与求解
5.1 两组评酒员的评价结果有无显著性差异,选择哪一组更可靠 5.1.1 两组评酒员的评价结果有无显著性差异——配对样本的 T 检验 1.1 配对样本 T 检验的概念 若实验设计是将条件、 性质相同或相近的两个供试单元配成一对,并设有多 个配对, 然后对每一个配对的两个供试单元分别随机的基于不同处理,这样的实 验叫做配对实验。它的特点是配成对子的两个试验单元的非处理条件尽量一致, 不同对子的试验单元之间的非处理条件允许有差异, 每一个对子就是试验处理的 一个重复。 SPSS 配对样本的 T 检验主要解决来自配对样本数据的两个总体均值有否显 著差异的问题。 所谓配对样本,通常是指对同一观察对象在使用某种新方法的有 效性。配对样本的 T 检验对数据的要求: (1)是抽取样本数据的两个总体必须服从正态分布。 (2)两个样本的样本容量相同。 1.2 建立模型: 1.基本数学原理: 成对样本的均值比较 t 检验,假设这两个样本之间的均值差异为零,用于 检验的统计量为: t=
a a a
11 21
a a a
12 22
... ...
... ...
a a
1p 2p
n1
n2
a
k 1 p
(其中 a ij 表示样品 i 的第 j 个指标)
np
(2)写出样品间的距离矩阵 d( a i , a j )=
D
2
1
(欧氏距离为例)
(
a ik a jk )
二、问题分析
2.1 针对问题一,我们将它分成两个问题去解决 1、 针对问题一中的两组评酒员的评价结果有无显著性差异,我们在 SPSS 中利用 T 检验去判断。在这之前,我们对附录 1 中数据进行处理,利用 excel 分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。 2、针对问题一中选择哪组结果更加可靠,我们利用 SPSS 求出两组葡萄 酒评价结果的平均值的标准差, 通过对比两组相应葡萄酒评价结果的平均值的标 准差,从而确定出第几组的结果更可靠。 2.2 针对问题二 首先我们将附录 2 和附录 3 中的一些数据进行了处理(例如:求平均值) , 然后通过聚类分析的原理,在 SPSS 实现对酿酒葡萄的分类。 2.3 针对问题三,我们分两个问题去解决 1、 针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,我们先计算 酿酒葡萄和葡萄酒理化指标之间的相关系数,通过 SPSS 实现。由于酿酒葡萄的 理化指标远远多于葡萄酒的理化指标,通过整理数据,在 excel 中得到一个葡萄 酒的理化指标与多个酿酒葡萄的理化指标之间的相关系数的数据。 规定两者的相 关系数大于 0.6(酿酒红葡萄与红葡萄酒的理化指标)时,认为两者的相关性显 著。从而筛选出与葡萄酒理化指标相关性显著的酿酒葡萄的理化指标。 2、 针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,最后我们利 用上面整理好的数据,采用回归分析原理,在 SPSS 中得到酿酒葡萄与葡萄酒的 理化指标之间的联系。 2.4 针对问题四 首先我们知道,葡萄酒的理化指标若理想,葡萄酒的质量就较高;但葡萄的
四、符号说明
x x
1i
——第一组每种红葡萄酒的平均得分 ——第二组每种红葡萄酒的平均得分 ——第一组每种白葡萄酒的平均得分 ——第二组每种白葡萄酒的平均得分
1
y
1i
2i
y
2i
x - y ——两组红葡萄酒平均数之差
1
x -y
2
2
——两组白葡萄酒平均数之差
r
xy , z
——是控制了 z 条件下, x , y 之间的偏相关系数 ——是控制了 z1 , z 2 条件下, x , y 之间的偏相关系数
a =( a
i
i1
, , aip )’
a
j
=( a j1 , , a jp )’
(3)将每一个样品看作一个类,即为: G1 , G 2 ,…… G n , 观察比较 D (G i , G j ) 哪个最小,将 G i , G j 聚为一类,计算新类与其余各类 之间的距离,得到新距离矩阵 D 2 。 (4)依此类推,最终将样品 G1 , G 2 ,…… G n 分出类来。 3.模型求解: (1)对酿酒红葡萄进行分类: 在 SPSS 中运行聚类分析的程序,得到如下图表: Cluster Membership 4 Clust Case ers 1:葡萄样品1 1 2:葡萄样品2 1 3:葡萄样品3 2 4:葡萄样品4 3 5:葡萄样品5 3 6:葡萄样品6 3 7:葡萄样品7 3 8:葡萄样品8 1 9:葡萄样品9 1 10:葡萄样品10 3 11:葡萄样品11 4 12:葡萄样品12 3 13:葡萄样品13 3 14:葡萄样品14 3 15:葡萄样品15 3
16:葡萄样品16 17:葡萄样品17 18:葡萄样品18 19:葡萄样品19 20:葡萄样品20 21:葡萄样品21 22:葡萄样品22 23:葡萄样品23 24:葡萄样品24 25:葡萄样品25 26:葡萄样品26 27:葡萄样品27
3 3 3 3 3 2 3 1 3 3 3 3
聚类分析图示(一)
聚类分析图示(二) 根据图表内容,将酿酒红葡萄分为 4 类:
(2)对酿酒白葡萄进行分类: 同 3(1) ,在 SPSS 中运行程序,得到如下图表(详见附录一) : Cluster Membership 4 Clus Case ters 1:葡萄样品1 1
2:葡萄样品2 3:葡萄样品3 4:葡萄样品4 5:葡萄样品5 6:葡萄样品6 7:葡萄样品7 8:葡萄样品8 9:葡萄样品9 10:葡萄样品10 11:葡萄样品11 12:葡萄样品12 13:葡萄样品13 14:葡萄样品14 15:葡萄样品15 16:葡萄样品16 17:葡萄样品17 18:葡萄样品18 19:葡萄样品19 20:葡萄样品20 21:葡萄样品21 22:葡萄样品22 23:葡萄样品23 24:葡萄样品24 25:葡萄样品25 26:葡萄样品26 27:葡萄样品27 28:葡萄样品28
(2)用同样的方法对两组白葡萄酒质量的平均值运行配对样本的 T 检验, 如图二所示, 我们得到的检验结果是:两组评酒员对白葡萄酒的评价结果有显著 性差异。
图二 综合(1) 、 (2)我们得到的结果是:两组评酒员的评价结果有显著性差异。 5.1.2 结果可靠性的选则 通过对 5.1.1 的解答,我们可以清楚的看到第一组、第二组红葡萄酒质量 的平均值的标准差分别是:7.3426、3.9780。第一组、第二组白葡萄酒质量的平 均值的标准差分别是:5.201、3.1709。 通过比较我们得到的结果是:第二组评酒员的评价结果更可信。 5.2 根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级——聚类分 析-分层聚类-凝聚法 1.聚类分析的概念 聚类分析是根据事物本身的特性研究个体分类的方法。在这里我们采用分 层聚类中的凝聚法, 即聚类开始把参与聚类的每个个体视为一类,根据两类之间 的距离或相似性逐步合并,直到合并为一个大类为止。 2.建立模型: (1)将所要分析的数据转变为矩阵: