基于数据挖掘技术的葡萄酒评价体系研究
关于葡萄酒评价的数学建模论文

葡萄酒的评价摘要本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。
关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。
首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。
然后将第一组10位()评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。
关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。
关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。
关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。
然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。
最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。
关键词:葡萄酒质量的评价EXCEL MATLAB、主成分分析相关系数T-检验1.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
基于机器学习算法的红葡萄酒质量评价模型研究

基于机器学习算法的红葡萄酒质量评价模型研究红葡萄酒是指采用红葡萄酿制而成的葡萄酒,其酿制过程中需要进行多个环节的控制,如选材、发酵、陈酿等,而其中一个非常重要的环节就是质量评价。
酒类行业一直以来都在探索如何通过科技手段来提高红葡萄酒的质量,机器学习算法作为其中的一个重要工具也开始受到了越来越多的关注。
本文将从机器学习算法的角度,探讨基于机器学习算法的红葡萄酒质量评价模型的研究。
一、机器学习算法简介机器学习是人工智能的一个分支,它的主要任务是通过训练数据集让机器能够自动学习并表现出某种行为或任务的能力。
机器学习算法可以分为监督学习、无监督学习、半监督学习、强化学习等几种,其中监督学习是应用最广泛的算法之一。
监督学习主要是基于已有的有标签数据集进行训练,让机器能够自动学习并对未知数据进行分类或预测等任务。
二、基于机器学习算法的红葡萄酒质量评价模型研究红葡萄酒质量评价是根据各种目标和指标来综合评价葡萄酒的质量,包括外观、香气、口感等各个方面。
传统的评价方法主要是依靠人工鉴定,但是这种方法有很多缺点,例如标准不统一、可靠性差、评价效率低等。
随着科技的发展,基于机器学习算法的红葡萄酒质量评价模型开始逐渐被应用于酒类行业中。
在基于机器学习算法的红葡萄酒质量评价模型中,主要是通过先给出一些红葡萄酒的质量数据集作为训练集,利用监督学习算法进行训练,然后通过训练出来的模型对新的红葡萄酒进行评价。
在数据集的选取上,一般需要考虑到数据的多样性、数量和质量等因素。
如何有效地选取数据集是机器学习中非常重要的一个环节。
在选择机器学习算法的时候,要根据任务的具体需求来进行选择。
例如,如果需要对红葡萄酒的外观进行评价,可以采用基于图像处理的机器学习算法,如卷积神经网络(CNN)等。
如果需要对红葡萄酒的香气进行评价,可以采用基于自然语言处理(NLP)的机器学习算法,如深度学习等。
三、机器学习算法在红葡萄酒质量评价中的应用案例随着机器学习算法的不断发展,它在红葡萄酒质量评价中的应用也越来越广泛。
数学建模葡萄酒评价优秀论文

葡萄酒的评价模型摘要近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增。
特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平。
如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。
本文通过对感官评价分析,结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据,建立了客观可靠的葡萄酒质量综合评价模型。
针对问题一:本题需要检验两组品酒员的评价结果是否存在显著差异,并选出更可靠的一组。
我们将各种葡萄酒的10个二级指标得分,相加得到每种酒的总分。
在判断知每组品酒员的评价总分均服从正态分布后,用t检验分析两组品酒员对各葡萄酒评价的差异性,由此计算得到两组评价的显著性差异率为13.36%,即总体上两组品酒员的评价不存在显著差异。
但由于两组品酒员的评价仍存在部分差异,我们比较两组品酒员对55种葡萄酒评价的方差,发现第二组评分的方差普遍小于第一组,所以第二组的评价结果更可信。
针对问题二:为了对酿酒葡萄进行分级,我们将葡萄的理化指标作为媒介。
先根据国际指标制定适用于本题评分的分级标准,将葡萄酒进行分级,再根据理化指标经标准化之后的数值,利用欧氏距离对酿酒的55种酿酒葡萄进行Q型聚类分析。
聚类得到红白葡萄各六个分类后,再把各类酿酒葡萄对应至相应葡萄酒的等级,将酿酒红葡萄和酿酒白葡萄各分为五级。
针对问题三:由于各种酿酒葡萄的理化指标种类复杂,我们用主成分分析的方法,从酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分。
考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,我们建立多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。
关键词:显著性检验;聚类分析;主成分分析;多元回归。
一、问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
数据挖掘技术在提高产品质量中的应用——基于白葡萄酒质量的研究

费 者 的 口味进 行 细 分 , 高 产 品 的 竞 争力 。 提 竞争力。 四 、 论 与 展 望 结 对 葡 萄酒 进 行 分 类 , 等 级 可 以用 来 改 善 酿 酒 工 艺 、 高 葡 分 提 近 年 来 . 着 人 们 生 活 水 平 的提 高 , 费 者 对 葡 萄 酒 的需 求 随 消 萄酒 品质 。
21 0 0年 1 1月 总 3 8期 6
数 据 挖 掘 技 术 在 提 高 产 品 质量 中 的 应 用
江 山
( 西南 财 经大 学 经济 信 息 工程 学 院
四川 成 都 I
6 13 ) 1 1 0
夯奚喜 亍 一 一 一 一 一支 标 ’ 一 一一
:一 一 一 一一一 A
逐 渐 扩 大 , 萄 酒 行 业 蓬 勃 发 展 , 是 目前 葡 萄 酒 的 质 量 区 分 主 葡 但 二 、 据 准备 数 葡萄 酒 的 数据 来 源 于 ht:a hv. s ce u 得 到 影 响 葡 萄 要 靠 的 品 酒专 家 的 味觉 鉴 别 能 力 。由 于人 的 局 限 性 以及 专 业 品 酒 t / r i i . id , p/c ecu . 导致 葡 萄 酒 质 量 区分 困难 。此 项 目通 过 数 据 酒 质 量 的 因 素 和等 级 的 十一 种 化 学 成 分 的数 据 。通 过 E EL进 师 的 昂贵 人 力 成 本 , XC 挖 掘 技 术 . 葡 萄酒 化 学 成分 数据 建模 预测 , 到 8 %的正 确 率 , 对 得 5 行处 理 , 分类 后 得 到可 用 数 据 。 此 研 究 数 据 是 关 于 葡 萄酒 质 量 相 关 的 特征 和化 学 物 含量 。总体 这 样 我 们 就 可 以 很 容 易 判 别 新 品 种 葡 萄 酒 属 于 哪 一 种类 , 结 果
红酒评级的科技与数据分析

红酒评级的科技与数据分析红酒作为一种具有浓厚文化底蕴和高端品质的酒类,一直以来都备受关注。
而对于红酒爱好者来说,了解不同品牌和产区的红酒评级成为了一种必备的技能。
而现代科技和数据分析的发展,为红酒评级带来了更为准确和便捷的方法。
在本文中,我们将探讨红酒评级的科技与数据分析的重要性和应用。
一、红酒评级科技的发展随着科技的进步和互联网的普及,红酒评级也逐渐与科技相结合,形成了一种新型的评级方式。
通过使用先进的科技手段,如人工智能、大数据分析和区块链技术等,收集和处理大量红酒相关的信息和数据,为红酒爱好者提供全面、准确的评级信息。
二、数据分析在红酒评级中的应用1. 评级指标的建立:数据分析帮助红酒评级建立起一套完整的评级指标体系。
通过分析红酒的各项数据,比如葡萄种植条件、酿造方法、口感特点等,确定不同参数对红酒品质的重要性,并建立起相应的评级体系。
2. 品鉴过程的辅助:传统的品鉴过程需要依赖专业品鉴师的经验和感觉,但这种主观性往往会带来评级的不准确性。
而借助数据分析技术,可以将一系列客观的指标纳入考量,例如颜色、香气、味道等,从而提高红酒评级的客观性和准确性。
3. 用户个性化推荐:通过分析红酒评级数据和用户的喜好,可以为用户提供个性化的红酒推荐。
根据用户的历史品鉴记录和对不同品牌、产区的评分,系统可以通过数据分析准确判断用户的口味偏好,进而为其推荐最符合其口味的红酒产品。
三、红酒评级科技的优势1. 提高评级准确性:传统的评级方式常常受到品鉴师主观意见的干扰,评级结果可能存在一定的主观性和不稳定性。
而采用科技手段进行红酒评级,可以从更多的客观数据中得出评级结果,避免主观因素的影响,提高评级的准确性和可靠性。
2. 提升评级效率:传统的红酒评级需要品鉴师花费大量时间和精力,而采用科技手段进行评级,可以减少人力成本和时间消耗,提升评级效率。
通过大数据分析和自动化技术,可以实现对大量红酒进行快速评级,为红酒爱好者提供更加及时准确的评级信息。
基于Hadoop的数据挖掘算法在葡萄酒信息数据分析系统中的应用

Applicaiton of data mining algorithm based on Hadoop in wine information data analysis system
HAOYanni , TIAN Weili
( School of Information Engineering,Ningxia University,Yinchuan Ningxia 750021 , China)
Journal of Computer Applications 计算机应用,2017,37( S1) : 72 - 74,79 文章编号: 1001-9081 ( 2017 ) S1-0072-03
ISSN 1001-97-06-15 http: / / www. joca. cn
*
Abstract: Aiming at the problems of inaccurate wine information data analysis, narrow sales channel, slow update of sales information and the low sales volume at Ningxia Helanshan foothill winery, this paper proposed a data mining algorithm based on Hadoop distributed framework for the wine winery at Ningxia Helanshan. A very large amount of wine information data was collected and analyzed, and according to the analysis results, the wine suitable for the user s taste was recommended. Firstly, this system based on the Ningxia Helanshan foothill winery estate as the experiment base, carried on the independent development of wine information data analysis system, and used Kmeans algorithm as the clustering algorithm and C4. 5 algorithm as the classification algorithm for data mining. The distributed clustering and classification algorithms based on MapReduce were implemented for Kmeans algorithm and C4. 5 algorithm, and the corresponding shortcomings were improved. Experiments show that the data mining algorithm based on Hadoop framework can improve the stability and accuracy of the algorithm, and it can deal with the massive data of wine information data analysis system well. Key words: Hadoop; data mining algorithm; C4. 5 algorithm; Kmeans algorithm; wine; data analysis 宁夏将葡萄酒作为其优势特色产业 , 在贺兰山东麓计划 建设百家葡萄酒庄。宁夏的葡萄酒文化目前在快速盛行 , 人 们对葡萄酒的质量也提出了很高的要求 , 政府也越来越重视 葡萄酒的数据信息, 对顾客对网站的浏览记录进行分析 , 可发 掘顾客对不同品种葡萄酒的喜好 , 帮助生产厂商更好地对其 生产的葡萄酒产品进行更好的销售 。 Hadoop[1] 是为了互联网时代的海量数据存储与处理而 设计开发的。目前 Hadoop 的用户已经从传统的互联网公司 扩展到科学计算、 生物、 医疗、 农业等行业, 并得到越来越广泛 的应用。将 Hadoop 平台与数据挖据技术结合 , 可为数据挖掘 算法注入新的血液, 并能有效地解决现有的数据挖掘算法在 解决海量数据挖据时的不足 。 HDFS) [3] 和 MapReduce[4] 分布式计算框架为核心 , 为用户提 供了底层 细 节 透 明 的 分 布 式 基 础 设 施 。 其 中 Hadoop 中 的 HDFS 是一种管理网络存储的分布式文件系统 , 作为 Hadoop
基于数据挖掘技术的红酒质量评价与等级划分研究

基于数据挖掘技术的红酒质量评价与等级划分研究红酒是一种受到广泛欢迎的酒类,在世界各地都有着众多的酒友和爱好者。
而红酒的品质和等级则成为了关注的重点之一,因为好的红酒能够为人们带来更美好的品尝体验。
然而,传统的红酒评价方式多为人工,时间和成本较高。
近年来,基于数据挖掘技术的红酒质量评价与等级划分研究越来越受到人们的关注。
一、数据挖掘技术与红酒质量评价数据挖掘技术是一种从大量数据中自动发现规律的方法,可以帮助人们快速准确地对红酒进行品质评价。
数据挖掘技术不仅包括了基础的数据统计和分析方法,还包括了人工智能、机器学习和深度学习等高级算法,可以更加准确地对红酒进行评价和分类。
在红酒质量评价中,数据挖掘技术主要通过构建模型实现。
模型的构建包括了特征提取、特征选择、模型训练和模型应用等多个过程。
其中,特征提取是数据挖掘技术的关键。
红酒的特征包括了多种成分和属性,如酒精度、酸度、甜度、色泽、气味等。
在特征提取中,需要选择合适的特征来对红酒进行描述和评价,同时,还需要对特征进行标准化和归一化等预处理操作。
二、基于数据挖掘技术的红酒品质等级划分方法基于数据挖掘技术的红酒品质等级划分方法主要包括了基于聚类的划分和基于分类的划分两种方法。
基于聚类的划分方法是将相似的红酒样本划分在一类中,不同的红酒样本则归为不同的类别。
在聚类过程中,需要选择合适的距离计算方法、聚类算法和聚类评价指标等。
在红酒品质等级划分中,可以选择基于距离的层次聚类或基于密度的DBSCAN聚类等算法来进行。
同时,也需要根据实际情况选择合适的聚类评价指标,如轮廓系数、DB指数等。
基于分类的划分方法是将红酒样本划分到已知的品质等级类别中。
在分类过程中,需要选择合适的分类算法和分类评价指标等。
在红酒品质等级划分中,可以选择k-NN、SVM、决策树等分类算法来进行。
同时,也需要根据实际情况选择合适的分类评价指标,如准确率、召回率、F1值等。
三、基于数据挖掘技术的红酒品质等级划分案例基于数据挖掘技术的红酒品质等级划分已经有一些实际应用案例。
全国大学生数学建模竞赛A题葡萄酒评价分析

全国大学生数学建模竞赛A题葡萄酒评价分析葡萄酒是一种古老而美妙的饮品,其种类繁多,风味各异。
如何对葡萄酒进行准确的评价和分析成为了葡萄酒爱好者和生产商们共同关注的问题。
在此次全国大学生数学建模竞赛A题中,我们将围绕葡萄酒的评价和分析展开讨论。
1. 引言葡萄酒是一种由葡萄经过发酵而成的酒类饮品。
葡萄酒的风味和品质受到许多因素的影响,如产地、葡萄品种、酿造工艺等。
为了准确评价葡萄酒的质量和特点,我们需要建立相应的评价指标和模型。
2. 数据分析为了进行葡萄酒评价,我们首先需要收集相关的数据。
通过对不同品牌、不同种类的葡萄酒进行采样和测试,我们可以获得葡萄酒的关键指标,如酒精含量、酸度、甜度、单宁含量等。
在数据分析中,我们可以运用统计学方法和数学建模技术,对数据进行整理和处理。
通过计算均值、方差、相关系数等指标,我们可以得到葡萄酒的基本特征和相互之间的关系。
3. 葡萄酒评价指标体系建立基于数据分析的结果,我们可以建立葡萄酒评价指标体系。
这一体系应该包含对葡萄酒各项指标的评价方法和权重。
常见的评价指标包括酒精含量、色泽、香气、口感等。
在指标体系中,我们可以采用层次分析法,通过对各个指标的重要性进行排序和评估。
同时,还可以利用数学模型,将各项指标综合起来,得到最终的评价结果。
4. 葡萄酒评价模型构建在对葡萄酒进行评价时,我们可以利用数学建模方法构建评价模型。
常用的模型包括多元回归模型、灰色关联度模型等。
多元回归模型可以用来分析葡萄酒各项指标之间的关系,进而预测葡萄酒的品质。
灰色关联度模型则可以用来度量葡萄酒各个指标对品质的影响程度。
通过不断地调整模型和参数,我们可以得到更准确的葡萄酒评价结果,并为葡萄酒生产商提供有针对性的改进建议。
5. 葡萄酒评价系统设计为了方便葡萄酒评价和分析的实施,我们可以设计一个葡萄酒评价系统。
该系统可以包括数据输入、数据处理、指标评价、模型计算等功能模块。
数据输入模块用于将葡萄酒相关数据录入系统。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384Published Online November 2015 in Hans. /journal/aam/10.12677/aam.2015.44047The Study on Evaluation System of WineBased on Data MiningSizhe Wang1, Zhigang Wang2*, Yong He21Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan2College of Information Science and Technology, Hainan University, Haikou HainanReceived: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015Copyright © 2015 by authors and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License (CC BY)./licenses/by/4.0/AbstractBased on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out.KeywordsEvaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis,Regression Analysis基于数据挖掘技术的葡萄酒评价体系研究王思哲1,王志刚2*,何勇21中南大学信息科学与工程学院自动化专业1301班,湖南长沙2海南大学信息科学技术学院,海南海口*通讯作者。
王思哲等收稿日期:2015年11月8日;录用日期:2015年11月23日;发布日期:2015年11月30日摘要本文以2012年高教社杯全国大学生数学建模竞赛A题为例,利用数据挖掘技术建立葡萄酒评价体系。
葡萄酒质量一般是通过聘请有资质的品酒员进行品尝评分,由于品酒员主观因素导致对酒样品的评分差异悬殊,我们通过方差分析对品酒员评分进行可信性研究;通过提取酿酒葡萄多个理化指标的公共因子,对因子得分和葡萄酒评分进行聚类,将酿酒葡萄进行分级研究;通过对葡萄酒理化指标和酿酒葡萄理化的数据进行相关性分析,利用逐步回归分析模型建立它们之间的依赖关系;利用葡萄酒芳香物质与葡萄酒评分之间的回归模型,找出决定葡萄酒质量的关键理化指标,最后指出现行葡萄酒评分体系的不足。
关键词葡萄酒评价,数据挖掘技术,方差分析,聚类分析,回归分析1. 引言在当今大数据时代,从数据库的挖掘出隐含的、先前未知的并有潜在价值的信息显得十分重要,多元统计方法是数据挖掘技术的关键要素。
多元统计分析是处理多维同体观测数据的数学方法,是数理统计学近几十年迅速发展的一个分支,计算机技术的发展为多元统计的方法应用提供了便利的计算工具。
多元统计的内容十分丰富,主要包括判别分析、聚类分析、主成分分析、因子分析、回归分析预测方法、方差分析、典型相关分析、时间序列等[1]-[11]。
多元统计方法在工业、农业、医学、气象、环境以及经济管理等诸多领域中有着十分广泛的应用。
本文以2012年高教社杯全国大学生数学建模竞赛A题为例,用多元统计序列方法建立葡萄酒评价体系。
确定葡萄酒质量时一般是通过聘请一批有资质的品酒员进行品评,每个品酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1(见竞赛试题中的附件,本文略,下同)给出了某一年份两组品酒员对两组红葡萄酒和白葡萄酒的评分结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据,包括各种理化指标和芳香物质指标数据。
由于品酒员主观因素导致对酒样品的评分差异,我们分别构造以品酒员和酒样品为组别数据序列进行方差分析,通过比较F统计量值评价两组品酒员是否有显著性差异,对品酒员评分进行可信性研究;通过对酿酒葡萄的多个理化指标进行筛选,提取公共因子,并计算因子得分,然后将这些因子得分和葡萄酒评分进行聚类分析,将酿酒葡萄进行分级研究;通过对葡萄酒理化指标和酿酒葡萄理化指标相关性分析,利用逐步回归模型建立它们之间的线性关系;通过葡萄酒理化指标与葡萄酒评分之间的回归模型,建立酿酒葡萄理化指标与葡萄酒质量之间关系,给出决定葡萄酒质量的关键理化指标。
2. 葡萄酒评分的可信性研究考虑到品酒员之间可能存在个人评酒风格等主观差异因素,导致不同品酒员对同一葡萄酒的评分悬殊,影响葡萄酒质量鉴定,因此,必须对品酒员的评分主观因素进行检验。
附件1给出了两组红葡萄酒王思哲等品酒员对27个酒样品的评价得分和两组白葡萄酒品酒员对28组酒样品的评价得分。
对于评酒得分的偏差性检验和影响因素的数据挖掘技术,可以通过方差分析来实现。
方差分析主要是检验两组品酒员评价结果有无显著性差异,进而判断出哪组评价结果更为可信。
评价得分之间的差异可以分为两个部分,一部分是由于各葡萄酒样品之间的差异,称为条件误差,另一部分是各品酒员评酒风格之间的差异,称为试验误差,我们主要目的是分析得分差异是由于葡萄酒样品之间差异,还是由于品酒员主观差异造成的。
通过对两组红葡萄酒和两组白葡萄酒评价得分进行正态性检验可以看出都近似服从正态分布,我们分别构造以品酒员和酒样品为组别的数据序列进行方差分析(见表1)。
分析表1数据,基于品酒员和酒样品的显著性差异检验中,除第二组白葡萄酒酒样品差异不显著外,另七组的F统计量都大于基于显著性水平0.01的临界值,表明品酒员评酒风格和酒样品之间的差异都很显著。
进一步比较F统计量数值大小,第一组红葡萄酒评分差异主要来源于酒样品之间的差异,第二组红葡萄酒评分差异主要来源于品酒员评分差异;白葡萄酒评分差异主要来源于品酒员评分差异,酒样品之间的差异不很显著。
初步可以看出,对于红葡萄酒,第一组品酒员评分更为可信,两组白葡萄酒品酒员评分都不可信,品酒员间的差异过大将导致酒样质量差异的显著性被掩盖,结合实际分析,酒样评价中应尽可能缩小由于品酒员个人风格的原因而导致对同一酒样评价差异较大的情况,应尽可能将酒样之间质量的差异通过评价扩大,提高酒样的可识别度。
为此,将原始数据进行处理,原始数据进行处理方法有很多,如标准化处理、聚类处理、收敛区间处理等,我们采用数据标准化处理,降低品酒员之间的主观差异性(见表2)。
Table 1. Wine score variance analysis based on the raw data表1. 基于原始数据的葡萄酒评分方差分析表差异源总平方和自由度均方差F统计量F临界值第一组红葡萄酒品酒员3084.952 9 342.772 3.543 2.484 酒样品14,090.119 26 541.928 9.308 1.837第二组红葡萄酒品酒员3228.681 9 358.742 9.999 2.484 酒样品4186.830 26 161.032 4.675 1.837第一组白葡萄酒品酒员17,034.122 9 1892.68 26.830 2.481 酒样品6253.086 27 231.596 1.957 1.818第二组白葡萄酒品酒员6714.442 9 746.049 19.910 2.481 酒样品2714.811 27 100.549 1.795 1.818Table 2. Wine score variance analysis based on data standardization表2.基于数据标准化处理的葡萄酒评分方差分析表差异源总平方和自由度均方差F统计量F临界值第一组红葡萄酒品酒员0 9 0 0 2.484 酒样品152.698 26 5.873 13.300 1.837第二组红葡萄酒品酒员0 9 0 0 2.484 酒样品119.148 26 4.583 7.906 1.837第一组白葡萄酒品酒员0.196 9 0.022 0.022 2.481 酒样品93.467 27 3.462 4.942 1.818第二组白葡萄酒品酒员0.006 9 0.001 0.001 2.481 酒样品76.147 27 2.820 3.666 1.818王思哲等分析表2数据,对于四组品酒员评价数据序列,用于检验的F统计量值都接近于0,远低于基于显著性水平0.01的F临界值,四组酒样品数据序列的F统计量都大于基于显著性水平0.01的F临界值。