酿酒葡萄分级的方法研究

合集下载

酿酒葡萄的分级标准

酿酒葡萄的分级标准

酿酒葡萄的分级标准含糖量与葡萄酒质量的关系最为密切 是控制葡萄果实成熟度的主要指标之一 同时 糖酸比也是判断酿酒葡萄果实成熟度的一个重要指标(李记明和李华1994)。

在浆果成熟过程中 由于叶片及果实本身的光合作用、呼吸作用、有机酸代谢及其他一系列生理反应使得葡萄浆果中含糖量不断增加 含酸量不断降低。

成熟期的昼夜温差、光照、降雨量及灌溉等因素是影响葡萄果实成熟度差异的主要因素。

BryanGCoombeetal(1980)的研究表明 只有适当的糖酸平衡的葡萄原料刁’能酿造出优质的葡萄酒 即最好的酿酒品种 加上最佳的成熟度 刁‘能酿出高质量的葡萄酒:葡萄原料过熟 所酿的葡萄酒酸低 pH值高 葡萄酒质量差;葡萄原料次等成熟 所酿的葡萄酒瘦弱而寡淡。

含糖量的高低是判断葡萄果实成熟与否的重要指标 既决定了所酿葡萄酒的潜在酒度 又在很大程度上决定了葡萄酒的风味。

在一定范围内 原料的含糖量越高 所酿葡萄酒的质量越好。

因此 并非原料的含糖量最高所酿葡萄酒的质量最好 高质量的葡萄酒是由含糖量较高的原料酿造的 并且要求原料中其他成分也达到一定的含量且具有较好的平衡关系。

葡萄果实中糖的含量一般为巧%一25% 果实中可溶性固形物含量与总糖含量呈正相关 且总糖占其可溶性固形物含量的60%一80% 葡萄及葡萄酒中多酚物质的含量因葡萄品种、产地、气候条件、栽培管理措施、酿造工艺等的不同而异。

即使是同一品种 不同的生态环境、气候条件和栽培管理措施也会导致其酚类物质含量差异较大 (KelleyMIHeazdinaGetal1998)。

一般而言 红葡萄品种果实中酚含量比白葡萄品种多。

葡萄的酚类物质主要存在于果皮、种子及果梗中 其中果梗和种子中酚类物质的含量分别占果穗总酚含量的20%和20%一55%(李华 2001;孙达旺1992)。

周存田等(1999)的研究进一步发现 红葡萄果实中 总酚含量在果皮、果肉、果汁和种子中的比例分别为33.3% 0.7% 3.4%和62.6%;相应在白葡萄中的比例分别为23.2% 0.9% 4.5%和71.4%。

酿酒葡萄分级

酿酒葡萄分级

酿酒葡萄分级七分原料三分工艺,好葡萄酒是种出来的。

葡萄品种特质在很大一定程度上决定了葡萄酒的风味、香气、典型性酒。

葡萄品种分为鲜食葡萄品种和酿酒葡萄品种,我们通常见到的葡萄均为鲜食葡萄。

全世界有超过8000种可以酿酒的葡萄品种,但可以酿制上好葡萄酒的品种只有50种左右,大约可以分为白葡萄和红葡萄两种。

白葡萄,颜色有青绿色、黄色等,主要用来酿制白葡萄酒及气泡酒。

红葡萄,颜色有黑、蓝、紫红、深红色,有果肉是深色的,也有果肉和白葡萄一样是无色的,所以白肉的红葡萄去皮榨汁之后可酿造白葡萄酒。

(一)葡萄的构造及其成分1.葡萄构造一穗葡萄包括果梗和果粒两个部分,其中果梗占4%~6%,果粒占94%~ 96%。

果梗富含木质素、单宁、苦味树脂及鞣酸等物质,常使酒产生过重的涩味,一般在葡萄破碎时除去 葡萄果粒包括果皮、果核、果肉及浆液,其中果皮占6%~12% ,果核占2%~5% ,果肉和浆液占83%~ 92%。

2.葡萄成分(1)果皮中的单宁、色素和芳香物①果皮中含有单宁、色素及芳香物质,对酿制葡萄有一定影响。

葡萄单宁是一种复杂的有机化合物,能溶于水和乙醇,味苦而涩,与铁盐作用时生成蓝色反应,能和动物胶或其他蛋白质溶液生成不溶性的复合沉淀 葡萄单宁与醛类化合物生成不溶性的缩合产物,随着葡萄酒的老熟而被氧化。

②绝大多数的葡萄色素只存在于果皮中,化学成分非常复杂,往往因品种而不同.白葡萄有白、青、黄、白黄、金黄、淡黄等颜色 红葡萄有淡红、鲜红、深红、红黄、褐色、浓褐、赤褐等颜色 黑葡萄有淡紫、紫、紫红、紫黑、黑等色泽。

③果皮的芳香成分能赋予葡萄酒特有的果实香味。

不同的品种,香味不一样。

粒小的品种酿制的葡萄酒香气较好果核中含有损害葡萄酒风味的物质,如脂肪、树脂、挥发酸等,这些成分如在发酵时带入醪液,会严重影响成品酒质量,所以葡萄破碎时,应尽量避免将核压破。

(2)果肉和果汁的主要成分果肉和果汁为葡萄果粒的主要部分。

酿酒用葡萄,希望柔软多汁,且种核外不包肉质,以使葡萄出汁率高。

酿酒葡萄的等级判别方法

酿酒葡萄的等级判别方法

中,每一个样品都不是严格划分为一类的,而是以一定的隶属度属于
某一类。
另 uik 表 示 第 k 个 样 品 xk 属 于 第 i 类 的 隶 属 度 , 这 里 0≤uik ≤1,
c
Σuik =1 定义目标函数 i
nc
ΣΣ J(U,V)=
2
uik dik
(2)
k = 1i = 1
其中 U=(uik )c×n 为隶属度矩阵,dik =襓xk -vi 襓。 显 然 J(U,V)表 示
【关键词】模糊 C 均值聚类;自主神经网络;隶属度;极差归一化;等级判别 The Wine Grape Level Discrimination Method LIU Xiao-fang ZHANG Jun-na
(Henan Normal University,College of Computer and Information Engineering,Xinxiang Henan,453007 ) 【Abstract】According to the problems of wine grape classification, in the case of no clear classification , this paper puts forward the fuzzy cmeans clustering (FCM) and autonomous neural network algorithm, under the circumstance of knowing wine quality score results ,first deal with the data of the physical and chemical index of wine grape and wine quality scores by normalization processing; By the fuzzy c-means clustering algorithm for classification can get membership degree matrix and classification center, under the condition of unsupervised learning way by the way of the autonomic nervous network wine grape is successfully divided into three levels. The ways can be used as a reference for grape wine production. 【Key words】The fuzzy c-means clustering; Autonomic nervous network; Normalization processing; Membership degree matrix; Grade judgment

葡萄酒质量的评价

葡萄酒质量的评价

葡萄酒质量的评价现行的葡萄酒质量的评价体系是建立在人的感官上进行的,如何通过一些量化的理化指标来评价葡萄酒质量是一个值得研究的方向。

为此,利用多元统计分析的相关知识,通过研究酿酒葡萄的理化指标和葡萄酒的质量之间的关系,客观的评价了葡萄酒的质量,成功的对酿酒葡萄进行了分级。

标签:t检验法;K均值聚类;典型相关分析;多元线性回归1问题背景葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,找到一种简单有效的客观方法来评酒,如何采用一个量化的评价标准就显得尤为重要了。

本文根据全国大学生数学建模竞赛2012年A题的问题和数据,通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标之间的关系,对葡萄酒的质量进行了客观评价和分级。

2模型假设(1)假设附件数据来源真实有效;(2)假设两组品酒员在相同环境下品酒,采用评分标准一样;(3)假设酿酒葡萄和葡萄酒编号一一对应。

3符号说明4模型建立与求解4.1问题一的模型建立与求解4.1.1数据预处理在数据分析之前通常要对数据进行预处理,附件1包含两组品酒员分别对红葡萄酒和白葡萄酒的评分数据,每组品酒员有10个,红葡萄酒样品有27个,白葡萄酒样品有28个。

观察数据我们可以发现,部分数据存在缺失和异常现象,我们对其正常化处理。

对于数据缺失情况,例如第一组红葡萄酒样品20号中品酒员4号对色调评分数据缺失,我们采用剩余数据的均值替换法来修补缺失数据。

对于数据异常情况,例如第一组白葡萄酒样品3号中品酒员7号对持久性数据评分超过其规定最大值,我们也是采用“先舍弃后均值替换”的方法。

4.1.2评分数据正态性的检验对数据进行预处理后,我们对附件1中品酒员对酒样品的评价总分进行了计算,然后得出了红葡萄酒和白葡萄酒的得分均值,其图像如图1、图2所示。

观察图1、图2可以发现,两组品酒员对红葡萄酒和白葡萄酒的得分均值虽然在数值上有出入,但其变化趋势大致一样,为了评价两组品酒员的评价结果有无显著性差异,我们拟采用双正态总体t检验法,为此我们需要对两组品酒员的评分数据进行正态性检验。

酿酒葡萄的分级问题

酿酒葡萄的分级问题

不同质量 的葡萄所 酿葡萄酒 品质不 同 , 所 以对酿酒 葡萄 的分级要从 两方 面
( 5 ) 利 用 回归分析 所得 到 的式子 , 可 以 由主成分 得到酿 酒红 葡萄所 酿 红葡 萄酒 的预 期评 分y , 结果 如( 表2 ) 。 ( 6 ) 通过 酿酒葡 萄所酿酒 的预期 评分 y 对酿 酒红葡 萄进行分级 , 规 定每 级分 数 间 隔区 间范 围 : 红葡 萄为 3 。 得 到分 级 结果 :
1 1 、 1 8 、 1 、 7 、 4 。
( 7 ) 同理 , 得 到 白葡萄 酒 的品酒 员评 价分 数 与主成 分之 间 的关系 为 : y = O .
8 3 8 x1 —0 . 02 l x 2-O. 8 3 1 x3 +O. 8 5 3 x4 -0. 90 l x5+1 . O 8l x 6-O. 4 77 x7 -1.
立如 下形 式 的函数模 型 : 红葡 萄 酒 : Y= a 1 x 1 + a 2 x 2 一 a 3 x 3 +a 4 x 4 一 a 5 x 5 +a 6 x 6 + a 7 x 7 一a 8 x 8 + a 9
l 7 、 2 l 、 1 2 、 1 9 、 1 5 、 6 、 4 、 2 3 、 1 0 、 2 ; 四级 ( 6 2 — 5 1 ) : 1 6 、 1 8 、 1 4 、 8 、 7 、 1 、 1 1 ; 五级( 5 1 —
分。
级( 8 O 一 7 7 ) : 样 本9 ; 二级 ( 7 7 — 7 4 ) : 样 本2 3 、 3 、 2 ; 三级 ( 7 4 — 7 1 ) 2 O 、 2 l 、 1 9 、
1 7 、 1 0 、 5 、 1 3 l 四级 ( 7 1 — 6 8 ) : 2 2 、 1 2 、 1 5 、 2 5 、 2 6 、 2 4 、 2 7 、 1 6 、 6 、 1 4 ; 五级( 6 8 - 6 5 ) : 8 、

基于主成分分析法评测酿酒葡萄的品质

基于主成分分析法评测酿酒葡萄的品质

酿酒红 葡萄的化学成分数 目过多,且局 部化学成分对各 自的质量影响小 , 且 数 目过多难 以树 立指标之 间的关联 , 不仅 会 增 加 工作 量 还有 可 能 对评 判 结 果产 生影 响 。 因而 , 可对各化 学成分进行 降维 , 减小化 学成分数量。 采 取 主 成 分 分 析 法 对 化 学 成 分 降 维 ,确 定 各 个化 学 成 分 的主 成
二、 酿酒葡萄评测方法
( 一) 红 葡 萄 酒 的质 量 依据 评酒 员对红葡萄酒的整体评估 分数 ,计算 出每个 红 葡 萄 酒样 品 的 平均 总 评 分 ; 对这些评分进行分级 , 如 下表 1 , 规 定 每 个 级 别 所 占分 值 , 筛 选 出每 一 等 级 红 葡 萄 酒 的数 量 。
分, 较 差 级 别 的 分值 为 4分 。 ( 二) 主成 分分 析 法
图 1红葡萄酒样 品对应分数 P
( 三) 层 次 分析 法
利用层次分析法 ,建立红 葡萄酒的品质 与酿酒红 葡萄的 化学成分关联 的模型 , 进而对 酿酒红 葡萄进行级别划分。 采用 AH P法建立各指标权重 , 确 定权重的对比矩阵为 :
采 用 AH P法建 立红 葡萄酒质 量和 酿酒红 葡萄化 学成分
的权重 , 分别为 :
红 葡 萄 酒 的质 量 的权 重 1

轰 ’ …
般 取 累计 贡 献 率达 8 5 — 9 5 % 的 特征 值 , … , 所 对 应 的 第一、 第二 , . . . , 第1 2 1 ≤p j 个 主 成 分 2 . 计 算 主 成 分 载荷
基于主成分分析法评 测酿酒 葡萄 的品质
文/ 王乔 宇 李瑞蒲 荆晓 原
摘要 : 本文对 酿酒 红葡萄 品质的分析 , 对外观 、 香气 、 口感 四项等级进行对红葡萄酒 的评分 , 同时针对 酿酒红葡萄 的化

葡萄酒分级

葡萄酒分级葡萄酒是一种古老而复杂的饮品,其品质和风味因多种因素而异。

为了帮助消费者更好地理解和选择葡萄酒,葡萄酒分级系统应运而生。

葡萄酒分级是一种对葡萄酒进行分类和评估的方法,通常根据产地、葡萄品种、酿造工艺以及质量等因素进行评定。

葡萄酒分级的历史可以追溯到法国波尔多地区的1855年葡萄酒分级制度的建立。

此后,许多其他葡萄酒产区也纷纷借鉴了波尔多的经验,建立了自己的葡萄酒分级系统。

目前,世界上各大葡萄酒产区都有各自的分级标准和体系,如法国新兴产区克鲁瓦尔地区的“圣爵修”,意大利的“DOCG”和美国的“AVA”。

在葡萄酒分级的体系中,通常将葡萄酒分为不同的档次或等级。

这些等级通常通过代表性葡萄酒的质量和特征来确定,以帮助消费者更好地选择他们所喜欢的葡萄酒。

下面将介绍一些常见的葡萄酒分级等级。

第一等级葡萄酒通常是该产区的顶级产品,具有出色的风味和质量。

这些葡萄酒通常是来自最佳葡萄园,采用最优质的葡萄品种,经过长时间的陈酿和精细工艺。

这些葡萄酒往往价格昂贵,适合特殊场合或收藏。

第二等级葡萄酒通常也是非常优质的产品,但与第一等级相比可能有一些差距。

这些葡萄酒仍然具有出色的风味和质量,但可能缺乏一些细节和复杂性。

第三等级葡萄酒通常是中档价位的产品,可能在质量和品味上略逊于前两个等级。

这些葡萄酒通常是可口的和令人满意的,但可能不具备复杂的风味。

第四等级葡萄酒通常是短期陈酿和较低价位的产品。

这些葡萄酒可能是年份较新或没有经过长时间的陈酿,因此味道相对较简单。

此外,还有一些特殊的葡萄酒分级等级,如特级葡萄酒或顶级酒庄的特别酒款。

这些葡萄酒通常是特殊年份的收藏品,或者是某个酒庄的顶级产品。

除了葡萄酒分级等级,一些产区还对葡萄酒的产地进行分级。

产地分级可以帮助消费者更好地了解和识别某个产区的葡萄酒。

总的来说,葡萄酒分级是葡萄酒界为了更好地评估和鉴定葡萄酒的品质和特征而建立的一个体系。

通过葡萄酒分级,消费者可以更好地了解和选择自己喜欢的葡萄酒。

葡萄酒的评分及酿酒葡萄的分级

葡萄酒的评分及酿酒葡萄的分级作者:李丽来源:《南方农业·下旬》2014年第10期摘要采用主成分分析法对所给数据的理化指标进行处理,利用统计软件SAS,用系统聚类法将酿酒葡萄进行分级。

为了分析两组评酒员对葡萄酒样品打分结果是否存在显著性差异,采用t检验法进行分析,得出两组评价结果存在差异,再根据两组评分的方差对比,即每组10个评酒员评分的波动性大小,判断出第2组评酒员的评价结果更可信。

关键词假设检验;聚类分析;葡萄酒;评分;酿酒葡萄;分级中图分类号:S663.1 文献标志码:A 文章编号:1673-890X(2014)10--21 问题的提出葡萄酒的质量可以通过评酒员进行品评。

每个评酒员品尝后对其分类指标打分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

根据某一年份一些葡萄酒的评价结果,和该年份这些葡萄酒和酿酒葡萄的成分数据,建立数学模型,分析两组评酒员的评价结果有无显著性差异,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

2 问题分析在葡萄酒质量的评价中,两组(各10位)评酒员对55种葡萄酒样品(红葡萄酒27种,白葡萄酒28种)的评分存在差异。

为得出更中肯的评价,假设这两组评酒员的评分都服从正态分布。

选用t检验法判断是否有显著性差异,再根据同一组中10位评酒员对同一葡萄酒样品的评分的波动性来判定评分结果的可靠性。

根据酿酒葡萄的理化指标以及反映葡萄酒原材料好坏的指标,用系统聚类法对酿酒葡萄进行分级。

3 模型的建立与求解模型的评价葡萄酒的评分以大多数人的意见为参考,并没有科学性。

评价葡萄酒的质量仅是以某组评酒员的评分来量化,没有较高的可靠性。

研究问题时,采用大样本空间,减少随机巧合,计算准确度提高,但酿酒葡萄的分级没有明显级别。

参考文献[1]黄本春.统计学实验教程[M].北京:中国经济出版社,2010.[2]王芳,陈胜可,冯国生.SAS统计与应用[M].北京:电子工业出版社,2010.(责任编辑:刘昀)。

酿酒葡萄分级的方法研究

酿酒葡萄分级的方法研究1 模糊C均值聚类1.1 算法描述聚类分析的目的是把分类对象按一定规则分成若干类,这些类不是事先给定的,而是根据数据的特征确定的,对类的数目和类的结构不必作任何假定。

在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同类里的对象倾向于不相似。

硬聚类把每个待辨识的对象严格地划分到某类中,具有非此即彼的性质,模糊聚类由于能够描述样本类属的中介性,能够客观地反映现实世界,已逐渐成为聚类分析的主流[1-2]。

在此,我们采用模糊C均值聚类的方法。

模糊C均值聚类(FCM),是用隶属度确定每个数据点属于某个聚类的程度的一种算法。

FCM把n个向量x■(i=1,2,…,n)分为c个模糊组,并求每组的聚类中心,使得非相似性指标的价值函数达到最小。

与引入模糊划分相适应,隶属矩阵U允许有取值在0,1间的元素。

不过,加上归一化规定,一个数据集的隶属度的和总等于1:■u■=1,?坌j=1,…,n(1)那么,FCM的价值函数(或目标函数)就是:J(U,c■,…,c■)=■J■=■■u■■d■■(2)这里u■介于0,1间,c■为模糊组I的聚类中心,d■=‖c■-x■‖为第I个聚类中心与第j个数据点间的欧几里德距离;m∈[1,∞)是一个加权指数。

构造如下新的目标函数,可求得使(2)式达到最小值的必要条件:■(U,c■,…,c■,λ■,…,λ■)=J(U,c■,…,c■)+■■■λ■(■u■-1)=■■u■■d■■+■λ■(■u■-1)(3)这里λ■,j=1到n,是(1)式的n个约束式的拉格朗日乘子。

对所有输入参量求导,使式(2)达到最小的必要条件为:c■=■(4)和u■=■(5)由上述两个必要条件,模糊c均值聚类算法是一个简单的迭代过程。

在批处理方式运行时,FCM用下列步骤确定聚类中心c■和隶属矩阵U:步骤1:用值在0,1间的随机数初始化隶属矩阵U,使其满足式(1)中的约束条件。

步骤2:用式(4)计算c个聚类中心c■,i=1,…,c。

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级


累计贡献率:

k 1 p k 1
i
k
k

i 1,2, , p
k
取累计贡献率达到 70% 的特征值 1,, 2, ,m 所对应的第 1,2, , mm p 个主 成分; (4)葡萄样品的综合评定的加权分析模型为: F W1 F1 W2 F2 Wn Fn 其中 F 为葡萄样品综合得分, (i=1,2, …n) , (i=1,2, … Wi 为贡献率 Fi 为因子得分 n) 。 1.3 模型的求解 根据附表 2 中的数据,利用 SPSS 对红白葡萄样品的理化指标进行主成分分 析,提取出各自的主成分以及因子得分,最后结合贡献率求出综合得分排名,结 果如下表: 表 1 红葡萄样品综合得分排名 红葡萄 评分 综合排名 红葡萄 评分 综合排名 葡萄样品 1 0.691202 1 葡萄样品 15 -0.23296 20 葡萄样品 2 0.435825 7 葡萄样品 16 -0.32867 21 葡萄样品 3 0.538394 4 葡萄样品 17 0.456459 5 葡萄样品 4 -0.49785 25 葡萄样品 18 -0.18906 16 葡萄样品 5 0.289863 8 葡萄样品 19 -0.20958 19 葡萄样品 6 0.076453 12 葡萄样品 20 -0.13219 15 葡萄样品 7 -0.4259 23 葡萄样品 21 -0.19872 17 葡萄样品 8 0.583125 3 葡萄样品 22 -0.0664 14 葡萄样品 9 0.455155 6 葡萄样品 23 0.68989 2 葡萄样品 10 -0.7099 27 葡萄样品 24 0.108177 10 葡萄样品 11 0.0932 11 葡萄样品 25 -0.6659 26 葡萄样品 12 0.071345 13 葡萄样品 26 -0.2089 18 葡萄样品 13 -0.34832 22 葡萄样品 27 -0.48189 24 葡萄样品 14 0.207176 9 表 2 白葡萄样品综合得分排名 综合排名 白葡萄 评分 综合排名 23 葡萄样品 15 -0.0192 14 17 葡萄样品 16 -0.8303 28 5 葡萄样品 17 -0.0776 18 15 葡萄样品 18 -0.4117 25 3 葡萄样品 19 -0.5280 26
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

酿酒葡萄分级的方法研究作者:刘洋洋薛凌云来源:《科技视界》2012年第31期1 模糊C均值聚类1.1 算法描述聚类分析的目的是把分类对象按一定规则分成若干类,这些类不是事先给定的,而是根据数据的特征确定的,对类的数目和类的结构不必作任何假定。

在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同类里的对象倾向于不相似。

硬聚类把每个待辨识的对象严格地划分到某类中,具有非此即彼的性质,模糊聚类由于能够描述样本类属的中介性,能够客观地反映现实世界,已逐渐成为聚类分析的主流[1-2]。

在此,我们采用模糊C均值聚类的方法。

模糊C均值聚类(FCM),是用隶属度确定每个数据点属于某个聚类的程度的一种算法。

FCM把n个向量x■(i=1,2,…,n)分为c个模糊组,并求每组的聚类中心,使得非相似性指标的价值函数达到最小。

与引入模糊划分相适应,隶属矩阵U允许有取值在0,1间的元素。

不过,加上归一化规定,一个数据集的隶属度的和总等于1:■u■=1,?坌j=1,…,n(1)那么,FCM的价值函数(或目标函数)就是:J(U,c■,…,c■)=■J■=■■u■■d■■(2)这里u■介于0,1间,c■为模糊组I的聚类中心,d■=‖c■-x■‖为第I个聚类中心与第j个数据点间的欧几里德距离;m∈[1,∞)是一个加权指数。

構造如下新的目标函数,可求得使(2)式达到最小值的必要条件:■(U,c■,…,c■,λ■,…,λ■)=J(U,c■,…,c■)+■■■λ■(■u■-1)=■■u■■d■■+■λ■(■u■-1)(3)这里λ■,j=1到n,是(1)式的n个约束式的拉格朗日乘子。

对所有输入参量求导,使式(2)达到最小的必要条件为:c■=■(4)和u■=■(5)由上述两个必要条件,模糊c均值聚类算法是一个简单的迭代过程。

在批处理方式运行时,FCM用下列步骤确定聚类中心c■和隶属矩阵U:步骤1:用值在0,1间的随机数初始化隶属矩阵U,使其满足式(1)中的约束条件。

步骤2:用式(4)计算c个聚类中心c■,i=1,…,c。

步骤3:根据式(2)计算价值函数。

如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阀值,则算法停止。

步骤4:用(5)计算新的U矩阵。

返回步骤2。

上述算法也可以先初始化聚类中心,然后再执行迭代过程。

由于不能确保FCM收敛于一个最优解。

算法的性能依赖于初始聚类中心。

因此,我们要么用另外的快速算法确定初始聚类中心,要么每次用不同的初始聚类中心启动该算法,多次运行FCM。

设被分类的对象的集合为:X={x■,x■,…,x■},其中,每一个对象x■有n个特性指标,设为x■=(x■,x■,…,x■)■,如果要把X分成c类,则它的每一个分类结果都对应一个c×N阶的Boolean矩阵U=[u■]■,对应的模糊c划分空间为:M■={U?奂R■|u■∈[0,1],?坌i,?坌k;■u■=1,?坌k;0Repeat for l = 1,2……Step 1:compute the cluseter prototypes(means):p■■=■,1≤i≤cStep 2:compete the distance:(d■)■=x■-p■■■A(x■-p■),1≤i≤c,1≤k≤nStep 3:Update the partition matrix:For 1≤k≤NIf (d■)■>0 for all i=1,2,…,cu■■=■Otherwiseu■■=0 if d■>0,and u■■∈[0,1] with ■u■■=1Until ‖U■-U(l-1)‖≤ε1.2 模型的建立与求解根据2012年全国数学建模竞赛中A题将第一组评酒员对红葡萄酒的27组样品酒评分作为样本进行聚类分析。

利用MATLAB编程对白葡萄酒的质量进行模糊C均值聚类,结果如表1所示。

根据表1的数据,求出每组数据的平均值分别为:86.5833、76.1333,可以看出白葡萄酒可分为两级,第一级为第一类数据,第二级为第二类数据。

葡萄酒与葡萄是相对应的,即葡萄酒样品1对应于葡萄样品1,所以白葡萄的分级与白葡萄酒的分级一致。

对红葡萄酒的质量进行模糊C均值聚类,结果如表2所示。

表2 红葡萄酒分类根据表2的数据求每组质量的平均值分别为:72.7143、72.5、75.75、66.7。

排序可知一级为第三类、二级为第一类、三级为第二类、四级为第四类。

1.3 模型缺陷此聚类模型只考虑了葡萄酒的质量对酿酒葡萄分级的影响,并没有考虑酿酒葡萄的理化指标,因此进一步形成主成分分析模型。

2 主成分分析2.1 算法描述主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的多元统计方法,这些主成分能够反映原始变量的大部分信息,通常表示为原始变量的线性组合[4]。

主成分分析的基本原理为:假定有样本,每个样本共有p个特征,构成一个n×p阶的数据矩阵:X=x■ x■ … x■x■ x■ … x■┇┇┇┇x■ x■ … x■当p较大时,在p维空间中考察问题比较麻烦。

为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。

记x■,x■,…,x■为原变量指标,z■,z■,…,z■(m≤p)为新变量指标:z■=l■x■+l■x■+…+l■x■z■=l■x■+l■x■+…+l■x■……z■=l■x■+l■x■+…+l■x■从以上的分析可以看出,主成分分析的实质就是确定原来变量x■(j=1,2,…,p)在诸主成分z■(i=1,2,…,m)上的荷载l■(i=1,2,…,m; j=1,2,…,p)。

从数学上可以证明,它们分别是相关矩阵m个較大的特征值所对应的特征向量。

主成分分析的步骤为:步骤一:计算相关系数矩阵:R=r■ r■ … r■r■ r■ … r■┇┇┇┇r■ r■ … r■r■(i,j=1,2,…,p)为原变量x■与x■的相关系数,r■=r■,其计算公式为:r■=■(6)步骤二:计算特征值与特征向量:解特征方程λI-R=0,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列λ■≥λ■≥…≥λ■≥0。

分别求出对应于特征值λ■的特征向量e■(i=1,2,…,p)■,要求‖e■‖=1,即■e■■=1,其中,e■表示向量e■的第j个分量。

计算主成分贡献率及累计贡献率:贡献率:■(i=1,2,…,p)(7)累计贡献率:■(i=1,2,…,p)(8)一般取累计贡献率达85%~95%的特征值λ■,λ■,…,λ■所对应的第1、第2、…、第m (m≤p)个主成分。

计算主成分载荷:l■=p(z■,x■)=■e■ (i,j=1,2,…,p)(9)各主成分的得分:z■ z■ … z■z■ z■ … z■┇┇┇┇z■ z■ … z■2.2 模型的建立与求解2.2.1 数据预处理从样本观测值出发对酿酒葡萄的主成分进行分析,根据2012年全国数学建模竞赛中A题的数据可知,一级指标下二级指标的所有值相加与此一级指标的值相等,所以一级指标包含了二级指标,因此在对指标进行分析时,只考虑一级指标忽略二级指标。

其次,对于某些指标测试多次的情况,对多次测试的值取平均值作为此指标的最后值,最后确定共28个指标。

在2012年全国数学建模竞赛中A题的数据有不同的性质和不同的量纲,为了处理问题的方便,需要对原始数据进行标准化处理。

2.2.2 分别对红白酿酒葡萄进行主成分分析利用MATLAB的princomp函数进行对红酿酒葡萄的主成分分析,分析出的结果如下:前三种主成分的累计贡献率分别为69.7038%,79.9874%,86.2521%,即前三种主成分的累计贡献率就达到了86.2521%,所以用前三个主成分就可以了。

根据前三个主成分的相关系数可知:第一主成分中系数比较大的理化指标为花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮、出汁率。

花色苷主要影响葡萄的色泽,DPPH自由基含有酚类物质影响的是葡萄的色泽,总酚影响葡萄的色泽和口感味觉,葡萄总黄酮抗氧化,影响葡萄的色泽,百粒质量,果穗质量,果皮质量影响的都是葡萄外形,果皮颜色影响的是色泽,因此第一主成分是葡萄的综合成分。

第二主成分中系数比较大的理化指标为总糖、还原糖、可溶性物质、干物质含量。

而这几种指标影响的是葡萄酒的口感,因此第二主成分是口感成分。

第三主成分中系数比较的的理化指标为酒石酸、柠檬酸、固比酸、果皮颜色,系数为负数且绝对值较大的指标为单宁,可滴定酸百粒质量,果皮质量,这几种指标中酸影响口感,在系数种有正向影响也有负向影响,因此此成分不影响葡萄酒的口感,影响葡萄酒的外形和色泽,即为外形和色泽的协调成分。

根据第一种主成分即综合成分对酒样品进行分级:此函数可以得到样品酒的第一主成分得分,根据得分可知,有很多得分为负值样品酒,即在第一主成分即综合成分方面这些样品酒的等级最差,因此只需要对为正的数据进行分级。

可知得分为正的样品酒为:样品酒1、2、3、8、9、13、14、16、19、21、23。

利用模糊综合评价的方法将各个指标所占的分数作为权重对样品酒进行模糊综合评价,可以得出每个样品酒的模糊综合评价如表3。

表3 各样品酒的模糊综合评价得分首先,按照表3的优良中差进行分级,再将得分为负值的样品酒作为最后一级,可知如果按照综合成分考虑:一级红葡萄酒:8,19二级红葡萄酒:2,3,9,13,16,21,23三级红葡萄酒:1,14四级红葡萄酒:4,5,6,7,10,12,15,17,18,20,22,24,25,26因为葡萄酒样品与酿酒葡萄样品是一一对应的,因此对酿酒葡萄的分级也是如此。

同理,可以得到样品酒的第二种主成分得分,可知得分为正的样品酒为:4、8、15、11、1、17、22、21、18、7、6、3、12。

根据第二种主成分即口感成分对酒样品进行分级,和主成分一的分析方法相同可得到分级为:一级红葡萄:4,6,21,22二级红葡萄:3,7,8,11,17,18三级红葡萄:1,12,15四级红葡萄:2,5,9,10,13,14,16,19,20根据样品酒的第三种主成分可知,得分为正的样品酒为:样品酒3、2、26、14、4、27、10、13、22、16、21、11。

根据第三种主成分即外形和香气协调成分对酒样品进行分级,和主成分一的分析方法相同可得到分级为:一级红葡萄:2,3,4,10,11,21,22二级红葡萄:13,14,16,26,27三级红葡萄:1,5,6,7,8,9,12,15,17,18,19,20,23,24,25用相同的方法对白酿酒葡萄进行主成分分析,分析出的结果如下:得出的前2个主成分的累计贡献率为,96.2584%,98.7679%,可以划分为连主成分。

相关文档
最新文档