全国大学生数学建模竞赛题葡萄酒的评价答案全解

全国大学生数学建模竞赛题葡萄酒的评价答案全解
全国大学生数学建模竞赛题葡萄酒的评价答案全解

数学实验

计算机科学与技术

成员:xxx

学号:xxxxxxxxxx

葡萄酒的评价

摘要

本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。

在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。

在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。

在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。

关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析

一.问题的重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

附件1:葡萄酒品尝评分表(含4个表格)

附件2:葡萄和葡萄酒的理化指标(含2个表格)

附件3:葡萄和葡萄酒的芳香物质(含4个表格)

二基本假设与符号说明

2.1 基本假设

(1)评酒员的评分是客观公正的,不受任何外界因素影响。

(2)用来检验的葡萄都是刚采摘的新鲜葡萄,葡萄酒也没有遭受任何污染。

(3)在检测酿酒葡萄和葡萄酒的理化指标的过程中,忽略由于人为操作不当带来的误差。

(4)由于不是每组数据都对葡萄酒的质量产生很大影响,所以在处理数据过程中,忽略那些影响不是很明显的理化指标。

2.2 符号说明

μ第i组评酒员对各品种红葡萄酒的评分均值的期望

i

)2,1

(=

i

σ第i组评酒员对各品种红葡萄酒的评分均值的方差

i

)2,1

(2=

i

H问题一的假设

Z第i个主成分

i

r第i个评酒员对第j种酒的评分

ij

三.问题的分析

针对问题一,如何判断两组评酒员的评价结果有无显著性差异,我们采用T检验法进行判断。但采用T检验法的前提是其必须服从正态分布,方差未知且相等。所以我们先对那些数据进行正态分布检验,判断其是否服从正态分布。验证服从正态分布后,我们利用T检验法判断两组评酒员评价结果的显著性差异。对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。

针对问题二中如何根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,我们采用主成分分析法。因为在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。解决这个问题的过程中,我们用Matlab软件实现主成分分析,我们对那些理化指标进行重新整理,求出各个理化指标的之间的相关系数、特征值及特征向量和贡献率等。

针对问题三中如何分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们想到了用多项式曲线拟合的方法,根据两者理化指标实测样本,用统计分析的方法,找出一种适当的函数关系从而达到处理酿酒葡萄与葡萄酒之间相关关系的目的。实际的操作过程中,我们首先构造一个关于酿酒葡萄与葡萄酒的理化指标的函数,以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量,利用Matlab软件进行曲线拟合,得出酿酒葡萄与葡萄酒的理化指标之间的关系。

针对问题四中如何分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,以及能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,我们采用无交互作用的双因素试验的方差分析方法。用方差分析,可以将影响葡萄酒的主要因素和次要因素区分开来,还可以分别算出酿酒葡萄的理化指标和葡萄酒的理化指标与葡萄酒质量之间的误差,如果误差在可接受范围之内,即说明可以用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒质量。

四.模型的建立与求解

4.1 问题一的模型建立与求解

4.1.1 T检验法的模型建立与求解

T检验是用T分布理论来推论差异发生的概率,从而比较两个均值的差异是否显著。

由于检验红葡萄酒与白葡萄酒的方法和模型一样,这里我们只给出检验红葡萄酒的模型。

1.正态分布的检验

由于使用T检验法的前提是两个总体分布都服从正态分布,我们先利用Excel软件计算出:

第一组评酒员对各品种红葡萄酒的评分均值为:

62.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7, 74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73

第二组评酒员对各品种红葡萄酒的评分均值为:

68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72, 71.5

然后我们利用Matlab 软件里的正态分布拟合函数进行曲线拟合,得出其正态分布的拟合曲线图为图一:

图一、正态分布拟合曲线图

从图中我们知道其曲线近似为一条直线,因此我们认为评酒员对红葡萄酒以及白葡萄酒的评分均值都服从正态分布。 2. T 检验法模型的建立与求解

设ξ,η分别为第一组、第二组评酒员对各品种红葡萄酒的评分均值,且

),(~211σμξN ,),(~222σμηN ,其中222121,,,σσμμ均未知。

(1) 作出统计假设211210::μμμμ≠?=H H 。 (2) 选取统计量

)2(~112

212

1212

222

112

1-++-++-=

-

-n n t n n n n S n S n T n n η

ξ

(3) 对于给定的显著性水平05.0=α,我们利用Matlab 软件进行计算求解。结果如下

表所示:

H=0,表示接受原假设;H=1,表示接受背择假设。

由上表可知:红葡萄酒之间不存在显著性差异,白葡萄酒之间存在显著性差异。 4.1.2 可信度的判定

由于样本的置信区间与其可信度是呈负相关的,即置信区间越小,其可信度越大。我们利用Matlab 软件求解得出第一组、第二组红葡萄酒和白葡萄酒的置信区间,见下表:

葡萄酒的置信区间

显然第二组的置信区间长度小于第一组,所以第二组评酒员的评价结果可信度更高。

4.2 问题二的模型建立与求解

主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I 个变量就有I 个主成分。 1.计算相关系数矩阵

??

?

???

?

????

???=pp p p p p r r r r r r r r r R 2

1

22221

11211

(1)

在(1)式中,),,2,1,(p j i r ij =为原变量的i x 与j x 之间的相关系数,其计算公式为

∑∑∑===----=

n

k n

k j kj i ki

n

k j kj i ki

ij x x x x

x x x x

r 1

1

2

21

)()()

)(( (2)

因为R 是实对称矩阵(即ji ij r r =),所以只需计算上三角元素或下三角元素即可。

2.计算特征值与特征向量

首先解特征方程0=-R I λ,通常用雅可比法求出特征值),,2,1(p i i =λ,并使其按大小顺序排列,即021≥≥≥≥p λλλ 。然后分别求出对应于特征值i λ的特征向量

),,2,1(p i e i =。这里要求i e =1,即112=∑=p

j ij e ,其中ij e 表示向量i e 的第j 个分量。

3.计算主成分贡献率及累计贡献率

贡献率:第i 个主成分方差在全部方差中所占的比重称为贡献率。这个值越大,表明第i 个主成分综合信息的能力越强。

主成分i Z 的贡献率为

),,2,1(1

p i p

k k

i

=∑=λ

λ (3)

累积贡献率:前k 个主成分共有多大的综合能力,用这k 个主成分的方差和在全部方差中所占的比重来描述,表明取前k 个主成分基本包含了全部测量指标所具有信息的 百分率。

累计贡献率为

),,2,1(11p i p

k k

i

k k

=∑∑==λ

λ (4)

一般取累计贡献率达%95~%85的特征值m λλλ,,,21 所对应的第一、第二,…,第)(p m m ≤个主成分。

4.计算主成分载荷

主成分载荷是反映主成分与元变量之间的相互关联程度。 其计算公式为

),,2,1,(),(p j i e x z p l ij i j i ij ===λ (5)

于是Matlab 软件求解,分别得出红葡萄与白葡萄所分的主成分、特征值、贡献率以及累计贡献率,结果见下表一及表二:

表一 红葡萄主成分的特征值、贡献率及累计贡献率

由上表可看出,主成分1Z 所占的累计贡献率已高达93.83%(大于85%),故只需求出第一主成分1Z 即可。

对于特征值 25.3328求出其特征向量1e ,再用公式计算各变量 ,,,321x x x ,在主成分1Z 上的载荷为)(i H :

0.9351,0.9791,0.9611,0.9878,0.9830,0.9812,0.9920,0.9101,0.9958,0.9837,0.9873,0.9877,0.9828,0.8736,0.9924,0.9834,0.9837,0.9911,0.9925,0.9877,0.9661,0.9921,0.9981,0.9781,0.9866,0.7914,0.9420

第一主成分1Z 与 ,,,321x x x 都呈现正相关性。 因此我们认为:

载荷)(i H =0.9981的23x (即果穗质量)与主成分1Z 有极强的正相关。所以,我们根据23x 的含量水平为葡萄进行排名:排名如下

因此依据以果穗质量的含量水平为重要指标,我们得出红葡萄品质级别如下表:

果见下表:

由上表可看出,主成分1Z 所占的累计贡献率已高达94.99%(大于85%),故只需求出第一主成分1Z 即可。

对于特征值 26.5959求出其特征向量1e ,再用公式计算各变量 ,,,321x x x 在主成分

1Z 上的载荷为)(i H :

0.8815,0.9947,0.9679,0.9898,0.9870,0.9974,0.9961,0.9912,0.9925,0.9965,0.9956,0.9977,0.9044,0.9769,0.9876,0.9786,0.9958,0.9865,0.9590,0.9962,0.8611,0.9926,0.9269,0.9899,0.9940,0.9895,0.9702,0.9738

第一主成分1Z 与 ,,,321x x x 都呈现正相关性。因此我们认为:

载荷)(i H =0.9977的12x (即单宁含量)与主成分1Z 有极强的正相关。所以,我们根据12x 的含量水平为葡萄进行排名结果如下

因此我们规定白葡萄品质级别如下表:

4.3 问题三的模型建立与求解

如果一个被解释变量(因变量)t y 有k 个解释变量(自变量)tj x ,k j ,...,3,2,1=, 同时,t y 不仅是tk x 的线性函数,而且是参数0β和k i i ,...3,2,1=,β(通常未知)的线性函数,随即误差项为t u ,那么多元线性回归模型可以表示为:

,...22110t tk k t t t u x x x y +++++=ββββ ),..,2,1(n t =

这里tk k t t t x x x y E ββββ++++=...)(22110为总体多元线性回归方程,简称总体回归方程。其中,k 表示解释变量个数,0β称为截距项,k βββ,...,,21是总体回归系数。

k i i ,...3,2,1=,β表示在其他自变量保持不变的情况下,自变量tj X 变动一个单位所引起的因变量Y 平均变动的数量,因而也称之为偏回归系数。

当给定一个样本n t x x x y tk t t t ,...2,1),,...,,(21=时,上述模型可以表示为:

????

?????

?????????+++++=+++++=+++++=+++++=t tk k t t t k k k k k k u x x x y u x x x y u x x x y u x x x y ββββββββββββββββ (22110333223110322222211021112211101)

此时,t y 与tj x 已知,i β与t u 未知。 其相应的矩阵表达式为:

)1(321)1(210)

(1333122211111)1(321 (1)

......1......1......1...??????

????????????????+?????????????????????????

??????

?????=?????

???

??????????T T k k k T Tk Tj T k j k j k j T T u u u u x x x x x x x x x x x x y y y y ββββ

可以简化为:

u X Y +=β

通过Matlab软件进行多项式拟合,得出如下图所示的结果:

白葡萄的拟合误差图

白葡萄酒的拟合图

红葡萄的拟合误差图

红葡萄酒的拟合图

由图表得出:酿酒葡萄与葡萄酒的理化指标呈线性正相关。

4.4 问题四的模型建立与求解

在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。

统计学上把多因素不同水平搭配对试验指标的影响称为交互作用。交互作用在多因素的方差分析中,把它当成一个新因素来处理。 4.1.1 无交互作用的双因素试验的方差分析的模型建立

假设某个试验中,有两个可控因素在变化,因素A 有a 个水平,记作a A A A ,,,21 ;因素B 有b 个水平,记作b B B B ,,,21 ;则A 与B 的不同水平组合。),,2,1;,,2,1(b j a i B A j i ==共有ab 个,每个水平组合称为一个处理,每个处理只作一次试验,得ab 个观测值ij X ,得双因素无重复实验表:

同时假设:(1)ij X 相互独立;

(2)),(~2σμij ij N X ,(方差齐性)。

线性统计模型:

ij j i ij X εβαμ+++=

其中

所有期望值的总平均:

∑∑===a i b

j ij ab 11

1μμ

水平i A 对试验结果的效应:

μμα-=∑=b

j ij i a 1

1

水平j B 对试验结果的效应:

μμβ-=∑=a

i ij j b 1

1

ij ij ij X με-=

ij j i εβα,,满足的性质:

)

,0(~;

0;021

1σεβ

α

N ij b

j j

a

i i

==∑∑==

要分析因素A ,B 的差异对试验结果是否有显著影响,即为检验如下假设是否成立:

:0:21022101========b a H H βββααα

总离差平方和的分解定理:

仿单因素方差分析的方法,考察总离差平方和:

E B A T SS SS SS SS ++=

2

1

)(∑=-=a

i i A X X b SS

称为因素A 的离差平方和,反映因素 A 对试验指标的影响。

2

1

)(∑=-=b

j j B X X a SS

称为因素B 的离差平方和,反映因素 B 对试验指标的影响。

2

11

)(∑∑==+--a i b

j j i ij E X X X X SS

称为误差平方和,反映试验误差对试验指标的影响。 若假设0101,H H 成立,则:

),(~2σμN X ij

可推得: ))

1)(1((~)1(~)

1(~)1(~22

22

22

22

-----b a SS b SS a SS ab SS E

B

A

T

χσχσχσ

χσ

将2222

,,,σ

σσσE

B A T SS SS SS SS 的自由度分别记作E B A T df df df df ,,,,则

))

1)(1(),1((~))

1)(1(),1((~---==---==

b a b F MS MS df SS df SS F b a a F MS MS df SS df SS F E

B

E E B B B E

A

E E A A A

对给定的检验水平α,

当))1)(1(),1((--->b a a F F A α时,拒绝01H ,即A 因素的影响有统计意义。 当))1)(1(),1((--->b a b F F B α时,拒绝02H ,即B 因素的影响有统计意义。

注意 : B

A T E

B A T E SS SS SS SS --=

各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。

A SS ,

B SS ,T SS 的简便计算式为:

p

R SS p D D R SS p

D SS T B A B A A -=+--=-=

其中:

∑∑∑∑========a

i b j ij

b

j j B a

i i A X R a

T D ab T p b

T D 11

2

12

212

)()(

于是通过matlab 软件计算得到ANOVA 表格如下:

所以,由结果知第一个p 值代表列样本均值相同的假设p 值,反映了酿酒葡萄的理化指标的影响。由于)1(p <0.05,故可得葡萄酒的理化指标对葡萄酒质量的影响显著。

同理,因为)1()2(p p <,所以可知酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

全国大学生数学竞赛预赛试题

第一届全国大学生数学竞赛预赛试题 一、填空题(每小题5分,共20分) 1.计算__ ,其中区域由直线与两坐标轴所围成三角形区域. 2.设是连续函数,且满足, 则____________. 3.曲面平行平面的切平面方程是__________. 4.设函数由方程确定,其中具有二阶导数,且,则_____. 二、(5分)求极限,其中是给定的正整数. 三、(15分)设函数连续,,且,为常数,求并讨论在处的连续性. 四、(15分)已知平面区域,为的正向边界,试证: (1);(2) . 五、(10分)已知,,是某二阶常系数线性非齐次微分方程的三个解,试求此微分方程. 六、(10分)设抛物线过原点.当时,,又已知该 抛物线与轴及直线所围图形的面积为.试确定,使此图形绕轴旋转一周而成的旋转体的体积最小. 七、(15分)已知满足, 且, 求函 数项级数之和. 八、(10分)求时, 与等价的无穷大量.

第二届全国大学生数学竞赛预赛试题 一、(25分,每小题5分) (1)设其中求(2)求。 (3)设,求。 (4)设函数有二阶连续导数,,求。 (5)求直线与直线的距离。 二、(15分)设函数在上具有二阶导数,并且 且存在一点,使得,证明:方程在恰有两个实根。 三、(15分)设函数由参数方程所确定,其中具 有二阶导数,曲线与在出相切,求函数。 四、(15分)设证明:(1)当时,级数收敛; (2)当且时,级数发散。 五、(15分)设是过原点、方向为,(其中的直线,均 匀椭球,其中(密度为1)绕旋转。(1)求其转动惯量;(2)求其转动惯量关于方向的最大值和最小值。 六、(15分)设函数具有连续的导数,在围绕原点的任意光滑的简单闭曲线上,曲线积分的值为常数。(1)设为正向闭曲线

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

原创!!全面大学生数学竞赛试题

2011年数学竞赛练习题C_3解答 1. 设数列{}n x 满足: 11 sin (2)sin 11 n n x n n n <<+++, 则1 1lim 1n k n k x n →∞==+∑_______。 11 sin (2)sin 111 n n n x n x n n <<+∴→++解 ; Q 1 1 1 1lim lim lim lim 1111n n k k n k k k n n n n k x x n n x n n n n n ==→∞→∞→∞→∞ =∴=?=?=+++∑∑∑ 2.设曲线()y f x =与sin y x =在原点相切, 则极限lim n ________。 (0)0,(0)1n n f f '===已知有: 2. 设(1n n a b =+, 其中,n n a b 为正整数,lim n n n a b →∞=__ 2224 113 (1) 1)3)(13)3) )()3) ) n n n n n n n C C C C C C =+++ =+++++ 224 41133(1(1)() n n n n n C C C C =++-++ (1=+(1=n n n n n n a b a b a b -所以,若则解得:

lim =n n n n n a b →∞∴= 3. 设()f x 有连续导数且0 () lim 0x f x a x →=≠, 又20 ()()()x F x x t f t dt =-?, 当0x →时()F x '与n x 是同阶无穷小, 则n =________。 2020 ()()()()()x x x F x x t f t dt x f t dt tf t dt =-=-? ?? 20 ()2()()()x F x x f t dt x f x xf x '=+-? 0() lim 0x F x x →'=显然 20 2 02()()() lim x x x f t dt x f x xf x x →+-?考虑: 2()() lim lim ()x x x f t dt f x f x x →→-=+? 2()() lim lim ()x x x f t dt f x f x x →→-=+? 2()() lim lim 0x x x f t dt f x x x →→=-+?0a =-≠ 2n ∴= 5. ()f x ∞设在[1,+)上可导,下列结论成立的是:________。 +lim ()0()x f x f x →∞ '=∞A.若,则在[1,+)上有界;

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

全国大学生数学竞赛试题及答案

河北省大学生数学竞赛试题及答案 一、(本题满分10 分) 求极限))1(21(1 lim 222222--++-+-∞→n n n n n n Λ。 【解】 ))1(21(12 22222--++-+-= n n n n n S n Λ 因 21x -在]1,0[上连续,故dx x ?1 02-1存在,且 dx x ? 1 2 -1=∑-=∞→-1 21 .)(1lim n i n n n i , 所以,= ∞ →n n S lim n dx x n 1lim -11 2∞→-? 4 -1102π ==?dx x 。 二、(本题满分10 分) 请问c b a ,,为何值时下式成立.1sin 1 lim 22 0c t dt t ax x x b x =+-?→ 【解】注意到左边得极限中,无论a 为何值总有分母趋于零,因此要想极限存在,分子必 须为无穷小量,于是可知必有0=b ,当0=b 时使用洛必达法则得到 22 022 01)(cos lim 1sin 1lim x a x x t dt t ax x x x x +-=+-→→?, 由上式可知:当0→x 时,若1≠a ,则此极限存在,且其值为0;若1=a ,则 21)1(cos lim 1sin 1lim 22 220-=+-=+-→→?x x x t dt t ax x x x b x , 综上所述,得到如下结论:;0,0,1==≠c b a 或2,0,1-===c b a 。 三、(本题满分10 分) 计算定积分? += 2 2010tan 1π x dx I 。

【解】 作变换t x -= 2 π ,则 =I 22 20π π = ?dt , 所以,4 π= I 。 四、(本题满分10 分) 求数列}{1n n - 中的最小项。 【解】 因为所给数列是函数x x y 1- =当x 分别取ΛΛ,,,3,2,1n 时的数列。 又)1(ln 21-=--x x y x 且令e x y =?='0, 容易看出:当e x <<0时,0<'y ;当e x >时,0>'y 。 所以,x x y 1-=有唯一极小值e e e y 1)(-=。 而3 3 1 2 132> ? <

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

历届全国大学生数学竞赛预赛试卷

全国大学生数学竞赛预赛试卷(非数学类) 2009年 第一届全国大学生数学竞赛预赛试卷(非数学类) 一、填空题(每小题5分,共20分) 1. 计算()ln(1) d y x y x y ++=??,其中区域D 由直线1=+y x 与两坐标轴所围成三角形区域. 2.设)(x f 是连续函数,且满足22 ()3()d 2f x x f x x =--? ,则()f x =. 3.曲面2 222 x z y =+-平行平面022=-+z y x 的切平面方程是. 4.设函数)(x y y =由方程29ln )(y y f e xe =确定,其中f 具有二阶导数,且 1≠'f ,则=22d d x y . 二、(5分)求极限x e nx x x x n e e e )(lim 20+++→Λ,其中n 是给定的正整数. 三、(15分)设函数)(x f 连续,10()() g x f xt dt =?,且A x x f x =→) (lim 0,A 为常数,求()g x '并讨论)(x g '在0=x 处的连续性. 四、(15分)已知平面区域}0,0|),{(ππ≤≤≤≤=y x y x D ,L 为D 的正向边界,试证: (1)??-=---L x y L x y x ye y xe x ye y xe d d d d sin sin sin sin ; (2)2sin sin 2 5d d π?≥--L y y x ye y xe . 五、(10分)已知x x e xe y 21+=,x x e xe y -+=2,x x x e e xe y --+=23是某二阶常系数线性非齐次微分方程的三个解,试求此微分方程. 六、(10分)设抛物线c bx ax y ln 22++=过原点.当10≤≤x 时,0≥y ,又已知该抛物线与x 轴及直线1=x 所围图形的面积为3 1.试确定 c b a ,,,使此图形绕x 轴旋转一周而成的旋转体的体积V 最小. 七、(15分)已知)(x u n 满足1()()1,2,n x n n u x u x x e n -'=+=L ,且n e u n =)1(,求 函数项级数∑∞ =1 )(n n x u 之和.

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

全国大学生数学竞赛决赛试题(非数学类)

首届全国大学生数学竞赛决赛试卷 (非数学类) 考试形式: 闭卷 考试时间: 150 分钟 满分: 100 分. 一、 计算下列各题(共20分,每小题各5分,要求写出重要步骤). (1) 求极限1 21lim (1)sin n n k k k n n π-→∞=+∑. (2) 计算 2∑其中∑ 为下半球面z =0a >. (3) 现要设计一个容积为V 的一个圆柱体的容器. 已知上下两底的材料费为单位面积a 元,而侧面的材料费为单位面积b 元.试给出最节省的设计方案:即高与上下底的直径之比为何值时所需费用最少? (4) 已知()f x 在11,42?? ???内满足 331()sin cos f x x x '=+,求()f x .

二、(10分)求下列极限 (1) 1lim 1n n n e n →∞????+- ? ? ?????; (2) 111lim 3n n n n n a b c →∞??++ ? ? ???, 其中0,0,0a b c >>>. 三、(10分)设()f x 在1x =点附近有定义,且在1x =点可导, (1)0,(1)2f f '==. 求 220(sin cos )lim tan x f x x x x x →++. 四、(10分) 设()f x 在[0,)+∞上连续,无穷积分0()f x dx ∞?收敛. 求 0 1lim ()y y xf x dx y →+∞?.

五、五、(12分)设函数()f x 在[0,1]上连续,在(0,1)内可微,且 1(0)(1)0,12f f f ??=== ???. 证明:(1) 存在 1,12ξ??∈ ???使得()f ξξ=;(2) 存在(0,)ηξ∈使得()()1f f ηηη'=-+. 六、(14分)设1n >为整数, 20()1...1!2!!n x t t t t F x e dt n -??=++++ ????. 证明: 方程 ()2n F x =在,2n n ?? ???内至少有一个根.

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

历届全国大学生数学竞赛真题

高数竞赛预赛试题(非数学类) 2009年 第一届全国大学生数学竞赛预赛试卷 一、填空题(每小题5分,共20分) 1.计算=--++??y x y x x y y x D d d 1) 1ln()(____________,其中区域D 由直线1=+y x 与两坐标轴所围成三角形区域. 2.设)(x f 是连续函数,且满足? -- =20 22d )(3)(x x f x x f , 则=)(x f ____________. 3.曲面22 22 -+=y x z 平行平面022=-+z y x 的切平面方程是__________. 4.设函数)(x y y =由方程29ln ) (y y f e xe =确定,其中f 具有二阶导数,且1≠'f ,则 =2 2d d x y ________________. 二、(5分)求极限x e nx x x x n e e e )(lim 20+++→ ,其中n 是给定的正整数. 三、(15分)设函数)(x f 连续,?=10d )()(t xt f x g ,且A x x f x =→) (lim 0,A 为常数,求) (x g '并讨论)(x g '在0=x 处的连续性. 四、(15分)已知平面区域}0,0|),{(ππ≤≤≤≤=y x y x D ,L 为D 的正向边界,试证: (1)?? -=---L x y L x y x ye y xe x ye y xe d d d d sin sin sin sin ; (2)2sin sin 2 5 d d π? ≥--L y y x ye y xe . 五、(10分)已知x x e xe y 21+=,x x e xe y -+=2,x x x e e xe y --+=23是某二阶常系数线性非齐次微分方程的三个解,试求此微分方程. 六、(10分)设抛物线c bx ax y ln 22++=过原点.当10≤≤x 时,0≥y ,又已知该抛物线 与x 轴及直线1=x 所围图形的面积为3 1 .试确定c b a ,,,使此图形绕x 轴旋转一周而成的旋转体的体积最小. 七、(15分)已知)(x u n 满足),2,1()()(1 =+='-n e x x u x u x n n n , 且n e u n =)1(, 求函数项级数 ∑∞ =1 )(n n x u 之和. 八、(10分)求- →1x 时, 与∑∞ =0 2 n n x 等价的无穷大量.

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.360docs.net/doc/6d3900537.html,/journal/aam https://www.360docs.net/doc/6d3900537.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/6d3900537.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

相关文档
最新文档