2012研究生数学建模A题

合集下载

2012数学建模A题论文：葡萄酒的评价

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）： A我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：参赛队员(打印并签名) ：1.2.3.指导教师或指导教师组负责人(打印并签名)：日期： 2012年 9月日赛区评阅编号（由赛区组委会评阅前进行编号）：编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国统一编号（由赛区组委会送交全国前编号）：全国评阅编号（由全国组委会评阅前进行编号）：葡萄酒的评价摘要葡萄拥有很高的营养价值，含有多种氨基酸、蛋白质和维生素，而以葡萄为原料的葡萄酒也蕴藏了多种营养物质，而且这些物质都是人体必须补充和吸收的营养品。

目前，已知的葡萄酒中含有的对人体有益的成分大约就有600种。

葡萄酒的营养价值由此也得到了广泛的认可，可以说葡萄酒是一个良好的滋补品。

本文通过对葡萄酒的评价，以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。

对不同的酿酒葡萄进行了分类，并更深入讨论两者的理化指标是否影响葡萄酒质量。

对于本题，我们主要采用SPSS软件对模型进行求解。

针对问题一，首先我们将附件1中数据在Excel中进行处理；其次，我们在SPSS中，采用T检验，分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。

2012年全国数学建模竞赛A题第一问数据综合整理

9.6
0.27
0.516398
第二组
10
9
9
9
8
9
10
9
9
9
91
9.1
0.32
0.567646
酒样品3
第一组
9
10
10
9
8
10
9
10
10
9
94
9.4
0.49
0.699206
第二组
10
9
9
9
8
9
8
9
9
9
89
8.9
0.32
0.567646
酒样品4
第一组
7
9
9
8
7
8
9
8
10
9
84
8.4
0.93
0.966092
0.40
0.632456
酒样品16
第一组
9
10
10
9
8
8
10
9
9
9
91
9.1
0.54
0.737865
第二组
9
9
9
9
9
8
8
9
9
9
88
8.8
0.18
0.421637
酒样品17
第一组
8
10
10
8
11
9
7
10
10
9
92
9.2
1.51
1.229273
第二组
9
9
9
9
9
8
10
9
9
9

2012年数学建模A题资料

（一）葡萄酒观察方法1 酒液总体观察1.1 澄清度观察衡量葡萄酒澄清程度的指标有透明度、浑浊度等，与之相关的指标还有是否光亮、有无沉淀等。

优良的葡萄酒必须澄清、透明(色深的红葡萄酒例外)、光亮。

a.澄清：是衡量葡萄酒外观质量的重要指标。

澄清表示的是葡萄酒明净清澈、不含悬浮物。

通常情况下，澄清的葡萄酒也具有光泽。

b.透明度：表示的是葡萄酒允许可见光透过的程度。

红葡萄酒如果颜色很深，则澄清的葡萄酒也不一定透明。

c.浑浊度：表示的是葡萄酒的浑浊程度，浑浊的葡萄酒含有悬浮物。

葡萄酒的浑浊往往是由微生物病害、酶破败或金属破败引起的。

浑浊的葡萄酒其口感质量也差。

d.沉淀：指的是从葡萄酒中析出的固体物质。

沉淀是由于在陈酿过程中，葡萄酒构成成份的溶解度变小引起的，一般不会影响葡萄酒的质量。

1.2 颜色观察葡萄酒的颜色受酒龄影响，新红葡萄酒由于源于果皮花色素苷的作用，通常颜色鲜艳，为紫红色和宝石红色，带紫色色调；在葡萄酒的成熟过程中，丹宁逐渐与游离花色素苷等结合而使成年葡萄酒带有黄色色调。

瓦红或砖红色为成年红葡萄酒的常有的颜色，而棕红色则为在瓶内陈酿10年以上的红葡萄酒的颜色。

因此，可根据颜色，判断葡萄酒的成熟状况。

葡萄酒的颜色和口感的变化存在着平行性，颜色和口感之间必须相互协调平衡。

颜色的深浅反应葡萄酒的结构、丰满度以及尾味和余味。

如在红葡萄酒中，颜色的深浅与丹宁的含量往往正相关。

如果红葡萄酒颜色深而浓，几乎处于半透明状态，多数情况下它必然醇厚、丰满、丹宁感强。

相反，色浅的葡萄酒，则味淡、味短。

当然，如果较柔和，具醇香，仍不失为好酒。

例如瓦红色的红葡萄酒，必须与浓郁的醇香和柔顺的口感同时存在，否则表明该酒是人工催熟条件下陈酿而未能表现出最佳感官质量。

带紫色的新葡萄酒往往口味平淡、瘦弱、尖酸、粗糙；褐色过重的成年葡萄酒，氧化过重、老化。

1.3 浑浊度观察观察葡萄酒有无下列情况：略失光，失光，欠透明，微混浊，极浑浊，雾状混浊，乳状混浊；1.4 沉淀观察观察葡萄酒有无下列情况：有无沉淀，沉淀类型：纤维状沉淀，颗粒状沉淀，絮状沉淀，酒石结晶，片状沉淀，块状沉淀。

2012年数学建模A题优秀论文

（4）利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素，将附件 3 中 4 个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析，比较前后两者结果中由样品中的芳香指标导致的影响差异来确定不能只用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量还需要结合感官指标，感官指标是评价葡萄酒质量的最终及最有效的指标。
11.
2 T
：为全酒样总得分的方差。
13.Xki:葡萄的理化指标变量
10.
2 i
：为第
i
种酒样品得分的方差
12：：为随机误差项。
14.Βk: 未知参数
15. ：解释变量估计值
16. ：实际观测值
17. ：变量
18. ：残差
五、模型的建立与求解
5.1 问题一模型的建立和求解 5.1.1.评价结果的显著性差异分析
4
行结果：
对1
一红 - 二红
对2
一白 - 二白
t 2.390 -2.127
n
Sig.(双侧)
26
.024
26
.043
结论分析：本题中的自由度 n=27-1=26， t (26) 2.0555，即知拒绝域为 2
t 2.0555，由上表可知两组评酒师对红、白葡萄酒的评价结果的检验值
t1 2.390 2.0555, t2 2.127 2.0555,因为两个检验值均在拒绝域，所以两组评酒师
66.3
68.4
75.5
样品 7
71.5
65.3
77.5
74.2
样品 8
72.3
66
71.4
72.3
样品 9
81.5

2012 数学建模A题 3-2 相关系数

27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
多酚氧化酶活力褐变度 DPPH自由基总酚单宁葡萄总黄酮白藜芦醇黄酮醇总糖还原糖可溶性固形物 PH值可滴定酸固酸比干物质含量果穗质量百粒质量果梗比出汁率果皮质量 L 果皮颜色红绿果皮颜色黄蓝
27 27 27 27 27 27 27 27 27Байду номын сангаас27 27 27 27 27 27 27 27 27 27 27 27 27 27
褐变度 DPPH自由基 0.445 0.753 -0.153 0.105 0.198 0.749 0.071 -0.003 0.696 0.654 -0.063 0.275 0.644 0.052 0.389 -0.004 0.556 0.095 1.000 0.295 0.295 1.000 0.361 0.857 0.473 0.645 0.236 0.836 0.025 0.211 0.421 0.428 -0.066 -0.102 -0.069 -0.287 -0.019 -0.107 -0.241 0.404 -0.285 -0.343 0.364 0.171 0.085 -0.090 -0.268 0.016 -0.393 -0.136 0.498 0.501 0.215 0.456 -0.048 -0.042 -0.201 -0.253 -0.233 -0.253 -0.139 -0.220 0.010 0.000 0.223 0.301 0.161 0.000

2012年数学建模A题

葡萄酒质量评定模型摘要葡萄酒质量的评定长久以来都是采用聘请品酒员，通过品酒员对葡萄酒各项指标打分求和来确定葡萄酒的质量。

葡萄酒的价格因品酒员评分高低的不同有显著的差别。

然而在这样的评定方式中人的主观因素对酒质量的评定占主导地位，葡萄酒质量的评定结果存在较大的不确定性。

随着人们对葡萄酒消费的增加及高质量化的追求，建立合理、规范、客观的葡萄酒质量评定模型显得尤为重要。

根据题中给出的相关数据，通过解决以下问题建立葡萄酒质量评定模型。

对于问题一：首先，将题目附录1中的数据经Excel处理，得到每组评酒员对每种酒样品的总分。

然后，对每一种酒样品运用两配对样本的非参数检验(符号秩和检验)对数据进行显著性差异分析，运用MATLAB软件比较各酒样品的两组数据发现两组结果差异显著。

其次，通过Excel求出每一种酒的品酒员所打总分的方差，得到两组品酒员分别对两类葡萄酒的方差走势图(见图1.1、1.2)，根据总体方差最小，方差波动较小，确定第二组品酒员的评分更可信。

最后，采用SPSS软件作进一步检验，结果相同即模型合理。

对于问题二，选取一级理化指标作为酿酒葡萄分级参考，对理化指标运用主成分分析法降维，通过MATLAB计算得到红葡萄的主成分有8个，白葡萄的主成分有11个。

综合评分得到的葡萄酒质量影响，红葡萄的影响因素有9个，白葡萄的影响因素有12个。

然后，利用折衷型模糊决策模型，考虑到由主成分分析方法得到的酿酒葡萄的的主成分值在反应酿酒葡萄质量好坏问题上会有一定的偏差，利用三角模糊的表达方式对主成分指标值进行表示，分别将红、白两类酿酒葡萄按隶属度大小排序，在运用聚类分析的方法，利用SPSS软件将葡萄划分为五个等级(见表格2.1)。

对于问题三，数据的庞杂是解决该问题的难点。

我们运用问题二中的主成分分析方法将理化指标转化为几个主成分，并运用MATLAB编程求出具体的主成分数值，然后建立线性回归模型，求解出酿酒葡萄与葡萄酒理化指标主成分之间的相关关系，从而反映出酿酒葡萄与葡萄酒理化指标之间的联系。

2012年高教杯数学建模竞赛a题

2012年高教杯数学建模竞赛A题文章包括以下内容：一、引言1. 对数学建模竞赛的介绍2. 2012年高教杯数学建模竞赛的背景3. A题的重要性和难度二、问题描述1. A题的具体内容和要求2. 问题背景和实际应用三、问题分析1. 对A题中涉及的数学知识和模型进行分析a. 需要运用的数学工具和方法b. 相关参数和变量的定义和意义c. 问题中存在的约束条件和假设2. 对A题中涉及的实际问题进行分析a. 现实场景的相关情况和特点b. 问题的实际意义和应用价值c. 对问题的可行性和局限性进行分析四、问题求解1. 根据问题分析确定相应的数学模型a. 求解问题所需建立的数学模型b. 模型的简化和推导过程2. 运用已知的数学方法和工具解决问题a. 使用数学软件进行模拟和计算b. 运用数学定理和理论进行证明和推演五、结果分析1. 求解结果的展示和分析2. 结果的合理性和可靠性分析3. 结果对实际问题的指导意义和应用价值六、总结与展望1. 对A题求解过程的总结和反思2. 对实际问题的展望和未来研究方向3. 对数学建模竞赛的意义和作用进行总结稿件要求：1. 语言流畅、准确，表达清晰、精炼，逻辑性强2. 论据充分，论证严谨，具有说服力3. 不得抄袭，不得侵犯他人著作权4. 投递稿件时请注明真实尊称和通信方式，以便我们及时与您取得联系注：以上为文章大纲及要求，具体内容请根据实际情况进行撰写。

2012年高教杯数学建模竞赛A题是一个具有挑战性和复杂性的问题，需要参赛者结合数学理论和实际问题进行分析和求解。

在本文中，我们将对A题进行深入的探讨，从问题描述到问题分析再到问题求解，最终得出结果分析和总结展望，全面展示对A题的理解和解决方案。

让我们来看A题的具体内容和要求。

A题涉及一个复杂的实际问题，需要参赛者运用数学工具和方法对其进行建模和求解。

这个问题背景和实际应用是一个现实场景中的情况，问题的实际意义和应用价值是非常明显的。

A题的重要性和难度也就显而易见了。

2012全国数学建模A题分析

2012全国数学建模竞赛A题详细分析1.问题重述在设计太阳能小屋时，需在建筑物外表面（屋顶及外墙）铺设光伏电池，光伏阵列件所产生的直流电需要经过逆变器转换成220V交流电才能供家庭使用，并将剩余电量输入电网。

不同种类的光伏电池每峰瓦的价格差别很大，且每峰瓦的实际发电效率或发电量还受诸多因素的影响。

因此，在太阳能小屋的设计中，研究光伏电池在小屋外表面的优化铺设是很重要的问题。

对下列三个问题，分别给出小屋外表面光伏电池的铺设方案，使小屋的全年太阳能光伏发电总量尽可能大，而单位发电量的费用尽可能小，并计算出小屋光伏电池35年寿命期内的发电总量、经济效益（当前民用电价按0.5元/kWh计算）及投资的回收年限。

在同一表面采用两种或两种以上类型的光伏阵列件时，同一型号的电池板可串联，而不同型号的电池板不可串联。

在不同表面上，即使是相同型号的电池也不能进行串、并联连接。

应注意分组连接方式及逆变器的选配。

问题1：请根据山西省大同市的气象数据，仅考虑贴附安装方式，选定光伏阵列件，对小屋（见附件2）的部分外表面进行铺设，并根据电池组件分组数量和容量，选配相应的逆变器的容量和数量。

问题2：电池板的朝向与倾角均会影响到光伏电池的工作效率，请选择架空方式安装光伏电池，重新考虑问题1。

问题3：根据附件7给出的小屋建筑要求，请为大同市重新设计一个小屋，要求画出小屋的外形图，并对所设计小屋的外表面优化铺设光伏电池，给出铺设及分组连接方式，选配逆变器，计算相应结果。

2．问题的分析2．1 问题一的分析问题一中要求根据山西省大同市的气象数据，选定光伏阵列件对小屋的部分外表面以贴附安装方式进行铺设，使小屋的全年太阳能光伏发电总量尽可能大，而单位发电量的费用尽可能小，最后给出铺设方案，包括电池组件分组数量和容量，以及相应的逆变器的容量和数量。

首先，附表中提供的大同地区的光照数据并未直接告知每个面获得的光照总量，需要根据光散射和直射的关系，建立光照模型，确定每个面的总的光照强度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

摘要..................................................................................................................... - 1 -一、问题的重述....................................................................................................... - 2 -二、问题分析与建模思路....................................................................................... - 2 -三、基本假设与符号说明....................................................................................... - 3 -3.1 基本假设 ........................................................................................................ - 3 -3.2 符号说明 ........................................................................................................ - 4 -四、模型的建立与求解........................................................................................... - 4 -4.1功率谱和信噪比的计算方法 ............................................................................. - 4 -4.1.1 基于Voss映射求解功率谱和信噪比方法................................................ - 4 -4.1.2 基于Z-curve映射求解功率谱与信噪比方法 ........................................... - 7 -4.1.3 基于实数映射求解功率谱与信噪比方法 ............................................... - 10 -4.2 对不同物种类型基因的阈值确定 ................................................................... - 11 -4.2.1 人类基因序列阈值的确定 .................................................................... - 11 -4.2.2鼠类基因序列阈值的确定................................................................... - 13 -4.3 基因识别算法的实现..................................................................................... - 16 -4.4 延展性研究................................................................................................... - 20 -五、模型评价与改进............................................................................................. - 21 -六、参考文献......................................................................................................... - 22 -七、附录................................................................................................................. - 23 -参赛密码（由组委会填写）第九届“华为杯”全国研究生数学建模竞赛题目基因识别问题及其算法的研究摘要在生物学、医学、药学等诸多方面，DNA的研究都具有重要的理论意义和实际价值。

在面对大量、复杂的基因序列数据时，如何更好更快捷地获取准确的基因信息，如何能够在众多的基因序列中确定功率谱和信噪比，如何能够对每类基因快速地得到其阈值确定方法，如何快速实现基因识别算法，是摆在我们面前的一个具有研究意义的实际课题。

我们运用计算机MATLAB软件，分析结果如下：对于问题一，我们根据文献中给出的Voss映射，用快速傅里叶变换方法来实现功率谱和信噪比的求解。

本文利用附件中的genes6中的数据，运行第1条DNA片段的基因数据，通过编程分析，得到功率谱和信噪比r =3.4474。

在Z-curve 映射下我们得到功率谱和信噪比r = 4.5965，并发现二者呈现一定的常数比例关系。

在实数映射下，我们得到功率谱和信噪比为r =3.1186。

对于问题二，假定运行的数据拥有足够的长度。

首先根据快速傅里叶变换方法，运行相关程序得到在不同基因片段时能够得到的信噪比，然后将得到的信噪比进行数据分析与整合；其次，把外显子和内含子的功率谱都运行出来；最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类，找出2者的信噪比并确定以何种信噪比作为标准。

我们预测到人类的基因序列组合信噪比为R=1.5861，鼠类的基因序列组合信噪比为R=1.7503。

对于问题三，我们假定3-周期性具有一定的普遍性。

采用相邻峰值频谱差异法确定外显子的起点和终点。

首先，画出genes6中的DNA序列功率谱图像；其次，截取总片断中呈3的倍数的小片段，逐步测验，得到不同的频谱图；第三，在基因片段N/3和2N/3处取峰值；最后，根据3-周期性，得到基因片段的两处端点。

对于问题四，我们运用的是频谱和信噪比方法探讨基因突变。

首先利用genes200数据，得到信噪比；其次做描述性统计分析，得到基因序列信噪比折线图和描述统计表；最后预测到当R值突然高于周围值时，基因失去DNA片段的对称性，这样的片段就会存在基因突变。

创新点：1. 利用快速傅里叶变换代替傅里叶变换，并用程序运行，大大提高了基因功率谱和信噪比的运算速度，对于今后研究具有现实性意义和参考价值。

2. 运用信噪比的取值探讨基因识别方法。

关键词：Voss映射Z-curve 映射MATLAB软件SPSS软件快速傅里叶变换一、问题的重述DNA是生物遗传信息的载体，DNA分子是一种长链聚合物，DNA序列由腺嘌呤（Adenine, A），鸟嘌呤（Guanine, G），胞嘧啶（Cytosine, C），胸腺嘧啶（Thymine,T）这四种核苷酸（nucl eotide）符号按一定的顺序连接而成。

其中带有遗传讯息的DNA片段称为基因（Genes）。

其他的DNA序列片段，有些直接以自身构造发挥作用，有些则参与调控遗传讯息的表现。

如何利用DNA这些重要的信息帮助人们在农业、工业等行业领域内实现新的突破是我们面临的一个新的实际课题。

我们就当前国内外的研究现状与成果的相关情况，建立数学模型分析研究下面的问题：问题一：（1）基于Voss映射，探求功率谱和信噪比的计算方法。

（2）基于Z-curve映射，求解频谱与信噪比并对Z-curve映射和Voss映射下的频谱和信噪比进行比较。

（3）基于实数映射，求解功率谱与信噪比的计算方法。

问题二：对8个人类和92个鼠类的基因序列进行分析，找到每类基因研究其阈值的确定方法和阈值结果，并对所得到的结果进行评价。

问题三：对设计好的基因识别算法的准确率做出适当评估，并对genes6的编码区域的预测。

问题四：利用频谱或信噪比方法去发现基因编码序列可能存在的突变。

二、问题分析与建模思路问题一：（1）根据Voss映射，采用傅里叶方法探求功率谱和信噪比的快速计算办法。

本文利用附件中的genes6中的数据，运行给定的任意一段基因数据，在给定的一段DNA序列片段为S = ATCGTACTG，则所生成的四个0-1序列分别为：{[]}A u n ：{1,0,0,0,0,1,0,0,0}； {[]}G u n ：{0,0,0,1,0,0,0,0,1}；{[]}C u n ：{0,0,1,0,0,0,1,0,0}； {[]}T u n ：{0,1,0,0,1,0,0,1,0}。

这样产生的四个数字序列又称为DNA 序列的指示序列，并通过利用MATLAB 软件对Voss 映射进行编程分析（见附件1），得到功率谱和信噪比的快速计算方法。

（2）根据附件1中的Z-curve 映射来探求频谱与信噪比的快速计算方法。

通过运行程序得到Z-curve 映射下频谱和信噪比的值，然后采用100个组进行对比分析，发现在Voss 映射和Z-curve 映射下得到的信噪比之间呈现一定的倍数比例关系。

（3）根据已编好的程序在实数映射下，如：0,1,2,3A C G T →→→→，采取快速傅里叶方法得到功率谱与信噪比的快速计算方法。

问题二：假定运行的数据拥有足够的长度。

从带有编码外显因子信息的8个人和92个鼠类中找出具有代表性的基因序列，并对每类基因研究其阈值确定方法，适当地评论其有效性。

我们预测到人类的基因序列组合信噪比为R=1.5861，鼠类的基因序列组合信噪比为R=1.7503。

问题三：我们假定3-周期性具有一定的普遍性。

采用相邻峰值频谱差异法确定外显子的起点和终点。

首先，画出genes6中的DNA 序列功率谱图像；其次，截取总片断中呈3的倍数的小片段，逐步测验，得到不同的频谱图；第三，在基因片段N/3和2N/3处取峰值；最后，根据3-周期性，得到基因片段的两处端点。