国赛数学建模A题优秀论文
2021年国赛数学建模A题优秀论文

2021年国赛数学建模A题优秀论文本文基于FAST的工作原理,通过机理分析、坐标変换、非线性最小二乘优化等方法,建立了反射面板谟节优化模型・并利用BFGS 算法、蒙特卡洛积分算法等算法,对不同条件下反射光线吸收比率进行了研究。
问题一中,首先基于固定的仰角观测目标S、圆心C和焦点P・利用旋转抛物面的中心对祢性,选取焦距作为自由度控制变量,构建在极坐标系下开口竖直向上的二维抛物线方程.得到不同偏转角度下原点到抛物线的距离.进而导出三维下的旋转掀物面方程。
其次,以焦距为决策变量,将口径300米的拋物面作为积分域•将理想抛物面到原点的距离与基准球面半径差值平方作为被积函数进行积分作为最小化目标函数.建立了确定理想抛物面的优化模型。
最后,使用二分法求得目标函数导函数在定义区间上的零点.得到理想抛物面焦距的精确值为280.854,误差平方积分的最小偵为10.112o此时对应理想抛物面的解析式为z=Q+#)2/561.708300.841,问题二中,首先利用球坐标下不同轴线方向抛物面的旋转不变性.在原坐标系和问题一的坐标系之间建立了双向可逆的变换关系.得到了不同方位角下理想抛物面到原点的距离。
其次.以主索节点的工作坐标和促动器的伸缩长度为决策变量:.以积分域覆盖的主索节点到原点的距离与理想抛物面到原点的距厲之差的平方和为最小化目标函数.分别考虑下拉索长度固定、相邻节点的距离变化幅度不超过0.07%.促动器的伸缩范围在±0.6m为约束条件.建立反射面板调节优化模型。
最后,使用拉格朗日乗子法和BFGS算法进行求解.得到误差平方在抛物面口径上的积分的最小值为5.1353X109.理想抛物线的顶点坐标为(-49.392,-36.943,-294.450).调节后反射面300米口径内的主索节点编号、位置坐标、各促动器的伸缩量等结果见文件result.xlsxe问题三中,首先通过旋转变换.将反肘问题的倾斜入射光线转化为垂直入射光线。
数学建模全国赛07年A题一等奖论文

关于中国人口增长趋势的研究【摘要】本文从中国的实际情况和人口增长的特点出发,针对中国未来人口的老龄化、出生人口性别比以及乡村人口城镇化等,提出了Logistic、灰色预测、动态模拟等方法进行建模预测。
首先,本文建立了Logistic阻滞增长模型,在最简单的假设下,依照中国人口的历史数据,运用线形最小二乘法对其进行拟合,对2007至2020年的人口数目进行了预测,得出在2015年时,中国人口有13.59亿。
在此模型中,由于并没有考虑人口的年龄、出生人数男女比例等因素,只是粗略的进行了预测,所以只对中短期人口做了预测,理论上很好,实用性不强,有一定的局限性。
然后,为了减少人口的出生和死亡这些随机事件对预测的影响,本文建立了GM(1,1) 灰色预测模型,对2007至2050年的人口数目进行了预测,同时还用1990至2005年的人口数据对模型进行了误差检验,结果表明,此模型的精度较高,适合中长期的预测,得出2030年时,中国人口有14.135亿。
与阻滞增长模型相同,本模型也没有考虑年龄一类的因素,只是做出了人口总数的预测,没有进一步深入。
为了对人口结构、男女比例、人口老龄化等作深入研究,本文利用动态模拟的方法建立模型三,并对数据作了如下处理:取平均消除异常值、对死亡率拟合、求出2001年市镇乡男女各年龄人口数目、城镇化水平拟合。
在此基础上,预测出人口的峰值,适婚年龄的男女数量的差值,人口老龄化程度,城镇化水平,人口抚养比以及我国“人口红利”时期。
在模型求解的过程中,还对政府部门提出了一些有针对性的建议。
此模型可以对未来人口做出细致的预测,但是需要处理的数据量较大,并且对初始数据的准确性要求较高。
接着,我们对对模型三进行了改进,考虑人为因素的作用,加入控制因子,使得所预测的结果更具有实际意义。
在灵敏度分析中,首先针对死亡率发展因子θ进行了灵敏度分析,发现人口数量对于θ的灵敏度并不高,然后对男女出生比例进行灵敏度分析得出其灵敏度系数为0.8850,最后对妇女生育率进行了灵敏度分析,发现在生育率在由低到高的变化过程中,其灵敏度在不断增大。
全国大学生数学建模大赛国家一等奖论文A题

=
− − ( − 1)′
, = 1, 2, · · ·, 210
当逐渐增大,锚链受到的竖直向下方向的合力与支持力之差先逐渐接近于0,
再等于0,直至小于0。当合力小于0时,锚链以海床接触,此时海床提供向上的支持
力,其大小与′ 相等。因此可将小于0 的值都作零处理,故锚链接触海床时,
对于问题二,首先考虑第一个子问题,将风速36/直接代入问题一的模型中,
得出此条件下的吃水深度为0.723,各钢管倾斜角度(度)依次为8.960、9.014、9.068
、9.123,钢桶倾斜角(度)为9.179,锚链链接处的切线方向与海床的夹角(度)为18.414,
游动区域半径为18.80。发现此条件下,水声通讯系统设备的工作效果较差,且锚被
计与应用对海上科学发展有重要意义。
1.2 问题的提出
已知某近浅海传输节点(如图1所示),将浮标视作底面直径2为、高为2、质量
为1000的圆柱体,锚的质量为600,钢管共4节,每节长度为1,直径为50,
每节钢管的质量为10。水声通讯系统安装在一个长为1、外径为30的密封圆
柱形钢桶内,设备和钢桶总质量为100。
Step1: 遍历求解
令吃水深度ℎ的初始值为0.1,以0.0005为单位逐步增加至2。( 浮标高度为2,
完全浸没时吃水深度ℎ则为2 ),记录对应的数据,选取水下物体竖直方向高度和
与海域水深最接近的组别,进一步进行计算,结果如下表所示(具体程序见附录):
表 1: 不同风速的相关结果表
以风速24/的情况为例,绘制游动区域图:
题意的变量临界值。以水深16、系统各部分递推关系式和钢桶与竖直方向夹角小
于5°为约束条件,将多目标优化转化为单目标优化。通过调节决策变量中锚链的型
全国大学生数学建模优秀论文(A题) 国家一等奖

地下储油罐的变位分析与罐容表标定摘要加油站地下储油罐在使用一段时间后,由于地基变形等原因会发生纵向倾斜及横向偏转,导致与之配套的“油位计量管理系统”受到影响,必须重新标定罐容表。
本文即针对储油罐的变位时罐容表标定的问题建立了相应的数学模型。
首先从简单的小椭圆型储油罐入手,研究变位对罐容表的影响。
在无变位、纵向变位的情况下分别建立空间直角坐标系,在忽略罐壁厚度等细微影响下,运用积分的方法求出储油量和测量油位高度的关系。
将计算结果与实际测量数据在同一个坐标系中作图,经计算得误差均保持在3.5%以内。
纵向变位中,要分三种情况来进行求解,然后将三段的结果综合在一起与变位前作比较,可以得到变位对罐容表的影响。
通过计算,具体列表给出了罐体变位后油位高度间隔为1cm 的罐容表标定值。
进一步考虑实际储油罐,两端为球冠体顶。
把储油罐分成中间的圆柱体和两边的球冠体分别求解。
中间的圆柱体求解类似于第一问,要分为三种情况。
在计算球冠内储油量时为简化计算,将其内油面看做垂直于圆柱底面。
根据几何关系,可以得到如下几个变量之间的关系:测量的油位高度0h 实际的油位高度h 计算体积所需的高度H于是得到罐内储油量与油位高度及变位参数(纵向倾斜角度α和横向偏转角度β )之间的一般关系。
再利用附表2中的数据列方程组寻找α与β最准确的取值。
αβ一、问题重述通常加油站都有若干个储存燃油的地下储油罐,并且一般都有与之配套的“油位计量管理系统”,采用流量计和油位计来测量进/出油量与罐内油位高度等数据,通过预先标定的罐容表(即罐内油位高度与储油量的对应关系)进行实时计算,以得到罐内油位高度和储油量的变化情况。
许多储油罐在使用一段时间后,由于地基变形等原因,使罐体的位置会发生纵向倾斜和横向偏转等变化(以下称为变位),从而导致罐容表发生改变。
按照有关规定,需要定期对罐容表进行重新标定。
题目给出了一种典型的储油罐尺寸及形状示意图,其主体为圆柱体,两端为球冠体。
2010年全国大学生数学建模优秀论文(A题)

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员 (打印并签名) :1.2.3.指导教师或指导教师组负责人 (打印并签名):日期: 2010 年 9 月 13 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):地下储油罐的变位分析与罐容表标定摘要加油站地下储油罐在使用一段时间后,由于地基变形等原因会发生纵向倾斜及横向偏转,导致与之配套的“油位计量管理系统”受到影响,必须重新标定罐容表。
本文即针对储油罐的变位时罐容表标定的问题建立了相应的数学模型。
首先从简单的小椭圆型储油罐入手,研究变位对罐容表的影响。
在无变位、纵向变位的情况下分别建立空间直角坐标系,在忽略罐壁厚度等细微影响下,运用积分的方法求出储油量和测量油位高度的关系。
将计算结果与实际测量数据在同一个坐标系中作图,经计算得误差均保持在3.5%以内。
纵向变位中,要分三种情况来进行求解,然后将三段的结果综合在一起与变位前作比较,可以得到变位对罐容表的影响。
通过计算,具体列表给出了罐体变位后油位高度间隔为1cm 的罐容表标定值。
进一步考虑实际储油罐,两端为球冠体顶。
数模国赛2017A题原创优秀论文

三、模型假设1.假设CT光源的旋转中心在探测器的中垂线上。
2.假设X光不会发生衍射等其他影响吸收强度的现象。
四、符号说明五、模型建立与求解1.问题一1.1.建立坐标系椭圆方程较为复杂,为方便分析,选择在椭圆中心建立直角坐标系,可得模板椭圆和圆的方程为:1.2. 增益的确定1.2.1 的模型查阅资料可知X光吸收强度与其穿过的介质长度和密度有关,令模板的密度函数为,可得由于椭圆和圆模板均为均匀介质,可认为为常数,可得可知X光吸收强度和其穿过的介质长度呈正比,令增益,即可得1.2.2 的计算选取中非0数据最多的六列数据,可以有效减小系统误差。
取每一列数据数值最大的几个值,其表示椭圆短轴和圆直径吸收衰减后的X射线能量经增益处理的量值,取六个方向平均值,对应为38;同理选取中非0数据最少的六列数据,此时探测器位于平行于x 轴的位置,两段不为0 数据中的最大值分别表示椭圆长半轴和圆直径吸收衰减后的射线能量增益后的量值,取三个方向平均值分别得,对应的,为80 和8。
对这三组数据用excel进行最小二乘法拟合,得到μ=1.7713。
过程如图所示:1.3 探测器间距离确定通过附件2,可知中每一列非0数据的个数,即为X光源截得相应弦长,对应的探测器的个数。
则当探测器平行于y轴时,探测器的个数最多;平行于x轴时,探测器的个数最少。
将附件2数据,用Matlab可视化,如图可确定在,有最少个数探测器;,有最多个数探测器。
得到当时,之间,有个探测器;当时,之间,有个探测器。
最终可算出取均值得1.4 旋转中心的确定当时,设第行, 使得取到最大值;当时,设第行, 使得取到最大值,。
显然当时,其X射线路径通过原点。
其截得模板的长度分别为椭圆长轴和短轴。
有1.3图像可知:将在这两个位置将椭圆中心即坐标系原点与旋转中心之间的探测器单元数目差值分别确定,找到模板和探测器系统的相对位置,代入d 值,分别求得纵坐标和横坐标。
则1.5 180次旋转角度的确定1.5.1 180次旋转角度的模型在发射系统,绕(,)(-9.2233,6.0182)旋转过程中,可用表示出发射系统所对应的直线的方程该直线截的模板长度之和有3种情形。
全国数学建模大赛A题获奖论文

全国数学建模大赛A题获奖论文城市表层土壤重金属污染分析摘要本文旨在对城市土壤地质环境的重金属污染状况进行分析,建立模型对金属污染物的分布特点、污染程度、传播特征以及污染源的确定进行有效的描述、评价和定位。
对于重金属空间分布问题,首先基于克里金插值法,应用Surfer 8软件对各数据点的分布情况进行模拟,得到了直观的重金属污染空间分布图形;随后,分别用内梅罗综合污染指数以及模糊评价标准和模型对城区内不同区域重金属的污染程度进行了评判。
对于金属污染的主要原因分析问题,基于因子分析法、问题一的结果和对各个金属污染物的来源分析等因素,判断出金属污染的主要原因有:工业生产、汽车尾气排放、石油加工并推测该区域是镍矿富集区。
随后讨论了污染源之间的相互关系和不同金属的污染贡献率。
针对污染源位置确定问题,我们建立了两个模型:模型一以流程图的形式出现,基于污染传播的一般规律建立模型,求取污染源范围,模型作用更倾向于确定污染源的位置;模型二基于最小二乘法原理,建立了拟合二次曲面方程,在有效确定污染源的同时也反映了其传播特征,模型更加清楚,理论性也更强。
在研究城市地质环境的演变模式问题中,我们对针对污染源位置确定问题所建模型的优缺点进行了评价,同时建立了考虑了时间,地域环境和传播媒介的污染物传播模型,从而反映了地质的演变。
综上所述,本文模型的特点是从简单的模型建立起,强更准确的数学模型发展,逐步达到目标期望。
关键词:重金属污染,克里金插值最小二乘法因子分析流程图一、问题重述问题背景随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。
对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。
评价和研究城市土壤重金属污染程度,讨论土壤中重金属的空间分布,研究城市土壤重金属污染特征、污染来源以及在环境中迁移、转化机理,并对城市环境污染治理和城市进一步的发展规划提出科学建议,不仅有利于城市生态环境良性发展,有利于人类与自然和谐,也有利于人类社会健康和城市可持续发展[1]。
国赛数学建模A题优秀论文之欧阳法创编

葡萄酒的评价模型海军航空工程学院(烟台) 史成巍许志鹏王鑫指导教师司守奎专家点评:本文格式基本规范,表达较清晰。
解决问题一方法适当,结论正确;问题二以相关系数筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,进行聚类分析,思路简明,结论较合理。
问题三进行理化指标的相关性分析,切入准确,但对结果的说明不够充分。
不足之处是在问题二到问题四中没有充分考虑芳香类物质的使用,问题四中对如何判定“葡萄和葡萄酒的理化指标是否能用来评价葡萄酒”时方法略有不妥,导致结论不当。
点评人:济南大学数学科学学院许振宇副教授摘要:本文主要针对葡萄酒的评价问题建立了相关数学模型。
在对两组评酒员的评价是否存在显著性差异的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
在对酿酒葡萄进行分级的问题中,首先以相关系数衡量葡萄理化指标与葡萄酒质量的相似性程度,然2021.03.09 欧阳法创编后筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,利用筛选出的评价指标对酿酒葡萄进行聚类分析,将红葡萄和白葡萄均分成了四类。
最后以每类中对应葡萄酒质量评分的均值作为该类葡萄的分数,从而定出四类的级别,以对应国家葡萄酒的四级分类标准。
在分析酿酒葡萄与葡萄酒的理化指标间的联系问题中,本文采用偏最小二乘回归分析法对指标间的联系进行了分析计算,发现葡萄酒中的某些理化指标与葡萄的某些理化指标存在较强的相关性,比如白葡萄中的总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇的影响较大。
在判断葡萄与葡萄酒的理化指标与葡萄酒的质量间关系的问题中,首先对葡萄和葡萄酒的理化指标与葡萄酒的质量进行了相关性分析,发现某些理化指标与葡萄酒的质量相关性很大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
葡萄酒的评价模型之樊仲川亿创作海军航空工程学院(烟台) 史成巍许志鹏王鑫指导教师司守奎专家点评:本文格式基本规范,表达较清晰。
解决问题一方法适当,结论正确;问题二以相关系数筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,进行聚类分析,思路简明,结论较合理。
问题三进行理化指标的相关性分析,切入准确,但对结果的说明不敷充分。
缺乏之处是在问题二到问题四中没有充分考虑芳香类物质的使用,问题四中对如何判定“葡萄和葡萄酒的理化指标是否能用来评价葡萄酒”时方法略有不当,导致结论不当。
点评人:济南大学数学科学学院许振宇副教授摘要:本文主要针对葡萄酒的评价问题建立了相关数学模型。
在对两组评酒员的评价是否存在显著性差别的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差别,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
在对酿酒葡萄进行分级的问题中,首先以相关系数衡量葡萄理化指标与葡萄酒质量的相似性程度,然后筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,利用筛选出的评价指标对酿酒葡萄进行聚类分析,将红葡萄和白葡萄均分成了四类。
最后以每类中对应葡萄酒质量评分的均值作为该类葡萄的分数,从而定出四类的级别,以对应国家葡萄酒的四级分类尺度。
在分析酿酒葡萄与葡萄酒的理化指标间的联系问题中,本文采取偏最小二乘回归分析法对指标间的联系进行了分析计算,发现葡萄酒中的某些理化指标与葡萄的某些理化指标存在较强的相关性,比方白葡萄中的总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇的影响较大。
在判断葡萄与葡萄酒的理化指标与葡萄酒的质量间关系的问题中,首先对葡萄和葡萄酒的理化指标与葡萄酒的质量进行了相关性分析,发现某些理化指标与葡萄酒的质量相关性很大。
然后筛选出这些相关性较大的指标,用偏最小二乘回归分析法进一步定量分析了这些指标与葡萄酒质量的关系,建立了葡萄酒质量的评价模型,经过检验,利用建立的评价模型对葡萄酒评价结果与专家组的评价结果误差普遍小于5%,这同时论证了用葡萄和葡萄酒的理化指标对葡萄酒进行评价是基本可行的。
关键字:显著性检验;聚类分析;偏最小二乘回归分析法1 问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
建立数学模型讨论下列问题:(1)分析两组评酒员的评价结果有无显著性差别,哪一组结果更可信?(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2 问题的分析对于问题(1),两组评酒员分别对27种红葡萄酒和28种白[1],然后利用方差分析对两组评酒员的评价结果进行显著性分析。
一个较好的评价组应是本着客观的原则进行评价,因此评价结果通常较为均匀,据此,可以分别计算出各组评酒员评价结果的方差,方差越大标明组内成员的评价差别越大,可信度就越低。
对于问题(2),题目要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,首先就必须从这些指标中找到与酿酒葡萄分级有关的指标。
考虑到酿酒葡萄的用途是酿制葡萄酒,因此葡萄酒的质量可以作为衡量酿酒葡萄质量的重要指标。
而那些与葡萄酒质量相似性程度较大的酿酒葡萄理化指标也应作为酿酒葡萄的评估价指标。
采取计算相关系数的方法计算两者间相似性程度,选定合适的相关系数为界线即得出酿酒葡萄质量评价指标。
在酿酒葡萄质量指标确认后,采纳聚类分析的方法对酿酒葡萄进行分类。
分类后,各类中葡萄酿制葡萄酒的质量得分即作为各类分数,从而分出酿酒葡萄的级别。
对于问题(3),要求对葡萄与葡萄酒的理化指标的联系进行分析,葡萄的二级理化指标有50多种,葡萄酒的理化指标有15种左右,而且各个指标间可能存在较大的关联度,研究两组多重相关变量间的关系问题,可以考虑用偏最小二乘回归分析法。
对于问题(4),首先利用问题(2)中相关性分析法和聚类分析法,筛选出与葡萄酒质量关联度较大的一些关键指标。
经过去除掉对葡萄酒质量影响较小的指标,不但可以简化计算,而且在实际研究中,工作人员只需丈量这些关键指标即可,减少了工作量。
然后利用偏最小二乘回归分析法,分析筛选后的指标与葡萄酒质量的函数关系,进而得到对葡萄酒质量的评价模型。
为检验所建评价模型的准确性,可以考虑将样本数据分成两部分,一部分数据用于分析计算评价模型,然后利用另一部分数据对模型进行检验。
如果说误差较小,则说明所建评价模型较为满意,同时也论证了用理化指标对葡萄酒的质量进行评价的可行性。
3 模型的假设(1)酿酒葡萄的酿造水平与酿造环境相同;(2)酿制同一种酒使用的葡萄是相同的;4 符号说明5 模型的建立与求解5.1 两组评酒员评价结果的差别分析5.1.1 数据的处理与准备根据题意,共有两组评酒员,每组有十个成员,每个评酒员在评价任意一种酒时,均考虑了四项一级指标和十项二级指标,每种酒的评价满分为100分,其中各个指标所占分值如表1所示。
为方便计,将各个二级指标依照表1中从左至右的顺序依次编为1—10号。
评分和白葡萄酒的总评分,现以第1号红葡萄酒为例,分析两组评酒员评价结果的分布情况。
20个评酒员对第1号酒的评分依次为70,79,91,68,97,82,69,80,81,76,68,71,80 ,52 ,53 ,76,71,73,70,67。
以10分为间距,统计落入各个区间数据的个数,结果见表2.可以看出,20号红葡萄酒的评分结果呈现出两头少[1]检验评价结果是否服从大似然估计值分别是计算出落入50.1,0.2,0.4,0.2,0.1.经过查20个评酒员对1号红葡萄酒样品的评分可视为服从正态分布。
类似地,其他54种酒的评价结果经检验均服从正态分布。
5.1.2 两组评价结果分析计算出两组评酒员对各种酒的评分情况,见图1.图1 两组最终评分均值通过图1总结出,两组评酒员对于55种酒的评分走势大致相酒,两组评酒员的评分尺度可能分歧,主观性较大。
为检验两组评酒员的评价结果是否存在显著性差别,可进一步对两组评价结[1]。
度为9则95%18酒的评价结果差别显著。
经过上述计算,两组评酒员对27中红葡酒和28种白葡萄酒的评价差别结果如表3所示(其中,1暗示两组评价结果不显著差别,0暗示显著差别)。
表3 各种酒的评价差别性两组评酒员对于55种酒的评价,总计有37种存在显著性差别,占总数的67.3%。
其中红葡萄酒17种,占红葡萄酒总数的63.0%,白葡萄酒20种,占白葡萄酒总数的71.4%,差别性略高于红葡萄酒。
因此,两组评酒员对于这些酒的评价普遍存在显著性差别,为了得到更为准确客观的评价结果,必须分别对各组评酒员的评价结果进一步分析,比较两组评价的可靠性。
一个好的评价组在评价某种酒时,每一个成员应当本着客观性的评价原则对酒的各项指标进行评分,尽量防止主观影响。
因此好的评价组对于同一种酒的评价结果通常更为均衡,不会出现高分和低分居多,而中等分数偏少的现象。
所以,组员评价结果的均衡度在很大程度上表征了该评价组评价结果的可信度,而表示均衡度大小的数据就是评价样本的方差,方差越大,均衡度越则根据上式依次分别计算出,两组评酒员对27种红葡萄酒和28种白葡萄酒评价结果的方差,结果见图2.图2 两组组评酒员评价结果方差通过图2,可以看出,第一组评酒员对于各种酒评价结果的方差绝大部分大于第二组,这说明第一组评酒员在评价同一种酒时,组内成员的尺度或认识差别较大,评价结果过于离散,均衡度较差,可信度也就较低,因此可以断定,第二组评酒员的评价结果更可信。
5.2酿酒葡萄分级模型欲对酿酒葡萄进行分级,首先应当确定适当的分级指标。
然而对于题目要求的酿酒葡萄的理化指标和葡萄酒的质量这些指标中既可能存在指标间存在较强的相关性的情况,又可能存在一些指标与酿酒葡萄的分级关系微小。
因此,有需要对所给指标进行分析。
题目提供的酿酒葡萄的理化指标中的部分指标具有二级指标,为了更为细致准确的分析各指标与葡萄酒质量的关系,对于有二级指标的一级指标,只考虑其二级指标,将该一级指标去55565由相关系数确定评估葡萄质量指标因为酿酒葡萄是用来酿葡萄酒的,因此,酿成葡萄酒的质量也就成为了判别酿酒葡萄的最重要指标。
题目提供了酿酒葡萄的50多种指标,然而对于这些指标未必每项都对酿制的酒有影响,或者说发生的影响是可以忽略的。
所以有需要对酿酒葡萄的理化指标与酿酒质量进行相似性度量,从而找出与酿酒质量相关程度较大的指标。
下面通过计算相关系数衡量这些指标间的相似程度。
计算得红葡萄理化指标与红葡萄酒质量相关系数见图3。
图3 相关系数散点图从图中可以看出,只有部分指标与葡萄酒的质量的相关系数超出0.5,与葡萄酒质量具有较大的相似性。
其中,还有些指标是与葡萄酒的质量具有较大的负相关系数,也就是会抑制葡萄酒质量的提高,因此这样的指标也必须被作为评估酿酒葡萄的指标。
下面对红葡萄以正负0.5、正负0.4为界,对白葡萄以正负0.4、正负0.3为界筛选指标,筛选情况见表4.经过筛选后的指标不但与葡萄酒的质量有了较大的相关性,同时也大幅度降低了指标的数量,因而无需再对筛选后的指标间的相似程度进行计算以去掉相似程度过高指标。
如果指标数量较多,可以采取R型聚类分析对指标进行聚类从而去掉可归为一类的指标。
聚类分析主要包含样底细似性度量,类与类间相似性度量两个步调。
(1)样本的相似性度量在对样本进行聚类分析时,首先要确定样本的相似性度量,经常使用的样底细似性度量有马氏距离、车比雪夫距离、欧式距件:这一距离的定义满足正定性、对称性和三角不等式。
在聚类(2法、重心法、类平均法等方法度量它们之间的距离。
下面介绍本个数。
下面根据由5.2.1示样品的数量和指标的数量。
样本间相似性采取欧式距离度量,类间距离的计算选用类平均法。
此外国际上和国内都是将葡萄酒按质量分为四个等级,其中,我国葡萄酒质量划分为优质特级葡萄酒、产区优质葡萄酒、产区优良葡萄酒以及佐餐酒四个级别[8]。
故将酿酒葡萄分为对应的四个等级能够便于对酿酒葡萄的收购以及应用。
得到葡萄样品分类结果为界线降低并没有对分类结果发生较大的影响,但为了包管分类结果与酿酒质量的相关性,这里采取界线取得较高的两组分类结果。