数学建模竞赛论文问题

竞赛论文评审中的数学
摘 要
本文针对数学建模竞赛论文评审问题,综合考虑参赛学校的参与力度与往年成绩,论文的数量与水平,评审人的数量与水平,提出了参赛校的评审人数分配方案,论文与评审人分组审阅方案以及可行的论文排名方案,实现了竞赛论文评审的优化配置,具有一定的现实实践意义。
问题一中,对于 ,我们结合公平席位分配问题,提出了比例分配法和 值法两种模型,并结合题给的约束条件采用LINGO优化软件对所构建的数学模型进行求解得到可行的分配方案:排名为 1,2,3的本科院校各有2位老师参加评审。排名为4,5,6,7,8,9,10,11,13,16,21,22,23,32,33,34,36,37,38的本科院校各有1位老师参加评审;排名为17,18,19,20,46,47,48,49,50,51,52,53的高职高专院校各有1位老师参加评审。总评审人数为37。
问题二中,考虑评审人的审阅速度不一这一重要,基于评审速度服从正态分布中间大两头小这一特点,我们采用正态分布 来描述该评审速度,并通过理论计算对已提出的参赛校评审人数分配方案进行分析,证明在评审人的审阅速度不一的情况下,问题一得出的分配方案仍满足要求。
问题三、四中,为满足评审人不得评审本校的参赛论文要求,我们先将学校分成两组(两组学校实力相当),来自两组学校的评审老师评阅另一组学校的参赛论文。再将各组评审老师分成4组,分别评阅A、B、C、D题,即将评审人和论文分别分为8组。另一方面还要使各组评审人工作量尽可能接近,所以在将老师分组时要考虑到该组论文数量,而在论文分组时要尽量使同类型论文按质量平均分组,结合各约束条件得到最后分配方案及各组评审人应评阅论文数:
分组 上半区 下半区
A B C D A B C D
评审人数 7 7 3 3 7 6 3 2
论文数 172 175 71 79 172 143 71 58
平均工
作量 2人73
5人74 7人75 3人71 3人79 2人73
5人74 6人72 3人71 2人87
问题五中,由于不同评审人的评审宽严尺度存在差异,导致直接给出的评审结果无可比性,但是在论文水平服从正态分布等假设下,我们可由统计学方法对结果进行标准化,使其同服从于正态分布,最后根据由标准分查表所得的值对论文进行排名归类。


关键词:比例分配法, 值法,正态分布,随机模拟

一. 问题概述
全国大学生数学建模竞赛是目前国内最有影响的一项大学生课外科技活动。2005年有大约26000名学生参与该项竞赛。竞赛采取全国范围内同时分赛区进行。各赛区负责本赛区的竞赛组织工作。竞赛论文是评奖的主要依据。评审分初评、赛区评审、全国统一评审3个阶段。赛区评审的工作量非常

大,各赛区都采取了一些积极的措施,以保证评审的公正,并尽可能减少评审工作量。
江苏赛区目前的做法是由赛区组委会根据各校的参赛情况及其它因素聘请若干专家参与评审,这些专家基本上都来自参赛学校。评审时将参赛论文按赛题分成若干组,评审人也分成若干组。假设总共有M篇论文,每篇论文至少需要经K名评审人评阅,每个评审人一天可以评阅J篇论文。
请你帮助解决如下问题:
问题1:评审是匿名的,假如评审工作必须2天内完成,请你根据训练1.xls 中的数据,对K=3,J=40,确定总评审人数,并给出一个参赛校的评审人数分配方案。要求每个学校至多2人,有些近年才参赛的学校不邀请评审人,高职高专类(只做C,D题)评审人数不低于30%。要求说明你的方案的公平性,少数历年竞赛成绩优秀的学校可以适当增加评审人数,但总人数不能超过2人,训练1.xls 的序号是根据历年参赛成绩编号的。
问题2:实际上,各位评审人每天评审的论文数(即J值)是有差异的,根据往年的经验, ,大部分评审人每天评阅的论文数在40份左右。请在适当的假设下,回答问题1。
问题3:根据问题2的相关结果,根据训练1.xls的数据,给出一个论文与评审人的分组方案。要求评审人不得评审本校的参赛论文。
问题4:在问题3的前提下,给出一个评阅方案,要求各评审人的任务尽可能少。在此前提下,计算各评审人应该评阅的论文数。
问题5:因为每个评审人只能评阅部分论文,每篇论文也只有若干个评审人评阅,各个评审人评审的宽严尺度有差异,给最后的论文排序造成很大困难,请给出一个合理的处理方案,将论文按4%,7%,9%,11%,13%,56%的比例从好到差分类(只需给出方案),要求尽量体现公正原则。

二. 问题分析
问题一是个席位分配问题,目标是提供一个最公平可行的方案。关键就是定出评审人数的分配标准,为此,我们建立了比例分配法和Q值法这两个模型来解决这个问题。
问题三及问题四的分析中要求给出论文与评审人的合理分组方案。可参考的条件有:各评审人的工作任务尽可能少;每组论文总体水平一致;评审论文的回避原则,即评审人不得评审本校的参赛论文;一个评审人只评审ABCD其中一类论文;本科生和高职高专生的能力存在差异;往年各学校参赛的成绩可作为其递交论文水平的参考。
对于问题五,由于数学建模竞赛中的赛题大多是开放性的,没有固定的标准答案,而各个评审人评审的宽严尺度也会有所差异,因此评卷的结果中主观因素很强。由于论文量大,而每篇论文只由三个评审人评阅,结果的可比性较差,

不能给出合理的参赛队排名。因此要得出一个能够用于排名的论文评阅结果,必须对三个评阅人的评阅结果进行处理,得到一篇论文的标准分,用于排名。

三. 问题假设

1. 往年的参赛成绩排名能够较好的反映各学校的真实水平,可以成为制定今年评审分配方案的依据。
2. 一个评审人基本上只批改A,B,C,D中的某一类论文。
3. 不同的评审人的评阅是相互独立,互不干扰的。
4. 所有评审人的评阅论文数近似于正态分布。
5. 每位评审一天最多可评阅50份论文。
6. C、D题的难度较A、B题低,评阅速度相对较快。
7. 存在一个客观标准,可以根据它衡量任意两份论文的优劣。可以用一个绝对名次或分数来描述在此标准衡量下的论文质量。这是任何一种排序算法的基础。
8. 各评审人在整个评审过程中评审的宽严尺度保持一致,所评阅的论文是随机选取的,基本反映了赛区论文的水平。
9. 各评委独立进行评阅。每个评委都有胜任评审工作的素质和经验, 他们对同一份论文的评阅具有较高的一致性。
10. 由每位裁判单独的评判结果得到的名次与绝对名次一致。
11. 赛区论文质量服从正态分布

四. 符号说明
m:参赛学校总数
nA:A类论文的数量
nB:B类论文的数量
nC:C类论文的数量
nD:D类论文的数量
:排名第 所学校派出的评审人数 =1,2,……,60
:排名第 所学校派出的参赛队伍数 =1,2,……,60
:参赛队伍的总数
:评审的总人数
:每个评审人每天审阅论文数
:审阅天数
:评审人 评审论文成绩的均值
:评审人 评审论文成绩的方差
:评审人 对论文 的评审结果
:评审人 对论文 的评审结果的标准化结果
:论文 的最终得分(标准分)

五. 模型建立与求解
5.1 问题一
5.1.1 模型分析
第一个问题是个席位分配问题,目标是提供一个最公平可行的方案。关键就是定出评审人数的分配标准,为此,我们建立了两个模型来解决这个问题。

5.1.2 模型建立
模型1---比例分配法

根据表中的数据,初步估计评审总人数应该满足 ,可得 。
从数据表中可以看出,无论是论文数量还是成绩排名,高职高专的学校都处于劣势。 但题目要求高职高专的评审人数不低于30%,所以要将高职高专和其他学校分成两组,并分别根据实力指数排名。
考虑到高职高专和本科院校两部分的排名确定后,按公式求出的理论值不是整数,而且不能保证每个学校的评审名额不超过2,所以是不可行的,仍需调整。调整的过程中我们要保证评审的总人数是不变的。且在所有的可行的方案中是最优的,也就是最公平的,这些过程会用公平函数来实现。
由于每

个评审人只能改一类论文,所以四类论文分别计算。由于A类论文有341篇,B类论文有319篇,C类论文有142篇,D类论文有138篇。所以评审A类论文所需要的人数为:
(取整),
同理可计算得 =12, =6, =6。故总评审人数 =37,
则高职高专的评审人数G=37*0.3=11.1 ,取整后G=12.
根据惯例分配席位方案得到各校理论评审人数:
(1)
我们定义如下的公平度函数 ,来衡量分配评审名额的公平性,当 取最小值时,方案最为公平,不过同时要满足高职高专类(只做C,D题)评审人数不低于30%。

模型2--- Q 值法

比例分配法的公平性很难判定,因此我们在分配时要考虑对各队的公平性。 值法较好地解决了这一问题。
公平而又简单的席位分配办法是按参赛学校的参赛队伍数分配,对于A、B两方来说,设两方人数分别为 ,两方评委数为 ,则两方每个席位代表的人数分别为 和 ,但是因为人数和席位都是整数并且又存在,所以通常 。这时席位分配不公平。假设 ,则A的相对不公平程度可用 来表示,B的相对不公平度可用 来表示。制定席位分配方案的原则是使这两个相对不公平度尽可能小。即 时,这一席应该分给A方,反之则分给B方。
上述方法当推广到有m方分配席位时,设第 方人数为 ,已占有席位为 , ,则当总席位增加1席时,计算 ,应将这一席分给 值最大的一方。这种席位分配方法称为 值法。
值法适用于处理剩余席位,但对于总评审人数不明的情况下直接分配存在明显问题。后文我们将在已给出总评审人数的情况下采用 值法决定评阅ABCD四类论文的评审人数。下面我们将提出两个衡量公平分配的理想化原则,然后采用LINGO优化软件计算出最优分配方案。
设第 方人数为 , ,总人数 ,待分配的席位为S,理想化的席位分配结果为 ,满足 。记 , 不全为整数时,记 , 和 分别为 向上取整和向下取整,公平分配方法应该满足的理想化原则如下:
原则一 : ,
原则二:
结合题给约束条件:每个学校至多2人;有些近年才参赛的学校不邀请评审人;往年竞赛优秀的学校可以适当增加评审人数,得到的数学模型如下:


5.1.3 模型求解
以上两种模型获得的结果是一致的,其中高职高专评审有12人。
假设每篇论文只需3位老师审阅时,问题1的结果如下:
排名为 1,2,3的本科院校各有2位老师参加评审
排名为4,5,6,7,8,9,10,11,13,16,21,22,23,32,33,34,36,37,38的本科院校各有1位老师参加评审;
排名为17,18,19,20,46,47,48,49,50,51,52,53的高职高专院校各有1位老师参加评审。总评审人数为37。

5.2 问题二
5.2.1 模型分析与求解
对此问进行求解,关键是要对J的分布进行分析。由于老师每天批阅的快慢是一个概率事件。实际情况下,老师在每天批阅的分数在40的人数较多,离40份越远的老师人数越少。对这样一种“两头小,中间大”的分布,我们假设可以近似看成正态分布。根据题意假设 。
因为大多数人每天改的论文数量在40左右,且近似于正态分布的离散情形。由图像的对称性可知,期望 。其次,我们通过下面对的比较来选取较为合适的 。 =1, =2, =3, =4, =5的曲线如下图所示,考虑到评审人的评阅速度的差异性,选择 =4。

下面判断在评审速度呈正态分布的情况下问题1中的评审人人数以及分配方案是否满足评卷要求。

代入 7
解得 =1
即在评审速度存在差异的情况下,问题1中的评审人人数以及分配方案依然满足要求,故不做调整。

5.3 问题三、四
5.3.1 模型分析
考虑将论文和评审人分为8组,首先根据评审论文的回避原则将参赛学校分为两大组,来自第一组参赛学校的评审人审阅第二组参赛学校递交的论文,来自第二组参赛学校的评审人审阅第一组参赛学校递交的论文。然后根据ABCD类论文将每大组再细分为四小组。

5.3.2 模型建立
采用问题1中的Q值法求出ABCD类论文各自所需的评审人数。

剩余三个席位。分别计算出 ,可得,

根据Q值法的规则,ABCD类论文各自所需的评审人数为14,13,6,5。
而对于论文分组中出现的论文水平不均问题,我们考虑将参加评审的学校分为两组,再分组考虑。
第一组参赛学校:往年竞赛成绩优秀的6个学校,序号1,2,3,4,5,6
第二组参赛学校:除1-6外其他27个参与评审的院校,序号7,8,9,10,13,14,16,18,19,20,21,22,32,33,34,36,37,38,39,46,47,49,50,51,52,53,54
用集合表示如下,
将上述两个集合分别分为两个大组,表示为:P1+P2= ,P1 P2,
Q1+Q2= ,Q1 Q2。
P1=3,P2=3,Q1=7,Q2=8;
令S1,S2,S3,S4,T1,T2,T3,T4分别表示分组后各组的评审人数,则有
S1+S2+S3+S4=P1+Q1
T1+T2+T3+T4=P2+Q2
由选择各题的比例可得:
S1+T1=14
S2+T2=13
S3+T3=6
S4+T4=5
基于上述分组建立以下优化模型:
约束条件1——各评审人的工作任务尽可能少

即满足 尽可能小。
约束条件2——每组论文总体水平一致
即满足 尽可能小。
目标函数OBJ:

5.3.3 模型求解
在实际求解模型时,我们是分步骤进行的。
第一步:将各区评审人细分到A,B,C,D各题
本例取 S1=7,S2=7,S3=3,S4=3,T1=7,T2=6,T3=3,T4=2,
第二步:随机产

生P,Q向量
第三步:在第二步的基础上,计算一次H值
第四步:重复第二、第三步
第五步:比较多次随机模拟的结果,选择H值最小的。
下面是较好的方案( =100)
上半区的学校有:1,4,5,9,11,12,16,19,20,23,24,26,27,29,31,33,34,35,38,41,42,43,44,46,47,49,50,52,56,58,60参赛总队数505,含评委20人;其余学校分在下半区,参赛总队数435,含评委20人。上半区A组的论文有172,B组的论文有175,C组的论文71,D组的论文79。下半区A组的论文172,B组的论文有143,C组的论文71,D组的论文58。
从以上数据可以看出前六所往年成绩优秀的学校,被平均的分到了上下半区。而且其他学校也是按编号比较平均的分到上下半区之中,充分体现了公平原则。
经计算,上下半区分配到的老师平均批阅的试卷分数为:
A组 B组 C组 D组 评审人数
上半区 73.7 75 71 79 20(来自下半区)
下半区 73.7 72 71 87 18(来自上半区)
再考虑每位评审人应当评审的试卷数。我们认为对于每一组(一共8组)的评审人来说,试卷的分配是随机的。而为了达到评审人批阅试卷最少的目的,数量应该最平均。由以上分析我们得到结果(平均):
上半区:
A组:2位评审改73份,5位评审改74份;
B组:每位评审改75份;
C组:每位评审改71份;
D组:每位评审改79份。
下半区:
A组:2位评审改73份,5位评审改74份;
B组:每位评审改72份;
C组:每位评审改71份;
D组:2位评审改87份。
由此可见,评审下区D题的老师工作量较大,A,B,C题的老师工作量差不多,同区的情况相仿,各层次的评审老师按平均分布在上下半区,两区评审老师平均水平相差很小,符合公平的标准。

5.4 问题五
5.4.1 模型分析
对于三个评审给出结果有较大差异的论文,可由第四位较权威的评审再次评阅。对于三个结果交一致的论文,我们必须对评阅结果进行处理,使其有一定可比性。
对上面第二种情况,在假设每位评委在整个评审过程中评审的宽严尺度保持一致,所评阅的论文是随机选取的前提下,又论文水平服从正态分布,则每位评委评阅的论文成绩也满足正态分布。而任一正态分布均可转化为标准正态分布,于是得到的结果就有较强的可比性。

5.4.2 模型建立
根据统计学原理,统计评审人 评审的论文成绩及相应的 值,成绩 服从 ,即 。若 三位评审人均参与论文 的评阅,则 且独立,根据独立可加性原理有 ,取 为论文 的最终得分(标准分),则 ,且 值越大,该篇论文排名越高。

5.4.3 模型求解
根据以上建立的模型通过对评阅结果的标准化处理对论

文进行排序,最终排序方案如下:
1. 评审结果差别大的再次评审,结果较一致的按一下步骤排序归类。
2. 统计整个评审过程中评审人 评审结果的 值;
3. 对于论文 分别对三个评阅人 给出的结果进行标准化: , ;
4. 计算论文 的最终得分(标准分) ;
5. 查表得 的值,将论文 按该值归入4%,7%,9%,11%,13%,56%中的一类。
具体归类原则如下(假设按4%,7%,9%,11%,13%,56%的比例从好到差将论文分为一等、二等、三等、四等、五等、六等、七等):
等级 一等 二等 三等 四等





等级 五等 六等 七等




六. 模型评价
优点:
1. 合理利用分组的思想,简化了本题的复杂程度
2. 合理应用了Q值法,充分考虑到了公平性
3. 对不同评审给出的结果可由统一方法进行处理,得到有较强可比性的结果用于排序。
4. 考虑到评审分歧较大的情况,增加复评,且由较权威评审人评阅

缺点:
1. 分配时上下半区老师不能交叉改卷,造成下半区D组评审的工作量偏大,上半区不与“评审不得评阅本校答卷”原则冲突的D组评审资源浪费。
2. 大多数情况下,论文水平呈偏态数据分布,于正态分布稍有区别。
3. 在评阅过程中需要记录各评审给出的所有成绩以计算 值,会增加一定的工作量。

七. 模型改进与推广
问题3、4的模型中上半区下半区分开改卷会造成评审资源一定程度上的浪费,由于参赛队伍的客观条件,造成每个老师的阅卷量不会绝对相同,我们尽可能做到同一题各老师的阅卷量大致相同。而上、下半区的划分使得两区同一题评审阅卷量相差较大,因此可以抽调另一半区已阅卷结束的评审来评阅非本校的同类题目,例如上半区D题的评审可以进入下半区评审非本校的答卷。这样可以做到公平合理的最大化,防止某一部分老师阅卷量过大。
问题五中考虑到实际论文水平服从偏态分布,可先对结果进行偏态数据正态化转化,再进行标准化处理排名。

八. 参考文献
[1]谢金星;优化建模与LINGO LINDO软件
[2]施政, 杨辉, 曹翰;会议分组的优化;数学的实践与认识;1998.27,(4): 335-347
[3]张建勋;席位分配问题的数学模型;数学的实践与认识, 2002.32, (4): 54l- 548
[4]岳林;关于Q值法的一种新定义;系统工程;1995.13,(4): 70- 72













附录
作 =1, =2, =3, =4, =5的曲线图的matlab程序:

x=20:0.1:60;
y1=normpdf(x,40,1);
y2=normpdf(x,40,2);
y3=normpdf(x,40,3);
y4=normpdf(x,40,4);
y5=normpdf(x,40,5);
plot(x,y1,'-',x,y2,'.',x,y3,':',x,y4,'--',x,y5,'-')




相关文档
最新文档