网络资源下载问题数学建模

网络资源下载问题数学建模
网络资源下载问题数学建模

2015高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮

件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问

题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他

公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正

文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反

竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员(打印并签名) :1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期: 2015年6 月 1 日

网络资源下载问题

摘要

本文针对目前互联网的文件下载问题,根据下载方式的不同,建立优化模型,使得用户用最少的时间下载到最多的文件。

针对问题1,首先考虑速度波动问题,确定波动范围。为便于分析,用MATLAB 计算下载速度的期望,得到速度期望值分别为72.5kb/s、381.3kb/s。根据方式1文件大小,利用MATLAB对方式1的10个文件进行排序,实现文件组合下载的优化。将下载方式分为三个阶段:第一阶段为方式1方式2同时下载,方式2达到速度期望值,当方式2中的文件全部下载完成后第一阶段结束;第二阶段为六个方式1同时下载,其中方式1有一个文件未达到速度期望值;当第二阶段中任一组合文件下载完成后进入第三阶段,此时剩余的文件1同时以期望速度下载。

利用MTALAB求解,得到三个阶段分别耗时254.8min,149min,74min,故总耗时为485.8min。

针对问题2,考虑积分问题,在问题1的基础上,考虑问题1的方案是否满足积分要求。由附件数据可得,20个文件所需积分为103分。第一次回答无需等待,升级后第一次回答也无需等待,故获得103积分的时间为140min。增加此约束条件后最优解不受影响,故问题1方案可行。

针对问题3,在考虑积分和上机时间有限的前提下,达到下载文件数量最多的目标,根据多线程下载优化模型,建立了多条线路没有下载的方案,通过对大量数据进行假设,分析,得出最优解,即能下载19个文件,剩余file7没有下载。

针对问题4,仍然考虑积分和上机时间,以及需求程度的问题,在这些条件下实现下载文件数量的最多,针对此问题,在问题3已建立的的模型基础上,利用贪心算法,让急需文件优先下载,得出最优下载方案,急需文件全部下载,总文件数为19。

文章最后,对模型的缺点进行分析,提出模型存在的问题,并且提出了改进方案,通过模型的建立,未下载折节省了大量的时间。同时此模型对日程安排,生产流程规划也有很好的推广性。

关键词:排队论数学期望组合优化多目标规划动态规划

一问题重述

现在互联网发展迅速,网络资源丰富。人们在日常生活及学习中,经常需要在网络上下载需要的文件资料。

现有某学生需要在某论坛下载资料,需要下载的文件共有20个,由于下载方式的不同,下载文件具有不同的下载速度。现在的文件共有两种下载方式(每个文件有且仅有一种下载方式),方式1的下载速度最高是80kb/s,方式2的下载速度最高是400kb/s,20个文件的大小、下载方式及需求程度等资料见附件。

另: 由于网络的原因,

1.每种下载方式的下载速度都有在10%范围内的波动;

2.该生所用电脑网络带宽下载速度最高可达430kb/s.

问题:

建立数学模型帮助该生解决如何安排下载计划,使得其可在最短时间内下载完成所需文件(该问题不需要考虑积分);

该论坛将注册用户分为A级用户(回复问题在0-20次),B级用户(回复问题在20-25次),C级用户(回复问题在25次以上)等等级,下载资料需要积分,提供注册用户回复问题每次可获得积分4分,为避免有人恶意回复,规定每名用户:A级用户每30分钟可回复一次问题,B级用户每20分钟可回复一次问题,C 级用户每10分钟可回复一次问题。该用户现有积分50分,已回复问题在15次,如何安排下载以及获得积分的计划,使得其可在最短时间内下载完成所需文件。

在问题2的条件下,由于时间原因,该用户现在只有7小时的上机时间,那么,如何安排下载计划,使得其可在规定时间内下载得到所需文件数量最多?

在问题2,3的条件下,由于资料的需求程度不一致,要求下载的资料中,急需的文件数量要比一般程度的文件数多,如何安排下载计划,使得其可在规定时间内下载得到所需文件数量最多?

二问题分析

2.1问题一的分析

对于问题一,要求安排下载计划,可以在最短时间内下载完成所需文件。这是一个最优决策问题,无论先前的策略如何,相对于前面的策略所形成的状态而言,余下的决策序列必然构成最优子策略,即一个最优策略的子策略也是最优的。

由于下载速度是上下波动的,首先就要确定速度的波动范围,还要考虑用同一种方式下载多个文件时,是否可以对下载速度进行叠加。若下载速度不进行叠加,那么在进行单种方式下载时,会造成带宽的浪费,所以我们假设在带宽足够的情况下,对多个文件的下载速度是可以叠加的,在带宽不够的情况下,就对所下载的文件进行方式的分配。通过这样的分配,可以达到最短的下载时间。

当然在对下载方式进行分配的时候,毕竟速度还是存在波动的,为便于分析,用MATLAB计算下载速度的期望,得到期望速度分别为72.5kb/s、381.3kb/s。

在对方式二进行下载的时候,方式二的下载速度期望为381.3kb/s若只进行一个方式二的下载任务,则会有带宽浪费,且不可能多个文件下载速度都达到速度上限,所以考虑对方式一和方式二的文件进行组合下载,为尽量保持带宽充分利用,方式二中的文件以期望的速度下载,当方式2中的文件全部下载完成后第一阶段结束,此时耗时254.8min。第二阶段为六个方式1时下载,其中有一个方式1文件未达速度期望值。当第二阶段中任一组合文件下载完成后进入第三阶段,此时剩余的文件1同时下载,均达到速度期望值。

在考虑下载方式的速度不同之后,还要考虑到不同质量的资源,下载速度也是不同的,但是题目没有给出资源的质量分析,所以我们做出假设,网络资源没有优劣之分,在资源质量这一条件下,下载速度是相同的。

2.2问题二的分析

针对问题2,考虑积分问题,在问题1的基础上,考虑问题1的方案是否满足积分要求。由附件数据可得,20个文件所需积分为103分。第一次回答无需等待,升级后第一次回答也无需等待,故获得103积分的时间为140min。增加此约束条件后最优解不受影响,故问题1方案可行。

2.3问题三的分析

针对问题三考虑有限的上机时间为7个小时(420min),由问题1可知下载完所有文件的时间为T(min),只需验证在(T-420)时间内未能下载的文件数W,即下载的文件数是20-W。

2.4问题四的分析

要求下载的资料中,急需的文件数量要比一般程度的文件数多,如何安排下载计划,使得其可在规定时间内下载得到所需文件数量最多。问题四在问题三的基础上,添加了文件的重要性这一条件。因此只要尽量多的保证急需文件的下载,就可以达到这一目标。

三模型的基本假设

1、假设文件下载时,文件下载速度可控制。

2、假设在带宽足够的情况下,对多个文件的下载速度是可以叠加的,在带宽不够的情况下,就对所下载的文件进行速度的分配;

3、假设该生进入论坛、点击下载文件的时间为0;

4、假设在论坛刚回答完问题,4积分就可获得,就可以用于下载。

四符号说明

五 模型建立与求解

5.1.1问题1的模型

考虑速度波动,为便于计算,利用MATLAB 算出方式1和方式2速度的期望值,分别为1v 、2v ,程序详见附录1。对表格中的数据进行处理,得到按稳定速度下载所需时间,详见表5.1。

表5.1

对问题1,将下载过程分为三个阶段,根据方式1、方式2的下载的速度和文件大小,由表5.1可知,方式2的下载时间明显少于方式1的下载时间,第一阶段考虑方式1和方式2的文件同时下载,对方式1的文件大小进行排序,选择方式1中一个最大文件(即文件7)先后和方式2一起下载。方式2以期望速度下载,剩余带宽用于方式1下载,并且方式1、2速度和达到宽带最大值,按此期望下载速度,下载至方式2的文件全部下载完成为第一阶段,记第一阶段耗时为1T :

16

9

i M ∑+20

19

i M ∑= 2V 1T

进入阶段二,此后只有方式1的文件下载,并且同时下载六个文件,但是其中一个文件的速度无法达到72.5kb/s ,即为 430 – 5*72.5=67.5kb/s ,此速度用于下载阶段一尚未完成的文件7,当文件7下载完成后,文件17按此速度继续下载。由第一阶段下载1max M 所剩的文件大小'

1max M ,对现有文件大小排

序,对其中三组文件进行组合下载。

当剩余文件中的最小文件以72.5kb/s 的速度下载完成后, 67.5kb/s 的速度升为72.5kb/s ,继续下载,此时第二个阶段结束,此过程耗时为2T

2T ='

1max M * 1024 / 1V * 60

接下来所剩文件的下载速度全部达到72.5kb/s ,进入下载的第三阶段。将此过程所剩文件再次排序,取最大文件进行计算,即为此阶段所耗时间3T 。

''1max M =1V 3T * 1024 最后得出问题 (1) 的最优时间为: T =1T +2T +3T

最后有三个阶段的划分模型得出了最优下载计划,详见图5.2.

图5.2表示整个过程(即一二三阶段)的下载计划,数字对应下载的文件号

5.1.2问题1的求解

根据问题1模型,下载过程分为三个阶段: 第一阶段时间为1T ,

169

i

M ∑+20

19

i

M

∑= 2V 1T

1T =169

i M ∑+20

19

i M ∑/2v

1T =254.8min

该时间表示方式二的文件全部下载完成所需的时间。 第二阶段时间为2T

2T ='

1max M * 1024 / 1V * 60

求得2T =149min

该时间表示方式1文件组合后,以期望速度下载完所需时间。

第三阶段时间3T

''1max

M

=1V 3T * 1024

3

T =''1max

M /1V *1024

3

T

=74min

故最优时间为T =1T +2T +3T

T

=485.8min

5.2问题2模型的建立

针对问题2,考虑积分问题,在问题1的基础上,考虑问题1的方案是否满足积分要求。由附件数据可得,20个文件所需积分为103分。第一次回答无需等待,升级后第一次回答也无需等待,故获得103积分的时间为140min 。增加此约束条件后最优解不受影响,故问题1方案可行。 5.2.1问题2模型的求解

由于第一次回答问题无需等待,升级后第一次回答问题也无需等待。第一阶段下载完成时间为254.8min ,此过程所获积分为40分,累计积分为30分。第二三阶段下载完成用时231min ,此过程所获积分为92积分,累计积分为56积分。因为累计积分>0,故最优下载计划不受影响。

5.3问题3模型的建立

现将解决问题1,2的模型拿来套用,由图5.2可知,最多只能下载16个文件,有4个文件始终无法下载完成。这时,考虑重建模型,看是否能在7小时内下载更多文件。

因为时间已经限定为7小时,即420分钟,因此,只要在420分钟内下载的文件最多时,就保证了文件下载最多。据此展开讨论:

当按方式一下载的文件都以72.5kb/s 下载时,方式二按357.5kb/s 下载,此时各个文件下载完所需的时间详见表5.3。

表5.3

由表5.3分析,

假设一:

将过程分为两个阶段,第一个阶段分为两个线程,一个线程速度为72.5kb/s,另一个线程为357.5kb/s。以方式二文件完全下载为第一阶段结束标志。此时进入第二阶段,第二阶段为六个方式一文件下载。通过定性分析,最多

相关主题
相关文档
最新文档