2013数学建模D题
2013年全国大学生数学建模竞赛专科组D题

公共自行车服务系统运行规律研究-----以浙江省温州市鹿城区为例摘要:根据浙江省温州市鹿城区公共自行车使用数据,基于公共自行车服务模式和使用规则,对公共自行车服务系统的运行规律从各个站点运行规律、借车人借车规律和高峰日系统的具体运行规律三个方面进行研究。
并基于所发现的规律对目前公共自行车服务系统的设置进行了评价,同时给出了提高系统效率的建议。
首先分别统计各站点20天中每天及累计的借车频次和还车频次。
结果显示,几乎所有站点在20天中的累计借车频次排序和还车频次排序大致相同。
另外也对每次用车时长的分布情况也进行了分析,发现用车时长主要集中在30分钟之内,约占用车量的90%;而用车时长在60分钟之内的用车量占总用车量的99%。
这与鹿城区公共自行车租赁收费标准(1小时内免费,超过1小时收费)相吻合。
以上现象也间接说明了政府制定的收费机制的有效性。
然后统计了20天中各天使用公共自行车的不同借车人数量,并统计了数据中出现过的每张借车卡累计借车次数的分布情况。
结果表明,20天中借车人数呈现明显的周期性波动,并且波动周期大约为7天。
而且波动量非常大,从最高峰第20天约20000个借车人到最低峰不到5000人。
还发现每张借车卡累计借车次数的分布情况如下:20天中55%的借车人借车次数不超过10次,35%的在10-30次之间,9%的在30次以上。
最后基于用车次数最多的第20天的数据对系统进行更为详细的分析。
发现借还车站点之间最长距离为32号站到45号站的距离,最短为73号站到115号站,99号站到150号站的距离。
借还车频次最高的站点分别为42号站点(770次)和56号站点(743次)。
两个站点借还车主要时间段相同,98.6%的借车在7:00到21:00之间,99.9%的还车在7:00到21:30之间。
发现两个站点运行规律的不同点有:56号站点比42号站点在早晨上班时的用车高峰更明显。
56号站点比45号站点用车时长在30分钟之内的多3.3%,说明还车高峰期人们会较快使用完自行车。
13年研究生数学建模D题

(5.1)
式中: IAQI P ——污染物项目 P 的空气质量分指数;
CP ——污染物项目 P 的质量浓度值; BPHi ——文献[2]中表 1 中与 CP 相近的污染物浓度限值的最高值; BPLo ——文献[2]中表 1 中与 CP 相近的污染物浓度限值的最低值;
相关系数ρXY 取值在-1 到 1 之间,ρXY = 0 时,称 X,Y 不相关;|ρXY| = 1 时,称 X,Y 完全相关,此时,X,Y 之间具有线性函数关系; |ρXY| < 1 时,X 的变动引起 Y 的部分变动, ρXY 的绝对值越大, X 的变动就会引起 Y 的变动越大, 当|ρXY|> 0.8 时称为高度相关,当|ρXY| < 0.3 时,称为低度相关,其他为中 度相关。 由表 5.1 可以看出,在 10 个监测点的相关系数的均值中,PM2.5 的浓度含 量与 CO 的浓度含量的相关系数为 0.801, 因此两者高度相关; 与 SO2 、 NO2、 PM10 的相关系数分别为 0.664、0.697、0.762,因此 PM2.5 与三者分别中度相关; 与 O3 相关系数为-0.327,因此定义两者低度相关。ຫໍສະໝຸດ 4.4 对问题 4 的分析
灰箱模型只能针对已发生的类似情况进行预测,因此针对突发状况,即某 监测点的 PM2.5 浓度突然增至数倍,我们可以将此突发情况简化成已知边界条 件的点源扩散模型,将 PM2.5 监测点浓度最高点作为点源,突发状况发生前各 监测点的浓度作为初始条件,并考虑当天的天气影响因素。最后按环保部新修 订的《环境空气质量标准》给出重度污染和可能安全区域。
二、问题的假设
2013年全国研究生数学建模竞赛D题

2013年全国研究生数学建模竞赛D 题空气中PM2.5问题的研究大气为地球上生命的繁衍与人类的发展提供了理想的环境。
它的状态和变化,直接影响着人类的生产、生活和生存。
空气质量问题始终是政府、环境保护部门和全国人民关注的热点问题。
2013年7月12日《中国新闻网》记者周锐报道:“2013年初以来,中国发生大范围持续雾霾天气。
据统计,受影响雾霾区域包括华北平原、黄淮、江淮、江汉、江南、华南北部等地区,受影响面积约占国土面积的1/4,受影响人口约6亿人”(中国国家发展和改革委员会(发改委)2013年7月11日公布在官方网站上的一份报告披露了上述信息,中新社北京7月11日电)。
对空气质量监测,预报和控制等问题,国家和地方政府均制定了相应政策、法规和管理办法。
2012年2月29日,环境保护部公布了新修订的《环境空气质量标准》 (GB3095—2012)[1],本次修订的主要内容:调整了环境空气功能区分类,将三类区并入二类区;增设了颗粒物(粒径小于等于2.5μm)浓度限值和臭氧8小时平均浓度限值;调整了颗粒物(粒径小于等于10μm)、二氧化氮、铅和苯并(a)芘等的浓度限值;调整了数据统计的有效性规定。
与新标准同步还实施了《环境空气质量指数(AQI)技术规定(试行) 》 (HJ633—2012)[2]。
新标准将分期实施,京津冀、长三角、珠三角等重点区域以及直辖市和省会城市已率先开始实施并发布AQI(Air Quality Index);今年113个环境保护重点城市和国家环保模范城市也已经实施;到2015年所有地级以上城市将开始实施;2016年1月1日,将在全国实施新标准。
上述规定中,启用空气质量指数AQI 作为空气质量监测指标,以代替原来的空气质量监测指标――空气污染指数API (Air Pollution Index)。
原监测指标API 为无量纲指数,它的分项监测指标为3个基本指标(二氧化硫2SO 、二氧化氮2NO 和可吸入颗粒物PM10)。
2013年数学建模试卷及答案

葡萄酒的评价摘要葡萄酒的评价结果反映了葡萄酒的优劣程度,而葡萄酒的质量是由多种因素综合决定的。
本文综合考虑了评酒员对葡萄酒的品尝评分、酿酒葡萄及葡萄酒的理化指标等因素,建立了相应的数学模型,利用excel软件,C++编程,变量的相关分析及统计学相关知识等对模型求解,并对所得结果分析比较,对葡萄酒进行评价。
针对问题一,根据附件1中两组品酒员对红、白葡萄酒的品尝评分,分别计算出两组品酒员对红、白葡萄酒各酒样品的评分总值及均值,确定出各酒样品的质量。
通过欧式距离公式,计算出两组品酒员的评价结果差异性数据,得出两组品酒员的评价结果都存在显著性差异。
然后通过计算两组品酒员对两种酒的评价总分的方差均值,判断评价结果的稳定性,从而得出第二组的评价结果更可信。
针对问题二,根据附件2中酿酒葡萄和葡萄酒的理化指标,通过聚类算法对红、白两种葡萄进行聚类划分,将酒样品分为4类。
然后根据葡萄酒质量,划分出样品的等级。
再由葡萄酒样品等级,对聚类后的酿酒葡萄进行分级。
针对问题三,根据附件2,可以得出葡萄酒中的一些物质含量相对于葡萄中的一些物质含量有所减少或增加。
在葡萄酒的制作过程中,由于陈酿条件和发酵工艺及条件可能会造成物质的流失,导致酒中物质含量的减少,而葡萄酒中含量相对增加的物质可能是由葡萄中与其不相关的物质转化而形成的。
通过分析葡萄酒中含量增加的指标与葡萄的各理化指标的相关性系数,判断出酿酒葡萄与葡萄酒的理化指标之间的联系。
针对问题四,对葡萄的理化指标与葡萄酒的评价指标进行相关性分析,结合问题三的结论,得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
根据附件1,可知评价葡萄酒要综合考虑香气、口感等方面,而葡萄和葡萄酒的理化指标主要与口感相关,但并不能决定葡萄酒的质量。
芳香物质与香气有关,在一定程度上也可能会影响葡萄酒的质量。
分别对葡萄和葡萄酒的芳香物质进行聚类分析,将聚类结果与葡萄酒质量等级比较,从而得出结论。
最后,我们就模型存在的不足之处提出了改进方案,并对优缺点进行了分析。
2013年武汉理工大学数学建模训练题目

第1题:箱子的摆放策略某省内知名企业生产的产品用形状为长方体的箱子包装,使用叉车将这些箱子从生产车间运输至仓库。
这些箱子叠放在叉车的正方形底板上,如下图所示,叉车置放箱子的底板是一个边长为1.1米的正方形。
箱子的规格是统一的(所有箱子的长方形底面的尺寸相同)。
通常在一次运输中,箱子像下图中这样横着放,或者竖着放。
下图所示的便是一种可行的摆放方法,但不一定是最优的。
现在这家企业需要你们帮助建立一个通用的优化模型,使得给定长方形箱子的长和宽之后,利用这个模型就能算出该如何摆放箱子(不需考虑箱子的高度,即只考虑摆放一层箱子),才能使得一次摆放的箱子数量最多。
问题1 如果不允许箱子超出叉车底板(如上图所示情形),也不允许箱子相互重叠,建立一个优化模型,考虑如何摆放这些箱子,才能使摆放的箱子数量最多?利用你们构建的模型,分别计算出对于下表中型号1、型号2和型号3的箱子,最多可以摆放多少个?该如何摆放?如果你们能画出摆放示意图,那么将有助于这家企业更快地理解你们的方法。
问题2 假设箱子的密度都是均匀的,允许箱子在正方形底板的上方,左边,右边部分超出底板(下方紧靠叉车壁,不能超出),但不至于掉落出叉车底板。
对于这种情况,重新建立优化模型,并针对上表中三种型号的箱子, 分别计算最多可以摆放多少个箱子?该如何摆放?画出摆放示意图。
问题3在不允许箱子相互重叠的条件下,你们是否还能另外设计出一种摆放方案?并将你们设计的方案与上图中的摆放方案的优劣性进行比较。
第2题:高校教师课堂教学的评价问题目前多数高校都建立了学生对教师的评价系统。
系统中,全体学生对自己的所有任课教师打分,综合评价该教师的教学情况。
教师的评价分值一定程度上能够反映该教师的教学情况,但也存在其分值在全校中的排序和实际教学能力地位不相符的情形。
问题1:附录1为我校学生对教师课堂教学评价的调查问卷,试从各项评价指标中,找出其中相关度较高的部分,将其整合为一个指标;对调查问卷中你认为不合理的部分,说出你的理由,并给出相应的处理方法。
2013高教社杯全国大学生数学建模竞赛题目

2014高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)D题储药柜的设计储药柜的结构类似于书橱,通常由若干个横向隔板和竖向隔板将储药柜分割成若干个储药槽(如图1所示)。
为保证药品分拣的准确率,防止发药错误,一个储药槽内只能摆放同一种药品。
药品在储药槽中的排列方式如图2所示。
药品从后端放入,从前端取出。
一个实际储药柜中药品的摆放情况如图3所示。
为保证药品在储药槽内顺利出入,要求药盒与两侧竖向隔板之间、与上下两层横向隔板之间应留2mm的间隙,同时还要求药盒在储药槽内推送过程中不会出现并排重叠、侧翻或水平旋转。
在忽略横向和竖向隔板厚度的情况下,建立数学模型,给出下面几个问题的解决方案。
1.药房内的盒装药品种类繁多,药盒尺寸规格差异较大,附件1中给出了一些药盒的规格。
请利用附件1的数据,给出竖向隔板间距类型最少的储药柜设计方案,包括类型的数量和每种类型所对应的药盒规格。
2. 药盒与两侧竖向隔板之间的间隙超出2mm的部分可视为宽度冗余。
增加竖向隔板的间距类型数量可以有效地减少宽度冗余,但会增加储药柜的加工成本,同时降低了储药槽的适应能力。
设计时希望总宽度冗余尽可能小,同时也希望间距的类型数量尽可能少。
仍利用附件1的数据,给出合理的竖向隔板间距类型的数量以及每种类型对应的药品编号。
3.考虑补药的便利性,储药柜的宽度不超过2.5m、高度不超过2m,传送装置占用的高度为0.5m,即储药柜的最大允许有效高度为1.5m。
药盒与两层横向隔板之间的间隙超出2mm的部分可视为高度冗余,平面冗余=高度冗余×宽度冗余。
在问题2计算结果的基础上,确定储药柜横向隔板间距的类型数量,使得储药柜的总平面冗余量尽可能地小,且横向隔板间距的类型数量也尽可能地少。
4. 附件2给出了每一种药品编号对应的最大日需求量。
在储药槽的长度为1.5m、每天仅集中补药一次的情况下,请计算每一种药品需要的储药槽个数。
2013全国数学建模竞赛题目A-B

2013高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)A题车道被占用对城市道路通行能力的影响车道被占用是指因交通事故、路边停车、占道施工等因素,导致车道或道路横断面通行能力在单位时间内降低的现象。
由于城市道路具有交通流密度大、连续性强等特点,一条车道被占用,也可能降低路段所有车道的通行能力,即使时间短,也可能引起车辆排队,出现交通阻塞。
如处理不当,甚至出现区域性拥堵。
车道被占用的情况种类繁多、复杂,正确估算车道被占用对城市道路通行能力的影响程度,将为交通管理部门正确引导车辆行驶、审批占道施工、设计道路渠化方案、设置路边停车位和设置非港湾式公交车站等提供理论依据。
视频1(附件1)和视频2(附件2)中的两个交通事故处于同一路段的同一横断面,且完全占用两条车道。
请研究以下问题:1.根据视频1(附件1),描述视频中交通事故发生至撤离期间,事故所处横断面实际通行能力的变化过程。
2.根据问题1所得结论,结合视频2(附件2),分析说明同一横断面交通事故所占车道不同对该横断面实际通行能力影响的差异。
3.构建数学模型,分析视频1(附件1)中交通事故所影响的路段车辆排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量间的关系。
4.假如视频1(附件1)中的交通事故所处横断面距离上游路口变为140米,路段下游方向需求不变,路段上游车流量为1500pcu/h,事故发生时车辆初始排队长度为零,且事故持续不撤离。
请估算,从事故发生开始,经过多长时间,车辆排队长度将到达上游路口。
附件1:视频1附件2:视频2附件3:视频1中交通事故位置示意图附件4:上游路口交通组织方案图附件5:上游路口信号配时方案图注:只考虑四轮及以上机动车、电瓶车的交通流量,且换算成标准车当量数。
附件3视频1中交通事故位置示意图附件4附件5上游路口信号配时方案本题附件1、2的数据量较大,请竞赛开始后从竞赛合作网站“中国大学生在线”网站下载:试题专题页面:/service/jianmo/index.shtml试题下载地址:/service/jianmo/sxjmtmhb/2013/0525/969401.shtml2013高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)B题碎纸片的拼接复原破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
2013年夏令营深圳杯数学建模D题

2013深圳夏令营数学建模承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完明白, 在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题.我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出.我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性.如有违反竞赛规则的行为,我们将受到严肃处理.我们参赛选择的题号是(从题中选择一项填写): D 题所属学校:贵州民族大学参赛队员:1.姓名:2.姓名:3.姓名:指导教师或指导教师组负责人(打印并签名):2013深圳夏令营数学建模编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):自然灾害保险问题的研究摘要本文讨论了如何建立合理的自然灾害保险的问题,并建立了关于P省农业保险公司盈亏的简洁数学模型。
引入。
原理对于问题一,对于问题二,对于问题三,关键词:费率、线性回归、农业保险一、问题重述根据2013年3月5日《环球时报》转摘美国《商业周报》的相关报道,“在2012年全世界发生的10大自然灾害中,有4场是发生在中国。
包括3场严重的夏季洪涝灾和席卷苏鲁冀等沿海地区的台风‘达维’造成的灾害。
另外,还有很多地区遭受了严重干旱、冰雹等自然灾害,共造成290亿美元的损失,但通过投保由保险公司赔付的比例仅占总损失的4%左右,这个比例相对美国的自然灾害保险赔付率相差甚远。
”另据报道:“2013年3月20日发生在广东、广西等省部分地区的一场大风和冰雹灾害,造成直接经济损失达13亿多元。
”这个事实警示我们,中国需要重视和加强自然灾害保险的研究和实践,特别是针对严重自然灾害的保险体系建设和对策方案的研究,推动由政府主导的自然灾害政策性保险方案的实施。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): D我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):平日期:2013年9月16日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):公共自行车服务系统的统计分析摘要本文研究的是有关公共自行车服务系统的统计分析,包括站点设置和锁桩数量的配置问题。
对于该题中的问题我们转化为数学中的数据统计与图像,利用Excel、matlab软件对数据进行处理。
分别得到本题中的五个问题。
对与问题一:首先要进行总体样本数据统计,利用Excel软件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。
第一、用Excel统计各站点20天中每天以及累计的借车频次和还车频次。
第二、对所有站点按照累计的借车频次和还车频次分别给它们排序。
第三、在Excel中汇总出每次用车时长的数据,随即将数据导入matlab中,通过matlab 处理去除奇异数据,并做出图像。
第四、通过该图得出用车时长最长的时段数据,拟合出函数分布,并判断实际观察的属性类别分配是否符合已知属性类别分配理论。
第五、检测观察数与理论数之间的一致性,通过检测真实数据与理论数据间的一致性来判定事物之间的独立性。
对于问题二:首先在表借车卡SN列中用数据透视筛选出20天每张借车卡的数量,再将数据导入matlab中,统计数据中每张出现过的借车卡累计借车次数,进行数据处理后得出每张借车卡累计次数的分布情况。
对于问题三:首先根据问题二的统计结果确定使用公共自行车次数最多的一天。
在解答下列小问1)先从统计数据结果找出自行车用车的借、还车站点之间(非零)最短距离和最长距离。
在利用Excel对借、还车是同一站点且使用时间在1分钟以上的借、还车情况进行统计。
2)从问题一数据中选择那一天借还频次最高的站点,分别统计其借、还车时刻及用车时长的分布。
3)列表统计出那一天各站点借、还车高峰时段及其高峰时段的借、还车的频次,把共同借还车高峰时段的站点分别进行分类。
对于问题四:通过从数据中分析出有用信息,并对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
对于问题五:从统计出来的数据中找出公共自行车服务系统的运行规律,并提出合理的改进建议关键词:公共自行车Excel Matlab 总体样本平面直方图数据统计与分析分布的检验拟合优度检验1.1.背景资料与条件低碳生活是世界可持续发展的首要任务。
全球变暖等气候问题致使人类不得不考量目前的生态环境。
人类意识到生产和消费过程中出现的过量碳排放是形成气候问题的重要因素之一,所以要减少碳排放就要相应优化和约束某些消费和生产活动。
公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及。
在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。
题目给出了:附件1是公共自行车数据(内含20个Excel文件);附件2公共自行车站点分布图。
1.2.需要解决的问题1.2.1.问题一分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序。
另外,试统计分析每次用车时长的分布情况。
1.2.2.问题二试统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。
1.2.3.问题三找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。
(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
1.2.4.问题四请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
1.2.5.问题五找出公共自行车服务系统的其他运行规律,提出改进建议。
2.1.问题的重要性分析建立此模型的目的是为了使公共自行车服务系统更加完善,便于市民通行。
以此合理分布站点,根据不同站点人员借车的密集程度安排自行车的数量。
做好每天高峰时段及节假日用车高峰时段的自行车调度是重要问题。
2.2.问题的思路分析2.2.1.问题一对与问题一需要进行大量的数据统计,利用所给的Excel文件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。
首先统计各站点20天中每天以及累计的借车频次和还车频次,然后对所有站点按照累计的借车频次和还车频次分别给它们排序,最后,统计分析每次用车时长的分布情况,可以通过该图看出用车时长最长的时段,数据处理后可以找出其满足的函数分布。
并对其分布进行检验。
2.2.2.问题二与问题一相同,要先统计出各天使用公共自行车的不同借车卡数量,然后统计数据中每张出现过的借车卡累计借车次数,进行数据处理后得出每张借车卡累计次数的分布情况。
2.2.3.问题三通过的数据统计找出所有已给站点合计使用公共自行车次数最大的一天。
1)首先任意定义两站点之间的距离,找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
然后对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
2)将统计出借车频次和还车频次的数据进行筛选,找出借车频次和还车频次最高的站点,把借、还车时刻的数据进行统计分析,处理得其分布以及车时长的分布。
3)在统计数据中找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行数据处理分类。
2.2.4.问题四通过问题一到问题三的数据处理,在统计结果中列出有用的信息,通过观察数据对目前公共自行车服务系统站点的设置和锁桩数量的配置进行评价。
2.2.5.问题五从数据中找出公共自行车服务系统的一些规律,提出合理的改进建议(三)模型假设为了我们更好的解决该问题,在此之前,我们作出以下假设:1)假设路程与时间成正比;2)假设借出的车都归还(借车未还的忽略不计);3)假设公共自行车不存在跨市运营;4)假设公共自行车不存在跨市运营且只有一家运营公司;5)假设公共自行车在借车以后一直处于行驶状态6)假设每个锁桩所能容纳的车辆都相同,(四)符号说明ν:中心距α:偏斜度β:偏斜度X:表示【附件3】数据中每张卡的总次数的平均值;x i:表示【附件3】数据中每张卡的总次数N:表示【附件3】数据中卡的总次数;s:表示【附件3】数据中每张卡的总次数的标准差(五)模型的建立与求解5.1问题一首先统计各站点20天中每天以及累计的借车频次和还车频次见附件中的【附件1】然后对所有站点按照累计的借车频次和还车频次分别给它们排序见附件中的【附件2】最后,统计分析每次用车时长的分布情况1)去除大数据、奇异值原因:1、通过把每次用车时长数据统计后画出直方图1【附件3】,经观察后发现有较多大数据阻碍了图像的完美表达,并且数据主要集中在0-150之间,为了便于观察分析,剔除大于150的奇异数据。
编辑matlab程序:a=data;j=1;b=a(:,1);for i=2:20b=[b;a(:,i)];endfor i=1:size(b)if b(i)>150;b(i)=0;j=j+1;endendj运行程序的结果:j=844图1偏态测定:将三阶中心距3v与其标准差的三次方对比,求得偏态偏斜度α即:___3 33 3___21()()iif X Xv Nsf X XNα-==-⎝⎭∑∑注:α=0,表示数据为对称分布;α>0,表示数据为右偏或者正偏;表示α<0,表示数据为左偏或者负偏。
编辑matlab程序,计算结果如下:α=-2.31峰度测定:将四阶中心距4v与其标准差的三次方4S对比,求得峰度偏斜度β即:___444 4___21()()iif X Xv Nsf X XNβ-==⎛⎫-⎪⎪⎪⎪⎝⎭∑∑注:当β=3时,为正态分布;当β>3时,分布曲线为尖峰;当β>3时,分布曲线为平峰。
编辑matlab程序,计算结果如下:β =4.232)利用Matlab软件画出每次用车时长在0-150之间的直方图。
如图2所示。
编辑matlab程序a=data;b=a(:,1);for i=2:20b=[b;a(:,i)];endfor i=1:size(b)if b(i)>150b(i)=0;endendhist(b,1000)图23) 验证图2中曲线的分布情况。
对于这种直方图,我们尝试用卡方分布,F分布,泊松分布来拟合,为了方便起见,编写matlab 程序进行分析;程序见附件中程序1,检验结果都不予通过。
下面通过拟合曲线来看清分布情况图3注:(1)拟合的指数方程为0.06720375y e -=(2)2R 为拟合优度,越接近1越好,以上拟合优度2R =0.9412,效果良好。
5.2问题二1)先统计出各天使用公共自行车的不同借车卡数量见附件中的【附件4】2)然后统计数据中每张出现过的借车卡累计借车次数 见附件中的【附件5】3)进行数据处理后得出每张借车卡累计次数(见附件中【附件6】) 分布情况:图4每张借车卡累计借车次数的统计如附表1,利用excel 画出其分布图像,如图4经观察,图像分布接近指数分布图像,再利用excel 进行拟合得到R 2=0.9728,非常接近于1,(R 2为优度系数,越接近1,拟合程度越好)因此每张借车卡累计接车次数的分布较符合指数分布 其函数为ey X-=073.02.3147算得:⎰+∞X-0073.02.3147e=1因此,进一步证明了每张借车卡累计接车次数的分布与指数分布具有满意的一致性。