全国大学生数学建模竞赛公共自行车服务系统
城市公共自行车服务系统数学建模论文

数学建模论文公共自行车服务系统毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:日期:指导教师签名:日期:使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:日期:学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:日期:年月日导师签名:日期:年月日注意事项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
全国大学生数学建模竞赛论文提交系统使用说明

附件2全国大学生数学建模竞赛组委会提供支持▪登录系统(P3)▪选题(P5)▪提交论文(P6)▪学生常见问题(P10)▪在竞赛开始后,参赛学生可以使用参赛队帐号登录系统,请注意正确选择“用户类型”、“所属赛区”、“所属学校”等信息。
▪登录成功后,可点击页面中的“进入后台”,完成参赛队管理操作▪竞赛开始后,通过学校审核的参赛队可以在“参赛队信息管理”页面进行选题操作。
注意:在选题确认后,请点击“保存选题”,保存后,竞赛期间不能修改。
▪说明:MD5码是一种文件校验编码,即使用“MD5校验工具”取得。
这里采用MD5码主要是为了保证学生上传文件的完整性,也保障公平竞赛的一个手段。
▪注意:▪任何对文件内容的修改和打开重新保存都会使文件的MD5码改变,但文件重命名、复制粘贴不改变MD5码;▪竞赛结束时间(2015年9月14日8:00)之前,参赛队必须将需要上传的电子版论文及支撑材料所对应的MD5码上传完毕,此后,文件内容不可更改;▪如果在上传了MD5码后,对论文或支撑材料又做了修改,只要在8点前参赛队就可以重新提取文件的MD5码,并再次上传;▪电子版论文提交的流程共3步(P24~P26)。
▪第1步:下载文件MD5码生成器(如已经下载,可以跳过)▪说明:校验工具可以在系统主页面和参赛队上传论文页面下载。
▪第2步:获取电子版论文和支撑材料的MD5码,并上传▪说明:参赛队可以根据实际确定是否提交“支撑材料”,如无“支撑材料”,可忽略“支撑材料MD5码”项。
▪说明:校验工具可以在系统主页面和参赛队上传论文页面下载,使▪第3步:上传电子版论文及相关支撑材料2015-09-11 08:00:00 ~ 2015-09-14 07:00:002015-09-14 07:00:01 ~ 2015-09-14 08:00:002015-09-14 08:00:01 ~ 2015-09-14 23:59:59▪注意:上传的电子版论文及支撑材料内容必须与获取MD5码的文件一致,其文件名要按照“论文编号规则”要求命名。
全国大学生数学建模竞赛历年赛题

全国大学生数学建模竞
赛历年赛题
Document number:WTWYT-WYWY-BTGTT-YTTYU-2018GT
全国大学生数学建模竞赛历年赛题
2009:AB
CD
2010:A储油罐的变位识别与罐容表标定
B2010年上海世博会影响力的定量评估
C输油管的布置
D对学生宿舍设计方案的评价
2011:A城市表层土壤重金属污染分析
B交巡警服务平台的设置与调度
C企业退休职工养老金制度的改革
D天然肠衣搭配问题
2012:A葡萄酒的评价
B太阳能小屋的设计
C脑卒中发病环境因素分析及干预
D机器人避障问题
2013:A车道被占用对城市道路通行能力的影响
B碎纸片的拼接复原
C古塔的变形
D公共自行车服务系统
2014:A嫦娥三号软着陆轨道设计与控制策略B创意平板折叠桌
C生猪养殖场的经营管理
D储药柜的设计
2015:A太阳影子定位
B“互联网+”时代的出租车资源配置
C月上柳梢头
D众筹筑屋规划方案设计。
城市公共自行车系统发展研究

这种不平衡增长, 全国很多城市特别是大城市交通所 面临 的压力愈来愈大,
交 通 阻 塞 特 别 是 城 市 中 心 区 的交 通 阻 塞 也 日渐 严 重 。 因此 交通 阻 塞 、 秩 序 混
乱、 事故多发、 污染加重等一系列城市交通 问题 己成采取一些应急的 措施如车辆单双号行驶、 部分路段的交通管制等等 。然而, 道路增建的速度 永远赶不上车辆的增长速度 ,势不可挡 的客货运量增长也不是靠行政 措施 可 以抑 制 的 。
二、 公共交通现状
目前, 在国外各大重要城市的公共交通系统 中, 地铁 以其便捷、 快速的 特 点逐渐代替公交、 巴士成为城市公共交通的主体, 而在视觉系统中又 以地 铁 的视觉设计最为成熟和全面。 而在我国, 随着经济增长和人们 生活水平的 提 高,我 国汽车保有量在进 一步快速增长。我 国民用汽 车的保有量从 1 9 9 8 年起每年 以1 0 %以上的速度高速增长。正是因为机动车与城市道路面积的
公 共 交 通 发 展 意 义 近年来城市化发展进一步加快, 中国正经历着一轮跨越式的发展机遇,
一
、
略有不 同。如杭州 的收费方式为1 小时内免费, 1 — 2 小时1 元, 2 - 3 小时2 元, 3 小时以上, 3 元/ 小时; 广州和北京则是1 小时内免费, 之后每小时收费1 元, 每 日累计收 费不超过1 O 元。而南 京的收费方式则 为前2 小时 免费, 2 - 5 小时, 1 元/ 小时, 5 小 时 以上 , 3 元/ d , 时, 收 费 价 格 相对 优 惠 。 公共 自行车服 务系统除了在杭州有运行外在南京 、 武汉、 北京 等城 市也 均有投人使用。 在各个城市, 自行车租赁点的设置大致相 同, 均 由公共 自行车 和租赁亭组成。公共 自行车租赁亭普遍被用于管理人员的服务 咨询和 维修 自行车的功能。而在旅游风景区 内的租赁亭通常被用为志愿者服务亭, 为群 众解答到一个新 的城市即时办理 公共 白行车租车手续、 即时使用的过程 中 遇到 的实际 困难和 间题, 并提供力所能及的旅游服务, 这为一个城市 的形象 提升起到了很大 的作用 。 2 0 1 3 年 高教社杯全 国大学生数学建模竞赛的D题就 是有关 自行车服务 系统的问题 ,题 目要求学生利用浙江省温州市鹿城区公共 自行车 管理 中心 提供的某2 0 天借车和还车的原始数据进行统计分析,得出各站点2 O 天 中每 天及累计的借车频次和还车频次, 累计的借车频次和还车频 次的排序 , 从而 进一步分析描述每次的用车时长分布情况等; 而最后 , 需要利用 得到的统计 分析结果对 公共 自行车服务系统 中出现的弊端, 提 出一些合理的建议 方案 , 给当地政府相关部 门提供参考意见 。这足见政府对公共 自行车 服务项 目的 重 视 程度 之 高 。 四、 环 境 与社 会 效 益 近几年我 国多个城市把 自行车纳人公共交通领域 ,意图让慢行交通 与 公共交通“ 无缝对接 ” , 破解交通末端“ 最后一公里’ ’ 难题 。方便居 民出行 , 同 时还有效 地节省能耗 , 减少碳 排放 , 具有 良好 的环境效益 , 公共 自行车替代 私家车 的环境效益最为明显。在成品油价格上涨、 交通拥堵 、 尾号 限行等多 种 因素下, 更多人开始关注这种新的出行方式 。 公共 自行车如此受欢迎, 最重要的一个原因就是方便, 而正是 这些遍 布 城市各个角落的服务 点, 蕴藏着商机 。 例 如杭州市政府想出了一个颇具商业 智 慧的办法: 以亭养车。 在杭州 公共 自行车租赁系统中, 租赁亭的用处五花八 门, 如奶茶等各类饮 品的销售, 报刊杂志及旅游地图的出售, 体育彩票 的发售 等 。这一措施值得其它城市学习。 服务点创造的巨大财 富将逐渐摆脱政府投资的状况 , 实现公共 自行车 自身盈 利。相信 随着服务点不断增多, 对服务亭地 理位置 的分析和之后的 合理使用, 以及总体的 良好规划 , 租赁亭会给 公共 自行车带来长远 的乐观改
高教社杯全国大学生数学建模竞赛B题参考答案

交巡警服务平台的设置与调度优化分析摘要本文以实现警察的刑事执法、治安管理、交通管理、服务群众四大职能为宗旨,利用有限的警务资源,根据城市的实际情况与需求合理地设置了交巡警服务平台、分配各平台的管辖范围及调度警务资源。
并分别对题目的各问,作了合理的解答。
问题一:(1)、根据题目所给数据,确定各节点之间的相邻关系和距离,利用Floyd 算法及matlab编程求出两点之间的最短距离,使其尽量满足能在3分钟内有交巡警平台警力到达案发结点的原则,节点去选择平台,把节点分配给离节点距离最近的平台管辖,据此,我们得到了平台的管辖区域划分。
(2)、我们对进出该区的13条交通要道实现快速全封锁的问题,我们认定在所有调度方案中,某种方案中耗时最长的的围堵时间最短即最佳方案,利用0-1变量确定平台的去向,并利用线性规划知识来求解指派问题,求得了最优的调度方案。
(3)、在确定增添平台的个数和具体位置的问题中,我们将尽量保证每个节点都有一个平台可以在三分钟内到达作为主要原则来求解。
我们先找出到达每个平台的时间都超过三分钟的节点,并尝试在这些节点中选取若干个作为新的平台,求出合理的添加方案。
问题二:(1)、按照设置交巡警服务平台的原则和任务,分析现有的服务平台的设置是否合理,我们以各区覆盖率作为服务平台分布合不合理的评价标准,得到C、D、E、F区域平台设置不合理。
并尝试一些新的设置方案使得设置更为合理,最后以覆盖率最低的E区为例,使用一种修改方案得到一个比原方案更合理的交巡警服务平台的设置方案。
(2)、追捕问题要求在最快的时间内抓到围堵罪犯,在罪犯和警察的行动速度一致的前提假设下,我们先设定一个具体较小的时间,编写程序检验在这个时间内是否可以成功抓捕罪犯,不行则以微小时间间隔增加时间,当第一次成功围堵时,这个时间即为最佳围堵方案。
关健字: MATLAB软件,0-1规划,最短路,Floyd算法,指派问题一、问题重述“有困难找警察”,是家喻户晓的一句流行语。
全国大学生数学建模大赛 交巡警服务平台的设置和调度

交巡警服务平台的设置和调度摘要本文针对交巡警服务平台的设置和调度问题,通过题目给出的全市交通信息,采用弗洛伊德算法思想、借助矩阵、MATBLE和LINGO软件,求出最短距离矩阵和最短路径矩阵,再过数据的分析、筛选和计算,将目标函数进行优化。
针对A区问题一:根据最短路径原则,利用弗洛伊德算法计算A区92个路口任意两个之间的最短路径距离。
首先,根据距离最短原则建立数学模型,即根据最短路径进行分配;其次,对模型进行优化,对模型增加各平台的工作量,即为平台到节点的距离和该节点的案发频率的乘积。
为使达到相对工作量均衡(大于10的即为不公平),将其大于10的进行调整。
针对A区问题二:将问题转化为求所有方案中到达指定A区出入口路径最长的交巡警平台的最小值问题,建立目标规划模型,即对13个出入A区的节点实现最短时间封锁,同时一个交巡警服务平台只能封锁一个出入路口。
运用LINGO 程序,进行求解,最优解为Km。
MIN0155.8针对A区问题三:对于该问题主要总结上面两小问,在满足各交巡警服务平台到达各管辖节点最长时间小于三分钟且工作量相对均衡下,求交巡警服务平台增加数的最小值。
建立在符合相应约束条件求最小值的线性规划问题,求得最优解为新增四个交巡警服务平台。
关键词Floyd算法整体规划优化决策问题重述为了有效地贯彻实施警察刑事执法、治安管理、交通管理、服务群众的职能,需要在市区的一些交通要道和重要部位设置交巡警服务平台,且各职能和警力配备基本相同。
警务资源是有限的,问题在于根据城市的实际情况与需求合理地设置交巡警服务平台、分配各平台的管辖范围、调度警务资源。
1.中心城区A要解决的问题(1)根据题目给出的各附表,为各交巡警服务平台分配管辖范围,使其在所管辖的有突发事件尽量能在三分钟内到达。
(2)调度全区20个交巡警服务平台的警力资源,对进出该区的13条范围内出现突发事件时,要道实现快速全封锁。
设计该区交巡警服务平台警力合理的调度方案。
2023高教社杯数学建模竞赛a题思路

2023高教社杯数学建模竞赛A题思路题目A:城市共享单车调度优化问题背景介绍:随着共享经济的发展,共享单车已成为城市出行的重要方式。
然而,在高峰时段,共享单车的需求量激增,导致部分区域出现车辆短缺,而其他区域则出现车辆过剩的情况。
为了解决这个问题,需要对共享单车的调度进行优化。
任务要求:本题要求参赛者建立数学模型,通过数据分析与优化算法,为城市共享单车公司提供以下方面的建议:预测不同时段的共享单车需求量;根据预测需求量,制定合理的调度计划;优化调度计划,以降低调度成本和提高用户满意度。
思路分析:数据收集与处理首先,需要收集城市共享单车的相关数据,包括各区域的共享单车使用量、高峰时段、用户行为等。
对数据进行清洗、整理和预处理,为后续分析提供准确的基础。
需求预测模型建立采用时间序列分析、回归分析或机器学习等方法,对历史数据进行建模,预测未来不同时段的共享单车需求量。
可以考虑以下因素:天气、节假日、交通状况、用户习惯等。
调度计划制定根据预测需求量,制定初步的调度计划。
可以考虑以下策略:增加车辆投放、调整车辆分布、设置临时停车点等。
根据实际情况,对调度计划进行调整和优化。
优化算法应用为了降低调度成本和提高用户满意度,需要应用优化算法对调度计划进行进一步优化。
可以采用整数规划、动态规划或遗传算法等方法,对车辆调度进行优化。
考虑不同区域的共享单车需求量、车辆行驶时间、用户等待时间等因素。
系统设计与实现根据上述分析结果,设计并实现一个城市共享单车调度优化系统。
该系统能够根据实时数据和预测需求量,自动生成调度计划并实时调整。
同时,能够提供可视化界面,方便管理人员进行监控和决策。
方案评估与改进对优化后的调度计划进行评估,可以采用成本效益分析、用户满意度调查等方法。
根据评估结果,对调度计划进行进一步改进和优化,以提高方案的实际效果。
总结:本题通过城市共享单车调度优化问题,要求参赛者综合运用数据分析与优化算法,为共享单车公司提供有针对性的建议。
2013年数学建模d题公共自行车服务系统

2013年数学建模d题公共自行车服务系统2013年,数学建模竞赛中的D题涉及到公共自行车服务系统。
公共自行车服务系统是指一种城市中提供给居民使用的自行车共享系统,旨在解决城市交通拥堵问题,提倡绿色出行和健康生活方式。
为了建立一个高效的公共自行车服务系统,需要考虑以下几个方面:1. 路线规划:为了提供便捷的自行车租借和归还服务,需要合理规划自行车站点的位置和数量。
数学建模可以根据城市人口分布、交通流量和出行需求等因素,通过建立数学模型来确定最佳的自行车站点布局方案。
2. 自行车调度:在公共自行车服务系统中,自行车的调度是一个重要的问题。
如何保证每个自行车站点都有足够的自行车供居民租借,同时又避免出现某些站点自行车过多的情况,是需要解决的优化问题。
数学建模可以通过建立自行车调度模型,考虑自行车租借和归还的需求,制定合理的自行车调度策略,以提高系统的效率和用户的满意度。
3. 车辆维护:在公共自行车服务系统中,自行车的维护和修理是不可避免的。
如何合理安排自行车的维护和修理任务,以及如何减少因维护导致的系统中断时间,也是需要解决的优化问题。
数学建模可以通过建立自行车维护模型,考虑自行车的使用情况和维护成本等因素,制定合理的维护计划,以提高系统的可靠性和可用性。
4. 用户满意度评价:公共自行车服务系统的目标是提供高质量的服务,满足用户的出行需求。
因此,对于公共自行车服务系统的用户满意度评价也是一个重要的方面。
数学建模可以通过建立用户满意度评价模型,考虑用户的需求和反馈意见,评估系统的性能和改进空间,以提高用户的满意度和忠诚度。
随着城市化进程的加快和人们对健康出行方式的需求增加,公共自行车服务系统在各个城市中得到了广泛的应用和推广。
通过数学建模,可以帮助优化公共自行车服务系统的设计和运营,提高系统的效率和用户的满意度,为城市居民提供便捷、环保的交通选择。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D题公共自行车服务系统公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及。
在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。
附件1为浙江省温州市鹿城区公共自行车管理中心提供的某20天借车和还车的原始数据,所给站点的地理位置参见附件2(详细信息可以参考温州市鹿城区公共自行车管理中心网站:)。
请你们在搞清楚公共自行车服务模式和使用规则的基础上,根据附件提供的数据,建立数学模型,讨论以下问题:1. 分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序。
另外,试统计分析每次用车时长的分布情况。
2. 试统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。
3. 找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。
(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
4. 请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
5. 找出公共自行车服务系统的其他运行规律,提出改进建议。
附件1:公共自行车数据(内含20个Excel文件)附件2:公共自行车站点分布图1 问题分析1. 分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序。
另外,试统计分析每次用车时长的分布情况。
分析:把问题1分为3个步骤进行:(1)统计各站点20天中每天及累计的借车频次和还车频次;(2)所有站点按累计的借车频次和还车频次分别给出它们的排序;(3)统计分析每次用车时长的分布情况。
(直方图表示)2. 试统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。
分析:将问题2分为2个步骤进行:(1)统计20天中各天使用公共自行车的不同借车卡(即借车人)数量;(2)统计数据中出现过的每张借车卡累计借车次数的分布情况(直方图表示)3. 找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。
(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
分析:首先通过数据分析找出合计使用公共自行车次数最大的一天。
将问题3分为6个步骤:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离;(2)对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计;(28min)(3)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布;(4)找出各站点的借车高峰时段和还车高峰时段;在地图上标注或列表给出高峰时段各站点的借车频次和还车频次;对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
4. 请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
5. 找出公共自行车服务系统的其他运行规律,提出改进建议。
分析:第4,5小问是根据分析结果提出建议,故不用再进行步骤的详细划分。
通过将原问题细分为每个步骤,有利于加强我们对于问题的理解和模型的构建。
2 基本思路通过对于问题的拆解理解,该问题的解决应该主要分为以下几个模块:(1)数据整理:题目给定的附件的数据多达63多万份,其中不乏有很多无效数据,例如:只有借出时间,没有归还时间;借车时间小于1分钟等。
需要对数据进行预处理,获得对我们有用的数据。
(2)数据分析:问题1,问题2,问题3中有较多的数据分析步骤。
我们对预处理过后的数据针对不同的问题需求进行特定分析获得结果。
(3)针对两站点之间的距离定义,我们根据借还车高峰期不同于普通用车时期。
在高峰时期添加了修正因子对模型进行再处理。
(4)在问题3中,需要我们针对合计使用公共自行车次数最大的一天进行特定分析。
要求找出各个站点借还车高峰时段,对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
(5)针对问题1,2,3的分析结果提出建议。
3 模型假设1.假设每个时间区间内频数最大的即为高峰时期;2.假设自行车不出现丢失,损坏,不归还等情况;3.假设由于通过数据无法准确获知自行车的行车时间,我们假设自行车一直在行驶;4.假设数据没有出现人为的修改;5.假设除了没有归还时间的系统数据的错误外,没有借车卡错误的情况存在。
6.假设自行车在使用时没有发生故障。
4 数据预处理处理思路:有关数据处理的方法有很多,主要有SPSS,Excel,MATLAB等。
我们借鉴了《城市公共自行车服务系统运行状况和效率分析》中提到的MATLAB 数据导入分析方法,能够得到有效的结果,但是时耗较大,63万的数据量要40分钟左右才能预处理完毕。
基于以上原因,我们采用了SPSS来进行数据分析,能够较为快速有效的得到所需结果。
处理工具:SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件,IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。
SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。
SPSS也有专门的绘图系统,可以根据数据绘制各种图形。
处理方式:先将20天的数据依次导入SPSS文档,将其中跟数字有关的变量数据类型从字符串类型修改为数值类型,便于比较计算。
经过处理过后的数据一共有600291个(附件1)预处理条件:(1)用车时间过短(1分钟以下),删除用车时间在0-1分钟之间的数据;(2)删除只有借车时间,没有还车时间的数据5 模型建立与求解5.1问题1把问题1分为3个步骤进行:1.统计各站点20天中每天及累计的借车频次和还车频次;2.所有站点按累计的借车频次和还车频次分别给出它们的排序;3.统计分析每次用车时长的分布情况。
(直方图表示)5.1.1 每天每站点借还车统计我们将每天预处理过后所得到的数据导入SPSS中,通过分别将借出车站号和还车车站号设置为“频率统计”变量,得到下图,并进行排列:分别统计得到20天中的每天的累计借车频次和还车频次。
结果如下图。
5.1.2 各站点借还车排序我们先将预处理过后的表格合并为一个表。
其后的处理方式与第一步的处理方式相同,统计得到每个站点20天借出的自行车总量。
累计还车频数的处理方式与累计借车频数的处理方法类似。
分别得到20天每个站点的还车,借车的总频次后,导出至Excel。
通过Excel 的排序功能,我们可以自由地设置降序或者是升序排列。
(结果如下图)累计借车数导出至Excel未排序(原始数据图):累计借车数排序(数据处理图):累计还车数导出至Excel未排序(原始数据图):累计还车数排序(数据处理图):5.1.3 用车时长分布通过将预处理数据中的还车时间与用车时间作差得到用车时长(精确到秒)。
统计处理前将用车时长“四舍五入”,便于SPSS进行统计。
将用车时长设置为“频率统计”变量,获得每个时长的用车频次数,导入Excel,按照用车时长进行升序排列。
同时处理数据得到平均值,中位数以及众数(单位:min)。
(结果如下图)通过表格可以得知,低于20分钟的自行车使用数占到了总数的76.9%,而根据中位数,众数,以及平均数的分析,其值也落在这个区间范围内。
可以分析出,该区域的人们出行选择自行车的方式大多为短途。
这样既可以提升出行效率,避开交通堵塞,更能够强身健体,提高生活质量。
5.2问题2将问题2分为2个步骤进行:1.统计20天中各天使用公共自行车的不同借车卡(即借车人)数量;2.统计数据中出现过的每张借车卡累计借车次数的分布情况(直方图表示):5.2.1每天借车卡累计借车数量将预处理过后的20天数据导入SPSS中,依次将“第一天,第二天……”设置为“频率统计”变量,统计每天的不同借车卡出现频次,导入Excel。
(如图所示)。
通过分析表格数据可以得出,20天的平均值大约为15300。
第3,9,10,16天的借车卡数量与平均值相差较远,可能是改天的天气状况较差,不宜骑自行车出行。
第19,20天借车卡数量较多,特别是第20天为数量最多的一天,分析为周末假期出游。
向前推算,第13,14,6,7天也为周末,数据显示的结果与推论结果相符。
5.2.2 每张借车卡累计借车次数分布我们构造一个新的SPSS数据库,将20天所有借车号导入到同一列中,将借车号设置为“频率统计”变量,统计每一个借车号出现的次数。
再导出到Excel 中分析处理。
(如下图)获得的每个借车卡借车次数:将借车次数设置为“频率统计”变量:(统计每个借车次数的频次)由统计结果分析,可以看到,大多数使用次数趋近于20次以内,也就是每天1次。
存在小部分使用次数过多,可能存在使用时长越长,平均时长费用越高等问题。
但这种情况占小部分,属于可控范围内。
我们将每张借车卡使用次数作函数拟合(左端为指数分布的拟合图,右端为正态分布拟合图)通过变量和函数的拟合程度,以及拟合过后的函数偏离程度(指数分布:0.05;正态分布:0.3)可以得出指数分布的置信度为95% 。
可以发现所求变量具有较好的指数分布特性,随着使用次数的增多,出现的概率逐渐降低。
我们再次使用点估计中的最大似然估计来进行分析。