基于手机信令数据的居住和出行特征分析——以深圳市为例

合集下载

《2024年基于手机信令大数据的京津冀城市群人口时空分布与流动特征分析》范文

《2024年基于手机信令大数据的京津冀城市群人口时空分布与流动特征分析》范文

《基于手机信令大数据的京津冀城市群人口时空分布与流动特征分析》篇一一、引言随着信息化和数字化的飞速发展,手机信令大数据在分析城市群人口时空分布与流动特征方面发挥了重要作用。

本文以京津冀城市群为例,通过手机信令大数据的分析,探究其人口时空分布的规律及流动特征,旨在为城市群的发展规划、政策制定和资源配置提供科学依据。

二、研究区域与数据来源京津冀城市群作为我国北方重要的经济、文化和政治中心,其人口时空分布与流动特征具有重要研究价值。

本研究采用的手机信令大数据,来源于各大通信运营商在京津冀地区的用户数据,包括用户的通话、短信和网络使用记录等。

三、研究方法本研究采用数据挖掘、统计分析、空间分析等方法,对手机信令大数据进行处理和分析。

首先,通过数据清洗和整理,提取出与人口时空分布和流动相关的信息;其次,利用统计方法分析人口的空间分布和时间变化;最后,通过空间分析技术揭示人口流动的特征和趋势。

四、京津冀城市群人口时空分布特征1. 空间分布特征:通过手机信令大数据的分析,发现京津冀城市群的人口分布呈现出明显的集聚效应。

北京、天津等大城市是人口的主要集聚区,而周边小城市和农村地区的人口相对较少。

此外,不同区域的经济发展水平、教育资源、医疗条件等因素也影响了人口的分布。

2. 时间变化特征:通过对比不同时间段的数据,发现京津冀城市群的人口分布随时间发生变化。

随着城市化进程的加快,大城市的人口数量呈现持续增长的趋势,而周边小城市和农村地区的人口则出现流失或增长缓慢的现象。

五、京津冀城市群人口流动特征1. 流动方向:根据手机信令大数据的分析,京津冀城市群的人口流动主要发生在大城市之间以及大城市与周边小城市之间。

其中,北京作为核心城市,吸引了大量周边地区的人口流入。

2. 流动原因:人口流动的原因主要包括就业机会、教育资源、生活环境等。

大城市由于经济发达、就业机会多、教育资源丰富等因素吸引了大量人口流入。

而周边小城市和农村地区由于经济发展相对滞后、生活环境较差等原因导致人口流失。

用出租车GPS数据分析深圳市道路交通况

用出租车GPS数据分析深圳市道路交通况

用出租车GPS数据分析深圳道路交通情况摘要随着城市经济的发展,城市交通量不断增大,出租车通过安装GPS终端,将交通信息反馈给管理中心,为城市交通进行合理的规划做出了贡献。

本文利用深圳市出租车GPS数据,解决了交通小区的划分,OD时空分布的计算和预测等问题。

针对问题一,由于数据量庞大,本文选取2011/4/19一天的数据进行处理。

选取车辆状态status从0变为1,从1变为0对应的坐标分别作为出租车载客的起讫点,对数据进行筛选。

根据筛选后的数据,利用出租车起讫点的密集程度用基于密度的聚类算法—DBSCAN聚类进行交通小区的划分,得到划分图。

针对起讫点过于密集且没有进行划分的区域,结合深圳市交通地图,采用K-Means空间聚类对这些地区进行细分,最后将深圳市划分为A-K等11个交通小区,划分结果见图6,对比深圳市行交通地图发现本文划分的小区与其大致吻合。

本文通过计算小区内各点经纬度的平均值作为小区的坐标。

如A区坐标:(114.23,22.56)。

针对问题二,本文用OD矩阵表示OD时空分布,选取2011/4/19,7:40时刻做具体计算说明。

首先计算出该时刻下,车辆状态status为1,即出租车重载或者开始载人的地点与各小区坐标的马氏距离,选取马氏距离较小的小区作为载客出租车起点的所属小区,追踪载客出租车的讫点,用同样的方法计算出讫点所属小区。

对到达每个小区的车次进行累加求和,即可得到该时刻各小区之间的交通量,即OD时空分布。

例如7:40从E区前往K区的人数为130。

用同样方法可以计算出任意时刻载客出租车的OD时空分布。

针对问题三,首先建立居民出行选择出租车作为交通工具的概率随小区间距离变化的隶属度函数,计算出各小区之间居民选择出租车来往的概率。

然后挑选出居民出行特征明显的五个时刻:1:20,7:40,12:30,17:30,21:30,分别计算载客出租车的OD时空分布,之后根据各小区之间出租车通行的概率求解出居民出行的OD时空分布。

基于手机信令定位数据的居民出行时空分布特征提取方法

基于手机信令定位数据的居民出行时空分布特征提取方法

基于手机信令定位数据的居民出行时空分布特征提取方法李祖芬;于雷;高永;吴亦政;龚大鹏;宋国华【期刊名称】《交通标准化》【年(卷),期】2016(002)001【摘要】为了得到可靠的居民出行时空分布特征,并为城市交通规划提供准确的出行现状数据,基于手机信令定位数据设计了提取居民出行时空分布特征的方法.通过对重复冗余的手机数据进行处理、运用地理信息系统将手机数据映射至所研究的交通区域、划分交通小区、定义出行识别、建立OD矩阵及绘制出行期望线等出行数据挖掘,得到了居民的出行时空分布特征.为了验证设计方法的可行性,以北京市的手机信令定位数据为例,提取出北京市居民的出行时空分布特征,并将所得的结果与北京市第4次综合交通调查的数据进行对比得出:两者的出行时间分布特征平均偏差为0.78%,早晚高峰进出城方向比例的偏差为0.1,全市的出行发生量与吸引量的平均偏差均小于3%.【总页数】7页(P51-57)【作者】李祖芬;于雷;高永;吴亦政;龚大鹏;宋国华【作者单位】北京交通大学城市交通复杂系统理论与技术教育部重点实验室,北京100044;北京交通大学城市交通复杂系统理论与技术教育部重点实验室,北京100044;德克萨斯南方大学理工技术学院,美国休斯顿 77004;北京交通发展研究中心,北京 100161;加利福尼亚大学戴维斯分校土木与环境工程系,美国戴维斯95618;北京交通大学城市交通复杂系统理论与技术教育部重点实验室,北京100044;北京交通大学城市交通复杂系统理论与技术教育部重点实验室,北京100044【正文语种】中文【中图分类】U491.1【相关文献】1.基于手机信令定位数据的居民出行时空分布特征提取方法 [J], 李祖芬;于雷;高永;吴亦政;龚大鹏;宋国华;2.基于手机信令数据的人口高精度时空分布特征研究——以天津市小白楼CBD片区为例 [J], 陈伟; 翟国方; 张义杰3.基于手机信令数据居民出行链提取算法 [J], 肖志权; 张子民; 毛曦; 樊文平4.基于手机信令数据的居民出行调查扩样模型 [J], 陈小鸿;陈先龙;李彩霞;陈嘉超5.基于手机信令数据的武汉市居民出行疫后恢复分析 [J], 谭波;秦思娴;罗名海;李盼盼因版权原因,仅展示原文概要,查看原文内容请购买。

基于手机信令数据的游客行为研究——以泰山风景名胜区为例

基于手机信令数据的游客行为研究——以泰山风景名胜区为例

基于手机信令数据的游客行为研究——以泰山风景名胜区为例摘要:随着手机的普及和人们对旅游需求的提高,手机信令数据开始成为研究游客行为的重要数据源。

本文以中国著名的文化名山泰山为例,利用手机信令数据分析游客行为,并探讨其对旅游管理的指导意义。

关键词:手机信令数据;游客行为;泰山;旅游管理一、引言泰山是中国的著名文化名山,每年吸引着来自世界各地的大量游客。

随着手机的普及,手机信令数据成为研究游客行为的新的数据源。

通过分析手机信令数据,可以更加全面地了解游客在景区内的活动轨迹、游览时间分布以及游客数量等信息。

因此,本文将基于手机信令数据,研究泰山风景名胜区的游客行为,以期为景区的旅游管理提供一定的指导。

二、方法1. 数据收集:本研究采集了泰山风景名胜区2019年的手机信令数据。

通过与通信运营商合作,获得了在景区范围内的手机信令数据,包括手机信号强度、信号覆盖范围以及通信记录等信息。

2. 数据处理:根据手机信令数据,可以获得游客的位置信息、移动轨迹以及停留时间等。

通过对数据进行清洗和整理,得到可用于分析的数据集。

3. 数据分析:利用数据分析工具,对手机信令数据进行统计分析。

主要研究内容包括游客的游览路径、游览时间分布、停留点集中度等指标。

三、结果与讨论1. 游览路径:通过分析手机信令数据,可以重建游客在泰山景区内的游览路径。

研究发现,大部分游客按照固定的游览线路进行游览,其中包括观日出、游览主峰、祭拜文化景点等。

而一些独立游客则有较大的自由选择权,其游览路径更加多样化。

2. 游览时间分布:根据手机信令数据,可以确定游客在景区内的游览时间分布。

研究发现,泰山景区的游客主要集中在早上和下午,其中早上时间段的游客数量较多,主要是前来观日出的游客。

下午时间段的游客数量相对较少,主要是游览主峰和其他景点的游客。

3. 停留点集中度:利用手机信令数据,可以计算景区内每个区域的游客停留点的数量。

通过对比不同区域的停留点数量,可以发现主峰区域、祭拜文化景点等是游客停留较为集中的地方,而一些偏远区域则相对较少有游客停留。

基于大数据的手机信令数据分析与应用研究

基于大数据的手机信令数据分析与应用研究

基于大数据的手机信令数据分析与应用研究手机信令数据是指手机用户在进行通信时产生的各种信令数据,包括通话记录、短信记录、网络连接记录等。

随着移动互联网的快速发展,手机信令数据也呈现出爆炸式增长的趋势。

这些数据蕴含了大量的信息,可以用来进行用户行为分析、交通流量分析、城市规划等方面的研究与应用。

基于大数据的手机信令数据分析与应用研究是指利用大数据分析技术对手机信令数据进行挖掘和分析,以揭示潜在的信息和规律,并将分析结果应用于实际的领域。

一、手机信令数据分析的方法和模型手机信令数据分析的方法和模型主要包括数据清洗、数据预处理、特征提取、模型构建和结果验证等步骤。

首先,需要对原始数据进行清洗和预处理,去除重复、无效和缺失数据,以确保数据质量和准确性。

然后,利用数据挖掘和统计学方法对数据进行特征提取,提取出影响关键变量的特征,如通话时长、通话频率等。

接下来,根据特征选择和模型构建的要求,选择适当的机器学习算法或统计模型,构建预测模型。

最后,通过交叉验证和模型评估等方法,验证模型的可靠性和准确性。

二、手机信令数据分析的应用领域1. 用户行为分析:通过分析手机信令数据,可以了解用户的通话行为、上网行为和位置分布等。

这些信息可以帮助运营商制定个性化的营销策略,提供更好的用户体验,提高用户满意度和留存率。

2. 交通流量分析:手机信令数据可以用于城市交通流量的监测和预测。

通过对手机信令数据的分析,可以获得城市不同区域的通勤规律、出行方式和拥堵情况等信息,为城市交通规划和优化提供依据。

3. 社会安全和紧急事件响应:手机信令数据可以用于社会安全和紧急事件的监测和响应。

通过分析手机信令数据,可以提前发现异常行为和异常事件,并进行预警和应对措施,提高社会安全性和事件响应效率。

4. 城市规划和建设:手机信令数据可以用于城市规划和建设的决策支持。

通过分析手机信令数据,可以了解城市的人口分布、人流分布和活动空间分布,为城市基础设施建设和土地利用规划提供科学依据。

无锡基于手机信令数据的居民出行调查项目

无锡基于手机信令数据的居民出行调查项目

无锡基于手机信令数据的居民出行调查项目一、项目背景无锡市作为中国东部沿海城市之一,经济发达,人口密集,交通繁忙。

为了更好地了解居民的出行行为和习惯,提供科学依据为城市交通规划和出行管理决策服务,开展基于手机信令数据的居民出行调查项目具有重要意义。

二、调查目的1.了解无锡市居民的出行方式、出行目的、出行频次等基本情况;2.分析无锡市居民的出行时间分布、出行距离分布等出行特征;3.研究无锡市居民的出行模式选择、出行偏好等;4.探索无锡市居民出行行为与城市交通规划的关系。

三、调查内容1.出行方式:调查居民常用的出行方式,包括步行、自行车、公共交通、私家车等;2.出行目的:调查居民出行的目的,如工作、学习、购物、娱乐、就医等;3.出行频次:调查居民出行的频率,包括每天、每周、每月等;4.出行时间分布:调查居民出行的时间分布,如早高峰、晚高峰、平峰等;5.出行距离分布:调查居民出行的距离分布,如短途出行、中途出行、长途出行等;6.出行模式选择:调查居民在不同出行情景下的出行模式选择,如通勤、购物、休闲等;7.出行偏好:调查居民对不同出行方式的偏好程度,如对公共交通、自行车、步行等的喜好程度。

四、调查方法本项目采用基于手机信令数据的调查方法,通过采集和分析居民手机信令数据来获取出行相关信息。

具体步骤如下:1.数据采集:与无锡市的电信运营商合作,获取居民手机信令数据;2.数据处理:对手机信令数据进行清洗和预处理,提取出与出行相关的信息;3.数据分析:利用数据分析工具和方法,对提取出的数据进行统计和分析,得出相关结论;4.结果呈现:将分析结果进行可视化展示,生成报告和图表;5.数据保护:在数据处理过程中,严格遵守相关法律法规,确保个人隐私信息的保护。

五、预期成果1.出行特征分析报告:根据手机信令数据分析结果,撰写出行特征分析报告,包括出行方式、出行目的、出行频次、出行时间分布、出行距离分布等内容;2.出行模式选择研究报告:根据手机信令数据分析结果,撰写出行模式选择研究报告,探讨居民在不同出行情景下的出行模式选择;3.出行偏好调查报告:根据手机信令数据分析结果和调查问卷调查结果,撰写出行偏好调查报告,分析居民对不同出行方式的偏好程度;4.数据可视化展示:将分析结果进行可视化展示,生成报告和图表,便于理解和应用。

手机信令数据识别职住地的时空因素及其影响

手机信令数据识别职住地的时空因素及其影响

手机信令数据识别职住地的时空因素及其影响钮心毅;谢琛【摘要】使用手机信令数据识别职住地时,采用不同规则和参数取值可能导致结果差异.这种差异对职住地识别结果可靠性的影响程度值得研究.根据手机信令数据特性,提出职住地识别的时间连续性、空间位置分辨率、数据时间序列3个关键时空因素.采用4种时间规则、3种空间聚合距离、3种数据时间序列进行组合,对同一城市同一批手机信令数据进行职住地测算.比较不同时空因素下职住地识别结果的差异,采用识别率、平均直线通勤距离、共同识别用户一致性等指标验证结果的可靠性.研究表明,不同的时空因素对职住地识别结果产生显著影响.最后,探讨在实际应用中时空因素取值需注意的问题,并提出相关建议.【期刊名称】《城市交通》【年(卷),期】2019(017)003【总页数】11页(P19-29)【关键词】交通规划;手机信令数据;居住地识别;工作地识别;时空因素【作者】钮心毅;谢琛【作者单位】同济大学建筑与城市规划学院,高密度人居环境生态与节能教育部重点实验室,上海200092;同济大学建筑与城市规划学院,高密度人居环境生态与节能教育部重点实验室,上海200092【正文语种】中文【中图分类】U491.1+20 引言近年来,手机信令数据在城市交通、城市规划等领域引起了广泛关注,也已经在各大城市的交通调查、城市交通规划、城市总体规划中得到了较多实际应用[1-6]。

基于手机信令数据可以识别居民的居住地、工作地,从而获取通勤OD、揭示职住空间关系。

这是手机信令数据辅助交通调查、城市交通规划、城市总体规划的基础性工作[7-11]。

手机信令数据是手机用户在移动通信网络中留下的时空轨迹数据,只是记录了居民日常行为的时空轨迹。

使用手机信令数据识别居住地、工作地的基本原理是对手机用户长时间时空轨迹规律进行测算,以多日夜间的时空轨迹推算居住地、以多日日间的时空轨迹推算工作地。

职住地算法是采用某种规则对居住、工作行为的时间、空间特征进行归纳。

《2024年基于手机信令大数据的京津冀城市群人口时空分布与流动特征分析》范文

《2024年基于手机信令大数据的京津冀城市群人口时空分布与流动特征分析》范文

《基于手机信令大数据的京津冀城市群人口时空分布与流动特征分析》篇一一、引言随着信息技术的飞速发展,大数据已经成为研究城市群人口时空分布与流动特征的重要工具。

手机信令大数据作为大数据领域的重要组成部分,具有覆盖面广、实时性强、准确性高等特点,为城市群人口流动研究提供了新的视角。

本文以京津冀城市群为例,基于手机信令大数据,对其人口时空分布与流动特征进行分析,以期为城市规划、政策制定和社会经济发展提供参考。

二、数据与方法2.1 数据来源本文采用的手机信令大数据主要来源于各大通信运营商,数据包含了用户的移动轨迹、位置信息等。

此外,还结合了人口普查数据、社会经济统计数据等辅助分析。

2.2 研究方法本研究采用空间分析、时间序列分析、网络分析等方法,对手机信令大数据进行处理和分析,从而揭示京津冀城市群人口时空分布与流动特征。

三、京津冀城市群人口时空分布特征3.1 空间分布特征通过手机信令大数据,我们可以清晰地看到京津冀城市群的人口空间分布。

北京、天津作为核心城市,人口密集度较高;而河北地区的人口分布相对分散。

此外,各城市内部的人口分布也呈现出一定的空间差异性,如北京的CBD、中关村等地区人口密集度较高。

3.2 时间分布特征在时间分布上,工作日与节假日、白天与夜晚的人口流动存在明显差异。

例如,工作日的早晨和晚上,人们普遍从周边城市流向北京、天津等核心城市;而节假日则呈现出反向流动的趋势。

此外,随着季节的变化,人口流动也会有所调整。

四、京津冀城市群人口流动特征4.1 流动路径与网络结构通过手机信令大数据,我们可以构建出京津冀城市群的人口流动网络。

其中,北京、天津与其他城市之间的流动最为频繁。

此外,各城市内部的流动也呈现出一定的网络结构,如交通干线附近的节点成为人口流动的枢纽。

4.2 流动原因与动力机制人口流动的原因多种多样,包括就业、教育、医疗等因素。

随着京津冀一体化进程的推进,区域内的经济、文化、社会等方面的联系日益紧密,为人口流动提供了动力。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Hans Journal of Data Mining 数据挖掘, 2018, 8(4), 162-173Published Online October 2018 in Hans. /journal/hjdmhttps:///10.12677/hjdm.2018.84018Residential and Travel CharacteristicsAnalysis Based on Mobile Phone SignalingData—A Case in Shenzhen CityJiandong Qiu1, Qingya Lin1*, Qiang Li21Shenzhen Urban Transport Planning Center Co., Ltd., Shenzhen Guangdong2Traffic Information Engineering & Technology Research Center of Guangdong Province, Shenzhen GuangdongReceived: Aug. 20th, 2018; accepted: Sep. 5th, 2018; published: Sep. 12th, 2018AbstractThere is no obvious tendency for the data of mobile phone signaling data to be objective, compre-hensive and sampling. The data has strong spatiotemporal continuity and can be observed in the whole process of traffic travel, which is unmatched by any other data source. Using mobile phone signaling data to analyze the characteristics of urban traffic operation makes up for long cycle of the traditional traffic survey, heavy workload, small sample size and high cost. This paper studies the use of space-time information of mobile signaling data to visualize and analyze the characte-ristics of urban traffic travel. The analysis shows that there is still a strong job-commuting attrac-tion in the original SAR and the SEZ; most people live in Dongguan, Huizhou, working in Shenzhen.Living and employment are basically at the junction of the city. Early peak of travelling shows a clear east-west, north-south formation. Analyzing the results provides a reliable basis for trans-port planning and operations.KeywordsCell Phone Signaling Data, Data Quality Inspection, Big Data Analysis, Visualize基于手机信令数据的居住和出行特征分析——以深圳市为例丘建栋1,林青雅1*,李强2*通讯作者。

丘建栋 等1深圳市城市交通规划设计研究中心有限公司,广东 深圳 2广东省交通信息工程技术研究中心,广东 深圳收稿日期:2018年8月20日;录用日期:2018年9月5日;发布日期:2018年9月12日摘要手机信令数据样本量大、数据客观、全面、采样不会有很明显的倾向性,且数据具有较强的时空持续性,可以观测到交通出行整个过程,是任何其它数据源无法比拟的。

用手机信令数据分析城市交通运行特征,弥补了传统的交通调查周期性长、工作量大、样本量少和花费高的特点。

本文研究利用手机信令数据的时空信息,对城市交通出行特征进行可视化和科学分析,分析结果显示,原特区内与特区外仍有较强职住通勤吸引;住在东莞、惠州,职在深圳的人,居住和就业位置基本在城市间交界地带;早高峰出行形成明显东西向、南北向通道。

分析所得结果可为交通规划和运营部门提供可靠的依据。

关键词手机信令数据,数据质量检查,大数据分析应用,可视化Copyright © 2018 by authors and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/1. 引言目前,中国城市化进程仍处在快速演变阶段,城市建设步伐加快,城市用地规模不断加大,城市人口不断攀升,城市居民的时空出行范围进一步扩展,所面临的交通问题越来越严重[1]。

作为城市居民生活与生产的两大载体,“居住”与“就业”是城市空间结构中的两个核心内生变量,它们彼此依存、互相影响,两者是否均衡发展是影响城市居民生活幸福指数的关键指标,制约城市可持续发展的重要因素[2]。

传统的数据获取方法局限性明显。

作为新兴的研究方向——手机信令数据,一方面,手机用户群体数量和手机使用率的不断提高,保证了手机信令数据的样本数量和随机性特征[3];另一方面,无线通信网络覆盖区域的不断扩大,使得手机信令数据的时空信息具备时间连续性和空间广覆盖性等优点[4]。

本文基于手机数据,从多个层面上对深圳市居民活动与空间环境间的复杂关系做更加精细与全面的描述与解析,重点关注城市居民的职住分布、城市空间的流动性与相互作用机制,以及特定场景、特定人群的空间活动特征,开展深莞惠区域城市群落居民居住和就业空间关系及往来联系强度研究,对推动就业与居住均衡发展,把握城市发展规划,促进居住空间与产业空间拓展的联动与共赢显得非常必要。

2. 停留和出行地识别算法2.1. 数据概述数据来源于深圳市城市交通规划设计研究中心有限公司——未来交通实验室。

一共有2017年11月12日到2017年11月25日(共14天)的数据,其中工作日有10天。

数据空间范围为深圳、东莞和惠州这丘建栋 等三个城市的全域。

本文主要分析深圳居民交通出行时空变化和深莞惠市域间的职住关系。

手机信令数据包含的信息如下,见表1所示。

2.2. 人口类型划分本次研究通过人口的停留日期、时间和位置总体上将人口划分为两大类型(见图1):常住人口(停留时间超过7小时/天的、天数大于等于50%天)以及非常住人口。

常住人口又分为常驻人员和固定设备,其中定位位置一直不变的识别为固定设备;非常住人口中所有出现的日期里,停留时间均少于3个小时的识别为过境人员,其他为流动人员。

2.3. 居住地和工作地识别居住地的判别依据为0~8点、19~24点停留时间最长的基站为居住基站。

9~18点停留时间最长的基站,且在基站周围500米范围内停留时间大于4小时、天数大于等于50%天的为工作地基站。

2.4. 出行识别首先,按500米的距离对个体出行的轨迹点进行空间聚合,将停留时间超过30分钟的点作为一次停留活动点,两个相邻活动点为一次出行,一天中的第一个活动点和最后一个活动点也作为一次出行,这样可得到用户一天的出行链轨迹及出行次数和出行时间。

Figure 1. User type division 图1. 人口类别划分Table 1. Description of Mobile phone signaling data field 表1. 手机信令数据字段说明序号 字段名称 说明1 用户ID F14BE1E7E64922F873B889ED15FD900A2 时间 2016-09-11 08:12:243 基站大区 9904 4 基站小区 76,060,3115 经度 114.6627 6纬度23.6428丘建栋等2.5. 数据分析流程本文通过对比每天的手机信令数量,分析数据的接收质量情况,选取接收数据较稳定的日期用于后续的数据处理。

数据分析流程见图2,数据处理过程中剔除有杂质的数据,将Python语言编译的算法部署于Spark平台上,通过人口类别的划分、居住地、工作地和出行识别,计算得到相应的中间表,中间表存放于postgis数据库中,用于后续应用层做分析时调用计算,应用层通过Arcgis和Transcad将计算结果进行可视化。

3. 数据质量检查现今,手机信令数据已经被广泛应用于城市的交通特征出行分析,但是,不同的人清洗数据的算法、阈值设置都不一样。

为了保证算法的可靠性,需要对清洗的数据进行数据质量检验。

主要验证手机基站手机数据是否缺失,居住地和工作地识别、出行识别算法是否正确。

大致的检验过程如下:用手机数据的人口数与已有的数据进行比较,判别居住地和工作地识别算法的结果是否可靠;计算每小时的出行数量,从而找出数据收集比较稳定的日期作为后面出行特征分析;计算手机数据的早高峰OD,用于与宏观模型的早高峰出行OD对比,检查出行识别算法的正确性。

3.1. 人口分布比较考虑到手机数据中的人口不是全样数据,这里用各区人口数量占总人口比重进行比较。

比较结果显示(图3),不管是与宏观模型数据还是统计年鉴数据比较,误差最大不超过5%,误差最大的行政区为福田,可能原因是福田、罗湖区原本发展程度已达到饱和,且深圳原关外地区近年来建设用地不断扩大、交通路网不断完善、居民出行更加方便、配套设施逐渐齐全、居民的择居选择受就业岗位地理位置的制约力下降,人们很多会选择居住在原关外。

Figure 2. Process of data analysis图2.数据分析流程丘建栋等Figure 3. Population distribution of mobile data compare with macro-models and statistical yearbook图3. 手机数据与宏观模型和统计年鉴人口分布比较3.2. 早高峰OD比较与宏观模型(2014年)比较结果如图4所示,最大流量通道基本相似,特别是南部几个大区之间的关联度,连接宝安、南山、福田和罗湖的通道联系强度基本一致;龙华到南山和福田、龙岗到罗湖和龙华的联系关系也一样紧密。

相关文档
最新文档