人口数据格网化
基于夜间灯光数据的人口空间分布研究综述

国土资源遥感
REMOTE SENSING FOR LAND & RESOURCES
VoU31,No.3 Sep. ,2019
doi: 10. 6046//tzyyy. 2019. 03. 02 引用格式:肖东升,杨松.基于夜间灯光数据的人口空间分布研究综述[J].国土资源遥感,2019,31 ( 3 ) :10-19. ( Xmo D S, Yang S. A review of population spatial distribution based on nighttime light data# J $. Remote Sensing for Land and Resources ,2019,31 (3):10 — 19.)
基于夜间灯光数据的人口空间分布研究综述
肖东升1,2,杨松1
(1.西南石油大学土木工程与建筑学院,成都610500; 2.成都理工大学 地质灾害防治与地质环境保护国家重点实验室,成都610059)
摘要:人口空间分布信息是地理学科、资源学科和社会学科等研究中的基础信息,在城市规划和应急救援等实际应
用中具有十分重要的意义。利用自然地理和社会经济等多种辅助数据,可以很好地模拟人口分布情况。夜间灯光
第3期
肖东升,等:基于夜间灯光数据的人口空间分布研究综述
-11 -
云层分布信息,其搭载的线性扫描业务系统(opera tional linescan system, OLS )传感器能够探测到无云 情况下的城市灯光以及车流、渔船等发出的微弱灯 光,其后主要用于获取地表夜间灯光以反映人类活 动情况[7](早期影像数据以胶片形式保存,研究成 果较少且以描述性分析为主。自1992年起,美国空 军联合国家海洋和大气管理局(Ndtiondl Oceanic and Ataosphlc Administration, NOAA)开始整理、校 正和合成夜间灯光数据,并且在国家地球物理数据 中心%National Geographical Data Centac,NGDC)建立 了数字格式文档⑻,影像数据覆盖年份为1992— 2013年,大大促进了夜间灯光数据的研究应用。 2011年10月,美国国家极地轨道卫星% national pvIos orbiting painership, NPP)卫星成功发射,其上搭 载了新一代可见光及近红外辐射仪% visibla infrared imayiny radiometas suita,VIIRS),夜间灯光数据得到 了进一步发展。由此NGDC地球观测小组将工作 重心转移至NPP - VIIRS数据,学者也越来越多地 利用NPP - VIIRS数据进行研究[9-11](
210966113_基于NPP-VIIRS的福建省人口网格化方法改进对比分析

第48卷第3期西南师范大学学报(自然科学版)2023年3月V o l.48N o.3 J o u r n a l o f S o u t h w e s t C h i n aN o r m a lU n i v e r s i t y(N a t u r a l S c i e n c eE d i t i o n)M a r.2023D O I:10.13718/j.c n k i.x s x b.2023.03.013基于N P P-V I I R S的福建省人口网格化方法改进对比分析①黄耀裔,陈文成,陈显银,郑朝洪,赵益民泉州师范学院资源与环境科学学院/农村环境整治与废弃物资源化福建省高校重点实验室,福建泉州362000摘要:基于夜间灯光人口校正指数(N A N I)㊁城市夜间灯光校正指数(V A N U I)㊁人居指数(H S I)3种指数修正N P P-V I I R S夜间灯光过饱和与溢出效应的修正模型,直接面向网格,采用按县域中有人口分布的网格数加权,使用最小二乘法回归对人口空间网格化,并随机抽取一定比例网格化后的乡镇域样本加以验证.结果表明:①3种修正模型改进后的网格化系数均通过p=0.001的统计学意义检验,拟合优度增加㊁预测标准误差大幅降低;②3种修正模型的人口绝对误差(MA E)㊁人口纯方根误差(R M S E)㊁人口相对误差(M R E)值均有较大幅度降低;③3种修正模型两两之间的夹角余弦系数为0.981~0.996,每个网格绝对距离为29.1~75.8人,同一性大,互证有效.说明3种修正模型的改进既考虑了县域规模差异的影响又避免了建模过程中行政单元与网格单元的尺度变换,显著提高了人口网格化精度.关键词:N A N I;V A N U I;H S I;回归分析对比中图分类号:K910文献标志码:A文章编号:10005471(2023)03009409C o m p a r a t i v eA n a l y s i s o f I m p r o v e dP o p u l a t i o nG r i d d i n g M e t h o di nF u j i a nP r o v i n c eB a s e d o nN P P-V I I R SD a t aHU A N G Y a o y i, C H E N W e n c h e n g,C H E N X i a n y i n,Z H E N GC h a o h o n g,Z HA O Y i m i nC o l l e g eo f R e s o u r c e sa n dE n v i r o n m e n t S c i e n c e,Q u a n z h o uN o r m a l U n i v e r s i t y/K e y L a b o r a t o r y o f R u r a l E n v i r o n m e n t a l R e m e d i a t i o na n dW a s t eR e c y c l i n g F u j i a nP r o v i n c eU n i v e r s i t y/F i r s t-c l a s sM a j o r i nH u m a nG e o g r a p h y a n dU r b a n&R u r a l P l a n n i n g,Q u a n z h o uF u j i a n362000,C h i n aA b s t r a c t:T h r e e N D V I-m o d i f i e d m o d e l sb a s e do n N P P-V I I R Sn i g h tl i g h ts u p e r s a t u r a t i o na n ds p i l l o v e r e f f e c t sw e r e d e v e l o p e d a n d a p p l i e dd i r e c t l y t o g r i d s.T h em o d e lw a sw e i g h t e db y t h e n u m b e r o f g r i d sw i t h p o p u l a t i o nd i s t r i b u t i o n i n t h e c o u n t y,a n d t h e l e a s t s q u a r e s r e g r e s s i o nw a s u s e d t o g r i d t h e p o p u l a t i o n,a n d t h e na c e r t a i n p r o p o r t i o no f r a n d o m l y s e l e c t e d t o w n f i e l ds a m p l e sw e r eu s e d f o rv e r i f i c a t i o n.T h ee x p e r i-m e n t a l r e s u l t s s h o w e d t h a t:①t h e c o e f f i c i e n t s o f t h e t h r e em o d e l s a f t e r t h e i m p r o v e m e n t o f t h e g r i dm e t h-①收稿日期:20221107基金项目:福建省社会科学基金项目(F J2021B072);福建省科技项目(2021J01974);福建省中青年教师教育科研项目(J A T200543, J A T200549).作者简介:黄耀裔,高级实验师,主要从事人口与地理信息系统应用的研究.通信作者:赵益民,副教授.o dh a v e p a s s e d t h e s t a t i s t i c a l s i g n i f i c a n c e t e s t o f p =0.001.T h i sm e a n s t h a t t h e f i t t i n g d e g r e e h a s i n c r e a s e d a n d t h e p r e d i c t i o n s t a n d a r d e r r o r h a s d e c r e a s e d s i g n i f i c a n t l y.②T h eMA E ,R M S Ea n d M R Eo f t h e t h r e e m o d e l s h a v ed e c r e a s e ds i g n i f i c a n t l y .③T h ea n gl ec o s i n ec o e f f i c i e n t sb e t w e e nt h e t h r e e m o d e l sw e r eb e -t w e e n0.981a n d 0.996,a n d t h ea b s o l u t ed i s t a n c eo f e a c h g r i dw a sb e t w e e n29.1a n d75.8p e r s o n ,w h i c h h a sh i g hc o n s i s t e n c y a n d i sm u t u a l l y ef f e c t i v e .I n c o n c l u s i o n ,t h e t h r e em o d e l s h a v e t a k e n i n t o a c c o u n t t h e i n f l u e n c eo f t h e d i f f e r e n c e i n s c a l e o f t h e c o u n t y an d a v o i d e d t h e s c a l e t r a n s f o r m a t i o nb e t w e e n t h e a d m i n i s -t r a t i v eu n i t a n d t h e g r i du n i t ,w h i c hs i g n i f i c a n t l y i m p r o v e d t h e a c c u r a c y o f p o p u l a t i o n g r i d d i n g .K e y wo r d s :N A N I ;V A N U I ;H S I ;r e g r e s s i o na n a l y s i s c o m p a r i s o n 目前的人口普查数据主要以不同级别的行政区划为统计单元进行统计,难以与自然㊁人文要素相匹配,不利于多源数据间的融合分析.人口空间网格化具有解决行政单元边界不稳定㊁同级规模悬殊的效果[1],使人口空间分布更接近实际,可以实现人口与社会经济㊁自然资源㊁生态环境等的有效融合[2].国内外学者对人口空间网格化进行了诸多研究,利用与人口相关程度高且数据来源较为容易的相关数据进行人口网格化分析成为目前的研究目标.赵鑫等[3]基夜间灯光㊁土地利用等构建指标体系后采用主成分赋权法确定权重后的广州市人口网格化;李翔等[4]基于夜间灯光数据和空间回归模型在乡镇域尺度下对上海市常住人口格网化;柏中强等[5]基于土地利用数据㊁居民点信息㊁D E M ㊁夜晚灯光数据等多源数据,利用多元回归方法进行人口分布格网化.诸多文献研究多以土地利用㊁居民地㊁交通廊道㊁夜间灯光数据㊁D E M ㊁居住建筑斑块㊁通信㊁P O I 等[6-8]多源辅助数据为主进行空间网格化,但多源数据存在获取难度大,获取的多源数据常常出现时间和空间尺度不一的问题.根据福建省乡镇域尺度的第7次人口普查统计数据以及N P P -V I I R S 夜间灯光㊁N D V I 植被指数等数据,本文利用N A N I ㊁V A N U I [9]㊁H S I [10-11]3种灯光修正模型,采用直接面向网格的加权个案(样本加权)及加权最小二乘法(W e i g h t e dL e a s t S q u a r e s ,W L S )分别对3种修正模型的回归建模进行人口网格化,根据两两余弦相似系数㊁绝对距离差异系数等同一性指标互证模型合理性,并随机抽取不同比例乡镇域尺度下的网格化结果,采用MA E ,R M S E ,M R E 和加权MA E ,R M S E ,M R E 验证网格化精度.1 数据来源及预处理1.1 研究区数据①福建省行政区划数据:源于福建省1ʒ20万比例尺的栅格地图经几何校正后投影为U T M 后的矢量化数据(包含县域㊁乡镇域等面状数据).②网格数据:采用G I S 软件 渔网 功能构建的1k mˑ1k m 网格,与福建省区划数据相交叠加分析得到全省1k mˑ1k m 基准网格.③人口统计数据:福建省第7次人口普查的常住人口统计数据,往上汇总分别作为乡镇域㊁县域尺度的矢量数据属性值.④N P P -V I I R S 夜间灯光数据:利用2020年12个月的N P P -V I I R S 月份数据合成为年均数据[12].⑤N D V I 植被指数数据:利用2020年12个月的N D V I 月份数据经算术平均合成为年均数据.1.2 数据预处理N P P -V I I R S ㊁N D V I 数据采用最邻近法设置为1k mˑ1k m 尺度像元后,将夜间灯光的D N 值㊁N D V I 的D N 值分别转点后,通过空间叠加分析分别赋值基准网格.为便于N P P -V I I R S 灯光修正数据与人口建模,将最大值规范化变换后的变量记为x k ㊃x k =d n k /n t l m a x ,x k ɪ[0,1],当x k =0表示为无灯光,x k =1表示为夜间灯光饱和.2 面向网格的人口网格化2.1 面向网格的人口网格化处理流程将县域用于建模与网格化,乡镇域人口数据用于模型外推与网格化结果精度验证,网格化处理流程分为4个步骤(图1):①夜间灯光修正模型构建;②加权个案及加权最小二乘法回归建模;③模型外推㊁网格化精度验证;④人口网格化及 零误差 优化调整.59第3期 黄耀裔,等:基于N P P -V I I R S 的福建省人口网格化方法改进对比分析2.2 N P P -V I I R S 修正模型由于N D V I 数据的分辨率与精度优于N P P -V I I R S 数据,二者融合可有效缓解灯光像元饱和溢出效应,强化夜间灯光区域的内部强度差异.为便于表达融合后的灯光修正模型,本文将其设为x l (l表示修正方法,l =1,2,3),分别代表N A N I 修正模型(x 1)㊁V A N U I 修正模型(x 2)和H S I 修正模型(x 3),计算方法如下.N A N I 修正模型记为x 1,计算公式如下x 1(,)k =0(n d v i k <0.1o rn d v i k >0.9)x k +(1-n d v i k )(1-x k )+n d v i k (0.1ɤn d v i k ɤ0.9)0(x k =0)ìîíïïïïï(1)V A N U I 修正模型记为x 2,计算公式如下x 2(,)k =(n d v i k ɤ0.1o rn d v i k ȡ0.9)(1-n d v i k )㊃x k (0.1ɤn d v i k ɤ0.9){(2)H S I 修正模型记为x 3,计算公式如下x 3(,)k=0(n d v i k <0.1o rn d v i k >0.9)1-n d v i k +x k1-x k +(1+x k )㊃n d v i k (0.1ɤn d v i k ɤ0.9)0(x k =0)ìîíïïïïï(3)式中:下标(,)中省略了网格继承的县域㊁乡镇域的I D 码i 和j ,全文下标k ,(,)k ,(i ,)k ,(,j )k 均指网格I D 码等于k 的网格,i ,j 仅为强调处在i 县域㊁j 乡镇域中.n d v i k 为第k 网格的N D V I 的D N 值;x 1(,)k=x 1(i ,)k =x 1(,j )k =n a n i k 为k 的N A N I 值,x 2(,)k =x 2(i ,)k =x 2(,j )k =v a n u i k 为k 的V A N U I 值,x 3(,)k =x 3(i ,)k =x 3(,j )k =h s i k 为k 的H S I 值.当n d v i k <0.1或n d v i k >0.9时,为不适合居住区或无常住人口区;当0.1<n d v i k <0.9时,为适合居住区中;当x k =0时,说明夜间少有人类活动,属尚无人口居住区,网格按x l (,)k ʂ0为有人网格和x l (,)k =0为无人网格重新划分为两类.图1 N P P -V I I R S 夜间灯光辅助的人口网格数据流模型图69西南师范大学学报(自然科学版) h t t p ://x b b jb .s w u .e d u .c n 第48卷2.3 加权个案的加权最小二乘法回归设个案i (即县域)的因变量y l ㊁自变量x l ㊁变量n l 的值(i 县域y l ,x l ,n l的代表值,"i ,l )分别记为p l (i ,),x l (i ,),n l (i ,);x l (i ,),p l (i ,)代表n l (i ,)个有人网格的属性值,根据图1流程先确定权重.(1)加权个案权重γl (i ,)的确定.个案由n l (i ,)个有人网格平均而成,顾及n l (i ,)县域人口规模差异在建模中的作用,回归分析时将n l (i ,)作为γl (i ,),即取γl (i ,)=n l (i ,)进行x l (i ,)和p l (i ,)加权.(2)加权最小二乘法(W L S )权重βl (i ,)的确定.由于加权个案可能导致异方差,当n l (i ,)值越大,则x l (i ,),p l (i ,)的代表性越好㊁可靠性越大㊁精确性越高㊁对同方差贡献越大;反之越小,则βl (i ,)=n l (i ,)/ðn l (i ,).再以x l (i ,),p l (i ,)分别为自变量和因变量及以γl (i ,),βl (i ,)分别为加权个案㊁W L S 的权重,在网格中通过加权个案结合加权最小二乘法的回归分析,以n 1,i 为权重的x l (i ,)加权平均值与全省有人网格x l (i ,)k 的平均值相等,p l (i ,)的加权平均值分别与全省有人网格p l (i ,)k 及其预测值y ɡl (i ,)k 的平均值均相等,即为无偏,而x l (i ,)k ,p l (i ,)k 则分布在临近其平均值两侧,p l (i ,)k 预测值y ɡl (i ,)k精度较高㊁可靠性较大,见公式(4).考虑到x l (,)k =0时y l (,)k =0,处理过程不勾选 在等式中包含常量 复选框.y ɡl =f l (x l )=b l ㊃x l (∀l )(4)式中:b l 为回归系数,表示网格x l 值增/减1个单位后其y l 值随之增/减b l 个单位;x l 为因变量㊁y ɡl 为因变量的回归值,分别表示网格中的x l值的人口预测值/回归值.2.4 改进效果验证根据不同比例随机抽取乡镇域样本,从不同尺度对模型进行验证,预测乡镇人口外推,预测风格人口网格化.随机抽样派生乡镇a :①a 与网格b 相交得c 网格,c 属性统计得到n l (,j )及有人网格x l 平均值x l (,j )(x l (,j )=ðx l (,j )k /n l (,j )),x l (,j )代入式(4)计算得y ɡl (,j )(y ɡl (,j )=b l ㊃x l (,j )外推于乡镇域),根据n l (,j )计算p l (,j )(p l (,j )=ðp l (,j )k /n l (,j )=P (,j )/n l (,j ),p l (,j )k 为j 的第k 网格人口);②a 与经网格b 属性x l 代入公式(4)计算派生的网格c 相交得d 网格,d 属性统计得Y ɡl (,j ),Y ɡl (,j )=ðy ɡl (,j )k ,y ɡl (,j )k =b l ㊃x l (,j )k 应用于网格化.得到数据后代入下式验证精度.MA E l =ðτj =1(q l (,j )-y l (,j )㊃ηl (,j ))/ðτj =1ηl (,j ) (∀l )(5)R M S E l =1ðτj =1ηl (,j)ðτj =1((q l (,j )-y l (,j ))2㊃ηl (,j )) (∀l )(6)M R E l =ðτj =1(ql (,j )-y l (,j )㊃ηl (,j ))ðτj =1(y l (,j )㊃ηl (,j )) (∀l )(7)式中:MA E l ,R M S E l ,M R E l 为x l的人口预测误差,分别表示网格或乡镇域尺度人口平均或加权平均的绝对误差㊁方根误差㊁相对误差.2.5 人口网格化结果优化将网格b 属性x l 代入公式(4)派生的网格c ,即网格b 的属性x l 的第k 网格值x l (,)k代入公式(4)得y ɡl (,)k =b l ㊃x l (,)k ("k )赋值给新建属性y ɡl (,),y ɡl (,)为上节随机抽样验证的初步网格化值.对于回归分析,不管个案与最小二乘法加权与否都是全局的,都忽略了空间异质性㊁非平稳性,而公式(4)的回归系数是全省各县域共有平均值.有学者[13-14]提出通过地理回归来解决空间异质性㊁非平稳性问题,但不可否认存在一定尺度的局域稳定性,与建模数据的空间尺度相对应,设在县域内具同质性㊁稳定性,因此根据i 县域的自变量值x l (i ,)回代至公式(4)中得的回归值y ɡl (i ,)(y ɡl (i ,)=b l ㊃x l (i ,))与p l (i ,)的不一致,通过对每个县域确定一个回归的调节系数使p l (i ,)的回归值y ɡl (i ,)与p l (i ,)相等优化调节y ɡl (i ,)k,使其达到全79第3期 黄耀裔,等:基于N P P -V I I R S 的福建省人口网格化方法改进对比分析省㊁县域人口零误差调整.公式为ξl(i,)=p l(i,)/yɡl(i,)(∀l,i)(8)y l(,)k=ξl(i,)㊃yɡl(,)k=ξl(i,)㊃b l㊃x l(,)k(∀l,k)(9)式中:p l(i,),y l(,),b l,x l(,)k,yɡl(,)k与公式(4)相同;ξl(i,)为i县域中回归系数的调节系数;y l(,)k为yɡl(,)k的优化值.引入聚类统计量作为3种修正指数模型的人口网格化结果数据集之间的同一性指标交互验证,如下:θl,h=ðm k=1(y l(,)k㊃y h(,)k)/ðm k=1y2l(,)k㊃ðm k=1y2h(,)k(lʂh)(10)d l,h=1m㊃ðm k=1y l(,)k-y h(,)k(lʂh)(11)式中:l,h这2种不同灯光修正模型x l,x h;y l(,)k,y h(,)k分别为与x l,x h对应的网格e的第k网格的人口; m为全省全部网格的个数;θl,h为余弦相似系数(其值越接近1则越相似);d l,h为平均绝对距离(其值越大差异越大㊁反之趋向同一).3结果及讨论3.1人口网格化建模结果分析根据图1的处理流程进行灯光像元饱和与溢出效应修正等处理后,分别进行有加权个案的W L S(改进后)与个案无加权的O L S(改进前)回归分析建模,结果见表1所示.表1S P S S的回归分析的部分结果方法模型:yɡl=f(x l)系数b l检验t值.S i g B o o t s t r a p模型拟合与F检验R R2调整R2S e F值S i g.W L S yɡ1=1624.907㊃x1627.5670.0000.0010.9440.8920.89234.156393840.0280.000 yɡ2=8677.205㊃x2539.0450.0000.0010.9270.8590.85939.022290569.7840.000 yɡ3=2207.578㊃x3629.3020.0000.0010.9450.8920.89234.072396021.0860.000O L S yɡ1=5957.758㊃x16.6490.0000.3710.5900.3480.3408304.09444.2140.000 yɡ2=32715.044㊃x26.1610.0000.3700.5600.3140.3068515.96637.9630.000 yɡ3=9219.348㊃x35.8740.0000.3710.5420.2940.2858640.46534.5020.000注:①方法W L S(加权最小二乘法)为个案加权基础的加权最小二乘法,O L S(最小二乘法)未加权个案;②B o o t s t r a p为基于1000样本的显著性水平(双侧).由表1可知:①在F检验中,改进后的F值与第2自由度远大于改进前,均通过了p=0.001的有统计学意义的检验;②回归系数b l的t检验在p=0.001有统计学意义下均通过线性假设的有统计学意义检验;③相关系数R,从改进前的0.542~0.590增至改进后的0.927~0.945,趋于1,相关性明显增大.④模型的决定系数R2,整后为0.859~0.892,较改进前增加了2.5倍,拟合精度更高;⑤反映模型实用价值的估计/预测标准误差S e,改进后减少210倍,精度得到提高,代表性的增强有统计学意义.综上,3种不同方法灯光修正模型都通过了有统计学意义的检验,说明改进后比改进前效果更好. 3.2随机样本验证模型应用与改进效果分析按比例随机抽取的不同容量乡镇域样本验证模型外推于乡镇域与应用于网格化的结果见表2和表3.由表2可知:①网格人口绝对误差(MA E/人).对于不同灯光修正模型x l,改进后MA E介于360~516人,不同x l没有明显差别,但都明显比改进前缩小,改进效果更有统计学意义;②网格人口均方根误差(R M S E/人):与MA E类似,改进后的平均与加权平均分别比改进前缩小3.7~4.7倍㊁4.3~6.6倍,改进效果有统计学意义;③网格人口相对误差(M R E/%):改进后分别比改进前缩小3.4~5.6倍㊁5.0~ 8.2倍,改进效果有统计学意义.综上,改进后MA E,R M S E,M R E都小于改进前,通过了模型外推与改进方法效果的验证.89西南师范大学学报(自然科学版)h t t p://x b b j b.s w u.e d u.c n第48卷表2 根据随机样本验证模型外推的网格人口误差统计表y ɡl改进后(加权个案及加权最小二乘法)MA E l /人ηl (,j )=1ηl (,j )=n l (,j )R M S E l /人ηl (,j )=1ηl (,j )=n l (,j )M R E l /%ηl (,j )=1ηl (,j )=n l (,j )改进前(无加权个案的最小二乘法)MA E l /人ηl (,j )=1ηl (,j )=n l (,j )R M S E l /人ηl (,j )=1ηl (,j )=n l (,j )M R E l /%ηl (,j )=1ηl (,j )=n l (,j )抽样比例/%47828271243446.141.72027186131361944195.4275.91039722267138447.242.41577144526062092187.6276.41539523568642742.338.51734151626782178185.9248.320y ɡ136022857435744.241.01606146326972046197.3262.62542622974041646.542.11705143028472079186.2262.53043524473142346.341.51673145327662105178.2246.84042324570741846.342.21697147228242145185.6253.05051628377945649.841.92127182634061968205.0270.71045525172942454.148.01534131228442286182.5251.11543825372446046.941.41801143831002466193.0235.520y ɡ240824763539450.244.31537134628642196188.8241.62547124778544151.445.31650128230192228180.2235.43048226577545051.345.11645133229732279175.2226.24046826475244651.245.51658134929972293181.4231.95049831575545948.046.72361233831562187227.6346.71039623968837047.145.72010196726702389239.1376.41541427470744744.444.82211205829252541237.0337.120y ɡ336825858536245.246.42049200427642397251.8359.72544726377743748.848.32123196329002412231.8360.33044927175743347.946.02101198928462436223.7337.94043327172842647.346.62127200528842460232.7344.850由表3可知:①乡镇域人口绝对误差(M A E /人).3种修正模型改进后的乡镇域M A E 无明显差异,分别比改进前减少5.0~8.2倍㊁6.2~9.2倍,改进后明显更优;②乡镇域人口均方根误差(R M S E /人).改进后的平均与加权平均R M S E 比改进前分别减少27.9~38.0倍与25.7~35.0倍㊁比改进前分别减少5.9~8.0倍与6.1~8.4倍,明显优于改进前;③乡镇域人口相对误差(M R E /%).x 1模型改进后的平均与加权平均M R E 分别比改进前减少5.9~66倍与7.0~7.8倍,明显优于改进前;x 2模型改进后的平均M R E 只有1件样本大于46.3,其余6件中有3件小于44.62,加权平均的除1件为46.3外其他6件均小于44.62,而且改进后比改进前至减少5.0倍多,改进后优于改进前并介于x 1和x 3模型改进后;x 3模型改进后的平均与加权平均M R E 分别较改进前减少了7.3~8.2倍与7.9~9.2倍,改进后优于改进前.综上可见在M A E ,R M S E ,M R E 这三方面都极其明显比改进前优,且改进模型通过了网格化验证.3.3 福建省人口网格化的结果根据公式(8)-(9)对县域内人口网格化 零误差 调整,最终空间网格化结果见图2-a 和2-b 所示.由图2可知,Y 1与Y 2具有高度相似的人口空间分布特征,均呈现网格人口(密度)空间分异,有统计学意义,总体上东部人口相对稠密而西部相对稀疏,并呈N E 向为主与NW 向为次的带状㊁串珠状分布,二者组合呈现为不甚规则的网状,交叉处为局域人口密集中心,其中全省的人口高值区㊁中心分布于闽东南沿海的福州市区㊁泉州市区㊁厦门市区等地.其次,利用与x 1,x 2,x 3对应的人口网格化结果绘制基于N A N I 模型(Y 1)㊁V A N U I 模型(Y 2)㊁H S I 模型(Y 3)剖面可视化折线图,见图3-a ,b ,c ,图3为图2-b 横穿厦门市A 1-A 2㊁福州市B 1-B 2㊁三明市C 1-C 2城市中心区的网格人口(密度)表面的剖面,从中可见Y 1,Y 2,Y 3的网格人口(密度)都是从城市中心到郊区㊁远郊从高值变为低值再逐渐过渡为0,与实际的人口空间分布规律相吻合,各市的Y 1,Y 2,Y 3网格人口(密度)变化曲线不仅总体形态相似,而且剖面上相邻网格的人口增减趋势也完全一致.99第3期 黄耀裔,等:基于N P P -V I I R S 的福建省人口网格化方法改进对比分析表3根据随机样本验证网格化结果的乡镇域人口误差统计表yɡl改进后(加权个案及W L S)M A E l/人ηl(,j)=1ηl(,j)=n l(,j)R M S E l/人ηl(,j)=1ηl(,j)=n l(,j)M R E l/%ηl(,j)=1ηl(,j)=n l(,j)改进前(无加权个案的O L S)MA E l/人ηl(,j)=1ηl(,j)=n l(,j)R M S E l/人ηl(,j)=1ηl(,j)=n l(,j)M R E l/%ηl(,j)=1ηl(,j)=n l(,j)乡镇域个数τ/%yɡ11513212699210561797841.739.710001789411143565110194275.9279.375 yɡ11153913625174011957842.442.275199106894113940139905276.4331.0134 yɡ11263614848203122285038.538.181473114614120089147494248.3293.8164 yɡ11225915629180462247541.042.178586118020116384152329262.6317.8205 yɡ11151014063172792028542.142.671759107268105500138815262.5324.6256 yɡ11242114814182912095841.541.773883108003109480139869246.8303.8330 yɡ11291615489188812170942.243.177429112094114373144550253.0311.8417 yɡ21520711632219591678141.936.39815373349150842103333270.7229.275 yɡ21305814813195162170148.045.96830392993120322142098251.1288.0134 yɡ21358215074220602432341.438.677274100556129282149054235.5257.8164 yɡ21326215859195362340744.342.772321106141121693153702241.6285.8205 yɡ21239514370183592094345.343.56436591992109640138293235.4278.4256 yɡ21349815341196232199745.143.26770594350114940140743226.2265.4330 yɡ21391215743201492240745.543.87098198042118905144082231.9272.7417 yɡ31693416743221392171046.752.3125683131849165379155163346.7411.975 yɡ31242216198174672142245.750.2102399149702139141179281376.4463.6134 yɡ31470418821215022495044.848.2110593161532149050192124337.1414.1164 yɡ31388119380195842598246.452.2107650165179148023201911359.7444.8205 yɡ31320017934192172460748.354.398517152871135324187470360.3462.7256 yɡ31377818141194752420346.051.0101148153162138280186001337.9430.8330 yɡ31425218973200962524246.652.8105521158340143458191799344.8440.4417将Y1,Y2,Y3的yɡl(i,)k(l=1,2,3;"i,k)代入公式(10)计算余弦系数,θ1,2=0.988,θ1,3=0.996,θ2,3= 0.981,3种模型的余弦系数均接近于1,可见Y1,Y2,Y3两两间相似性非常大;代入公式(11)得平均绝对距离d1,2=57.6,d1,3=29.1,d2,3=75.8,Y1,Y2,Y3两两间差异性小㊁同一性大.综上,从综合相似性㊁差异性两方面可以说明Y1,Y2,Y3趋于同一,并从图2-a㊁图2-b㊁图3-a㊁图3-b㊁图3-c能相互印证,说明3种不同灯光修正模型的人口空间网格化结果可以互证.底图来源于标准地图网站福建省地图,审图号:G S(2019)3333号图2福建省人口网格化结果001西南师范大学学报(自然科学版)h t t p://x b b j b.s w u.e d u.c n第48卷图3 福建省网格化剖面可视化折线图4 结语以N A N I ,V A N U I ,H S I 3种指数像元饱和与溢出效应修正后的模型的灯光强度为自变量,分别构建人口网格化回归模型,考察改进后与改进前的各项相关指标差异,发现改进后的加权个案及W L S 建模与改进前的101第3期 黄耀裔,等:基于N P P -V I I R S 的福建省人口网格化方法改进对比分析201西南师范大学学报(自然科学版)h t t p://x b b j b.s w u.e d u.c n第48卷个案无加权的W L S建模入选模型模糊了方法改进效果,解决了人口统计单元与网格间尺度差异㊁统计单元间规模差异等可变面元问题,证实了改进效果的有效性,拟合优度增大了2.5倍多,预测标准误差缩小了210多倍,乡镇域随机样本的外推与网格化验证的网格人口㊁乡镇域人口的M A E,R M S E,M R E和加权M A E, R M S E,M R E分别缩小了3.4~8.2倍与5.0~9.2倍㊁3.7~6.6倍与5.9~8.4倍㊁3.4~8.2倍与5.0~ 9.2倍,提高了人口网格化精度.3种修正模型彼此间余弦系数θ1,2=0.988,θ1,3=0.996,θ2,3=0.981,均接近1,平均绝对距离d1,2= 57.6,d1,3=29.1,d2,3=75.8,两两间差异性小㊁同一性大,说明不同灯光修正模型的人口网格化结果可以互证.改进方法以相关程度高的指标网格化,降低了多源数据时间和空间尺度不一和处理难度,其统计单元间㊁统计单元与网格间空间规模差异的方法也适用于G D P等社会经济统计数据的网格化/空间化.此外,改进方法的加权个案等方法在时空数据(截面数据㊁面板数据)的一些分析方法中,也可以借鉴参考.致谢:感谢泉州师范学院人文地理与城乡规划国家一流学科专业资助!参考文献:[1]陈述彭,陈秋晓,周成虎.网格地图与网格计算[J].测绘科学,2002,27(4):1-6,2.[2]黄安,许月卿,孙丕苓,等.基于多源数据人口分布空间化研究 以河北省张家口市为例[J].资源科学,2017,39(11):2186-2196.[3]赵鑫,宋英强,刘轶伦,等.基于卫星遥感和P O I数据的人口空间化研究 以广州市为例[J].热带地理,2020,40(1):101-109.[4]李翔,陈振杰,吴洁璇,等.基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J].地球信息科学学报,2017,19(10):1298-1305.[5]柏中强,王卷乐,姜浩,等.基于多源信息的人口分布格网化方法研究[J].地球信息科学学报,2015,17(6):653-660.[6]董南,杨小唤,蔡红艳.基于居住空间属性的人口数据空间化方法研究[J].地理科学进展,2016,35(11):1317-1328.[7]林珲,张鸿生,林殷怡,等.基于城市不透水面 人口关联的粤港澳大湾区人口密度时空分异规律与特征[J].地理科学进展,2018,37(12):1644-1652.[8]谭敏,刘凯,柳林,等.基于随机森林模型的珠江三角洲30m格网人口空间化[J].地理科学进展,2017,36(10):1304-1312.[9] Q I N G L I N G,Z H A N G,.T h eV e g e t a t i o nA d j u s t e dN T LU r b a n I n d e x:aN e wA p p r o a c h t oR e d u c e S a t u r a t i o n a n d I n c r e a s eV a r i a-t i o n i nN i g h t t i m eL u m i n o s i t y[J].R e m o t e S e n s i n g o fE n v i r o n m e n t,2013,129:32-41.[10]L I U H Q,H U E T EA.AF e e d b a c kB a s e dM o d i f i c a t i o n o f t h eN D V I t oM i n i m i z eC a n o p y B a c k g r o u n d a n dA t m o s p h e r i cN o i s e[J].I E E ET r a n s a c t i o n s o nG e o s c i e n c e a n dR e m o t eS e n s i n g,1995,33(2):457-465.[11]L U DS,W E N G Q H,L IG Y.R e s i d e n t i a l P o p u l a t i o nE s t i m a t i o nU s i n g aR e m o t eS e n s i n g D e r i v e d I m p e r v i o u sS u r f a c eA p-p r o a c h[J].I n t e r n a t i o n a l J o u r n a l o fR e m o t eS e n s i n g,2006,27(16):3553-3570.[12]胡为安,刘传立,詹淇雯.中国区域N P P-V I I R S年度夜间灯光数据的合成方法与对比验证[J].桂林理工大学学报,2021,41(1):141-148.[13]赵真,徐柱,侯剑.地理加权回归在人口空间分布研究中的应用[J].遥感信息,2018,33(4):128-134.[14]王珂靖,蔡红艳,杨小唤.多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用[J].地理科学进展,2016,35(12):1494-1505.责任编辑胡杨文娟。
人口数据空间化研究综述_柏中强

第32卷第11期2013年11月地理科学进展PROGRESS IN GEOGRAPHYV ol.32,No.11Nov.,2013收稿日期:2013-06;修订日期:2013-09.基金项目:国家科技基础性工作专项重点项目(2011FY110400);国家科技基础性工作专项课题项目(2012FY111800-05)。
作者简介:柏中强(1988-),男,博士研究生,主要研究方向为基于格网的区域人口时空模拟。
E-mail :baizq@ 通讯作者:王卷乐(1976-),男,博士,副研究员,主要从事格网化资源环境综合科学调查研究。
E-mail :wangjl@1692-1702页1引言人口数据是表征人类活动最直接的指标之一,在生态环境保护、灾害风险评估与救援、商业决策、区域规划与开发等领域广泛运用。
人口统计数据通常以行政区为单元逐级统计和汇总而来,以严谨的统计学理论和方法作为支撑,具有权威、系统、规范的特点(胡云峰等,2011)。
但是当此类数据应用于空间分析或跨学科研究时,会出现如下问题:①人口统计数据所依赖的行政单元(省、市、县、乡镇等)与实际研究中的自然单元(流域、土壤类型单元、植被类型单元、样带等)边界不一致,从而造成地学研究中的“可变元问题”(Openshaw et al,1983;杨小唤等,2002);②以行政区平均密度来表征的人口空间分布信息不能在小尺度上体现人口空间分布特征,其精度也无法达到许多科学研究和工程应用的要求;③时间分辨率低,更新周期长,中国国家层面的人口普查一般是每10年进行一次,而其他大多数发展中国家的更新周期更长;④不便于可视化和空间分析操作,不利于表现和挖掘人口的分布规律及其模拟和预测研究。
以现代对地观测技术和地理信息空间分析与模拟技术为支撑,“社会数据空间化”和“空间数据社会化”(Pixelizing the Social and Socializing thePixel)成为学界关注的焦点(Jacqueline et al,1998;蒋耒文,2002),人口数据空间化作为其典型代表和重要研究领域,对人口统计数据形成了有益补充。
网格中心人口统计工作总结

网格中心人口统计工作总结
近年来,随着城市化进程的加快和人口流动的增加,网格中心人口统计工作显得尤为重要。
网格中心作为城市管理的基础单位,承担着对辖区内人口情况进行全面、准确统计的重要任务。
在这样的背景下,我们对网格中心人口统计工作进行了总结和分析,以期为今后的工作提供参考和借鉴。
首先,我们对网格中心人口统计工作的重要性进行了深入的思考。
人口是城市发展的基础,准确的人口统计数据是城市规划和管理的重要依据。
而网格中心作为城市管理的基础单位,对于辖区内人口情况的了解和统计工作显得尤为重要。
只有通过精准的人口统计数据,才能更好地为城市的规划和管理提供支持。
其次,我们对网格中心人口统计工作存在的问题进行了分析。
在实际工作中,我们发现由于人口流动性大、登记不及时等原因,网格中心人口统计工作存在一定的难度和局限性。
同时,一些网格中心人员对于人口统计工作的重要性认识不足,导致统计数据的准确性和完整性不够。
最后,我们提出了一些改进和完善网格中心人口统计工作的建议。
首先,加强对网格中心人员的培训和宣传,提高他们对人口统计工作的重视和认识。
其次,建立健全的人口登记和信息共享机制,确保人口统计数据的准确性和完整性。
同时,利用现代化的信息技术手段,提高人口统计工作的效率和精准度。
总的来说,网格中心人口统计工作是城市管理的基础工作,对于城市的规划和管理具有重要意义。
我们将进一步加强对网格中心人口统计工作的重视和支持,不断完善工作机制,提高统计数据的准确性和完整性,为城市的发展和管理提供更加可靠的数据支持。
人口数据空间化模型方法_概述及解释说明

人口数据空间化模型方法概述及解释说明1. 引言1.1 概述人口数据空间化模型方法是一种用于研究和分析人口数据地理分布特征的有效工具。
随着城市化进程的加速和城市规划需求的增长,人口数据空间化模型方法在城市规划、社会经济研究以及环境保护与资源管理等领域中得到了广泛应用。
本文将就这种方法进行概述并提供详细解释说明。
1.2 文章结构本文主要包括如下几个部分:引言、正文、方法概述、模型应用场景分析以及结论与展望。
在引言部分,我们将介绍人口数据空间化模型方法的背景和意义,并对全文进行简要说明。
在正文部分,我们将详细探讨该方法的内涵和基本原理。
在方法概述部分,我们将介绍该方法的定义、使用案例说明以及数据处理与分析步骤。
在模型应用场景分析部分,我们将阐述该方法在城市规划与发展、社会经济研究以及环境保护与资源管理等领域中的重要应用。
最后,在结论与展望部分,我们将总结文章内容,并探讨未来研究的发展方向。
1.3 目的本文旨在为读者提供一个全面了解人口数据空间化模型方法的基础,并介绍其在实际应用中的重要性和价值。
通过分析该方法的使用案例以及与其他研究领域的关联,我们希望能够揭示其潜在的贡献和未来发展方向。
同时,该文章也可以作为相关领域研究者和决策者参考的资料,从而推动该方法在实践中的广泛应用和进一步探索。
2. 正文人口数据空间化模型方法是指将人口数据与空间信息相结合,通过建立数学或统计模型来分析和预测人口分布、人口迁移和人口增长的方法。
这种方法可以有效地帮助我们理解人口现象的时空特征以及其影响因素,进而为城市规划、社会经济研究、环境保护和资源管理等领域的决策提供科学依据。
在构建人口数据空间化模型前,首先需要对人口数据进行处理和分析。
常用的处理方式包括数据清洗、变换和插值等,以确保数据的准确性和完整性。
分析步骤则涉及探索性空间数据分析、地理加权回归和空间插值等方法。
这些步骤可以帮助我们发现与空间有关的模式,并推断其背后的驱动力。
流动人口网格化管理方案

流动人口网格化管理方案引言随着城市快速发展和人口流动的增加,对流动人口进行有效管理成为一个迫切的问题。
传统的管理方式已经无法满足实际需求,针对这一问题,流动人口网格化管理方案应运而生。
本文将介绍流动人口网格化管理方案的设计和实施细节,以及预计的效果和挑战。
背景在中国,流动人口(包括外来务工人员、学生等)经常涉及到诸多问题,例如住房、就业、教育、医疗等。
传统的管理方式主要是通过户籍和身份证等手段进行管理,然而这种方式的效果正在逐渐下降。
为了更好地管理流动人口,流动人口网格化管理方案应运而生。
方案设计为了达到有效管理流动人口的目的,流动人口网格化管理方案主要包括以下几个方面的设计:网格划分将城市划分为若干个网格,每个网格负责管理一定区域内的流动人口。
网格的大小可以根据实际情况进行设定,一般建议不超过10平方公里。
这样一来,每个网格的管理工作就可以更加精细化和专业化。
网格负责人为每个网格指定一个负责人,负责该网格内流动人口的管理工作。
负责人应该具备一定的管理经验和专业能力,可以协调解决流动人口的相关问题,例如住房、就业、教育、医疗等。
数据共享平台建立一个流动人口数据共享平台,将各个网格的数据集中存储和管理。
该平台应该包括流动人口的基本信息,例如姓名、身份证号码、年龄、性别等,并且需要定期更新和审核。
多部门合作流动人口的管理涉及到多个部门,例如宣传部门、公安部门、教育部门、卫生部门等。
为了实现流动人口的综合管理,各个部门需要加强沟通和协作,共同制定和执行管理方案。
信息化支持通过信息技术的支持,提高流动人口管理的效率和精确度。
例如可以利用人工智能和大数据分析技术,对流动人口的行为和需求进行预测和分析,为管理决策提供科学依据。
实施细节流程优化针对流动人口管理过程中存在的繁琐和低效问题,对流程进行优化。
例如可以利用在线申请和审批系统,简化流动人口办理相关手续的流程,提高办理效率。
信息登记流动人口应该在进入某个网格时进行信息登记,包括基本信息、住宿地址、工作单位等。
社会治理网格化大数据融合服务平台建设方案

技术架构设计
总结词
先进、灵活、可扩展
详细描述
平台的技术架构设计应采用先进且成熟的技术,具备灵活性和可扩展性,能够 满足未来业务需求的变化和增长。
数据安全保障
总结词
全面、可靠、合规
详细描述
平台应建立完善的数据安全保障机制,包括数据加密、访问控制、备份恢复等, 确保数据的安全性和可靠性,同时符合相关法律法规的要求。
鼓励企业和社会组织参与融合服务平台的建设和应用,提高社会治 理的效率和公共服务的质量。
社区和居民
加强社区和居民对融合服务平台的认知和接受度,提高公众参与度 和满意度。
社会效益
1 2
提高社会治理能力
融合服务平台的建设有助于提高社会治理的信息 化、智能化水平,提升社会治理的效率和精准度 。
优化公共服务
融合服务平台能够提供更高效、便捷的公共服务 ,满足公众多样化的需求,提高公众满意度。
3
促进社会和谐稳定
融合服务平台有助于加强社会各界的联系和互动 ,促进社会和谐稳定,提高社会文明程度。
THANKS FO据采集层、 数据处理层、数据存储层 、数据应用层四个部分组 成。
架构关系
各层之间通过数据流、控 制流和通信流相互关联, 形成一个完整的平台架构 。
功能模块
数据采集模块
该模块负责从各种数据源采集数据, 包括但不限于政府部门公开数据、企 业数据、社会数据等。
数据处理模块
该模块负责对采集到的数据进行清洗 、去重、格式转换等处理,提高数据 质量。
提供更准确、更及时的数据支持。
建设目标
1. 提升社会治理效能
2. 优化资源配置
3. 增强决策的科学性
4. 促进社会和谐稳定
中共南京市委、南京市人民政府关于进一步加强人口服务管理工作的意见-宁委发[2011]44号
![中共南京市委、南京市人民政府关于进一步加强人口服务管理工作的意见-宁委发[2011]44号](https://img.taocdn.com/s3/m/bfcbaf58bf1e650e52ea551810a6f524ccbfcbb3.png)
中共南京市委、南京市人民政府关于进一步加强人口服务管理工作的意见正文:---------------------------------------------------------------------------------------------------------------------------------------------------- 中共南京市委、南京市人民政府关于进一步加强人口服务管理工作的意见(宁委发〔2011〕44号2011年8月30日)为创新社会管理,全面做好人口工作,促进人口长期均衡发展,创造有利于我市在全省争当“三个第一”的人口环境,现就进一步加强人口服务管理工作,提出如下意见。
一、创新统筹解决人口问题体制机制1、创建新型人口服务管理领导体制。
着眼于调控人口数量,优化人口结构,提升人口素质,引导人口有序流动,促进人口与经济社会资源环境协调可持续发展,主动适应省会城市、特大型中心城市社会管理需求,进一步强化“大人口”、“大服务”理念,致力构筑“党政统筹、部门协调、属地管理、单位负责、社区服务、群众自治”的管理体制,打造具有南京特色的城市人口社会管理和公共服务新模式。
2、创新人口服务管理工作机制。
深化人口和计划生育综合改革,着力构建党政主导的统筹协调机制、运行高效的科学管理机制、城乡一体的优质服务机制、优先优惠的利益导向机制、民主公开的群众自治机制、稳定增长的投入保障机制。
进一步完善人口工作领导小组联席会议机制,建立关于提高出生人口素质、人口文化宣传教育、流动人口服务管理、利益导向政策等专项工作联席会议制度,切实形成“党委领导、政府负责、社会协同、公众参与”的工作格局。
3、强化职能部门人口综合服务管理职能。
市人口和计划生育委员会是人口服务管理的实施主体,要切实担负起全市统筹解决人口问题综合协调、全市人口发展战略研究、人口中长期规划和年度计划拟制与实施、市级人口信息服务管理平台建设与管理、0-3岁儿童早期发展与教育等职能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人口数据格网化
1、原始数据:里边包含行政区名、行政区人口数和行政区面积。
人口密度=人口数/行政区面积
2、建立覆盖行政区格网,并转成面主要是用Arctoolbox里的Creatfishnet
网格线构面:用到Arcgtoolbox中Feature to Polygon
3、用select by location选出与行政区相交的网格并导出到新的shapefile:
4、将格网和人口数据面做Identity分析:用到Arctoolbox中Identity工具
结果:
5
5、重新计算上步结果的面积(因shapefile不会自动更新面积),并根据人口
密度计算人口数
结果:
6、在fid_gwnew字段名上点右键,选summarize,计算每个小格内的人口数,
人口数选sum
做join,并将sum_人口数赋给新建的人口数字段
Join关联
人口分布格网图。