北大考研-计算机科学技术研究所研究生导师简介-万小军_ 副研究员

合集下载

北大考研-计算机科学技术研究所研究生导师简介-刘家瑛_副教授

北大考研-计算机科学技术研究所研究生导师简介-刘家瑛_副教授
研究方向: 数字图像/视频处理与编码优化技术: ·可伸缩视频编码与率失真优化 ·时空超分辨率,视频重建技术 ·图像先验建模与稀疏表达 ·基于视觉感知的视频编码与处理 ·图像/视频的质量评测技术
代表论文及专利成果: FullPublicationList 部分获奖情况: ·2010 年 12 月获北京大学第十届青年教师教学演示竞赛理工科类一等奖(全校 2 名) ·2010 年 7 月获北京大学“优秀毕业生”(校级) ·2009 年 10 月获 IBM 中国优秀学生巾帼奖学金(国家级) ·2009 年 10 月获北京大学“学术创新奖”(校级)
爱考机构 中国高端考研第一品牌(保过 保录 限额)
爱考机构-北大考研-计算机科学技术研究所研究生导师
简介-刘家瑛_副教授
刘家瑛副教授 . ?. . . 研究组主页(ResearchGroup) ? ?
刘家瑛,女,1983 年出生,陕西西安人。2010 年 6 月毕业于北京大学计算机应用技术专业, 获理学博士学位。2007 年 8 月至 2008 年 8 月赴美南加州大学多媒体通讯实验室做访问学者。 2010 年 7 月留校任教,加入北京大学计算机科学技术研究所从事科研教学工作,2012 年 8 月晋升为副教授。研究领域包括超分辨率的视频处理技术、可伸缩视频编码与优化研究、基 于视觉感知的视频处理与编码技术以及图像视频质量评价技术研究等。曾在视频领域的顶级 国际期刊 IEEET-CVST,视频压缩领域的国际顶级会议 DCC,图像多媒体处理领域国际重 要会议 IEEE-ICIP,IEEE-ICME 等会议上发表多篇论文,并已申请国内专利 8 项,国际专利 2 项 。 还 担 任 国 际 权 威 期 刊 IEEET-IP,T-CSVT,IEEET-MM,J-VCIR 等 及 国 际 会 议 IEEE-ISCAS,ICIP,ICME,MMSP,VCIP,E一品牌(保过 保录 限额)

北大考研-地球与空间科学学院研究生导师简介-李培军

北大考研-地球与空间科学学院研究生导师简介-李培军
北大考研地球与空间科学学院研究生导师简介李培军李培军研究生导师研究生导师评语研究生导师介绍给研究生导师发邮件研究生导师库导师对研究生的评语研究生导师自荐信研究生论文导师评语
爱考机构 中国高端考研第一品牌(保过 保录 限额)
爱考机构-北大考研பைடு நூலகம்地球与空间科学学院研究生导师简
科研成果与主要论著 国内外学术刊物(2003 年以来): HuiranJin,PeijunLi,TaoChengandBenqinSong,2012,LandcoverclassificationusingCHRIS/PROBAi magesandmultitemporaltexture.InternationalJournalofRemoteSensing,33(1),101–119. Jin,H.,Mountrakis,G.andLi,P.,2012,Asuper-resolutionmappingmethodusinglocalindicatorvariogra ms.InternationalJournalofRemoteSensing,33(24),7747–7773. PeijunLi,HaiqingXu,BenqinSong,2011,Anovelmethodofurbanroaddamagedetectionusingveryhighr esolutionsatelliteimageryandroadmap,PhotogrammetricEngineeringandRemoteSensing.77(10),105 7-1066. PeijunLi,JiancongGuo,BenqinSongandXiaobaiXiao,2011,Amultilevelhierarchicalimagesegmentati onmethodforurbanimpervioussurfacemappingusingveryhighresolutionimagery.IEEEJournalofSele ctedTopicsinAppliedEarthObservationsandRemoteSensing,4(1),103-116. Sánchez-Azofeifa,Arturo;Rivard,Benoit;Wright,Joseph;Feng,Ji-Lu;Li,Peijun;Chong,MeiMei;Bohl man,StephanieA.,2011.EstimationoftheDistributionofTabebuiaguayacan(Bignoniaceae)UsingHigh -ResolutionRemoteSensingImagery.Sensors,11(4),3831-3851. HaiqingXuandPeijunLi,2010,Urbanlandcoverclassificationfromveryhighresolutionimageryusingsp ectralandinvariantmomentshapeinformation.CanadianJournalofRemoteSensing,36(3),248-260. PeijunLi,HaiqingXuandJiancongGuo,2010,Urbanbuildingdamagedetectionfromveryhighresolution imageryusingOne-ClassSVMandspatialfeatures.InternationalJournalofRemoteSensing,31(13),339 3-3409. PeijunLiandHaiqingXu,2010,Land-CoverChangeDetectionUsingOne-ClassSupportVectorMachine, PhotogrammetricEngineeringandRemoteSensing,76(3),255-263. PeijunLi,TaoCheng,andJiancongGuo,2009,Multivariateimagetexturebymultivariatevariogramform ultispectralimageclassification.PhotogrammetricEngineeringandRemoteSensing,75(2),147-157. PeijunLiandHaikuoYuandTaoCheng,2009,LithologicmappingusingASTERimageryandmultivariate texture.CanadianJournalofRemoteSensing,V.35,Suppl.1(SupplementS1),S117-S125. PeijunLi,XiaobaiXiao,2007,Multispectralimagesegmentationbyamultichannelwatershed-basedappr oach.InternationalJournalofRemoteSensing.28(19),4429-4452. PeijunLi,YingduanHuang,2005,Landcoverclassificationofremotelysensedimagewithhierarchicalite rativemethod.ProgressinNaturalScience.15(5),442-447. PeijunLiandWooilM.Moon,2004,LandcoverclassificationusingMODIS/ASTERairbornesimulator( MASTER)dataandNDVI:acasestudyoftheKochangarea,Korea.CanadianJournalofRemoteSensing , 30(2),123-136. PeijunLi,XiaobaiXiao,2004,Anunsupervisedmarkerimagegenerationmethodforwatershedsegmenta tionofmultispectralimagery.GeosciencesJournal,8(3),325-331. PeijunLi,ZhengwuZhou,JinaghaiLi,ChenZhang,WenyuanHeandMancheolSuh,2003,Structuralfram eworkanditsformationoftheKalpinthrustbelt,TarimBasin,NorthwestChina,fromLandsatTMdata.Inte rnationalJournalofRemoteSensing.24(18),3535-3546. 张西雅、徐海卿、李培军,2012,运用 EO-1Hyperion 数据和单类支持向量机方法提取岩性 信息,北京大学学报(自然科学版),48(3),411-418。

符合GJB5000A的软件工程化管理解决方案-删减版

符合GJB5000A的软件工程化管理解决方案-删减版

符合GJB5000A的软件工程化管理体系建立与实施整体解决方案二Ο一二年五月目录第1章了解北大软件 (1)1.1软件工程中心简介 (1)1.2提供的优质产品与服务 (1)1.3专业化咨询/研发/服务团队 (1)1.4典型用户 (52)第2章结识“软件工程管理集成平台”产品 (6)2.1功能构成体系 (6)2.1.1总体功能结构 (6)2.1.2项目管理系统 (7)2.1.3需求管理系统 (11)2.1.4配置管理系统 (13)2.1.5测试管理系统 (15)2.2技术架构体系 (16)2.2.1总体技术架构 (16)2.2.2核心运行环境 (17)2.2.3数据访问服务 (18)2.2.4业务基础服务 (18)2.2.5企业级工作流服务 (19)2.2.6统一门户服务 (20)2.2.7系统安全管理 (21)2.3与外系统集成体系 (22)2.3.1集成机制.......................................................... 错误!未定义书签。

2.3.2已接口工具类型 (22)2.4产品特点与优势 (23)第3章工具支持下的GJB5000A体系运行场景 (25)3.1符合GJB5000A的军用软件研制过程 (25)3.2项目管理过程 (25)3.2.1项目策划(PP&IPM) (25)3.2.2项目执行与监控(PMC) (28)3.2.3风险管理(RskM) (29)3.2.4供方协议管理(SAM) (31)3.3工程过程 (33)3.3.1软件分析设计与实现(RM&RD&TS&PI) (33)3.3.2验证与确认-评审(V&V-Approve) (35)3.3.3验证与确认-测试(V&V-Test) (36)3.4支持过程 (38)3.4.1过程与产品质量保证(PPQA) (38)3.4.2配置管理(CM) (39)3.4.3测量分析(MA) (40)3.5组织过程(OPD&OPF&OT) (41)3.5.1OP-001过程定义 (42)3.5.2OP-002组织过程资产管理 (42)3.5.3OP-003过程评估 (42)3.5.4OP-004组织培训 (43)3.6组织/部门项目综合分析与管理 (43)第4章GJB5000A实施过程&方法 (43)4.1总流程 (43)4.2启动阶段 (44)4.2.1建立过程改进组织 (44)4.2.2GJB5000A基础培训 (44)4.2.3现状与差距分析 (45)4.2.4制定改进计划 (45)4.2.5阶段工作产品和要求 (45)4.3过程定义阶段 (45)4.3.1体系架构设计 (45)4.3.2顶层文件编写 (45)4.3.3过程文件编写 (45)4.3.4集中统稿和问题修改 (45)4.3.5体系模拟运行验证与评审 (46)4.3.6提交文审 (46)4.3.7阶段工作产品和要求 (46)4.4协助体系实施阶段 (47)4.4.1制定实施计划 (47)4.4.2软件工具定制开发 (47)4.4.3实用化培训 (47)4.4.4执行体系 (48)4.4.5检查与改进 (48)4.4.6阶段工作产品和要求 (49)4.5协助内部评估阶段 (49)4.5.1内部评估流程 (49)4.5.2阶段工作产品和要求 (49)4.6协助企业接受评价阶段 (49)4.7咨询服务特点与优势 (50)第1章了解北大软件1.1软件工程中心简介软件工程国家工程研究中心(以下简称中心)成立于1996年,是国家创新体系的重要组成部分,依托单位为北京大学。

基于强化学习的车辆服务迁移方法

基于强化学习的车辆服务迁移方法

第13卷㊀第6期Vol.13No.6㊀㊀智㊀能㊀计㊀算㊀机㊀与㊀应㊀用IntelligentComputerandApplications㊀㊀2023年6月㊀Jun.2023㊀㊀㊀㊀㊀㊀文章编号:2095-2163(2023)06-0001-07中图分类号:TP393.09文献标志码:A基于强化学习的车辆服务迁移方法周㊀率,韩㊀韧(上海理工大学光电信息与计算机工程学院,上海200093)摘㊀要:近年来,随着中国对于车联网发展战略的落实,基础设施与车联应用服务规模不断增加,车联应用服务对于资源的需求越来越高,现有车辆配备的有限计算资源已无法满足需求,需要将服务迁移到路侧单元,以提供充足的计算资源并降低服务时延㊂本文在车辆边缘计算场景下,提出了一种基于强化学习的车辆服务迁移方法,以降低服务的延迟与能耗㊂首先为迁移过程中可能产生的成本建模,并把服务迁移问题规约为马尔可夫决策问题,通过应用深度强化学习算法以降低迁移产生的成本㊂实验结果表明,提出的算法优于基线算法,在高速环境下具有相对较强的鲁棒性㊂关键词:车联网;车辆边缘计算;服务迁移;强化学习VehicularservicemigrationbasedonreinforcementlearningZHOULv,HANRen(SchoolofOptical-ElectricalandComputerEngineering,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China)ʌAbstractɔInrecentyears,withtheimplementationofChinaᶄsvehicletoeverything(V2X)developmentstrategy,thescaleofinfrastructureandV2Xserviceshasbeenincreasing.Atthesametime,thedemandforresourcesforV2Xservicesisgettinghigher,whilethelimitedcomputingresourcesequippedwithexistingvehiclescannolongermeetthedemand.Therefore,servicesneedtobemigratedtoroadsideunitstoprovidesufficientcomputingresourcesandlowerservicelatency.Inthispaper,anovelvehicularservicemigrationalgorithmisproposedtodecreasetheservicelatencyandenergyconsumptioninservicemigration.Firstly,thecostduringmigrationismodeledandtheservicemigrationproblemisformulatedasaMarkovdecisionproblem.Thenanovelalgorithmbasedondeepreinforcementlearningisproposedtosolvethisissue.Theexperimentalresultsshowthattheproposedalgorithmoutperformsthebaselinesandhasstrongrobustnessindifferentdrivingscenarios.ʌKeywordsɔvehicletoeverything;vehicularedgecomputing;servicemigration;reinforcementlearning基金项目:软硬件协同设计技术与应用教育部工程研究中心(OP202202)㊂作者简介:周㊀率(1998-),男,硕士研究生,主要研究方向:边缘计算;韩㊀韧(1980-),男,博士,副教授,硕士生导师,主要研究方向:智能计算㊁物联网㊂通讯作者:韩㊀韧㊀㊀Email:ren.han@usst.edu.cn收稿日期:2023-03-110㊀引㊀言随着‘车联网(智能网联汽车)产业发展行动计划“通知的下发,中国车联网发展的战略目标已基本确定, 长三角三省一市统筹智能网联汽车产业发展规划 的签署进一步加快了中国车联网的发展㊂5G网络基础设施的不断完善以及国内外车联应用的涌现,使得车辆对计算资源和服务延迟的要求日益增加,现有车辆配备的计算资源已无法满足车联应用的需求,这种日益迫切的要求需要将车联应用服务迁移到具有更高计算能力的云端服务器上,但是传统的云计算不能满足车联网下的低延迟要求,因此需要考虑一种称为车载边缘计算(VehicularEdgeComputing,VEC)的计算范式㊂在VEC中,车辆将服务迁移到靠近车辆的路侧单元(RoadSideUnit,RSU)上,可以享受RSU带来的低延迟㊁高带宽和充足的计算资源[1]㊂然而,盲目的迁移有时会影响服务性能,如:对于一个固定的车辆,将服务迁移到最近的RSU在短期内可以带来良好的服务性能,但是考虑到车辆的移动性,该种策略可能会导致频繁迁移,进一步导致服务频繁中断,因此一个最佳的服务迁移策略应该考虑车辆的移动性㊂服务迁移也伴随着各种成本,包括计算成本㊁迁移成本和能源消耗,以全面评估迁移的效果㊂考虑到车辆的移动性,专注于短期的性能提升可能会导致频繁迁移因而带来巨大的成本,需要考虑迁移带来的长期累积回报,以权衡整体性能的提高㊂即当车辆远离RSU时,如果服务性能仍然处于可接受的水平,一个最佳的迁移策略应该权衡服务迁移带来的收益与开销㊂为了提高服务迁移的性能表现,减少服务的延迟与开销,文献[2]研究了最小化移动设备和边缘服务器的总能量消耗,通过启发式算法产生了一个接近最优的解决方案;文献[3]提出在卸载比例和子载波分配时,必须考虑各种系统限制,包括延迟和子载波资源限制,以减少移动设备的能耗,并从混合整数规划(MixedIntegerProgramming,MIP)问题中生成多对一匹配和线性编程的子问题,以解决子载波分配问题;文献[4]研究了下行链路资源分配㊁卸载决策和计算资源分配的联合优化,考虑了包括数据传输和任务计算的总成本,并建模为混合整数线性规划(MILP)问题;文献[5]提出了李雅普诺夫优化的卸载决策,可以减少平均响应时间,同时降低移动设备的能耗;文献[6]评估了计算卸载的财务成本,并建模为决策和资源联合优化的MILP问题;文献[7]以合作博弈理论为基础,通过终端设备和边缘云的协同合作来优化系统的性能,并提出了一种基于交易的计算卸载技术;文献[8]提出了Follow-MeChain算法来解决服务功能链的问题;文献[9]研究了任务卸载,考虑了能耗和服务延迟的约束,并使用了二元卸载决策;文献[10]提出了一个基于强化学习的离线无线接入网络分片解决方案和一个低复杂度的启发式算法,以满足不同分片的通信资源需求,使得资源利用率最大化;文献[10]将迁移问题建模为一维马尔科夫决策过程(MarkovDecisionProcess,MDP),并考虑了服务器和设备之间的欧氏距离;文献[12]考虑了二维MDP模型并提出了基于深度强化学习的迁移方案,使得时延与能耗最小㊂尽管现有的工作在服务迁移策略方面取得了很大的进展,但仍需要进一步探索,包括迁移过程中成本的建模以及车辆的移动性㊂本文将车辆的服务迁移过程建模为MDP,同时考虑了包括计算成本㊁迁移成本和能耗的成本,此外,本文还使用行驶速度代表示车辆的运动状态,并提出了一种基于强化学习的迁移算法,该算法可以有效地解决传统MDP中维度过高的问题,并利用Actor-Critic网络和熵来确保收敛性和可探索性㊂最后,本文基于真实数据集进行实验并对算法进行评估㊂1㊀系统模型建立车辆行驶随机分布在城市区域的道路中,道路配备了若干通信范围相等的RSU,并且每个RSU都具有相同的计算能力㊂用E={e1,e2, ,ei}表示所有RSU的集合,用U={u1,u2, ,uj}表示所有车辆的合集,每个车辆uɪU都有一个计算任务且可以选择在本地计算或者通过无线网络迁移到RSU上㊂车辆移动时可以连接到任意一个路侧单元eɪE㊂为了保证车辆采取迁移决策时的满意程度,本文用迁移成本,计算成本,能源消耗等相关指标来衡量服务迁移过程中产生的开支㊂1.1㊀通信模型本文假定车辆通过V2X的蜂窝网络和毫米波与RSU进行通讯㊂1.1.1㊀5G蜂窝网络根据香农公式,在假定被高斯白噪声干扰的信道中,理论的最大信息传输速率为公式(1):C=Blog21+SNæèçöø÷(1)㊀㊀其中,B是信道带宽;S是信道内所传输信号的平均功率;N是信道内部的高斯噪声功率㊂因此,车辆u和路侧单元e之间的数据传输率可以表示为式(2):Ccu,e=Bclog21+Hu,edu,e|h|2Nc2æèçöø÷(2)㊀㊀其中,Bc是信道带宽;Hu,e是车辆u的车载通信设备与其对应的路侧单元e的传输功率;du,e表示车辆u与路侧单元e的距离;h表示瑞利衰落因子;Nc是高斯噪声功率㊂1.1.2㊀毫米波模式NR-V2X采用毫米波模式,本文假定每辆车辆都配备有定向天线阵列,并且采用了定向波束形成来增强毫米波信号的传播㊂为了最大化提高毫米波天线的指向性增益,本文假定对发射器和接收器进行光束准直,因此可以将定向天线模式近似为理想的水平面上的扇形模型[13],天线增益可以建模为式(3):gu,eη()=gm,ηɤηᶄ2gs,η>ηᶄ2ìîíïïïï(3)㊀㊀其中,η为当前天线的角度与当天线增益达到峰值时的角度之差,即天线转向方向的可容忍对准2智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀误差;ηᶄ是射束宽度;gm和gs分别是主瓣和旁瓣天线的定向增益㊂在上述条件下,本文将毫米波信道带宽表示为式(4):Cmu,e=Bmlog21+SINRu,e()(4)㊀㊀其中,Bm是毫米波信号带宽㊂车辆天线与基站天线的信噪比为式(5)[14]:SINRu,e=pu-Nm-10log10Bm()+2gm-10αlog10du,e()-69.6-ρ(5)其中,pu是车辆u配备的毫米波收发器的传输功率;Nm是噪声功率谱密度;du,e表示车辆u和路侧单元e间的曼哈顿距离;ρ N0,σ2()是以分贝为单位的阴影衰落模型;而σ为标准偏差㊂1.1.3㊀通信模型车辆与RSU的数据传输速率可以表示为式(6):Cu,e=λcCcu,e+λmCmu,es.t.λc=0,1{},λm=0,1{},λc+λm=1(6)其中,λc,λm分别为代表是否使用5G蜂窝网络或NR模式进行通讯的二元变量㊂当λc=1时,假设车辆u使用5G蜂窝网络作为通讯方式,λm=0;反之当λc=0时,λm=1认为车辆u使用NR模式作为通讯方式㊂1.2㊀迁移成本模型本文使用了平台服务(PaaS)范式,并采用Docker技术,该技术具有增强应用程序可移植性的机制,可以让应用程序无环境差异地部署在各个地方,因此本文将服务迁移成本建模为Docker服务镜像迁移成本㊂假定每个车辆都包含计算任务,且任务定义为一个二元组:Tu=pu,Su{},其中pu是完成任务Tu所需的计算资源,Su代表车辆u执行的服务镜像大小㊂本文采用了部分迁移而非二元迁移,并假定车辆u卸载到远程路侧单元e的服务比例为ωvecu,e,表示为式(7):ωlocu=1-ωvecu,e(7)㊀㊀其中,ωvecu,e表示车辆u卸在本地执行的服务比例㊂据服务镜像大小,可以得出在路侧单元e执行的服务的镜像大小,式(8):Svecu,e=ωlocuˑSu(8)㊀㊀因此迁移成本如式(9):Gmigu,e=Svecu,eCu,e=ωlocuˑSuλcCcu,e+λmCmu,e(9)㊀㊀其中,λc=0,1{},λm=0,1{},λc+λm=11.3㊀计算成本模型1.3.1㊀本地车载计算当车辆u在本地计算时,计算开销的时间取决于其可用资源㊂本文假设flocu是车辆u的车载计算资源,则本地计算时间tlocu的计算公式(10):tlocu=puflocu(10)1.3.2㊀远程VEC计算当本地计算资源紧张或者计算负载过高时,可以将服务卸载到远程路侧单元上进行计算㊂在许多包括道路检测和智能制动在内的应用中,因为其镜像的大小远大于从路侧单元传输回来的数据大小,所以本文假定路侧单元返回的计算结果的接收时间忽略不计,则车辆u的远程计算时间tvecu表示为公式(11):tvecu=pufvecu(11)㊀㊀其中,fvecu表示路侧单元分配给车辆u的计算资源,pu是完成任务Tu所需的计算资源㊂本文假定车辆u卸载到远程路侧单元e的服务比例为ωvecu,e,车辆u卸载本地执行的服务比例为ωlocu,因此计算成本可以表示为式(12):Gcompu,e=ωlocupuflocu+ωvecu,epufvecu(12)1.4㊀能耗模型当本地计算资源紧张或者计算负载过高时,可以将服务卸载到路侧单元上㊂在这种情况下,传输能耗可以由公式(13)计算:Pvecu,e=ϑeˑSvecu,eCu,e(13)㊀㊀其中,ϑe表示车辆u在卸载时的平均传输功率;Svecu,e是服务镜像的大小;Cu,e是车辆u可访问的数据传输速率㊂2㊀基于强化学习的车辆服务迁移2.1㊀马尔可夫决策问题服务迁移策略应该考虑若干成本,在服务迁移过程中对于成本的优化可以采用MDP进行解决[11]㊂MDP由四元组构成<A,S,R,P>,其中A代表智能体的所有行动,S是智能体可以感知的环境状态,P是在时隙t状态下的行动将导致下一个时隙t+1的状态的概率,R是一个实数,代表奖励3第6期周率,等:基于强化学习的车辆服务迁移方法或惩罚[15]㊂2.1.1㊀动作空间本文将时隙t的行动αtɪA定义为αt={ωvecu,et(),Wt()},ωvecu,et()表示时隙t中车辆u的服务迁移给路侧单元的比例,Wt()={-1,0,1,2, ,I}表示时隙t中车辆u迁移的目标路侧单元,若Wt()=-1则表示时隙t中车辆u不进行迁移,若Wt()ȡ0表示时隙t中车辆u将服务迁移到序号为Wt()的路侧单元㊂2.1.2㊀奖励函数由于强化学习的根本目标在于提升智能体的长期累积回报,因此合理的奖励函数能够提升训练速度与性能表现㊂长期累积回报的定义如式(14):Gt()=ð¥t=0γtrt(),0ɤγ<1(14)㊀㊀其中,rst()是时隙t中获得的奖励值,γ表示折扣率,用于计算未来奖励值的现值㊂本文的奖励函数设计如式(15):rt()=ΔGmigt()+ΔGcompt()+ΔPt()(15)㊀㊀其中,ΔGmigt()㊁ΔGcompt()和ΔPt()分别表示时隙t迁移成本㊁计算成本和能耗的下降百分比㊂以ΔPt()为例,如式(16)定义:ΔPt()=Pt-1()-Pt()Pt-1()(16)2.2㊀算法描述本文采用基于SoftActor-Critic的强化学习算法,该算法考虑了预期收益和熵之间的最大化效益,因此最优迁移策略定义为式(17):π∗=argmaxπðtE st,at()ρπγtrst,at()+[αHπ㊃∣st()()](17)其中,at代表智能体在时隙t采取的行动;st代表智能体在时隙t的状态;γ表示奖励值折扣率;温度参数α决定了熵值的相对重要性;H(π(㊃∣st))代表熵㊂V值表示当前环境状态下开始,未来能获得奖励的期望值,用于表现当前环境状态的好坏程度;Q值表示在选取某个行动后,未来能获得奖励的期望值,该值衡量的是当前选取的行动的好坏程度㊂V值和Q值之间的关系如图1所示㊂㊀㊀根据贝尔曼方程,V值和Q值可以表示为式(18)和式(19):Vst()=Eτ πð¥t=0γtrst,at()+αHπ㊃∣st()()()[](18)Qst,at()=Eτ πð¥t=0γtrst,at()+αð¥t=0γtHπ㊃∣st()()[](19)V 值QQ QS SSQ 值V SAA A图1㊀Q值与V值关系图Fig.1㊀TherelationshipbetweenQvalueandVvalue2.2.1㊀Critic网络更新传统强化学习中,由于维度过高会引发训练困难的问题[16],因此引入神经网络进行近似,本文提出的算法网络由一个Actor网络和两个Critic㊁目标Critic网络构成㊂Critic网络的损失函数可以表示为式(20):JQθk()=E (st,at) DQθkst,at()-y()2[](20)其中,θk为Critic网络参数;D表示重放缓冲区,可以通过DѳDɣst,at,rt,st+1()更新;Qθkst,at()是时隙t的状态行动价值;y表示目标网络的Q值,可以表示为式(21):㊀y=rst,at()+γVst+1()=rst,at()+γmink=1,2Qθ-kst+1,at+1()-(αlogπat+1∣st+1())(21)其中,mink=1,2Qθ-kst+1,at+1()表示取两个目标网络输出的最小值,能够有效防止过高估计㊂根据式(20)和式(21),Critic网络的更新公式为式(22):Ñθk1Dð(st,at,r(st,at),st+1) D(Qθk(st,at)-y)2(22)㊀㊀并根据式(23)更新目标Critic网络:θk-=λθk--1-λ()θk(23)㊀㊀其中,θk为目标Critic网络的参数,λ为网络的更新比例㊂2.2.2㊀Actor网络更新Actor网络的损失函数通过式(24)计算:Jπϕ()=E st D,ɪt Nαlogπϕfϕεt;st()|st()-[Qθst,fϕεt;st()()](24)其中,fϕεt;st()采用了重参数化技巧,式(25):at=fϕεt;st()=fμϕst()+εt☉fσϕst()(25)4智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀其中,fμϕ和fσϕ分别为均值和方差,ε N(ε)是正态分布下的噪声参数㊂策略参数可以通过式(26)更新:maxϕEst D,εt Nmink=1,2Qθkst,at()-αlogπat∣st()()[](26)其中,at是从策略π㊃∣st()中采样得到的,因此可以将其微分㊂车辆服务迁移算法见表1㊂表1㊀车辆服务迁移算法Tab.1㊀Vehicularservicemigrationalgorithm算法1㊀车辆服务迁移算法输入㊀初始策略参数ϕ,Q函数网络参数θk,目标网络参数θk-,k=1,2输出㊀模型权重1㊀初始化重放缓冲区D2㊀for每次迭代do3㊀㊀fort=1,最大时间步do4㊀㊀㊀观察环境状态st,根据策略选定动作at,观察执行后的环境状态st+15㊀㊀㊀根据公式(15)计算奖励值rst,at()6㊀㊀㊀更新重放缓冲区D=st,at,rst,at(),st+1()7㊀㊀结束for循环8㊀㊀for每次更新do9㊀㊀㊀从重放缓冲区D中采样st,at,rst,at(),st+1() D10㊀㊀㊀根据公式(20)计算y,并根据公式(22)更新θk11㊀㊀㊀根据公式(23)更新θk-12㊀㊀㊀根据公式(26)和梯度Ñθ1DðsɪDmink=1,2Qθkst,at()-αlogπat∣st()()()更新ϕ13㊀㊀结束for循环14㊀结束for循环3㊀实验3.1㊀数据集介绍为了评估所提出的算法在真实场景中的性能,本文采用微软亚洲研究院在2007年4月至2012年8月期间在Geolife项目中收集的GPS轨迹数据集,该数据集由一连串带有经度㊁纬度和高度的时间戳的点,包含的轨迹总距离为1292951km,总时间为50176h㊂同时本文使用阿里巴巴集群数据来模拟真实场景中RSU的负载,该数据集中包含每台机器的资源使用情况㊁容器的元信息和事件信息以及每个容器的资源使用情况㊂3.2㊀实验环境本文的仿真实验硬件平台配置:Inteli5-12500,32GBDDR4内存和NVIDIAGTX3060;软件平台基于Python3.7.9,OpenAI-gym和Manjaro㊂本文将通信范围设定为200m,实验参数设定见表2㊂表2㊀实验参数设置Tab.2㊀Experimentparameterssetting参数值重放缓冲区大小10000优化器Adam学习率{0.1,0.01,0.005,0.001}Minibatchsize128折扣率0.985最大迭代次数60000车辆数量20车辆平均速度[10-60]km/hRSU计算能力16GHz3.2.1㊀算法收敛性本文首先研究学习率对提出算法的影响,将学习率设置为:0.1㊁0.01㊁0.03㊁0.001,采用在不同迭代次数的平均服务时延作为评价指标,平均服务时延越小,算法的表现也就越好㊂学习率对算法收敛性5第6期周率,等:基于强化学习的车辆服务迁移方法影响的实验结果如图2所示,当学习率为0.005时,在经过9500次迭代后收敛到最优值并能保持稳定状态;当学习率为0.001时,在经过15000次迭代后收敛;当学习率为0.1㊁0.01时,曲线变得极不稳定,而且很难收敛到稳定状态㊂因此,研究得出学习率对于算法的稳定程度具有较高影响,这是由于学习率决定了模型权重更新的速度和幅度,对模型的收敛性具有重要影响㊂过高的学习率会导致模型在训练过程中无法收敛并出现不稳定的训练行为,使得模型的性能反而变得更差;相反,如果学习率过低,模型的权重更新会变得缓慢㊂959085807570656055504506000120001800024000300003600042000480005400060000迭代次数平均服务时延学习率=0.001学习率=0.005学习率=0.1学习率=0.01图2㊀不同学习率对算法收敛性的影响Fig.2㊀Effectofdifferentlearningratesonconvergence3.2.2㊀不同算法的服务时延对比为了进一步验证算法的可靠性,将本文采用的算法与就近迁移(AlwaysMigrateClosely,AMC)㊁随机迁移(Random)和深度Q学习(DeepQ-Learning,DQN)算法进行对比,以验证不同移动性下算法的稳定性及其表现㊂算法的学习率设定为0.005,实验结果如图3所示㊂随着平均车辆移动速度的增加,各算法的平均服务延迟都在上升,这是由于车辆行驶速度越快,离开RSU通信范围的间隔也就越小,服务迁移的触发频率随之上升㊂本文和DQN算法的平均服务延迟都处于较低的水准,同时其增长速率也较为缓慢㊂AMC算法虽然每次都选择就近的RSU,但是迁移服务时带来的额外开支并不能弥补其服务延迟㊂与DQN算法相比,本文提出的算法在移动速度为20km/h时有8.6%的优势,当移动速度达到60km/h时有15.3%的优势,这是由于本文提出的算法具有较高的探索率,相比DQN算法可以探索更多的迁移决策,从而使得平均服务时延上升速度较为缓慢㊂3.2.3㊀不同算法的能耗对比对比各算法在不同车辆移动速度下的平均能耗,实验结果如图4所示,随着平均车辆移动速度的增加,各算法的能耗同步上升,其中AMC算法的上升速率最快,这是由于车辆移动速度的上升导致车辆更快的离开RSU通信范围,进而频繁触发迁移行动,AMC算法的能耗因此远远高于其他算法㊂而Random算法在远离RSU后并没有完全决定迁移,因此相比AMC算法其能耗仍有一定优势㊂基于强化学习的DQN和本文算法具有较大的优势,这是因为奖励函数中能耗带来的奖励值使得算法对于迁移决策较为慎重,频繁地触发服务迁移并不总是最优策略㊂与DQN相比,本文提出的算法在60km/h移动状态下有14.4%的优势,这是由于该算法在训练过程中充分探索了可能的策略,因而与DQN相比能使用更优的策略以降低能耗水平㊂本文D Q N R a n d o m A M C807570656055504540202530354045505560平均车辆移动速度/(k m ?h -1)平均服务延迟/m s图3㊀不同车辆移动速度下的平均服务延迟Fig.3㊀Averageservicedelayfordifferentvehiclemovementspeeds本文D Q N R a n d o m A M C55504540353025202530354045505560平均车辆移动速度/(k m ?h -1)平均能耗/J图4㊀不同车辆移动速度下的平均能耗Fig.4㊀Averageenergyconsumptionfordifferentvehiclemovementspeeds4㊀结束语针对中国目前重点发展方向之一的车联网,本(下转第12页)4 结束语本文设计了一种基于FPGA的UDP_IP协议栈,ICMP报文和UDP报文数据部分在该协议栈内完成了正确的缓存和转发,当发送ARP报文时,在该协议栈内能够及时进行ARP列表的更新㊂本设计具有良好的稳定性和可靠性,为高速以太网通信提供了一个很好的解决方案,有着广泛的应用前景㊂参考文献[1]武朋,黄虎,王兴.基于FPGA的TCP/IP协议设计与实现[J].软件导刊,2013,12(5):22-23.[2]朱明辉,司斌,张从霞,等.FPGA与88E1111的千兆以太网接口设计[J].单片机与嵌入式系统应用,2017,17(3):60-63,66.[3]李勋,刘文怡.基于FPGA的以太网接口设计与实现[J].自动化与仪表,2014,29(5):57-60.[4]董永吉,王钰,袁征.基于FPGA的万兆以太网UDP_IP硬件协议栈设计与实现[J/OL].计算机应用研究:1-4[2022-04-25].[5]韩剑南,胡辽林.基于FPGA和UDP/IP协议的千兆网络图传系统[J].计算机系统应用,2018,27(3):99-104.[6]刘源,张刚.可靠UDP协议栈的FPGA实现[J].火力与指挥控制,2017,42(7):139-143.(上接第6页)文研究了基于该环境下的服务迁移问题,并对服务迁移过程中产生的计算成本㊁迁移成本和能耗建模,将迁移决策规划为部分迁移而非二元迁移,同时考虑了车辆移动性带来的问题㊂本文将服务迁移建模为MDP问题,并提出了基于深度强化学习的服务迁移算法来降低服务的平均时延和能耗㊂实验结果表明,本文提出的算法在学习率为0.005时能够较快达到收敛,并且与其他算法相比在20km/h和60km/h时分别有8.6%和15.3%的性能提升,同时当移动速度处于60km/h时,在能耗方面有14.4%的优势㊂在未来工作中,将车辆加速度引入以预测用户驾驶车辆的移动意图,从而进行更精确的迁移决策㊂参考文献[1]ABBASN,ZHANGY,TAHERKORDIA,etal.Mobileedgecomputing:Asurvey[J].IEEEInternetofThingsJournal,2018,5(1):450-465.[2]BIJ,YUANH,DUANMUS,etal.Energy-optimizedpartialcomputationoffloadinginmobile-edgecomputingwithgeneticsimulated-annealing-basedparticleswarmoptimization[J].IEEEInternetofThingsJournal,2020,8(5):3774-3785.[3]ZHANGQ,ZHENGH,ZHONGZ,etal.Energyminimizationforfogcomputing-enabledhierarchicalnetworkswithdynamicTDD[C]//2019IEEE/CICInternationalConferenceonCommunicationsinChina(ICCC).IEEE,2019:590-595.[4]WANGK,HUZ,AIQ,etal.Jointoffloadingandchargecostminimizationinmobileedgecomputing[J].IEEEOpenJournaloftheCommunicationsSociety,2020,1:205-216.[5]WUF,LIX,LIH,etal.Energy-timeefficienttaskoffloadingformobileedgecomputinginhot-spotscenarios[C]//ICC2021-IEEEInternationalConferenceonCommunications.IEEE,2021:1-6.[6]SINGHS,KIMDH.Profitoptimizationformobileedgecomputingusinggeneticalgorithm[C]//2021IEEERegion10Symposium(TENSYMP).IEEE,2021:1-6.[7]KIMS.Bargaininggamebasedoffloadingservicealgorithmforedge-assisteddistributedcomputingmodel[J].IEEEAccess,2022,10:63648-63657.[8]OUYANGT,ZHOUZ,CHENX.Followmeattheedge:Mobility-awaredynamicserviceplacementformobileedgecomputing[J].IEEEJournalonSelectedAreasinCommunications,2018,36(10):2333-2345.[9]VUTT,NGUYENDN,HOANGDT,etal.Optimalenergyefficiencywithdelayconstraintsformulti-layercooperativefogcomputingnetworks[J].IEEETransactionsonCommunications,2021,69(6):3911-3929.[10]ALBONDAHDR,PéREZ-ROMEROJ.AnefficientRANslicingstrategyforaheterogeneousnetworkwitheMBBandV2Xservices[J].IEEEAccess,2019,7:44771-44782.[11]KSENTINIA,TALEBT,CHENM.AMarkovdecisionprocess-basedservicemigrationprocedureforfollowmecloud[C]//2014IEEEInternationalConferenceonCommunications(ICC).IEEE,2014:1350-1354.[12]TANGZ,ZHOUX,ZHANGF,etal.Migrationmodelingandlearningalgorithmsforcontainersinfogcomputing[J].IEEETransactionsonServicesComputing,2019,12(5):712-725.[13]WILDMANJ,NARDELLIPHJ,LATVA-AHOM,etal.Onthejointimpactofbeamwidthandorientationerroronthroughputindirectionalwirelesspoissonnetworks[J].IEEETransactionsonWirelessCommunications,2014,13(12):7072-7085.[14]LIZ,XIANGL,GEX,etal.LatencyandReliabilityofmmWaveMulti-HopV2VCommunicationsUnderRelaySelections[J].IEEETransactionsonVehicularTechnology,2020,69(9):9807-9821.[15]BELLMANR.Amarkoviandecisionprocess[J].JournalofMathematicsandMechanics,1957,6(5):679-684.[16]SUTTONRS,BARTOAG.Reinforcementlearning:Anintroduction[M].MITpress,2018:472-475.。

北大考研-计算机科学技术研究所研究生导师简介-杨建武_ 副研究员

北大考研-计算机科学技术研究所研究生导师简介-杨建武_ 副研究员

爱考机构-北大考研-计算机科学技术研究所研究生导师简介-杨建武_副研究员杨建武副研究员杨建武,男,1973年7月出生,博士,副研究员。

2002年7月毕业于北京大学计算机研究所,获博士学位。

主讲课程:·课程名称:文本挖掘技术·教学对象:北京大学信息科学技术学院研究生研究方向·信息检索、文本挖掘、SGML/XML主要研究工作面向互联网内容安全的Web挖掘技术研究。

获得信息产业部电子信息产业发展基金(“以智能信息分析处理为核心的数据挖掘软件平台”)、国家自然科学基金(“基于核矩阵学习的半结构化文本挖掘研究”)以及方正集团的课题资助。

主持研发的“方正智思”信息检索与智能分析产品已被广泛应用于国务院新闻办、中宣部等国家重要部门的互联网舆情分析预警系统等大型项目之中。

主要科研成果、专利、奖励:·《ASemi-StructuredDocumentModelForTextMining》计算机科学技术学报(JCST英文刊)2002.9·《半结构化数据相似搜索的索引技术研究》计算机学报2002.11·《基于规范划分集的并行循环计算划分》软件学报2003.3·《基于核矩阵学习的XML文档相似度量方法》软件学报2006.5·IntegratingElementKernelandTermSemanticsforSimilarity-BasedXMLDocumentClusteringWI'05·UsingProportionalTransportationSimilaritywithlearnedelementsemanticsforXMLdocumentclusteri ng.WWW2006·Manifold-rankingbasedtopic-focusedmulti-documentsummarization.IJCAI’07·SingleDocumentSummarizationwithDocumentExpansion.AAAI2007·Towardsaniterativereinforcementapproachforsimultaneousdocumentsummarizationandkeywordext raction.ACL2007·CollabSum:ExploitingMultipleDocumentClusteringforCollaborativeSingleDocumentSummarizati ons.SIGIR2007·LearninginformationdiffusionprocessontheWeb.WWW’07申请专利10多项,其中2项已获授权:·一种对半结构化文档集进行文本挖掘的方法专利,2004.8·一种基于快速排序算法的快速分页排序方法专利,2006.10奖励:·2004年度北京大学优秀博士论文。

北大考研-计算机科学技术研究所研究生导师简介-陈晓鸥_ 研究员

北大考研-计算机科学技术研究所研究生导师简介-陈晓鸥_ 研究员

·
YuxinPeng,CuihuaFang,XiaoouChen:UsingEarthMover'sDistanceforAudioClipRetrieval.PCM200
6
· 余 军 、 陈 晓 鸥 命 名 实 体 识 别 :One-at-a-timeorAll-at-once?Word-basedorCharacter-based ,
ICCC2007(ISTP)2007
·余军、杨建武、陈晓鸥,一种与 TDT 结合的增量多文档摘要方法,NCIRCS2007
·路斌、万小军、杨建武、陈晓鸥,《基于搜索引擎摘要的词汇语义褒贬计算》,计算机科学
爱考机构 中国高端考研第一品牌(保过 保录 限额)
爱考机构-北大考研-计算机科学技术研究所研究生导师 简介-陈晓鸥_ 研究员
陈晓鸥研究员
陈晓鸥,陈晓鸥,1960 年出生,研究员。1982 年毕业于国防科技大学计算机系计算机软件 专业。研究方向涉及数字音视频处理、数字图像处理、中文信息处理、数据挖掘、数字广播、 内容管理、数字电路辅助设计等领域。曾获国家广电总局科技创新奖一等奖、国防科技大学 科技进步二等奖、国家档案局优秀科技成果三等奖、中国科协期刊优秀学术论文奖、柯达奖 教金、CCID 中国信息技术创新人物奖等奖励。曾任文字信息处理国家重点实验室副主任、 北京大学计算机研究所副所长等职。现任中国中文信息学会常务理事。
研究方向: ·音乐概念识别与检索 ·安全监控视音频检索 ·数aoouChen,YuQianWu

DeshunYang,MUSICEMOTIONCLASSIFICATIONUSINGTF*IDFANDRHYMEBASEDONLY
RICS,InproceedingsofISMIR2011

北大考研-计算机科学技术研究所研究生导师简介-吴於茜_ 高级工程师

北大考研-计算机科学技术研究所研究生导师简介-吴於茜_ 高级工程师

爱考机构中国高端考研第一品牌(保过保录限额)
爱考机构-北大考研-计算机科学技术研究所研究生导师简介-吴於茜_高级工程师
吴於茜,女,1966年出生,高级工程师。

1984年至1988年就读于北方交通大学计算机科学技术系,获学士学位,1991年获计算机应用硕士学位。

1991年至1999年从事印前排版及彩色桌面出版系统的研究与开发。

1999年底开始从事XML方面研究,是XML中国论坛()主要策划者之一,参与编著《XML实用进阶教程》一书。

2000年起从事内容管理及跨媒体出版方面的技术研究和产品开发。

2001年获北京大学柯达奖。

研究方向
·图形图象处理
·内容管理
主要科研工作
·自1991年底至1999年底,从事桌面排版软件NPM开发和大型彩色拼版软件方正画苑的开发。

在色彩理论和彩色管理方面有较深入的研究。

·1999年底至今,主要从事XML技术的研究。

策划并建设XML中国论坛网,目前该网站访问量已超过12万人次。

·2000年起开始跨媒体出版及内容管理方面的研究,2001年推出方正博思内容管理平台,2002年推出该平台的2.0版本。

该平台将作为内容管理核心平台支持数字图书馆、教育、宽带内容增值服务、电子政务等多种领域的应用。

北京大学软件与微电子学院工程硕士专业方向及导师清单【模板】

北京大学软件与微电子学院工程硕士专业方向及导师清单【模板】

****大学软件与微电子学院工程硕士专业方向及导师清单(北京校区)
1、根据专业方向,先由学生选择导师,再由各领域学科组负责人召集进行双选协调确定责任导师,并根据情况配备协助导师。

最终由学院确定导师双选名单后公布。

2、导师(专职)每个方向限报20名,导师(兼职)每个方向限报10名。

3、2013年2月入学的学生也参加本次导师双选;单转双的同学导师不变,不参加双选。

4、导师后加*,表示该方向学生需要在导师所在实验室完成毕业实习。

5、9月17、18日网上导师双选;9月19-22日各学科组协调;9月23日各学科组报学院;9月25日公布导师双选结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

爱考机构中国高端考研第一品牌(保过保录限额)爱考机构-北大考研-计算机科学技术研究所研究生导师简介-万小军_副研究员
万小军:1979年生,2000年7月在北京大学信息管理系获理学学士,2003年7月在北京大学计算机科学技术系获理学硕士学位,2006年7月在北京大学信息科学技术学院获博士学位,博士论文获北京大学优秀博士论文奖,同年加入北京大学计算机科学技术研究所任助理研究员,2007年8月晋升为副研究员。

2008年获北京大学宝洁奖教金,同年入选教育部新世纪优秀人才支持计划与北京市科技新星计划(B类),2010年获北京大学王选青年学者奖。

研究方向为自然语言处理与文本挖掘。

现为ACM、ACL与CCF会员,多个国际一流会议(ACL、WWW、SIGIR、CIKM、COLING、EMNLP等)程序委员会委员,担任ACL2011领域共同主席,并担任多个国际权威期刊(T-ALIP、T-KDE、T-ALSP、KAIS、IPM等)审稿人。

以第一作者身份发表(含接收)论文30多篇,其中包括领域顶级国际会议与期刊(SIGIR、ACL、AAAI、IJCAI、COLING、ACMTOIS、ComputationalLinguistics)正式论文10多篇。

目前主持和承担多项国家科研项目。

以第一发明人申请发明专利10项,其中获授权7项。

详细情况参见英文主页:https:///site/wanxiaojun1979
研究小组主页:http://59.108.48.12/。

相关文档
最新文档