北大考研-计算机科学技术研究所研究生导师简介-刘家瑛_副教授

合集下载

区块链系统中的分布式数据管理技术——挑战与展望

区块链系统中的分布式数据管理技术——挑战与展望

第44卷 第1期2021年1月计 算 机 学 报CHINESEJOURNALOFCOMPUTERSVol.44No.1Jan.2021收稿日期:2019 03 22;在线发布日期:2019 10 31.本课题得到国家重点研发计划项目(2018YFB1003404)、国家自然科学基金(U1811261,61672142)、辽宁省科学技术基金(20180550321)资助.于 戈,博士,教授,中国计算机学会(CCF)会员,主要研究领域为分布式数据库、分布与并行计算、区块链.E mail:yuge@mail.neu.edu.cn.聂铁铮(通信作者),博士,副教授,中国计算机学会(CCF)会员,主要研究方向为数据库、数据集成、区块链.E mail:nietiezheng@mail.neu.edu.cn.李晓华,博士,讲师,中国计算机学会(CCF)会员,主要研究方向为信息安全、区块链.张岩峰,博士,教授,中国计算机学会(CCF)高级会员,主要研究领域为分布式数据处理、云计算.申德荣,博士,教授,中国计算机学会(CCF)高级会员,主要研究领域为分布式数据库、数据集成.鲍玉斌,博士,教授,中国计算机学会(CCF)高级会员,主要研究领域为数据仓库、OLAP.区块链系统中的分布式数据管理技术———挑战与展望于 戈 聂铁铮 李晓华 张岩峰 申德荣 鲍玉斌(东北大学计算机科学与工程学院 沈阳 110169)摘 要 区块链是在数字加密货币的应用基础之上发展起来的一种分布式数据库技术.区块链系统具有去中心化、不可篡改、分布共识、可溯源和最终一致性等特点,这使其可以用于解决不可信环境下数据管理问题.区块链独特的数据管理功能已经成为各领域应用中发挥区块链价值的关键.本文基于对比特币、以太坊、超级账本等代表性区块链系统的研究分析,阐述区块链系统中分布式数据管理技术.首先,深入讨论区块链系统与传统分布式数据库系统之间的异同点,从分布式部署模式、节点角色、链拓扑结构等多个方面给出区块链的分类.然后,详细分析各类区块链系统所使用的数据存储结构、分布式查询处理与优化技术及其优缺点.最后,总结区块链系统的分布式数据管理技术在各专门领域应用中所面临的挑战和发展趋势.关键词 区块链;分布式数据管理;数据存储;查询处理中图法分类号TP311 犇犗犐号10.11897/SP.J.1016.2021.00028犜犺犲犆犺犪犾犾犲狀犵犲犪狀犱犘狉狅狊狆犲犮狋狅犳犇犻狊狋狉犻犫狌狋犲犱犇犪狋犪犕犪狀犪犵犲犿犲狀狋犜犲犮犺狀犻狇狌犲狊犻狀犅犾狅犮犽犮犺犪犻狀犛狔狊狋犲犿狊YUGe NIETie Zheng LIXiao Hua ZHANGYan Feng SHENDe Rong BAOYu Bin(犛犮犺狅狅犾狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犈狀犵犻狀犲犲狉犻狀犵,犖狅狉狋犺犲犪狊狋犲狉狀犝狀犻狏犲狉狊犻狋狔,犛犺犲狀狔犪狀犵 110169)犃犫狊狋狉犪犮狋 Blockchainisatechniqueofdistributeddatabasewhichisdevelopedwiththeapplicationsofdigitalencryptedcurrency.Ablockchainsystemhasthecharacteristicsofdecentralization,non tampering,distributedconsensus,provenanceandeventualconsistency,whichmakesitbeappliedtosolvedatamanagementproblemsoftheuntrustedenvironments.Thedatamanagementfunctionofablockchainsystemhasalreadybecometheimportantfeatureforplayingitsvalueintheapplicationsofdifferentdomains.Blockchainsystemsmakeeverynodecontainacompletecopyofledgerdata,andusedistributedconsensusalgorithmstoensuretheconsistencyofdata.Therefore,ablockchainsystemisanewkindofdistributeddatamanagementsystemscomparedwithtraditionaldistributeddatabasesystems.WithanalyzingtherepresentativeblockchainsystemsincludingBitcoin,EthereumandHyperledgerFabric,thispaperfocusesonthedistributeddatamanagementtechniquesinexistingblockchainsystems,whichcoversqueryprocessing,smartcontract,networkcommunication,anddatastoragelayersinthearchitectureofblockchainsystems.Thispaperfirstdiscussesthemaindifferencesandsimilaritiesbetweenablockchainsystemandatraditionaldistributeddatabasesystem.Justlikeadistributeddatabasesystem,ablockchainsystemhasfeaturesofdistribution,transparency,autonomyandscalabilityonmanagingdata,butitisalsodifferentfrommostofdistributeddatabasesystemsontopologic,datadistribution,queryprocessing,consistencyandsecuritymechanism.Then,thispaperpresentstheclassificationofblockchainsystemsondifferentaspectsofdistributeddeploymentstyles,noderolesandtopologicalstructures.Withthedevelopmentofblockchaintechnology,blockchainsystemsaredesignedtoadaptblockchainapplicationenvironments.Themodelsofpublicblockchain,consortiumblockchainandprivateblockchainareproposed,andfunctionsofblockchainareregroupedanddeployedtomakenodesplaydifferentrolesinasystem.Moreover,themultipletopologicstructuresofblockchainareproposed.Besidesthechainstructureoftraditionalblockchain,theDAGstructures,suchasTangleandLattice,areappliedtoimprovetheefficiencyofblockchainsystems.Thirdly,thispaperanalyzesthetechniquesofdistributeddatastoragemanagement,distributedqueryprocessingandoptimizationusedinblockchainsystemsanddiscussestheiradvantagesanddisadvantages.Specifically,thedatastoragetechniquesofexistingblockchainsystemsaredeeplyanalyzed,includingthedatastructuresofstorage,aswellastheorganizationofdatafilesandoptimizationtechniques.Key ValuedatabasessuchasLevelDBareusuallyusedinblockchainsystemstoimprovetheefficiencyofaccessingledgerdataandstatedata.Currently,moreresearchworksfocusonusingdifferentmethods,includingdatabase,indexanddistributedstorage,tooptimizethestorageofblockchain.Thispaperalsoanalyzesvariousqueriesintheexistingblockchainsystemsandclassifiesthemintothreetypes:accountquery,transactionqueryandcontractquery.Thedistributedqueryprocessingtechniquesusedinblockchainsystemsarediscussed.Fourthly,thispaperpointsoutthechallengesanddevelopmenttrendsofdistributeddatamanagementtechniquesforblockchainsystems,includingdistributedstorageforblockchaindata,efficientandsecureconsensusmechanismforblockchaintransactions,highavailablequeryprocessing,distributedmanagementofsmartcontracts,privacyprotectionforblockchaindata,dataauditandmonitoringinblockchainsystem.Finally,thispapershowsthedistributeddatamanagementofblockchainsystemsinvariousdomain specificapplications,suchasfinance,manufacture,networkstorage,creditandotherfields.犓犲狔狑狅狉犱狊 blockchain;distributeddatamanagement;datastorage;queryprocessing1 引 言在“互联网+”应用日益普及的大环境下,大量应用需要将发生的事件、行为、状态持久地记录在分布式环境中以用于日后的查询,即进行分布式记账.分布式记账已经逐渐成为互联网应用中的一项重要功能.以电子商务交易系统为例,客户需要执行提交订单、通过电子银行向商家支付货款、从物流公司收货等操作,商家需要执行接受订单、通过物流公司发货、通过电子银行收款等操作,电子银行方需要执行从客户收款、向商家付款等操作,物流公司需要执行从商家收货、收取物流款、向客户发货等操作.客户、商家、物流公司、电子银行共四方处于一个分布式环境中,在每一个环节都需要记录相关的操作和信息.由于各方之间并不存在完全信任关系,最终以哪一方记录的账目为确认信息是一个重要的问题.传统的方法采用由电子商务交易服务平台作为公正的第三方进行统一记账,所有的交易信息的查询操作全部在这个平台上进行处理,物流公司和银行的部分数据也以接入的方式添加至交易服务平台.在这种传统集中式记账方式里,主要的交易信息存储在单一的记账方,这是一种“逻辑”上的集中式存储模式,即交易数据存储在唯一的某业务参与方并由其负责管理.集中式记账方式存在的问题包括:(1)记账方为了保证可靠性需要存储数据的多个副本,从而造成了数据存储的性能瓶颈;(2)交易数据可能被记账方篡改且无法验证,因此各参与方需要完全信任记账方;(3)记账方受到攻击后数据难以恢复.因此,传统集中式记账方式存在着存储效率低、可信性差、易受攻击等弊端.为了解决以上难题,采用分布式记账方式的比921期于 戈等:区块链系统中的分布式数据管理技术———挑战与展望特币系统(Bitcoin)[1]在2008年被首次提出,并受到广泛关注.随后,区块链技术作为比特币系统所采用的底层技术逐渐引起工业界与学术界的重视,比特币系统所具有的分布共享性、共识性、不可篡改性、可溯源性和最终一致性等特点均来源于区块链技术.在基于区块链技术的分布式记账方式中,所有参与方都可以保存一份相同的完全账本,新加入的参与方可以下载完全账本并验证账本的正确性.这种方式降低了传统集中式记账方式中记账方的多副本数据维护成本,同时参与方也可以通过访问本地数据提高访问效率.此外,在区块链系统中,交易的账目采用数字签名和加密算法处理,从而提高了系统中数据的安全性,而区块之间通过哈希值串联的数据关联方式和基于共识算法确认区块的数据写入机制也使得区块链上的数据极难被篡改.起初,区块链技术所支撑的比特币系统仅是一个专用的交易系统,并不支持虚拟货币交易以外的其他功能,这严重限制了区块链技术在分布式数据管理上的应用.随着区块链技术的发展,产生了大量新型区块链系统.2014年由Buterin基于区块链技术推出了以太坊(Etherum)平台[2].以太坊提供了基于智能合约的编程功能,支持区块链应用的二次开发,这标志着区块链2.0时代的诞生.超级账本(HyperledgerFabric)[3]则是基于IBM早期贡献出的OpenBlockchain为主体搭建而成的Linux基金会的区块链项目,其主要目的是发展跨行业的商用区块链平台技术.在超级账本框架中,包括了HyperledgerFabric①、HyperledgerBurrow②、HyperledgerSawtooth③和HyperledgerIroha等多个项目,构成了完整的生态环境.区块链3.0时代[4]则是将区块链技术的应用范围扩展到各类应用之中,服务领域除金融、经济之外,还包括政府、健康、科学、文化等领域.区块链技术将支持各类资产交易与登记的去中心化可信处理,并与物联网等技术融合.未来,区块链技术将会与其他新兴技术相结合用于各类应用之中,诸如区块链+科学、区块链+医疗、区块链+教育、区块链+能源等应用将会迅速发展.目前,区块链技术已应用于多个领域之中.在数字货币服务领域,支持支付、兑换、汇款、交易功能;在金融服务领域,支持清算、结算、安全监管、反洗钱等功能;在B2C服务领域,支持无人管理的商亭等新业务;在P2P租赁管理领域,支持无需中介的货物交换、租赁等共享经济新业务;在供应链管理领域,支持物理资产签名、物流跟踪和交付等功能;在知识产权保护领域,用于建立不可篡改的权利和拥有权;在征信管理领域,支持身份认证、日志审计和监管等;在溯源管理领域,支持数据鉴别与存证、防伪溯源等功能.区块链技术是一种建立在多种技术之上的分布式共享账本技术,而区块链本质上是一种多方参与共同维护的分布式数据库.相对于集中式数据库管理系统,区块链系统采用去中心化或者弱中心化的数据管理模式,没有中心节点,所有参与节点均可以存储数据,而事务的持久性则依靠参与节点共同维护的不断增长的数据链和非集中式的共识机制予以实现,保证了数据在基于验证基础上的可信性.此外,相比于传统的分布式数据库和分布式数据存储系统,区块链系统的参与节点可以获得完整的数据副本,而非部分数据的副本.区块链系统的特殊数据存储机制和一致性共识机制是其不同于传统分布式数据库系统的主要原因.区块链的数据存储结构和数据组织方式不同于其他数据存储系统.区块链将数据记录组织成区块(Block),并在每个区块的区块头中通过记录前一区块的哈希值将区块组织成链式结构.这种结构使区块链的数据存储具有不易篡改性、可溯源性和可验证性.然而,区块链的存储结构和基于密码学算法的共识机制也为数据管理带来了交易确认效率低和查询不便等诸多弊端.例如在记录交易的吞吐量方面,使用区块链技术的比特币系统仅支持每秒处理7笔交易数,并且还需要经过1小时以上时间才可以确认写到区块(相关研究表明43%的比特币交易未能在一小时内得到处理④).此外,区块链的数据记录按时间顺序存储在区块中,这为交易数据的查询处理带来了挑战,当前很多数字货币系统的查询处理都要依赖于某种键值数据库系统.其次,区块链的共识机制也不同于分布式数据库系统.区块链系统为了在P2P网络环境下保证交易操作符合事务特性,需要维护数据一致性,并避免“双重支付”(DoubleSpends)的发生,这是区块链共03计 算 机 学 报2021年①②③④HyperledgerFabric.https://www.hyperledger.org/projects/fabricHyperledgerBurrow.https://www.hyperledger.org/projects/hyperledger burrowHyperledgerSawtooth.https://www.hyperledger.org/projects/sawtoothStudy:43%ofBitcoinTransactionsAren’tProcessedafterFirstHour.2017.https://www.ccn.com/43 bitcoin transactions not processed one hour study says识机制的主要考虑的问题.同时,由于区块链网络本身是一个去中心化的网络,参与节点完全自治,并没有统一的节点负责管理和维护,为此区块链节点之间需要使用P2P技术实现数据广播以更新节点的状态信息和账本信息.区块链系统公认的基础架构模型[5]主要分为6层,本文在其基础上增加了查询层,以便对区块链系统的查询处理机制进行分析.这样,区块链系统架构扩展为7层,如图1所示,主要包括:(1)应用层.基于区块链的各类应用,如数字货币、区块链金融、区块链征信等;(2)查询层.实现对交易账本数据的访问和验证,以及对账号状态的查询;(3)合约层.由脚本、算法机制和智能合约所构成的可编程基础框架;(4)激励层.负责为奖励记帐工作而进行货币发行、交易费用分配任务;(5)共识层.封装网络节点的PoW、PoS、DPoS和PBFT等各类共识算法,实现分布式共识机制;(6)网络层.封装P2P组网机制,数据传播机制和数据验证机制;(7)数据层.封装底层数据区块的数据结构和加密机制.当前的区块链系统大多基于该系统架构进行实现,其中数据层、网络层、共识层和查询层是区块链系统的必要元素.现有相关工作针对区块链系统不同层次的技术和区块链在各领域上的应用进行了大量研究与综述.对于区块链系统所包含的关键技术和研究现状,以及未来的发展趋势,袁勇等人[5]在区块链的基础架构模型方面对比特币的原理和技术进行了系统的阐述,何蒲等人[6]结合比特币系统介绍了区块链的概念和技术,并对前景进行了展望,邵奇峰等人[7]对比特币、以太坊和超级账本等多个区块链平台进行分析,总结了区块链的优势、劣势和发展趋势.在应用层方面,文献[8]对区块链在数字货币上的应用进行了全面的综述,刘敖迪等人[9]介绍了区块链技术在信息安全领域的研究现状和进展.由于区块链具有健壮的数据存储能力,因此相关研究工作在数据存储系统上进行区块链技术的应用[10 11].对于合约层,贺海武等人[12]结合多个领域应用场景对智能合约技术的概念、关键技术和面临的问题进行了阐述.此外,对于共识层、网络层和数据层,已有研究分别对区块链系统的共识机制[13 14]、安全机制[15 16]、网络协议[17]、可信数据管理[18]和查询处理[19]进行了整理和综述.区块链在设计之初就是以进行防篡改的数据存储和管理为目的,分布式数据管理是区块链系统的主要功能之一.区块链技术中涉及分布式数据管理的部分主要集中在区块链架构的查询层、合约层、网络层和数据层,其中查询层和合约层在区块链系统中负责实现对数据的处理操作,如图1所示.本文主要以分布式数据管理为视角,基于对当前主流的区块链系统分析,对比不同区块链系统在数据管理上的差异,对其中分布式数据管理所涉及的数据存储技术、查询处理机制和算法进行阐述和分析,并对区块链研究中涉及分布式数据管理的挑战进行探讨,对各领域的应用进行展望.本文第2节对区块链系统的分布式数据管理机制进行分析,对比区块链系统和传统分布式数据管131期于 戈等:区块链系统中的分布式数据管理技术———挑战与展望理系统的异同;第3节介绍区块链系统的分类;第4节介绍区块链系统中的数据存储技术,包括物理存储结构,对比不同区块链系统在物理存储机制上的差异,以及区块链系统所采用的数据存储优化技术;第5节介绍区块链系统的数据查询处理技术;第6节探讨区块链系统在分布式数据管理方面所面临的研究挑战和发展方向;第7节展望区块链所支持领域应用的场景和待解决的问题;第8节总结全文.2 区块链系统的分布式数据管理区块链系统作为一种分布式数据库管理系统,主要以解决数字货币的货币转移、兑换和支付功能而被提出.区块链的特征主要体现在数据的公开透明、不可篡改和网络结构的去中心化等几个方面.由于区块链主要面向的是不可信数据存储环境下的记账应用,因此在数据存储上采用了去中心化、全副本的分布式方式,即所有参与方均通过P2P网络结构连接,并可以存储完整的共享账本.由此可见,区块链系统在管理交易记账上虽然使用了分布式数据管理方式,但与传统的集中式数据管理和分布式数据库系统管理数据的方式均有所差别.本节主要将区块链系统与传统数据管理方式进行对比和分析,并阐述彼此间的共同点和差异性.图2 记账业务流程对比2 1 区块链与传统分布式数据库的共同点区块链技术主要是针对现有金融机构的集中式记账系统的信任问题而被提出的,其本身是由分布式存储、P2P网络、加密算法、共识机制等多种技术所构成的.中本聪基于区块链技术设计并发行了数字货币“比特币”,用以解决美国次贷危机中所展现的金融机构信任问题.相比于金融机构的集中式记账系统,基于区块链技术的交易记账系统具有公开透明、去中心化、可溯源查询和不可篡改等诸多的优势,从而避免了集中式记账方式中账本的真实性高度依赖于对记账方信任的弊端.这里以电子商务的交易记账应用为例,对传统基于清算中心的集中式记账方式和基于区块链的分布式记账方式的记账业务流程进行对比.传统集中式记账方式如图2(a)所示,交易相关的账目数据集中存储在清算中心的数据库中,交易的参与各方如果需要调用完整的交易信息需要访问清算中心,其弊端主要体现在完全依赖于对清算中心记账方的信任,一旦记账方失信或遭受攻击,其保存的数据也随之失去可信性.区块链的分布式记账方式如图2(b)所示,其中账本数据是整体共享的,以区块为单位通过密码学算法链接在一起,且网络中任何一个参与方均可以存储完整的共享账本副本,而数据的安全性则也是基于密码学算法予以保证.由于所有参与方均保存有共识后的共享账本,因此任何一个参与方进行双重支付或篡改账本数据的难度变得极大,从而保证账本数据在不可信环境中的可信性.区块链系统的分布式记账方式使其在数据存储管理的方式上与分布式数据库相同,即存储结构化的数据集合,这些数据逻辑上属于同一系统,物理上分布在计算机网络的各个不同场地上[17].区块链系统同样具有分布式数据库所具有的诸多特性:(1)分布性区块链系统与分布式数据库系统在数据的存储方面都是物理上分散、逻辑上统一的系统.区块链系统中具有全局统一的数据模式,数据以副本形式存储在参与节点中,每个参与节点存储的是数据模式相同且数据一致的共享账本.(2)透明性区块链系统在数据访问上具有透明性,用户看到的共享账本是全局数据模型的描述,就如同使用集中式数据库一样,在记录交易数据时也不需要考虑共享账本的存储场地和操作的执行场地.在数据复制方面,区块链系统的共享账本存储在各个参与节点上,并通过共识机制自动维护数据的一致性.23计 算 机 学 报2021年(3)自治性区块链系统的参与节点具有高度的自治性.在通信方面,参与节点可以独立地决定如何与其他参与者进行通信;在查询方面,参与节点本地就保存了完整的共享账本,可以在本地执行对账本数据的访问.(4)可伸缩性区块链系统支持参与节点规模的任意扩展.区块链系统允许参与节点在任意时刻加入和退出系统.而且,由于区块链的参与节点保存的是完整共享账本,因此对于参与节点重新加入区块链系统后,仅需要从其他节点更新缺失的区块数据即可完成数据的重新分布,不会影响整体的系统性能.2 2 区块链与传统分布式数据库的差异区块链系统原始的设计目的之一是解决非信任环境下数据的可信性问题.所谓的非信任环境是指负责数据存储的节点可能随意篡改数据而其他参与节点又无法识别,这将造成参与节点之间的互不信任问题.对于传统分布式数据库管理系统而言,系统建立在信任环境,其中参与节点采用统一管理的方式,节点之间具备完全相互信任的关系.因此区块链与传统的分布式数据库在数据管理方式上又具有显著的差异,如图3所示,具体体现在以下几个方面:(1)去中心化拓扑结构在参与节点的网络拓扑结构方面,区块链系统的去中心化结构采用了基于P2P的分布式模式,这种结构与基于P2P网络结构[20]的数据库系统(P2PDBS)[21 22]相似.如图3(b)所示,区块链节点通过通信控制器(CM)仅基于邻居地址进行通信,其加入和退出都是随意和动态的.传统分布式数据库虽然数据分布在不同的场地,但是通常采用中心化的主从结构,由全局的网络管理层存储各个局部数据库节点的地址和局部数据的模式信息,以用于查询处理时进行全局优化和调度,如图3(a)所示.(2)数据分布方式分布式数据管理的数据存储方式,通常分为两类[23]:①分割式.数据被划分成若干个不相交的分片,分别保存在不同的节点上,数据的划分方法分为水平分片和垂直分片;②复制式.同一个数据分片保存在一个以上的节点上,复制方式分为部分复制和全复制.分割式能够节省数据的存储空间,查询时需要在节点间传输数据,虽然使用半连接等算法可进行优化,但效率依然较低.复制式通过多节点的数据冗余存储可提高查询效率,但耗费存储空间且需要维护数据一致性.区块链系统的数据分布采用的是全复制式,即每个参与节点都在本地复制了具有全局模式的全部数据.因此,数据在区块链系统中是全局共享的,如图3(b)所示.相比于区块链系统,传统分布式数据库的分布方式主要基于在全局模式创建局部模式,再对数据进行垂直分片和水平分片,如图3(a)所示,每个节点存储的是全局数据分片的副本,再通过数据分片的元信息管理实现全局数据的访问和查询处理.当前很多基于分布式数据库技术的大数据存储系统,如HBase①等,均采用集中式的元信息管理节点管理数据副本的分布信息.图3 区块链系统与传统分布式数据库系统对比(3)数据查询处理区块链系统中对账本信息的查询处理通常在存331期于 戈等:区块链系统中的分布式数据管理技术———挑战与展望①ApacheHBaseReferenceGuide.http://hbase.apache.org/book.html储了完整共享数据的参与节点本地执行.由于区块数据采用基于文件的存储方式且本身缺少索引结构,因此在区块链上直接执行对账本查询只能使用顺序扫描的方式访问所有区块数据.目前区块链系统常用的查询优化方式是将账本记录存储在Key Value数据库中,以提高数据的访问效率.当前,比特币和以太坊等系统都使用了LevelDB①存储和检索数据.需要说明的是,在以太坊这类支持智能合约的第二代区块链系统中,智能合约代码的执行处理是嵌入在区块链记账功能中的.因此,对智能合约代码的调用是在所有参与进行共识验证的节点上执行.传统分布式数据库的查询处理主要基于数据副本的大小和分布场地进行优化[24],而在面向大数据的分布式数据库上则采用基于并行计算思想的查询优化方法[25].(4)数据一致性维护数据一致性是保证数据正确性和可信性的关键,区块链系统采用共识机制来保证各节点上数据的一致性.在数字货币的应用中通常采用工作量证明机制(PoW)通过算力竞争保证分布式的一致性[26],如解决基于SHA256、Ethash②等算法的数学难题,而从节约能耗的角度,则会采用权益证明机制(Proof of Stake,PoS)和授权权益证明机制(DelegatedProof of Stake,DPoS)等③方法.其中,使用工作量证明机制进行一致性维护的最大问题在于共识的效率过低,一个区块的一致性需要在其后生成一定长度的后续区块之后才能够被确认.分布式数据库系统通常采用包括实用拜占庭容错PBFT[27]、Paxos[28]、Gossip[29]、RAFT[30]等高效的算法维护数据的一致性,而这些算法也被一些面向联盟链应用的区块链系统所采用.(5)数据安全性机制区块链系统在安全性方面主要为用户提供了数据篡改验证、数据溯源和加密安全机制.数据的篡改可以通过校验前后区块的哈希值进行验证,因此要篡改数据并被所有参与者认可就需要在算力上付出高昂代价以重新生成区块,其难度相比传统的集中式和分布式数据库都要大很多.但是在数据的可访问性上,由于区块链的共享性,所有用户均可访问完整数据,而传统数据库管理系统则基于用户身份验证方式控制数据的访问.为了解决共享数据上的隐私安全性问题,区块链采用了基于非对称加密的交易方式实现匿名交易,其优点是很好地保护了用户隐私,缺点是一旦密钥丢失,用户的账号信息将无法恢复.综上所述,区块链系统相比传统分布式数据库系统,在记账方式上提供了更好的分布性、透明性和可信性,在功能上提供了防篡改验证机制和智能合约机制,因此更加适合在非可信环境下的匿名使用.另一方面,相比传统的分布式数据库系统,区块链系统在网络结构、数据存储和访问方式上也具有显著的差异.3 区块链系统的分类3 1 区块链系统部署方式的分类区块链系统根据其分布式部署方式和开放对象被划分为三种:“公有链”(PublicBlockchain)、“联盟链”(ConsortiumBlockchain)和“私有链”(PrivateBlockchain).三类区块链系统的对比如表1所示.表1 各区块链系统类型对比公有链联盟链私有链网络结构完全去中心化部分去中心化(多)可信中心节点规模无控制可控有限加入机制随时可以参加特定群体或有限第三方机构内部节点记账方任意参与节点预选节点机构内部节点数据读取任意读取受限读取受限读取共识机制容错性高、交易效率低(PoW或PoS等)容错性和交易效率适中(PBFT,RAFT)容错性低、交易效率高(Paxos,RAFT)激励机制有代币激励无代币激励无代币激励代码开放完全开源部分开源或定向开源不开源(1)公有链公有链是对所有人开放的,任何互联网用户都能够随时加入并任意读取数据,能够发送交易和参与区块的共识过程.比特币和以太坊等虚拟货币系统就是典型的公有链系统.公有链是完全去中心化的结构,其共识机制主要采用PoW、PoS或DPoS等方式,将经济奖励和加密算法验证相结合,以保证经济奖励和共识过程贡献成正比.此外,公有链中程序开发者对系统的代码是完全开源的,而且开发者无权干涉用户.在分布式数据管理方面,公有链系统的优势和缺陷主要包括以下几个方面:43计 算 机 学 报2021年①②③LevelDB.http://leveldb.org/RayJ.Ethash.https://github.com/ethereum/wiki/wiki/EthashBitshares.DelegatedProofofStake.http://docs.bits hares.org/bitshares/dpos.html。

北大考研-计算机科学技术研究所研究生导师简介-陈晓鸥_ 研究员

北大考研-计算机科学技术研究所研究生导师简介-陈晓鸥_ 研究员

·
YuxinPeng,CuihuaFang,XiaoouChen:UsingEarthMover'sDistanceforAudioClipRetrieval.PCM200
6
· 余 军 、 陈 晓 鸥 命 名 实 体 识 别 :One-at-a-timeorAll-at-once?Word-basedorCharacter-based ,
ICCC2007(ISTP)2007
·余军、杨建武、陈晓鸥,一种与 TDT 结合的增量多文档摘要方法,NCIRCS2007
·路斌、万小军、杨建武、陈晓鸥,《基于搜索引擎摘要的词汇语义褒贬计算》,计算机科学
爱考机构 中国高端考研第一品牌(保过 保录 限额)
爱考机构-北大考研-计算机科学技术研究所研究生导师 简介-陈晓鸥_ 研究员
陈晓鸥研究员
陈晓鸥,陈晓鸥,1960 年出生,研究员。1982 年毕业于国防科技大学计算机系计算机软件 专业。研究方向涉及数字音视频处理、数字图像处理、中文信息处理、数据挖掘、数字广播、 内容管理、数字电路辅助设计等领域。曾获国家广电总局科技创新奖一等奖、国防科技大学 科技进步二等奖、国家档案局优秀科技成果三等奖、中国科协期刊优秀学术论文奖、柯达奖 教金、CCID 中国信息技术创新人物奖等奖励。曾任文字信息处理国家重点实验室副主任、 北京大学计算机研究所副所长等职。现任中国中文信息学会常务理事。
研究方向: ·音乐概念识别与检索 ·安全监控视音频检索 ·数aoouChen,YuQianWu

DeshunYang,MUSICEMOTIONCLASSIFICATIONUSINGTF*IDFANDRHYMEBASEDONLY
RICS,InproceedingsofISMIR2011

全国大学老师会议通讯录

全国大学老师会议通讯录

所在院系
职称
数学与计算机学院 数学系 数学所 数学与计算科学学院 应用数学所 数学学院 数学系 数学科学学院 数学与统计学院
数学学院 数学科学学院 数学与信息科学学院 数学与计算机科学学院 数学系 应用数学所 数学所
理学院 数学系 数学系
理学院 数学系 数学科学学院 数学系 数学系 数学与计算机科学系 数学科学学院
数学学院 数学系 数学科学学院 数学系 数学科学学院 数学与统计学院 数学科学学院 数学系 数理信息学院数学系 理学院数学系 数学系 数学系 数学系
数学学院
数学科学学院 数学学院
讲师 研究生 教授 研究生 讲师 研究生 研究生 副教授 副教授 副教授 副教授 副教授 研究生 讲师 研究生 研究生 副教授 讲师
教授
117 杨迎球 男 安顺学院
数学与计算机科学系 讲师
56 姚光同 男 山姚海楼 男 北京工业大学
教授
83 姚廷富 男 贵州师范大学
数计学院
研究生
43 姚云飞 男 阜阳师范学院
数学与计算科学学院 教授
95 叶家琛 男 同济大学
数学系
教授
27 叶郁
男 中国科学技术大学
数学系
139 林增强 男
115 令狐荣涛 男
31 刘东

110 刘家春 男
152 刘建波 男
20 刘文德 男
55 陆珊年 男
53 罗翠玲 女
12 罗栗

112 罗勇贵 男
120 孟道骥 男
128 穆强

81 倪军娜 女
10 倪霖

40 宁群

89 裴玉峰 男
8 钱玲

84 任斌

计算机系2022-2022(2)研究生课程表

计算机系2022-2022(2)研究生课程表

计算机系2022-2022(2)研究生课程表学期2022春2022春2022春2022春2022春2022春2022春2022春2022春2022春2022春2022春2022春2022春2022春课程代码某033518/C033716CS28002某033533C033728某033537CS28001C033713某033530F033574某033514某033533某033525某033526F033569F033581课程名称程序语言理论计算复杂性高级论题学分/学时起止周3/483/482-17周3-10周1-16周1-16周1-11周1-16周1-16周1-16周1-8周1-12周1-16周1-16周1-16周6-13周10-17周上课时间任课教师上课地点陈瑞球楼309电院3-318陈瑞球楼312陈瑞球楼207陈瑞球楼309陈瑞球楼309电院3-414陈瑞球楼207陈瑞球楼312陈瑞球楼313陈瑞球楼219陈瑞球楼216陈瑞球楼207陈瑞球楼309陈瑞球楼311备注全英文课程星期四11-13节邓玉欣星期一11-13节傅育熙星期四11-13节星期四6-8节星期四3-5节高晓沨郁昱算法分析与理论(英语班)3/48可证明安全理论并行计算与并行算法现代移动通信与计算现代密码算法密码算法与协议神经网络理论与应用计算机图形学算法分析与理论机器学习生物信息学自然语言理解网络安全基础3/482/323/483/483/483/483/483/483/483/483/483/48全英文课程星期三11-13节过敏意星期五11-13节贾维嘉星期二11-13节刘胜利星期一6-8节星期一6-9节星期四6-9节星期三6-8节星期五6-8节星期四6-8节星期三6-9节星期三6-9节龙宇吕宝粮马利庄任庆生杨旸苑波赵海朱浩瑾/阮娜全英文课程全英文课程全英文课程全英文课程全英文课程上课时段上课时间(节次)1、2节08:00-09:403、4节10:00-11:405、6节12:00-13:407、8节14:00-15:409、10节16:00-17:4011、12节18:00-19:4011、12、13节18:00-20:20。

北京大学 哲学硕士培养计划

北京大学 哲学硕士培养计划

北京大学硕士研究生培养方案(报表)一级学科名称哲学专业名称科学技术哲学专业代码010108北京大学研究生院制表填表日期:1999年6月24日修订日期:2002年5月16日一学科(专业)主要研究方向二培养目标与学制及应修学分三课程设置(包括专题研讨课等)注:1. 序号第8-11的4门课程中至少必须选修3门。

2. 序号第12-13的2门课程中至少必须选修1门。

3. 补修课为推荐免试者开设,不计学分。

4. 研究生还可在导师指导下选修校内其他院、系、所、中心开设的有关课程。

P r o g r a m m e o f M a s t e r S t u d e n t C o u r s e sD i s c i p l i n e (一级学科):P h i l o s o p h y S p e c i a l t y (二级学科):P h i l o s o p h y o f S c i e n c e a n d T e c h n o l o g y*. N —n e e s s a r y ; C -c h o s e n ; M --m a k e -u p . **.S --S p r i n g s e m e s t e r ; A --A u t u m n s e m e s t e r四科研能力与水平及学位论文的基本要求五对新生能力、水平的基本要求及入学考试科目设置一北京大学博士研究生培养方案(报表)一级学科名称哲学专业名称科学技术哲学专业代码010108北京大学研究生院制表填表日期:1999年6月24日修订日期:2002年5月16日一学科(专业)主要研究方向二培养目标与学制及应修学分三 课程设置(包括讨论班等)P r o g r a m m e o f P h . D S t u d e n t C o u r s e sD i s c i p l i n e (一级学科):P h i l o s o p h y S p e c i a l t y (二级学科):P h i l o s o p h y o f S c i e n c e a n d T e c h n o l o g y*. N --n e c e s s a r y ; C -c h o s e n . **.S --S p r i n g s e m e s t e r ; A --A u t u m n s e m e s t e r课程内容提要四前沿讲座课(含讨论班)的基本要求五需阅读的主要经典著作和专业学术期刊目录六学习安排和综合考试的基本要求七科研能力与水平的基本要求八学位论文的基本要求1九对新生能力、水平的基本要求及入学考试科目设置北京大学直攻博、硕-博连读研究生培养方案(报表)一级学科名称哲学专业名称科学技术哲学专业代码010108北京大学研究生院制表填表日期:1999年6月24日修订日期:2002年5月16日说明:本报表中的学科(专业)主要研究方向、前沿讲座课(含讨论班)的基本要求、需阅读的主要经典著作与专业学术期刊目录、学位论文的基本要求等部分内容同博士研究生培养方案(报表)一培养目标与学制二课程设置(包括讨论班和属于硕士生层次的课程)注:1. 序号第8-11的4门课程中至少必须选修3门。

电子科大计算机导师介绍

电子科大计算机导师介绍

电子科技大学计算机学院导师及其科研能力介绍为方便大家报考我们学校,了解各位导师的学术和科研能力,科大考研网www.**将提供给大家详细的信息。

陈雷霆,1966年7月出生,男,现任电子科技大学计算机学院副教授、副院长,主管学院的科研、产业和外事工作,在职博士研究生;现为中国软件行业协会理事,四川省计算机学会理事。

主要研究方向:(1)信息安全;(2)网络多媒体与虚拟现实。

主要科研项目:国家“863-317-403”项目—综合业务多媒体通讯终端与系统;“八五”军事预研项目激光成像雷达系统;多媒体安全监控系统;“九五”军事预研项目激光防撞雷达系统;总装备部项目军用移动图象采集压缩传输系统;航空科技信息集成处理系统;模拟实战射击训练系统;国家“十五”863信息安全项目等。

开设研究生课程:多媒体技术及应用、计算机图形学、软件认证;本科生课程:多媒体技术、数字逻辑。

--------------------------------------------------------------------------------李毅超,男,1969年6月,硕士,副教授。

1997年4月毕业于电子科技大学,获计算机应用硕士学位。

现任网络安全基础实验室主任,计算机网络与通信研究室主任,计算机网络与安全技术研究所副所长,兼成都市软件行业协会副秘书长。

研究方向为计算机网络与通信、网络信息安全、嵌入式应用。

参加或主持"恩威网络MIS系统“、“420驻厂军代室光纤网络MIS系统”、“路由器开发”、信产部基金项目“IP电话网关”,成都华易“美视数字录像监控系统”、西部网信“软交换关守和IP电话多功能终端研发”等近10个科研项目,获得四川省科技三等奖1项,省部级科技成果鉴定5项,国家版权局软件著作权2项。

出版《计算机网络》教材1本在国内外重要刊物和国际会议上发表论文十余篇。

为本科和硕士生开设了若干课程。

获得Microsoft、Novell、SCO、Cisco、Compaq等各大公司认证证书和授权讲师资格。

北大考研-计算机科学技术研究所研究生导师简介-贾文华_ 副研究员

北大考研-计算机科学技术研究所研究生导师简介-贾文华_ 副研究员

爱考机构-北大考研-计算机科学技术研究所研究生导师简介-贾文华_副研究员贾文华副研究员贾文华,男,1968年生于四川省渠县,1987年进入北京大学学习,1994年毕业于北京大学计算机科学技术系计算机软件专业,获得理学硕士学位。

现任北京大学计算机科学技术研究所副研究员,长期从事电子出版、印刷系统技术的研究、开发管理及其产品在国际市场的推广。

1994年到1998年的主要研究领域是文字、图形和图象信息的计算机处理,1999年开始从事基于网络、数据库的数字化流程技术方面的研究工作,2000年起同时开始研究并实施如何将自主技术的软件产品有效出口欧美市场。

曾获得北京市科技进步一等奖和北京大学优秀教学奖(柯达奖教金)。

研究方向研究室主页>>·基于网络与数据库的数字化流程·文字与图形图象信息处理主要科研成果·1993年与阳振坤博士和其它同事一起实现了国际上第一个中文PostScriptLevel2的激光照排控制器(也称光栅化图象处理器)—PSP,同年秋天产品化并在香港明报正式投入使用。

·1997年完成了基于WindowsNT的全32位多线程的PostScript激光照排控制器—PSPNT,PSPNT包含近20个子系统30多万行源代码,我个人担任PostScript解释器总体设计师职责。

·1998年起全面负责方正激光照排控制器的研制工作,组织研制了支持PostScriptLevel3和出版印刷行业新标准PDF1.3的新版激光照排控制器,并对欧美客户行业要求进行深入调研并对产品进行大幅度提升和改进,于2000年成功推出方正EagleRIP2.1激光照排控制器,并成功推向欧美纯西文市场。

·1999年发起并组织研究方正畅流全数字化工作流程系统,其基于出版印刷行业国际标准—PDF,有效应用数据库和互联网技术,并完全采用国际组织CIP4的最新国际标准—JDF 作为方正畅流系统内部与印前其它工艺、印刷、印后加工、互联网管理以及第三方管理信息系统通讯的标准语言,形成全数字化的高度自动化的印前工艺流程管理系统,极大地提高了出版印刷行业的生产效率和管理水平。

ODQ文档模型和语法的扁平化处理

ODQ文档模型和语法的扁平化处理

优先出版 计 算 机 应 用 研 究 第32卷--------------------------------基金项目:北京市教委科技面上项目(SQKM201211232011);网络文化与数字传播北京重点实验室开放课题资助;北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)作者简介:凌峰(1990-),男,北京人,硕士研究生,主要研究方向为文档信息处理(tomoko000@);刘旭红(1972-),女,博士,副教授,主要研究方向为XML 与文档信息处理;田英爱(1975-),女,博士,高级实验师,主要研究方向为文档数据处理与集成、软件工程;李宁(1964-),男,博士,教授,主要研究方向为文档信息处理、XML 、信息技术标准化.ODQ 文档模型和语法的扁平化处理 *凌 峰,刘旭红,田英爱,李 宁(北京信息科技大学 计算机学院,北京 100192)摘 要:ODQ 是一种面向流式办公文档的查询语言。

为了提高ODQ 的查询效率并降低使用难度,提出了一种将ODQ 文档模型和语法进行扁平化处理的方法。

首先将ODQ 文档模型由传统树形结构转换成多线性结构,减少文档模型的层次。

其次,在语法中设置特定关键字,将文档模型中的各层次连接起来,形成一条可以直接访问目标数据的路径。

实验结果表明扁平化处理可以使查询效率得到提高,并简化查询操作。

关键词:文档查询语言;文档格式;扁平化;文档模型;语法 中图分类号:TP302.1 文献标志码:AFlattening dispose of ODQ document model and grammarLING Feng, LIU Xu-hong, TIAN Ying-ai, LI Ning(Dept. of Computer, Beijing Information Science & Technology University, Beijing 100192, China)Abstract: ODQ is a query language for streaming office documents. In order to increase the query efficiency and lower the use difficulty, this paper proposed a method to flatten the ODQ document model and grammar. First, it translated the ODQ document model from the original tree structure into multi-linear structure, and reduced the level of document model. Second, it designed a specific keyword in grammar, which is able to link all levels of document model and create a path that lead to the target data. The experimental results show that the flatten procedure can increase the query efficiency and simplify the query operations. Key Words: document query language; document format; flattening dispose; document model; grammar0 引言目前流式文档在办公领域占据了很大的份额。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究方向: 数字图像/视频处理与编码优化技术: ·可伸缩视频编码与率失真优化 ·时空超分辨率,视频重建技术 ·图像先验建模与稀疏表达 ·基于视觉感知的视频编码与处理 ·图像/视频的质量评测技术
代表论文及专利成果: FullPublicationList 部分获奖情况: ·2010 年 12 月获北京大学第十届青年教师教学演示竞赛理工科类一等奖(全校 2 名) ·2010 年 7 月获北京大学“优秀毕业生”(校级) ·2009 年 10 月获 IBM 中国优秀学生巾帼奖学金(国家级) ·2009 年 10 月获北京大学“学术创新奖”(校级)
爱考机构 中国高端考研第一品牌(保过 保录 限额)
爱考机构-北大考研-计算机科学技术研究所研究生导师
简介-刘家瑛_副教授
刘家瑛副教授 . ?. . . 研究组主页(ResearchGroup) ? ?
刘家瑛,女,1983 年出生,陕西西安人。2010 年 6 月毕业于北京大学计算机应用技术专业, 获理学博士学位。2007 年 8 月至 2008 年 8 月赴美南加州大学多媒体通讯实验室做访问学者。 2010 年 7 月留校任教,加入北京大学计算机科学技术研究所从事科研教学工作,2012 年 8 月晋升为副教授。研究领域包括超分辨率的视频处理技术、可伸缩视频编码与优化研究、基 于视觉感知的视频处理与编码技术以及图像视频质量评价技术研究等。曾在视频领域的顶级 国际期刊 IEEET-CVST,视频压缩领域的国际顶级会议 DCC,图像多媒体处理领域国际重 要会议 IEEE-ICIP,IEEE-ICME 等会议上发表多篇论文,并已申请国内专利 8 项,国际专利 2 项 。 还 担 任 国 际 权 威 期 刊 IEEET-IP,T-CSVT,IEEET-MM,J-VCIR 等 及 国 际 会 议 IEEE-ISCAS,ICIP,ICME,MMSP,VCIP,E一品牌(保过 保录 限额)
·ReviewerforIEEETransactionsonCircuitsandSystemsforVideoTechnology ·ReviewerforIEEETransactionsonImageProcessing ·ReviewerforIEEETransactiononMultimedia ·ReviewerforIEEESignalProcessingLetter ·ReviewerforIEEEICASSP,InternationalConferenceAcoustics,Speech,SignalProcessing ·ReviewerforVCIP,VisualCommunicationsandImageProcessing ·ReviewerforIEEEISCAS,InternationalSymposiumonCircuitsandSystems ·Member,IEEE
联系方式: 通讯地址:北京大学计算机科学技术研究所 邮编:100871 传真:010-82529714 E-mail:
相关文档
最新文档