基于重复数据删除的虚拟桌面存储优化技术_付印金

合集下载

一种云存储系统中重复数据删除机制

一种云存储系统中重复数据删除机制

一种云存储系统中重复数据删除机制
毕朝国;徐小龙
【期刊名称】《计算机应用研究》
【年(卷),期】2014(31)10
【摘要】基于现有重复数据删除策略,提出了一种基于负载均衡的C/S双端延迟重复数据删除方法.利用基于类型的数据分块方法将数据块分成若干块;利用MD5提取指纹值,与客户端本地的索引表对比指纹,若相同则用指针取代该数据块,具有数据块指纹和数据类型的索引表一同发送至控制器;控制器在收到客户端的请求后,首先根据自己实时监控得到的各服务器的当前状态来选择最佳目标存储节点;服务器端根据数据类型查询不同的索引表以缩小查找范围.对提出的方法的重复数据删除率进行了实验验证,结果表明该机制具有较好的性能表现.
【总页数】5页(P3052-3055,3060)
【作者】毕朝国;徐小龙
【作者单位】南京财经大学江苏省现代服务业研究院,南京210003;南京邮电大学计算机学院,南京210003
【正文语种】中文
【中图分类】TP333
【相关文献】
1.云存储环境中基于离线密钥传递的加密重复数据删除方法研究 [J], 张曙光;咸鹤群;刘红燕;侯瑞涛
2.基于分数阶Fourier变换的云存储系统重复数据删除算法 [J], 徐奕奕;唐培和
3.基于云存储的重复数据删除架构的研究与设计 [J], 宋雨;易璐;王凤霞
4.一种基于重复数据删除技术的云中云存储系统 [J], 毛波;叶阁焰;蓝琰佳;张杨松;吴素贞
5.基于多比特重复数据删除的云存储信道隐藏 [J], 施南业;袁莹;汪昕晨;俞俊杰因版权原因,仅展示原文概要,查看原文内容请购买。

基于Simhash改进的文本去重算法

基于Simhash改进的文本去重算法

基于Simhash改进的文本去重算法
张亚男;陈卫卫;付印金;徐堃
【期刊名称】《计算机技术与发展》
【年(卷),期】2022(32)8
【摘要】为了提高大规模文本去重算法Simhash对重复数据的检测精度,针对词袋(Bag of Words,BoW)模型无法体现特征词位置分布信息的缺点,提出一种改进的Simhash算法(P-Simhash)。

该算法首先改进了Simhash计算特征词权重的方法,在由TF-IDF算法计算得到特征词的权重的基础上,引入Jaccard相似度量对共现词的权重进行优化,以降低共现词权重过高对检测文本差异的影响。

其次采用BDR算法降维思想,设计了体现特征词位置差异的签名方案,将特征词在文本中出现的位置特征转化为一组由二进制向量表示的签名。

最后,将特征词哈希签名与位置特征签名加权求和的结果作为其对应的特征向量,与经过优化后的特征词权重进行二次加权,合并降维后得到新的文本签名。

使用开放的搜狗新闻数据集进行实验,并与其他算法进行了性能比较。

实验结果表明,P-Simhash算法在去重效果和执行效率上较传统的Simhash算法有明显提高。

【总页数】7页(P26-32)
【作者】张亚男;陈卫卫;付印金;徐堃
【作者单位】陆军工程大学指挥控制工程学院
【正文语种】中文
【中图分类】TP301
【相关文献】
1.基于Simhash的大数据去重改进算法
2.基于Simhash的中文文本去重技术研究
3.基于Simhash的大规模文档去重改进算法研究
4.改进的Simhash算法在文本查重中的研究及应用
5.Simhash算法在文本去重中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。

基于重复数据删除的虚拟桌面存储优化技术

基于重复数据删除的虚拟桌面存储优化技术

基于重复数据删除的虚拟桌面存储优化技术付印金;肖侬;刘芳;鲍先强【期刊名称】《计算机研究与发展》【年(卷),期】2012(049)0z1【摘要】Depending on massive cloud infrastructure in data centers, virtual desktop infrastructure (VDI) can provide software and hardware resources for user on demand. However, there are two challenges facing VDI: low storage capacity utilization and low desktop performance. In this paper, we present a deduplication based storage optimization technique for virtual desktop environment. It can significantly reduce storage capacity requirement based on large amounts of data redundancy in virtual desktop storage, and boost desktop performance by server local disk cache and solid state disk (SSD) in hybrid storage pool. The experimental evaluations, based on our prototype implementation, show that static chunking based deduplication can get higher deduplication ratio and efficiency than content defined chunking based deduplication, and 4 KB is its optimal chunk size with 85% storage capacity saving; Our I/O optimiza-tion based on local disk cache and SSD can speedup the virtual machine startup performance by 35%.%虚拟桌面基础架构依靠数据中心海量的云基础设施,为用户按需提供虚拟桌面部署所需的软硬件资源,但同时面临存储资源利用率低和虚拟机启动慢的困境.针对虚拟桌面存储中具有大量数据冗余的特性,采用重复数据删除技术缩减虚拟桌面基础架构的存储空间需求;并利用服务器本地磁盘缓存以及共享存储池内的固态硬盘来优化虚拟机的启动性能.通过原型实现,发现相比于基于内容分块的策略,静态分块策略更适合虚拟桌面存储进行重复数据删除,最优的分块大小为4 KB,并能够缩减85%的存储空间容量;通过服务器本地磁盘缓存和基于闪存的固态硬盘进行I/O优化,虚拟机的启动速度能够获得35%的提升.【总页数】6页(P125-130)【作者】付印金;肖侬;刘芳;鲍先强【作者单位】国防科学技术大学计算机学院长沙410073;国防科学技术大学计算机学院长沙410073;国防科学技术大学计算机学院长沙410073;国防科学技术大学计算机学院长沙410073【正文语种】中文【中图分类】TP393【相关文献】1.基于存储环境感知的重复数据删除算法优化 [J], 周敬利;聂雪军;秦磊华;刘科;朱建峰;王宇2.基于重复数据删除的虚拟机镜像存储优化的研究与实现 [J], 李张娟3.重复数据删除技术方案选型删除冗余优化存储 [J], 雷赫4.基于重复数据删除技术的雾存储数据去冗余方案 [J], 陈思佳; 温蜜; 陈珊5.基于重复数据删除的虚拟机镜像存储优化的研究与实现 [J], 李张娟因版权原因,仅展示原文概要,查看原文内容请购买。

面向大数据备份的应用感知并行重删存储系统

面向大数据备份的应用感知并行重删存储系统

面向大数据备份的应用感知并行重删存储系统
付印金;胡谷雨;倪桂强;陈卫卫;卢继荣
【期刊名称】《计算机研究与发展》
【年(卷),期】2015(0)S2
【摘要】随着社会数字网络信息化进程的不断推进,全球IT企业需要管理的数据量急剧增长.当前大规模数据中心对海量复杂数据管理在扩展性、性能和成本等方面要求的不断提升.为了减缓企业存储容量的增长速度,传统的重复数据删除存储管理技术和方法已无法满足大数据备份应用的服务质量需求,新的软硬件技术进步为大数据管理能力的提升带来机遇.提出了一种面向大数据备份的应用感知并行重删存储系统,它利用新型非易失性存储来提升块索引的并发查询能力,并通过应用层丰富的文件语义信息设计应用感知的数据路由机制.通过实验论证,该并行重删存储系统不仅能实现单个节点内高性能的并行数据重删处理,还能通过横向扩展提升集群数据重删的吞吐量.
【总页数】9页(P139-147)
【关键词】大数据备份;并行重删;应用感知;非易失存储;扩展性
【作者】付印金;胡谷雨;倪桂强;陈卫卫;卢继荣
【作者单位】解放军理工大学指挥信息系统学院
【正文语种】中文
【中图分类】TP333;TP309.3
【相关文献】
1.面向大数据的并行数据分布式备份存储仿真 [J], 姚迎乐;张志华
2.BDCode:一种面向大数据存储系统的纠删码算法 [J], 殷超;王健宗;吕海涛;崔宗敏;程良伦;李同芳;刘妍
3.面向大数据应用的多层次混合式并行方法 [J], 黄磊;支小莉;郑圣安
4.面向大数据异构系统的神威并行存储系统 [J], 何晓斌;蒋金虎
5.面向大数据异构系统的神威并行存储系统 [J], 何晓斌;蒋金虎
因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于历史信息的一致性Hash集群重复数据删除路由策略

一种基于历史信息的一致性Hash集群重复数据删除路由策略

一种基于历史信息的一致性Hash集群重复数据删除路由策略邢玉轩;肖侬;刘芳;付印金;李芳;巫小泉【期刊名称】《计算机研究与发展》【年(卷),期】2014(0)S2【摘要】随着全球数据量爆炸式增长,单节点重复数据删除系统已不能满足系统在吞吐量等方面的性能需求,因此集群重复数据删除系统应运而生.如何提高数据传输效率、节约网络带宽和增强系统的可扩展性,成为当前面临的严峻挑战.提出一种基于历史数据信息的一致性Hash路由策略,通过在本地缓存热点数据块指纹,数据路由前先在本地索引,可以大大减少索引消息请求数量,并且采用一致性Hash的路由策略,有效地缓解集群系统中动态扩展存储节点导致的全局数据重删率急剧恶化与负载不均.在3类真实的数据集上进行试验,能减少20%~80%的指纹消息请求,动态扩展存储节点导致数据缩减率降低保持在33%以下,并且能够很好地保持系统节点间负载均衡.【总页数】7页(P182-188)【关键词】重复数据删除集群;路由策略;消息请求;负载均衡;数据缩减率【作者】邢玉轩;肖侬;刘芳;付印金;李芳;巫小泉【作者单位】国防科学技术大学计算机学院;解放军理工大学指挥信息系统学院【正文语种】中文【中图分类】TP311.13【相关文献】1.基于文件路径的重复数据删除集群的数据路由策略 [J], 王丽芳;张志珂;蒋泽军;蔡小斌;彭成章2.一种武警云计算环境下集群重复数据删除策略 [J], 段志刚;吴耕锐;薄鸟3.一种基于历史相遇信息的容迟网络地理路由算法 [J], 王艳;李建波;宋有美;王夫沭4.HDRA:一种基于历史寻径信息的分布式路由算法 [J], 乔保军;毋琳;计卫星5.一种基于历史信息的社会机会网络路由算法 [J], 杨云辉;王小明;张立臣;刘森;林亚光因版权原因,仅展示原文概要,查看原文内容请购买。

一种分布式文件重复数据删除系统及方法[发明专利]

一种分布式文件重复数据删除系统及方法[发明专利]

专利名称:一种分布式文件重复数据删除系统及方法专利类型:发明专利
发明人:侯孟书,周立康,许佳欣,詹思瑜,周世杰
申请号:CN202010362251.X
申请日:20200430
公开号:CN111522791A
公开日:
20200811
专利内容由知识产权出版社提供
摘要:本发明公开了一种分布式文件重复数据删除系统及方法。

系统包括元信息服务节点,元信息服务节点用于管理数据块的内容地址;元信息表,用于存储HDFS系统中所有数据块的内容地址;至少一个HDFS客户端,其包括元信息服务节点和元信息表,去重文件在HDFS客户端上写入,HDFS 客户端将重文件切分为多个数据块,计算每个数据块的指纹值,并调用元信息服务节点查询元信息表,去除重复的数据块,将节点中剩余数据块重组后,之后将剩余数据块和索引数据重组后生成新的索引文件,并与NameNode节点交互将索引文件存储到HDFS上,同时将新产生的数据指纹存储在HDFS客户端数据库的元信息表中。

通过本发明使得HDFS客户端快速完成文件的重复数据删除和分布式存储。

申请人:电子科技大学
地址:610041 四川省成都市高新区(西区)西源大道2006号
国籍:CN
代理机构:成都金英专利代理事务所(普通合伙)
代理人:袁英
更多信息请下载全文后查看。

基于Hadoop平台的分布式重删存储系统

基于Hadoop平台的分布式重删存储系统刘青;付印金;倪桂强;梅建民【期刊名称】《计算机应用》【年(卷),期】2016(036)002【摘要】针对数据中心存在大量数据冗余的问题,特别是备份数据造成的存储容量浪费,提出一种基于Hadoop平台的分布式重复数据删除解决方案.该方案通过检测并消除特定数据集内的冗余数据,来显著降低数据存储容量,优化存储空间利用率.利用Hadoop大数据处理平台下的分布式文件系统(HDFS)和非关系型数据库HBase 两种数据管理模式,设计并实现一种可扩展分布式重删存储系统.其中,MapReduce 并行编程框架实现分布式并行重删处理,HDFS负责重删后的数据存储,在HBase数据库中构建索引表,实现高效数据块索引查询.最后,利用虚拟机镜像文件数据集对系统进行了测试,基于Hadoop平台的分布式重删系统能在保证高重删率的同时,具有高吞吐率和良好的可扩展性.【总页数】6页(P330-335)【作者】刘青;付印金;倪桂强;梅建民【作者单位】解放军理工大学指挥信息系统学院,南京210007;解放军理工大学指挥信息系统学院,南京210007;解放军理工大学指挥信息系统学院,南京210007;解放军理工大学指挥信息系统学院,南京210007【正文语种】中文【中图分类】TP309.3【相关文献】1.支持文件重删的HDFS分布式备份系统研究 [J], 王建辉;石宇良2.基于Hadoop平台的农产品价格数据爬取和存储系统的研究 [J], 杨晓东;郜鲁涛;杨林楠;刘建阳3.Hadoop平台的分布式重删存储系统研究 [J], 荆东星4.基于Scrapy和Hadoop平台的房屋价格数据爬取和存储系统 [J], 丁志毅5.面向大数据备份的应用感知并行重删存储系统 [J], 付印金;胡谷雨;倪桂强;陈卫卫;卢继荣因版权原因,仅展示原文概要,查看原文内容请购买。

基于存储环境感知的重复数据删除算法优化

基于存储环境感知的重复数据删除算法优化周敬利;聂雪军;秦磊华;刘科;朱建峰;王宇【期刊名称】《计算机科学》【年(卷),期】2011(038)002【摘要】Storage applications such as backup and archive are creating more and more duplication data, which has caused increasing waste in storage space and energy consumption,and how to delete duplication data has become a hot subject in research. CDC(Content-Defined Chunking) is a prevail algorithm for data de-duplication and can be applicable in various environment, however it does not take into account .some characteristics which are specific to individual environment and can influence its result. We studied the CDC's application in storage system and put up with two constraints for determining parameters for CDC: (1)Determining parameters such as average block size based on the block organization of storage devices; (2)l)etermining block boundary based on candidate boundary distribution. The result indicates that,comparing with the separate CDC without restraint conditions, these two constraints can achieve 16. 3%higher compression ratio with 4 data sets.%在备份和归档等存储应用中产生的重复数据在存储空间和能耗上造成的浪费问题日益突出,如何删除重复数据已成为当前存储领域中的研究热点.CDC(Content-Defined Chunking)是一种适用于多种应用环境的重复数据删除算法,但缺乏针对具体应用环境的优化.通过对存储环境进行感知和分析,为CDC算法提出了两个参数选择约束条件:(1)根据存储设备中的数据块存储方式来选择平均分块大小等参数;(2)根据数据的分块边界分布特性来选择分块边界特征值参数.实验表明,与无约束条件的CDC算法相比,这两个约束条件在4个实验数据集上平均可提高16.3%的数据缩减比.【总页数】5页(P63-67)【作者】周敬利;聂雪军;秦磊华;刘科;朱建峰;王宇【作者单位】华中科技大学计算机科学与技术学院,武汉430074;华中科技大学计算机科学与技术学院,武汉430074;华中科技大学计算机科学与技术学院,武汉430074;华中科技大学计算机科学与技术学院,武汉430074;华中科技大学计算机科学与技术学院,武汉430074;华中科技大学计算机科学与技术学院,武汉430074【正文语种】中文【中图分类】TP334.5【相关文献】1.云存储环境中基于离线密钥传递的加密重复数据删除方法研究 [J], 张曙光;咸鹤群;刘红燕;侯瑞涛2.基于重复数据删除的虚拟机镜像存储优化的研究与实现 [J], 李张娟3.基于多比特重复数据删除的云存储信道隐藏 [J], 施南业;袁莹;汪昕晨;俞俊杰4.基于重复数据删除技术的雾存储数据去冗余方案 [J], 陈思佳; 温蜜; 陈珊5.基于重复数据删除技术的存储系统分析 [J], 朱江;冀鸣;杨志成;张嘉贤;曹雄因版权原因,仅展示原文概要,查看原文内容请购买。

基于布隆过滤器的新型混合内存架构磨损均衡策略

基于布隆过滤器的新型混合内存架构磨损均衡策略张震;付印金;胡谷雨【摘要】相变存储器(PCM)凭借低功耗的优势有望成为新一代主存储器,但是耐受性的缺陷成为其广泛应用的重要障碍.现有的随机存取存储器(DRAM)缓存技术和磨损均衡分别从减少PCM写数量以及均匀化写操作分布两个角度延长PCM使用寿命,但前者在写回数据时未考虑数据的读写倾向性,后者在空间局部性较强的应用场景下存在数据交换粒度、空间开销、随机性等诸多问题.因此,设计一种全新的混合存储架构,结合最近最少使用(LRU)算法和带有时间变化的最不经常使用(LFU-Aging)算法提出区分数据读写倾向性的缓存策略,并且基于布隆过滤器(BF)设计针对强空间局部性工作集的动态磨损均衡算法,在有效减少冗余写操作的同时实现低空间开销的组间磨损均衡操作.实验结果表明,该策略能够减少PCM上13.4%~38.6%的写操作,同时有效均匀90%以上分组的写操作分布.【期刊名称】《计算机应用》【年(卷),期】2018(038)008【总页数】6页(P2230-2235)【关键词】相变存储器;混合存储架构;缓存算法;布隆过滤器;磨损均衡【作者】张震;付印金;胡谷雨【作者单位】陆军工程大学指挥控制工程学院,南京210007;73610部队,南京210007;陆军工程大学指挥控制工程学院,南京210007;陆军工程大学指挥控制工程学院,南京210007【正文语种】中文【中图分类】TP391.40 引言随着信息技术的高速发展,大数据所催生的内存计算和处理器核数的不断增加对内存的速度、容量、功耗和可靠性的需求都达到前所未有的新高度。

在过去数十年期间,动态随机存取存储器(Dynamic Random Access Memory, DRAM)作为主要主存储器被广泛应用在移动终端和大规模计算系统中。

然而,现代计算机系统对大容量、低功耗、扩展性强的高性能内存的需求不断增加,高静态功耗、容量提升达到上限、扩展性有限的DRAM面临着众多新型存储技术的挑战。

基于区块链的多代理联合去重方案

基于区块链的多代理联合去重方案
张亚男;陈卫卫;付印金;徐堃
【期刊名称】《计算机系统应用》
【年(卷),期】2022(31)6
【摘要】随着多云存储市场的快速发展,越来越多的用户选择将数据存储在云上,随之而来的是云环境中的重复数据也呈爆炸式增长.由于云服务代理是相互独立的,因此传统的数据去重只能消除代理本身管理的几个云服务器上的冗余数据.为了进一步提高云环境中数据去重的力度,本文提出了一种多代理联合去重方案.通过区块链技术促成云服务代理间的合作,并构建代理联盟,将数据去重的范围从单个代理管理的云扩大到多代理管理的多云.同时,能够为用户、云服务代理和云服务提供商带来利益上的共赢.实验表明,多代理联合去重方案可以显著提高数据去重效果、节约网络带宽.
【总页数】7页(P86-92)
【作者】张亚男;陈卫卫;付印金;徐堃
【作者单位】陆军工程大学指挥控制工程学院
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于区块链与代理重加密的数据共享方案
2.基于门限代理重加密和IPFS的数据去中心化安全共享方案
3.基于区块链的代理重加密信息共享及安全多方计算模型
4.
基于区块链和代理重加密的电子处方共享方案5.支持属性和代理重加密的区块链数据共享方案
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
] 3 4 - 存储空间 [ . N a t h等人发现在基于虚拟机的存储
系统中进 行 块 级 重 复 数 据 删 除 能 够 充 分 利 用 存 储
5] 和网络资源 [ . L i u o r i等人对不同操作系统的虚拟 g
机磁盘镜像进行重 复 数 据 删 除 效 果 比 较 分 析 , 并测 试重复数 据 删 除 技 术 对 虚 拟 机 启 动 和 读 性 能 的 影
用频率不同 ; 本文将 被 频 繁 引 用 的 数 据 块 存 放 在 数 据中心中较传统硬盘性能高的基于闪存的固态硬盘 上, 并同时在服务器 端 通 过 本 地 磁 盘 缓 存 热 数 据 以 提高虚拟桌面的访问性能 .
1 相关工作
1. 1 重复数据删除技术 重复数据删除技术是一种基于数据冗余度的数 据缩减技术 . 它首先 利 用 一 定 的 数 据 分 块 策 略 将 大 的数据对象划分为 若 干 较 小 的 数 据 块 , 并用数据块 的加密哈希值作为 指 纹 来 标 识 它 们 ; 通过比对数据 块的指纹 , 我们可以 提 高 存 储 系 统 的 空 间 利 用 率 和 按重复数据删除操作时机 网络系统的带宽利 用 率 . 的不同 , 可以分为在 线 重 复 数 据 删 除 和 离 线 重 复 数 据删除 . 在虚拟桌面架构中 , 由于即时缩减数据能够 使得在线重复数 避免不必要的数据 传 输 和 写 操 作 , 据删除更具有优势 . 按重复数据删除操作粒度的差 可以分 为 文 件 级 、 块级甚至字节级重复数据删 异, 除. 根据虚拟机磁盘镜像特点 , 我们发现块级在线重 复数据删除技术更适合虚拟桌面存储的优化 . 目前 , 重复数据删除技术已被广泛应用于虚拟 机环境 . 通过分析虚拟机磁盘镜像的消重效果 , 发现 重复数据删除技术能够大量地缩减虚拟机磁盘镜像
中图法分类号 T P 3 9 3
云计算 已 成 为 分 布 式 计 算 领 域 中 的 研 近年来 , 究热点 . 它是指运行 在 数 据 中 心 软 硬 件 上 的 应 用 通 过I 并将数据中心内 n t e r n e t为用户按 需 提 供 服 务 ;
1] 的软 硬 件 资 源 统 称 为 云 [ 云计算自身并不是一种 .
, , , F u Y i n i n X i a o N o n L i u F a n a n d B a o X i a n i a n j g g q g
( ) C o l l e e o C o m u t e r, N a t i o n a l U n i v e r s i t o D e e n s e T e c h n o l o C h a n s h a4 1 0 0 7 3 g f p y f f g y, g
基于重复数据删除的虚拟桌面存储优化技术
付印金 肖 侬 刘 芳 鲍先强
( ) 国防科学技术大学计算机学院 长沙 4 1 0 0 7 3 ( i n i n f u m a i l . c o m) @g y j
D e d u l i c a t i o n B a s e d S t o r a e O t i m i z a t i o n T e c h n i u e f o r V i r t u a l D e s k t o p g p q p
计算机研究与发展 J o u r n a l o f C o m u t e r R e s e a r c h a n d D e v e l o m e n t p p
I S S N 1 0 0 0 1 2 3 9 C N 1 1 1 7 7 7 T P - ? - ? ( ) : , 4 9S u l . 1 2 5 3 0 2 0 1 2 -1 p p
, A b s t r a c t e e n d i n o n m a s s i v e c l o u d i n f r a s t r u c t u r e i n d a t a c e n t e r s v i r t u a l d e s k t o i n f r a s t r u c t u r e D p g p ( ) , V D I c a n r o v i d e s o f t w a r e a n d h a r d w a r e r e s o u r c e s f o r u s e r o n d e m a n d .H o w e v e r t h e r e a r e t w o p : , f a c i n V D I l o w s t o r a e c a a c i t u t i l i z a t i o n a n d l o w d e s k t o t h i s c h a l l e n e s e r f o r m a n c e . I n a e r g g p y p g p p p r e s e n t w e a d e d u l i c a t i o n b a s e d s t o r a e o t i m i z a t i o n t e c h n i u e f o r v i r t u a l d e s k t o e n v i r o n m e n t . I t p p g p q p c a n s i n i f i c a n t l r e d u c e s t o r a e c a a c i t r e u i r e m e n t b a s e d o n l a r e a m o u n t s o f d a t a r e d u n d a n c i n g y g p y q g y , e r f o r m a n c e v i r t u a l d e s k t o s t o r a e a n d b o o s t d e s k t o b s e r v e r l o c a l d i s k c a c h e a n d s o l i d s t a t e d i s k p p g p y ( , , o o l . T h e r o t o t e S S D) i n h b r i d s t o r a e e x e r i m e n t a l e v a l u a t i o n s b a s e d o n o u r i m l e m e n t a t i o n p p y p y g p p s h o w t h a t s t a t i c c h u n k i n b a s e d d e d u l i c a t i o n c a n e t h i h e r d e d u l i c a t i o n r a t i o a n d e f f i c i e n c t h a n g p g g p y , c o n t e n t d e f i n e d c h u n k i n b a s e d d e d u l i c a t i o n a n d 4K B i s i t s o t i m a l c h u n k s i z e w i t h 8 5% s t o r a e g p p g ;O s a v i n u r I O o t i m i z a t i o n b a s e d o n l o c a l d i s k c a c h e a n d S S D c a n s e e d u t h e v i r t u a l c a a c i t ? - g p p p p y m a c h i n e s t a r t u b 3 5%. e r f o r m a n c e p y p ; ; ; K e w o r d s l o u d c o m u t i n v i r t u a l d e s k t o d e d u l i c a t i o n s t o r a e o t i m i z a t i o n s o l i d s t a t e d i s k c p g p; p g p y 为用户按需提供虚拟桌面部署所需的软 硬 摘 要 虚拟桌面基础架构依靠数据中心海量的云基础设施 , 件资源 , 但同时面临存储资源利用率低和虚拟机启动慢的困境 . 针对虚拟桌面存储中具有大量数据冗余 采用重复数据删除技术缩减虚拟桌面基础架构的存储空间需求 ; 并利用服务器本地磁盘缓存以 的特性 , 及共享存储池内的固态硬盘来优化虚 拟 机 的 启 动 性 能 . 通 过 原 型 实 现, 发现相比于基于内容分块的策 略, 静态分块策略更适合虚拟桌面存储进行重复数据删除 , 最优的分块大小为 4K 并能够缩减 8 B, 5% 的 存储空间容量 ; 通过服务器本地磁盘缓存和基于闪存的固态硬盘进行 I 虚拟机的启动速度能够 O 优化 , ? 获得 3 5% 的提升 . 虚拟桌面 ; 重复数据删除 ; 存储优化 ; 固态硬盘 关键词 云计算 ;
新技术 , 而是一种新服务模式 . 这种 , 具有按使用计费
2] 和扩展灵活的特性 [ 通过对I . T 资源的统一部署与
集中管理 , 云计算能够优化资源的利用率 , 为用户提
- - 2 0 1 2 0 1 0 4 收稿日期 :
) ; ) 国家自然科学基金项目 ( 教育部新世纪优秀人才支持计划基金项目 ( 6 0 7 3 6 0 1 3, 6 1 0 2 5 0 0 9, 6 0 9 0 3 0 4 0, 6 1 0 7 0 1 9 8 N C E T 0 8 0 1 4 5 基金项目 : - -
1 2 6
( 计算机研究与发展 2 增刊 ) 0 1 2, 4 9
供廉价 、 高效 、 可靠的服务 . 虚拟 桌 面 作 为 一 种 典 型 的 云 计 算 应 用 , 是建立 如图 1 所示 , 虚拟 在服务器虚拟化基础上的云应用 . 桌面基础架构在云中为用户提供远程的计算机桌面 服务 ; 服务提供者在 数 据 中 心 服 务 器 上 运 行 用 户 所 需的操作系统和应 用 软 件 , 然后采用桌面显示协议 将操作系统桌面视图以图像的方式传送到用户端设 同时 , 服务器 对 用 户 端 的 输 入 进 行 处 理 , 并随 备上 . 用户通过任意可以接入 时更新 桌 面 视 图 的 内 容 . 通过授 权 认 证 即 可 进 行 桌 面 计 算 . I n t e r n e t的终端 , 在虚拟桌面计算模 式 下 , 所有计算都可以放在数据 中心的服务器上 , 对终端设备的要求将大大降低 , 类 似于平板电脑 、 智能手机 、 掌上电脑以及其他智能的 更灵活 手持设备这样的瘦 终 端 就 可 以 满 足 更 广 泛 、 的应用需求 . 虚拟桌面架构通过服务器虚拟化 , 集中 管理 、 统一配置 , 使得计算和数据更安全 ; 同时 , 便于 降低 I 能耗以及管理开销 . 精简配置 , T 系统成本 、
相关文档
最新文档