XSKY 分布式存储解决方案
分布式存储解决方案

分布式存储解决方案目录一、内容概览 (2)1. 背景介绍 (3)2. 目标与意义 (3)二、分布式存储技术概述 (5)1. 分布式存储定义 (6)2. 分布式存储技术分类 (7)3. 分布式存储原理及特点 (8)三、分布式存储解决方案架构 (9)1. 整体架构设计 (10)1.1 硬件层 (12)1.2 软件层 (13)1.3 网络层 (14)2. 关键组件介绍 (15)2.1 数据节点 (16)2.2 控制节点 (18)2.3 存储节点 (19)2.4 其他辅助组件 (20)四、分布式存储解决方案核心技术 (22)1. 数据分片技术 (23)1.1 数据分片原理 (25)1.2 数据分片策略 (26)1.3 数据分片实例分析 (28)2. 数据复制与容错技术 (29)2.1 数据复制原理及策略 (31)2.2 容错机制与实现方法 (32)2.3 错误恢复过程 (34)3. 数据一致性技术 (35)3.1 数据一致性概念及重要性 (36)3.2 数据一致性协议与算法 (37)3.3 数据一致性维护与保障措施 (38)4. 负载均衡与性能优化技术 (39)4.1 负载均衡原理及策略 (41)4.2 性能优化方法与手段 (43)4.3 实例分析与展示 (43)五、分布式存储解决方案应用场景及案例分析 (44)1. 场景应用分类 (46)2. 具体案例分析报告展示 (47)一、内容概览分布式存储解决方案是一种旨在解决大规模数据存储和管理挑战的技术架构,它通过将数据分散存储在多个独立的节点上,提高数据的可用性、扩展性和容错能力。
本文档将全面介绍分布式存储系统的核心原理、架构设计、应用场景以及优势与挑战。
我们将从分布式存储的基本概念出发,阐述其相较于集中式存储的优势,如数据分布的均匀性、高可用性和可扩展性。
深入探讨分布式存储系统的关键组件,包括元数据管理、数据分布策略、负载均衡和容错机制等,并分析这些组件如何协同工作以保障数据的可靠存储和高效访问。
深信服分布式存储 参数

深信服分布式存储一、什么是分布式存储分布式存储是一种将数据分散存储在多个计算机节点上的存储方式。
它将数据分割成多个块,分别存储在不同的节点上,通过网络协议进行数据的读写操作。
相比于传统的集中式存储,分布式存储具有高可靠性、高性能和可扩展性的优势。
二、深信服分布式存储的优势深信服分布式存储是一套高性能、高可靠性的分布式存储系统。
它具有以下优势:1. 高可靠性深信服分布式存储采用冗余备份的方式存储数据,即将数据的多个副本存储在不同的节点上。
当某个节点出现故障时,系统可以自动切换到其他节点上的备份数据进行读写操作,从而保证数据的可靠性和高可用性。
2. 高性能深信服分布式存储采用了分布式文件系统和分布式数据库等技术,可以实现数据的并行读写和负载均衡。
它可以根据业务需求动态调整存储节点的数量和存储容量,从而提高数据的访问速度和系统的整体性能。
3. 可扩展性深信服分布式存储可以根据业务需求灵活扩展存储节点的数量和存储容量。
当业务负载增加时,可以通过增加存储节点来提高系统的存储能力和吞吐量。
同时,深信服分布式存储还支持数据的动态迁移和负载均衡,可以自动调整数据的分布和存储位置,从而实现系统的可扩展性和弹性伸缩性。
三、深信服分布式存储的架构深信服分布式存储的架构主要包括以下几个组件:1. 存储节点存储节点是深信服分布式存储的核心组件,负责存储和管理数据。
每个存储节点都有独立的存储设备和计算资源,可以独立处理数据的读写操作。
存储节点之间通过网络连接进行通信和数据同步,保证数据的一致性和可靠性。
2. 元数据服务元数据服务负责存储和管理数据的元数据信息,包括文件的名称、大小、创建时间等。
它可以记录数据的分布和存储位置,提供数据的查找和访问服务。
深信服分布式存储的元数据服务采用分布式数据库技术,可以实现高可用性和高性能的元数据访问。
3. 数据访问接口数据访问接口是深信服分布式存储的外部接口,负责处理数据的读写请求。
它可以根据请求的类型和参数,将读写请求发送到相应的存储节点进行处理。
分布式存储系统及解决方案介绍

分布式存储系统及解决方案介绍分布式存储系统是指将数据分散存储在多个节点或服务器上,以实现高可靠性、高性能和可扩展性的存储解决方案。
分布式存储系统广泛应用于云计算、大数据分析和存储等领域。
本文将介绍几种常见的分布式存储系统及其解决方案。
1. Hadoop分布式文件系统(HDFS):Hadoop分布式文件系统是Apache Hadoop生态系统的一部分,用于存储大规模数据集。
该系统基于块存储模型,将文件划分为块,并将这些块分布式存储在多个节点上。
HDFS使用主从架构,其中NameNode负责管理文件系统的命名空间和协调数据块的存储位置,而DataNode负责实际的数据存储。
HDFS提供了高吞吐量和容错性,但对于小型文件存储效率较低。
2. Ceph分布式文件系统:Ceph是一个开源的分布式存储系统,能够提供可伸缩的冗余存储。
其架构包括一个Ceph存储集群,其中包含多个Ceph Monitor节点、Ceph Metadata Server节点和Ceph OSD(对象存储守护进程)节点。
Ceph仅需依赖于普通的网络和标准硬件即可构建高性能和高可靠性的存储系统。
Ceph分布式文件系统支持POSIX接口和对象存储接口,适用于各种应用场景。
3. GlusterFS分布式文件系统:GlusterFS是一个开源的分布式文件系统,能够提供高可用性和可扩展性的存储解决方案。
它使用类似于HDFS的块存储模型,将文件划分为固定大小的存储单元,并将这些存储单元分布式存储在多个节点上。
GlusterFS采用主从架构,其中GlusterFS Server节点负责存储数据和文件系统元数据,而GlusterFS Client节点提供文件系统访问接口。
GlusterFS具有良好的可伸缩性和容错性,并可以支持海量数据存储。
4. Amazon S3分布式存储系统:Amazon S3(Simple Storage Service)是亚马逊云服务提供的分布式对象存储系统。
分布式存储解决方案

分布式存储解决方案下面将系统地介绍几种常见的分布式存储解决方案。
1. 分布式文件系统(Distributed File System, DFS):分布式文件系统将文件分割为多个块,并将这些块存储在不同的节点上,实现文件的高可靠性、高可扩展性和高性能。
其中比较著名的有Hadoop分布式文件系统(Hadoop Distributed File System, HDFS)和谷歌分布式文件系统(Google File System, GFS)。
HDFS将文件分割为固定大小的数据块,并将这些数据块复制到多个节点上。
通过对数据块的复制,实现了数据的冗余和高可靠性。
同时,HDFS还采用了主从架构和数据局部性原理,使得数据的读写操作能够高效地在节点之间实现负载均衡和数据局部性。
GFS采用了类似的设计思想,将文件分割为大量的数据块,并将这些数据块按照一定的规则分布到多个节点上。
通过为每个文件存储多个副本和采用主从架构,实现了数据的冗余和高可靠性。
同时,GFS还使用了日志结构文件系统和数据局部性原理,使得数据的读写操作能够高效地在节点之间实现负载均衡和数据局部性。
2. 分布式对象存储(Distributed Object Storage, DOS):分布式对象存储将数据存储为对象,并将这些对象通过哈希算法分布到多个节点上,实现对象的高可靠性、高可扩展性和高性能。
其中比较著名的有亚马逊云存储服务(Amazon S3)和谷歌云存储服务(Google Cloud Storage)。
这些分布式对象存储系统采用了分布式哈希表的设计思想,将对象根据其哈希值分布到多个节点上。
通过为每个对象存储多个副本和采用主从架构,实现了对象的冗余和高可靠性。
同时,这些系统还使用了一致性哈希算法和数据局部性原理,使得对象的读写操作能够高效地在节点之间实现负载均衡和数据局部性。
3. 分布式块存储(Distributed Block Storage, DBS):分布式块存储将数据划分为固定大小的块,并将这些块存储在多个节点的硬件设备上,实现块的高可靠性、高可扩展性和高性能。
分布式存储系统及解决方案介绍

分布式存储系统及解决方案介绍目录一、概述 (2)二、XX分布式存储系统主要特性 (3)2.1 海量存储,在线横向扩展 (3)2.2 数据可靠性与性能的平衡 (3)2.3 不间断的业务服务 (3)2.4 直观、人性化的管理 (4)三、XX分布式存储系统架构图 (4)四、XX分布式存储系统应用场景 (5)一、概述分布式存储系统,是将数据分散存储在多台独立的设备上。
该方案采用领先的全分布式架构,无单点故障,具有高弹性和高可靠性,性能和容量可横向扩展,分层分级存储数据,并可自定义存储系统的性能、容量、数据保护能力。
打破现有存储技术瓶颈,专有分布式存储解决方案,无单点故障、集群越大性能越好、支持平滑扩展。
XX分布式存储系统,能对上层应用多副本同时提供块存储、对象存储、文件存储等多种数据存储服务,为云计算、大数据业务等提供大容量、高可靠、经济的存储解决方案。
存储平台支持容量、性能等自由扩展,满足客户多样化的存储需求。
二、XX分布式存储系统主要特性2.1 海量存储,在线横向扩展●支持块存储接口可为主流的Windows和Linux操作系统提供磁盘卷,磁盘空间可调整。
●支持对象存储接口可通过APP、Web、API等方式访问存储资源池,也可通过Web随时随地接入访问;基于通用标准API接口,可定制企业专属网盘应用、为开发者提供通用访问接口。
●支持通用存储介质支持SAS/SATA/PCI-E接口及协议,支持固态硬盘和机械硬盘的组合模式。
2.2 数据可靠性与性能的平衡●支持数据多副本、数据纠删码等数据冗余配置●支持数据快照、快照回滚、用户数据隔离等数据保障措施●支持SSD存储池与HDD池组合模式,加速读写性能●支持软硬件故障系统自动修复,系统服务数据可靠性可达99.999%●支持集群跨机房灾备2.3 不间断的业务服务●控制管理通道与用户数据平面分离●支持物理卷镜像、存储资源快照等数据保障功能●用户可构建跨存储池、跨地区海量统一存储空间资源池●扩容、设备硬件故障及节点系统故障处理,均不会导致存储集群服务中断2.4 直观、人性化的管理●管理系统提供直观的集群中设备、磁盘、资源、状态可视化清单管理员设设置全局数据备份机制(多副本和EC码)●提供实时动态和历史记录告警、错误数据,以及多点提示●统一的部署、管维平台●可定制客户端APP,优化用户体验三、XX分布式存储系统架构图高效、极简的数据存储及管理解决方案,满足超大并发、超高性能、超大容量等各类业务场景。
数据湖Hadoop大数据存算分离的XSKY存储

数据湖Hadoop大数据存算分离的XSKY存储据IDC预测,到2021年,至少50%的全球GDP将由数字化驱动。
面对海量数据,企业亟需通过更加现代化、敏捷、高性能的IT基础设施来推进业务持续发展。
当今世界,只有很少的数据得到了分析,还有巨大的待开发潜能,在高达3000亿美元的以数据为驱动的市场中,中国在人工智能、物联网和5G等技术方面已经逐渐成熟,为中国数字经济蓬勃发展奠定了基础,而那些尚未被充分利用的数据,就是新商业价值的关键元素。
1.数据湖的价值数据湖支持以其本机或接近本机的格式存储数据,从而为高技能的数据科学家和分析师提供了未完善的数据视图。
数据湖提供了一个没有折衷的环境,以及相应的记录分析系统所共有的保证和利益,即语义一致性,治理和安全性。
因此,数据湖特别适合科学家对未知数据和未知问题的探索。
很多暂时得不到分析的数据,可以暂时统一保存在数据湖里。
2.Hadoop是数据湖最常用的解决方案Hadoop的一个主要优势是支持围绕未知数据和未知问题的这些探索性用例。
它在LDW(逻辑数据仓库)中扮演的角色在基于数据管理基础设施模型的右上象限 - 未知数据领域和未知问题。
由于Hadoop技术针对语义灵活性进行了优化,因此它可以与传统的结构化数据仓库并列,从而实现更广泛的数据类型,最终用户和用例。
虽然现在Hadoop没有前几年那么热,但是,它依然是数据湖最常用的解决方案。
最近的Gartner研究数据表明,Hadoop的部署和需求仍然很大并且正在增长。
在最近的一项调查中,有235名受访者表示,34%的受访者目前正在使用Hadoop进行数据和分析工作,另有55%的受访者计划在未来24个月内进行调查,总计达到89%。
这是Gartner 2016年研究以来的需求最大幅度增加。
3.HDFS的局限Apache Hadoop是一个高度可扩展的系统,广泛应用于大数据存储和分析。
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式文件系统。
分布式存储解决方案

分布式存储解决方案分布式存储解决方案在当今大数据时代,数据量不断增长,对于传统的存储系统来说,面对海量数据的存储和处理是一个巨大挑战。
为了解决这个问题,分布式存储解决方案应运而生。
什么是分布式存储解决方案分布式存储解决方案是一种将数据分散存储在多个节点上的存储架构。
它将海量数据划分为多个较小的数据块,并将这些数据块分散存储在不同的存储节点上,从而实现对数据的并行存储和读取。
每个存储节点都具备存储和计算能力,可以独立进行数据的存储和处理,并通过网络进行数据的传输和交互。
分布式存储解决方案的主要特点高可靠性分布式存储解决方案通过数据的冗余存储实现高可靠性。
当一个节点发生故障时,其他节点可以继续提供服务,不影响系统的正常运行。
通过复制数据到多个节点,即使某个节点发生故障,数据仍然可用。
高可扩展性分布式存储解决方案可以根据需求动态增加存储节点,实现系统的高可扩展性。
随着数据量的增长,可以通过增加存储节点的方式来增加存储容量和计算能力,满足不断增长的业务需求。
高性能分布式存储解决方案通过数据的并行存储和读取实现高性能。
数据可以同时从多个节点进行读取,提高了数据的读取速度。
同时,可以将计算任务分发到不同的节点上进行并行处理,提高了系统的计算性能。
易管理性分布式存储解决方案提供了统一的管理界面,方便管理员对存储节点进行管理和配置。
同时,它还提供了监控和告警功能,可以实时监控存储节点的运行状态,及时发现和解决问题。
常见的分布式存储解决方案Hadoop HDFSHadoop HDFS(Hadoop Distributed File System)是Apache Hadoop生态系统中的一个分布式文件系统。
它是基于Google的GFS(Google File System)论文而设计的。
HDFS具有高可靠性和高可扩展性的特点,适用于海量数据的存储和处理。
HDFS将数据划分为多个数据块,并将每个数据块进行冗余存储。
它将数据块分散存储在多个存储节点上,实现数据的并行存储和读取。
分布式存储系统及解决方案介绍

分布式存储系统及解决方案介绍分布式存储系统是指通过将数据分布在多个存储节点上实现数据存储和访问的系统。
它通过数据的冗余备份和分布,提高了系统的可靠性和可扩展性,并能通过并行读写提升系统的性能。
下面将介绍几种常见的分布式存储系统及其解决方案。
1. Hadoop分布式文件系统(HDFS)HDFS是Apache Hadoop项目的核心组件之一,它使用大规模计算集群存储和处理大规模数据集。
HDFS采用了冗余备份机制,将数据分布在多个存储节点上,以提供高可靠性和容错性。
同时,HDFS采用了多副本机制,将数据复制到不同的节点上,以提供高可用性和读取性能。
解决方案:-均衡数据负载:HDFS通过将数据分布在多个节点上,实现均衡的数据负载,提高整个系统的读写性能。
-自动故障检测与恢复:HDFS具有自动检测节点故障并重新复制数据的功能,从而提高数据的可靠性。
-大规模并行处理:HDFS支持将数据划分成多个数据块,并行处理多个数据块,提升系统的处理能力。
2. GlusterFSGlusterFS是一个开源的分布式文件系统,它允许将多个存储节点组合成一个存储池,并提供统一的文件系统接口。
GlusterFS采用分布式哈希表作为元数据管理机制,将数据分布在多个节点上,并提供冗余备份和数据恢复机制。
解决方案:- 弹性伸缩:GlusterFS支持动态添加和移除存储节点,以适应不断变化的存储需求,提供弹性伸缩的能力。
- 均衡负载:GlusterFS使用分布式哈希表进行数据分布,实现均衡的数据负载,提高系统的读写性能。
- 数据冗余和恢复:GlusterFS提供冗余备份和故障恢复机制,以保证数据的可靠性和可用性。
3. CephCeph是一个分布式存储系统,它将数据划分成多个对象,并将对象存储在多个存储节点上。
Ceph通过分布式哈希算法将对象映射到存储节点上,实现均衡的数据负载。
解决方案:- 弹性伸缩:Ceph支持动态添加和移除存储节点,以适应存储需求的变化,并能自动平衡数据分布,提供弹性伸缩的能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XSKY 2016 年 10 月 将 Ceph 的 InfiniBand/RDMA互联共享给upstream。
产品以Ceph为引擎,构建企业级分布式存储产品
• 企业级接口,FC和iSCSI,多路径 • 高性能,低延时、百亿级文件对象 • 持续服务,高水平SLA和业务QoS保证 • 易运维,全图形化操作,0命令行运维 • 内置数据保护功能,一站式解决数据安全问题
X-EBS 是专门为大并发,高性能,高 压力,弹性扩展需求的客户所量身定 做的解决方案产品。
应用场景:虚拟化 / 数据库 / 结构化 数据 / 部分替代SAN
X-EDP是一个真正的统一存储,实现 了同一套存储系统向上层应用同时提 供块、文件和对象三种数据服务,满 足业务对结构化、半结构化、非结构 化数据的存放需求。
全球存储市场发展趋势:分布式存储快速成长
当前
基于标准服务器的软件定义存储(SDS)逐渐取代专用存储
未来10年全球企业分布式存储市场快速增长,预计2027将占存储市场的70%份额
XSKY 产品介绍
融合架构 – Software Defined Device
Radio
PSP
MP3 Games Camera Video
性能优化: • 4K随机写IOPS提升20%; • IO延时降低15% • CPU利用率降低40% • 内存使用至少减少2/3 支持在线升级
支持Xen、Hyper-V
完美的支持Xen、Hyper-V
全图形化运维
准备硬件
安装OS 安全与密钥配置
NTP配置
安装XSKY软件包 Web集中配置集群
集群其他节 点就绪
哪块硬盘坏了? • 硬盘手动点灯功能
• 硬盘点灯设置是硬盘故障定 位功能,对于出现错误或告 警的硬盘可以通过管理界面 点灯操作定位到物理盘的位 置。以便于运维人员进行排 查或修复。
X-EOS 是专门为高性价比和大容量需 求型客户,量身定做的解决方案产 品,对海量小文件,超大容量数据存 储有良好的优化。
应用场景:视频,影音,图片,流媒 体 / 非结构化数据 / 性能容量比
XSKY 产品架构体系
XSKY分布式存储软件部署形式
两种形态,按需选择
超融合部署架构
资源池分离部署架构
将计算和OSD部署在同一个节点即超融合架构,部署在不同节点即分离部署架构。
TCO持续上升,部分设备扩 容成本比新购还高
“3 年 前 的 型 号 厂 商 说 停 产 了,建议我们买新型号。问 题是数据迁移太痛苦!”
性能无法满足业务要求,需 要购置新设备,原投资浪费
“如果一套存储可以一直扩 展下去那样就好了!”
对云计算、大数据等新技 术支持不足
“现在业务都上云了,要 给上千个虚机配存储资源 至少要花两天!”
按需选择所需的虚拟化平台
iSCSI | FC | LibRBD | Local SCSI
XSKY分布式存储资源... 池
标准x86服务器
标准x86服务器
标准x86服务器
Vmware Ready
VAAI支持,获得Vmware 官方认证 TAP 合作伙伴 SDDC 成员
OpenStack生态默认后端存储
XSKY统一存储解决方案
2017.5
XSKY 公司和团队简介
Future Ready SDS
关于公司
• Ceph分布式存储技术中国领先者,2016年Ceph社区中 国贡献率第一
• 拥有近40个产品专利和软著 • 中国开源云联盟 理事会员 • IDC重点关注的软件定义存储创业公司
关于 XSKY | 星辰天合
LibRBD
S3
RADOS GW
海量小文件处理 冷池休眠
Librados
XSKY加速组件 (内存管理、网络通信、线程调度、数据持久化策略等)
FileStore
OSD Core
BlueStore
KvStore
XStore 读写缓存
硬件加速层(SPDK,DPDK等)
MON
CPU
DISK
MEM
NIC
XSKY管理系统
图灵奖得主Jim Gray :
从现在起,每18个月,新增 的数据量等于有史以来数 据量之和。
企业信息化面临的挑战
容量不足, 经常需要扩容
“业务发展快,数据量 增长更快!”
管理复杂, 需要专业人员
“It is data center that managing me, not I am managing it.”
推荐在中小规模的vmware 虚拟化场景使 用。参考《Vmware超融合部署最佳实践 指南》
XSKY分布式存储系统——VMware VAAI支持
X-EBS:增强的LIBRBD,提升超融合性能
使用了“增强LIBRBD”后… 1. 4K随机写IOPS提升 20% 2. IO延迟降低15% 3. CPU利用率降低40% 4. 内存使用至多减少2/3
统一数据平台。
研发核心
• 团队A:来自一线互联网,国内Ceph社区贡献第一; • 团队B:来自IT领导厂商的存储产品研发。
XSKY 在ceph社区的贡献度
3
XSKY如何为Ceph社区贡献源代码
XSKY 开 源 贡 献 主 要 集 中 在 NVMe , DPDK/SPDK/RDMA整合,BlueStore, 网络 优化,OSD, MON 性能优化等等方面。
可视化管理 健康状态监控
智能辅助 故障告警 容量性能统计 工作负载统计 操作日志
市场对于XSKY的认可
IT架构变革趋势
互联网和物联网持续推动大数据经济
44ZB 数据产生 80% 以上的
数据将是非结构化 数据
未来10年内,将增加44倍 的数据和内容
4500亿美元
数据价值
至2020年,500亿设 备实现互联
在融合EBS 和 EOS,形成统一管理的 基础上,内置数据保护功能:备份、 复制、容灾、云分层等,帮助企业轻 松应对业务快速变化时的信息灵活、 可靠存取需求。
应用场景:虚拟化 / 数据库 / 结构化 数据 / 低延迟 / 部分替代SAN
X-EDP 分布式数据平台
X-EOS 分布式对象存储
X-EOS 是XSKY基于软件定义的分布 式对象存储的发行版,X-EOS 不但可 以帮助运营商与云服务商实现数10个 PB规模的存储资源池,也可以帮助企 业实现成本可控的中小规模水平扩展 存储。
两步完成在线扩容(主机): 1、配置主机网络环境 2、输入IP安装主机
两步完成在线扩容(磁盘): 1、选择目标主机 2、安装磁盘
除去安装Linux操作系统的时间,X-EBS本身的安 装部署仅需要2~3分钟
完善的软硬件监控平台,数据统计长达90天时间
GUI/CLI
Restful API
SNMP
可视化硬盘管理
SDS统一数据平台:
• 更高的数据可靠性 • 数据与硬件解耦合,通用|异构 • 数据价值排浪 • 可控的|更长的数据生命周期
• 高性能服务器集群 • 服务器、机架、DC多级保护 • OLTP业务,FC与iSCSI接口
• 大容量服务器集群 • 分析与增值业务 • 在线备份 • 对象接口
• 低功耗服务器集群 • 合规与潜在数据红利 • 在线归档 • 对象接口,多云互通
接口不变,每台物理机多运行更多的VM
OpenStack
• 创建虚拟机 • 创建镜像 • 创建块存储卷 • 块存储卷生命周期管理 • 创建卷快照及克隆块存储卷
• 创建拓扑、存储池 • 块存储卷管理与监控 • 批量设置块存储卷QoS • 卷快照管理 • 硬件资源管理与监控
支持多虚拟化(Multi-Hypervisor)
资源孤岛,无法共享,利用率 低下
“各个部门都说资源不够用, 但实际上很多是可以共享使用 的,特别是研发,但是我们很 难都监控起来”
企业的面临的IT挑战是技术革新的推动力
TOP 6问题:容量/管理/TCO/性能/大数据/利用率
存储容量不能满足需求
50.1%
资源配置复杂
44.4%
采购和运营成本高 不能满足并行处理能力需求
以可视化的视图展示硬盘的基本 信息及从属关系,基本信息包 括:硬盘名称、状态、容量、已 使用容量、数据恢复情况、硬盘 介质、IO利用率等。从属关系包 括从属服务器视图和从属存储池 视图。同时支持鼠标hover时显示 硬盘详细信息。
硬盘运维
海量硬盘如何维护? • S.M.A.R.T检测 • 硬盘灯告警功能 • SSD寿命预警
SDS 软件软件 = Server SAN
互联网技术引导存储变革:通用硬件 + 软件定义
传统公司的数据中心 (Yahoo, Altavista)
各种专用服务器、交换机、SAN、NAS
一线互联网的数据中心(Google, Amazon,BAT) 通用硬件 + SDI
磁带库或蓝光设备
支撑线上业务
数据保护,按需调档
合规留存
光纤网络
以太网络
以太网络+特殊介质
~30000元
~10000元
~1000元
软件定义存储 – “数据湖”模型
数据访问热度
业务访问
分析访问
增值访问
2016 2017 2018
… 2025
…
热数据池
2045 …
温数据池
SDS
冷数据池
数据加密
存储公 有云
传统的业务数据存储策略与模型
数据访问热度
传统影像数据生命周期:
• 从在线到离线,单向流动 • 数据价值仅一次利用
介质转移
2016 2017 2018 … 2025