沈阳大学——浪潮云海大数据一体机产品白皮书

合集下载

浪潮云海大数据一体机介绍

浪潮云海大数据一体机介绍

内存
128GB
网卡
1*单口万兆网口
RAID
512M缓存高性能 raid卡
硬盘
系统盘2*300GB SATA/SAS/SSD 数据盘4*600GB SATA/SAS/SSD 系统盘2*300GB SATA/SAS/SSD 系统盘10*2TB SATA/SAS/SSD
数据节点 软件平台 相关配件
12Core
7.9 0.8 2009 1.2 2010 1.8 2011 2.7 2012 2015 2020
全球数据存储量(ZB)
现状:传统的数据库存储模式无法应对数据量井喷式的增长
面临的重大挑战
挑战1:现出大量音频、视频等半结构化、 非结构化数据,传统数据库不能有效应对 需要新型数据处理体系结构进行高效的存储和管理数据
5
大数据时代即将来临
• 大数据具有无可预估的数据价值
– – – – 体量Volume:巨大的数据量 多样性Variety:半结构化、非结构化 速度Velocity:指数级别的增长 价值密度Value:蕴含大财富 IDC:到2020年,大数据的支出将超过2000亿美元 以上 麦肯锡:未来全球范围内大数据带来的价值将达 20000亿美元

大数据具有无可预估的数据价值


粗放式
精细化
基于大数据的分析、挖掘,为商业决策提供依据
大数据生态链
应用
最终用户 服务技术提供商 数据分析技术提供商 数据服务提供商 数据分析者
分析 及可 视化
数据 处理 数据 存储
数据处理技术提供商 软件平台(数据库、数据仓库、分布式处理技术 等)提供商
基础硬件(服务器、存储、交换)厂商 数据采集技术提供商
半结构化/非结 构化数据 结构化数据

浪潮云海白皮书

浪潮云海白皮书

浪潮云海Insight产品白皮书文档状态:V1.02016年4月浪潮电子信息产业股份有限公司1产品功能云海Insight是包含分布式计算引擎HD(Hadoop发行版)、分布式并行数据库MPP和内存数据库MemDB等产品的产品族,提供从GB到PB级数据在高并发访问、数据查询和分析处理等不同应用场景大数据处理的能力,帮助客户轻松构建数据采集、数据存储、数据处理、数据应用开发的整个数据生命周期管理体系,快速搭建大数据处理平台。

云海Insight产品族包含分布式计算引擎HD、分布式并行数据库MPP和内存数据库MemDB:⏹分布式计算引擎HD是一个hadoop发行版,提供企业级的大数据处理环境,无缝集成了Hadoop生态中大量工具,提供海量数据存储、查询、分析和挖掘能力;⏹分布式并行数据库MPP是一个企业级的大规模并行处理关系型数据库,支持行存储和列存储,提供PB级别数据量的即席查询能力;⏹内存数据库MemDB是一个弹性伸缩的、提供事务支持的内存数据库,具备SQL读写能力,支持多地多中心级的广域网集群部署,用于构建和加速需要超高速数据交互的、具有高度可扩展能力的应用系统。

2产品规格3产品价值⏹快速实现多源数据整合,挖掘数据全新价值实现内外部信息资源的有效整合,全面提升数据共享和信息联动的运转效率,挖掘数据全新价值,支持决策管理。

⏹减少数据计算时间,提升业务效率具有并行处理架构、内存计算等多重机制,保证数据加载、计算、访问等各个环节数据处理效率最大化,提升业务效率。

⏹实现在线扩容,提升系统稳定性支持集群在线扩展,支持数据存储、加载和查询性能线性增长,并具备多层次的容错、自动检测和自动恢复机制,保证系统安全可用,降低业务停顿和运维风险。

⏹提供专业化咨询服务,提升服务质量浪潮具备丰富的大数据应用和行业落地实践经验,提供客户专业化的咨询服务,提升客户的服务质量。

4应用场景5典型案例某省警务云建设,汇集全省多源数据,为各警种部门上层应用提供数据服务,面临数据种类多且基数大、计算场景复杂、上层应用开发商多、业务需求多样等大数据处理的巨大挑战,仅靠单一技术无法满足需求。

19-浪潮云海大数据一体机产品白皮书V1.0 2016503

19-浪潮云海大数据一体机产品白皮书V1.0 2016503

浪潮云海大数据一体机产品白皮书文档状态:V1.02016年3月浪潮电子信息产业股份有限公司1引言随着近年来信息化日臻成熟,社会化网络迅速兴起,云计算、移动互联网和物联网等新一代信息技术广泛应用,中国行业用户的数量增长之大,数据增长之快前所未有,他们需要引入新的技术和产品,建设自己的大数据基础环境,融合处理多种类型的数据,解决性能与扩展性的矛盾,满足大并发、快速响应的客户需求。

在这个大数据引入过程中,也爆发出了很多的新问题:●大数据场景复杂,需要合理规划行业用户对数据价值的期望迫切并且热烈,但其数据现状是总量不断膨胀、类型多种多样、质量参差不齐,数据应用和创新的场景十分复杂。

这种需求的复杂性和当前的技术发展水平,直接导致了尚无单一技术可以包打天下,需要从架构层面合理规划,利用软硬件多种技术手段搭配组合、配合调优,才能实现整体的融合和高效。

●大数据开源组件+通用硬件平台,问题众多开源生态的兴起为新技术的发展注入了源源不断的新鲜血液,但是其过度炒作也导致很多客户为了追求一时的低成本,采用了开源软件+通用硬件平台简单组合的建设方式。

随着使用的深入,客户越来越发现这种组合方式软件升级更新频繁,品质不稳定,硬件能力没有得到有效释放,出现问题排查困难,总体稳定性不高,总体拥有成本不低反高。

●IT服务分层,接口众多,交付困难行业的大数据基础建设需要综合性和一体化的考量,但是目前业界普遍的IT 产品和服务专业化分工方式导致整个升级和重构过程往往会涉及IaaS、PaaS和SaaS的多家产品和服务提供商,接口复杂。

这就意味着需要花费大量的时间和精力完成不同厂商和产品之间的对接、整合、排错和调优,交付周期长,大数据转型成本高。

2产品定位浪潮云海大数据一体机(Inspur InCloud SmartData Appliance,简称SDA)采用分布式架构,提供海量数据的采集、存储、处理、挖掘洞察能力,是基于浪潮卓越稳定的硬件平台、企业级的大数据软件系统,配合丰富的大数据最佳实践经验打造出来的开箱即用的融合基础设施。

浪潮云海大数据一体机发布背景资料1116

浪潮云海大数据一体机发布背景资料1116

激活·大数据浪潮云海大数据一体机产品发布会背景资料核心信息●大数据是大产业,中国将是全球最大的大数据市场2010年全球大数据以及相关的硬件、软件和服务市场,已经达到30亿美元,2015年整个市场将超过170亿美元,平均增长速度每年超过50%,大数据成为全球IT产业增长最快的领域之一,据国内有关机构初步预算,作为全球大数据产业的重要组成,未来中国大数据潜在市场规模有望近2万亿元,领跑全球。

●大数据技术将对中国发展转型有巨大推动作用,应用是发展适合中国国情的大数据产业的根本动力。

当前中国正面临从粗放到可持续的发展方式转变挑战。

大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,为人类的社会经济活动提供依据,从而提高各个领域的运行效率,提高整个社会经济的集约化程度。

同样,全面转型的时代背景也为大数据提供了广阔的发展空间,推进大数据在各个社会、经济领域中的应用将成为该行业发展的巨大动力。

●行业是中国大数据应用的主体,帮助用户解决技术应用问题是中国大数据应用和产业发展的关键。

行业客户在几十年的信息化应用中,积累了大量的历史数据,并不断产生新的数据。

如何将数据转换为业务的竞争力有着强烈的需求。

大数据技术在政府、企业等领域的应用对提升政府管理服务水平和决策能力,建立企业新业务模式,加速经济发展方式转变将产生深刻影响。

然而,行业客户普遍缺乏高等级技术人员,经验不足,需要提供整体方案和服务,帮助他们尽快迈过技术应用的门坎。

●浪潮云海大数据一体机是一款产品化的大数据平台方案,是大数据产业的装备型产品浪潮云海大数据一体机采用新型技术体系架构,是涵盖数据存储、数据处理、数据展现等全环节的一体化数据平台产品,具有可按需扩展、统一交付、集中管理等特点,用户可以根据各自应用特点选择不同系列的产品,同时浪潮提供全程技术服务与保障,为用户解决部署、业务移植开发等技术难题,帮助用户跨过应用门槛。

基础信息●大数据将深刻改变人类的决策方式和社会经济的运行方式⏹数据是与水、石油、天然气同等重要的国家战略资源:全球著名的调查公司麦肯锡在最近的研究报告中指出,当前数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素,大数据将推动生产力发展和创新,对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来,在全球已经全面进入信息时代的今天,数据已经成为与水、石油、天然气同等重要的国家战略资源;⏹大数据是大产业,对于社会经济的运行将发生深刻影响: IDC报告指出,截止2011年底,全球新增的数据量已达到了1.8万亿GB,未来十年还将增长50倍,迅速积累的海量数据蕴含着重大的商业价值和社会价值——通过挖掘海量数据,公司的决策、运行会建立在更加科学的基础上,失误更少,效率更高,而对于政府,大数据技术可以提高政府决策效率、危机应对能力和公共服务水平,建设更高水平的智慧政府。

浪潮InCloud Rail1000超融合一体机白皮书

浪潮InCloud Rail1000超融合一体机白皮书
要点 基于浪潮 InCloud
Sphere 服务器虚拟化 及 InCloud Storage 存储虚拟化可快速实 现 IT 计算、存储和网 络资源池化 通过自动化部署引擎 实现系统的自动化安 装和部署,实现基于策 略和模板的自动化管 理 实现千兆和万兆网络 的灵活切换,实现高速 网络互连 可实现系统内的快速 扩容,支持多个 InCloud Rail 的自动 化堆叠
产品架构
融合架构
INCLOUD RAIL 基于浪潮新一代融合架构系统,即面向应用的硬件重构和软件定义,在硬件层将计算、存 储、网络等设备整合为资源池,在软件层通过软件定义技术实现动态感知业务的资源需求。利用硬件重组 的能力,智能的动态分配和组合资源,满足各类应用的需要。
硬件重构
摒弃传统的服务器设计,高密度的 INCLOUD RAIL 在标准机架 2U 空间里集成了 4 个计算节点,并通过 软件定义存储重构存储节点。打破传统每个节点分散的供电和散热方式,实现散热、电源、管理功能的集 中化和模块化,实现硬件重构。
强管理
INCLOUD RAIL 融合 InCloud Manager,突破传统系统架构,可提供功能强大、经生产验证的高性能 虚拟化层。它支持多个虚拟机共享硬件资源,并灵活的调度各个虚拟机资源,解除了传统架构下的应用 和硬件紧耦合的状态。
高性能
INCLOUD RAIL 融合浪潮分布式存储系统,单节点存储 IOPS 达到 20000+。
高速网络互连: INCLOUD RAIL 可实 现千兆和万兆网络的 灵活切换,实现高速的 网络互连。
弹性的基础架构: INCLOUD RAIL 可 实现系统内的快速 扩容,可横向扩展至 64 个物理节点
【浪潮超融合架构一体机】
产品特点

浪潮云海大数据解决方案V3.0

浪潮云海大数据解决方案V3.0

浪潮云海大数据一体机解决方案高端服务器研发部高端容错计算机产品部2013.1目录一.产品简介 (4)1.1浪潮云海大数据一体机总体架构 (4)1.2系列化产品 (4)二.关键模块介绍 (5)2.1Hadoop分布式文件系统: (5)2.2Hadoop MapReduce计算框架: (6)2.3HBase 分布式数据库 (6)2.4Hive数据仓库 (7)三.浪潮云海大数据一体机解决方案优势 (7)3.1高性能 (7)3.2高可靠性 (8)3.3高性价比 (9)3.4易管理 (9)3.5专业化服务 (11)四.竞争性分析 (11)4.1跟传统关系型数据库对比分析 (11)4.2跟开源Hadoop对比分析 (13)五.成功案例 (15)5.1某城市智能交通系统 (15)5.2某省级运营商清帐单查询系统 (18)六.浪潮云海大数据一体机配置 (19)一.产品简介为应对大数据时代的到来,浪潮集团适时推出浪潮云海大数据一体机,重点面向行业大数据应用,是一体化数据处理的解决方案。

采用新型技术体系架构,整合软硬件系统,涵盖数据存储、数据处理、数据呈现等全环节。

浪潮云海大数据一体机是公安、金融、电信、交通、医疗、企业等各个行业用户的大数据解决方案理想之选。

1.1浪潮云海大数据一体机总体架构1.2系列化产品SDA-1:●满配:CPU:480Core;内存:12TB;存储容量:144TB;网络:1Gbps、10Gbps或者40Gbps●支持线性扩展●适合数据处理应用:模式计算,商业智能,医疗数据挖掘等。

计算能力、I/O能力、存储能力均衡。

SDA-2:●满配:CPU:288Core;内存:6912GB;存储容量:540TB;网络:1Gbps、10Gbps或者40Gbps●支持线性扩展●适合处理密集型的重载应用:视频处理,图片处理分析,图像渲染,在线交易等。

可重构加速器件或众核处理器,硬件加速。

二.关键模块介绍HDFS分布式存储解决数据如何存储的问题,Map/Reduce解决数据如何处理问题,HBase解决实时数据库问题,Hive解决基于SQL的数据分析和挖掘。

浪潮 InCIoud Sphere 4.5旗舰版技术白皮书说明书

浪潮 InCIoud Sphere 4.5旗舰版技术白皮书说明书

InCloud Sphere 4.5 旗舰版技术白皮书V1.0浪潮(北京)电子信息产品有限公司2017 年 1 月InCloud Sphere 4.5 旗舰版技术白皮书 V1.0目录1第一章摘要 (5)2第二章InCloud Sphere 产品概述 (6)2.1InCloud Sphere 介绍 (6)2.2InCloud Sphere 架构 (8)3第三章InCloud Sphere 技术原理 (9)3.1InCloud Sphere 系统设计 (9)3.2InCloud Sphere 核心技术 (11)3.2.1CPU 虚拟化 (13)3.2.2内存虚拟化 (15)3.2.3I/O 设备虚拟化 (17)4第四章InCloud Sphere 功能原理 (19)4.1 计算 (19)4.1.1CPU 管理 (19)4.1.2内存管理 (19)4.1.3GPU 管理 (20)4.2 存储 (23)4.2.1 存储I/O (23)4.2.2 快照 (24)4.2.3存储多路径 (25)4.2.4存储读缓存技术 (26)4.3 网络 (26)4.3.1网络虚拟化架构 (26)4.3.2网卡绑定 (29)4.3.3QOS (33)4.4高可用 (33)4.4.1vMotion (33)4.4.2Storage vMotion (36)4.4.3 HA (38)4.5负载均衡 (41)4.6 监控 (44)4.6.1性能收集 (45)4.6.2配置性能图表 (46)4.6.3自动化告警机制 (46)4.7vApp (48)4.8 灾备 (49)4.8.1DR 结构 (49)4.8.2DR 工作原理 (50)4.8.3DR 故障转移 (50)4.8.4备份机制 (51)4.9 容器 (52)4.9.1Docker 介绍 (52)4.9.2InCloud Sphere 旗舰版和Docker (52)4.9.3InCloud Sphere 提供Docker 支持优势 (54)5第五章InCloud Sphere 自动化能力 (56)5.1自动化安装 (56)5.1.1自动化部署架构 (56)5.1.2自动化部署条件 (56)5.1.3自动化部署过程 (57)5.1.4应答文件 (57)5.2自动化更新 (57)5.2.1iCenter 自动检查可用更新 (57)5.2.2Hotfix 自动更新 (58)5.2.3InCloud Sphere Tools 自动更新 (59)5.2.4池滚动升级 (59)6第六章InCloud Sphere 开放性和安全性 (61)6.1XAPI (61)6.1.1XAPI 介绍 (61)6.1.2XAPI 功能 (62)6.1.3XAPI 架构 (62)6.2Introspect API (63)6.2.1Introspect API 介绍 (63)6.2.2虚拟机内存保护 (63)6.2.3预防攻击技术 (63)6.2.4虚拟机无代理保护 (64)6.2.5Direct Inspect API 防病毒架构 (64)6.2.6Direct Inspect API 防病毒的优势 (65)6.3PlugIn (65)6.3.1PlugIn 介绍 (65)6.3.2PlugIn 优势 (66)6.3.3部分PlugIn 插件列表 (66)6.4安全架构 (66)6.5SSR (67)6.5.1SSR 介绍 (67)6.5.2SSR 实现原理 (68)6.5.3SSR 技术架构 (69)6.5.4SSR 主要功能 (70)6.6与OpenStack 集成 (70)6.6.1OpenStack 介绍 (70)6.6.2InCloud Sphere 旗舰版的优势 (70)6.6.3与OpenStack 集成架构图 (71)7第七章总结 (73)8第八章缩略语 (74)1第一章摘要浪潮,着力推动中国“行业云”,致力于成为中国领先的云计算解决方案供应商,业已形成涵盖IaaS、PaaS、SaaS 三个层面的整体解决方案服务能力。

浪潮云桌面方案设计白皮书

浪潮云桌面方案设计白皮书

XXXX桌面云解决方案建议书201X年X月浪潮信息目录第1章项目概述 (1)1.1项目背景 (1)1.2需求分析 (1)1.2.1高昂的运维和支持成本 (1)1.2.2数据丢失和泄密风险大 (2)1.2.3阻碍企业移动业务战略 (2)1.3革新的桌面交付模式 (2)1.3.1桌面云概念定义 (2)1.3.2桌面云带来的变化 (3)1.4设计原则 (3)第2章浪潮aDesk桌面云方案介绍 (4)2.1一站式方案概述 (4)2.2主要功能列表 (5)2.3多种桌面交付类型 (8)2.4方案价值总结 (9)2.5方案优势介绍 (10)第3章XXXX桌面云整体架构设计 (11)3.1浪潮桌面云整体架构 (11)3.2组件及模块介绍 (11)3.2.1AD/DHCP服务器 (11)3.2.2桌面服务器和磁盘阵列(VMS) (12)3.2.3虚拟桌面控制VDC (12)3.2.4终端设备 (12)3.3服务器群集设计思路 (13)3.4浪潮RAP协议技术详解 (13)第4章桌面云方案软硬件需求 (16)4.1服务器存储选型依据 (16)4.2容量估计及性能分析 (18)4.3aDesk桌面云方案配置参数 (18)4.3.1容量规划 (18)4.3.2软硬件列表 (19)第5章产品精彩亮点解析 (20)5.1良好用户体验 (20)5.1.1高清视频体验 (20)5.1.2高效RAP协议 (20)5.1.3单点登录技术 (21)5.1.4自动化桌面部署 (21)5.2最优的灵活性 (22)5.2.1广泛终端支持 (22)5.2.2丰富的桌面类型 (22)5.2.3外设的总线映射技术 (23)5.2.4智能开关机 (24)5.3端到端安全设计 (24)5.3.1终端安全 (24)5.3.2传输安全 (25)5.3.3平台安全 (25)5.4最低的IT总体成本 (26)5.4.1高效率、低能耗瘦终端 (26)5.4.2存页合并技术 (27)5.4.3镜像分离和IO加速 (27)5.4.4桌面服务器群集设计 (28)第1章项目概述1.1项目背景传统PC设备为中心的计算模式,操作系统、应用程序和数据与特定设备紧密关联,即各组件被绑定于用户PC上,只要其中一个组件出现问题,系统将无常工作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浪潮云海大数据一体机
产品白皮书
2014.8
浪潮信息云产品部
目录
1.产品介绍 (2)
1.1产品定位 (2)
1.2产品特点 (2)
2.体系架构 (3)
2.1大数据一体机硬件组成 (4)
2.2大数据一体机网络拓扑 (5)
2.3大数据一体机软件架构 (6)
3.应用场景 (8)
4.关键技术特性 (9)
5.技术指标 (9)
1.产品介绍
1.1产品定位
浪潮云海大数据一体机(Inspur In-Cloud SmartData Appliance 以下简称SDA 或大数据一体机)面向行业大数据应用场景,是一体化数据处理的解决方案,采用新型技术体系架构,整合软硬件系统,采用全分布式大数据处理架构,平台能够随着客户数据的增长和业务的扩张而不断线性扩展,解决了传统架构的扩展瓶颈,集成计算单元、存储单元、通讯单元、管理单元、等核心模块,涵盖数据存储、数据处理、数据呈现等全环节,是金融、电信、公安、交通、卫生等各个行业用户大数据分析处理平台的理想之选。

1.2产品特点
新型技术体系架构
采用全分布式大数据处理架构,平台能够随着客户数据的增长和业务的扩张而不断增长,并且能够保持极高的线性度,解决了传统架构的扩展瓶颈,系统在扩展至120000核心时依旧保持0.8左右的扩展效率;
软硬一体化的系统
集成计算单元、存储单元、通讯单元、管理单元等核心模块,是对数据存储、处理、展现的全环节的解决方案,由浪潮统一开发,能够统一交付,集中管理,用户可以轻松完成;
全局优化的系统
浪潮进行全局优化性能等技术指标大幅提升,在性能、可用性方面有了重大提升。

16%:通过优化系统任务调度策略,动态调整任务执行资源,减少慢任务数量,任务执行时间平均缩短16%以上;
30%:引入Reed-Solomon算法,优化分布式散列数据布局,满足文件高并发和高带宽双重需求同时平衡数据冗余度,浪潮采用两副本加编码的方式相对三副本最大可实现30%空间节省;
50%:采用多级高速缓存,实现硬件加速。

经测试,1TB数据排序测试整体访问性能提高50%;
系列化、产品化
针对视频等重载应用、商业智能分析应用、海量并发的轻量级线程类应用这三类应用场景。

云海大数据一体机根据用户应用特点提供个性化解决方案;
国产化
浪潮可提供基于飞腾处理器、浪潮云谷系统等产品的全国产化方案;在敏感行业、关键数据,保障数据核心处理平台的自主可控;
专业化服务
从业务分析、应用移植、应用开发到运维服务的全环节服务保障。

解决用户在实施分布式数据理架构面临的软硬件部署、二次开发等实际问题,帮助客户实现由传统数据仓库向新型大数据平台的平滑迁移。

2.体系架构
大数据一体机基于Apache Hadoop集群架构,由三个大的模块构成:底层基础架构基于浪潮的先进硬件平台,软件部分则采用浪潮的专有Hadoop发行版来提供海量数据的存储与处理能力,通过浪潮软件、硬件的彼此优化与整合,形成一套高性能的软硬一体的平台解决方案,并经过大量的测试调优来保证整体系统的兼容性、稳定性和可靠性。

在软硬件之上,还架构了一个可视化的管理界面来帮助用户对一体机的硬件、软件进程进行统一的管理和控制。

2.1大数据一体机硬件组成
大数据一体机物理部署图(SDA30000主柜)
如上图所示,SDA硬件上主要由管理节点,数据节点,管理交换机,计算交换机,KVM控制器机柜等组件构成
2.2大数据一体机网络拓扑
大数据一体机网络拓扑图
如图所示,大数据一体机具有两套相互独立的网络系统:管理网络和计算网络管理网络:采用千兆以太网连接一体机所有节点,实现节点的配置,管理和性能监控,并可以通过IPMI接口,实现远程开关机,虚拟设备挂载等带外管理功能计算网络:采用万兆以太网连接一体机所有节点,一体机各节点间的数据交换和
通信通过计算网络完成。

文件服务器,ETL服务器和应用服务器等相关系统可配备万兆网卡直接连入一体机,或者通过交换机万兆上联端口连入一体机计算网络进行数据交换和处理。

2.3大数据一体机软件架构
浪潮云海大数据一体机软件架构
在软件架构上,浪潮云海大数据一体机支持多种Linux版操作系统,并采用浪潮自主研发的Hadoop 商业发行版—浪潮云谷系统(CloudCanyon)。

浪潮云谷系统为用户提供稳定的、可靠的、易用的Hadoop平台,其组件包括HDFS文件存储系统、MapReduce框架以及Hive数据仓库、Pig数据分析平台和HBase数据库等。

3.应用场景
云海大数据一体机是一体化的数据分析处理平台,可应对多种数据类型和多种数据处理需求,包括但不限于以下四种应用场景:
海量数据存储:大数据一体机具备高性能的分布式文件系统,支持大吞吐量高并发访问,具有自我修复,动态扩展等特性,硬件配备了高密度大容量的硬盘和高速的数据交换网络,对外提供丰富的数据访问接口,非常适合监控视频,医疗影像,科研数据等大数据集的存储。

批量数据处理:通过分布式计算框架MapReduce,大数据一体机可调用所有节点的计算资源执行诸如数据格式整理,数据类型转换,图片特征值提取,语音识别等数据数据处理任务,在处理过程中减少了数据在不同节点间的交换,降低了传输带宽的压力,极大的提升了处理效率。

海量结构化数据在线查询:大数据一体机内置了列存数据库HBase,它具有高效的查询性能和良好的横向扩展能力,支持高并发访问,百亿条的数据规模下进行查询可达到毫秒级响应,非常适合金融,电信等行业的历史交易详单查询以及公安,
交通等行业的道路卡口数据查询,快速身份信息查询等需。

数据仓库:大数据一体机配备了数据仓库工具和ETL工具,可实现将数据从多种数据库,多个数据源抽取,转换最终加载到数据仓库中。

数据仓库对外提供标准SQL接口,可对接SAS,Congons等传统分析应用,适合各种面向分析应用的数据仓库场景。

4.关键技术特性
针对企业用户对与数据分析处理的需求,大数据一体机在硬件上进行了定制化设计,在软件层面也在开源 Hadoop 基础之上进行了优化和较大的功能改进:
1.支持高速并发写入和高并发查询,每秒实现10万条以上写入和查询(记录大小1K);
2.递交请求创建数据表,数据表需要能灵活改变Schema;
3.灵活的表结构,可动态改变和增加每一行的列,保证新旧数据共存;
4.数据自动切分和分布,可通过增加服务器动态扩容,扩容过程中无需停机可持续服务;
5.单台数据库节点失效会自动修复,所提供服务可自动迁移至集群中其他服务器;
6.数据文件存放于分布式文件系统之上,可复制多份,保证数据不丢失;
7.数据文件实现元数据备份和恢复功能,防止元数据破坏失效;
8.线上动态扩容,新加节点可以实现自动负载均衡;
9.节点数据的副本以及正确性的自动检查,尽最大限度的保证数据的高可用性;
10.多副本机制,提供高并发读性能;
11.磁盘故障的自动检测,发现故障磁盘,数据自动实现副本恢复迁移;
12.提供多层容错机制,应用程序故障能自动迁移重启;
13.可以实现表中指定列的复制份数,做到可用性和复制冗余根据需要灵活调配;
14.可以实现表中指定列的压缩,可根据需要实现存储空间的高利用率;
15.分布式数据库自动负载均衡;
16.分布式数据库支持多级别的客户请求过滤器,可对单个列族、多列族、行等进行过滤;
17.分布式数据库局部性机制,减少读写数据时网络传输消耗;
18.分布式数据仓库可以增加节点提高计算性能,扩容无须停机;
19.分布式数据仓库需要提供灵活的扩展性,如复杂数据类型,扩展函数和脚本等;
20.分布式数据仓库可以提供分区操作,桶操作;
21.集群管理软件提供图形化界面对集群服务器角色,配置和状态进行管理;
22.集群管理软件支持分布式文件系统、分布式数据库和分布式数据参数所有参数配置及用户自定义参数配置;
23.集群管理软件支持集群服务器上分布式系统状态监控和服务器状态监控;
24.集群管理软件支持自定义报警;
25.集群节点健康状态监控管理;
26.集群组件服务状态监控;
27.平台支持全文检索功能扩展;
28.提供大对象存储能力;
29.采用有效的数据冗余技术;
30.提供有效的安全访问及鉴权机制,确保合法用户对数据进行合法访问;
31.提供独立的远程管理控制端口;
32.提供自动化的管理特性,帮助管理员简化运维管理;
33.可根据日志数据的保存周期,设置数据生命周期策略,对不同阶段的日志数据采用不同的可靠性策略,并支持自动资源回收。

技术指标
根据不同的应用场景需求,浪潮云海大数据一体机有三个通用系列供用户选择,并可为用户进行定制化配置满足客户要求:
*扩展性:指大数据一体机标准配置的扩展能力,采用特殊硬件和设计理论上可扩展到4000节点*主柜数据存储空间:如采用HDFS 3副本机制实际存储容量需要除以3。

相关文档
最新文档