无锡101医院云计算解决方案建议书

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

无锡101医院云计算解决方

案建议书

1方案概述 (3)

2总体架构 (4)

3分布式数据库--数据立方 (5)

3.1数据立方(DataCube) (6)

3.2软件规格说明 (6)

3.3优势 (8)

4任务调度引擎--JobKeeper (8)

5硬件规格 (11)

6市场应用 (14)

1方案概述

当今时代是数据爆炸时代,全球数据总量每过18个月就会在原有数据总和基础上翻一番。IDC研究表明,仅从2006年到2010年,全球信息总量增长6倍以上,从161EB 增加到了988EB。随着互联网向物联网、移动互联网的扩展,网络将连接起更多的人和物,信息海量化趋势将进一步加剧。在这样的背景下,各行各业,各大领域的公司、政府机构需要将TB乃至PB级的数据存储起来,并从中挖掘出有用的信息,对这些海量的数据进行快捷、高效的处理。云计算与云存储在这样强烈的市场需求之下应运而生。

同样医疗信息系统,每年产生及需要管理的数据也是相当惊人的,传统处理方式已无法实现如此海量数据的存储与高效处理。因此,为加强医疗系统管理能力,进一步提升医疗信息科技水平,提高信息处理效率,应用云计算与云存储管理相关系统,已成为医疗信息科技发展的必然趋势。

作为当今处理海量数据存储与计算的最佳方案,云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的。云计算已被公认为能够改变人类信息生活的革命性技术,其计算资源组织、分配和使用模式,有利于合理配置计算资源并提高其利用率,促进节能减排,实现绿色计算。

本方案针对医疗信息系统实际应用特点,结合云计算、云存储优势,利用云创存储自身云计算与云存储产品,创新地开发设计了物联云系统平台,通过整合各个相关部门系统现有资源,结合云创cStor海量云存储系统、cProc高效云处理平台、cVideo云视频监控管理系统、cTrans高速云传输系统四大系统产品,充分发挥云存储与云计算针对海量数据处理时的优势,达到海量监控信息存储与管理的目的,从而进一步提升医疗平台数据管理能力,医疗信息处理效率,为打造科技创新型现代医疗信息平台做出贡献。

2总体架构

IaaS层:利用虚拟化技术将计算、存储和网络等基础硬件资源,以逻辑方式形成基础资源池层,再将资源池提供的虚拟机、虚拟存储或虚拟端口组等经过二次封装与组合、调度使用,形成一个个面向组织用户的虚拟服务器、虚拟桌面或者云存储系统,通过这样的形式为各业务单位提供资源服务;同时提供物理资源和虚拟资源的统一监控管理,进而提供全生命周期资源服务。

PaaS层:在IaaS层基础上,提供分布式数据库--数据立方来解决海量结构化数据的管理和数据交互,提供标准SQL接口、JDBC技术,能够与各种不同的业务数据库进行无缝对接;同时提供海量任务并行调度引擎JobKeeper,能够实时处理大规模并发任务的负载均衡和任务分发,做到所有任务实时分发处理,不堆积,做到高度可靠性,任何任务处理过程中不会丢失,保障所有任务都能够处理完。

SaaS层:医疗信息云计算平台能够支撑所有医疗业务系统在上面运行,所有业务数

据统一管理,根据权限做到绝对安全访问,支撑各个部门的业务应用。

3分布式数据库--数据立方

数据处理是对数据的采集、存储、检索、加工、变换和传输。数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据的形式可以是数字、文字、图形或声音等。数据经过解释并赋予一定的意义之后,便成为信息。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响着人类社会发展的进程。

3.1数据立方(DataCube)

我们以B+树的结构建立了字段的索引,每个B+树结构的字段索引相当于一个数据平面,这样一个全局数据表与其多个重要字段的索引就组成了一个类似于立方体的数据组织结构,我们称之为“数据立方(DataCube)”。如下图所示:

数据立方(DataCube)是一种用于数据分析与索引的技术架构。它是针对大数据(big data)的处理利器,可以对元数据进行任意多关键字实时索引。通过数据立方对元数据进行分析之后,可以大大加快数据的查询和检索效率。

数据立方是凌驾于数据存储层和数据库系统之上的,通过数据立方解析后,可以大大增加数据查询和检索等业务,可以让系统平台具备数据实时入库、实时查询、查询结果实时传输等优势。

3.2 软件规格说明

3.3 优势

实时性:平台在高效率并行分布式软件的支撑下,可以实时完成数据处理和分析工作,如数据处理、数据查询、和统计分析等。数据处理不会出现数据堆积现象,各类分析和查询工作基本都在秒级完成,具有前所未有的高效性。

响应速度快速:在海量数据领域,DataCube的响应速度远远快于传统的数据库。采用分布式处理的方式,性能与节点数成正比,通过增加节点的方式,可将性能提升,以达到满足需求的处理要求。

高可靠性:基于对云处理可靠性深厚的研究积累,彻底解决了当前分布式处理平台易出现的单点故障问题。任何一个节点出现故障,系统将自动屏蔽,而且不会出现丢失数据的现象。

可伸缩性:在不停机的情况下,增加节点,平台的处理能力自动增加;减少节点,平台的处理能力自动缩减。这样,可以做到与资源池的无缝对接,根据处理和存储任务动态地申请或释放资源,最大限度地提高资源利用率。

高性价比:采用X86架构廉价处理机构建云处理平台,用软件容错替代硬件容错,大大节省成

本。在目标性能和可靠性条件下,可比传统的小型机加商用数据库方案节省10倍左右的成本。

全业务支持:采用NoSQL+关系数据库混合模式,绝大部分海量数据存放于分布式平台并进行分布式处理,少量实时性要求很高的数据存放于关系数据库,可支撑各种类型的业务。不仅支撑查询、统计、分析业务,还可支撑深度数据挖掘和商业智能分析业务。

3.4 可行性

系统可靠性

HDFS可靠性概述:

HDFS包括元数据节点(Namenode)和数据节点(Datanode),Namenode是一个中心服务器,负责管理文件系统的Namespace和客户端对文件的访问。,Datanode在集群中一般是一个节点一个,Datanode是文件系统中真正存储数据的地方。

DataNode所在机器挂了怎么办?

HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块(block)。一个文件对应的所有BLOCK全部按照一定的部署策略存在于DataNode上,文件的所有block为了容错都会被复制(一般为3份),每个文件的block大小和replication因子都是可配置的。Datanode每3分钟向Namenode发送心跳,如果10分钟datanode没有向Namenode发送心跳,则Namenode认为该Datanode已经dead,Namenode将取出该Datanode上对应的block,对其进行复制。

Namenode挂了怎么办?Namenode主控服务器,为了避免主节点失效而影响整个系统正常工作,我们采用基于HDFS的改进方案Avatar,同时可开启两个Namenode,主Namenode和secondNamenode,实际工作的只有主Namenode。主Namenode将所有关于文件和目录的操作记录都会写入日志,并定时序列化到本地做镜像,并且保存到本地的NFS服务器,同时secondNamenode读取主Namenode所在NFS服务器的日志并对镜像日志做CheckPoint。故障后,secondNamenode升级为Namenode,通过镜像数据和文件日志迅速恢复系统。数据服务器可通过分布式协同服务机制得知关于主控服务器的更迭情况,然后向新的主控注册并继续发送心跳。

HBase可靠性概述:

相关文档
最新文档