集群系统管理

合集下载

小型机双机集群数据库系统管理与维护

小型机双机集群数据库系统管理与维护

小型机双机集群数据库系统管理与维护摘要:随着计算机技术的迅猛发展,大型数据的处理和存储已成为当今计算机科学中的重要问题。

为了保证数据库系统的稳定性和可扩展性,使用小型机双机集群成为一种常见的数据库解决方案。

本文以小型机双机集群数据库系统为研究对象,详细分析了其管理与维护的必要性,阐述了如何通过备份、故障转移、性能监测等手段保证数据库系统的安全、稳定运行。

关键词:小型机双机集群、数据库系统、管理、维护、备份、故障转移、性能监测。

正文:一、引言随着信息时代的到来,数据的容量和速度呈现爆炸式增长,数据处理与存储成为了计算机科学的急需问题。

作为现代信息化的重要基础设施,数据库系统的运行稳定性和数据存储安全问题受到了广泛关注。

在此背景下,小型机双机集群数据库系统应运而生,成为了常用的数据库解决方案。

二、小型机双机集群数据库系统概述小型机双机集群数据库系统相当于通过搭建集群将多台服务器联合成一个整体运行,每个服务器可以相互配合,并将数据分布在参与集群的服务器之间。

小型机双机集群的应用方案具有可扩展性,故障容错和性能提升的优势。

三、小型机双机集群数据库系统的管理与维护小型机双机集群数据库系统的管理与维护包括备份与恢复策略、故障转移和性能监测三个方面。

(一)备份与恢复策略备份与恢复策略是小型机双机集群数据库系统管理的重要方面。

备份策略的制定包括数据备份的时间、备份的频率、备份如何执行、备份存储的位置等,考虑数据量的大小、恢复所需时间等因素,同时也需要考虑故障发生的概率。

恢复的策略与备份策略类似,主要包括数据恢复的时间、恢复数据顺序,应急措施等。

(二)故障转移故障转移是小型机双机集群数据库系统管理的另一个重点。

故障发生时,系统要能够在最短时间内完成故障转移。

原理是通过主从切换,将数据库系统从故障节点转移到正常节点,并保证业务持续不中断。

同时,也需要进行故障原因的分析和处理,避免下一次故障的发生。

(三)性能监测性能监测的目的是了解任务执行的情况,发现运行中的问题,并及时解决。

图书馆集群管理系统

图书馆集群管理系统

图书馆集群管理系统图书馆集群管理系统文档1.引言本文档为图书馆集群管理系统的详细设计文档,旨在介绍系统的功能和架构,以便理解和使用该系统。

2.系统概述2.1 目标图书馆集群管理系统是为提供高效、便捷的图书借阅和管理服务而设计的。

该系统旨在实现以下目标:- 提供在线图书借阅和归还功能- 实现图书目录检索和查询- 管理图书馆资源和会员信息2.2 主要功能- 图书管理:包括图书入库、借阅、归还、续借、逾期管理等功能。

- 会员管理:包括会员注册、登录、个人信息管理等功能。

- 图书检索:根据关键词、作者、出版社等条件进行图书目录的检索。

- 统计报表:图书借阅统计报表和会员统计报表。

3.系统架构3.1 系统需求实现图书馆集群管理系统需要满足以下需求:- 客户端:支持多平台,包括Web、移动端等。

- 服务器:提供稳定的运行环境和数据库支持。

- 数据库:存储图书、会员及其他相关信息。

3.2 系统组件图书馆集群管理系统包括以下组件:- 用户界面:提供给会员和管理员使用的交互界面。

- 服务器端:处理用户请求,与数据库进行交互,提供业务逻辑处理。

- 数据库:存储图书馆资源、会员信息和操作日志等数据。

4.功能模块详细设计4.1 用户模块4.1.1 登录功能- 用户输入用户名和密码进行登录。

- 系统验证用户身份信息。

- 登录成功后,跳转到相应界面。

4.1.2 注册功能- 用户填写相关个人信息进行注册。

- 系统验证用户输入信息的合法性。

- 注册成功后,跳转到登录页面。

4.1.3 个人信息管理- 用户可以修改个人资料,如昵称、密码等。

- 系统保存用户修改的个人信息。

4.2 图书管理模块4.2.1 入库功能- 管理员输入图书相关信息,如书名、作者、出版社等。

- 系统图书ID和条形码。

4.2.2 借阅功能- 会员输入图书ID进行借阅。

- 系统记录借阅时间和归还期限。

4.2.3 归还功能- 会员输入图书ID进行归还。

- 系统记录归还时间,并更新图书状态。

网络IP的分布式系统和集群管理

网络IP的分布式系统和集群管理

网络IP的分布式系统和集群管理随着互联网的发展,信息技术的迅速进步,网络IP的分布式系统和集群管理在网络架构和管理中变得越来越重要。

本文将探讨网络IP 的分布式系统和集群管理的概念、原理以及相应的技术。

一、概述网络IP的分布式系统和集群管理是指将大量的网络IP地址资源分布在多台服务器之间,通过集群管理技术实现网络资源的高效利用和运营管理。

在传统的网络架构中,IP地址通常是集中管理和控制的,但随着网络规模的不断扩大和业务需求的不断增加,集中式管理已经不能满足快速增长的需求。

因此,采用分布式系统和集群管理的方式成为了一种趋势和解决方案。

二、分布式系统1. 概念和原理分布式系统是指将多台服务器通过网络连接起来,共同完成某个任务或者提供某个服务的系统。

在分布式系统中,各个服务器之间相互协作,共享资源和负载,实现高性能和高可用性。

分布式系统可以通过多种协议和技术实现,例如TCP/IP协议、DNS负载均衡、数据复制和同步等。

2. 分布式系统的优势分布式系统的优势在于提供了更高的性能和可靠性。

通过将网络IP地址资源分布在多台服务器之间,可以充分利用服务器的计算和存储能力,提高系统的吞吐量和响应时间。

同时,分布式系统还可以实现负载均衡和故障恢复,当某一台服务器发生故障时,其他服务器可以接管工作,保证服务的连续性。

三、集群管理1. 概念和原理集群管理是指对分布式系统中的多台服务器进行集中化管理和控制的技术。

通过集群管理,管理员可以对服务器进行集中配置、监控和维护,提升系统的可管理性和运维效率。

集群管理还可以实现负载均衡和故障转移,确保系统的稳定性和可用性。

2. 集群管理的技术集群管理可以通过各种技术来实现,例如集群软件、集群文件系统、集群监控和自动化运维工具等。

集群软件可以实现服务器的集中管理和配置,例如通过SSH协议实现远程登录和操作。

集群文件系统可以实现数据在多台服务器之间的共享和同步,例如NFS和GlusterFS等。

利用Linux操作系统进行服务器集群管理

利用Linux操作系统进行服务器集群管理

利用Linux操作系统进行服务器集群管理在当今信息时代,服务器集群已经成为现代企业中不可或缺的一部分。

而要有效地管理服务器集群,利用Linux操作系统是一个明智的选择。

本文将介绍如何利用Linux操作系统进行服务器集群管理。

一、服务器集群管理的基本概念服务器集群是由多台服务器组成的,旨在提高系统的可靠性、可用性和性能。

服务器集群管理的核心目标是促进集群中服务器的协同工作以提供高负载、高性能和高可用性的服务。

二、Linux操作系统简介Linux操作系统是一个免费且开源的操作系统,具有出色的稳定性和安全性,广泛应用于服务器领域。

Linux操作系统提供了一系列工具和命令,用于管理集群中的多台服务器。

三、服务器集群管理工具1. SSH(Secure Shell)SSH是一种网络协议,可用于在两个网络设备之间进行加密通信。

通过SSH,管理员可以在远程终端登录服务器,执行管理操作。

2. Shell脚本Shell脚本是一种在Linux操作系统中编写的可执行脚本,用于批量执行一系列命令。

管理员可以编写Shell脚本来进行服务器集群管理任务,如自动化安装软件、配置系统参数等。

3. rsyncrsync是一种高效的文件复制工具,可用于在服务器之间同步文件和目录。

管理员可以使用rsync命令将文件从一台服务器复制到集群中的其他服务器,实现数据的同步和备份。

4. PacemakerPacemaker是一个开源的高可用性集群管理软件,可用于监控和管理服务器集群中的资源。

通过配置Pacemaker,管理员可以实现自动故障切换和负载均衡等功能。

四、利用Linux操作系统进行服务器集群管理的步骤1. 安装Linux操作系统首先,管理员需要在每台服务器上安装Linux操作系统。

可以选择适合企业需求的Linux发行版,如Ubuntu、CentOS等。

2. 配置SSH登录在每台服务器上,管理员需要配置SSH服务,以便能够通过SSH 协议远程登录服务器。

IInterlib区域图书馆集群管理系统用户手册

IInterlib区域图书馆集群管理系统用户手册

I n t e r l i b图书馆集群管理系统用户手册广州图创计算机软件开发有限公司目录前言⏹图书馆集群管理系统Interlib的出现⏹为什幺需要区域图书馆群的联合服务⏹阅读对象⏹本手册包括的内容⏹本手册阅读指导⏹相关参考手册⏹本书约定⏹更多信息图书馆集群管理系统Interlib的出现传统的图书馆管理方式下,区域内各图书馆作为一个独立存在的实体,数字化文献资源信息无法做到共享,达到为全区域服务的目的,各自的独立发展将使自己成为今后数字化信息时代的一座孤岛。

从图书馆自动化系统发展历程来看,经历过单机、终端/主机阶段,局域网下客户机/服务器(C/S)阶段。

C/S模式在90年代中期作为图书馆自动化系统架构的主流,一直到今天,将图书馆自动化的发展带入了新境界。

C/S模式是基于局域网技术发展起来的,在Internet技术发展到今天的地步,C/S模式在伸缩性、可管理、资源共享、联合服务等方面有技术上先天的缺陷,难以实现数字资源和传统业务紧密结合以及海量数字资源的分布处理。

图书馆集群管理系统Interlib是新一代的图书馆自动化软件,采用开放的多层结构体系,基于Internet实现传统业务与海量数字资源管理的结合。

Interlib作为资源共建共享的新的载体形式,打破了图书馆各自分离的局面,将区域内图书馆群作为一个整体进行管理,从而达到资源共建共享、合理配置和图书馆之间互相合作的目的。

Interlib通过Internet网络或城域网络将区域内各图书馆联合起来,组成一个区域性的虚拟图书馆群,建立一个区域图书馆群的电子化、数字化、网络化的信息空间,同时通过开放的多层结构达到与国内外其它图书馆的资源共享与协作,从真正意义上实现图书馆群的资源管理和业务协作。

Interlib系统的主要功能特点:⏹100%纯Java开发产品,跨平台设计,与Internet紧密结合。

⏹B/S模式多层体系结构,MVC架构。

⏹Browser端完全采用XML,解决HTML的局限性,适应更新的技术发展。

图书馆集群管理系统

图书馆集群管理系统

Interlib图书馆集群管理系统广州图创计算机软件开发有限公司网址:邮件:******************.cn目录1 公司简介 (1)2 Interlib系统介绍 (3)2.1 Interlib系统的出现 (3)2.2 为什么需要区域图书馆群的联合服务 (4)2.3 Interlib体系结构 (5)2.4 Interlib联合服务特色 (6)2.4.1 联合、协调采购 (7)2.4.2 联合编目 (7)2.4.3 联合目录 (8)2.4.4 通借通还 (8)2.4.5 降低维护成本 (10)2.4.6 丰富的工作形态 (11)2.5 Interlib系统特色 (11)2.5.1 采访 (14)2.5.2 编目 (15)2.5.3 典藏 (17)2.5.4 流通 (18)2.5.5 期刊 (20)2.5.6全文传递 (22)2.5.7 WebOPAC (23)1 公司简介广州图创计算机软件开发有限公司是一家大型软件开发公司,主要目标是为图书馆行业用户提供高质量的应用软件系统设计、集成和维护服务,是集产品研发、应用集成、客户服务为一体的高新技术企业。

在企业发展过程中,图创以技术创新、产品质量可靠和客户服务为核心的整体发展策略,专注于研发具有自主知识产权和创新核心技术的图书馆行业应用软件产品,服务于国民经济信息化建设,推动图书馆界软件事业的快速发展。

公司成员均是在图书馆行业从事软件开发与系统设计工作多年,在对国内外图书馆系统全面分析总结后,创新的提出了“第三代图书馆系统Interlib ”--区域图书馆群的整体解决方案。

目前,该产品为国内外第一家采用面向Internet 技术开发的图书馆系统软件产品,超越以往传统的图书馆系统模式,以区域图书馆群的资源共建共享和联合服务作为特色和优势,将成为下一代图书馆系统软件产品的先驱和倡导者。

公司人员组成:公司由获得国家科技进步奖等多项奖励的资深图书馆行业领域应用专家,优秀的软件工程系统分析工程师,一流的软件产品设计和开发团队及管理人员组成。

浪潮集群系统管理软件

浪潮集群系统管理软件

知识库建设
整理常见问题解答和操作指南,方便用户自 行查找解决方案。
版本更新与维护
及时发布软件更新和维护补丁,确保系统的 稳定性和安全性。
04 浪潮集群系统管理软件的 应用场景与案例
科学计算
生物信息学
用于基因测序、蛋白质结构分析等生物信息数据处理,提高研究效 率。
气象预报
处理大规模气象数据,提供更准确的气象预潮集群系统管理软件将进一步与云计算技术集成,实现资源的动态管
理和按需分配。
02
大数据分析
通过对集群系统中的大量数据进行实时分析,为业务决策提供有力支持。
03
自动化运维
提高自动化运维水平,降低人工干预,提升系统稳定性和可靠性。
应用场景拓展
人工智能
支持更多人工智能应用场景,如机器学习、深度学习等。
安全与可靠性
1 2
访问控制
支持用户身份验证、授权和访问控制,确保系统 安全。
数据备份与恢复
提供数据备份和恢复功能,确保数据安全可靠。
3
高可用性
通过负载均衡、容错和故障转移等技术,提高系 统的可用性和可靠性。
03 浪潮集群系统管理软件的 部署与实施
系统架构设计
高可用性设计
确保系统在硬件或组件故障时 仍能持续运行,通过负载均衡
选择适合的备份和恢复工具,如磁带库、云 存储等。
数据备份策略
定期备份系统数据,确保在意外情况下能够 快速恢复数据。
灾难恢复计划
制定灾难恢复流程,以应对大规模数据丢失 或系统故障。
系统优化与调整
性能监控
定期监控系统性能,包括CPU、内存、 磁盘和网络等资源的使用情况。
性能优化
根据监控结果调整系统参数,如内存 分配、线程数等,以提高系统性能。

大规模集群系统管理应用研究

大规模集群系统管理应用研究
◆不 同应 用系统 分 片式 管理 增加 了系统 管 理员 工作量 。实现集 中管 理 和监控 可 为系统 管理 员提 供 高效的管理和 监控 手段 , 及时 发现 和解 决各 类 故 障 , 保证 P C集群计算环 境能够高效稳定运行 。 ●随着 P C集 群 规模 的扩 大 , 障率 急 剧上 升 , 故 主要表现在计 算节 点 的硬 盘 。随 着磁盘 密 度 的快速 增加 , 磁盘表面 的读 错误 率也 在增 加 , 盘 故 障 已成 硬 为P C集群 的主要 故 障点 , 随之 而来 的重装 系统 成 为 系统管理很大 的负担 。
0引 言
随着 P C集 群技 术 的发 展成 熟 , 价格 便 宜 、 署 部 灵活 、 计算速度 强等特 点使 P C集群 在地震 数据 处 理
解释系统 中成 为主要 计算 资源 。新疆 油 田地球 物 理 研究所从 20 0 3年部 署 24个节 点 的 P 2 C集 群地 震 处 理 系统开始 , 目前 已投产 94个计 算节 点 的 P 5 C集 群 地震处理 系统 , 在油 气 勘探 研究 中发 挥 了重要 作 用 。

服务 器和存储 服务 器两部分组 成 。P C集 群节点 管理
服务 器负责模 板管理 、 快照生成 、 节 点快速 部署 、 计算 存储服 务器管 理 、 虚拟 硬盘管理等工 作 。存储 服 务器 负责 为 Bamn系统 提供模 板及 快照 存放 空间 , ld i 为计 算节点 提供 虚拟硬盘及 连接带宽 。Bamn系统结 构 l管理 大规模 集群 系统案例 的分析 , 了利 用 Bamn技 术 实现 大规 l i d 探讨 l i d
模P C集群的优化 管理 。 关键词 快照 ; C I 网络磁盘 ; I S; S 集群管 ;O D; 分发 S N 软件
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简介:本文首先对Linux高性能集群Cluster1350及其集群管理系统CSM (Cluster System Management)进行了简要的介绍,然后对CSM的体系结构进行了比较详细的剖析。

一、集群一般来说,集群是指一组高性能计算机通过高速网络连接起来的,在工作中像一个统一的资源,所有节点使用单一界面的计算系统。

集群技术的出现,使得使用多台PC或工作站就可获得同大型机相匹敌的计算能力,同时成本大大降低,从而在很多高性能计算领域内由集群完全取代大型机也将成为可能。

广义上的集群的节点可以是任意类型的计算机,包括PC机、工作站、SMP等等,甚至是大型机。

Linux集群是指一类以PC架构计算机为集群节点,以某一版本Linux操作系统为集群节点操作系统的集群。

由于Linux本身具有开放源码、稳定、支持PC架构等诸多优势,以及操作系统及节点机价格的因素,Linux集群技术被认为是最具发展潜力的集群技术。

回页首二、集群系统管理根据典型的集群体系结构,集群中涉及到的关键技术可以归属于四个层次:网络层、节点机及操作系统层、集群系统管理层、应用层。

•网络层:网络互联结构、通信协议、信号技术等。

•节点机及操作系统层:高性能PC或工作站、分层或基于微内核的操作系统等。

•集群系统管理层:资源管理、资源调度、负载平衡、并行I/O、安全等。

•应用层:并行程序开发环境、串行应用、并行应用等。

集群技术是以上四个层次的技术有机结合,所有的相关技术虽然解决的问题不同,但都有其不可或缺的重要性。

集群系统管理层是集群系统所特有的功能与技术的体现。

在未来按需(On Demand)计算的时代,每个集群都应成为业务网格中的一个节点,所以自治性(自我保护、自我配置、自我优化、自我治疗)也将成为集群的一个重要特征。

自治性的实现,各种应用的开发与运行,大部分直接依赖于集群的系统管理层,并且,系统管理层的完善程度,决定着集群系统的易用性、稳定性、可扩展性等诸多关键参数。

正是集群管理系统将多台机器组织起来,使之可以被称为"集群"。

回页首三、IBM Cluster1350,Linux高性能集群Cluster1350是IBM公司目标定位于高性能计算市场的Linux集群,包括一套完整的解决方案,集成了众多IBM与非IBM的先进的软硬件技术,有其特有的技术优势与强大的服务支持。

Cluster1350集群的体系结构如下图所示:Cluster1350体系结构•High Speed NetworkCluster1350的计算网络可选Myrinet超高速网络或者千兆以太网,以及相应的通信协议,用于并行计算时各节点间数据交换。

•Manage NodeCluster1350的管理节点为xSeries345 (2U),操作系统为Linux,目前支持RedHat7.2与7.3,RedHat AS2.1,以及SuSe 8.0和8.1,SuSe SLES7.2和8.0。

自带两个10M/100M/1000M自适应网卡,支持RAID,有RSA适配器接口(PCI插槽)。

•Compute NodeCluster1350的计算节点为xSeries335 (1U),操作系统为Linux,目前支持RedHat7.3,RedHat AS2.1,以及SuSe 8.0和8.1,SuSe SLES7.2和8.0。

自带两个10M/100M/1000M自适应网卡,有RSA适配器接口(PCI插槽)。

•RSA (Remote Supervisor Adapter)RSA适配器节点机主板上的ISMP以及C2T Chain等其它相关硬件配合工作,用于实现对集群中各节点的电源管理、机器硬件状态监测、日志报告等管理功能,是Cluster1350中硬件控制的接入点。

一个Cluster1350集群中可以有多个RSA配置器,每一个RSA适配器最多可控制24个节点。

•Terminal Server各节点通过串口连接到Terminal Server,通过Terminal Server,管理员在管理节点上可以获得任意受控节点的控制台,而不管该节点在普通网络(ManagementNetwork)上是否可达。

一个Cluster1350集群根据规模不同,可以有一个或多个Terminal Server。

在节点比较少时,也可以不用Terminal Server,而用KVM交换机以及xSeries335前面板上的控制按钮配合来实现控制台切换,不过后一种方式当节点数目增多时连接及操作复杂度会越来越高。

•Management NetworkCluser1350的集群管理网络由各节点上的ISMP (Integrated Systems Management processor)、C2T Chain (Cable Chain Technology)、RSA适配器、Terminal Server、Management Switch/VLAN构成。

其中ISMP内置于安节点主板,由C2T Chain级联,然后通过RSA适配器用网线连接到管理网络;各节点用串口线连接到Terminal Server,Terminal Server也通过网线连接到管理网络。

这样,管理节点通过管理网络可以便捷地实现对集群所有节点的控制。

•Cluster NetworkCluster Network可以是普通的网络,主要用于集群系统管理软件对集群的管理,比如监控节点状态、网络安装各节点操作系统、更新各节点配置文件及软件等。

Cluster Network一般不用于并行计算时各节点间数据交换。

•Cluster System Management LayerIBM公司为Cluster1350提供功能完备的基于SRC (System Resource Controller)和RSCT (IBM Reliable Scalable Cluster Technology)的CSM (Cluster Systemmanagement),GPFS (General Parallel File System)等集群管理软件,可以便捷地完成基本的集群系统管理工作。

还可以再选择安装其他用于Linux集群的管理调度软件以实现负载平衡、任务调度等功能。

•Application Layer科学计算、商务服务、信息服务等各种需要大规模计算或高可靠性服务的应用都可以在Cluster1350上运行。

Cluster1350不是面向任何特定的应用的设计,应用层根据用户的需要而不同。

此外,根据需要Cluster1350还可以配置专门的存贮节点,通常是xSeries345。

Cluster1350由各节点主板内置硬件和RSA 适配器、C2T Chain级联技术等与CSM等集群系统管理软件相配合,实现了可靠、强大、易用、可扩展的系统管理功能。

•整个集群可由单一节点控制。

包括所有节点的开机、关机、状态查询、显示远程控制台、安装操作系统、升级各节点系统及应用软件等所有工作在内,都可以在管理节点上完成。

一个集群只需一套外置输入/输出设备(键盘、鼠标、显示器)。

•可以使管理人员方便地完成集群的部署。

xSeries335和xSeries345为集群系统量身定做,安装,连接都很简单。

整个集群管理结构只需少量线缆相连。

安装配置好集群管理节点的操作系统及CSM后,管理员可以同时进行所有计算节点的安装及配置,而这一过程只需几条命令即可完成。

•方便的使用期管理。

在CSM的支持下,管理员只需登录到管理节点,便可完成在所有指定计算节点上同时安装/缷载rpm软件、升级CSM客户端、更新配置文件、执行同一shell命令(脚本)等操作,可以对集群节点的进行动态/静态分组管理,删除或新增节点。

•有效地监控各节点的资源状况。

CSM的后台进行时刻监控所有指定资源的状态,并且及时响应给相应的处理程序或集群管理员,而并不需要很大的带宽。

•可以及时检测到系统错误,准确定位错误,并自动解决或记录日志以帮助管理员手工处理错误。

对于普通Linux集群来说,以上这些管理工作在没有专用集群管理系统的情况下工作量是随着集群规模的扩大而急速增长的,有时还会导致硬件资源的浪费。

而Cluster1350彻底地解决了这个问题,使管理集群变得像管理一台计算机一样简单方便,使用户可以将主要精力用于应用方案的设计与开发,而不用在这些繁琐的集群管理工作上投入过多不必要的时间。

回页首四、CSM (Cluster System Management)CSM是IBM公司开发,专门用于集群系统管理的中间件,在Cluster1350解决方案集成。

CSM的设计思想与体系结构来自PSSP (IBM Parallel System Support Programs for AIX)与其它一些开源的集群管理软件。

还有一些中间件及技术,虽然不直接为用户服务,但构成了CSM的不可或缺的基础,包括RMC、SRC、RSCT等。

CSM的体系结构如下图所示。

CSM体系结构(引用自Linux Clustering with CSM and GPFS, IBM Redbook)其中CSM Server只安装运行于管理节点,CSM Client安装运行于所有受控节点。

CSM体系结构中各模块功能详细说明如下:•Database and Distributed Management Server (DMS)管理节点上的CSM系统数据库,用来存贮整个集群的配置信息。

比如所有节点的参数,分组等。

集群中的每一个计算节点都要注册到此数据库,才能通过CSM由管理节点控制。

而CSM的大部分管理命令,都需要从此数据库中读取相关配置信息。

•l Managed Node集群中正常连接并且已经正确安装配置好操作系统及CSM的节点。

安装工作正确完成后CSM数据库中对应的节点属性会自动改为Managed,说明该节点已经由管理节点所控制。

•Node Group对CSM系统受控节点的分组管理。

默认的几个分组的判断条件是操作系统类型、版本,CSM版本,电源管理方式等。

具体管理中可以实现自定义的分组。

分组的定义方式类似于SQL中视图的定义,支持多条件及模糊条件,支持分组嵌套。

另外CSM节点管理支持动态和静态分组。

•Distributed Shell (dsh)使用dsh可以同时在集群中指定的一个或者多个节点上同时执行同一shell命令。

比如dsh -a date。

•Hardware control硬件控制功能依赖于xSeries335, xSseries345节点机以及RSA卡的支持,以实现对集群节点的一些基本操作,如开机、关机、关闭系统、重新启动等。

此功能与节点是否安装操作系统无关,因为这些指令直接由节点机主板上专门的服务处理器执行,只要节点电源正常,便会响应。

相关文档
最新文档