数据中心虚拟化管理手册

数据中心虚拟化管理手册
数据中心虚拟化管理手册

数据中心虚拟化管理手册

数据中心虚拟化管理手册

虚拟化让数据中心硬件得以整合,使数据中心设备密度加大,在提高服务器、网络以及存储等设备效率的同时,也带来了相应的管理难题。在虚拟化环境下,对数据中心服务器、网络等硬件设备的配置要求越来越高。或者说,在现有的设备基础上,如何对硬件配置进行管理,使其满足虚拟化所需的高性能需求,是许多数据中心管理员所面临的难题。此外,虚拟机的蔓延也是一大问题。是什么原因导致了虚拟机的蔓延问题?如何从根本上去解决虚拟机蔓延难题?亦是许多数据中心管理员关心的话题。本技术手册将从虚拟化硬件管理、虚拟机蔓延、虚拟数据中心资源管理等几个方面来分析这些问题,并提出相应的解决方案。

虚拟化硬件管理

目前来看,CPU、内存与I/O资源仍是服务器系统的主要限制。毫无疑问新一代的服务器可以支持更多计算资源,而且将会有更多的应用加入虚拟化阵营。例如AMD-V和Intel VT处理器扩展可以极大提高虚拟化环境下的服务器性能。

如何提高虚拟化环境下的硬件性能?

如何监控和优化虚拟机宿主服务器性能?

改善虚拟服务器架构性能的五大方法

如何解决虚拟机蔓延难题?

虚拟机易于创建,反应速度快,所消耗的硬件资源也非常有限,这必然会导致虚拟机的蔓延。当你需要对生产环境进行复制来测试一个新应用的部署时,你只需创建一个虚拟机即可,耗时仅仅几秒钟。但是,这项工作完成之后,那台虚拟机该如何处理?

追溯:虚拟机蔓延问题产生的根源及其影响

如何从根本上解决虚拟机蔓延问题?

虚拟机蔓延?使用服务器容量规划与生命周期管理

虚拟化资源管理

一旦你完成了对数据中心各种服务器工作负载的归类,就需要考虑一下如何将其分配给主机了。如果一台主机服务器要运行20台虚拟机,那这些虚拟机就不能也不应该在同一时刻去竞争相同的资源。

如何制定服务器虚拟资源分配原则

企业系统管理:后虚拟化时代的数据中心利器

如何提高虚拟化环境下的硬件性能?

目前来看,CPU、内存与I/O资源仍是服务器系统的主要限制。毫无疑问新一代的服务器可以支持更多计算资源,而且将会有更多的应用加入虚拟化阵营。例如AMD-V和

Intel VT处理器扩展可以极大提高虚拟化环境下的服务器性能。

对管理员来说,需要定期检查使用效率与评估可能产生的新需求,以确保管理平台资源利用率、互用性与环境中其它硬件匹配与通用。而虚拟化的价值便是能驱使产商们加强互相合作与协作。

你所有的外围硬件都可以通过虚拟化发挥更大价值,Kroll Factual Data Inc.(Loveland, Colo.)的首席技术架构师Chris Steffen表示:“我想指出的是虚拟化管理平台的统一。”

服务器已能为虚拟化提供卓越的性能,但专家们指出网络似乎落后了。Erickson对网络性能与交换机背板带宽是否能满足来自多个虚拟机流量交换表示严重关切。类似链路聚合与多路径技术可以在一定程度上帮助减轻带宽与延迟问题,为了优化网络,将对一些基础架构进行变更。(《通过以太网来实现I/O虚拟化?这个真的可以有》)

一些管理员们通过建立负载均衡来绕过网络瓶颈——优化工作负载,让同宿主上虚拟机之间通过宿主服务器内部背板传输重要数据,而不是将数据发往外部网络再重新转发。

“I/O问题从未远离服务器,”Erickson说。“但看起来似乎对管理服务器-服务器应用的资源没有起到实际作用,因为在服务器之间并没有足够的物理带宽。”(《如何提高虚拟化数据中心的弹性:网络架构》)

这些问题对公司购置硬件起到深远的影响。最值得关注的趋势是服务器选型已经从小型商业服务器向更大型与更强劲的服务器过渡。例如,某家公司需要五台新服务器,却没法充分利用,而虚拟化改变了这种情况。现在只需要增加一台性能强劲的服务器便可以支撑20或30台虚拟机运行。一台新服务器可以在很短时间内,以较小代价集成至现有环境,而不用花费大量精力去安装数量众多的普通服务器。

专家们认为应该选择具有虚拟化中心特性的设备,包括含虚拟化技术的CPU或支持聚合的网络适配器。我们的目标是以未来发展眼光,优化虚拟数据中心性能及企业中虚拟化

应用的效益。这里最大的问题是所选择产品的专有功能,可能因为其独占性而需支付额外费用或需要消耗许多时间克服此问题。

查看原文

(作者:Stephen J. Bigelow译者:陈德文来源:TechTarget中国)

如何监控和优化虚拟机宿主服务器性能?

当服务器虚拟化技术在IT专业人士之间成为流行话题以来,其对现有硬件更好的资源利用率和降低成本成为人们谈论的焦点,通常,服务器的资源利用率只有10-20%,因此通过虚拟化整合资源利用率低的服务器非常有意义。

服务器虚拟化技术在近几年已经发生了根本性改变,现在虚拟化已经被视为数据中心实现灵活和弹性的必需品,只虚拟化开销较低的服务器已经没有多大意义,越来越多的组织开始虚拟化整个数据中心,这样组织可以将宿主服务器看作是一个资源池,可以按需分配资源。

虽然这种方法提供了很好的灵活性,也为硬件故障提供了更好的保障,但它对服务器虚拟化的依赖程度也大大加强了,因此现在是时候优化你的虚拟主机,确保你的服务器能应付不断增长的需求。

磁盘资源

服务器硬盘是它最慢的组件,在虚拟数据中心,注意设计你的存储子系统,不要让它成为主要性能瓶颈,最理想的办法是为虚拟服务器存储使用SAN,即使预算不允许使用SAN,也要想办法确保磁盘资源争用不会让虚拟机(VM)陷入瘫痪。

首先应将宿主操作系统安装到专用硬盘上,注意不是专用卷,确保宿主操作系统不会和虚拟机抢夺磁盘资源,如果你的托管服务器可以连接外置存储,还可以考虑将宿主操作系统的换页文件移动到外置专用驱动器。

RAID阵列是满足虚拟服务器性能所必需的,至少你应该选择使用RAID1,但RAID1+0是更好的选择,因为它能提供容错,并且性能开销也比RAID5小,如果可以的话,给每个虚拟服务器分配一个专用磁盘阵列最好。

虽然存储阵列类型很重要,但阵列使用的硬盘也同样重要,如果两个或更多虚拟服务器共享一个存储阵列,那你应该考虑使用10K RPM的硬盘,它们的价格比7500 RPM的硬盘要贵一些,但性能表现却要好很多,当然这需要你在性能和成本之间进行平衡。

不要忘了使用可热插拔的SCSI硬盘,不然换一块硬盘就得停掉系统,尤其是你有多个虚拟服务共享一个存储阵列时,其影响面是非常大的。

不管你使用哪种存储类型,确保你安装了合适的驱动,我曾让Windows自动识别存储设备,虽然这样做本身并没有什么错,存储设备也可能会工作得很正常,但性能表现得就不是很理想了,还是自己手动安装原厂提供的驱动最好。

使用固定大小的虚拟硬盘配置你的虚拟服务器会获得额外的性能提升,虽然动态扩展虚拟硬盘很方便,但对服务器的性能是有影响的。

内存和CPU资源

物理内存是服务器虚拟机容纳数量的最大影响因素,应尽可能安装最多的内存,最好是主板支持的内存上限,此外,给虚拟机分配合适的内存,给宿主操作系统预留足够的内存,避免内存不够用或过度分配。

有些虚拟化产品不能阻止管理员过度分配服务器的CPU资源,它们允许你分配比物理CPU核心还多的虚拟CPU给虚拟机,为了获得最佳性能,宿主操作系统至少要预留两个CPU核心,确保你分配的每个虚拟CPU都有对应的物理CPU核心,否则就会出现资源赤字。

请记住,这个建议是基于最佳性能角度考虑的,虽然有时你可以分配比物理CPU核心还多的虚拟CPU给虚拟机,性能也能维持一个可接受的水平,但它一定不是最优的状态。

宿主操作系统

服务器虚拟化优化常常被忽视的一个方向是,宿主操作系统本身对硬件资源的需求,不是所有虚拟化产品都依赖于传统的Windows服务器操作系统,例如,Hyper-V Server是一个专门的,独立的产品,它比完整的Windows服务器操作系统的身材要小巧得多,因此它对硬件资源的需求就更少。

如果你的目标是最大化性能,那最好使用独立的虚拟化产品,当然可以是Hyper-V或其它类似的产品,但有时系统管理需求可能会要求你在宿主服务器上运行传统的操作系统,在这种情况下,你可以采取一些措施减少宿主操作系统的开销。

首先确定宿主操作系统中的哪些进程是必需的,哪些是可有可无的,哪些是应该停止的,在任何情况下,宿主操作系统应该只运行那些关键的应用,如备份代理或防病毒软件,其它非必需应用都应该关闭或卸载。

其次,确保宿主操作系统上的防病毒软件不要扫描虚拟硬盘或与虚拟机相关的任何文件,扫描这些文件不但没有实际意义,对服务器的性能还会造成影响,最糟糕的是,你的防病毒软件还可能会损坏虚拟硬盘文件,如果真的发生这种事,那你的虚拟机就完蛋了。

另一个优化技术是更改宿主操作系统的处理器调度方法,Windows服务器提供了一个设置,允许你调整处理器调度以优先满足运行中的程序或后台服务,对于虚拟主机,应该总是优先满足后台服务的需要。

最后,如果你的宿主服务器可以自动执行碎片整理,你应该将碎片整理进程安排在空闲时段执行,同样,如果你对虚拟机执行自动化碎片整理,也应该安排在非高峰时段进行,同时要避免多个虚拟机同时执行碎片整理。

随着虚拟主机处理的负载越来越多,优化宿主服务器的虚拟变得比以往任何时候都重要,通过优化可以确保资源池得到最有效的利用。

查看原文

(作者:Brien M. Posey译者:黄永兵来源:TechTarget中国)

改善虚拟服务器架构性能的五大方法

管理员经常会努力寻找一些有助于性能改善和提高操作效率的方法,以实现对服务器虚拟化架构的调优。因此,看起来似乎一些很小的调整和设置,可以用来帮助一个复杂的虚拟化环境实现对用户的高性能体验和快速响应支持。

本文提供了改善服务器虚拟化架构效率的五个办法。这些配置方法可以适用于所有的服务器虚拟化环境,虽然其中的某些实践看起来仅仅是小范围的调整,但是它们却可以对虚拟架构整体的性能表现带来显著影响。

一、通过整合文件服务器提高虚拟架构性能

通常,文件服务器对于管理员而言都是个大难题。而且,当我们把物理的文件服务器整合实现虚拟化的时候,只是简单地把它们从物理架构转化和迁移到虚拟服务器系统中。这样的做法也就意味着管理员失去了重新整理、删除、统合和组织一些潜在的非结构化数据的机会。所以,让我们来考虑一种完全不同的整合办法来优化文件服务器性能。

办法一是通过使用存储局域网络(SAN)来完成文件服务器功能。很多存储系统都可以支持以CIFS(Common Internet File System)协议的方式对外提供服务。因此存储终端可以很方便地通过网络连接到AD域控服务器。这种方法同时实现了对所有文件服务器的虚拟化。

另外一种整合方式是借助于云的方式实现文件服务器虚拟化。通过这种方式,您只需在本地文件服务器存储器中存放大约10%的数据,而高达90%的数据可以归档到云存储系统中。单从功能性的角度来看,一个虚拟的文件服务器对外表现为似乎所有的数据都是存放在本地网络上一样。而且,这种虚拟的文件服务器可以很方便地连接到AD域控服务器,同时可以实现对NT文件系统的全面支持。因此,这种方式下虚拟机服务器的管理也非常方便,和物理服务器几乎没有区别。

最后一种方法是通过运行虚拟机来代替原有的物理文件服务器。这种配置模式下,您还可以进一步整合服务器的命名来减少文件服务器的数量。Windows系统中可以支持多种服务器命名方式,以及NetBIOS命名方式,这样用户可以通过一些更加简短好记的命名连接到服务器(例如,\\ServerName)。

很多管理员喜欢用一个大型的文件服务器来代替多个分散的小型文件服务器。Windows Servers可以通过在注册表如下位置

“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\LanmanServer\Parameters ”添加OptionalNames键值来实现对NetBIOS命名方式的支持。

二、禁用微软的集群功能来改善系统性能

有一种很常见的行为就是同时实现了一对MSCS集群下物理服务器的虚拟化。对于那些无法支持VMware HA以及FT容错功能的虚拟机而言,MSCS提供了一种应用级的故障切换能力。但是这样的部署方式对于很多虚拟服务器系统而言都显得相对有些臃肿。

在VMware环境中,MSCS是少数几个需要裸磁盘映射方式虚拟磁盘安装才能支持的配置功能之一。如果用户需要使用MSCS功能就必须放弃最常见的把数据存放于VMFS文件系统上的部署方式。这样的过程也增加了安装过程中存储分配的难度,而且应用也不太普遍。

因此,禁用MSCS集群功能可以获得很多潜在的收益。假设您的Windows系统购买的授权是企业版的甚至是更高级版本时,您甚至还可以减少在软件授权上的花费。如果迁移时把MSCS集群下的物理服务器,迁移到运行标准版操作系统的虚拟机上,您就可以在操作系统上节省一定的授权费用。

三、改善虚拟服务器架构中的操作系统管理能力

通过采用各种系统管理工具和方法来改善服务器虚拟化架构的可管理性。这样的做法对虚拟架构的性能提升很有帮助,从而最终使用户从中获益。

例如,最理想的部署方式是可以基于不同的组策略划分出多个不同的用户组配置,同时尽量减少单个用户独有的本地化操作需求。这样就可以从一个虚拟机模板快速地实现多个虚拟机的部署。

企业级系统管理软件还可以协助完成虚拟服务器的部署。很多虚拟化环境管理员非常讨厌进行一些程序的安装操作,以及映射网络磁盘和本地化配置等等操作。

因此,域组策略的管理方式可以在大多数小型虚拟化环境中成功部署,而企业级大型应用环境可以采用Microsoft System Center, Altiris 和 Novell ZENWorks等管理终端实现。这些工具可以在策略的基础上实现对子虚拟机的应用交付和互操作管理等功能。

四、有效规划虚拟服务器架构中的病毒扫描过程

很多在非虚拟化环境中非常普通的操作,进入整合的虚拟化架构之后反而会成为一个难点问题。例如,非常著名的虚拟化环境病毒扫描问题。我们设定的策略是在每周日凌晨3点完成对所有系统的全面病毒扫描(假设这个时间点也不会成为企业其它区域内国家的应用高峰时间段。)这样的方法同样可以应用于物理服务器,因为在这个时间内处理器也多半处于Idle状态。

另外,病毒扫描过程带来的问题在SAN环境中会更加突出,因为它会对本地处理器资源带来极大地压力。如果我们在虚拟服务器架构中进行磁盘碎片整理操作,就可以理解当所有的子虚拟机同时开始运行全扫描操作时对整个处理器资源池带来的巨大压力。

为避免这种情况,可以为不同的虚拟机组设置不同的扫描时间。例如,在凌晨3点启动15台虚拟机的扫描,而另外15台的扫描开始时间为凌晨5点。这样的设置方法是非常有必要的。只有这样,一些高级功能,如VMware的DRS,才可以基于对集群系统计算能力的理解实现对工作负载的自动迁移。

五、尽量采用新建虚拟机方式代替P2V转化从而提高系统性能

虽然物理机到虚拟机(P2V)转化是一个非常简单地操作过程,但是往往新建的系统是更为纯净的。在Windows系统中,P2V转化过程会同时移植很多原有配置信息,例如硬件驱动程序、一些不必要的软件以及混乱地文件系统,这些都会影响到系统的性能。

为了使新系统达到最优性能,最好的方式就是部署全新的虚拟机,然后重新分发所需的软件。这包括,用户应用程序的重新安装、代码和配置信息的转化、数据库服务器上数据库系统的重建等过程。当然,P2V的转化仍然是一项非常有用的功能,因为很多管理员并没有足够的时间实现对所有系统的重新安装。

查看原文(作者:Rick Vanover 译者:李哲贤来源:TechTarget中国)

追溯:虚拟机蔓延问题产生的根源及其影响

虚拟机易于创建,反应速度快,所消耗的硬件资源也非常有限,这必然会导致虚拟机的蔓延。当你需要对生产环境进行复制来测试一个新应用的部署时,你只需创建一个虚拟机即可,耗时仅仅几秒钟。但是,这项工作完成之后,那台虚拟机该如何处理?它可能会处于你物理基础设施的某一个硬盘上,很容易会被遗忘,但它还会继续消耗相应的存储和计算资源,却没有产生任何回报,这也就是虚拟机的蔓延问题。不幸的是,广大管理人员并没有意识到这一问题的存在。

创建一个虚拟机很容易,这往往会导致虚拟机在系统内的泛滥。如果把这些虚拟机都加起来,对你所在企业或机构而言不是一个小数目。Embotics发表的一份名为《详解虚拟机蔓延》的白皮书中介绍到,“在一个拥有150台虚拟机的环境中,会因为虚拟机的泛滥而浪费50000到15000美元的成本。”

事实上,虚拟机的泛滥是不可避免的。但问题的关键在于,管理人员会把过多的注意力放在一些独立系统的管理上,而忽略了整个IT环境的“健康”。此外,他们并没有意识到虚拟机蔓延这一问题的严重性。(《虚拟机蔓延如何抑制?》)

最为不幸的是,这已经形成了一种恶性循环。一旦关键关键任务完成之后,管理员们就有可能会对其管理任务进行重新排序,从而忽略一些边缘设备。他们会把更多的注意力放在仍在运行中的虚拟机上,而让那些旧的、不再使用的虚拟机陷入无人管理的局面。尽管说这样做可以减少他们的日常系统管理工作量,但旧的虚拟机仍然会消耗物理和财务资源。对于那些不再使用的虚拟机而言,即便是将其关闭,也或许还会有相应的软件许可、技术支持等成本产生。要知道,非生产性的计算资源和软件许可也会给企业带来很大的负担。

实际上,这种浪费状况很容易遭到恶化。管理人员提供的虚拟机数量经常会超出实际需求。不论面对什么业务需求和目的,他们提供的都是固定内存、存储和处理器核的虚拟机配置。此外,在进行快照备份时,他们也需要耗费过多的时间和存储资源来对多余的虚拟机进行保护。

(作者:Brian Proffit译者:王霆来源:TechTarget中国)

如何从根本上解决虚拟机蔓延问题?

要让虚拟机“退役”并对其所占用的物理和财政资源进行回收为什么会这么难?虚拟机创建起来很容易,却必须通过手工方式移除。管理人员总是面临着许多网络管理需求,手动删除虚拟机会占用他们大量的时间。即使是使用VMware vCenter这样的工具来管理虚拟机也会面临这一问题。(《数据中心虚拟机部署:从保守到激进》)

要专门成立一个小组来删除“退役”的虚拟机也会有很多问题,因为你很难确定虚拟机的状态。例如,要想确定一台虚拟机是否仍有使用价值就不是一件容易的事。其次,即使是安排人专门来从事这件事情,也需要有好的方案和流程来提供支持,来防止问题再度发生。相应的方案要包括具体的虚拟机创建、运维和“退役”规划。如果能将虚拟机的淘汰放进日常的虚拟机创建流程,虚拟机的蔓延问题就会好很多。但是,千万不要总是把精力放在虚拟机的“退役”上,通过控制虚拟机的创建率也能很好地缓解这一问题。因此,管理人员应该制定虚拟机的创建政策,来从源头上控制虚拟机的蔓延,而不是在虚拟机的“退役”上花太多的功夫。如果要通过手动的方式来对虚拟机进行管理,要确保所有的虚拟机用户都要意识到这些流程,并在参与过程中牢记这一问题。

多数虚拟机解决方案都缺乏自动化的流程,这也是导致虚拟机蔓延的根源。根据具体的业务需求,我们都是用模板或定制化的方法来手动创建虚拟机。如果能够通过网络对虚拟机进行自动发现和追踪,就可以很好地简化虚拟机的管理流程。(《虚拟架构难题:虚拟机扩展和虚拟机安全》)

例如,Embotics公司的V-Commander工具就可以以自动化的方式来对IT环境中的虚拟机进行定位和追踪,并提供相应的业务、技术和财务信息。此外,生命周期管理是V-Command的一个核心功能,他可以让你站在更高的角度对虚拟机进行管理。

与之相比,VMware正在对其vCenter Lifecycle Manager(LCM)应用进行大的更改,由此引发的问题是供应商计划如何对虚拟机蔓延问题进行管理。根据VMware的介绍,2010年9月1日的LCM版本将不再单独进行销售,对其的官方支持也会在2012年3月1日终止。

实际上,VMware正在致力于将LCM的功能集成到类似vCloud Center这样的云管理产品中。此外,也会在vCloud Center中加入LCM的管理和服务递交功能。在vCloud的框

架下,管理人员更多会将虚拟资源当做一种服务,而不是当做单独的虚拟机来进行管理,根据需求,并基于相应的管理政策来对这种服务进行供给。一旦这种服务变得没有必要了,他们就可以将其关闭,对于虚拟机而言也是这样。

此外,类似于vCloud Request Manager(年底推出)这样的虚拟机管理产品还提供了IaaS模式,这也可以从很大程度上解决虚拟机蔓延问题,尤其是对于那些大型企业用户而言。而对于那些小型企业用户而言,则应该用V-Commander这样的服务器级的自动化解决方案来对虚拟机蔓延进行控制。

从企业管理角度来看待虚拟机蔓延问题

很明显,要想避免虚拟机的蔓延问题,需要企业制定严格的维护措施和监控手段,或是采用一种高度自动化的工具。尽管说创建一台虚拟机很容易,但在虚拟机蔓延超出我们控制范围之前能够给予其足够的重视也很重要。因此,企业一定要制定合理的政策来应对这一问题。

虚拟机蔓延?使用服务器容量规划与生命周期管理

虚拟化并不是一蹴而就的,随着时间推移,虚拟化就会出现各种问题,就算看起来运行得很正常。

例如,虚拟机不受控制的增长就造成虚拟机蔓延,会逐步消耗来自服务器的剩余处理能力。虚拟机蔓延会降低其他虚拟机的性能,导致未知的崩溃,并阻止虚拟机从其他受影响的服务器进行正确的故障转移。给底层虚拟化平台升级或打补丁也会对性能和稳定性造成未知的结果。

因此,管理员必须积极主动地预防虚拟机蔓延,以及可能出现的其他问题。下面我们分享一些最佳实践。

虚拟化生命周期管理以及性能监控

虚拟化生命周期管理是有助于管理虚拟机的一种策略,确保只有授权的管理员能够创建所需的虚拟机,这些虚拟机能激活使用,并且最终能删除以释放计算资源给其他虚拟机。

性能监控能够根据有形因素计算资源利用率,比如网络带宽、磁盘I/O和CPU使用。追踪随着时间的推移,资源负载趋势能够标注出潜在的需要进行研究的故障点。几乎所有的性能监控工具都包括email/SNMP陷阱,当关键资源超出设置参数时会发生警报。识别资源使用里的瞬间警告转移能够较早发出警告,这对于快速做出决定是必要的,更能最小化产生环境的损失。

“在终端用户知道之前你应该发现问题,”First Flight Federal Credit Union首席运营官Todd Erickson说。

服务器容量规划与归档

正在进行的性能监控对于实际的服务器容量规划也很必要。通过观察趋势,管理员能对未来升级做出预测,以适应业务的长期增长。

“在虚拟环境里作的容量规划越多,你就会发现这不是物理设置,”IBusiness Network LLC技术服务经理Ty Hacker说。

服务器容量规划更好,花费也不贵,所以不过不做规划在达到危险级别时就会损失性能。

彻底预防虚拟化问题的最后一个元素是精确的、精心维护的存档。出现在虚拟设置里的大量细节非常容易忘记。所以要记录支持文档,确保你的修复、升级和提升进展顺利。

查看原文(作者:Stephen J. Bigelow译者:唐琼瑶来源:TechTarget中国)

如何制定服务器虚拟资源分配原则

一旦你完成了对数据中心各种服务器工作负载的归类,就需要考虑一下如何将其分配给主机了。如果一台主机服务器要运行20台虚拟机,那这些虚拟机就不能也不应该在同一时刻去竞争相同的资源。

为了尽可能地优化虚拟机的部署,你必须仔细对工作负载进行考分析,确认它们究竟需要哪些进程和资源,以及在什么时候需要。例如,如果你要在网络上运行Windows服务,就应该是这样的:

?域控制器在高峰时期往往需要网络和处理器资源,比如说在清晨或午饭后的时间。

?文件和打印服务器在非高峰需要时刻需要使用处理器和网络资源,比如说早晨十点左右或下午三四点左右。

?网络服务器往往需要网络资源,如果规划得当,应该保证有稳定的流量。

?SQL服务器和Exchange服务器在每天24小时内都需要有稳定的磁盘和处理器资源。

?企业应用通常都会有预定的资源需求。比如说,企业工资结算应用程序需要每两月或每两周运行一次。

?测试和研发系统在非工作时段还经常会被使用,或者说其工作负载变化既不规律。

?培训系统一般是在白天运行,但通常的资源需求不是很大。

不同工作负载的服务器资源需求对比

并不是所有的工作负载在任何时间都很忙。事实上,一些工作负载经常处于“停车”或“空载”状态,几乎很少运行。这就需要对其进行合理的规划——降低实际所运行的工作负载数量。

主机服务器工作负载分配

服务器工作负载在不同的时段会有不同的资源需求,这就需要你对其进行合理配置,使其不会在同一时段、在同一主机上去竞争同样的物理资源——CPU、RAM、网络或存储资

源。因此,你要尽可能多地配置各种虚拟工作负载,避免主机服务器承载过多的工作负载。这意味着一台主机服务器可以运行一个数据中心、一台网络基础设施服务器、一台文件服务器、一台或多台Web服务器、甚至或许是一套企业应用。当然了,关键是要对那些在不同时段拥有不同资源需求的工作负载给与足够的关注。

查看原文(作者:Stephen J. Bigelow译者:王霆来源:TechTarget中国)

企业系统管理:后虚拟化时代的数据中心利器

数据中心越来越庞大,其原因主要是如今的应用程序、服务和用户比以往任何时候都多。与此同时,管理员也要更快速地提供IT资源——尤其是虚拟资源,并确保这些资源可随用户需求做出相应改变。

上述问题根本无法通过手工处理解决,因此数据中心都采用某种形式的管理制度来深入了解现状、提高自动化程度并采用更智能、成本更低的方案。但是,系统管理的形势因为工具的演变正在发生变化,并且变得更加重要。下面让我们考虑一下几个正在变化的趋势。

系统管理的作用

系统管理采用哪种方式由多种因素决定,但最重要的因素也许是越来越流行的服务器虚拟化,这无疑增加了系统管理工具自如地进行自动化管理的复杂度。

美国Thomson-Reuters公司的高级网络服务管理员Ian Parker表示,“对我们而言,服务器数量的激增,是经济增长和虚拟化造成的。虚拟化就意味着需要更多的服务器,而系统管理也会变得更加重要。”

事实上,最近https://www.360docs.net/doc/6615623516.html,对数据中心进行的一项调查显示,超过51%的IT专业人士希望在未来的12个月内,通过利用系统管理软件实现手工操作过程的自动化。22%的人士希望通过利用工具来加快虚拟化实现。

但推动系统管理工具发展的动力更为强大。使用工具可以让IT工作人员腾出更多时间专注于更重要的项目,超过45%的受访者希望通过系统管理工具来提高员工的生产效率。超过24%的受访者希望通过工具来辅助跟踪系统的性能问题(如故障排除),约17%的受访者希望通过工具解决系统配置的挑战性问题。

鉴于自动化的重要性,微软最近收购Opalis的举措毫无疑问将增强微软系统中心工具的自动化功能。

vmvare虚拟化平台巡检细则和方法

vmvare虚拟化平台巡检细则和方法 1.1 检测多个主机之间是否有相同的软件版本 通过图形化方法: 为了获得ESXi主机的版本信 息,使用VS Client,点击给定ESXi 主机的配置标签。 为了获得VC的版本信息,通过 使用VS Client,在主菜单上选择帮助 正常异常 -〉关于虚拟化架构选项 ESXi 5.0.0 1311175 命令行方法: 以root权限登陆ESXi 主机,在 命令行提示符下输入“vmware –v” 1.2 检查网络和存储配置信息是否一致 图形化方法: 正常异常 在VS Client里面, 导航到

Configuration -> Networking and Network Adapters 检测: 虚拟交换机数量 虚拟交换机命名 物理网卡数量 物理网卡的速度/全双 工 端口组类型 是否有冗余 命令行方法: 在命令行提 示符下键入 “esxcfg –vswitch –l” 列出多个虚拟交换机和端口组信息 在命令行提示符下键入 “esxcfg -nics –l” 列出多个物理网卡,网卡的速度,制造商,连接状态 1.3 检查服务器配置信息是否相同,是否有不同的CPU 类型

图形化方法: 在VS Client里面, 导航到每个主机的Configuration -> Processors 检测: Cpu型号 处理器速度 处理器数量 每个物理处理器上是否有多核核数是否相同 超线程是否开启 逻辑cpu数量正常异常 1.4 是否配置NTP时钟同步服务 图形化方法: 在VS Client中, 导航到Configuration -> Security Profile 并且观察NTP Client 选择是否开启了外出连接选项。正常异常

浪潮模块化数据中心方案 v2.0 第二版

浪潮模块化数据中心方案 2013-8-12 浪潮集团互联网行业部

目录 一项目背景: .................................................. 错误!未定义书签。 1.模块化数据中心............................................. 错误!未定义书签。 2.网易、上海数据港、浪潮三方角色............................. 错误!未定义书签。 3.项目预期 .................................................. 错误!未定义书签。二方案介绍: .................................................. 错误!未定义书签。 1.模块布局 .................................................. 错误!未定义书签。 2.气流遏制子系统............................................. 错误!未定义书签。 3.供配电子系统 .............................................. 错误!未定义书签。 4.制冷子系统 ................................................ 错误!未定义书签。 5.机柜及布线子系统........................................... 错误!未定义书签。 6.监控子系统 ................................................ 错误!未定义书签。三项目管理 .................................................... 错误!未定义书签。 1.关系人及各方职责........................................... 错误!未定义书签。 2.项目范围 .................................................. 错误!未定义书签。 3.项目周期及里程碑计划....................................... 错误!未定义书签。 4.沟通机制及工作方法......................................... 错误!未定义书签。 5.变更管理 .................................................. 错误!未定义书签。 6.项目交付物 ................................................ 错误!未定义书签。 7.验收及结束标志............................................. 错误!未定义书签。四附件 ........................................................ 错误!未定义书签。

数据中心运维管理框架

6.2数据中心运维管理框架 6.2.1.运维管理框架4Ps概述 所谓数据中心运维管理框架是指管理一个数据中心所使用的方法与手段的总称。那么,应该用什么样的方法与手段来管理数据中心呢?在此,信息技术基础架构库(InformationTechnologyInfrastructureLibrary,ITIL)给出了一个比较好的管理框架,即所谓的4Ps。数据中心运维管理框架如图6-3所示。 图6-3数据中心运维管理框架 1.人员 人员是数据中心运维管理的基础,也是数据中心运维管理的核心。一个好的数据中心运维管理框架,少不了合适的技术和管理人员。从前面数据中心运维管理概述中,可以看到数据中心所需要管理的对象,包括基础设施、IT设备、系统与数据、管理工具和人员等。只有具备相应知识背景与管理经验的人,才能有效地整合上述资源,为客户提供符合质量与合同要求的IT服务。因此,在考虑建设数据中心运维管理框架时,必须要考虑到:如何建立起一套科学合理的包括选、用、培养、考核及解聘的人员管理生命周期;如何通过合理的组织架构设计与人员分工,最大限度地发挥个人的主观能动性,为组织目标贡献力量等。 2.流程

流程是数据中心运维管理质量的保证。作为客户IT服务的物理载体,数据中心存在的目的就是保证服务可以按质、按量地提供。服务与产品有着许多的不同,其中最核心的不同在于服务本身是看不见、摸不着的,但又是能通过服务商与客户的互动为客户所感受到的。为确保最终提供给客户的服务是符合服务合同的要求,数据中心需要把现在的管理工作抽象成不同的管理流程,并把流程之间的关系、流程的角色、流程的触发点、流程的输入与输出等进行详细定义。通过这种流程的建立,一方面可以使数据中心的人员能够对工作有一个统一的认识,更重要的是通过这些服务工作的流程化使得整个服务提供过程可被监控、管理,形成真正意义上的“IT服务车间”。 3.产品 产品是数据中心运维管理的加速器。数据中心运维管理涉及的对象庞杂,且重复性工作较多。若完全依靠人工去完成这些工作,一方面对人员的技能与数量有较高的要求,另一方面在工作质量的保证方面也存在风险。为此,越来越多的数据中心在开展运维管理工作时使用大量工具,目的是通过这些工具的部署取代一些监控、操作、配置文件、工作流管理等大量重复性工作,最终实现提升运维水平、降低运维风险、减少运维成本的目的。 4.服务商 服务商是数据中心运维管理的支持者。作为专业化的数据中心运维管理,有效地整合数据中心管理对象,并最终为用户提供专业化的服务才是数据中心服务提供者的核心价值所在。而且,数据中心运维管理中涉及了太多不同种类的设备,数据中心也不可能把所有的技术与管理工作独自承担。聘用一批既懂变压器、发电机、UPS,又了解空调、消防、防火设备,同时还精通IT相关软硬件的人员,对于任何一个企业或机构均是极大的成本支出。所以,数据中心需要与许多设备供应和服务提供商建立良好的战略合作关系。 6.2.2.运维管理的人员要求 如前所述,人员既是数据中心运维管理的基础,也是数据中心运维管理的核心。一个数据中心组建团队时应注意什么呢?以下重点就人员技能、人员分工与人员管理三个方面谈一下数据中心运维管理方面的人员要求。 1.人员技能

数据中心信息安全管理及管控要求

数据中心信息安全管理及管控要求 2012-02-24 11:29博客康楠 随着在世界范围内,信息化水平的不断发展,数据中心的信息安全逐渐成为人们关注的焦点,世界范围内的各个机构、组织、个人都在探寻如何保障信息安全的问题。英国、美国、挪威、瑞典、芬兰、澳大利亚等国均制定了有关信息安全的本国标准,国际标准化组织(ISO)也发布了ISO17799、ISO13335、ISO15408等与信息安全相关的国际标准及技术报告。目前,在信息安全管理方面,英国标准ISO27000:2005已经成为世界上应用最广泛与典型的信息安全管理标准,它是在BSI/DISC的BDD/2信息安全管理委员会指导下制定完成。 ISO27001标准于1993年由英国贸易工业部立项,于1995年英国首次出版BS 7799-1:1995《信息安全管理实施细则》,它提供了一套综合的、由信息安全最佳惯例组成的实施规则,其目的是作为确定工商业信息系统在大多数情况所需控制范围的唯一参考基准,并且适用于大、中、小组织。1998年英国公布标准的第二部分《信息安全管理体系规范》,它规定信息安全管理体系要求与信息安全控制要求,它是一个组织的全面或部分信息安全管理体系评估的基础,它可以作为一个正式认证方案的根据。ISO27000-1与ISO27000-2经过修订于1999年重新予以发布,1999版考虑了信息处理技术,尤其是在网络和通信领域应用的近期发展,同时还非常强调了商务涉及的信息安全及信息安全的责任。2000年12月, ISO27000-1:1999《信息安全管理实施细则》通过了国际标准化组织ISO的认可,正式成为国际标准ISO/IEC17799-1:2000《信息技术-信息安全管理实施细则》。2002年9月5日,ISO27000-2:2002草案经过广泛的讨论之后,终于发布成为正式标准,同时ISO27000-2:1999被废止。现在,ISO27000:2005标准已得到了很多国家的认可,是国际上具有代表性的信息安全管理体系标准。许多国家的政府机构、银行、证券、保险公司、电信运营商、网络公司及许多跨国公司已采用了此标准对信息安全进行系统的管理,数据中心(IDC)应逐步建立并完善标准化的信息安全管理体系。 一、数据中心信息安全管理总体要求 1、信息安全管理架构与人员能力要求 1.1信息安全管理架构 IDC在当前管理组织架构基础上,建立信息安全管理委员会,涵盖信息安全管理、应急响应、审计、技术实施等不同职责,并保证职责清晰与分离,并形成文件。 1.2人员能力 具备标准化信息安全管理体系内部审核员、CISP(Certified Information Security Professional,国家注册信息安全专家)等相关资质人员。5星级IDC至少应具备一名合格的标准化信息安全管理内部审核员、一名标准化主任审核员。4星级IDC至少应至少具备一名合格的标准化信息安全管理内部审核员 2、信息安全管理体系文件要求,根据IDC业务目标与当前实际情况,建立完善而分层次的IDC信息安全管理体系及相应的文档,包含但不限于如下方面: 2.1信息安全管理体系方针文件

虚拟化平台管理规范标准

虚拟化资源申请及管理规 一、总体要求 1、虚拟机按需创建,做到专机专用。关键业务虚拟机、一般业务虚拟机和测试用虚拟机应分开,停用的虚拟机在规定时限应及时删除。 2、创建后的虚拟机及时登记并纳入服务器统一管理,每开通一个虚拟机要及时把虚拟机配置,用户名,密码,主机地址纳入管理库。 3、不要随意在公共场所安装虚拟机客户端,进行登录虚拟机操作。不得向他人随意泄露vcenter登陆密码。 二、虚拟机创建 1、虚拟机命名:使用[IP地址后两位_虚拟机用途_操作系统简写]的格式,如“1.42_SJBS_WIN2003”、“6.32_BPMIHS2_CENTOS6”。 2、虚拟机磁盘配置:为实现DRS和HA,虚拟机安装在共享存储上,不能使用服务器自带存储。每个LUN上可布置15-20个一般业务的虚拟机,用于生产业务的LUN上虚拟机个数最好在10个以下。对于oracle、ms sql server等高io的应用,建议使用裸设备映射。每个LUN的空间使用率不能高于80%。所有的虚拟机磁盘文件应放在同一文件夹下,以方便管理。用于生产业务的虚拟机,虚拟磁盘采用厚置备置零的格式,对于测试的虚拟机,虚拟磁盘采用THIN PROVISION格式。一般业务的虚拟机则根据存储的空间大小来选择合

适的格式。所有虚拟机初始硬盘大小为80G,不够时再对硬盘扩容。原则上不提倡使用大于2T的超大存储硬盘,这样在做快照或数据备份时会出现很多问题。如果确有超过2T的存储空间需求,建议为这台虚拟机分配多个LUN,用户可在操作系统层面实现逻辑卷的合并来满足需求。 3、CPU配置:根据虚拟机业务量分配CPU,建议配置两个CPU,总CPU核数不能不能超过32个。原则上是安装完操作系统后就不再对虚拟机cpu作更改,否则会影响到系统的稳定性。如果虚拟机运行一段时间发现cpu资源不足,可向信息发展部提出申请迁移到性能更强的虚拟主机上运行或增加cpu的预留值和共享cpu的比例来提高性能。 4、存分配:虚拟化环境中存资源很宝贵,为了合理利用存资源及提高存利用率,存最低分配为2G,最高不超过32G,所有虚拟机存总使用量不能超过服务器所配存的80%。虚拟机运行一段时间后发现存资源长期不足可再次申请增加存。如果虚拟机申请大量存但是长期处于低使用率状态,信息发展部可根据统计情况回收多余的存。 5、网卡配置:如无特殊需求,只配置一个千兆虚拟网卡,虚拟交换机采用标准千兆交换机。 6、虚拟机操作系统安装:目前提供Windows server 2003 64位、windows server 2008 R2 64位、Centos 6.4 64位。对于windows 系统,系统分区为50G。linux系统,/boot分区200M,swap分区和存大小一样,/为20G,剩余大小设置为数据分区。

云计算数据中心的运维管理

云计算数据中心的运维管理 现代信息中心已成为人们日常生活中不可缺少的部分,因此信息中心机房设备的运行正常与否就非常关键。在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。这就给运维是否到位提出了严格要求。 1 运维在机房中的地位 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理是,为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统地计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负合规性、可用性、经济性、服务性等四大目标。 在信息中心机房配备有运维人员,但大都是“全才”的,即什么都管,尤其是对供电系统大都是由主机运维的人员代管。当电源系统出故障时,此代管人员一问三不知,甚至连配电柜门都没开过。这实际上就是把机房的运维放在了一个次要的地位。 当然也有的地方有所分工,看似重视,实际上也没得到真正地重视。比如说机房设备长时间一直运行正常,这时如果运维人员提出要增添运维方面的测量设备,有的领导就认为多余,很难得到批准。但他不知道机房设备所以长时间一直运行正常,正是由于这些运维人员的细心维护和努力保养所获得的。并不是这些人员每天闲着无事可干,他们的这些工作一般是领导看不见的。比如同样多款的UPS在同样的环境条件下,在某卫星地面站就极少出故障,而在同系统别的地方机房同一家同规格的机器就故障连连。原来是前者的运维人员每天都在细心观察和分析机器面板LCD上显示的数据,一旦发现异常苗头及时采取措施;而后者只限于每天抄写这些数据就算完成任务,使异常苗头不断积累,以致于导致故障。比如断路器在额定闭合状态发现触点处温度高了,就要检查是不是电流过大到超过额定值,如果不是就要检查触点接触是否牢靠,是否需要再紧固一下。这样一来,故障隐患就排除了。如果一直不管不问久而久之就会导致跳闸而使系统崩溃。这都是一些小的动作,都是在巡查中顺便做的事情。所以同是运维人员在巡查,但前者在做事而后者只是走马观花。这就是数据中心可靠与不可靠的区别。 运维人员就像幼儿园的保育员和老师。孩子交到幼儿园后,起主要作用的就是保育员和老师,这时保育员和老师就是主体。机器就好比是幼儿园的孩子,孩子是否健康成长,机器是否正常运行,除去本身的健康(可靠性质量)状况外,那就是运维人员的责任了。由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性,除基于ITIL(IT 基础设施库)的常规数据中心运维管理理念之外,以下运维管理方面的内容,需要我们加以重点关注。 2 云计算数据中心运维管理的要点 (1)理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象一般可分成5大类: ①机房环境基础设施 这里主要指的是为保障数据中心所管理的设备正常运行所必需的网络通信、供配电系统、环境系统、消防系统和安保系统等。这部分设备对于用户来说几乎是透明的,比如大多数用

(完整版)虚拟化平台日常管理和应急处理规范1.0

VMware虚拟化平台服务器 日常维护和应急处理规范 1 目的 为提高部门处理VMware虚拟化服务器故障的能力,形成科学、有效、反应迅速的日常管理流程和应急处理机制,确保虚拟化平台的安全和稳定运行,最大限度地减小服务器故障对生产的影响,降低业务中断风险,特制定本规范。 2 适用范围 本规范适用于公司局域网中所有提供VMware虚拟化平台服务的服务器管理,应对发生和可能发生的故障。 3 规范内容 虚拟化平台服务器运维和应急处理应包括风险评估,检测体系和应急处理三个环节,合理有效的执行控制将防止故障影响扩大。 3.1 故障分类 虚拟化平台故障包括服务器硬件和虚拟化软件的故障;自然灾害(水、火、电等)造成的物理破坏;电脑病毒等恶意代码危害;人为误操作造成的损害等。 3.2 应急准备 部门责任人员明确职责和管理范围,根据实际情况,安排应急值班,确保到岗到人,联络畅通,处理及时准确。 3.3 具体措施 (1)建立安全、可靠、稳定运行的机房环境,防火、防雷电、

防水、防静电、防尘;建立备份电源系统。 (2)虚拟化平台服务器应采用可靠、稳定、兼容性硬件,落实责任管理机制,遵守安全操作规范;对虚拟机和管理服务器进行定时备份;采用有效的虚拟化监控工具,及时发现问题和日报告。 4 故障处理规范 4.1 机房停电 接到停电通知后,相关人员应及时部署应对具体措施,启动备用电源,保证服务器正常运行。 4.2 硬件维护 (1)平台服务器出现硬件告警需要停机维护,服务器责任人应立即通知相关人员,将业务虚机迁移到集群中其他服务器主机上,再将故障服务器切换至维护模式并从HA集群中移除,负责陪同硬件厂家现场更换至成功恢复。 (2)若服务器硬件24小时内无法恢复,服务器责任人需书面报告原因并立即通知业务管理人员进行数据应急备份,防止灾难扩大。 (3)若虚拟化存储硬件出现告警,第一目击人应立即通知存储管理员,并上报主管领导,存储管理员应在报告1小时内联系厂家到场处理,处理完成后因报告原因,找到解决方法;并立即对数据做完整性检查,消除重复发生隐患。 4.3 虚拟化平台故障 (1)虚拟化服务器应保证双机群集配置,并同时配置好一套备用服务器群集,随时待命。

云计算数据中心的运维管理-培训课件

望采纳 云计算数据中心的运维管理 现代信息中心已成为人们日常生活中不可缺少的部分,因此信息中心机房设备的运行正常与否就非常关键。在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。这就给运维是否到位提出了严格要求。 1 运维在机房中的地位 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理是,为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统地计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负合规性、可用性、经济性、服务性等四大目标。 在信息中心机房配备有运维人员,但大都是“全才”的,即什么都管,尤其是对供电系统大都是由主机运维的人员代管。当电源系统出故障时,此代管人员一问三不知,甚至连配电柜门都没开过。这实际上就是把机房的运维放在了一个次要的地位。 当然也有的地方有所分工,看似重视,实际上也没得到真正地重视。比如说机房设备长时间一直运行正常,这时如果运维人员提出要增添运维方面的测量设备,有的领导就认为多余,很难得到批准。但他不知道机房设备所以长时间一直运行正常,正是由于这些运维人员的细心维护和努力保养所获得的。并不是这些人员每天闲着无事可干,他们的这些工作一般是领导看不见的。比如同样多款的UPS在同样的环境条件下,在某卫星地面站就极少出故障,而在同系统别的地方机房同一家同规格的机器就故障连连。原来是前者的运维人员每天都在细心观察和分析机器面板LCD上显示的数据,一旦发现异常苗头及时采取措施;而后者只限于每天抄写这些数据就算完成任务,使异常苗头不断积累,以致于导致故障。比如断路器在额定闭合状态发现触点处温度高了,就要检查是不是电流过大到超过额定值,如果不是就要检查触点接触是否牢靠,是否需要再紧固一下。这样一来,故障隐患就排除了。如果一直不管不问久而久之就会导致跳闸而使系统崩溃。这都是一些小的动作,都是在巡查中顺便做的事情。所以同是运维人员在巡查,但前者在做事而后者只是走马观花。这就是数据中心可靠与不可靠的区别。 运维人员就像幼儿园的保育员和老师。孩子交到幼儿园后,起主要作用的就是保育员和老师,这时保育员和老师就是主体。机器就好比是幼儿园的孩子,孩子是否健康成长,机器是否正常运行,除去本身的健康(可靠性质量)状况外,那就是运维人员的责任了。由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性,除基于ITIL(IT基础设施库)的常规数据中心运维管理理念之外,以下运维管理方面的内容,需要我们加以重点关注。 2 云计算数据中心运维管理的要点 (1)理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象一般可分成5大类: ①机房环境基础设施 这里主要指的是为保障数据中心所管理的设备正常运行所必需的网络通信、供配电系统、环境系统、消防系统和安保系统等。这部分设备对于用户来说几乎是透明的,比如大多数用户都不会忽略数据中心的供电和制冷。因为这类设备如果发生意外,对依托于该基础设施的应用来说是致命的。 ②数据中心所应用的各种设备

数据中心安全管理制度

数据中心安全管理制度 ST-YW-ZD-1.3

目录 一、适用范围 (3) 二、门禁安全管理 (3) 三、机房保安制度 (3) 四、机房消防制度 (4) 五、视频监控管理 (5)

一、适用范围 计算数据中心 二、门禁安全管理 1)机房门禁卡管理系统由专人管理,门禁卡应严格控制,统一调配 2)门禁卡按照一人一卡的原则配置,设置确定的权限,不得借给他人使用 3)门禁必须设有紧急开关按钮,出现紧急情况可以通过击碎紧急按钮玻璃逃生第四条 4)平时不使用的机房门必须从机房内侧反锁,门上用十字封条封死; 5)门禁系统需与消防联动,当消防告警,门禁系统自动失效,机房内人员可以逃生 6)门禁卡必须设置备用卡,由专人保管,在紧急事件中使用 7)门禁系统实行分级授权管理制度,授权相应办公人员的进入级别,并可限制其进入的 区 8)员工进入数据中心及相应办公区域必须使用门禁感应卡 9)门禁感应卡的持有人有责任保管好自己的感应卡,若有遗失,需立即通知管理人员禁 止该丢失卡的使用权限,持卡人在使用中发现问题应立即联系管理人员维修,持卡人若离职或调动,管理人员需将感应卡收回或重新设定使用权限 10)申请办理门禁卡,设定使用权限或者其他人员因遗失申请补办门禁卡,需报机房服务 部批准并发卡,由相关人员设置权限,原则上不为客户提供门禁卡 11)持卡人应刷卡出入权限规定的机房,确保门禁系统的记录完整、真实;相关单位新增 门禁卡或变更门禁卡权限,需专门提出书面申请填写《数据中心门禁权限申请表》,经相关领导申批通过后,由门禁系统管理人员负责核实并制卡 12)数据中心所有门需常闭,即进出后随手关门 三、机房保安制度 1)各岗位保安应着制服,保持仪容整洁、精神状态佳、态度和蔼、认真负责 2)坚守岗位,不擅离职守,因事离开岗位时必须有人代班,无关人员不得进入保安室 3)值班保安严禁睡觉、看小杂志、酗酒、听收音机等做与工作无关的事,监守自盗 4)不定时巡察机房重要区域的安全,防止意外事件的发生 5)发生民事纠纷,应及时劝阻和制止,并及时报告保安队长或综合管理部处理 6)接班后,警具、警械应随身携带,不得交于无关人员玩耍

虚拟化平台管理制度-模板

虚拟化平台应用管理规定 *变化状态:A——增加,M——修改,D——删除

目录 1总则 (3) 1.1目的 (3) 1.2适用范围 (3) 1.3术语和定义 (3) 1.4管理职责 (3) 2管理流程 (5) 2.1虚拟桌面申请 (5) 2.2虚拟桌面配置 (5) 2.3开发环境配置 (5) 2.4开发与配置库交互 (5) 2.5售后项目管理流程 (5) 2.6管理要求 (6)

1总则 1.1目的 为进一步提高部门产品及项目文档的安全性,深化和完善部门项目管理体系,解决目前项目最新代码与配置库分离,各项目系统配置环境复杂,控件不统一,项目售后问题解决缺乏跟踪,以及不能有效的进行测试等一系列问题,部门引进了虚拟化技术。为能充分利用该虚拟化平台解决我们现存的问题,特制定本规定。 1.2适用范围 本规定适用于各市场项目。 1.3术语和定义 1、虚拟化:指计算机元件在虚拟的基础上而不是真实的基础上运行。虚拟化技术可以扩大硬件 的容量,简化软件的重新配置过程。CPU的虚拟化技术可以单CPU模拟多CPU并行,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。我们是采用VMVARE虚拟化软件来实现虚拟服务器运行的。1.4管理职责

2管理流程 2.1虚拟桌面申请 ?项目启动后,还没有虚拟桌面的成员要及时根据所负责任务的要求,填写《虚拟桌面申请表》(附件1),明确项目名称、系统环境、开发语言等。 ?《虚拟桌面申请表》填写完毕后提交虚拟化管理员。 2.2虚拟桌面配置 ?虚拟化管理员收到申请人提交的《虚拟桌面申请表》后,要与申请人进行信息的核实,如无问题则提要到研发部,由研发部负责人对申请信息进行审核,审核通过后虚拟化工程师根据 《虚拟桌面申请表》中的配置要求为申请人搭建相应的虚拟桌面。 ?虚拟化工程师分配完虚拟桌面后,并创建用户,分配密码,并发送邮件给虚拟桌面申请人,申请人收到通知后及时登录自己的虚拟桌面修改密码,并检查核实自己的环境配置是否满足 项目需要,如有问题及时和虚拟化工程师联系。 2.3开发环境配置 ?成功登录自己的虚拟桌面后,及时测试开发环境,为项目开发工作做好准备工作 ?部门建立了两个服务于市场项目的数据库服务器,各项目根据情况选择项目数据库搭建位置:IP地址:172.16.12.XXX IP地址:172.16.12.XXX 2.4开发与配置库交互 ?为实现开发代码与配置库的实时交互,在虚拟平台上搭建了配置库服务器: 配置库服务器IP地址:172.16.12XXX ?在各自虚拟桌面上开发的代码每天工作结束后及时提交配置库,保证配置库代码的有效性和一致性。 ?代码提交配置库后,由专人从配置库上获取代码进行编译,编译通过后将发布程序获取到本地,再安装到客户现场。 2.5售后项目管理流程 ?项目验收后,以该项目的某个虚拟桌面为蓝本,重新复制一个虚拟桌面作为该项目的售后虚

数据中心机房相关管理人员要求及制度

为了能够高效的进行机房管理,机房管理人员应具有一定的技术能力和基本的设备维护经验。 机房管理人员的基本岗位职责如下: 1、负责机房设备的日常管理,做好日常巡检工作,包括配电、空调、消防等设施以及网络设备、服务器、存储等设备的检查工作; 2、机房以及部门所属各种资产的管理,做好设备清点、分类、统计、标示等工作; 3、负责安排机房设备维修工作,协调相关设备维修人员进行维修,安排好相关维修工作; 4、对机房各类设备的运行情况进行分析,制定预防和常用方案。 5、对机房各类设备上所运行的系统、服务进行管理和配置,满足办公部门的IT服务需求。 相关技术能力和经验要求如下: 1、计算机及相关专业,本科及以上学历;两年以上相关工作经验,最好有机房管理经验者。 2、熟悉winsever、linux等操作系统的硬件维护、网络和服务配置。 3、熟悉VM和相关虚拟化技术; 4、熟悉Oracle数据库; 5、熟悉存储技术,熟悉存储光纤交换机的配置; 6、熟悉H3C核心设备及接入网络设备的基本配置和命令; 注:以上技术能力和经验并不要求某一管理人员全部具备或精通,各个机房管理人员技术能力可各有侧重,互补配合进行机房管理。 为了使机房日常维护工作制度化、规范化,对于数据机房的管理,要求制定以下机房管理维护制度(参考),以下重要制度应上墙: 《机房现场管理制度》 《机房值班制度》 《机房突发事件应急预案》 《机房交接班制度》 《外来人员操作管理制度》

《机房现场管理制度》参考 一、 机房维护人员应注意监控设备运行情况,发现故障及时处理,对于重大故障,在对故障进行处理的同时要按传报流程向上汇报。 二、 机房维护人员应定时对机房环境进行巡检,并根据表格做好相应记录;机房内温度应保持在23±3℃,相对湿度在40%~60%,机房照明应有应急备用。如遇到通信保障期间、电源变化、气候恶劣等情况时,应加强巡回检查。 三、 机房维护人员应对出入机房人员身份进行确认,不允许无关人员进入机房,对于得到主管部门同意进入机房的外来人员,机房维护人员应督促其在《机房出入登记簿》上登记,并督促其遵守机房各项规章制度。外来人员进入机房工作,机房维护人员应要求其出示工单或者上级部门通知。 四、 定期检查机房各消防设备情况,如消防设备有异常情况,需及时向上级汇报。 五、 机房内非特殊需要,严禁使用明火,要动用明火必须得到主管领导和上级安全部门的同意。 六、 机房内各种图纸资料、文件、工具仪表未经允许不准擅自带出机房,使用后归还原处。 七、 机房内系统的网络拓扑图和各设备所配置的资料均属于保密范围,未经上级部门同意,外来人员不得查阅、复制。 八、机房内严禁在终端和PC机上运行游戏程序及其他与工作无关的程序。

模块化机房设计方案

数据中心建设方案建议书 2016 年08月

目录 1.概述 (5) 1.1.建设原则 (5) 1.2.编制依据 (6) 2.建设方案 (7) 2.1.平面布局方案 (7) 2.1.1建设原则 (7) 2.1.2平面布局说明 (7) 2.2.模块化机房 (9) 2.2.1概述 (9) 2.2.2模块总成 (10) 2.2.3模块化机房的特点和优势 (10) 2.3.装修建设方案 (11) 2.3.1建设原则 (11) 2.3.2机房区装饰材料的选取 (12) 2.3.3机房区吊顶 (12) 2.3.4机房区地面 (13) 2.3.5机房区墙、柱面 (14) 2.3.6机房区门窗 (15) 2.3.7电磁屏蔽、防静电设计 (15) 2.3.8噪声及振动处理 (16) 2.4.供配电建设方案 (16) 2.4.1建设原则 (16)

2.4.3建设方案 (18) 2.4.4机房防雷接地 (22) 2.4.5主要部署的部件 (24) 2.4.6一体化配电柜方案 (26) 2.5.制冷建设方案 (28) 2.5.1建设原则 (28) 2.5.2机房精密空调系统 (28) 2.5.3空调负荷计算 (30) 2.5.4气流组织形式 (31) 2.6.机柜及密闭冷通道系统 (32) 2.6.1概述 (32) 2.6.2设备机柜 (32) 2.6.3密封冷通道 (34) 2.7.综合布线建设方案 (36) 2.7.1布线系统主要标准 (36) 2.7.2机房布线系统设计 (36) 2.7.3数据中心网络布线拓扑结构 (40) 主干布线系统构成 (41) 2.7.4布线方案说明 (41) 2.8.消防建设方案 (43) 2.9.管理系统建设方案(根据需求是否选用) (43) 2.9.1概述 (43) 2.9.2系统拓扑结构 (43) 2.9.3设备集中统一管理 (44)

2、数据中心工作人员岗位职责

数据中心工作人员岗位职责 一、数据中心工作人员全面负责数据中心的日常使用、安全、清扫和管理等工作;负责网络、软件、设备的管理和维护。 二、数据中心工作人员应按照相关规定,严格履行职责,应加强日常学习和交流,及时掌握网络建设和管理最新技术,加以运用,确保操作水平和技能逐步提高。 三、数据中心工作人员应熟练掌握该数据中心各种设备的技术参数、性能指示和使用注意事项,应全面了解和掌握各系统设备的连接布线方式和易出现问题的重要环节,出现问题及时解决。 四、数据中心工作人员在使用各系统设备的过程中,应严格按照设备使用说明书和操作规程,操作各种设备,不得随意损坏设备,确保不发生因操作失误造成设备损坏的事件。 五、数据中心工作人员应强化网络日常建设与管理,定期检修和维护各种设备、网络信息资源等,确保网络正常运行。 六、数据中心工作人员应加强各系统设备的日常管理,不得随意变更、私接或挪用各种设备,如因工作需要必须变更和使用的,应事前请示经理同意后,方可实施。 七、数据中心工作人员应强化网络安全管理,按照相关规定,设定密码和各种权限,并要牢记;应定期查杀网络病毒、木马,以及做好防黑客攻击等工作,以确保网络安全运行;有权利阻止无关人员进入,对进出数据中心的人员或设备要实时登记,确保数据中心设施设备安

全。 八、数据中心工作人员应妥善保管数据中心内各种设备的使用说明书、操作规程,以及设备相关的软、硬件设备等,确保出现问题能及时检修。 九、数据中心工作人员应加强数据中心日常清洁工作,确保地面、操作台、各种设备表面日常清洁无灰尘,并做好设备防尘、防静电及室内恒温等工作;禁止在数据中心内吸烟、使用设备以外电器等。 十、数据中心工作人员有义务对各科室网络和计算机等设备进行维修和维护,并及时对各科室提出的问题给予答复,确保全局网络正常运行。

vmware vsphere虚拟化平台运维管理守则

VMware虚拟化平台 运维手册

文档编辑记录 版本记录 术语和缩写 为了方便阅读,特将文中提及的术语及缩写列示如下: 注意事项 本文中所有内容均属XX公司和xx公司的商业秘密。未经允许,不得作任何形式的复制和传播。

目录 2.8克隆虚拟机 ........................................................................................................ 错误!未指定书签。 1.概述 1.1目的 本手册针对VMware虚拟化平台提供日常维护操作的指导。 1.2现状描述 本项目由28台物理主机和一台VC组成,另部署一套VCOPS和VDPA。 1.2.1软件版本 物理主机:VMware-ESXi-5.5.0 Vcenter:VMware-vCenter-Server-Appliance-5.5.0 Vcops:

Vdpa: 1.2.2用户名及密码 2.管理虚拟机 1.3登录vCenterserver 登录vCenterServer管理该平台有2种方法: 1、vSphereClient: 远程桌面登录跳板机:运行—>mstsc打开远程桌面 进入远程桌面后打开vsphereclient输入IP地址 图2.1.1vSphereClient登录 2、WebClient: 登录vCenter 图2.1.2WebClient登录 1.4新建虚拟机 在VMwarevSphere虚拟化平台上新建虚拟机的操作如下: 1、在主机或集群上点击右键,选择“新建虚拟机”,进入新建虚拟机向导, 选择“自定义”。 图2.2.1新建虚拟机 2、点击下一步,进入名称和位置窗口。 图2.2.2名称和位置 3、点击下一步,选择资源池。 图2.2.3资源池 4、点击下一步,选择虚拟机放置的存储器,请选择共享存储。 图2.2.4(共享)存储 5、点击下一步,选择虚拟机版本,默认选择最高版本。 图2.2.5虚拟机版本 6、点击下一步,根据需要的操作系统来选择虚拟机操作系统及版本。 图2.2.6虚拟机操作系统 7、点击下一步,选择该虚拟机CPU插槽数及每个插槽内核数。 图2.2.7CPU个数 8、点击下一步,按照具体需求为该虚拟机分配内存。 图2.2.8内存

数据中心运维操作标准及流程

数据中心运维操作标准及流程 郑州向心力通信技术股份有限公司 二零一八年

1 机房运维管理前期准备 1.1 管理目标 机房基础设施运维团队应与业主管理层、IT部门、相关业务部门共同讨论确定运维管理目标。制定目标时,应综合考虑机房所支持的应用的可用性要求、机房基础设施设施的等级、容量等因素。目标宜包括可用性目标、能效目标、可以用服务等级协议(SLA)的形式呈现。不同应用的可用性目标的机房,可设定不同等级的机房基础设施的运维管理目标。 1.2 参与数据中心建设过程 机房运维团队应充分了解自己将要管理的场地基础设施。对于新建机房,应尽早参与机房基础设施的建设过程,以便将运维阶段的需求在规划、设计、建造、安装和调试等过程中得到充分的考虑;同时为后期做好运维工作打下基础。 1.2.1 应参与规划设计 机房的规划设计是一个谨慎和严谨的过程,需要所有参与机房建设的相关方共同完成,才能确保规划和设计的有效性、实用性等要求。其中,基础设施运维团队应提出运维要求,从运维经验、实际运维难度、提高运维可易性等方面对规划和设计过程进行配合。 1.2.2 应参与相关供应商遴选 机房基础设施运维团队应参与机房基础设施设备供应商选择的全过程,及时地了解各种产品及服务的品牌、型号、规格等关键参数,使之更能满足运维的要求。并就在安装、调试过程中的注意事项等提

出建议,还需要对后续的设备保修等服务提出要求。 1.2.3 应参与建造管理 机房的基础设施运维团队应积极参与机房基础设施的建造工作,并协助做好建设项目的项目管理工作,着重关注工程建造中如材料的使用、工序、建造过程等工作,重点关注隐蔽工程的安装工艺和质量。 机房基础设施运维团队应充分了解施工过程中的工艺。对于新建数据中心,从施工质量和日后运维方便性出发,尽早发现施工过程的问题,及时纠正,方便日后运维和节省日后整改成本。 1.3 测试验证 机房基础设施投产前的测试验证是确保机房基础设施满足设计要求和运行要求的关键环节。 1.3.1 时间和预算 机房的业主应设立测试验证专项预算,预算应包括外部测试验证服务提供商的相关费用,以及在测试验证阶段产生的电费、水费、油费等相关费用。应制定测试验证的工期规划,以更准确地预测机房基础设施交付投产的日期。 1.3.2 测试验证参与方 项目建设管理部门可作为测试验证工作的主体责任单位;运维管理部门可作为测试验证工作的主体审核单位;第三方测试服务商可作为测试验证的实施单位及整体组织工作的协调单位。但运维管理部门应要求测试服务商预先提供测试方案,在运维管理部门审核后方可进行。机房基础设施运维团队可参与测试验证工作,在此过程中熟悉设

数据中心建设与运行管理

数据中心建设与运行管理 2010年07月26日 《数据中心建设与运行管理》 作者:林小村主编马玉林翁小云副主编(2010年04月第1版第1次) 科学出版社SCIENCE PRESS https://www.360docs.net/doc/6615623516.html, 北京东黄城根北街16号(100717) 内容简介 本书旨在为推动我国企业(机构)数据中心的发展而献出微力。《数据中心建设与运行管理》介绍了数据中心建设和管理的具体做法和体会,全面阐述了数据中心建设的规划与基本要求。全书共12章,包括:数据中心概述、数据中心总体规划、数据中心机房、数据中心网络系统、数据中心主机和存储系统、数据规划和数据库设计、数据中心应用支撑平台、数据中心应用系统、数据中心安全系统、数据中心容灾备份系统、数据中心建设管理、数据中心运行管理。 《数据中心建设与运行管理》观点前瞩、面向应用、深入浅出、图文并茂、重于实用,以数据中心的规划为主线,涵盖了数据中心系统工程全过程、全方位、多目标的全部内容。

《数据中心建设与运行管理》可供企业(机构)信息化管理部门、各类数据中心的建设与管理人员、技术人员、各级信息系统工程建设单位等参考,也可作为工科院校相关专业师生的辅导材料。 P2,互联网接入服务提供商ISP主要为各机构单位或个人提供互联网接入服务,同时还提供公共服务器空间租赁,实现电子邮件通信、网络信息检索等功能;有的单位则将自己的WEB服务器存放在ISP所在地,分享ISP所租用的线路,以降低成本。无论是租用ISP的服务器空间还是委托ISP管理WEB服务器都是Web hosting 模式(空间租用、主机托管)。在ASP模式中,各经济组织将基于WEB技术的应用交由ASP运营商托管,又叫做Application Hosting 模式。 P7,数据中心分类:企业数据中心(Corporate/Enterprise Data Center)、互联网数据中心(Internet Data Center)。 P38,数据交换平台 数据交换平台时数据中心数据与其他应用系统沟通的桥梁,是进行数据交换的基站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按照数据中心建设标准规范数据,形成核心数据库,并提供给其他应用系统使用。

信息系统密码管理规定

信息系统密码管理规定 第一条为了加强风险管理,强化保密工作,提高公司信息系统的安全性,保障信息系统的正常运行以及业务 数据安全,防止黑客攻击与用户越权访问,防止公 司重要信息的丢失、泄漏与破坏,建立科学、规范 的信息系统密码管理规范,特制定本规定。 第二条本制度所指信息系统密码,包括以下几种类型: 1.公司所有业务系统普通用户密码(包括NC、即时通 讯、上网行为、邮箱、视频会议等业务登录密码); 2.公司所有业务系统权限管理员与系统运维管理员密 码(包括业务系统、网站系统、邮箱系统、安全审计 系统、备份系统、虚拟化系统、防病毒安全系统、 视频会议系统、存储系统等后台管理密码); 3.应用服务器管理密码(包括运行业务系统服务器、网 站服务器、邮件服务器、安全审计系统服务器、备 份系统服务器、虚拟化系统服务器、防病毒安全系 统服务器、存储设备等登录密码); 4.系统数据库管理员密码; 5.其她网络应用及网络系统(路由器、交换机、上网行 为、VPN等)管理员密码; 第三条应用系统服务器、数据库、网络系统,自身包含有完整的多级权限管理体系。这些系统的最高权限分 配的其她权限的密码,也需遵守本规定; 第四条公司业务系统普通用户的密码设置规范要求如下:

1.密码长度不得低于6位; 2.密码必须包含字母(a-z,A-Z)、数字(0-9)、特殊字 符(!@#$%^&*)中的两种; 3.密码必须6个月更换一次,并且新密码不得与原密 码相同; 第五条对以下密码: 1.司所有业务系统权限管理员与系统运维管理员密 码; 2.应用服务器管理密码; 3.系统数据库管理员密码; 4.其她网络应用及网络系统管理员密码; 其设置规范,应符合以下要求: 1.密码不得低于8位; 2.密码必须包含大小写字母、数字及特殊符号; 3.密码必须每3个月更换一次,并且新密码不得与原 密码相同; 第六条信息系统密码设置规范的系统控制: 1.应用系统应控制密码的有效期,通过设置,强行要求 用户定期进行密码修改,减少密码被盗用的可能性; 2.用户密码唱的与编码规则限制。强行要求用户密码 符合长度与复杂性要求; 3.系统控制第一次登陆后必须马上更改初始密码; 4.设置用户密码输入错误次数。再密码错误输入三次 后,系统锁定登录用户。用火狐必须通知信息化部门

相关文档
最新文档