四种方法可以让数据中心避免停机,并优化性能

四种方法可以让数据中心避免停机,并优化性能

四种方法可以让数据中心避免停机,并优化性能

?当数据中心停机时间平均每分钟损失近9,000美元时,组织避免发生这种事件是节省成本的第一个也是最显着的一种方法。不过,以下四种方法可以帮助组织避免停机,并优化性能。

1. 验证调试数据中心设施

?数据中心的系统和组件日益繁多复杂,这意味着导致数据中心设施宕机中断的机会越来越多。调试(Cx)有助于确定并纠正诸如设计、安装和启动缺陷等故障背后的主要元凶。为了进一步最大限度地提高数据中心可用性,调试(Cx)验证并记录所有关键系统(电源、冷却和楼宇自动化等)可以作为一个完全集成的系统功能。

?调试(Cx)还有助于降低数据中心设施的生命周期成本。调试(Cx)过程改进了系统操作,同时提供了可用于保持最佳性能的基准数据。在系统优化后,不仅更可靠,而且也更有效率。调试(Cx)活动可以验证作为系统设计一部分的特定效率功能的适当功能。

?一个进行调试验证的数据中心通常比传统部署所经历的延迟更少,从而更

数据中心运营的一系列问题

常见问题(解决方案) 发布时间:2012-11-22 1.多大规模的数据中心才足够大? 第一个问题通常的最难回答的或者最简单的问题。对于分析师来说,这个问题的答案是“取决于许多因素”。但是,当你投资数千万美元建设一个新的数据中心的时候,这个答案就不行了。这个问题的困难部分不是搞清楚你现在的需求有多大,而是要搞清楚你在15年中的需求是什么。 2.我确实需要多少可用性? 数据中心通常是由层次水平确定的。层次水平实际上确定了这个环境的可用性(正常运行时间)的目标。虽然经常引用TIA 942行业标准,但是,许多公司在设计的早期阶段都使用正常运行时间学会(UPTIME INSTITUTE)的4层可用性指南作为一个良好的拇指定律。确定这个层是非常重要的,因为你的60%的资本预算都是由你确定层次的决策确定的。 3.我需要多少能源? 传统的数据中心是根据旨在支持当时典型的IT设备的最大容量的静态能源需求建设的。这种模式现在不在起作用了,数据中心的设计需要考虑能源的伸缩性,以支持未来安装高密度的机架环境。 4.绿色技术如何? 在设计数据中心的时候,有没有我需要了解的市场上的绿色技术或者将出现的绿色技术?从设计的角度看,在数据中心中使用句柄头和冷却工作量的最有效的方法是什么? 5.这个数据中心要使用多长时间? 一个新的数据中心的实际的生命周期是什么?传统数据中心一般使用寿命是15至20年。但是,由于目前的技术和计算需求的迅速变化,这个时间段是现实的吗?有没有一些方法把新的数据中心寿命延长到20年以上? 6.所有的应用程序都以同样的水平创建吗? 在传统的数据中心设计中,我们要支持例外的情况:高可用性、高性能和伸缩性。但是,你的应用程序都需要这些水平的支持吗?我能根据我的应用程序的要求建立一个环境以支持不同的服务和技术水平吗? 7.当前最新的设计趋势是什么?

数据中心运营的最佳实践

数据中心运营的最佳实践:运营效率和高效数据中心

造成数据中心宕机的首要“元凶”1是人为操作失误,而非数据中心设计或建造欠佳。这一观点已被业内接受多年。Uptime Institute 在其《数据中心场地基础设施等级标准:运营可持续性》(Data Center Site Infrastructure Tier Standards: Operational Sustainability )中也赞同这一观点。随着数据中心行业开始采纳这类评级标准,监管部门、保险公司和最终用户都纷纷准备加强对数据中心运营状况的详细审查。目前正是各大公司评估各自数据中心运营计划的合适时机。他们必须能够清晰地描述数据中心的运营需求,并根据对数据中心的风险预测设计运营计划。然而,制定业内最佳运营计划决非易事,尤其对那些核心专业技术不在数据中心设施的公司。尽管业内许多咨询公司可以帮助解决问题,但极少咨询公司拥有数据中心(或关键任务)的专业知识——若您期望实现可持续的运营,具备这方面的专业知识至关重要。第145号白皮书《数据中心规划中存在的九大误区》中讨论了业界在建造或扩建数据中心时存在的九大误区。按照逻辑,现在,我们将为您揭示在数据中心运营过程中你可能犯的十大错误。第一大错误:将数据中心运营团队排除在设施设计过程中采用能够平衡初始资金投入和运营成本支出与公司需求的总体拥有成本(TCO)方法,是打造最有效、最经济和高效数据中心的第一步,其中包括根据公司的具体情况确定数据中心的设计标准并确定其性能特性。根据我们的经验,如果在数据中心设施设计阶段将运营团队排除在外,其结果往往在数据中心交付以后需要整改和维修。譬如,遇到以下情况,我们不得不对一个崭新的数据中心进行整改。1.没有设计足够多的分支电路,导致各种维护作业;2.发电机组设计和安装不合理,导致简单的维护作业也很困难;3.由于楼宇设计缺陷,导致空气处理单元无法为数据中心提供所需要的气流。如果在设计过程中考虑到运营计划,这些错误本来是可以避免的。当您让运营人员参与到设计阶段时,就会“在设计时胸有成竹”。这就是TCO 方法的实质。 第二大错误:过分依赖于数据中心的设计许多企业认为,如果设计了高度的冗余,便可减少在运行与维护计划方面的投入,这种看法是极其错误的。对任务关键环境中宕机的各种研究得出的结论都相同:人为错误才是罪魁祸首。正确的运营(而非设计)既可维持设施正常运行、又可控制成本,既能保护公司投资,又能保护公司的声誉。许多公司错误地将大量的资金投入到稳健的、冗余的设计中,却忽略了适当地投入到运营的预算,这种情况屡见不鲜。比如,许多企业将关键设施运营交由专门维护写字楼的物业公司执行,而这些公司根本不具备运行或维护关键设施的专业技术。典型的办公室空间设施运营都是基于这样的理念,就是系统可以停机进行维护或维修。短暂的办 公楼系统故障只可能给内部工作人员带来不便,但如果数据中心发生严重的宕机事故则可能危及公司的企业使命。建造数据中心基础设施和组建其运营团队时,公司都应该牢记的唯一目标就是:最大限度地延长正常运行时间。传统的设备维护计划无法充分满足任务关键环境的以下特殊功能和需求: 1 Stephen Elliot ,IDC ,网络和服务管理高级分析师,2004年;Donna Scott ,副总裁兼调研总监,《运营变更管理的最佳实践》,Gartner, Inc. 2003年。 简介 数据中心运营的十大错误 如果在设计阶段将数据中 心运营团队排除在外,其结果 往往是需要整改和维修。 “ ”当下正是各大公司评估各 自数据中心运营计划的适宜时 机。他们必须能够清晰地描述 数据中心的运营需求,并根据 对数据中心的风险预测设计运 营计划。 “ ”尽管业内许多咨询公司可 以帮助解决问题,但极少咨询 拥有数据中心(或关键任务) 的专业知识——若您期望实现 可持续的运营,具备这方面的 专业知识至关重要。 “ ”

IDC机房的建设投资与运行成本分析(DOC)

IDC机房的建设投资与运行成本分析 罗洪元,温开华 国家电子计算机质量监督检验中心,中国北京 100083 National Computer Products Quality Supervising &Testing Center, Beijing, China 100083 E-mail:nctc@https://www.360docs.net/doc/4010077380.html, , wenkaihua2004@https://www.360docs.net/doc/4010077380.html, LUO Hong-yuan, WEN Kai-hua. IDC room building in investment and operating cost analysis Abstract: From the building of energy-saving IDC room size and configuration of the introduction of new technologies, starting with the extent of the IDC room after the pre-construction investment and operating costs of a brief analysis, and proposing some suggestions that the building of energy-saving IDC room , for the reference to readers of interest. Keywords: energy-saving; IDC room; Construction Investment; Operating costs; Solution 摘要:本文从建设节能IDC机房的配置规模及采用新技术的程度入手,对IDC机房的前期建设投资与事后运行成本进行简要分析,并提出了建设节能IDC机房的几点建议,供感兴趣的读者参考。 关键词:节能 IDC机房建设投资运行成本解决方案 1 问题的提出 随着互联网应用的普及,互联网数据中心(Internet Data Center,简称IDC)利用 已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府 提供服务器托管、租用以及相关增值等方面的全方位服务。迄今为止, IDC在电信、金 融、税务、政府、交通等众多领域的需求快速增长。IDC不仅是数据存储的中心,而且 是数据流通的中心,它是Internet网络中数据交换最集中的地方。 据统计,2007年中国市场的IDC投入高达124亿元人民币,其业务已经突破30多亿 元人民币,实现以30%的增长率高速发展。到2008年,中国建设企业级IDC机房所带 来的IT投入的市场规模增长率将是21.5%,市场规模将达到150.7亿元人民币。 IDC市场规模的高速增长一方面加速了数据的利用,另一方面也消耗了大量能源,根据2007年全球IDC统计数据(表1)表明全球IDC消耗总电能为1834.56亿千瓦时,成为重点节能对象。 表1 全球IDC统计数据

8种有效降低数据中心能耗的方法

随着新一代数据中心建设浪潮的兴起,随着企业机房里服务器的密度越来越高、数量越来越大,电力消耗和散热能力正在成为企业IT管理员重点关注的问题,数据中心所消耗的电力以及要冷却这些被转化为热量的电力消耗都达到了越来越高的水平。电力的巨大消耗带来各种严峻问题,巨额的电力成本会让企业的整体成本上升,并且,相对而言在一段时期内任何一个数据中心的电力供给都是有限的,所以即便是通过增加硬件来力求平衡,最终页仍然要面对电力供给与占地面积的问题,在日益倡导绿色环保和严格审核的低碳时代,降低数据中心的能耗极为必要。 在保证数据中心基础设施的最低电力供给的同时又能显著减少电力消耗与电力成本的方法有以下这些: 1、服务器虚拟化 服务器的电力消耗占整个数据中心电力消耗的一半左右,虚拟化技术让一台物理服务器可以运行多个多个虚拟主机,这让单独服务器的计算资源可以被多个环境共享,通过调整服务器的负载,可以让计算资源得到充分利用。降低二氧化碳排放量,降低管理和运营成本。 服务器虚拟化技术降低成本是非常明显的,平均来说,以一个月为周期,和应用多台服务器的非虚拟化站点相比,应用虚拟化技术的服务器站点在数据流量、能耗、受攻击威胁和总体拥有成本只有前者的10%。 虚拟化技术让企业更加绿色,运行多台服务器会产生大量的热量,并需要额外的能耗进行冷却。通过虚拟化技术,30台服务器可以整合到3台,这可以降低15至30吨的二氧化碳排放量——相当于在公路上减少7辆汽车。 2、采用现代化冷却系统 HVAC系统通常是数据中心第二大耗电系统,据Data Center Users Group估计,消耗的电能占数据中心能源消耗的37%。空气调节系统只有在处理小范围时才能到达较高效率,面对大规模的数据中心,多数冷却系统的冷却任务都无法最优化处理,冷却效率非常低。通常,用现代化、模块化和更高效的组件替代一些传统空调设备进行冷却处理可以节约大量电能。 在气候条件便利的情况下,采用类似用外部冷空气替代电力系统来进行冷却等更节能的方式,将可以更加节约电能。 3、重组数据中心 数据中心的数量和规模的扩大在过去的几年中非常明显,而服务器则被随处安装,非常缺乏计划性。这导致了数据中心的发热与散热不均,超载的IT环境也很难保证冷却系统的最优化运行。 对数据中心服务器的物理位置进行重组,例如配置冷、热通道,都可以显著减少冷却系

数据中心优化需要考虑的主要因素

俗话说,“时间就是金钱”,数据中心的运营很适合采用这个原则。随着时间的推移,任何停机中断、故障或仅仅是效率低下和过时的做法都会使组织损失数千甚至数百万美元。 但是,通过实施专注于最佳性能的解决方案,组织可以防止停机,更好地管理电源,并提高整体效率。然后,这就转化成为更高的工作效率,更高效的员工,并留住客户,但其前提是选择了正确的解决方案。 对于希望确定最基本的数据中心解决方案的组织,数据中心管理人员在进行任何旨在改善服务交付的变更时需要考虑,以下是一些很好的起点: 1. 数据中心基础设施管理(DCIM) 数据中心基础设施管理(DCIM)允许组织有效管理数据中心的整体网络和资产,减少损耗。此解决方案对所有资产、资源、流程和人员实现自动化管理,为计算基础设施提供了丰富的信息。 DCIM解决方案将通过以下方面的信息监控资源和流程: 容量-是否有足够的空间?是否具有弹性? 电力-所有资源都有足够的电力?预测的峰值在哪里? 工作流程-供应,修复和退役工作流程是否正确? 什么可以更智能、更快、更好? 效率-数据中心的整体运行效率如何? 以上只是简化了DCIM可以做的事情,它实际上在数据中心内没有界限,因为人工智能和机器学习解决方案成为DCIM软件包的一部分,并为其组合添加了预测能力。 2. 人工智能分析 人工智能分析与数据中心内的DCIM密切相关。通过分析,人工智能可以预测和学习(通过机器学习)从机房温度急剧上升是机架电源中断的原因。但不仅仅是效率,人工智能也被证明有效应对网络攻击的技术。 组织在其网络周围安装的传感器越多,人工智能软件就越智能。智能水平的增长意味着人工智能在发现错误或黑客行为(通过异常的行为模式)时更有效,在某些

数据中心运营的一常见问题(解决方案)

数据中心运营的一常见问题(解决方案) 1.多大规模的数据中心才足够大? 第一个问题通常的最难回答的或者最简单的问题。对于分析师来说,这个问题的答案是“取决于许多因素”。但是,当你投资数千万美元建设一个新的数据中心的时候,这个答案就不行了。这个问题的困难部分不是搞清楚你现在的需求有多大,而是要搞清楚你在15年中的需求是什么。 2.我确实需要多少可用性? 数据中心通常是由层次水平确定的。层次水平实际上确定了这个环境的可用性(正常运行时间)的目标。虽然经常引用TIA 942行业标准,但是,许多公司在设计的早期阶段都使用正常运行时间学会(UPTIME INSTITUTE)的4层可用性指南作为一个良好的拇指定律。确定这个层是非常重要的,因为你的60%的资本预算都是由你确定层次的决策确定的。 3.我需要多少能源? 传统的数据中心是根据旨在支持当时典型的IT设备的最大容量的静态能源需求建设的。这种模式现在不在起作用了,数据中心的设计需要考虑能源的伸缩性,以支持未来安装高密度的机架环境。 4.绿色技术如何? 在设计数据中心的时候,有没有我需要了解的市场上的绿色技术或者将出现的绿色技术?从设计的角度看,在数据中心中使用句柄头和冷却工作量的最有效的方法是什么?

5.这个数据中心要使用多长时间? 一个新的数据中心的实际的生命周期是什么?传统数据中心一般使用寿命是15至20年。但是,由于目前的技术和计算需求的迅速变化,这个时间段是现实的吗?有没有一些方法把新的数据中心寿命延长到20年以上? 6.所有的应用程序都以同样的水平创建吗? 在传统的数据中心设计中,我们要支持例外的情况:高可用性、高性能和伸缩性。但是,你的应用程序都需要这些水平的支持吗?我能根据我的应用程序的要求建立一个环境以支持不同的服务和技术水平吗? 7.当前最新的设计趋势是什么? 当前占主导地位的数据中心设计趋势是什么?使用(或者忽略)这些趋势有什么好处和坏处? 8.我应该建设一个还是多个数据中心? 在整合项目中,最常提出的问题是“我需要多少了数据中心?”这些问题的答案取决于风险与回报、资本预算、地理位置、服务水平和恢复时间目标。在某些情况下,建造两个数据中心能够建造一个数据中心便宜一些。 9.业务持续性与灾难恢复如何? 当设计一个数据中心的时候,我应该还要制定我的业务持续性计划吗?或者在整个设计阶段考虑业务持续性与灾难恢复?有没有新的技术在解决业务持续性与灾难恢复问题的同时还能为重要的应用程序提供高增长和冗余水平? 10.谁建设这个数据中心?我应该提前提出什么问题?

数据中心平台优化完善和补充建设

数据中心平台优化完善和补充建设 招标需求 山东出入境检验检疫局 2007年10月

--------------------------------------------------------------- 一、项目背景 近年来,随着信息化工作的不断推进,与山东检验检疫的综合业务、电子监管以及“大通关”进程密切相关关键应用业务系统相继上线运行;同时我局逐步建立了以小型机为核心,以微机服务器为外延,以数据集中存储管理为手段的多层次、立体化的全省数据中心平台;以此为依托实现了全省“数据大集中”,并对各业务系统进行了整合、优化。为了确保数据中心平台和各项关键业务系统的安全运行,实现更高层次的管理和统计分析等决策支持,我们亟需一个有效且实用的业务应用综合管理工具来实现完整的IT业务一体化的平台架构、实时监控、故障预警、追朔检测、集中管理和简易维护。 二、项目需求 1、总体目标 ?建立一个完整的业务应用监控管理平台,将山东检验检疫关键业务系统全面的监控起来,系统维护人员能够在最短时间内做出正确的判断问题根源。 ?大量来自各厂商的硬件设备和复杂的应用系统,全部被有机的整合到一个完整的监控管理系统中,能有效的控制管理维护成本。 ?实时监控,能够提前发现应用环境中存在的潜在问题,提前处理问题,使故障率大大降低,网络故障时间大大减少,用户的投诉率明显减少。

?改被动性局部维护为主动性宏观管理,重视预警机制和智能分析,致力于提高山东检验检疫信息化整体运营品质,提高资源的利用率。 ?减少了运营管理部门的繁重工作量,提高了维护水平,提高了维护人员的技术水平,提高了山东出入境检验检疫业务服务质量,使企业和客户便被动为主动,降低了管理风险,也降低了维护成本。 ?定制开发时要充分考虑系统的通用性和实用性,在功能和接口设计上要有扩展性,以充分满足检验检疫业务系统不断发展的需求。 2、集成总体要求 ?软硬件一体化解决方案, 快速实施,快速配置。 ?基于全中文B/S架构设计,集“设备管理”、“系统管理”、“应用管理”、“性能管理”、“业务管理”等于统一硬件平台,随需应变的灵活应用。?主动监测和预警。如一面"健康透视镜",随时监视IT网络环境的状态和性能,对即将发生的故障和危机,实时向IT管理人员发出预警。 ?全面监测。对整体IT环境中网络设备和系统的资源使用状态和参数性能全面的7×24监测。 ?专业规范的告警管理机制,灵活配置的告警策略,丰富的告警方式。?多种的告警方式能及时通知网络管理员处理问题。 ?良好的扩展性。可以快速准确的实现对任何一个新的网元的监控,更好更方便的完成用户的需求。 ?记录历史性能数据,更精确地分析隐患。 ?基于中文Web的远程管理。

提升业务持续运作 — 数据中心容量规划方案

提升业务持续运作—数据中心容量规划方案 透過 3 年的战略规划,能有助于我们对数据中心容量问题了如指掌,从而满足不断变化的业务和市场需求。 Monica To 英特尔 IT 部门数据中心规划师 Kevin Emery 英特尔 IT 部门数据中心规划师要点概述 为了更有效满足英特尔的业务计算需求和确保服务持续,英特尔 IT 部门开发了一种预测数据中心容量规划流程。该方案可帮助我们准确预测数据中心设施的需求,主动发现未来数年的容量短缺问题。 我们使用了该预测规划方案,每半年一次 做长期规划(long-range planning,以下简 称 LRP),針对 3 年规划周期内的相关问 题进行分析,以了解业务增长趋势和数据 中心未来的容量需求。 我们的 LRP 流程包含三个关键阶段: ? 从业务部门收集数据。每个业务部门 各自审查他们的业务计划,并根据历 史趋势和增长预估来预测需求。我们 的目标是预测未来 3 年各业务部门的 计算容量需求。 ? 分析数据。我们对每个数据中心的预测 数据和基本数据作分析比较,包括目前 可用的空间、散热和电源等。我们的主 要目标是找出超负荷运行(在规划周期 内某一时间点的需求将超过可用容量) 的数据中心.。 ? 报告结果。我们将分析结果向高级管理 层报告。我们的 LRP 报告旨在揭露即 将出现容量问题的数据中心,促使相关 人员就制定解决这些问题的修复计划展 开讨论,提出可优化每个数据中心性能 和利用率的解决方案。 数据中心容量的不足会影响业务目标的实 现和预算平衡,以及总体增长和创新进 程。3 年战略规划有助于我们对数据中心 的容量问题了如指掌,从而满足不断变化 的业务和市场需求。

IDC机房的建设投资与运行成本分析

I D C机房的建设投资与运行成本分析罗洪元,温开华 国家电子计算机质量监督检验中心,中国北京100083 NationalComputerProductsQualitySupervising&TestingCenter,Beijing, China100083 E-mail:,wenkai LUOHong-yuan,WENKai-hua.IDCroombuildingininvestmentandoperatingcostanal ysis Abstract:Fromthebuildingofenergy-savingIDCroomsizeandconfigurationofthei ntroductionofnewtechnologies,startingwiththeextentoftheIDCroomafterthepr e-constructioninvestmentandoperatingcostsofabriefanalysis,andproposingso mesuggestionsthatthebuildingofenergy-savingIDCroom,forthereferencetoread ersofinterest. Keywords:energy-saving;IDCroom;ConstructionInvestment;Operatingcosts;Sol ution 摘要:本文从建设节能IDC机房的配置规模及采用新技术的程度入手,对IDC机房的前期建设投资与事后运行成本进行简要分析,并提出了建设节能IDC机房的几点建议,供感兴趣的读者参考。 关键词:节能IDC机房建设投资运行成本解决方案 1问题的提出 随着互联网应用的普及,互联网数据中心(InternetDataCenter,简称IDC)利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。迄今为止,IDC在电信、金融、税务、政府、交通等众多领域的

XX数据中心优化方案

XX数据中心优化方案 XX数据中心优化目标: XX数据中心承载着XXXXXX服务平台3.0及4.0的所有运行环境,是整个业务的支柱,是数据存储、信息交换和信息再加工的基础,是提高核心竞争力之所在,没有良好的技术支撑和保障,提供优质服务就无从谈起。 针对XX数据中心现阶段存在的问题,我们希望通过优化能够满足高密度、高容量、高安全性,并且具有高可靠性、可扩展性的首要目标,然后在此基础上进一步节省成本、节省空间、能够在节能方面做得更好,而且使应用的稳定性更高。 数据中心现有架构: XX数据中心现有架构如上图所示:

1.网络接入采用双线路,电信联通各100M带宽,通过两个H3C的U200UTM接入互 联网,办公网络共用了服务平台的网络并建立了到五一新干线的VPN连接; 2.服务器采用3台HP DL380物理服务器并做了虚拟化,将20多台虚拟服务器分布到 上面并开启了Fault Tolerance(容错); 3.后端采用HP EVA 6350,所有的数据都储存在这一台存储设备内。 数据中心存在的问题及解决方案 一.网络方面 问题1:防火墙承载能力不足 现在采用的防火墙H3C的U200是一款低端的UTM设备,防火墙模式下200M的吞吐率,最大并发连接数为60000个,按照每用户25个连接计算,两台防火墙双线路共能支持5000用户在线,如果考虑未来1万用户在线,设备已无法承受;另外较低的吞吐率也不利于带宽扩展,与主流防火墙1000M以上的吞吐率相去甚远。 问题2:防火墙的防护能力差 现有防火墙的防攻击和反入侵能力较差,只有一些简单的防护功能,无法应付数据中心级别的安全保护要求,例如防DDOS攻击、入侵检测等,一旦遭遇上规模攻击就会导致整个平台瘫痪,另外如果开启了UTM防护模式,最大连接数会降低到16000个,两台防火墙双线路只能支持1200个在线用户。 问题3:平台网络和工作网络混杂 现在数据中心的业务平台网络和工作网络混杂在一起,这对数据安全是一个很大的隐患同时对业务网络稳定性也会产生影响,尤其当出现中毒或者中木马情况时,将会带来不可估量的后果。 解决方案: 1.增加满足需求的防火墙,考虑到未来发展需要,最大连接数至少达到达到500000,可以 同时承载20000用户在线,吞吐率至少达到1000M水平,同时需要有完整的抗攻击和

相关文档
最新文档