设备搬迁技术保障措施

设备搬迁技术保障措施
设备搬迁技术保障措施

IT设备搬迁技术保障措施

搬迁风险分析和措施

4.1. 设备搬运风险

1、设备硬件损坏的风险。搬运过程硬件损坏,导致设备不能正常工作。

解决措施:

(1)制定备份和恢复策略,重要系统准备应急设备。

(2)准备充足备件,现场修复。

2、数据丢失的风险。搬运过程的硬盘易损坏,导致数据丢失。

解决措施:

(1)制定备份和恢复策略,现场进行数据恢复。

3、设备丢失的风险。设备丢失,导致系统不能正常工作。

解决措施:

(1)制定清晰的设备清点和交接流程。

(2)分小组进行设备运输。

(3)货物搬运过程对物流公司进行现场监督。

4.2. 基础设施风险

1、电梯故障的风险。罗湖田心机房电梯故障导致搬迁暂停。

解决措施:协调物业,安排电梯维护工程师现场支持。

4.3. 人员风险

1、重要人员缺席的风险。重要人员缺席,导致搬迁过程的重要环节存在风险导致搬迁过程的重要环节存在风险导致搬迁过程的重要环节存在风险导致搬迁过程的重要环节存在风险。

解决措施:

(1)搬迁前安排重要人员充分休息。并考虑对重要人员安排备份人员。

2、人员过度疲劳的风险。会导致工作效率下降,增加出错几率。

解决措施:

(1)安排专用休息场所。搬迁过程中预留休息和吃饭时间。

3、指挥协调的风险。人员众多,指挥协调难度大,导致搬迁流程不顺畅。第 4 页共 21 页

解决措施:

(1)建立指挥沟通协调机制,明确搬迁过程汇报线路。

(2)配备足够的沟通工具,包括手机(充足电)、对讲机、机房移动无线座机。

4、操作失误的风险。人员操作失误,导致各类型的故障发生,影响搬迁进度。

解决措施:

(1)加强操作人员和备份人员培训。

(2)重要操作双人执行。

5、电源操作危险的风险。搬迁过程中电源插拔数量较多搬迁过程中电源插拔数量较多搬

迁过程中电源插拔数量较多搬迁过程中电源插拔数量较多,操作过程用电风险

较高。

(1)解决措施:安排专业电工现场支持。

搬迁应该遵循以下要求:

1) 确保数据和设备的安全;

2) 不影响正常的生产,生产停止时间为零;

3) 新旧系统平滑切换;

基本搬迁步骤为:

1) 做好各系统主机、网络数据的备份,必要时将应用程序运行在其他机器上。

2) 新机房中已经做好系统搬迁的相关准备,如:IP、网络端口、主机,网络设备位置、电源接口和相关的机房环境要求;

3) 系统健康检查;

4) 充分备份数据;

5) 备用主机设备拆卸及运输;

6) 备用主机设备安装;

7) 存储连接、配置

8) 备用主机调试,数据导入;

9) 备用主机运行,应用测试;

10) 生产主机搬迁

11) 最终测试

系统检查和备份数据

工程师负责系统的健康检查,并协助农大网络中心技术人员作系统备份,只有系统设备检测通过后才能继续设备搬迁服务。一旦发现数据库或主机无法正常工作,应立即检查相关原因并给予现场解决。

(注:一下步骤的详细操作命令与方式略)

1)检查主机操作系统

2)检查存储:

3)检查数据库

4)检查备份系统

5)测试系统重启

6)备份数据库

7)备份操作系统

8)备份数据库软件及配置:

主机拆卸及运输

步骤如下:

1)依次正常关闭E数据库、主机操作系统、主机电源。切断机柜交流电源。

2)做好备用主机的设备标签工作。

3)协助对能够装箱的设备(如显示器等)进行装箱,尽量采用泡沫塑料或海绵对设备

进行保护,尽可能避免搬迁过程对设备的损坏。

4)设备搬迁到新机房。搬迁过程中注意防潮、防震、防摔、防磁和防盗。

备用主机安装

步骤如下:

1)拆卸搬迁过程中的包装

2)按照规划,机架就位

3)安装新的光纤通道卡

4)连接网络和电源

存储连接及配置

1)连接备用主机到存储的光纤

2)关闭存储

备用机运行环境建立

建立备用机运行环境。

备用机接管生产机应用

备用机接管生产机应用。

生产机搬迁

步骤如下:

1)修改网络配置,符合新机房的规划

2)正常关闭主机等

3)切断电源

4)做好标签

5)拆卸主机、带库和相关pc server

6)搬迁主机、带库和相关pc server

7)在新机房就位

8)测试电源是否符合要求

9)连接网络

10)安装光纤通道卡

11)连接存储

12)正常关闭备用主机

13)连接内存通道卡

14)启动主机

15)测试cluster是否正常

16)启动生产主机的数据库

17)测试数据库是否正常

应急预案

在严格按照搬迁步骤进行搬迁的同时,必须严格控制以上步骤中的关键步骤,针对它们我们制订如下应急措施。在必要时候,都可以启动我司的故障升级流程,以保障问题的快速和有效解决:

1) 备份操作系统和数据库数据:如果备份失败,必须重新备份,直到备份成功为止,

而且必须作二份异地备份。

2) 搬迁前设备的标识:采用第三方检查办法来确保标识无误。

3) 搬迁路途中的安全问题:在搬家公司、集成商、农大几方形成设备和数据搬迁过程中出现的安全问题责任协议,督促各方做好各自工作。同时做好设备的包装和运输,第三方全程跟踪监督机制。在本方案中出现了万一设备严重损坏,不会影响系统正常运行。

4) 数据的导入和恢复:如果在导入操作系统中出现错误,必须重新导入,如果无法重新导入,那么可以根据配置来重新安装操作系统。如果在导入数据库中出现错误,必须重新导入,如果是导出文件错误,可以从现有的数据库中重新导出。

5) 搬迁后全面测试应用:如果在确认系统平台正常前提下,有客户和软件部门全面测试应用的运行情况,最终由软件部门负责解决,必要时启动问题升级流程。

=====================================================================

设备迁移方案

迁移流程及顺序说明

以上为系统迁移的流程图,各单位数据中心分系统均按该流程进行,做到系统迁移的有序进行。

迁移实施前期准备

迁移的准备工作是整个迁移工作的极其重要的部分,充分的做好本次迁移的准备工作,

是保证迁移工作顺利进行的首要条件,并可有效的减少迁移过程中的事故隐患,以下将对迁移前的准备工作做详细描述。

迁移设备确认

在此过程中需和用户方确认迁移的网络设备、服务器、存储等硬件设备及其辅助设备和材料,并对需迁移的设备进行分类统计,形成文档,由用户方确认。

设备检测

(一)硬件设备的检测

在迁移以前,用户方应对现有的设备进行一次全面的检测工作,包括系统状态、组件和系统配置的检测,确认系统迁移恢复后应具有的功能和性能。

(二)服务器软件应用系统的检测

配合业务系统的开发维护单位,对系统的集成接口、设备连接进行检测,确认系统迁移恢复后应具有的功能和集成方式。

数据备份

做好数据备份工作是本次搬迁工作顺利完成的有效保障之一,对各系统配置参数和配置文件做有效的记录和保存,形成文档,为系统再运行、集成提供充分的依据。

设备及接口标识

迁移工作比较繁琐,尤其值得注意的是,在系统的再集成过程中,设备物理连接的恢复将是系统再集成的首要保证,众多单位的业务系统与及数量繁多的设备容易引起现场的混乱,模糊不清或者意义不明确的设备标识、标识的丢失等因素将影响系统恢复运行的时间。

因此在迁移以前对所有的硬件设备做好编号和功能标示,对物理连接的接口和线缆做好标识,对设备、接口、线缆做到一一对应,并将以上标识内容形成文档,为系统快速恢复提供可靠的基础。

标识主要内容为:

服务器设备标识:在设备做好标示,注明设备的型号、配置、功用、接口信息等信息;

网络设备标知:注明设备型号、配置、功用、接口信息等信息;

线缆标识:接口类型、连接设备等信息。

设备的标识工作已经按现有机房设备摆放位置的格局做好的标识区分。在设备迁移到指定位置后再次做好标识,并整理成册为以后管理做好基础的依据。

设备迁移步骤及注意事项

设备迁移是指从硬件设备及业务系统停运、拆卸下架、更换机柜、内外网分区域部署、重新上架、系统开机运行的过程,此过程是迁移工作的重点之一,需做好详细的规划,保证

迁移工作的顺利进行。

系统停机步骤及注意事项

迁移前应关闭网络设备及服务器系统,具体步骤及内容如下:

(一)停运步骤

1.系统停运时间应和用户方协商决定暂建议元月15日进行设备第一次迁移;

2.对小型机、服务器系统及存储备份系统停运前应事先由用户、应用系统维护单位沟通进

行数据备份和停机;

3.确认设备配置及系统配置文件已做好记录和备份;

4.PC服务器停机:PC服务器关闭应用软件系统,关闭系统,切断电源;

5.小型机停机:小型机停数数据库,关闭系统,切断电源

6.存储系统停机:磁盘阵列关机,切断电源;光交换机关机,切断电源;

7.备份系统停机:备份服务器和磁带库关闭系统,切断电源;

8.网络及安全设备停机和拆离,在网络机架上按照交换机、核心交换机、路由器、入侵检

测、防火墙的顺序将设备依次关闭,待系统完全停止后切断电源;

(二)注意事项

1.设备停机时应按各设备使用单位,按不同业务系统进行有序停机;

2.设备切断电源前,应确认设备已经完全关闭,部分设备关机时间较长,应等其风扇完全

停转后切断电源;

3.确认业务系统软件停运注意事项,严格按照系统软件停运步骤进行操作;

4.停机顺序按照先停运业务系统,再停运数据库、存储系统、备份系统、网络系统的原则

进行;

5.系统停机时如发生软件或系统故障,应先排除再进行停机操作,不得野蛮停机,确保操

作系统和业务软件系统停运时无故障;

6.切断电源时应先关闭电源插座,再拔设备电源;

设备拆卸步骤及注意事项

待机房设备全部停运并切断电源后,方可对设备进行拆卸,设备拆卸步骤和注意事项如下:

(一)拆卸步骤

1.拆卸应本着“先外后内,先周边再主体”的原则;先拆卸设备周边连接附件及线缆,再

拆卸主机;

2.设备下架时应由上自下,对机柜内设备进行逐一拆除,并按照业务系统进行分类,待新

机柜安装好后设备再安装于指定地点。

(二)注意事项

1.拆除设备时确认周边设备已经全部断开连接,防止线缆下架时拖连;

2.拆卸设备时应注意对设备保护,对体积和重量较大的设备需提供托架;

3.设备拆卸时应按照要求佩戴静电保护设备,如:静电护腕等,确保拆卸时静电不会对设

备造成损害;

4.设备码放时应严格遵守设备的放置要求,杜绝将设备倒置、倾斜等随意堆放;

5.小型机、存储、核心交换机等设备体积大、重量较重,拆卸时应注意人员及设备的保护,

确保设备和人员安全。

6.设备拆卸时,应严格按照设备安装和拆卸指南进行,不得野蛮拆卸。

机柜、桥架安装与设备迁移协调步骤

机柜安装

新机柜进场替换原有机柜的安装步骤:

1.拆除原有机柜内的设备,并将老机柜搬移出机房,将新机柜安装在设计好的位置。

2.在新机柜中按编号,分层次,按规划的安装各单位服务器。服务器规划是按照专网和外

网划分摆放区域,因考虑到同一单位服务器设备集中摆放利于管理员管理,此次需要搬迁的是原先18-23号机柜专网服务器搬到新规划的区域。

3.新机柜按规划好的位置顺序替换老机柜,新机柜中设备摆放按同一网内同一单位的设备

在一起集中部署的原则进行。

4.对于外网网络机柜更换的步骤是:首先将外网的服务器设备迁移到新机柜,并继续使用

原有老线路,待新的布线系统完成后将接入交换机安装在网络列头柜中,再更换互联网的网络机柜。

上走线桥架安装

在机柜、服务器重新部署就位后开始安装上走线桥架,当上走线桥架安装完毕,新布线系统敷设完成后,再使用新的线路替换原有线路。保证各服务器设备在更换机柜时可以在很短的时间内恢复工作。

安装步骤及注意事项

设备安装上架

(一)设备上架步骤

1.新机柜安装在指定位置;

2.检查设备接口及组件,确定无故障隐患后方可安装;

3.按同一种应用、同一网内、同一使用单位的设备进行集中布置,按照网络设备、服务器、

存储及备份设备顺序对系统进行恢复安装;

4.按照支架/导轨、设备的顺序安装至机架上,使用安装螺丝固定牢固;

5.按照拓扑图对设备进行线缆的连接;

(二)注意事项

1.设备在安装时采取必要的防静电措施,佩戴防静电手环或在操作前采用洗手、握铁制器

具等以释放操作人员身上静电荷,以免发生由于静电导致的故障。

2.设备安装时需严格按照设备安装步骤及注意事项进行,避免在设备安装过程中出现设备

故障。

3.设备安装包括线缆及其他辅助设备的安装,安装线缆时,需对应设备接口和线缆接口,

对应拓扑图,将设备线缆按图连接。

设备加电

1.在设备安装完成,线缆连接完成后,需对设备进行加电,设备加电前应确保设备电缆等

已经连接就位;设备加电前应对机房供电系统进行检测,确保供电系统正常。

设备运行检测

设备加电后,整个网络系统应已处于运行状态,此时需对网络系统的运行状况进行检测。检测步骤如下:

(一)物理线路检测:

1.对物理线路进行检测,确保线路连接正常,接口无松动;

2.确保物理线路连接时按照网络拓扑结构连接。

(二)设备运行状态检测:

1.对网络系统进行检测,通过PING、TRACERT工具等,对网络路由及通畅情况做检测,确

保网络路由通畅;

2.按照网络新拓扑结构,对相应的网络设备,如路由器,交换机等进行配置,以符合新网

络的运行需求;

3.通过对应的网络管理软件或远程登录系统,检测系统运行状态,确定系统运行正常;

4.配合软件厂家及用户对业务软件运行状态做检测,确保业务系统运行正常;

一、机房搬迁工作内容

1. 设备迁移前的准备工作(老机房)

步骤内容时间安排

原有网络设备拓扑结构确认(了解原来所有单位的网络拓扑结构,备份网络设备的IOS,保证搬迁后系统的正常工作,出具一份现有网络设备的设备列表和拓扑结构图准备工作基本上在搬迁的前一天内完成

原有存储设备、服务器确认(6月14日)确定服务器的数量,服务器的型号,服务器的配置等,并且在搬动服务器之前必需有详细的表格记录。同时对SAN网络涉及的阵列、

交换机也做一个详细的记录。

系统备份(6月14日晚)所有关键数据(包括程序,数据库,各服务器的配置参数、操作系统等)的全备份。

检查设备的硬件系统(6月14日)检查各个设备连线,信号灯,液晶显示屏等,查看是否有错误,如有需提早解决。

标记线缆和设备(6月14日)在设备的显著位置标记编号,在线缆的两头标记所连接的设备编号,并在标记过程中对设备和线缆的位置有一个总体上的认识。

2. 设备迁移前的准备工作(新机房)(6月14日)

新机房内的准备工作主要是对于机房环境的确认,包括:

室电系统环境确认,供电系统环境确认,供电系统线路情况确认,各种电压测量。 UPS供电系统,电池供电性能检测,UPS主机参数确认,UPS供电输出参数测量。整体搬迁工作需要在新机房已经装修完成,弱点和强电(UPS)施工完成后,才能进行搬迁。

3. 机房搬迁步骤(至新机房)

机房的整体搬迁从进场准备到搬迁、测试完毕大概需要三天时间,考虑到政务系统办公的需要,搬迁工作建议发布政务系统停机3天的通告。

步骤内容

PC服务器停机和整理(6月14日晚) PC服务器停机,切断电源,并整理线缆和外设。

数据库服务器停机和拆离(6月14日晚)一台IBM小型机停数据库,最后关闭系统,切断电源。最后将机器从机柜中拆离并整理线缆。

备份系统停机和拆离(6月14日晚)备份服务器和磁带库关闭系统,切断电源,并从机柜中拆离并整理线缆。

存储系统停机和拆离(6月14日晚)磁盘阵列关机,注意关机过程可能比较长,要等其风扇停止后再切断电源;SAN交换机关机,切断电源。将设备从机柜中拆离并整理光纤线。

应用服务器停机和拆离(6月14日晚) PC服务器停双机系统,停数据库,最后关闭系统,切断电源。最后将机器从机柜中拆离并整理线缆。

网络及安全设备停机和拆离6月14日晚)在网络机架上按照交换机、中心交换机、路由器、入侵检测、防火墙的顺序将设备依次关闭,待系统完全停止后切断电源。将设备从机柜中拆离并整理线缆,注意记录各个设备在机架上的位置。

停止并整理UPS系统(6月15日)待设备全部离电后,将UPS停止并整理好。

整理机柜将四个空机柜解除固定,并整理线缆

设备搬迁(6月15日)将整理好的各种设备装车搬迁,注意过程中尽量避免剧烈的碰撞。到达新机房后,将设备按照子系统放置并清点设备清单,避免搬迁过程中有所遗漏。

4. 系统再集成和测试(新机房)

步骤内容

UPS安装(6月15日晚)在新机房内安装上UPS系统并测试其出入口电压、电流和稳定性。

机柜安装(6月15日晚)将机柜安装固定在规划好的新位置上

网络及安全设备安装、连接及检测(6月15日晚)按照原先记录的位置将所有网络及安全设备上架并连接,交换机和路由器上电开机,检测其设置及连接是否正常,保证网络正常运行,防火墙等网络安全设备上电开机,检查其参数及规则设定,检测搬迁过程有没有损坏设备硬件,以及原有设备规则设定是否保存良好。

PC服务器安装及检测(6月15日) PC服务器统一安装在新机柜中,将其统一连接至KVM设备上,连接线缆,上电开机,检测KVM切换功能和机器工作正常与否。

备份系统安装及检测(6月15日)备份服务器和磁带库硬件系统安装入机柜,连接线缆,上电开机,检测机器是否正常启动,是否正常工作。

数据库服务器安装(6月15日晚) IBM小型机硬件系统安装入机柜,连接线缆。存储系统安装

(6月15日)将磁盘阵列安装入机柜,根据搬迁前的标记和位置连接光纤线。

数据库服务器和存储系统上电开机检测(6月15日)将小型机及存储阵列上电,并按照磁盘阵列、小型机的顺序依次开机,注意的是,要待上一台系统启动完毕后再开下一台设备。启动后,检查磁盘阵列,小型机信号灯是否正常,在磁盘阵列和小型机上检查错误日志,看其是否正常启动。最后在小型机上检查阵列上的文件系统是否被正常识别。

数据库启动和测试

(6月16日)正常情况下运行后,数据库都应正常启动。

数据库系统检测(6月16日)检测各个数据库数据是否完好,保证数据库安全。应用系统检测

(6月16日)检测各个应用系统是否能正常运行,保证搬迁后应用系统正常使用。备份系统测试

(6月16日)测试备份系统能否正常备份,确保数据安全。

设备整理和清洁

(6月16日)对相关设备进行整理和卫生清洁,保持良好的运行状态

5. 验收

整理本次迁移工作的相关文档,提交给用户。

待全部工作结束,整个系统运行正常后,验收该项目。

6. 注意事项

搬迁前的准备工作一定要细致,对各个设备的布局和线缆的位置要了解清楚,并做详细的标注,包括出具结构拓扑图,位置示意图,设备和线缆的标记,系统重要数据的备份等等。

搬迁时,尽量避免剧烈的碰撞,要做到轻拿轻放,在装车时,各个设备和设备与车厢之间要放置泡沫塑料或纸板来减轻运输途中的碰撞。

搬迁前和搬迁后都要根据设备清单对设备进行清点,避免遗漏。

如遇设备硬件问题,应及时维修。

数据库和应用系统起不来时,拿出搬迁前的全备份及时恢复。

整个搬迁过程中,和各个应用系统和设备负责人、服务商做好沟通协调工作。

搬迁过程前期要与设备质保方商谈设备搬迁过程的质保情况。

搬迁前要确认UPS安装环境,希望建设单位能够提供支持,主要是确认电池摆放位置和电源供电情况。

搬迁前通知网络运营商提供线路切割。

确认办公地点希望由大楼综合布线公司能够提供线路接入。

对搬迁过程实时记录,做好文档整理工作。

第三章系统应急与灾难恢复方案

1.应急措施

前提:所有的和数据备份完整无缺,容灾系统正常。

具体内容:

(1)当数据发生丢失的时候,使用备份数据来恢复;

(2)当ORACLE数据丢失时,我公司直接联系ORACLE原厂工程师提供灾难恢复工具并解决问题及数据的恢复。以保证数据的安全可靠性。

(3)当服务器硬件发生故障的时候,立即联系我公司备件中心,尽快更换备件,如果该主机有集群,把应用系统切换到集群系统备机上,如果是非集群主机,暂时调整应用,尽量使应用系统先运行起来。

(4)发生严重灾难主备机都无法正常工作时,启用容灾系统,保证容灾系统网络正常。

(5)如主机有硬件故障,从最近的备件库提取相应设备更换之。

2.提供整机、阵列、易坏件到场,保证系统安全

(1)提供一台小型机以作备份机器使用,事先在备机上安装和现场一样的操作系统和ORACLE,以便及时切换。

(2)针对核心数据存放在HDS存储上的现状,提供一台HDS9500V存储以作备份使用,如果发生阵列损坏的灾难性故障问题,则及时切换使用。

(3)提供IBM pcserver和其他的pcserver的硬盘(曙光,浪潮)各2块。

因为在搬家过程中,硬盘是最容易损坏的硬件,如果有损坏,及时更换。

(4)提供华三交换机模块2个以作备份,如果搬迁过程中出现问题,把备份的配置信息及时恢复。

(5)提供小型机连接的san-switch模块2个,光纤线5根,在插拔光纤的时候容易把光纤线或者模块搞坏,如果出现类似光纤不同状况,急于更换。

(6)提供ibm 7133 存储硬盘2块,存储虽然有raid5 和 hotspare的保护措施,但是在损坏硬盘的时候要急时更换。

(7)提供网线及水晶头或成品的网线,在搬运网络柜的交换机时,避免不了一些网线无法使用等情况。

(8)赠送2个IBM p630电源,由于现在的电源是单电源,对小机的安全隐患有很大的危险,在搬迁之前升级为冗余电源。

(9)提供P630和RX7620小型机的电源及硬盘1个,在出现损坏的时候及时更换。

第四章注意事项

(1)特别注意人身安全:首先注意不要触电;其次由于机柜、机架等都是金属,有较锋利边缘,易划伤手;机器等都很重易砸伤脚,要特别注意。

(2)搬迁前的准备工作一定要细致,对各个设备的布局和线缆的位置要了解清楚,并做详细的标注,包括出具结构拓扑图,位置示意图,设备和线缆的标记,系统重要数据的备份等等。

(3)搬迁时,尽量避免剧烈的碰撞,要做到轻拿轻放,在装车时,各个设备和设备与车厢之间要放置泡沫塑料或纸板来减轻运输途中的碰撞。

(4)搬迁前和搬迁后都要根据设备清单对设备进行清点,避免遗漏。

(5)整个搬迁过程中,和各个应用系统和设备负责人、服务商做好沟通协调工作。

(6)UPS的搬迁可能耗时较长,设备加电测试时可以先用市电进行。单位最好在新机房留用电工及时配合。

(7)搬迁前通知网络运营商提供线路切割。

相关主题
相关文档
最新文档