存储设备巡检报告v10

存储设备巡检报告v10
存储设备巡检报告v10

存储设备巡检报告v1.0

————————————————————————————————作者: ————————————————————————————————日期:

XXXXXXX

存储设备巡检报告2015年6月26日

XXX分行

?存储设备巡检报告

尊敬的XXXXX客户: ?感谢您长期以来对我公司的支持与帮助!

为使贵公司所使用的存储设备更好的运行,在贵公司的大力配合下,我们于2015年06月26日对贵公司网上运行的存储设备进行了软件及硬件巡检工作。现将这次巡检的情况向您汇报如下,并请您对我们的巡检工作给予评价。谢谢!

1巡检基本信息

1.1局点基本信息

客户名称

客户联系人

客户联系电话

巡检人员

巡检时间

1.2巡检设备信息

设备型号设备数量

5

1.3巡检项简介

存储的巡检通过管理节点可对所有节点进行巡检。对巡检和信息收集是对设备当前的状态进行检视,能及时发现设备中存在的问题。检查项包括如下内容:

序号检查项检查方法参考标准或值的范围备注

1 基础巡检巡检工具Ocea

nStor Toolkit

巡检。

根据巡检报告的异常项(会

标红并显示巡检不通过)中

修复建议进行处理。

2 存储使用

情况分析

OceanStor Devi

ceManager

登录OceanStor

DeviceManager,人工

判断和工具判断结合。

3告警信息

检视

OceanStor De

viceManager

登录OceanStor Dev

iceManager导出告警和

事件信息

2存储检查结果汇总

2.1存储基础巡检概述

存储的巡检使用OceanStorToolkit工具进行,包括硬件巡检、软件巡检,具体又包含65个检查子项。详细检查项如下表所示。

说明:“√”表示通过;“×”表示不通过;“○”表示未检查;“-”表示不涉及;“!”表示建议优化。

√:通过×:不通过○:未检查-:不涉及!:建议优化

索引检查父

检查子项

22.

0.112.2

1

通过台数/

总台数

1

硬件磁盘利用率 1/1

2 CPU利用率 1/1

3内存利用率1/14磁盘状态 1/1

5电源状态 0/1

6风扇状态 1/1

7网口状态 1/1 8CPU状态1/1 9节点状态 1/1 10磁盘Verify 1/1

11节点温度 1/1 12网口协商单双工巡检 1/1

13光模块状态 1/1

14 SSD 配置 1/1

15系统盘 1/1

16 Nvdimm 1/1 17ECC错误巡检 1/1

18网口ARP解析 1/1 19 BMC的状态 1/1 20版本状态检查 1/1

21检查Modem的状态1/1

22检查节点间时间同步1/1 23检查syslog服务运行状态1/1

24

检查同一个diskpool内的磁盘利

用率是否均匀

1/1

25检查节点SATA盘中是否有坏盘 1/1 26节点池内存一致性检测 0/1

27

软件集群状态1/1

28检查打开的文件句柄数 1/1

29节点网络吞吐量 1/1 30节点IO统计信息 1/1

31看门狗状态 1/1 32MON与各子系统连接状态 1/1 33NTP 服务 1/1

34CM 主节点 1/1 35 ISM运行状态 1/1

36 License状态 1/1 37常见的文件操作测试 1/1 38NAS 客户端1/1 39 NAS 运行状态 1/1

40数据盘空间使用情况1/1 41节点间通讯链路 1/1

42内存池资源使用情况1/1 43关键数据一致性校验 1/1 44系统inode数量1/1 45文件数量超过阈值的目录 1/1

46 linux系统打开的文件句柄数1/1 47 NIS域控服务器的连接状态 1/148检查外部DNS的连通性0/14

LDAP域控服务器的连接状态 1/1 50 IPMI地址 1/1

51分级使用率 1/1

52未清除的告警 0/1

53业务主节点状态 1/1

54MON Server节点 1/1

55 Nvdimm内存池的使用1/1

56数据恢复状态 0/1

57检查过去三天是否存在数据恢复任务 0/1

58 nlun 状态1/1

59检查monitor频繁选主 1/1

60检查MDS的子树一致性 1/1

61检查近30天内是否有core和crash0/1

62检查NTP时间同步状态1/1

63检查节点RPC引用计数是否泄漏 1/1

64检测写NOFS是否有超时 1/1

65前端业务IP连通性检测 1/1

2.2存储版本巡检情况概述

现网运行的存储版本汇总如下:

设备型号设备名称设备SN 运行版本版本说明

2.3巡检问题汇总

本次巡检中,发现的不通过项目如下所示:

问题描述解决措施解决时间

3巡检结果总结

巡检项目巡检结果

基础巡检(根据巡检报告进行填写)

存储使用情况分析存储目前已经使用了30%(超过60%建议扩容)

4遗留问题处理

问题描述解决措施计划解决时间

5运行维护及其他方面的建议

1、定期进行设备硬件及软件的巡检。

2、参照《日常维护操作指导》中内容对设备进行例行检查和测试,并记录检

查结果,定期备份数据。

3、有问题请及时联系我们,为您提供7×24小时专家服务。

最后感谢贵公司长期以来对我公司的大力支持和理解,我公司将一如既往的为贵公司提供规范优质的服务。希望贵公司能多给我们的服务提出意见,您的意见就是我们最宝贵的财富。

用户意见:

用户签字:

:

相关主题
相关文档
最新文档