数据中心自动化运维技术探索之交换机零配置上线
Aruba CX 6400交换机系列产品说明书

模块化 Linux 体系结构上,所以我们的操作系统能够提供以下 独特功能:
时间序列数据库 (TSDB) 存储系统配置和运行状态数据,使其 可用于快速解决网络问题。这些数据也可用于分析趋势、识别
• 轻松访问所有网络状态信息,可提供独特的洞察和分析 异常和预测未来的容量需求。
能力 • 支持REST API 和 Python 脚本,能够实现网络任务的细粒
Aruba CX 移动应用程序 - 真正的部署便利性 易于使用的移动应用程序简化了 Aruba CX 6400 交换机的连 接和管理,适用于任何规模的项目。交换机信息还可以导入 Aruba NetEdit,以简化配置管理,并持续验证网络中任何地方 的配置一致性。Aruba CX 移动应用程序可以从这里下载。
的网络结构,以简化操作和故障排除。这个可以感知基础设施 用户角色策略自动创建隧道,并接入网络。凭借用户角色
和应用程序的解决方案还可以实现各种配置和生命周期事件的 策略,企业可以选择通过中心化网关上的七层状态防火墙对无 自动化。Aruba Fabric Composer 可提供一系列交互式的自动 线和有线流量实施统一的策略和微分段,也可以选择采用分布 化工作流,可以简化企业建立复杂网络环境时的工作复杂性。 式架构通过交换机上的四层ACL 实现角色到角色的访问控制。
布式架构。这可以确保我们的交换机具有非常低的延迟,增加
Aruba 动态隔离—园区和分支机构网络
数据包缓冲队列和实现自适应功耗。所有交换和路由均可达到
Aruba 动态隔离解决方案可以为各种规模网络上的有线和无线 线速,满足现在和未来带宽密集型应用程序的需求。每个交换
客户端提供无缝移动、一致的策略和自动化配置。它可以通过 机包括:
度可编程性 • 支持与其他工作流系统和服务完全集成的微服务体系结构 • 持续的状态同步,提供卓越的容错能力和高可用性 • 基于 WebSocket 订阅的持续遥测数据,实现事件驱动的
IDC智能机房整体解决方案

IDC智能机房整体解决方案随着科技的飞速发展,数据中心的运维和管理已经进入了智能化时代。
IDC智能机房整体解决方案,以其高效、安全、绿色的特点,日益受到业界的和重视。
一、IDC智能机房的必要性传统的IDC机房管理主要依赖人工,这种方式在信息化时代已经显得力不从心。
数据量的快速增长使得人工管理变得低效且易错;数据中心的高能耗、高成本、高风险等问题也需要更加智能、绿色的解决方案。
因此,IDC智能机房的出现,成为了一种必然的选择。
二、IDC智能机房的整体解决方案1、智能化监控管理IDC智能机房通过安装智能监控系统,可以实时监控机房的各项指标,如温度、湿度、空气质量、电力供应等,确保机房的运行环境始终保持在最佳状态。
同时,智能监控系统还可以对服务器、网络设备等关键设备进行实时监测,提前发现并解决潜在的问题,减少设备故障率。
2、自动化运维通过自动化运维,IDC智能机房可以大大提高设备的运行效率。
自动化运维系统可以根据预设规则,自动进行设备的开关机、重启、软件更新等操作,减少人工干预的错误,提高设备运行的安全性和稳定性。
3、绿色节能IDC智能机房采用高效UPS、节能空调等设备,以及智能电源管理系统,可以大大降低数据中心的能耗。
同时,智能机房还会采用一系列的绿色节能策略,如动态功率管理、智能冷却等,进一步提高数据中心的能源利用效率。
4、安全防护IDC智能机房的安全防护包括物理安全和网络安全两部分。
物理安全方面,智能机房采用人脸识别、指纹识别等技术手段进行进出管理,确保机房的安全。
网络安全方面,智能机房会建立完善的安全防护体系,包括防火墙、入侵检测系统、数据加密等,确保数据的安全性和完整性。
三、总结IDC智能机房是数据中心发展的必然趋势。
通过智能化监控管理、自动化运维、绿色节能和安全防护等方面的整体解决方案,IDC智能机房可以大大提高数据中心的运行效率和管理水平,降低能耗和成本,提高服务质量和客户满意度。
IDC智能机房还可以为企业的数字化转型提供强大的支持,推动信息产业的持续发展。
CloudEngine 6870系列数据中心交换机详版彩页

NA
NA
10GE SFP+接口
NA
48
24
48
100GE QSFP28
接口
6
6
6
4
交换容量
2.16Tbps/19.44Tbps1
1.68Tbps/15.12Tbps1 1.76Tbps/15.48Tbps 1
包转发率 风道类型
设备虚拟化
720 Mpps 标准前后或后前风道 支持iStack堆叠2 支持M-LAG
• OPS提供了丰富的Open API接口,可被业界主流云平台(含商业云平台和开源云平台)和第三方 Controller深度集成,支持业务对网络的灵活定制和自动化管理;
• 用户或第三方开发商可利用Open API接口,开发和部署专用的网络管理策略,从而迅速地实现业 务功能扩展、自动部署和设备的智能化管理,实现自动化运维,降低管理成本;
CloudEngine 6870系列 数据中心交换机
CloudEngine 6870系列数据中心交换机
产品概述
CloudEngine 6870(以下简称CE6870)系列是华为公司面向数据中心和高端园区推出的新一代高性 能、高密度、低时延、大缓存的万兆以太网交换机。CE6870采用先进的硬件结构设计,提供业界最 高密度的10GE端口接入,支持100GE上行端口,提供4GB的大缓存,解决视频、搜索等应用引起的流 量瞬时冲突问题,软件平台基于华为新一代的VRP8操作系统,支持丰富的数据中心特性和高性能的 堆叠,风道方向可以灵活选择。CE6870可以与华为数据中心核心交换机CloudEngine 12800配合构建 弹性、虚拟和高品质的云时代数据中心网络,实现端到端的大缓存网络,满足云时代数据中心对网络 的需求。 CE6870系列交换机定位于数据中心的高密万兆接入,帮助企业和运营商构建面向云计算时代的数据 中心网络平台,也可以用于园区网的核心或汇聚。
采购内容与相关要求

第五章采购内容及相关要求一、采购需求项目概况:遵循省人社厅行业标准明确公共招聘网发展模式方向。
在推广使用公共招聘网过程中,坚持以模式一为发展方向,第一种模式(直接使用):市、县(区)公共就业人才服务机构直接使用省厅的信息平台、云服务器和数据中心,通过建设地方频道为求职者、用人单位提供就业创业服务。
通过完善公共招聘网服务功能、提升公共招聘网云服务能力、改进公共招聘网服务体验,引导和鼓励市县公共就业人才服务机构按照模式一来推进人力资源市场建设、提供线上服务。
注:1、技术参数中标▲的参数,谈判响应文件中需提供证明文件并标明页数,否则谈判小组有权视为不响应。
(证明文件为谈判响应文件中提供的相关技术证明文件(第三方检测报告(含附件)或产品技术白皮书或产品彩页或其他技术参数要求提供的证明材料(如有)))2、如果在技术参数或配置中标明了品牌或产地,则仅供参考,并非指定,投标人可以选用替代的方案,但这种替代整体上要优于或相当于谈判文件的相关要求。
3、为鼓励不同品牌的充分竞争,如某货物的某技术参数或要求属于个别品牌专有,则该技术参数及要求不具有限制性,投标人可对该参数或要求进行适当调整,并应当在谈判响应文件中说明调整的理由,且该调整须经评委会审核认可。
4、所有描述为“支持”的,均表示具备、配置、提供、实现等意思,是要满足技术参数的要求。
二、商务要求1、货物的生产、安装、维修、检验、验收等按照以下原则执行:有国家标准的执行国家标准;无国家标准的执行行业标准;无行业标准的执行地方标准;无地方标准的执行企业标准。
2、所有货物(包括零部件)须为全新的、未使用过的原装正品。
3、本次采购所需的全部设备货物,投标人必须采用已经在中国境内实地安装使用并可靠稳定运行的设备。
所有设备必须具有良好的生产工艺,室外设备必须具有良好的防盗、防水、防锈、防尘功能。
4、货物的制造日期:成交供应商应提供全新的未使用的货物,货物的制造日期距本项目投标日不超过 1 年。
H3C iMC数据中心管理方案建议书V1.0(201108)[2]
![H3C iMC数据中心管理方案建议书V1.0(201108)[2]](https://img.taocdn.com/s3/m/3d6fc870f46527d3240ce08c.png)
H3C iMC数据中心管理方案建议书(V1.0)杭州华三通信技术有限公司All rights reserved版权所有侵权必究H3C iMC 数据中心管理方案建议书Keywords关键词:iMC,数据中心,网络流量,智能报表,虚拟化,ITIL,应用管理,SLA,零配置Abstract摘要:H3C iMC数据中管理方案提供了一体化、可视化的基础设施管理,虚拟化、自动化的IP资源管理,多维度、新模型的应用和流量管理,规范化、可衡量的IT运维流程管理,实现了管理平台、流量分析、行为审计、安全设备等各种资源之间的智能联动,为实现基于用户、开放式、自动化、智能化的数据中心管理打下了基础,为数据中心资源的动态调配、最优化利用提供了保障。
Abbr. List缩略语:目录1 综述 (6)1.1 建设背景 (6)1.2 现状分析 (6)1.3 建设目标 (7)1.4 建设内容 (7)2 H3C iMC数据中心管理方案介绍 (8)2.1 一体化、可视化的基础设施管理 (9)2.2 虚拟化、自动化的IP资源管理 (9)2.3 多维度、新模型的应用和流量管理 (10)2.4 规范化、可衡量的IT运维流程管理 (11)3 H3C iMC数据中心管理产品介绍 (12)3.1 基础设施管理 (12)3.1.1 全面的基础设施管理 (12)3.1.2 灵活方便的拓扑功能 (14)3.1.3 方便易用的性能管理 (19)3.1.4 设备配置管理 (20)3.1.5 智能的告警管理 (25)3.1.6 Syslog管理 (27)3.2 IP资源管理 (27)3.2.1 零配置自动化部署 (27)3.2.2 ACL管理 (29)3.2.3 VLAN管理 (31)3.2.4 IP/MAC管理 (33)3.3 网络应用流量分析 (38)3.3.1 任务式多角度网络流量分析 (38)3.3.2 结合拓扑、设备管理直观展示网络流量 (38)3.3.3 流量分析widget监控 (38)3.3.4 分布式流量监控能力 (39)3.3.5 总体流量趋势分析 (39)3.3.6 应用流量分析 (40)3.3.7 源主机\目的主机\会话流量分析 (40)3.3.8 智能基线及流量告警 (41)3.3.9 未知应用流量分析 (41)3.3.10 七层应用流量分析 (42)3.3.11 基于用户的流量分析 (42)3.3.12 主机连接数统计分析 (42)3.3.13 业务间流量统计分析 (43)3.3.14 VPN流量统计分析 (43)3.3.15 网络应用自定义 (44)3.4 虚拟化管理 (44)3.4.1 虚拟化网络管理 (44)3.4.2 VMWare虚拟服务器管理 (47)3.4.3 Hyper-V虚拟服务器管理 (50)3.5 应用性能管理 (51)3.5.1 简便灵活的web架构,易于部署和使用 (52)3.5.2 全方位的监视功能,更清晰地展示各种信息 (52)3.5.3 故障根源分析,协助管理人员快速解决问题 (53)3.5.4 丰富的报表功能,便于工作总结和汇报 (54)3.5.5 SLA水平测量,服务质量更有保障 (54)3.5.6 应用与拓扑融合管理,IP与IT的完美结合 (54)3.6 数据中心综合SLA分析 (55)3.6.1 增加KQI指标 (55)3.6.2 数据中心综合SLA分析报表 (56)3.7 智能报表分析 (57)3.7.1 集中的报表管理平台 (58)3.7.2 完备的开放数据源 (58)3.7.3 强大的智能分析能力 (58)3.7.4 丰富的预定义报表模板 (58)3.7.5 灵活而强大的报表设计功能 (58)3.7.6 无缝的设计环境和用户操作环境融合 (59)3.7.7 业界领先的报表展示 (59)3.7.8 快速自定义报表 (60)3.7.9 自动化的周期性报表机制 (61)3.7.10 实时的立即报表 (62)3.7.11 我的报表视图 (62)3.7.12 Email自动发放报表 (62)3.8 运维流程管理 (62)3.8.1 实时、精确的联合CMDB (63)3.8.2 完整的服务运维流程 (63)3.8.3 融合iMC告警模块的网络故障维护流程 (64)3.8.4 融合iMC配置管理的网络变更流程 (65)3.8.5 快捷灵活的流程定制能力 (65)3.8.6 集中的知识库管理 (66)3.8.7 服务台 (66)4 系统功能 (67)4.1 个性化首页定制 (67)4.2 系统安全管理 (68)4.2.1 操作员登陆管理 (68)4.2.2 操作员密码管理 (68)4.2.3 操作日志管理 (68)4.2.4 操作员在线监控和管理 (68)4.3 分权管理 (68)4.4 分级部署 (70)4.4.1 重要告警上报与下级网管状态监控 (71)4.4.2 无缝衔接的分级拓扑 (71)4.4.3 灵活丰富的分级报表 (71)4.5 硬件要求 (72)4.5.1 iMC平台部署硬件要求 (72)4.5.2 NTA组件部署硬件要求 (74)4.5.3 DIG采集器组件配置要求(可选) (75)4.5.4 APM部署方案(仅限Windows操作系统) (75)4.5.5 SOM部署方案 (75)4.5.6 iAR报表组件配置要求 (76)1 综述1.1 建设背景“网络三分靠建设,七分靠管理”,对于一个拥有一定规模数据中心的用户来说,管理永远是一个大“问题”。
数据中心信息系统运维服务技术要求

数据中心信息系统运维服务技术要求一、引言数据中心作为现代化企业的核心技术基础设施,承担着重要的数据存储、处理和传输任务。
为确保数据中心信息系统的高效运行,保证企业数据的安全性和可靠性,需要建立一套科学、规范的运维服务技术要求。
二、硬件设备维护要求在信息系统运维中,硬件设备的维护是重中之重。
为确保硬件设备的正常运行,需要遵循以下技术要求:1. 定期检测硬件设备的温度、电压、风扇转速等参数,及时发现并解决潜在问题;2. 做好硬件设备的清理工作,定期使用吹风机或专用设备清除设备表面和内部的灰尘;3. 定期备份数据,确保数据的安全性和可恢复性,备份数据存放在离线介质中。
三、服务器运维要求服务器是数据中心中最关键的设备之一,对其进行正确的运维是确保信息系统正常运行的基础。
以下是对服务器运维的技术要求:1. 定期对服务器进行操作系统、应用软件和安全补丁的升级,确保系统处于最新和安全的状态;2. 做好服务器的性能监控工作,包括CPU利用率、内存利用率、磁盘空间等指标的监测和分析;3. 定期进行服务器的备份,将备份数据存储在可靠的介质中,并进行定期的恢复测试;4. 定期清理服务器的日志文件和临时文件,释放磁盘空间,提高系统的性能。
四、网络设备运维要求网络设备是数据中心中连接服务器和用户的桥梁,需要进行正确的运维以确保网络的稳定性和安全性。
以下是对网络设备运维的技术要求:1. 定期备份网络设备的配置文件和系统镜像,确保网络设备的可恢复性;2. 建立网络设备的监控系统,对网络设备的连接数、流量、带宽利用率进行实时监测;3. 对网络设备进行定期的性能优化,包括调整设备的缓存大小、优化路由的选择等;4. 进行网络设备的安全审计,及时发现和处理网络攻击和其他安全威胁。
五、安全防护要求数据中心作为企业重要数据的存储和处理场所,需要进行严格的安全防护。
以下是对数据中心安全防护的技术要求:1. 建立完善的防火墙策略,限制进出数据中心的网络流量,防止未授权的访问;2. 使用安全性高的身份认证机制,如双因素认证,确保用户访问的合法和安全;3. 定期审查和更新访问控制策略,限制特定用户对敏感数据的访问权限;4. 定期进行数据中心的安全漏洞扫描和评估,及时修补和加固系统的安全性。
交换机配置教程

交换机配置教程目录一、基础概念 (2)1.1 什么是交换机 (2)1.2 交换机的功能 (3)二、交换机基本操作 (4)2.1 连接电源 (5)2.2 登录交换机 (6)2.3 查看和修改配置 (7)三、交换机基本配置 (8)四、交换机高级配置 (9)五、交换机故障排查与维护 (10)5.1 常见故障排查方法 (11)5.2 系统升级与备份 (12)六、交换机配置实例 (14)6.1 企业办公网络配置示例 (15)6.2 校园网配置示例 (16)6.3 企业数据中心配置示例 (17)七、交换机命令行界面 (18)八、交换机配置文件管理 (19)8.1 配置文件的作用 (21)8.2 配置文件的创建与导入 (22)8.3 配置文件的备份与恢复 (24)九、交换机与网络操作系统的集成 (24)十、交换机安全性配置 (26)10.1 交换机安全管理 (27)10.2 交换机端口安全 (28)10.3 交换机访问控制列表 (29)十一、交换机性能优化 (31)11.1 交换机端口流量控制 (33)11.2 交换机背压控制 (34)11.3 交换机缓存优化 (35)十二、交换机应用场景 (37)12.1 企业办公网络 (38)12.2 企业数据中心 (40)12.3 无线网络 (42)十三、总结与展望 (43)13.1 交换机配置教程总结 (44)13.2 未来交换机技术发展趋势 (44)一、基础概念交换机是一种网络设备,主要用于在局域网(LAN)中实现数据的转发和通信。
它的主要功能是接收来自一个端口的数据包,然后根据目标MAC地址将数据包转发到另一个端口,从而实现不同设备之间的通信。
交换机的工作原理类似于电话交换机,通过识别源MAC地址和目标MAC地址来决定数据包的转发路径。
交换机通常有两种工作模式:访问控制列表(ACL)模式和广播模式。
在ACL模式下,交换机会根据预先设定的规则对数据包进行过滤,只有符合规则的数据包才会被转发。
数据中心运维操作要求及流程

数据中心运维操作要求及流程
一、数据中心运维操作要求
1. 机房环境
1.1 温度控制在24~27℃,湿度控制在40%~60%
1.2 机房保持干净整洁,禁止踩踏机房铺设的电缆和光缆;
1.3 机房内禁止吸烟、饮食、饮水等行为;
1.4 机房内限制异物进入,并严格控制人员进入。
2. 设备管理
2.1 设备要保持清洁、干燥、避光和通风良好的环境中运行,每周需要进行设备巡检。
2.2 设备接口必须正确插入,以免掉电等影响机房稳定运行。
2.3 机房中设备必须按照标准机柜放置和固定。
3. 安全管理
3.1 数据库、服务器、交换机、防火墙等设备不得随意更改、
拷贝、删除和传输等;
3.2 禁止储存和使用盗版软件和文档;
3.3 数据中心要求运维人员每周或隔周对数控中心重要设备软
件漏洞和系统安全进行检查,对于发现的问题及时报告并处理。
二、数据中心运维流程
1. 上线前测试验证流程
机房经理安排人员测试并审批,测试验收合格的设备方可上线;
2. 日常维护流程
每周按计划进行设备巡检,如果发现有异常需要及时处理;
在机房设备维修、升级等操作中,需由经理提前安排,操作人员需按照安排进行操作,并备份好数据,以防操作错误导致数据丢失;
3. 突发事件处理流程
突发事件发生后,第一时间需要通知机房经理,并及时处理,同时要进行相关数据备份,并上报技术支持部门协同处理;
4. 下线操作流程
经过讨论并达成一致意见后,由机房经理提出申请,申请由负责人批准后,可以进行下线操作,操作完成后记录好操作记录和数据备份记录。
以上就是我们数据中心运维操作的要求和流程,希望大家都能够认真遵守执行。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
近几年来,互联网行业处于一个快速发展的快车道,一个又一个风口不断地涌向周边行业。
共享单车的出现解决了人们出行最后一公里的问题;新零售概念的提出,无人货柜的出现,更是将线上和线下的数据打通,优化了人们的购物体验;以抖音为首的短视频应用,在一夜间爆红,成为当下社交与宣传的重要载体。
而数据中心作为支撑这些业务的基础设施,其规模也随着业务的激增逐渐扩大,单集群内超过数万台服务器的情况已不再罕见。
面对如此庞大的服务器数量,在网络建设之初的交换机网络开局已成为网工的梦魇。
数据中心开局现状
聚焦于数据中心场景,我们先来回顾一下传统的交换机网络开局流程。
▲传统网络设备开局流程
Step 1:提前准备交换机的版本文件;
Step 2:根据部署的架构场景选择对应的配置模板;
Step 3:开始“搬砖”,到达现场,设备拆箱集中堆放,加电启动;
Step 4:使用U盘插到交换机,串口线连接设备,逐台进行版本升级(若需要);
Step 5:根据配置模板结合实际设备的情况进行VLAN、IP、路由以及其他基本信息的修订,然后开始刷配置(另外按照各公司要求,还会协助收集设备的SN用于资产管理);
Step 6:协调弱电同学帮忙搬到机房上架;
Step 7:基于Checklist完成连通性的测试工作。
整套流程下来,既耗人力,又耗时间。
据实际项目经验来看,在不堆叠的前提下完成一台设备的升级和配置大约在10分钟,堆叠情况下由于设备需要重启,需要30分钟才能完成。
总结来看,对于支撑数万台服务器集群的数据中心网络场景,如果按照这种传统的开局模式来部署,会存在以下几点不足:
• 效率低下:靠手工方式进行设备的版本升级、刷脚本,效率非常低;
• 出错率高:重复性的工作会导致网工疲于思考,稍有不慎出现失误,需要额外的时间用于排查错误更正,产生一定的时间损耗。
对此,各厂家做了许多的探索,比如零配置上线技术。
数据中心自动化开局
随着数据中心规模的不断增大,标准化的建设方式已经成为主流。
每个集群内的服务器以及网络设备的规模都是固定的,对应到网络设备的配置策略也是一致的(当然IP等基础信息会略有不同)。
因此,在这样标准化、规范化的场景下,我们可以将这些重复性的、机械性的工作编成处理逻辑,交给网络设备自己去完成上线工作,进而解放人力,同时也降低了人们出错的风险。
厂商对于自动化上线技术的开发,主要是利用编程语言(比如Python、Go等)进行逻辑处理,让网络设备自行加载,完成上线,例如ZAM(Zero-configure Automatic Manage,零配置自动管理)技术。
交换机自动化上线的思路:新出厂或空配置的设备上电启动后自动向文件服务器中获取文件并加载(包括版本文件、配置文件、补丁文件等),实现设备的免现场配置、部署,从而避免了运维人员重复地执行刷脚本、升级等机械性操作,提升开局效率。
以ZAM技术为例,首先要在运维端搭建统一的DHCP服务器和TFTP服务器(可以是同一台服务器),基于架构标准化设计和项目信息提前生成每台设备的完整配置文件以及版本文件,同时这些文件的文件名需要与设备的SN关联起来,确保每个配置文件可以对应唯一一台具体的物理设备。
▲零配置上线方案架构
交换机加电起机后会主动发起DHCP请求,通过Option拿到TFTP服务器的地址以及脚本名称。
通过
TFTP的方式下载到脚本文件后,解析并执行。
然后自动进行版本的升级以及配置文件的加载,重启后完成设备开局。
主要流程如下:
▲零配置上线流程
细节可以分拆成几个阶段来理解:
DHCP&TFTP获取阶段
设备加电后,首先判断自身是否存在配置文件,如果不存在则进入ZAM模式;如果存在则正常加载现有配置文件启动;
进入ZAM模式后,会先尝试从MGMT口上发起DHCP请求,无应答后会从业务口上广播该请求报文。
DHCP Server在回应报文中通过Option66(或者150)、67选项,将TFTP Server的IP以及Python脚本名称同步给设备;
▲典型的DHCP配置
交换机设备(需要支持Python的运行环境)进行Python脚本的下载。
自动化执行阶段
• 初始化:
首先要进行初始化,与此同时要清空之前运行过的本地文件,目的是为了避免那些通过错误逻辑模块到达该处时文件错乱的情况,因此需要执行初始化操作;
• 上传SN:
初始化完成后需要上传设备自身的SN到指定的目录下,目的是提示TFTP Server该设备已经开始启动。
即上传[sn]. ZAM到/ZAM_STARTUP/, 若上传失败则写"0"到/etc/zam.txt (通告zam执行失败),退出;• 配置参数文件下载:
上传SN之后,会基于SN去下载对应的配置参数文件(.PARAM格式),下载路径在代码中已经写好,若下载失败则跳到错误处理;
• 配置参数文件解析:
下载成功后解析该文件,判断是否需要升级版本,若解析失败则跳到错误处理;
• 配置文件下载:
通常情况下,脚本中会默认写好配置文件的下载路径,设备会基于SN到该路径下载配置文件[sn].CFG, 若下载失败跳到错误处理;
• 版本文件下载:
如果配置参数文件中存在bin文件的标识,则到指定的路径去进行bin文件的下载,若下载失败则跳到错误处理;
• 版本文件升级:
如果存在bin的文件,则进行升级bin文件,若升级失败则跳到错误处理;
• 配置文件重命名:
执行代码做配置文件的重命名,更改成config.txt的格式后重启(不同厂家配置文件命名不同,还要看具体的厂家;
• 设备重启加载:
重启设备后则再次进行配置文件的判断,发现此时存在配置文件,则不进入ZAM模式,正常加载配置文件并启动。
信息同步校验阶段
• 成功处理:
设备成功上线后
A. 上传[sn].log 到/ZAM_LOG/
B. 上传[sn].ok 到/ZAM_STATUS/
C. 写"1"到/etc/zam.txt (通告zam执行成功)
D. 清空本地本次执行相关文件([sn].CFG, [sn].ZAM, [sn].params, [sn].ok, [sn].error)
▲ZAM文件夹目录
▲成功执行ZAM流程
• 失败处理:
主逻辑任意一个节点发生故障,跳到故障处理时,执行下列动作
A. 上传[sn].log 到/ZAM_LOG/
B. 上传[sn].error 到/ZAM_STATUS/
C. 写"0"到/etc/zam.txt(通告zam执行失败)
D. 清空本地本次执行相关文件([sn].CFG, [sn].ZAM, [sn].params, [sn].ok, [sn].error)
探索创新
随着网络设备对于类似Python的高级编程语言环境的支持愈加成熟,零配置上线技术在IDC场景中得到了普遍的应用。
一方面加快了设备的开局速度,降低了人为操作失误的风险,节省人力投入;另一方面,对于后期设备的运维工作(比如扩容、故障替换等),只需要上报或者替换SN就可以自动完成加载,也不需要人工的参与。
那么,除了IDC场景有这样的需求之外,对于其他场景,是否也存在类似的运维痛呢?
最近火爆的新零售门店,其特点就是数量众多,业务的激增导致开店速度尤其快。
但是门店不会有专业的运维同学驻场,所以网络开局时需要网工四处出差;日常遇到故障,如果远程不能解决也需要网工到现场处理,人力投入极大。
对此,聚焦于新零售门店场景,我们基于数据中心零配置开局的思路进行创新,致力于打造全新的自动化门店网络解决方案,提升新零售门店网络开局和运维的效率,减少人力服务成本。
▲自动化门店网络解决方案组网设计。