华为培训资料-故障处理
华为PON设备故障处理手册

附件二华为PON设备故障处理手册目录(TOC Heading)第1章业务故障处理思路 (3)1.1 业务故障整体处理思路 (3)1.1.1 故障处理整体思路 (3)1.2 故障分析处理常用方法和介绍 (4)1.2.1 故障处理常用方法 (4)1.2.2 告警分析 (5)1.2.3 性能分析 (6)1.2.4 分段处理 (6)1.2.5 仪表测试 (7)1.2.6 对比分析 (8)1.2.7 互换分析 (8)1.2.8 配置数据分析 (8)1.2.9 协议分析 (9)第2章语音业务故障处理指导 (10)2.1接口注册异常问题 (10)2.1.1原因分析 (10)2.1.2排查方法 (10)2.1.3典型案例 (11)2.2主叫摘机无馈电问题 (14)2.2.1原因分析 (14)2.2.2排查方法 (15)2.2.3典型案例 (17)2.3主叫摘机无拨号音问题 (18)2.3.1原因分析 (18)2.3.2排查方法 (18)2.3.3典型案例 (19)2.4主叫摘机听忙音问题 (21)2.4.1原因分析 (21)2.4.2排查方法 (21)2.4.3典型案例 (23)2.5主叫拨号忙音(或不通)问题 (24)2.5.1原因分析 (24)2.5.2排查方法 (24)2.5.3典型案例 (25)2.6被叫振铃异常问题 (27)2.6.1原因分析 (27)2.6.2排查方法 (28)2.6.3典型案例 (29)2.7被叫来电显示异常问题 (30)2.7.1原因分析 (30)2.7.2排查方法 (30)2.7.3典型案例 (31)2.8语音质量问题(单通、杂音、回声) (32)2.8.1原因分析 (32)2.8.2排查方法 (33)2.8.3典型案例 (33)2.9传真类问题 (35)2.9.1原因分析 (35)2.9.2排查方法 (36)2.9.3典型案例 (36)第1章业务故障处理思路1.1 业务故障整体处理思路1.1.1 故障处理整体思路各处理步骤的详细指导如下:了解故障现象和进行信息收集:接到故障申告时,请在第一时间收集以下故障信息:●故障发生的具体时间。
培训-06 FusionCompute日常维护与故障处理5

系统接口涉及到底层网络硬件,主机和VRM节点,排除故障时可自顶 向下快速定位故障层次,然后再自底向上逐步排除故障点。
系统接口故障案例 - 删除存储接口路由导致异常
• 删除存储接口路由后,提示存储链路中断,关联虚拟机不能使用 收集信息
• 主机与存储设备通过三层网络连接,主机的存储接口和存储设备的存储IP地址不 定位故障 在同一网段,需要设置静态路由,使存储平面能够互通
管理员可以通过FusionCompute查看操作任务的进度
1. 维护管理
日常监控 配置管理 用户管理 FusionCompute备份与恢复
2. 故障管理Байду номын сангаас
FusionCompute账户
FusionCompute账户分为:本地用户、域用户、接口对接用户。本地用户用于登 录、管理系统;在配置域后可用域用户登录系统;接口对接用户用于其他用户对接。
提示
检测到潜在的或即将发生的影响业务的故障,但是目前对业务还没有影响,这种情况下的告警 为提示告警。
实时监控
管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运 行状态
1. 维护管理
日常监控 配置管理 用户管理 FusionCompute备份与恢复
2. 故障管理
系统配置 (1)
管理员可以根据业务需求对FusionCompute系统配置参数作出调整。
配置域认证信息 更新License 修改系统Logo 配置登录超时时间 配置资源调度周期 配置SNMP管理站 VRM单节点扩展为主备部署 ······
系统配置 (2)
任务管理
• FusionCompute服务异常,无法启动VRM虚拟机
华为光网络维护宝典—故障处理专题篇

华为光网络维护宝典——第2部分故障处理专题篇目录第1章OptiX 光网络产品IP与ID故障处理专题 ..................................... 错误!未定义书签。
1.1背景知识 ................................................................................................. 错误!未定义书签。
1.1.1网元ID.......................................................................................... 错误!未定义书签。
1.1.2IP地址 .......................................................................................... 错误!未定义书签。
1.1.3ID与IP的关系.............................................................................. 错误!未定义书签。
1.2常用的命令 ............................................................................................. 错误!未定义书签。
1.2.1设置/查询网元扩展ID(或子网号) .................................................. 错误!未定义书签。
1.2.2设置/查询网元的IP地址............................................................... 错误!未定义书签。
华为基站故障处理汇总

一、BSC中的MO状态1。
TRXC和LU能够处于下列的各种状态之一:2。
TRXC:复位(Reset)、启动(Started ) 和TGC激活(TGC Active)。
3。
LU:复位(Reset)、不激活(Disabled)和激活(Enabled)。
4。
能够用指令:RXMSP:MO=-----;来打印MO的状态。
参数BTS指示状态。
如果TRXC激活而TGC没有激活时参数TGC来指示状态。
5。
MO的各种状态表:所有的MO都有下列的各种通用状态:1。
UNDEF:MO没有定义。
2。
DEF:MO被定义在预服务状态中。
3。
COM:MO被人工闭塞。
4。
PREOPER:MO正在进入操作状态。
5。
OPER:MO正处于操作状态中。
6。
NOOPER:MO暂时不处于操作状态。
7。
FAIL:MO永久不处于操作状态。
8。
打印例:〈RXMSP:MOTY=RXETRX;RADIO X-CEIVER ADMINISTRTIONMANAGED OBJECT STATUSMO STATE BLSTATE BLO BLA BTS CONF TGCRXETRX-0-0 OPER 0000 0000 STA ARXETRX-0-1 OPER 0000 0000 STA S9。
所有的MO也可能是下列各种闭塞状态中的一种:BLL:由于正处于程序的加载过程而出现的闭塞。
BLT:由于正处于测试过程而出现的闭塞。
MBL:人工闭塞。
BLO:自动闭塞。
BLA:由于激活的需要所产生的闭塞。
如果出现了自动闭塞状态(BLO),则可从BLO的解码表中查出自动闭塞的原因。
二、BLO bit的解码表为:表中的各项说明:-:空。
LMT:MO由于本地维护激活而闭塞。
OML:MO由于OML变化而闭塞。
TGC:MO由于TGC变化而闭塞。
TRXC:MO由于TRXC变化闭塞。
TG:MO由于TG变化而闭塞。
AS:MO可能由于有故障而闭塞。
AT:MO由于自检而暂时闭塞。
AP:MO由于自检而固定闭塞。
华为光网络维护宝典—故障处理专题篇

华为光网络维护宝典——第2部分故障处理专题篇目录第1章OptiX 光网络产品IP与ID故障处理专题 ..................................... 错误!未定义书签。
1.1背景知识 ................................................................................................. 错误!未定义书签。
1.1.1网元ID.......................................................................................... 错误!未定义书签。
1.1.2IP地址 .......................................................................................... 错误!未定义书签。
1.1.3ID与IP的关系.............................................................................. 错误!未定义书签。
1.2常用的命令 ............................................................................................. 错误!未定义书签。
1.2.1设置/查询网元扩展ID(或子网号) .................................................. 错误!未定义书签。
1.2.2设置/查询网元的IP地址............................................................... 错误!未定义书签。
华为培训资料-故障处理

这个问题是连续出现,还是间断出现的? 是完全不能备份,还是备份的速度慢(即性能下降)? 哪个或哪些局域网服务器受到影响,地址是什么? 在网络的高峰期,日志服务器10.11.56.11到集中备份服务器 10.15.254.253之间进行备份时,FTP传输速度很慢,大约是 0.6Mbps。
正确的故障现象描述是:
Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast -------- -------------------- -------------------- ---------------6/32 10317812 0 8665 Port Xmit-Unicast Xmit-Multicast Xmit-Broadcast -------- -------------------- -------------------- ---------------6/32 6667987 286652 2474038
华为技术有限公司
版权所有,侵权必究
4
网络故障的一般分类
连通性问题
性能问题
硬件、媒介、电源故障 配置错误 不正确的相互作用
网络拥塞 到目的地不是最佳路由 供电不足 路由环路 网络错误
华为技术有限公司
版权所有,侵权必究
5
一般网络故障的解决步骤
故障处理系统化是合理地一步一步找出故障原因 并解决的总体原则。它的基本思想是系统地将由 故障可能的原因所构成的一个大集合缩减(或隔 离)成几个小的子集,从而使问题的复杂度迅速 下降。
网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? 是否有用户访问受影响的服务器时没有问题? 在非高峰期日志服务器和备份服务器间FTP传输速度是多少?
华为PTN常见开局故障处理讲课文档

第十二页,共34页。
Page 13
DCN 故障处理案例2/3
•案例类型-环回引发DCN 风暴导致网元脱管
故障现象
PTN 网络的网关网元穿越一个IP 传送网络后,保持与网管中心之间的通信 PTN 网络中的非网关网元全部脱管,系统中出现大量MPLS_TUNNEL_LOCV 告警,业务中断
处理步骤
步骤1:检查该网关网元主控板上的ETH 接口,发现该接口通过网线与IP 传送网络中一台路由器的2 号接口直连。该路由器的1 号接口连接网管,但 3 号接口与4 号接口被另一条网线直连,产生了环路 步骤2 : IP 传送网络中的大量DCN 报文及其它报文通过交换机的环路被引入PTN 网络中,造成网关网元的CPU 长期被完全占用,而PTN 网络内非网关 网元的DCN 报文及其它协议报文无法得到处理,最终导致网元脱管,业务中断 步骤3:拔掉引发交换机环回的网线,PTN 网络恢复正常
3.链路追踪检测(LT),源端MEP 发送LTM 帧,同时启动定时器开始计时。链路上所有的MIP 都会转发LTM 帧,所有收到LTM 帧的 MEP 和MIP 都会回送LTR 帧响应,根据这些LTR 帧可以判断出源MEP 到目的MEP 所经过的所有MIP。如果源端MEP 定时器超时,LT 失败
第七页,共34页。
处理步骤
步骤1 :在网元NE01 上连接仪表做误码测试。将NE04 的L75 单板上的2M 端口设置为“内环回”,仪表显示有大量误码。 步骤2 :在NE03 配置静态ARP 表项,MAC 地址选择NE03 的出端口,IP 地址选择NE04。在NE03 和NE04 之间创建入 标签和出标签相同的Tunnel 步骤3 :将NE04 的网络侧端口设置为“外环回”,连接NE01 的仪表仍然显示有误码,将NE03 上连接NE04 的网络
华为硬件告警及故障处理培训

接头类型
N型母头 连接1/2’跳线。
说明
HUAWEI TECHNOLOGIES Co., Ltd.
HUAWEI Confidential
Page 5
DRFU硬件单板 硬件单板
面板指示灯
指示灯
RUN 亮 灭 闪烁(0.5Hz) 闪烁(4Hz) ALM ACT 亮 灭 亮 灭 闪烁(0.5Hz)
状态
含义
HUAWEI TECHNOLOGIES Co., Ltd.
HUAWEI Confidential
Page 9
DRFU收发天馈配置 收发天馈配置
单天馈双接收
DRFU单个天馈发射,主分集接收。
双天馈
DRFU两个收发天馈,主分集接收。
双天馈四接收
每个DRFU配置两个收发天馈,可以配置两个DRFU双拼实现载波的四路 分集接收。
HUAWEI Confidential
Page 11
DRFU单板发射模式 发射合路或独立 单板发射模式-发射合路或独立 单板发射模式
发射独立
Interface Processing Unit
ANT1 DUP
CPRI0
CPRI1
ANT2 DUP
发射合路
Interface Processing Unit
电源输入正常,但BBU有问题。 没有电源输入或模块损坏。 模块正常。 正在加载软件或者正在启动。 故障告警。 无告警。 模块连接到BBU,运行正常。 与BBU无连接。 DRFU模块被测试中。
HUAWEI TECHNOLOGIES Co., Ltd.
HUAWEI Confidential
Page 6
DRFU硬件单板 硬件单板
HUAWEI TECHNOLOGIES Co., Ltd.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
该案例组网如上:某校园网的三个局域网,其中10.11.56.0为一个用户网段, 10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网
段。
华为技术有限公司
版权所有,侵权必究
9
1.故障现象描述
要想对网络故障做出准确的分析,首先应该了解故障表现 出来的各种现象
网络设备故障排除
版权所有,侵权必究
1
内容提要
网络故障处理技术概述 一般网络故障的解决步骤 Quidway中低端路由器产品介绍 路由器常用诊断工具介绍 故障处理常用方法 故障处理对网络维护和管理人员的要求
华为技术有限公司
版权所有,侵权必究
2
网络故障处理技术概述
当今的网络互连环境是复杂的,而且其复杂性的还在日益增 长,主要原因如下:
华为技术有限公司
版权所有,侵权必究
3
网络故障处理技术概述
能够正确地维护网络尽量不出现故障,并确保出 现故障之后能够迅速、准确地定位问题并排除故 障,对网络维护和管理人员来说是个挑战。
这不但要求对网络协议和技术有着深入的理解, 更重要的是要建立一个系统化的故障处理思想并 合理应用于实际中,以将一个复杂的问题隔离、 分解或缩减排错范围,从而及时修复网络故障。
中间网络性能问题,主要是到网络10.15.0.0的路由不 是最佳路由
华为技术有限公司
版权所有,侵权必究
13
5. 对每一原因实施排错方案
根据所列出的可能原因制定故障排查计划,分析 最有可能的原因,确定一次只对一个变量进行操 作,这种方法使你能够重现某一故障的解决办法。 如果有多个变量同时被改变,而问题得以解决, 那么如何判断哪个变量导致了故障发生呢?
与日志服务器间进行FTP传输时速度慢,只有0.6Mbps; 在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为
6Mbps;
华为技术有限公司
版权所有,侵权必究
11
3. 经验判断和理论分析
利用前两个步骤收集到的数据,并根据自己以往的故障处 理经验和所掌握的的知识,确定一个排错范围。通过范围 的划分,就只需注意某一故障或与故障情况相关的那一部 分产品、介质和主机。
华为技术有限公司
版权所有,侵权必究
12
4. 各种可能原因列表
该步骤列出根据经验判断和理论分析后总结的各 种可能原因。
如上述案例,可能原因如下:
网段10.11.56.0的性能问题,其原因可能为 : 日志服务器A的性能问题 10.11.56.0网络的网关性能问题 10.11.56.0网络本身的性能问题
华为技术有限公司
版权所有,侵权必究
10
2. 相关信息收集
搜集有助于查找故障原因的详细信息:
向受影响的用户、网络人员或其他关键人员提出问题; 根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议
分析仪、相关display和debug命令等; 测试性能与网络正常情况下的记录进行比较。
如上述案例,可以向用户提问或自行收集下列相关信息:
华为技术有限公司
版权所有,侵权必究
4
网络故障的一般分类
连通性问题
硬件、媒介、电源故障 配置错由 供电不足 路由环路 网络错误
华为技术有限公司
版权所有,侵权必究
5
一般网络故障的解决步骤
故障处理系统化是合理地一步一步找出故障原因 并解决的总体原则。它的基本思想是系统地将由 故障可能的原因所构成的一个大集合缩减(或隔 离)成几个小的子集,从而使问题的复杂度迅速 下降。
现代的因特网络要求支持更广泛的应用,包括数据、语音、 视频及它们的集成传输;
新业务发展使网络带宽的需求不断增长,这就要求新技术 的不断出现。例如:十兆以太网向百兆、千兆以太网的演 进;MPLS技术的出现;提供QoS能力等。
新技术的应用同时还要兼顾传统的技术。例如,传统的 SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承 载SNA的一种技术而被应用。
网络结构或配置是否最近修改过,即问题出现是否与网络变化有关? 是否有用户访问受影响的服务器时没有问题? 在非高峰期日志服务器和备份服务器间FTP传输速度是多少?
通过该步骤,我们收集到了下面一些相关信息:
最近10.11.56.0网段的客户机不断在增加; 129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,
下面我们以一个故障处理的实例来学习如何应用 这些步骤。
华为技术有限公司
版权所有,侵权必究
8
故障处理的实例
用户网段广播包过多造成该网段的服务器FTP业务传输速度慢
ETHERNET D:129.9.35.53/16
B:10.15.254.253/16 ETHERNET
网云
C:10.11.56.120/24 ETHERNET
如上述案例,我们现在能够确定是一个网络性能下降问题。 那么,是网段10.11.56.0的性能问题?是中间网络的性能 问题?还是10.15.0.0网段的性能问题呢?
根据129.9.0.0网段的机器与备份服务器间进行FTP传输时 速度正常为7Mbps这一事实,我们可以排除掉10.15.0.0网 段的性能问题。
华为技术有限公司
版权所有,侵权必究
6
网络故障解决的处理流程
华为技术有限公司
故障现象观察 故障相关信息收集 经验判断和理论分析 各种可能原因列表 对每一原因实施排错方案
循环2 循环1
故障排除?
N
恢复实施方案前的网络状态
Y
故障排除过程文档化
版权所有,侵权必究
7
网络故障解决的处理流程
该处理流程是网络维护人员所能够采用的排错模 型中的一种,如果你根据自己的经验和实践总结 了另外的排错模型并证明是行之有效的,请继续 使用它——网络故障解决的处理流程是可以变化 的,但故障处理有序化的思维模式是不可变化的 。
用户反映“日志服务器与备份服务器间备份发生问题。” 这就是一个不完整不清晰的故障现象描述。因为这个描述 没有讲述清楚下列问题:
这个问题是连续出现,还是间断出现的? 是完全不能备份,还是备份的速度慢(即性能下降)? 哪个或哪些局域网服务器受到影响,地址是什么?
正确的故障现象描述是:
在网络的高峰期,日志服务器10.11.56.11到集中备份服务器 10.15.254.253之间进行备份时,FTP传输速度很慢,大约是 0.6Mbps。