光大证券_DataGuard_容灾同步故障分析(758)

合集下载

存储HCIP考试模拟题含答案

存储HCIP考试模拟题含答案

存储HCIP考试模拟题含答案一、单选题(共38题,每题1分,共38分)1.生产中心有 2080GB 的数据,需要备份到灾备中心。

备份窗为 6 小时,不进行重删,带宽利用率为 0.8。

则至少需要多大的带宽才能满足此备份要求。

A、49.28MB/sB、61.6MB/sC、98.56MB/sD、123.2MB/s正确答案:D2.存储设备产生了故障告警,以下方法中,哪一项不能收集存储系统故障信息()A、检查 Zone 配置B、检查所有事件C、导出系统数据D、检查告警信息正确答案:A3.以下哪项不是 oceanstor cloud service 具备的功能?A、自动检查存储健康状态B、时刻发现设备告警C、自动解决故障D、故障信息即时传输到云端服务器正确答案:C4.在 oceanstor v3 存储中,edevlun 哪个信息是有华为存储直接提供的存储空间A、meta volumeB、external lunC、data volumeD、taget lun正确答案:A5.华为容灾方案中,关于同步远程复制顺序的描述正确的是:1 主存储阵列写 I/O 数据到主 LUN,并发送 IO 到从 LUN2 主机发送 IO 到主存储阵列。

3 主存储阵列向主机返回写成功的信息。

4 写 IO 数据到主从LUN 中。

A、2->1->4->3B、1->4->3->2C、3->2->1->4D、1->2->3->4正确答案:A6.配置主备容灾时,主端和备端阵列上的 LUN 需满足以下哪个条件?A、备端 LUN 大小需大于等于主端 LUN。

B、备端需配置相同的 RAID 级别,并且备端 LUN 需和主端 LUN 大小一致。

C、只需备端 LUN 和主端 LUN 大小一致。

D、备端需配置相同类型的硬盘,备端 LUN 大小需大于等于主端 LUN。

正确答案:C7.华为 Oceanstor 9000 InfoTier 文件池策略将决定文件创建的存储位置,以及文件重条带化时的目标分级,以下关于文件池策略说法不正确的是哪一项?A、策略参数组合间为“或”的关系B、default 策略优先级最低C、default 策略可以被修改D、最多可支持配置 128 条文件池策略正确答案:A8.以下关于 oceanstor 9000 InfoLocker 特性说法不正确的是哪一项?A、WORM 文件能进行修改和删除B、WORM 时钟只允许设置一次,设置成功后不再允许更改C、当一个目录配置为 WORM 根目录时,该目录的所有子目录、新增目录和新建文件自动获取父目录的WORM 属性D、WORM 保护的提交方式只支持自动提交正确答案:A9.下面对重复数据删除技术原理描述不正确的是哪项?A、相同的数据块物理上只存储一次。

数据中心管理中的故障诊断与故障处理方法(四)

数据中心管理中的故障诊断与故障处理方法(四)

数据中心管理中的故障诊断与故障处理方法引言在数字化时代,数据中心成为了现代企业不可或缺的重要组成部分。

然而,随着数据中心规模不断扩大和复杂性增加,故障的发生也愈加频繁。

因此,掌握数据中心故障诊断和处理方法变得至关重要。

本文将从硬件故障和软件故障两个方面分析数据中心管理中的故障诊断与处理方法。

一、硬件故障的诊断与处理1. 监控设备数据中心监控设备是诊断和处理硬件故障的重要工具。

通过设置监控点,管理员可以实时监测硬件设备的运行状态,及时发现异常情况。

例如,使用温度传感器监测机房的温度,当温度超过预设阈值时,系统将自动发出警报,及时采取措施避免硬件故障的发生。

2. 日志分析数据中心设备产生的日志包含了大量有用的信息,可用于故障的定位和诊断。

通过日志分析工具,管理员可以对大量日志进行自动分析,找出异常日志条目,有针对性地排查故障。

此外,还可以利用日志分析工具对日志进行存档,方便日后的故障溯源和问题排查。

3. 硬件维护定期的硬件维护也是预防和处理硬件故障的重要手段。

管理员应遵循制定的硬件维护计划,及时进行设备巡检和维护。

例如,定期清洁排风口、更换老化的电源等。

此外,设备维护时应注意规范操作,避免因操作失误导致硬件故障。

二、软件故障的诊断与处理1. 监控软件数据中心的软件系统中需要使用监控软件来检测和分析软件运行状态。

通过监控软件,可以实时监测服务器负载、网络流量等情况,及时发现异常。

例如,当服务器负载过高时,系统会发出警报,管理员可以立即采取措施,如增加服务器资源或优化应用程序,以防止软件故障的发生。

2. 软件补丁升级软件故障经常与软件中的漏洞和缺陷相关。

因此,定期进行软件补丁升级是避免软件故障的重要措施。

管理员应及时关注官方发布的补丁,并在测试环境中进行验证后进行升级。

同时,合理规划升级计划,避免在高峰期升级,以减少对数据中心运行的影响。

3. 故障恢复计划面对软件故障,一个完善的故障恢复计划至关重要。

在制定故障恢复计划时,管理员应全面分析系统,优先确定关键业务应用和数据库,并根据其重要程度设立恢复目标。

存储HCIP试题与参考答案

存储HCIP试题与参考答案

存储HCIP试题与参考答案一、单选题(共38题,每题1分,共38分)1.同事为客户定制双活容灾方案,客户已经有套第三方存储系统,计划新购置一套OceanStor5300V3,把这两套设备分别放置到两个数据中心实施双活容灾,该方案:A、可行,存储设备满自足双活容灾方案要求。

B、不可行,双活容灾方案需要至少两套OceanStorV3存储。

C、不可行,双活容灾方案只支持华为存储,不支持第三方存储。

正确答案:B2.某客户初始备份容量为1T,平均每天数据增量10G,备份策略是每周做一次全备,周二到周日每天一次差异增备,全备和增备数据的保存周期均为4周,在不考虑重删,冗余比,复制等的情况下所需的后端容量应该不少于哪个值?A、4940GB.B、4280GB.C、5940GB.D、5280GB.正确答案:C3.华为分布式存情块服务的压缩功能,哪个选项描述是正确的A、压缩引擎采用三种不同压缩算法组合运行B、在同一个存储池只能选择一个压缩算法C、存储池压缩算法的修改会影响已经压缩的数据D、同一个存储池可以选择多种压缩算法,提高压缩速度和比例正确答案:D4.关于源端重删,以下描述不正确的是哪一项?A、当数据从源端传输到目标端的过程中,在源端先对被传输的数据块进行哈希比对并去重。

B、占用源端资源进行去重处理。

C、只需要将新数据块的数据传输到目标端,无需传输老数据块相关的信息D、相比目标端重删可节约传输带宽。

正确答案:C5.华为UltaPath提供多种负载均衡算法,会根据每个io请求的块大小计算出总体负载数据量,然后进行负载均和的算法是以下哪种算法?A、least-blockB、round-robinC、least-into正确答案:A6.下面哪项属于oceanstor18000存储系列产品RAID2.0+技术支持的自动负载均衡技术?A、smartmotionB、smarttierC、smartqosD、smartpartition正确答案:A7.华为本地高可用方案中,如果采用HyperMirror特性,那么还必须使用哪种特性才能对异构存储整列创建镜像。

ict大数据复习题(含参考答案)

ict大数据复习题(含参考答案)

ict大数据复习题(含参考答案)一、单选题(共62题,每题1分,共62分)1.用户将证书上传到弹性负载均衡中,在创建()协议监听的时候绑定证书,提供HTTPS或TCP服务。

A、HTTPSB、HTTPC、TCPD、UDP正确答案:A2.LVS、Nginx节点服务正常时,每隔()秒会对ETCD节点连接,如果连续三次所有的ETCD节点都连接失败,产生集群健康检查告警。

A、1B、2C、3D、5正确答案:D3.ELB七层基于()实现。

A、LVSB、NginxC、HaproxyD、Apache正确答案:B4.常用的数据收集工具不包括?A、LoaderB、SparkC、KettleD、Sqoop正确答案:B5.为了提高Kafka的容错性,Kafka支持Partition的复制策略,以下关于Leader Partition和Follower Partition的描述错误的是:()。

A、Kafka针对Partition的复制需要选出一个Leader。

由该Leader负责Partition的读写操作。

其他的副本节点只是负责数据同步B、由于Leader Server承载了全部的请求压力。

因此从集群的整体考虑,Kafka会将Leader均衡的分散在每个实例上,来确保数据均衡C、一个Kafka集群各个节点间不可能互为Leader和FlowerD、如果Leader失效。

那么将会有其他follower来接管(成为新的Leader)正确答案:C6.Numpy包中创建数组的函数为(____)。

A、arrayB、ndimC、reshapeD、shape正确答案:A7.以下不属于CN自动剔除约束的是:()。

A、设置CN心跳超时时间的值大于0B、集群中的CN 总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后,逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行正确答案:D8.以下不属于数据科学家主要职责的是(____) 。

5G网络典型告警分析和问题处理方法

5G网络典型告警分析和问题处理方法

可能原因:电源柜、电源线故障;DCDU/电源柜空开不足;市电电压不足
处理建议及方法:

1. 检查DCDU空开、电压 2. 检查电源柜空开
力 3. 检查市电电压
类 2、射频单元维护链路异常告警
告警解释:BBU和射频单元之间电缆或者光纤中断
可能原因:射频单元交流掉电、射频单元直流掉电、未上电或运行异常;BBU与射频单元之间或者上下级射频单
故障处理流程图
历时故障处理
新增告警处理
联系后台确认故障
配置类告警先 处理
未处理恢复
确认详细故障和工 具,上站处理
处理恢复
现场处理故障
处理恢复
未处理恢复
联系后台确认故 障是否全部解决
详细记录故障无 法处理原因,为 下次上站做好准

检查设备标签、 维护资料
处理结束
故障的定位排查
故障定位常用办法
定位方式
查野战光缆、跳纤或者光模块(光模块波长与无源波分端口是否匹配、光模块 硬件)问题 3. 如部分光路出告警,优先排查野战光缆、跳纤或者光模块(光模块波长与无源 波分端口是否匹配、光模块硬件)问题,再排查无源波分部分端口故障
CPRI接口故障涉及的硬件组成
BBU侧常见的故障
2、传输光接口异常告警、传输光接口性能恶化告警
BBU侧常见的故障
常见故障
BBU直流输出异常告警、单板下电告警、gNodeB退服告警、网元连接中断
1、BBU直流输出异常告警
告警解释:BBU内UPEU单板输出过压或欠压 、UPEU单板功率不足
可能原因:UPEU单板硬件故障、UPEU未上电、UPEU供电不足、电源或电缆连接不正确、输入配电不正常 UPEU电源板供电异常

NetScout案例分析

NetScout案例分析

综合分析
每秒近1G比特流量
高精度的优势 :
1分钟清晰度时,每秒 流量400M比特; 1秒钟清晰度时,高峰 流量接近每秒1G比特 ; 网络时延小于1ms, 应用延时57ms, 网络时延忽略不计
故障根源查找--应用会话重组
同一个文件Query3次!!!
Open
Close
Open
Close…Open…Close…
故障排查思路
由故障现象来看,有可能是病毒、网络攻击、路 由配置、系统BUG等原因造成的; 重点对路由协议、端口号较为奇特、流量异常的 主机等进行排查; 遇到的难点;
– 较大流量; – 数据检索与分析;
故障分析难点
较大的网络流量,无法使 用传统流量捕获、分析手 段,进行故障的排查
故障分析难点 数据检索与分析
某国内银行
应用故障分析
问题提出:

国内某上市银行业,一段时间内,客户在使用网银 行业务时有失败率很高,客服方面有很大压力,应 用部门认为是网络问题
网银分析案例
分析网银系统在F5前后的网络错误情况
网银B服务器
网银A服务器
F5虚地址错误分布
某国内银行
应用故障报警分析
问题提出:

某省银行业客户,应用改造后,时常有客户端投 诉有时网络速度很慢,需要10多秒才能完成某个 操作
快速、精确的数据检索( 10:05-10:10之间5分钟 的数据取值); 通过NetScout AFM进行 长期流量捕获,从成千上 万的数据包中,识别并归 类这些数据包;
对OSPF协议的详细分析 发现,OSPF流量存在异 常情况

故障排查
调整后的OSPF流量对比
OSPF流量异常时
调整后的OSPF流量情 况

OTU_LOF告警

OTU_LOF告警
告警解释
OTU_LOF告警表示OTU层的FAS帧丢失。

告警属性
告警参数
在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。

告警参数的格式为“告警参数(16 进制):参数1 参数2…参数n”。

每个参数的含义说明参见下表。

对系统的影响
该告警产生时会导致FEC功能失效,并且业务中断。

可能原因
告警OTU_LOF产生的可能原因如下:
∙光纤问题或者光功率问题
∙单板硬件故障
对端发送过来的业务有问题
处理步骤
1.在网管上查看该告警,确定产生该告警的单板。

2.在网管上查看单板的接收光功率,如果接收光功率过低,请清洁光纤头和连接器,如
果光功率过高,则添加光衰减器,确保接收光功率正常后,查看告警是否消除。

3.若告警未消除,请检查对端发送光功率,如果对端发送光功率偏低,请更换对端单板。

4.若告警未消除,请检查本地网元和对端网元时钟是否与网络同步,没有同步请设置时
钟跟踪后,查看告警是否消除。

5.若告警仍未消除,请检查传输光纤,若光纤正常,请更换产生告警的单板。

6.若告警仍未消除,请更换本站时钟交叉板。

7.若告警仍未消除,请更换对端线路板。

8.若告警仍未消除,更换对端时钟交叉板。

资料由深圳市华佳慧科技有限公司提供,转载请保留。

OGG故障错误处理总结

OGG故障错误处理总结OGG故障错误处理总结第⼀章 GoldenGate错误分析与处理在维护GoldenGate过程中,由于各种意外情况,难免还是会遇到各种各样的问题。

掌握⼀些常见的GoldenGate故障诊断和错误分析的⽅法是⾮常有必要的,⽽且掌握这些错误分析⼯具也进⼀步加深对GoldenGate产品的认识与对GoldenGate原理的理解。

1.1 GoldenGate常见异常处理GoldenGate运⾏起来后,随着时间的推移可能会碰到各种各样的问题,下⾯就来介绍常见的异常现象以及常见的异常处理⽅法。

1.1.1 异常处理的⼀般步骤⾸先确定是GoldenGate的哪类进程有故障(是抽取,投递还是复制进程有问题),解决故障的⼀般思路如下。

(1)通过GGSCI>view report命令查找ERROR字样,确定错误原因并根据其信息进⾏排除。

(2)通过GGSCI>view ggsevt查看告警⽇志信息。

(3)检查两端数据库是否正常运⾏,⽹络是否连通。

(4)通过logdump⼯具对队列⽂件进⾏分析。

1.1.2 RAC单节点失败在RAC环境下,GoldenGate软件安装在共享⽬录下,可以通过任⼀个节点连接到共享⽬录,启动GoldenGate运⾏界⾯。

如果其中⼀个节点失败,导致GoldenGate进程中⽌,可直接切换到另外⼀个节点继续运⾏。

操作步骤如下。

(1)以Oracle⽤户登录源系统(使⽤另外⼀个正常的节点)。

(2)确认将GoldenGate安装的所在⽂件系统装载到另⼀节点相同⽬录。

(3)确认GoldenGate安装⽬录属于Oracle⽤户及其所在组。

(4)确认Oracle⽤户及其所在组对GoldenGate安装⽬录拥有读写权限。

(5)进⼊GoldenGate安装⽬录。

(6)执⾏./ggsci进⼊命令⾏界⾯。

(7)执⾏start mgr启动MGR。

(8)执⾏start er *启动所有进程。

存储HCIP考试题+参考答案

存储HCIP考试题+参考答案一、单选题(共38题,每题1分,共38分)1.客户需求为应用业务 RTO=0 和 RPO=0,应该使用哪种容灾方案,A、主备B、双活C、3DCD、云容灾正确答案:B2.在华为 OceanStor 9000 中,以下哪个不属于 NFS 共享支持的鉴权方式?A、NIS 鉴权B、LDAP 鉴权C、客户端 IP 地址/主机名鉴权D、本地用户鉴权正确答案:D3.以下关于交换机侧检测网络的命令,第一个描述:display Inter 命令可以用于查看接口统计数,查看交换机是否记录接口丢包。

第二个描述:display logbuf,如果 discarding,要关注后端组网是否存在环路。

A、第一个是正确的,第二个是错误的B、第一个是错误的,第二个是正确的C、两个描述都是正确的D、两个都是错误的正确答案:C4.下边哪一种方法可以实现RTO最优?A、磁盘-磁盘B、磁盘-磁盘-磁带C、远程复制D、虚拟带库正确答案:C5.在华为备份解决方案中,Server-Free 备份组网涉及到快照技术,由哪个组件发起快照创建命令。

A、备份介质B、介质服务器C、备份代理客户端D、生产存储正确答案:C6.关于华为 oceanstor 系列存储的故障排查争端顺序,以下哪种说法是正确的?1 定位故障 2 判断故障 3 收集故障信息 4 排除故障A、3214B、1234C、3124D、2314正确答案:A7.以下哪个选项对华为分布式存储智能负载均衡特征的描述是不正确的?A、可以按照需要对节点进行分类,对于每个分区,负载均衡系统支持配置独立的负载策略、独立的访问域名。

B、在所有节点间自动进行负载均衡时,只支持性能负载均衡,不支持容量负载均衡。

C、负载均衡策略可以基于:CPU、内存、带宽、网络连接数、节点能力值。

D、负载均街服务支持:轮询方式、CPU 使用率、节点连接数。

正确答案:B8.以下关于开箱验货说法不正确的是哪一项?A、如果货物出现与装箱清单不符情况,应将已拆包装箱的设备转室内妥善存放B、开箱验货时,工程督导可以单独开箱清点货物C、开箱验货时出现错货、缺货,请填写《货物差错反馈表》反馈给当地办事处正确答案:B9.下列选项中关于桶(Bucket)的描述不正确的是:A、桶是一种容器,用于存放对象,可视为能够通过网络访问的目录。

存储HCIP测试题(附参考答案)

存储HCIP测试题(附参考答案)一、单选题(共38题,每题1分,共38分)1.存储设备有A和B两个控制器,如果A控的BBU故障,以下哪项描述是正确的()A、归属A控的LUN会转为透写B、归属B控的LUN会转为透写C、所有的LUN都转为透写D、所有的LUN都不转为透写正确答案:BScanner特性通过哪种方式将需要查杀的文件路径发送给防病毒代理服务器A、轮询B、并发C、快照D、重删正确答案:C3.华为分布式存储系统上电顺序正确的是以下哪一项?A、机柜-->KVM--交换机--->节点B、机柜-->交换机-->KVM-->节点C、机柜-->节点-->KVM---交换机D、机柜-->交换机-->节点---KVM正确答案:B4.某应用的数据初始容量是500GB.,备份频率是每周1次全备,6次增备,全备和增备的数据保存周期均为4周,冗余比为20%。

则4周的后端存储容量为:A、3320GB.B、3504GB.C、4380GB.D、5256GB.正确答案:D5.文件系统备份带宽计算公式正确的是以下哪个选项,A、无复制需求时,需求带宽(不带重删)=全备数据量÷备份窗口÷带宽利用率。

B、有复制需求时,需求带宽(带重删)=复制数据量÷复制窗口÷带宽利用率。

C、无复制需求时,需求带宽(介质端重删)=全备数据量÷重删比÷备份窗口÷带宽利用率。

D、无复制需求时,需求带宽(源端重删)=全备数据量÷备份窗口÷带宽利用率。

正确答案:A6.下列哪个接口模块是SX6018上用于升级防火墙软件以及其他高级调试的:A、USB接口B、I2C接口C、管理网口D、CONSOLE口正确答案:B7.关于目标端重删,以下描述不正确的是哪一项?A、不占用源端的资源。

B、目标端重删等同于后处理重删(Post-processing)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

光大证券_DataGuard_容灾同步故障分析
【处理时间】2015年06月23日~ 2015年06月23日
【客户名称】光大证券
【主机信息】IBM X3850 x5;Redhat 5.7 x86_64,oracle11.2.0.3
【处理人员】周光晖
【问题说明】现象:
光大证券孙工06月23日联系恒生电子DBA。

反映目前数据库同步dataguard中。

主库无LNS推
送进程,备库无RFS接收进程。

但是备库有MRP进程且同步正常。

事件分析
1.通过远程登录主备机器查看数据库alert.log发现:
备库存在大量的手动注册日志的信息,主库在日志归档之后无发送至远端的信息:
Fri Jul 03 05:00:18 2015
Media Recovery Log /fapdb/archivelog/1_21282_801312798.dbf
Media Recovery Waiting for thread 1 sequence 21283
Fri Jul 03 07:00:06 2015
VKTM detected a time drift. Please check trace file for more details.
Fri Jul 03 08:48:25 2015
ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21283_801312798.dbf'
There are 1 logfiles specified.
ALTER DATABASE REGISTER [PHYSICAL] LOGFILE
Resynchronizing thread 1 from sequence 21282 to 21283
Completed: ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21283_801312798.dbf' Fri Jul 03 08:48:29 2015
Media Recovery Log /fapdb/archivelog/1_21283_801312798.dbf
Media Recovery Waiting for thread 1 sequence 21284
Fri Jul 03 08:49:03 2015
ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21284_801312798.dbf'
There are 1 logfiles specified.
ALTER DATABASE REGISTER [PHYSICAL] LOGFILE
Resynchronizing thread 1 from sequence 21283 to 21284
Completed: ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21284_801312798.dbf' Fri Jul 03 08:49:03 2015
Media Recovery Log /fapdb/archivelog/1_21284_801312798.dbf
Media Recovery Waiting for thread 1 sequence 21285
Fri Jul 03 09:10:18 2015
ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21285_801312798.dbf'
There are 1 logfiles specified.
ALTER DATABASE REGISTER [PHYSICAL] LOGFILE
Resynchronizing thread 1 from sequence 21284 to 21285
Completed: ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21285_801312798.dbf' Fri Jul 03 09:10:18 2015
Media Recovery Log /fapdb/archivelog/1_21285_801312798.dbf
Media Recovery Waiting for thread 1 sequence 21286
Fri Jul 03 10:52:59 2015
ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21286_801312798.dbf'
There are 1 logfiles specified.
ALTER DATABASE REGISTER [PHYSICAL] LOGFILE
Resynchronizing thread 1 from sequence 21285 to 21286
Completed: ALTER DATABASE REGISTER LOGFILE '/fapdb/archivelog/1_21286_801312798.dbf'
Fri Jul 03 10:53:00 2015
Media Recovery Log /fapdb/archivelog/1_21286_801312798.dbf
Media Recovery Waiting for thread 1 sequence 21287
2.通过查看主备库的参数发现,主库的log_archive_dest_state_2=DEFER;表示禁用了主库传送日志服务
3.一般国外DBA在标准版的数据库中通过手动复制归档到备端并应用实现数据容灾的方式。

因为DataGuard只
在oracle企业版中才可以使用。

目前数据库版本为企业版。

处理建议
1.由于该套DataGuard不是由恒生电子的DBA实施的。

所以建议客户排查是否当时实施的时候通过脚本传输
日志到备库被说动执行归档日志注册指令。

2.或排查是否有使用同步机制,同步程序等。

相关文档
最新文档