最新室分故障问题排查及处理流程

最新室分故障问题排查及处理流程
最新室分故障问题排查及处理流程

室分故障问题排查及

处理流程

室分问题排查流程2013年11月

目录

1室分主要问题 (3)

2室分问题优化排查方法 (4)

2.1 弱覆盖 (4)

2.1.1整治流程 (4)

2.1.2流程分析 (5)

2.2 信号外泄 (8)

2.2.1整治流程 (8)

2.2.2流程分析 (9)

2.2.3整治方案 (10)

2.3 高干扰 (12)

2.3.1整治流程 (12)

2.3.2整治流程 (13)

2.3.3整治方案 (17)

2.4 高质差 (23)

2.4.1整治流程 (23)

2.4.2流程分析 (25)

2.4.3整治方案 (28)

2.5 低接通率 (32)

2.5.1整治流程 (32)

2.5.2流程分析 (33)

2.5.3整治方案 (36)

2.6 超低或超高话务 (38)

2.6.1整治流程 (38)

2.6.2流程分析 (40)

2.6.3整治方案 (42)

2.7 频繁切换 (44)

2.7.1整治流程 (44)

2.7.2流程分析 (45)

2.7.3整治方案 (46)

2.8 掉话 (48)

2.8.1整治流程 (48)

2.8.2流程分析 (49)

2.8.3整治方案 (50)

6 附录 (51)

附录A 我国室内分布系统制式的频段范围(MHz) (51)

1室分主要问题

室分网络问题从用户感知的角度看,主要存在手机无信号、呼叫困难、通话断续、通话掉线等感知,但用户感知只是一种用户主观感觉,并不能直接引导优化人员进行问题处理,需要通过一些网络指标关联分析,定位,解决问题。相关教程请点击

综合全国各地市室分整治经验,可通过如下“八加一”个维度来定位问题:(1)弱覆盖;(2)高干扰;(3)高质差;(4)频繁切换;(5)外泄;(6)超低或超高话务;(7)接入困难;(8)高掉话;(9)高用户投诉。

其中,前八个维度的问题易于量化,它们与用户感知、常用KPI指标关联见下表:

2室分问题优化排查方法2.1 弱覆盖

2.1.1整治流程

弱覆盖排查处理流程图如下:

2.1.2流程分析

1.BTS硬件故障需要在后台首先排查。

如BTS功放输出功率过低,接收机灵敏度下降,合路器出现驻波比严重告警致使信号损耗大,射频连线错误等各种现象影响覆盖。

2.排查完基站硬件故障问题,要在后台排查无线配置参数设置是否有误。

无线参数设置不合理:如TRX功率等级设置不一致,BTS发射功率设置不合理,小区最小接入电平过大等。

3.天线布放不合理问题:现场排查时,首先需要排除弱覆盖是否由天线布放不合理问题

引起,如果天线口功率满足设计要求但还是存在弱覆盖的情况,则说明天线布放不合理,如果天线口功率不满足设计要求则应该重点检查有源设备及分布系统的问题。

天线布放问题造成弱覆盖常见原因见下:

1)设计方案不合理

部分站点可能存在方案设计不合理的情况,存在弱覆盖区域。如天线布放过远,使得天线与天线的交叠覆盖处存在弱覆盖区;地下层与标准层或出口处,天线的布放没有充分考虑信号的连续性,使得交叠处存在弱覆盖;

另外电梯、电梯厅、拐角处等区域,由于信号会陡降,信号的接续和切换存在问题,需要特别的考虑,卫生间、拐角房间、消防通道等特殊区域,容易出现弱覆盖或盲区。

2)物业协调难

同时可能由于物业无法协调,导致天线设计或安装时无法装在房间内,只能布放在走廊等公共区域,造成房间内或窗边区域弱覆盖。

3)施工质量问题

运维制度及流程

运行维护管理制度 2017年8月

目录3 3 3 5 6 6 7 8 8 9 9

1、总则 第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维部全体人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 3、运维部工作职责 一、负责网站运维和技术支持 (一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。 (二)负责网站栏目和应用系统的使用培训和操作使用指南编

写,对用户使用过程中出现问题的沟通和解决; (三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。 (四)网站设备和软件操作规程和应用管理制度的制定,并负责监督执行。 (五)网站设备和软件安装、调试和验收,使用培训和维修保养。 (六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。 (七)网站技术服务外包管理,主要包括技术外包开发、运行服务托管和空间域名管理。 (八)负责网站管理系统及设备保密口令的设置和保存,保密口令设置后报中心主任备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。 (九)负责网站新程序、新系统和网站改版升级方案技术的设计开发。 二、负责网站信息和技术安全 (一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。 (二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。

故障管理故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月 目录 第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。 第二章工程运维中心在95013业务维护管理中的职责

a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则: 先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障等级进行处理。 第五章故障处理时限要求。 1. 重大故障,故障处理时限≤2小时。

公司运维服务规范

某公司运维服务规范 第一章总则 第一条为保障公司运维工作有序开展,规范运维工作和人员的服务要求,避免人为操作不当引起的重大、关健运维事故,根据电信公司及公司维护管理办法要求,特制定本规范。 第二条本规范是公司运行维护管理的基本依据,维护岗位人员必须严格遵照执行。 第三条本规定的最终解释权在技术质量管理部。 第二章适用范围 第四条本规定所指的系统是指公司及各部门承接的运维项目中涉及的范围,按合同约定包括:网络设备、服务器、操作系统、应用系统、数据及保障项目正常运行的各项辅助设施。 第五条本规定适用于对各部门运维分管领导、运维管理员、运维项目经理及成员等各维护岗位人员(包括各部门外包员工)的运维管理要求。 第三章运维服务要求 第六条运维岗位人员要具备良好的工作作风和严谨的工作态度,服从管理,认真负责,坚守岗位,在问题面前不推诿、不拖拉、不盲目、不蛮干,要冷静分析、沉着处理。 第七条遵照公司各项运维管理制度及客户运维工作要求,严格执行维护工作服务规范,确保人员、系统及各项设施安全。具体要求

包括: (一)、基本维护要求 1、遵守客户业务管理和现场管理要求。 2、周期性的维护工作应经客户审批同意后方可实施。 3、因故障修复、功能升级等引起的系统版本升级和割接工作应经客户测试通过后方可实施。 4、未经客户同意,各维护岗位人员不得私自对客户的在线系统进行数据变更、数据统计、应用程序变更、系统参数调整、硬件设备调整。 5、维护外包人员须经业务和管理培训,明确岗位职责,通过部门考核确认后方可上岗。在客户现场以理想公司员工身份执行维护工作,遵循各项运维管理制度。 6、定期检查所维护系统的安全状况,为客户提出合理的预防处理措施。 (二)、故障响应/处理制度 1、遵照公司(故障控制管理办法)要求,在接到故障报修通知后,及时与用户取得联系后进行排障,故障排除后填写故障修复信息。 2、各维护岗位人员应确保通讯工作24小时畅通。 3、严格执行故障处理和处理逐级上报制度。 (三)、信息记录(维护资料管理) 1、建立健全系统维护文档和记录资料库,相关资料由各部门妥

故障管理及故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月 目录 第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。

第二章工程运维中心在95013业务维护管理中的职责 a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则:

最新室分故障问题排查及处理流程

室分故障问题排查及 处理流程

室分问题排查流程2013年11月

目录 1室分主要问题 (3) 2室分问题优化排查方法 (4) 2.1 弱覆盖 (4) 2.1.1整治流程 (4) 2.1.2流程分析 (5) 2.2 信号外泄 (8) 2.2.1整治流程 (8) 2.2.2流程分析 (9) 2.2.3整治方案 (10) 2.3 高干扰 (12) 2.3.1整治流程 (12) 2.3.2整治流程 (13) 2.3.3整治方案 (17) 2.4 高质差 (23) 2.4.1整治流程 (23) 2.4.2流程分析 (25) 2.4.3整治方案 (28) 2.5 低接通率 (32) 2.5.1整治流程 (32) 2.5.2流程分析 (33) 2.5.3整治方案 (36) 2.6 超低或超高话务 (38) 2.6.1整治流程 (38) 2.6.2流程分析 (40) 2.6.3整治方案 (42) 2.7 频繁切换 (44) 2.7.1整治流程 (44) 2.7.2流程分析 (45) 2.7.3整治方案 (46) 2.8 掉话 (48) 2.8.1整治流程 (48) 2.8.2流程分析 (49) 2.8.3整治方案 (50) 6 附录 (51) 附录A 我国室内分布系统制式的频段范围(MHz) (51)

1室分主要问题 室分网络问题从用户感知的角度看,主要存在手机无信号、呼叫困难、通话断续、通话掉线等感知,但用户感知只是一种用户主观感觉,并不能直接引导优化人员进行问题处理,需要通过一些网络指标关联分析,定位,解决问题。相关教程请点击 综合全国各地市室分整治经验,可通过如下“八加一”个维度来定位问题:(1)弱覆盖;(2)高干扰;(3)高质差;(4)频繁切换;(5)外泄;(6)超低或超高话务;(7)接入困难;(8)高掉话;(9)高用户投诉。 其中,前八个维度的问题易于量化,它们与用户感知、常用KPI指标关联见下表:

问题与故障处理流程图

NGBOSS3.0系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义 标准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障 管理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通 知故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到 标准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级 至故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。

●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤, 监督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员 现场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过 程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相 关领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。 ●记录问题处理过程,登记故障问题管理列表中的相关处理信息。 ●负责故障处理完成后,整理并填写故障分析报告,并按时提交。 ●总结及优化类似故障的处理步骤,为后续故障处理提供依据。 ●根据故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分 析。

医院信息系统故障处理应急预案

医院信息系统故障处理应急预案 一、总则 (一)目得 为有效防范医院信息系统运行过程中产生得风险,预防与减少突发事 件造成得危害与损失,建立与健全医院计算机信息系统突发事件应急机制,提高计算机技术与医院业务应急处理与保障能力,确保患者在特殊情况下能够得到及时、有效地治疗,确保计算机信息系统安全、持续、稳健运行. (二)编写依据 根据《湖南省网络与信息安全应急预案》及国家信息安全相关要求与 有关信息系统管理得法律、法规、规章,并结合医院得实际,编制木预案。 (三)工作原则 统一领导、分级负责、严密组织、协同作战、快速反应、保障有力(四)适用范围 适用于医院计算机网络及各类应用系统 二、组织机构与职责 根据计算机信息系统应急管理得总体要求,成立医院计算机信息系统应急保障领导小组(简称应急领导小组),负责领导、组织与协调全院计算机信息系统突发事件得应急保障工作。 1.领导小组成员: 组长由院长担任。

副组长由相关副院长担任。 成员由信息中心、院办、医务科、护理部、财务科、医保办、总务科 等部门主要负责人组成。 应急小组日常工作由医院信息中心承担,其她各相关部门积极配合。 2。领导小组职责: (1 )制定医院内部网络与信息安全应急处置预案。 (2)做好医院网络与信息安全应急工作。 (3)协调医院内部各相关部门之间得网络与信息安全应急工作, 协调与软件、硬件供应商、线路运营商之间得网络与信息安全应急工作. (4)组织医院内部及外部得技术力量,做好应急处置工作。 三、医院信息系统出现故障报告程序 当各工作站发现计算机访问数据库速度迟缓、不能进入相应程序、不能保存数据、不能访问网络、应用程序非连续性工作时,要立即向信息中心报告?信息中心工作人员对各工作站提岀得问题必须高度重视,做好记录,经核实后及时给各工作站反馈故障信息,同时召集有关人员及时进行分析,如果故障原因明确,可以立刻恢复得,应尽快恢复工作;如故障原因不明、情况严重、不能在短期内排除得,应立即报告应急领导小组,在网络不能运转得情况下由应急领导小组协调全院各部门工作,以保障全院医疗工作得正常运转。 四、医院信息系统故障分级 根据故障发生得原因与性质不同分为三类与其它故障: 一类故障:由于服务器不能正常工作、光纤损坏、主服务器数据丢失、

室分基站常见告警处理方法、流程及技术联系人

2G 一)OML链路故障告警(E1TI故障告警):即断站 1 、与传输网管核对,光端机运行是否正常(即是否能监控到本基站光端机),如 果可以监控到,则说明是基站侧问题,需上站处理。如果不能,则可判定传输光缆中断或者传输设备断电,上站核实。(仅限于华为光端机) 2 、上站核查是否断电,掉电则上电即可,如果没断电则检查基站2M质量并环回。 设备对应的传输2M环回,与传输网管核实该端口状态,如果正常则再向BSC网管核实。 如果传输网管看到该端口正常而BSC网管看到不通,则需传输网管与BSC网管进行核实,并找机房相关人员处理。如果基站环回没问题,则可判定是基站侧问题。 3、检查设备2M头质量。(自环或者万用表测)GSM可以自环,观察LIU0-4指示灯, WCDMA早期部分基站也有此功能。 4、是否为设备单板故障。主控板GSM(GTMU),WCDMA(WMPT) 5、由于室分安装场景比较复杂,而且有的相当恶劣。检查是否有进水迹象或者高 温等。观察设备外观,及主控板RUN指示灯运行状态(绿色慢闪)。风扇(BBU的FAN 模块)运行状态。 6、室分传输比较多样。华为可由网管监控,但格林威尔传输及PDH等网管看不到, 需相应厂家配合。 二)CPRI链路异常告警、射频单元维护链路异常告警、光接口性能恶化、光模块收发异常告警。 此类告警通俗点说即:BBU与RRU之间通讯不正常。 1、首先核实设备全部上电。同时检查基站尾纤与光模块是否匹配(室分基站全部为 单模尾纤,对应单模光模块1.125G-1310nm-10KM)。 2、观察主控板及RRU的CPRI接口指示灯。正常为绿色。有时指示灯正常,但依然有 光接口性能恶化告警,说明光衰较大。这时需用光功率计测各个光路,光衰不能 大于-15db。 3、尾纤拔插,酒精清洗接头,更换法兰盘等。法兰盘对接要插入凹槽内松紧适度 4、正常状态下BBU及RRU的CPRI接口灯为绿色常亮。RUN慢闪,ACT常亮,具体 各指示灯含义见下表1,RRU指示灯见表2 注:2G一些设备在后台数据去激活状态下主控板GTMU的CPRI接口指示灯不会亮,需要后台把数据激活才能看到光口亮灯,但是未激活状态下BBU与RRU之间如果光路正常则RRU的CPRI指示灯可以看到绿色。不通则红色。 三)GSM小区退服告警。 产生此告警原因如下: 1.基站断站 2.载频板(RRU.RFU)故障 3.主控板故障 4.驻波 四)E1/T1类。 2M告警主要有E1/T1告警指示告警、E1/T1帧失步告警、E1/T1信号丢失告警、E1/T1

室分优化常见问题及处理流程

1 室分优化常见问题 1.1 速率类问题 1.1.1 路测类速率问题定位和优化方法 1.1.1.1 路测类业务定位流程 1.1.1.2 空口问题指标 测试空口重点关注指标:RSRP 、SINR 、TM 、RI 、流数、PDCCH DL 、PDSCH RB number 、MCS 、iBLER 、通道的平衡。

一般而言,吞吐率由频谱效率、频带宽度、频带占用机会、误码率综合决定。在LTE 系统中,频谱效率由MCS决定;频带宽度由分配的RB数决定;频带占用机会由DL grant 决定;误码率主要考虑IBLER,HARQ重传以后,残留BLER通常较低,因此只考虑初次传输的BLER,也即IBLER。 备注:DL/UL Grant理论值,FDD为固定值1000;TDD为配置的10ms内下行和特殊子帧/上行子帧个数*1000,TDD的特殊子帧计算为下行帧,录入:配比(DSUUD),DL 理论值为600,UL理论值为400。 1.下行速率的基本分析方法: (1)统计UE侧SINR vs THP:定点测试统计AVG SINR和吞吐率平均值。

(2)判断用户的RB数和DL Grant是否调度充足,如果不充足,首先判断上层数据源是否充足,可以直接在Probe上查看,也可以采用MML命令DSP ETHPORT查看。 (3)若DL Grant和RB数都是调度充足,下一步需判断下行IBLER是否收敛到目标值。目前下行的IBLER目标值一般为10%,即5%~15%即认为IBLER收敛。可以直接在Probe上查看,也可通过M2000信令跟踪管理-用户性能监测-误码率监测观察。 (4)如果IBLER收敛,可判断是否使用了双码字,我司UE可通过Probe查看用户的Rank Indicator和DL MCS。也可通过M2000信令跟踪管理-用户性能监测-信道质量查看UE上报的Rank值和调度的CQI。 (5)如果上述都OK,可以查看下是否存在干扰,功率不平衡等现象,在Probe上可以直接查看 (6)上述1~5步检查结果都OK的话,需要进行深入定位,深入定位需要在M2000上采集的数据。 2. 上行速率的基本分析方法: 一般而言,吞吐率由频谱效率、频带宽度、频带占用机会、误码率综合决定。在LTE 系统中,频谱效率由MCS决定,MCS由SINR和IBLER决定;频带宽度由分配的RB数决定;频带占用机会由UL grant决定;误码率主要考虑IBLER,HARQ重传以后,残留BLER通常较低,

LTE故障分析报告_双流室分案例

双流室分案例分析报告 ——LTE网络优化组

关键字:WLAN合路器、RRU、故障、传输、双流、、平衡性 故障描述 2013年5月份开始,上海移动工程部对LTE一期室分站点进行验收,验收好点要求:RSRP>-85dBm,SINR>22dB。CQT测试:单路下载速率≥40Mbps,上传速率>7Mbps;双路下载速率>80Mbps,上传速率>7Mbps。步测:单路平均下载速率≥22.5 Mbps,平均上传速率>6Mbps;双路平均下载速率>45Mbps,平均上传速率>6Mbps。 验收测试期间发现很多问题,尤其是双流室分场景只有单流的速率。 故障诊断 上海越洋国际广场是双流场景,WLAN独立分布,也是POI合路系统。测试发现:双流信号很不稳定,下载速率一直上不去。如下图: 该小区RRU的2个端口分别接POI TX和POI RX,先闭塞POI RX通道,连接POI TX通道,进行测试RSRP -74dbm,下载速率47.9M,下载速率比较稳定,如下图:

但相同地点闭塞POI TX通道,连接POI RX链路进行测试,RSRP电平值-95dBm左右,下载速率46M,很不稳定,如下图: 两条链路电平差值约20dB,这样信号好的链路(-74dbm)对与信号差的链路(-95dbm)形成相互干扰,只有单流的速率。 解决措施 通过排查楼层分布系统,发现在RX链路上有二级合路器,怀疑该合路器性能异常,通过更换合路器,两条链路RSPR都在-74~-78dBm左右,测试平均速率达到89.6M,如下

图: 预防、监控措施 双流室分场景往往是在以前单流室分的基础上新增1路室分系统建设而成,这样先前的单流室分由于使用时间较长,存在老化或设计缺陷,与新建的1路室分达不到链路平衡,造成了双流场景只有单流的速率,双流站点两个通道的平衡性要求电平差值在5db以内,否则速率不达标可以判定为两条链路不平衡,需进行室分整改。 同时,双流场景下对两条链路的隔离度也有要求,建议室分天线点位间距不要太近或太远,距离约为1.5米性能最好。 流程图 室分问题处理流程如下:

信息系统的应急预案

一、总则 (一)、基本原则:明确责任、分级负责。按照“谁主管谁负责”的原则,建立和完善责任制度、协调管理机制和联动工作机制。根据部门职能,各司其职,落实到人,加强部门间的协调与配合,形成合力,共同履行应急处置工作的管理职责。 (二)、适用范围:本预案适用于史丹利化肥有限公司网络与信息系统故障的应急响应工作。 二、日常准备工作 (一)、软资源备用:对重要信息资源需要有足够备份,并将备份存放于攻击和灾害不能及的地方。 (二)、设备备用:在工作现场有主板、硬盘、光驱、网线等备件,以及备用的外部设备。 (三)、电源备用:配置不间断UPS电源。不间断电源可在断电后维持工作3小时以上。 (四)、重要或大型系统中的关键设备和信息安全产品采用双机热备份。 三、应急处理流程 信息管理科人员在监控过程中发现或收到其他部门反馈不能正

常使用办公或业务应用系统等故障事件,相关软件、硬件的技术人员立即行动,初步查明原因(电力、服务器、存储、网络、应用系统软件等),并向科室、部门相关领导汇报。 部门领导在听取情况汇报后,根据事件的范围、影响和紧急程度启动相应的专题预案。如果没有相应的专题预案,要根据情况迅速采取措施抑制事件的扩散,恢复系统运行。 信息管理科尽快通过OA、电话、短信平台、网上销售系统网站等方式向各科室、各分厂下发《应用系统暂停通知》或公告。各部门、各分厂要做好信息系统出现故障后的应急安排,尽力减小对公司正常业务的影响。 信息管理科人员进一步落实故障原因,根据事件的范围、影响程度,采取应急措施,尽快恢复系统运行。 信息管理科在对系统完成修复后,在完成测试的基础上,经请示相关领导进行系统的启用,同时通过OA、网上销售系统网站、电话等向各部门、各分厂发布系统恢复公告。 四、事件分类 事件类型按照各种突发紧急事件的影响范围,将史丹利网络与信息系统事件分成全局事件(总公司核心信息系统因电力、网络、软硬件等故障原因,导致全厂信息系统无法正常工作)和区域事件(SAP、网上销售系统、OA、BO、用友等系统故障,导致局部范围内的业务工作无法正常进行)。 五、全局事件处理

监控系统故障应急处置措施

监控系统故障应急处置措施 一、监测监控故障应急处理措施 故障处置负责人:张谦具体处置人员:刘海龙张雷 故障处置程序: 1、监控值班员发现传感器断线,或接到现场施工人员汇报传感器断线后,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断。 3、联系施工现场班组长或电工,检查传感器航空插头线,并重接。如恢复故障处置完毕。 4、上述过程不能恢复,监控维修值班员要带好备件及抢修工具及时赶赴现场,到达现场后,监控维修值班员由施工队组电工配合,从分站到传感器各接点一一排查,直至更换传感器或更换分站接口。 4、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (二)、分站断线不能上传数据。 故障处置程序: 1、监控值班员发现一分站所有传感器断线不能上传数据时,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断,监控主机与该分站的网络通讯是否正常。a、如该分站的网络节点与监控主机通讯不正常,到环网交换机处更换分站网络

节点,由监控值班员重新设置。b、如该分站的网络节点与监控主机通讯正常,立即下井检查,分站电源供电是否正常、环网交换机与分站的连接线是否短路或断路,直至故障处置完毕。 3、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (三)、环网交换机断线不能上传数据。 故障处置程序: 1、监控值班员发现若干分站所有传感器断线不能上传数据时,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断,断线分站是否同属一台环网交换机,如不同属一台环网交换机,按分站断线处置。如同属一台环网交换机,立即检查监控主机与该环网交换机的所有网络节点的通讯是否正常。a、如该环网交换机的所有网络节点与监控主机通讯不正常,要及时赶赴现场检查环网交换机电源是否供电正常或现场更换环网交换机,由监控值班员重新设置。b、如该环网交换机的部分网络节点与监控主机通讯正常,立即更换故障分站的网络节点,由监控值班员重新设置。 3、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (四)、监控主机故障,不能实时监控。 故障处置程序: 1、监控值班员发现监控主机不能运行时,要立即向值班领导汇

LTE室分问题解决方案汇总-中兴

LTE室分问题解决方案汇总-中兴 目录 1 单双流问题解决方案...................................................................... .. (2) 1.1 LTE双流简 介 ..................................................................... .. (2) 1.2 单双流后台验证流 程 ..................................................................... .. (2) 1.3 单双流前台验证流 程 ..................................................................... .. (2) 1.4 合路器不支持LTE频 段 ..................................................................... (3) 1.5 RRU(R8972 M192023)只能走单 流 ..................................................................... . (4) 1.6 4

2 覆盖不达标处理解决方案...................................................................... (4) 2.1 测试发现无信号解决方 案 ..................................................................... (4) 2.2 弱覆盖解决方 案 ..................................................................... . (4) 2.3 RSCP好SINR低解决方 案 ..................................................................... ...................... 4 3 速率不达标解决方案...................................................................... .. (5) 3.1 速率不达标问题处理流 程 ..................................................................... ........................ 5 4 外泄不达标解决方案...................................................................... .. (5) 5 切换常见问题...................................................................... .. (5) 1 单双流问题解决方案 1.1 LTE双流简介

运维管理制度

运维管理制度 XXXXXX有限公司2014年5月18日

目录 引言 (1) 1、总则 (2) 2、编制方法 (2) 3、运维部工作职责 (2) 3.1系统运维和技术支持 (2) 3.2.平台信息和技术安全 (3) 4、运维服务管理体系 (4) 4.1运维服务管理对象 (4) 4.2运维系统功能框架 (4) 4.3运维管理组织结构 (5) 4.3.1项目负责人 (5) 4.3.2项目经理 (5) 4.3.3技术主管 (6) 4.3.4服务台 (6) 4.3.5网络管理员 (7) 4.3.5应用、数据库管理员 (7) 4.3.7终端管理员 (7) 4.4运维服务流程 (8) 4.4.1项目运维服务工作流程图 (9) 4.4.2服务台 (9) 4.4.3事件管理 (10) 4.4.4工单管理 (10) 4.4.5问题管理 (10) 4.4.6变更管理 (10) 4.4.7配置管理 (11) 4.4.8知识库管理 (11) 4.4.9统计及工作报告 (11) 5、运维服务内容 (11) 5.1服务目标 (11) 5.2IT资产统计服务 (12) 5.3网络、安全系统运维服务 (12) 5.4主机、存储系统运维服务 (13) 5.5数据库系统运维服务 (13) 5.6中间件运维服务 (14) 5.7终端、外设运维服务 (14) 6、应急服务响应措施 (14) 6.1应急预案实施基本流程 (15) 6.2突发事件应急策略 (15) 7、服务管理制度规范 (16) 7.1服务时间 (16) 7.2行为规范 (16)

001-2 办公信息系统协同管理及协同数据交换策略研究运维制度引言 本文件是依据《XXXXXX系统协同管理及数据交换策略研究》分任务要求,完成“运维制度”的研究工作。 课题组参照国际国内标准有: ITIL/ISO20000标准 GBT 28827.1-2012 信息技术服务运行维护第1部分:通用要求 GBT 28827.2-2012 信息技术服务运行维护第2部分:交付规范 GBT 28827.3-2012 信息技术服务运行维护第3部分:应急响应规范 结合XXX课题应用实施及运维管理的实际情况研究、编制运行维护管理制度,本文分为7章内容分别为: 1.总则 2.编制方法 3.运维部工作职责 4.运维服务管理体系 5.运维服务内容 6.应急服务响应措施 7.服务管理制度规范等内容。

LTE室分11个问题处理思路

题1:TD-LTE 室分系统中天线口功率一般设计为多大? LTE 室分天线口功率一般设置在10-15dBm(总功率)范围内,具体应该按照实际场景及站点特点来区分: 1.对于地下室、商场等空旷区域或天线已经入户的等场景建议天线口功率设置在下限10dBm 左右; 2.对于天线只能布放在走廊且结构较为复杂或者层高6 米左右的场景建议天线口功率设置在上限15dBm 左右; 3.对于WLAN 受干扰场景可适当降低LTE 功率要求。 问题2:在LTE 室分系统合路建设中应该注意哪些问题? 在LTE 室分系统合路建设中应该注意以下几点: 1. 原有天线布放密度是否满足LTE 的覆盖需求,如果不符合则需要进行适当的改造增加天线进行覆盖; 2. 原有天线、耦合器、合路器等器件是否满足LTE 的频段要求,特别需要检查站点的WLAN 合路器,重点关注合路器件的WLAN 系统与LTE 系统隔离度指标; 3. 核对站点的天线口功率是否能满足LTE 的覆盖要求,特别是和GSM 合路的站点,由于二者的频段差异较大,前端和末端间相差能达到6-7dB(由于频段差异,100 米馈线900M 频段和2400M 频段的损耗相差5dB,末端天线至前端馈线长度达100-150米的话,功率损耗相差将达到6-7dB),这就需要在两个系统间取得一个相对的平衡点。 问题3:什么是LTE 室分系统中的鸳鸯线,会造成什么影响? LTE 室分系统中的鸳鸯线是指在双路建设的系统中,覆盖同一区域两路分布系统接的不是同一RRU 的两个通道,可参考下图所示: 鸳鸯线会造成以下影响: ●鸳鸯线导致覆盖同一区域的两路系统不是同一种信号,将导致不能实现空分复用的功能,影响系统的峰值性能;

信息系统(设备)故障处理制度

信息系统(设备)故障处理制度(试行) (2018年8月版) 第一章总则 为规范公司信息系统的故障申告、受理、处理和修复后业务验证等日常维护支撑和管理工作,保证故障申告、受理、处理和业务验证的及时性和有效性,进一步明确各部门的职责、工作流程、相关要求以及考核指标,特制定本制度。 第一条适用范围 本制度所指信息系统包括:机房环境、配套网络、计算机硬件平台、基础软件、应用软件。 第二章故障处理流程 第二条信息系统的分类 将信息系统分为重要信息系统和非重要信息系统两类。重要信息系统是指支撑公司重要业务,信息安全和服务质量的信息系统。包括面向客户、涉及账务处理且实时性要求较高的业务处理类、渠道类和涉及客户风险管理等业务的管理类信息系统,以及支撑系统运行的机房和网络等基础设施。非重要信息系统是指除重要信息系统之外的信息系统。 第三条信息系统故障分级 据信息系统故障的影响范围及持续时间等因素,将信息系统故障分为重大故障、较大故障、一般故障三个级别。当故障满足多个级别的定级条件时,按最高级别确定故障级别。 重大故障(一级): 由于线上系统服务宕机,系统的操作性能严重降低,重要信息系统服务异常,在主要业务服务时段导致业务无法正常开展达3个小时(含)以上,对业

务运作造成重大影响。 较大故障(二级): 由于系统操作功能受损,使业务运作中的某一部分功能受到不良影响,但其它部分业务功能仍可正常运作,重要信息系统服务异常,在主要业务服务时段导致业务无法正常开展达半个小时(含)以上, 一般故障(三级): 由于系统的操作性能(效率)降低,业务运作的受到不良影响,但业务功能应用仍可正常工作,在主要业务服务时段导致业务无性能不足达1个小时(含)以上; 第四条执行标准 本制度由负责解释和修订,自发文之日起开始执行。 第五条组织及职责,故障管理实行-两级管理体系 本制度涉及的相关组织有信息系统故障申告部门、受理部门、处理部门。 1、申告部门包括、分支机构相关信息系统的使用部门。申告分为、和三个层面。申告到层面能够解决的故障和问题,无须上报层面,在层面归口解决,解决不了的再上报层面解决。 2、受理部门分为和两个层面。原则上,负责故障受理和预处理,各负责级故障受理和预处理。 3、处理部门分为和两个层面。原则上,负责上报到的故障处理;各负责级的故障处理;科技联系人负责级的简单故障处理。 申告部门职责 1.负责将发现的系统故障以及问题、建议提交到故障受理部门。 2.负责在故障处理过程中与故障处理部门进行沟通。 3.负责对已修复的故障进行业务验证,在业务验证通过后及时关闭故障。 受理部门职责

运维体系说明

运维体系说明 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-MG129]

投标人运维体系说明我公司为用户提供免费技术服务热线,在接到用户请求后,根据请求情况协调公司资源,第一时间给用户反馈并解决问题。 运维组织架构 运维流程 技术支持服务热线工作流程图 1、诊断故障并提交故障诊断报告 根据系统运行过程中出现的系统故障或其它异常情况,及时进行故障诊断,并提出故障诊断报告。故障诊断报告的主要内容包括:故障现场情况记录、故障的级别和紧急处理过程记录等。 2、制定系统维护和故障恢复的实施计划 根据提交的故障诊断报告,制定系统维护和故障恢复的实施计划。按照制定的计划实施系统维护工作。 3、管理、监督维护计划的实施 组成系统维护工程管理和监督工作组,全面负责管理和监督系统维护工作实施过程(应包含用户方与项目承包商双方)。并根据系统维护实施的各个阶段提交维护工作报告。 4、确认维护工作完成并提交维护报告 在系统维护工作完成后,由系统维护人员提交系统维护工作报告,由用户方项目组的技术人员对系统维护情况进行测试并予以确认。 5、提交成果 每次系统维护工作完成后,都应提交如下的报告、记录等文档等资料:

故障诊断报告 系统维护和故障恢复的实施计划 维护工作阶段报告 系统维护工作报告 说明:紧急情况下,以排除故障,满足用户需要为首要任务,可以进行紧急处理,但事后要补充相应文档与记录。 现场服务流程 众所周知,最优的售后服务是一个项目的承建商必须做出的承诺。但是,如何根据用户的实际情况(人员素质、计算机应用水平、系统的要求等),做出切合实际的项目售后服务计划书,才是用户关注的问题。优质的售后服务也一直是我们公司在经营活动中最基本的原则。公司的技术支撑部门担负着专业的服务工作,无论是在系统的安装调试过程中还是在系统投入运行之后,无论发生任何问题用户都可以得到最快的响应,售后服务流程如下图所示: 售后服务流程 社会保险的组织结构、计算机应用水平、系统对人员素质要求等情况的分析,我们认为:社会保险信息系统稳定运行是保证本项目建设成功的一项关键因素。 公司提供的服务内容包括: 应用软件运行维护:应用软件自身缺陷的调整,为客户及时解决日 常运行中出现的问题。

管理信息系统开发过程中存在的问题及怎么解决

管理信息系统开发过程中存在的问题及怎么解决 1.对管理信息系统的认识有偏差 管理信息系统的建设与评价侧重计算机硬件配置.而不是信息开发与利用的方法和深度.这种误读给国内外许多组织的管理信息系统带来惨重损失。 2.目标不明确 管理信息系统开发前调研不够充分,分析不够清楚明了,就比如开发的工作人员中,对整个系统所需要达到的目标没有基本的,明确的、全面的的概念,就照着自己的想法做下去,进行设计和开发,做了大量工作后才发现设计不能满足用户的需要,而使得系统开发失败,重新开发设计,这样就浪费了大量的人力、物力、财力以及时间。 3.开发时忽视了高层领导者的态度 有时候开发人员本着自己的意愿设计并开发出了管理信息系统,尽管系统很好,但领导不满意属下擅自动手,不听指挥,从而浪费了时间,资源和心血,还加剧了与领导之间的隔阂。并且在没有领导的授权和支持下,能开发出一个好的信息系统很是艰难。 4.开发时缺乏既懂计算机知识又懂管理业务的复合型人才,并且人员之间的合作能力较差 “只要熟练掌握几门计算机语言,就可以成为一个优秀的信息系统开发人员”这种观点是极其错误的。计算机程序设计语言是实现计算机信息系统的一种工具或手段,编码只不过是计算机信息系统开发过程中的一小部分工作,管理信息系统开发是一项多人群体性的任务,需要很好的合作与协调,没有这些很难开发出所需要的系统,并且会使系统开发周期变长,无针对性。 5.教育、理论体系研究落后 在教育方面主要表现在教学内容陈旧,理论落后于实践,理论在某种程度上又脱离实践,在教学中往往注重学生的编程技巧能力培养,而忽视系统分析、设计能力的培养,学生的实践能力差,团队合作能力差,系统开发本身还缺乏一套严格的理论基础以及缺少一套简单有力的开发工具。 6.开发后缺乏软件测试,并且安全性有待提高 软件测试是开发过程的必要过程,不进行的话,很难知道是否达到预先的要求,实现想要达到的目的,安全性问题在我国是一个很大的问题,山寨,盗版比较猖獗,这增加了开发的成本并严重影响了更新的速度。

日常运维管理制度

日常运维管理制度 令狐采学 1.运维保障机制 (1)建立硬件、网络、系统、应用及业务软件日常维护流程机制; (2)建立故障应急处理流程机制; (3)建立备份恢复保障机制; (4)建立安全保障管理机制; (5)建立版本管理机制,管理平台生产环境运行的软件版本; 以上机制应形成文档,作为日常遵循规范,按要求执行。2.硬件维护能力 需对硬件设备具备7*24小时不间断的支持、响应能力,原则上每日对硬件设备至少健康检查一次并记录;定期对网络环境进行检查。我公司服务器部署在移动云上定期通过命令进行硬件检测,内存、硬盘、I/O的使用情进行查询并进行登记,每台服务器运行的软件对硬件性能使用情况检测,对于服务器我们进行系统备份、软件,每日对网络使用情况进行观察,针对突发异常流量进行分析。

3.故障处理响应及要求 设备(系统)出现故障时,根据不同的故障级别提供相应的服务响应,响应方式及要求如下: 4.具备应急预案 针对部署国家平台节点服务器我们实施系统备份、软件重要数据实时备份,主机备份是提供的保留某个时间点上的主机系统数据状态的服务。基于主机备份可以随时生成或删除备份,并基于已备份进行主机的恢复,实现已有应用和主机数据

的快速复用,如系统出现事故无法使用将进行系统恢复并把最近一次备份的数据进行恢复。对于突发情况建立应急服务流程,主要是针对可能发生的各种意外情况设计应急的方案,以控制和规避突发事件带来的集中性风险,从而降低设备集中性风险所造成的损失,制定以下流程图: 为保证服务实施的质量能够稳定并不断有所提升,保障客户需求能够得到有效满足,保障服务实施团队为客户提供统一、标准

相关文档
最新文档