监控管理和运维管理的关键事项

合集下载

公司监控设施管理制度

公司监控设施管理制度

公司监控设施管理制度一、总则为了保障公司财产安全,维护公司正常运营秩序,加强管理,提高效率,特制定本《公司监控设施管理制度》(以下简称“本制度”)。

二、管理范围本制度适用于公司内所有监控设施及相关设备的管理工作,包括但不限于监控摄像头、录像服务器等。

三、责任主体1. 公司监控设施管理委员会:负责监控设施的规划、建设、维护和管理工作;2. 监控设施管理员:负责监控设施的日常运行和维护工作;3. 全体员工:应当遵守公司监控设施管理制度,不得擅自损坏监控设施或者影响监控设施的正常运行。

四、管理原则1. 规范管理:监控设施的规划、建设、维护和管理应当按照相关规定进行,确保其合法合规;2. 安全可靠:监控设施的运行应当安全可靠,确保信息的准确性和保密性;3. 防范风险:加强对监控设施的风险防范工作,防范各类安全事故的发生;4. 依法合规:监控设施的管理工作应当遵守国家法律法规和公司相关规定。

五、监控设施管理流程1. 规划建设阶段(1)确定监控设施规划方案、选址、设计方案等;(2)组织开展监控设施建设工作,确保建设质量和进度达标;2. 运行维护阶段(1)每日监控设施管理员应当对监控设施进行巡检,确保其正常运行;(2)定期维护监控设施,及时处理故障;(3)保护监控设施的安全,防止遭到破坏或者盗窃。

3. 日常管理阶段(1)建立完善的监控设施管理档案,包括设备信息、运行情况、维护记录等;(2)加强员工教育,提高员工安全意识,防范各类安全风险;(3)保护监控设施监控数据的安全性,严禁泄露或者私自删除监控记录。

六、监控设施安全管理1. 加密保护:对监控设施数据进行加密保护,确保数据传输和存储的安全性;2. 审计监控:定期对监控设施运行情况进行审计,发现问题及时处理;3. 设备更新:随着技术的发展,定期检查监控设施设备,及时更新升级。

七、监控设施管理制度的执行1. 监控设施管理员应当切实负责监控设施的管理工作,严格执行监控设施管理制度,负责监控设施的日常运行和维护;2. 全体员工应当遵守公司监控设施管理制度,不得擅自操作或者损坏监控设施。

软件系统运维技术使用注意事项注意事项整理

软件系统运维技术使用注意事项注意事项整理

软件系统运维技术使用注意事项注意事项整理随着信息技术的迅速发展,软件系统在现代社会中扮演着重要的角色。

作为软件系统运维人员,我们需要具备一定的技术知识和注意事项,以确保系统的正常运行和安全性。

本文将介绍一些软件系统运维技术使用的注意事项,以帮助运维人员更好地完成工作。

1.备份和恢复:在软件系统运维过程中,备份和恢复是关键的任务,以防止数据丢失或系统崩溃。

运维人员应定期进行数据备份,并确保备份的数据可以准确恢复。

此外,备份数据应存储在安全可靠的地方,以防止未经授权的访问。

2.安全性:保护软件系统的安全性是运维人员的重要职责。

他们应确保系统中安装的防火墙和安全软件是最新的,并定期进行安全更新和漏洞修补。

运维人员还应定期审查和监控系统日志,以及应对潜在的安全威胁。

3.性能监控:为了确保软件系统的高性能,运维人员应定期监控系统的资源使用情况和性能指标。

他们需要使用专业的监控工具,例如性能监视器和日志分析工具,以及做好性能调整和优化。

4.设备管理:软件系统通常依赖于物理设备,例如服务器、网络设备等。

运维人员应确保这些设备的正常运行,并随时检测和修复故障。

对于长期不使用的设备,应进行合适的存储和维护,以避免损坏或安全威胁。

5.升级和更新:随着软件系统的发展,软件供应商会定期发布新的版本和更新。

运维人员应及时关注这些更新,并评估其对系统的影响。

在进行升级或更新之前,应先进行测试,并备份系统以防止意外情况。

6.故障排除:软件系统运维人员应具备良好的故障排除能力。

当系统出现故障时,他们应能够迅速识别问题,并采取适当的措施进行修复。

此外,他们还应能够分析和记录故障的原因,以便以后预防类似问题的发生。

7.沟通和合作:软件系统运维工作通常需要与其他部门、开发人员和用户进行紧密合作。

运维人员应具备良好的沟通和协作能力,能够理解用户需求,并及时解决问题。

他们还应与其他团队保持良好的沟通,以确保系统的稳定运行。

8.文档记录:为了更好地管理和维护软件系统,运维人员应建立详细的文档记录。

数据库运维管理中常见问题与注意事项的解读

数据库运维管理中常见问题与注意事项的解读

数据库运维管理中常见问题与注意事项的解读随着信息化的不断发展和企业数据量的爆炸性增长,数据库成为企业重要的信息载体和支持业务发展的核心要素,数据库的运维管理显得尤为重要。

然而,在实际操作中,数据库管理人员常常会遇到一些常见问题,同时也需要注意一些管理上的要点。

本文将解读数据库运维管理中常见问题与注意事项。

1.备份与恢复在数据库运维管理中,备份与恢复是重要的环节。

尽管备份技术成熟,但仍然会遇到一些问题。

首先,备份的策略需要合理。

不同类型的数据库和应用场景需要采取不同的备份策略,如完整备份、增量备份和差异备份等。

其次,备份数据的存储方案要考虑可用性和安全性。

定期对备份数据进行验证,确保数据完整性并能及时恢复。

2.性能优化数据库的性能优化是提升系统整体性能的关键。

常见的性能问题包括慢查询、死锁、资源争用等。

通过合理的索引设计、查询语句优化、系统参数调优等方法,可以有效提升数据库的响应性能。

此外,定期进行性能监控和性能测试,及时发现和解决潜在的性能问题。

3.安全管理数据库中存储了企业的核心数据,安全管理至关重要。

首先,数据库的权限管理需要细化到最小的权限需求,授权应按照最小权限原则进行,避免权限滥用。

同时,定期对账号和密码进行安全审计,及时发现异常操作。

此外,数据库的加密和防火墙的配置也是保护数据安全的重要手段。

4.版本升级与补丁管理数据库的版本升级和补丁管理是数据库运维中另一个重要的工作。

升级数据库版本可以获得新的功能和更好的性能,但在升级过程中需要注意以下几点:备份数据、测试升级方案、制定升级计划、监控升级过程,以及对升级后的数据库进行验证。

同时,及时安装数据库厂商发布的补丁,修复安全漏洞和错误,提高系统的稳定性。

5.容灾和高可用性数据库故障是影响业务连续性的重要因素,容灾和高可用性技术成为了必备的防护措施。

通过合理的架构设计和技术手段,如主备复制、数据同步、切换和故障转移等,可以实现数据的容灾备份和业务的高可用访问。

安全监控系统安装、维护制度

安全监控系统安装、维护制度

安全监控系统安装、维护制度一、总则为了确保安全监控系统的正常运行,提高安全生产管理水平,保障员工的生命财产安全,根据国家有关法律法规和集团安全生产的实际情况,特制定本制度。

二、组织机构1. 成立安全监控系统管理小组,负责监控系统的安装、维护、管理工作。

2. 管理小组成员由集团安全管理部门、信息管理部门、生产部门等相关人员组成。

3. 管理小组下设安全监控系统运维中心,负责监控系统的日常运维工作。

三、安装、维护制度1. 安装前准备(1)安装前,由安全管理部门组织相关人员进行现场勘查,确定监控系统的安装位置、数量、设备型号等。

(2)设备采购应符合国家相关标准,确保设备质量。

(3)安装前,对安装人员进行培训,确保其掌握设备安装、调试、操作方法。

2. 安装过程(1)安装过程中,严格按照设计方案和技术规范进行,确保系统稳定、可靠。

(2)安装完成后,进行系统调试,确保各设备、各环节正常运行。

(3)安装完成后,对安装现场进行清理,确保现场整洁。

3. 日常维护(1)运维中心应制定详细的维护计划,定期对监控系统进行巡检、维护。

(2)每天对监控系统进行例行检查,确保设备运行正常。

(3)对监控设备进行定期清洁、保养,确保设备性能。

(4)对监控系统软件进行定期升级,确保系统功能完善。

4. 故障处理(1)发现监控系统故障,运维中心应立即组织人员进行排查、维修。

(2)故障处理过程中,及时向管理小组报告故障情况,必要时寻求专业维修团队支持。

(3)故障排除后,对故障原因进行分析,制定预防措施,避免类似故障再次发生。

5. 数据管理(1)对监控系统产生的数据进行统一管理,确保数据安全、完整。

(2)定期对监控数据进行备份,防止数据丢失。

(3)对监控数据进行统计、分析,为安全生产提供数据支持。

四、培训与考核1. 定期对监控系统管理人员、操作人员进行培训,提高其业务水平。

2. 对监控系统安装、维护、管理工作进行考核,确保各项工作落实到位。

数据库运维管理中的常见问题与注意事项

数据库运维管理中的常见问题与注意事项

数据库运维管理中的常见问题与注意事项数据库运维管理是保证数据库系统正常运行的重要工作。

然而,在实际的运维管理过程中,常常会遇到一些常见问题和需要注意的事项。

本文将探讨数据库运维管理中的常见问题和注意事项,帮助读者更好地应对和解决这些问题。

首先,我们来看一些常见问题。

第一个常见问题是备份与恢复。

数据库的备份是非常重要的,以防止数据丢失或灾难发生。

然而,很多管理人员往往只关注备份的频率,而忽视了备份的可靠性和恢复的测试。

要确保备份的可靠性,首先需要选择合适的备份策略,根据业务需求和系统容量确定全量备份和增量备份的频率。

其次,备份的数据必须存储在可靠的介质上,例如磁带库或云存储。

最后,定期进行备份恢复测试,以验证备份的完整性和可恢复性。

第二个常见问题是性能问题。

数据库的性能直接影响着应用程序的响应速度和用户体验。

为了解决性能问题,首先要定位问题的根源。

数据库查询语句的性能优化是常见的解决方案。

通过优化查询语句,例如使用索引、避免全表扫描等方法,可以大大提升查询性能。

另外,定期监测数据库的性能指标,例如响应时间、并发访问量等,可以及时发现并解决性能问题。

此外,如果遇到特定的性能问题,可以考虑分析慢查询日志或使用性能分析工具来帮助定位问题。

第三个常见问题是安全性问题。

数据库中存储着重要的业务数据,因此保证数据的安全性非常重要。

首先,要设置合理的权限控制。

只给予必要的用户和角色对数据库的访问权限,并按照最小权限原则去分配权限。

其次,定期更新和维护数据库软件和系统,以确保及时修补已知的安全漏洞。

另外,要设定数据库的审计策略,记录数据库的操作日志,并进行定期的审计分析,以及时发现和应对潜在的安全风险。

接下来,我们来看一些需要注意的事项。

首先,要定期进行数据库的维护工作。

这包括数据库的空间管理、索引优化、碎片整理等。

数据库的空间管理主要涉及对表空间和日志空间的管理。

当空间不足时,需要考虑扩展表空间或进行定期的空间清理。

系统运维流程

系统运维流程

系统运维流程一、概述。

系统运维是指对计算机系统进行日常维护、监控、管理和优化,以确保系统的稳定运行和高效性能。

系统运维流程是指在实际操作中,按照一定的步骤和方法进行系统维护和管理的过程。

本文将介绍系统运维的基本流程和注意事项。

二、系统运维流程。

1. 硬件设备检查。

在进行系统运维时,首先需要对硬件设备进行检查,包括服务器、网络设备、存储设备等,确保设备正常运行,没有故障和异常情况。

2. 系统监控。

系统监控是系统运维的重要环节,通过监控系统的运行状态、性能指标和日志信息,及时发现并解决问题,保障系统的稳定性和可靠性。

3. 故障处理。

当系统出现故障时,运维人员需要及时响应,快速定位问题,并采取有效措施进行处理,以减少故障对系统运行的影响。

4. 安全管理。

安全管理是系统运维工作中至关重要的一环,包括对系统的安全漏洞进行修补、加固系统安全防护措施、定期进行安全审计等,确保系统不受到恶意攻击和非法入侵。

5. 系统优化。

通过对系统性能进行分析和评估,运维人员需要对系统进行优化调整,提高系统的运行效率和性能,以满足日益增长的业务需求。

6. 变更管理。

在系统运维过程中,对系统的变更和升级需要进行严格管理,确保变更的合理性和安全性,避免因变更引发系统故障和安全风险。

7. 文档管理。

系统运维过程中产生大量的运维文档,包括系统架构图、配置文件、操作手册等,需要进行规范管理和及时更新,以便运维人员能够及时获取相关信息。

8. 性能分析。

定期进行系统性能分析,包括对系统资源利用率、响应时间、吞吐量等进行监测和分析,及时发现性能瓶颈并进行优化。

9. 问题总结。

运维人员需要对系统运维过程中遇到的问题进行总结和归纳,形成经验教训,为今后的运维工作提供参考和借鉴。

10. 应急预案。

制定系统运维的应急预案,包括对常见故障的应急处理流程和措施,以应对突发情况,保障系统的稳定运行。

三、注意事项。

1. 系统运维人员需要具备扎实的技术功底和丰富的实战经验,能够熟练运用各类运维工具和技术手段。

监控系统设备管理制度范本

监控系统设备管理制度范本

监控系统设备管理制度范本一、总则本制度是制定为规范监控系统设备管理工作,保障监控系统设备的安全和稳定运行,提高监控系统设备的利用效率,确保监控系统设备为业务运营提供可靠的支撑。

所有职工在使用和管理监控系统设备时都必须严格遵守本制度。

二、管理责任1.部门经理是本部门监控系统设备管理的主要责任人,负责监控系统设备的日常管理、维护和运行控制。

2.系统管理员是监控系统设备的具体操作和管理者,负责监控系统设备的安装、维护、运行、备份、升级和故障处理等工作。

3.所有使用监控系统设备的员工都要遵守本制度,并按照系统管理员的要求履行相应的管理和操作职责。

三、设备安装与维护1.监控系统设备的安装和维护必须由专业人员进行,在设备安装完毕后,需进行全面测试和验证,确保设备正常工作。

2.设备的维护包括定期巡检、清洁、更换设备和线缆等,确保设备的正常工作,防止因设备故障而影响日常工作。

3.设备维护过程中,需制定详细记录,包括维护内容、时间、人员等,确保维护工作的可追溯性和可评估性。

四、设备运行控制1.监控系统设备的运行控制应严格按照操作规程进行,确保设备正常、稳定运行。

2.系统管理员负责设备的开关机操作,确保设备在工作时刻保持正常状态,非工作时刻关闭。

3.系统管理员负责监控系统设备的存储管理,包括数据备份、清理、扩容等工作,确保设备正常运行。

五、设备备份与恢复1.定期备份监控系统设备的所有数据,包括配置数据、用户数据和系统日志等。

2.备份数据存储在安全的地方,并定期检查备份数据的完整性和可用性。

3.在设备出现故障或数据丢失时,及时进行数据恢复或设备替换。

六、设备故障处理1.当设备出现故障时,系统管理员应立即启动故障处理程序,包括检查设备状态、重新启动设备、调整配置等。

2.如果故障无法自行解决,应及时联系设备供应商或维修部门进行修复。

3.故障处理过程中,需制定详细的记录,包括故障现象、处理过程、修复结果等,以便后续跟踪和分析。

信息系统运行维护和监控管理制度

信息系统运行维护和监控管理制度

信息系统运行维护和监控管理制度第一章总则第一条为保障XX公司网站信息系统安全、稳定运行,加强网络与信息系统运行维护和监控管理,特制订此规定。

第二条本规定适用于XX公司。

第二章运行维护和监控工作第三条由技术部共同负责信息系统的安全运行维护和监控工作,保证各项业务的正常运行。

第四条建立安全管理中心,对通信线路、主机、网络设备和应用软件的运行状况,对设备状态、恶意代码、网络流量、补丁升级、安全审计等安全相关事项进行集中管理,并形成监测记录文档,指定专人对监测记录进行整理并保管。

第五条监测记录应包括监测对象、监控内容、监控的异常现象处理等方面。

第六条组织人员定期每个月对监测记录进行一次分析、评审,发现可疑行为时采取必要的措施,并形成分析报告,分析报告应包括监测到的异常现象和处理措施等。

第七条维护项目应包括但不限于以下内容:网络链路的实时监控,网络的连通性(内网、外网)、时延、丢包率检查,设备运行状态检查,出口链路或关键链路流量检查,设备备份工作等。

第八条定期每年对安全设备的策略进行一次检查,确保安全策略符合系统现状的要求。

第九条对设备和软件的日志定期每个月进行审计,了解整个网络的状况、设备的运行状况和网络故障及攻击事件。

第十条设备和软件分为版本升级和相关库(如病毒库、IDS策略库)升级两部分。

在业务不能满足或者出现一个很严重的漏洞的情况下,要进行相关升级。

第十一条运维人员负责维护和监控责任范围内的设备,不得越权进行访问。

第三章安全运行维护和监控作业计划第十二条系统运维人员根据维护和监控工作内容制定各项计划性的安全维护工作。

第十三条作业计划应包括以下内容:安全设备维护、安全监控、操作日志、日志审核、故障管理、测试等工作。

第十四条编制安全维护作业计划时,应充分考虑可能发生的各种情况,明确执行期限,落实到人。

第十五条编制安全维护作业计划时,应明确各项作业的执行完成标志,提供可操作的核查手段。

第十六条安全维护作业计划核准下达后,要保质、保量、按时完成,不得任意更改,如系统环境变化或遇特殊情况需要临时变动时,须经技术部核准后及时更新。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可实时检测应用系统的可用性;
(4)服务器操作系统运行日志管理要求
可自动对系统syslog日志内容进行分析,判断系统中的重要错误、警告以及性能等问题,并给出相应的告警;
对主机系统及其外设的硬件故障可通过对其相应的故障日志的分析,做出及时的告警;
(5)服务器硬件监测
能够监测IBM、HP等服务器的硬件状态,如温度、风扇和磁盘运转情况,同时能够支持对常见Vmware等虚拟机的监测。
2、网络系统监控
网络系统监控主要对路由器、交换机、防火墙、IDS/IPS/网闸等设备进行监控和管理,实现网络拓扑管理、网络性能管理、网络配置管理、网络故障管理等功能,支持主流网络和安全设备厂商。
支持网络中可基于SNMP协议的网络设备监控管理需实现网络拓扑管理、网络性能管理、网络故障管理、网络配置管理等。系统能够统一进行用户全网拓扑展现,提供全网网络设备性能监控、并提供ping、tracert、telnet、网络设备配置文件自动定期备份等一系列自动化管理手段。
(2)性能监控
监控中间件服务器占用资源CPU、内存占有情况;
监控中间件应用服务器打开连接数;
监控中间件应用服务器Sockets数;
监控中间件应用服务器总交易数;
退出交易数和提交交易数;
对中间件应用服务器JSP/SERVLET监控:最大执行时间,平均执行时间,重新加载累计值,重新加载累计值比率;
(3)应用监控
事件的提交应具有通过监测自动生成事件、用户通过Web方式提交事件、管理员手动提交事件三种方式。
事件在提交后,系统可自动匹配知识库及以往同类事件中的处理过程,保证并提高事件的处理效率。
事件处理的基本工作流程应该包括故障确认与记录、归类和初步支持、故障调查与分析、解决故障、关闭。对于复杂或重大故障,解决故障的步骤多、过程相对复杂,还要求提供更为灵活的工作流程支持。
5、中间件及应用监控
监控中间件及WEB\HTTP\FTP关键的运行状态和性能。涉及的产品WEBLOGIC、TUXEDO、WEBSPHERE、MQ、TOMCAT、JBOSS、EXCHANGE等
(1)可用性监控
当中间件服务器实例或其他被监控组件出现异常事件时报警;
可集成中间件管理软件的管理能力,可启动、关闭、锁和解锁服务器,具有强制垃圾惧能力,创建,优化和摧毁JDBC连接池,发布应用等功能;
实现问题和事件记录的关联,可以从问题记录查询到相关的所有事件,反之亦可。管理人员可以将各种故障处理的步骤和方法写入知识库,以有效帮助其它管理人员及时、有效地处理故障,同时可以提高整个运维团队的系统管理水平
完整记录针对各类问题的解决方案、测试方案及环境条件和结果,经过一定的分析、归纳和整理的过程后针对该类问题的解决方案,以实现有效的知识积累和分析,生成知识库,便于指导以后问题和事件的解决。
运维监控平台建设技术说明概要
建设技术需求:
技术需求
1
总体要求
平台基于.NET或J2EE技术开发,可跨平台部署,系统支持多级部署模式,以满足后期全省运维体系大集中的需求。整个系统为一体化服务综合管理平台,要求所有功能模块必须为同一厂商统一设计规划开发而并非简单集成;系统采用SmartClient(B/S登陆、C/S操作)或B/S技术架构,客户端免维护,全中文管理界面。支持统一Portal门户管理,需有完善的用户管理功能,不同角色的用户拥有不同的管理监控权限及相应界面,所见即所得,支持分级权限管理。
CPU性能管理:可监视系统CPU利用率,可按照占用CPU的情况给出系统所运行的进程列表;
内存使用情况管理:可监视系统内存的利用率以及虚拟内存的使用率;
硬盘利用情况管理:可显示硬盘或磁盘阵列的使用率;可显示用于文件读或写操作的磁盘I/O利用率;
系统进程管理:可实时监视系统进程的运行状况,并能在系统进程出现异常时给出告警;
对网络流量异常情况进行监控;
支持对STP、VTP、OSPF、BGP等协议的分析和识别;
支持对非法主机接入的自动发现,并可发现MAC和IP的对应情况及其连接的交换机和接口;
支持对VLAN及所属VLAN设备的管理,能够直观的呈现网络中的VLAN信息及其所属设备;
能够定位广播风暴,具有对广播风暴监控的功能,能够统计分析广播风暴的根源设备;
(1)网络拓扑视图
支持网络节点的自动发现,网络拓扑结构的自动生成及实时更新。对于自动发现的网络设备的不同平台的主机以不同的图标显示,对于无法自动识别生产厂家及产品类型的网络和主机设备,提供手工方式加以定义;
可方便、直观的定制网络监控策略、发现过滤策略;
提供网络物理拓扑图、逻辑分类视图,各视图层次清晰,可编辑视图。
事件记录至少包括以下内容:事件编号(唯一性)、事件类别、故障日期与时间、事件申告人信息、事件记录人、事件描述、事件紧急程度与处理优先级、事件状态(待处理、处理中和终止)、相关配置项、事件原因、事件解决方案、配置变更情况、事件处理人员、解决日期与时间、事件终止日期。
5、问题管理及知识库管理
提供图形化问题审控流程设计功能,在问题提交后可自动发现同类提交问题,并按照类型归并或者取消操作此问题。
(2)网络性能管理
可根据被管理的类型及其属性,定时采集性能数据,如CPU利用率、内存利用率、端口利用率、端口错误率、端口丢包率、端口流量,并将数据保存在数据库中供统计、分析使用;
对每一个被管理对名,可针对不同的性能指标进行阈值设置,设置阈值检查和告警,提供相应的阈值管理和溢出告警机制;支持对监测阀值和监测平率的统一修改;
确保告警的高度准确性,提供故障信息的事件关联处理,避免重复报警和误报,在发现系统异常后,可以根据用户的设定发送报警;需实现重要告警自动触发故障事件管理流程工单下发功能。发现被监测的监视项故障,系统可进行重复检查验证,且可配置对故障的检查验证次数。支持按照时段设置预警和报警策略,可在非工作时间报警。
3
能够实时监测网络线路的丢包;
(4)网络配置管理
能够实现网络设备的配置文件的备份和恢复;可以方便的对网络设备的配置文件进行下载和上传;
能够自动发现上述网络设备的型号、IP地址列表、各接口列表、CPU、内存、硬盘,并可以自动更新自动发现的结构;
支持基于设备面板的管理,可以在设备面板上真实、实时的显示设备各端口连接状态和性能信息。
可以由用户申请产生变更请求,在变更请求中记录变更申请人、变更请求状态以及详细的信息描述,包括实现变更必须完成的特定活动,该变更对业务的影响程度等。
变更可按照严格的审批流程进行,没有通过审批的变更请求,能够自动禁止变更工单的派发。
利用管理信息统计等手段对流程的执行提供统计、分析和查询等功能。
4、事件管理
4、数据库监控
支持对系统中的ORACLE、SYBASE、SQL SERVER、DB2、My SQL等主流数据库进行监控及管理。能够数据库的实时性能运行状况、各种性能指标进行监控,以保证数据库的正常运作。
(1)运行监控
服务器实例的可用性,监控数据库实例的状态,登陆的用户数等;
空间监控:监控数据库表空间、日志的使用情况,碎片情况,超过指定阈值则报警;
平台主要包括监控管理和运维管理两大部分,其中:
监控管理主要包括:网络系统监控、服务器监控、操作系统监控、数据库监控、中间件监控、应用监控等。
运维管理主要包括:IT资产管理、配置管理、变更管理、事件管理、问题管理、知识库管理、任务管理等。
平台软件应包括对100台服务器、50台网络设备、50台安全设备、20个数据库、20个中间件的监控及相关功能,还包括应用可用性监控(web/ftp/email等) 30个节点。整个平台为一体化服务综合管理平台,要求所有功能模块必须为同一厂商统一设计规划开发而并非简单集成;平台必须支持开放接口及二次定制开发功能。
(2)服务器系统文件系统管理
可实时监视文件系统空间的使用情况,并在文件系统达到一定的阈值时给出告警。
(3)服务器操作系统应用进程管理
监控应用系统进程的运行状态,可在应用系统进程出现异常时给出告警,并能在主要用系统的进程终止时给予自动重启该进程的操作,同时发送告警到控制台;
对关键进程占用系统资源的情况进行管理;
2)系统能够从多种角度展现监控视图,包括网络拓扑、设备分类展现、分不同区域关联展现,从业务角度关联展现,机房机架展现、服务器驾驶舱展现等;
3)告警管理支持性能告警管理、关联告警分析、故障分析处理、告警事件与服务流程工单联动触发、统一报表展现、系统管理、工具集等模块;
4)整个监控管理可方便、清晰的展现整个IT系统的健康运行状态和相应告警。
运维管理
1、IT资产管理
建立配置管理信息库CMDB,资产管理配置包括资产的范围、来源、状态、资产责任人等配置属性,使管理人员对整个数据中心的资产状况有全面的了解,动态管理信息系统内部的IT资产情况。可以按照用户的要求对资产进行分类和统计。
2、配置管理
可以自动识别IT组件的类别、厂商、功能,并识别IT组件之间的关系,例如、连接关系、使用关系、组成关系、涉及关系。
支持对IT组件的完整生命周期管理,具体包括:采购中,使用中,维修中等。
可按照IT业务应用的角度和IT基础架构的角度,对IT组件进行可视化管理。
3、变更管理
对变更审批和变更实施过程进行正确记录,并提供后续的审核和历史信息统计。可按照变更的类型进行统计。
合理定义变更的类别和优先级,实现变更的高效执行和有效分析统计。
2
监控管理
1、监控管理总体要求
监控管理要求必须实现省局整个数据中心的IT基础设施全局监控,包括网络系统监控、服务器监控、采集需支持SNMP、SYSLOG、FTP、JDBC、TELNET、SSH、Agent脚本等多种主动轮询及被动接收方式,监控采集过程要求必须不影响设备及业务系统的正常运行;
3、服务器及操作系统监控
支持IBM、HP小型机、主流PC服务器的监控和管理,包括AIX、HP-UNIX、LINUX、windows操作系统的监控和管理,同时也必须支持虚拟化主机的监控管理,包括物理实体主机及虚机的性能指标。可基于SNMP、syslog、ssh、telnet等多种采集指标方式。
相关文档
最新文档