Linux主机僵死信息收集指导 v1.0

合集下载

BCP使用指南(linux版)V1.0

BCP使用指南(linux版)V1.0

尊敬的浪潮海量存储系统软件用户:衷心感谢您选用了浪潮海量存储系统软件!本手册介绍了浪潮海量存储系统软件业务连续保护模块(Business Continuous Protection,以下简称BCP软件)的技术特性与系统的安装、设置和使用,有助于您更详细地了解和便捷地使用本款存储系统软件。

请将我方产品的包装物交废品收购站回收利用,以利于污染预防,造福人类。

浪潮集团有限公司拥有本手册的版权。

未经浪潮集团有限公司许可,任何单位和个人不得以任何形式复制本用户手册。

浪潮集团有限公司保留随时修改本手册的权利。

本手册中的内容如有变动恕不另行通知。

如果您对本手册有疑问或建议,请向浪潮集团有限公司垂询。

浪潮集团有限公司 2009年6月“浪潮”、“Inspur”是浪潮集团有限公司的注册商标。

Windows是微软公司的注册商标。

其他商标分别属于其相应的注册公司。

声 明在您正式使用本软件之前,请您先阅读以下声明。

只有您阅读了以下声明并且同意以下各条款后,方可正式开始使用本软件;如果您对以下条款有任何疑问,请和您的供货商联系或直接与我们联系。

如您未向我们就以下条款提出疑问并开始使用本软件,则是默认您已经同意了以下各条款。

1、我们提醒您特别注意:在任何时候,除了我们提示您可以修改的参数以外,您不要修改本存储系统软件中的任何其他参数。

2、在您使用的海量存储系统软件出现任何软件故障或您希望对软件进行任何升级时,请您联系我们的客户服务中心3、您在使用海量存储系统的过程中遇到的其它软件问题,我们希望您首先和相应软件的提供商联系,由他和我们联系,以方便我们沟通、共同解决您碰到的问题。

对于如数据库、网络管理软件或其他网络产品等的安装、运行问题,我们尤其希望您能够这样处理。

4、本手册中涉及的各软、硬件产品的标识、名称版权归产品的相应公司拥有。

5、以上声明中,“我们”指代浪潮集团有限公司;浪潮集团有限公司拥有对以上声明的最终解释权。

关于本手册第一章 系统概述介绍浪潮海量存储系统软件BCP的功能及系统特性。

最全Linux应急响应技巧

最全Linux应急响应技巧

最全Linux应急响应技巧原⽂地址:留存备⽤Linux环境下处理应急响应事件往往会更加的棘⼿,因为相⽐于Windows,Linux没有像Autorun、procexp这样的应急响应利器,也没有统⼀的应急响应处理流程。

所以,这篇⽂章将会对Linux环境下的应急响应流程进⾏讲解,并且提供每⼀个环节中所⽤到的shell命令,以帮助⼤家快速、系统化地处理Linux环境下的病毒。

处理Linux应急响应主要分为这4个环节:识别现象->清除病毒->闭环兜底->系统加固1. ⾸先从⽤户场景的主机异常现象出发,先识别出病毒的可疑现象。

2. 然后定位到具体的病毒进程以及病毒⽂件,进⾏清除。

3. 完成前2步还不够,病毒⼀般会通过⼀些⾃启动项及守护程序进⾏重复感染,所以我们要执⾏闭环兜底确保病毒不再被创建。

4. 将主机上的病毒项清除⼲净后,最后就是进⾏系统加固了,防⽌病毒从Web再次⼊侵进来。

⾛完这4个环节,才能算是⼀个应急响应流程的结束。

01识别现象第1个环节要求我们通过系统运⾏状态、安全设备告警,发现主机异常现象,以及确认病毒的可疑⾏为。

系统CPU是否异常枚举进程,CPU降序排序:topCPU占⽤率超过70%且名字⽐较可疑的进程,⼤概率就是挖矿病毒了。

是否存在可疑进程枚举进程命令⾏:ps -aux病毒⼀般都携带可疑的命令⾏,当你发现命令⾏中带有url等奇怪的字符串时,就要注意了,它很可能是个病毒downloader。

安全⽹关有⽆报警从安全⽹关报警中识别出威胁是最直接,但确认主机已经感染了病毒只是第⼀步,接下来得定位,具体是哪个进程在与C&C通信。

监控与⽬标IP通信的进程:while true; do netstat -antp | grep [ip]; done有时安全⽹关检测到的不全是恶意IP,还有可能是个域名,这种情况下,域名对应的IP是变化的,我们不能直接⽤上述⽅法进⾏监控。

我们可以先在host⽂件中添加⼀条规则,将恶意域名重定向到⼀个随机的IP地址,然后对其进⾏监控。

Linux出错提示信息详解

Linux出错提示信息详解

Linux出错提示信息详解深入地讲:许多人害怕Linux,因为它给出的出错提示信息简直像天书一样。

并且这样的信息有很多。

如果你在Linux Format(译者注:这是一家英国销售量最好的Linux杂志)的论坛上搜索“Error”这个词,你将会得到超过150页的内容。

那些是许多人遇到的许多问题。

用户们遇到的最大的困难并非出错提示信息的数量,而是如何从中找出有用的东西。

例如,“Kernel Oops”是什么意思,或者“PCI can't allocate”是什么意思?Linux的出错提示相当愚钝且很难理解,几乎起不了什么帮助。

这是一个遗憾,因为大绝大多数问题本可以很容易的解决,而且有相当数量的涉及同样问题的出错提示一次又一次的出现。

用商业圈里的话来说,这是最能获得立竿见影效果的部分(译者:不知些句如此翻译妥当否?请指教)。

我们要解决的正是这一部分问题。

启动你的系统不需要你成为一个Linux专家,播放视频文件也无需成为程序员。

然而大部分出错信息都假定他们的用户已掌握了此类专门技术。

我们试图阐明这些常见错误,并提供解决方案,以帮助普通的Linux用户规避这些问题,并使他们的系统回到正常状态。

我们挑选了一些我们认为问题最多的领域,包括启动、常规软件应用、文件系统、网络和发行版的安装。

我们从每个领域中挑选了几个最常见的错误,并解释了相应的解决方案是如何起作用的。

这样做的目的是,即使这些问题不适合你的情况,你也能了解为什么Linux的出错提示信息看上去如此的难以捉摸并令人生畏。

希望你能从中学会找到解决自己问题所需知识的方法。

发行版的安装每一种Linux发行版都有不同的安装例程,并且都会制造一些问题。

Ubuntu也许在一台电脑上工作良好而另外一台则不行。

一台安装了Ubuntu并运行正常的电脑也许根本无法安装Fedora,OpenSUSE, Linux Mint, 或者Mandriva...ERROR Can't boot from CD/DVD(无法从光盘启动)如何你刚开始接触Linux,下述情况通常会是你对该操作系统的第一体验:你将你的新光盘放入光驱并重启电脑,结果发现却是进入了你先前使用的操作系统。

linux中ss命令常见用法 -回复

linux中ss命令常见用法 -回复

linux中ss命令常见用法-回复SS(Socket Statistics)命令是一款用于检查网络连接状态、显示Socket 统计信息的工具。

它可以帮助系统管理员快速定位网络连接问题,并提供有关网络和主机的详细信息。

在本篇文章中,我将逐步介绍Linux中SS 命令的常见用法和相关示例。

1. SS命令的基本语法SS命令的基本语法为:ss [options]其中,options为各种参数和选项,用于控制SS命令的行为和输出内容。

2. SS命令常见参数和选项SS命令提供了许多参数和选项,以下是一些常见的用法:- `-t`:显示TCP套接字信息。

- `-u`:显示UDP套接字信息。

- `-a`:显示所有套接字信息。

- `-n`:以数字形式显示IP地址和端口号。

- `-p`:显示进程信息。

- `-l`:显示监听套接字信息。

- `-s`:显示套接字统计信息。

- `-o`:显示计时器信息。

- `-i`:显示具体接口信息。

- `-r`:显示路由表信息。

- `tcp`:仅显示TCP连接信息。

- `udp`:仅显示UDP连接信息。

- `listening`:仅显示监听套接字信息。

- `processes`:显示与套接字关联的进程信息。

3. SS命令示例3.1 显示TCP连接信息使用SS命令查看当前系统上的TCP连接信息,可以使用以下命令:ss -t该命令将显示所有的TCP连接信息,包括本地和远程IP地址、端口号、连接状态等。

3.2 显示UDP连接信息要查看系统上的UDP连接信息,可以使用以下命令:ss -u该命令将显示所有的UDP连接信息,包括本地和远程IP地址、端口号等。

3.3 显示所有套接字信息要查看系统上所有套接字的详细信息,可以使用以下命令:ss -a该命令将显示所有套接字信息,包括TCP和UDP连接。

3.4 以数字形式显示IP地址和端口号默认情况下,SS命令将IP地址和端口号显示为可读形式。

如果希望以数字形式显示,则可以使用以下命令:ss -na该命令将以数字形式显示IP地址和端口号,方便进行分析和筛选。

linux的top命令参数详细说明

linux的top命令参数详细说明

linux的top命令参数详细说明Linux中的top命令是个常用的命令之一,下面由店铺为大家整理了Linux的top命令参数详细说明,希望对大家有帮助!linux的top命令简介top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。

top显示系统当前的进程和其他状况,是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止该程序为止. 比较准确的说,top命令提供了实时的对系统处理器的状态监视.它将显示系统中CPU最“敏感”的任务列表.该命令可以按CPU使用.内存使用和执行时间对任务进行排序;而且该命令的很多特性都可以通过交互式命令或者在个人定制文件中进行设定.linux的top命令参数详细说明1.参数含义top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombieCpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0% wa, 0.0% hi, 0.0% siMem: 191272k total, 173656k used, 17616k free, 22052k buffersSwap: 192772k total, 0k used, 192772k free, 123988k cachedPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND1379 root 16 0 7976 2456 1980 S 0.7 1.3 0:11.03 sshd14704 root 16 0 2128 980 796 R 0.7 0.5 0:02.72 top1 root 16 0 1992 632 544 S 0.0 0.3 0:00.90 init2 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/03 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0统计信息区前五行是系统整体的统计信息。

Escout介绍v1

Escout介绍v1

2013年8月4日Escout China OfficeEscout Training公司介绍专注: 企业IT监控&服务管理成立: 2000年硅谷客户: 全球超过2000家市场: 美国印度台湾香港中国公司荣誉高速成长企业全球布局S. CaliforniaTexasFloridaNew York JapanUKFranceMilpitas, CAGermany Belgium LebanonArgentinaVancouverBostonCalgaryHong KongSpainSingaporeThailandTaiwanNorwayAustraliaR&D CenterR&D CenterDubaiNew Jerseyhongkong, ChinaKorea (R&D Centers in California and China)全球用户中国区销售目标金融行业政府行业运营商能源\制造行业 教育等行业目录1Escout 产品简介2Escout 应用背景3Escout 功能解密4Escout 产品特点Escout是什么Escout是一套基于Web应用的针对于企业信息化建设中一系列信息数据进行综合监控管理的解决方案。

Escout提供多种监视信息数据适配器(点)类型。

能通过对IT系统中多元化数据变化的有效监控,为您解决对信息化应用的影响。

Escout强大的功能,将使您的IT运维管理工作变得简单、轻松。

一切异动尽在掌控之中!产品建设目标⏹实现IT应用的统一监控管理⏹实现故障的早发现、早解决⏹实现运行维护管理工作的自动化系统1系统2系统3系统4系统n……维护人员1支撑系统1维护制度1维护人员2支撑系统2维护制度2维护人员3支撑系统3维护制度3维护人员4支撑系统4维护制度4维护人员n支撑系统n维护制度n图例:已有未有Escout监控服务平台1平台2平台n现状目标统一维护人员统一支撑系统统一维护制度产品功能架构监控管理操作系统LinuxUnixSolarisWindowsAIX数据库OracleSybaseDB2MySQLSQL Server路由器交换机防火墙网络设备应用服务器WeblogicWebSphereTomcatJBoss告警管理事件经验库告警颜色报警声音报警短信报警邮件报警报表管理拓扑管理网络拓扑视图网络资源管理网络自动发现中间件TuxedoIBM MQNotes资源趋势统计分类巡检配置管理模板配置监控配置基础数据MAILFTPTCPSOCKET应用系统管理系统自身监控安全管理日志管理系统维护工具库Escout 监控适配器—网络层监控对象管理对象交换机路由器防火墙端口CPU 内存端口故障数端口使用率会话数入向方出向方流量带宽利用率包速率错包率丢包率IOS 信息端口配置数据设备描述设备类型时长联系信息名称服务层次位置监控数据Escout 监控适配器—基础层基础设施硬件物理CPU 物理内存硬盘板卡物理端口网络设备路由器交换机防火墙光交换机服务器设备专用服务器服务器操作系统CPU 内存存储卷文件系统网络连接日志软件进程群集软件存储设备磁阵磁带机磁带库基础软件数据库共享内存表空间数据文件后台进程服务进程日志文件Web 中间件Web 应用程序数据库连接池线程池JVM交易中间件服务应用软件应用软件应用进程应用接口应用数据文件网络设备监控数据点类别对象性能指标网络设备CPU用户使用率、系统使用率、各板块CPU使用率内存内存使用率、已用内存数、可用内存数、共享内存数、缓存数端口端口状态、端口IP、端口MAC、端口速率、端口描述、运行时长包性能入方向包速率(pps)、入方向丢包率、入方向错包率、出方向包速率(pps)、出方向丢包率、出方向错包率比特率入方向带宽利用率、入方向流量(Mbps)、出方向带宽利用率,出方向流量(Mbps)日志设备类型(Facility)、等级(Level)、优先级(Priority)、日志类型、日志内容配置表IP地址表、MAC地址表、ARP地址表、CDP表维保信息机柜号、网络机柜号、跳线端口号、维护人等信息服务器监控数据点类别对象性能指标主机设备CPU用户使用率、系统使用率、优先进程使用率、闲置进程使用率内存内存使用率、已用内存数、可用内存数、共享内存数、缓存数磁盘各磁盘的使用率、各磁盘的剩余空间大小、磁盘的物理读速率、磁盘的物理写速率等操作系统系统进程总数、运行进程数、睡眠进程数、停止进程数、僵死进程数交换空间使用率、已用容量、闲置容量、高速缓存容量网卡接口状态、接收速率、发送速率、丢包率应用软件监控点数据类别对象性能指标中间件应用服务中间件服务器响应时间、请求数/秒、活动会话数、JDBC活动连接数、JDBC等待连接数、JDBC连接池平均使用率,线程池活动线程数、线程池空闲线程数据、线程池平均使用使用率等Web服务中间件可用性、服务应答时间、请求数/秒、页面返回状态码、页面返回内容长度等数据库数据库连接时间、连接用户数据、缓存命(击)中率、数据库日志、数据库表空间使用率、数据库锁数等目录1Escout 产品简介2Escout 应用背景3Escout 功能解密4Escout 产品特点网管员经常遇到的问题业务系统工作失常链路流量异常网络端口失效IT 应用使用故障问题出在哪里!!!企业IT 中心故障排除费时费力!问题分析网络系统规模不断扩大,复杂度日益增高,平台设备种类繁多,维护难度大;缺乏科学有效的自动监控的手段,维护人员工作效率低,故障的监视不能实时进行;网络性能要求越来越高,网络风险日益加剧,缺乏在统一平台下的综合网络及安全的管理系统,严重影响整个网络系统的可靠性和稳定性;故障发现依赖于网络管理员,使网管员工作量大、压力大;被动管理复杂管理分散管理手工管理Escout,为您解忧!做到运营网络系统的统一管理,集中监控,集中运维,减轻运维人员工作量;实现网络系统全面监控,故障早发现、早解决,确保计算机系统、网络和业务的连续稳定运行,降低发生系统故障的可能性,提升维护质量,提高客户满意度;全面的数据分析提供了决策者系统报告、趋势分析和扩容规划的数据依据;建立符合内控管理需求的运维管理流程和制度,提高整体运维水平,保障业务的稳定、高效、持续运行,提升企业管理水平;提高系统运行管理水平和服务保障能力,为业务工作提供高效、贴身服务。

linux应急响应手册

linux应急响应手册

linux应急响应手册Linux应急响应手册是一份用于帮助系统管理员和安全团队应对Linux系统遭受攻击或遇到其他安全事件的指南。

它提供了一系列的步骤和策略,以便使受攻击的系统恢复正常运行,并避免日后类似事件的发生。

以下是一个关于Linux应急响应手册的简要概述。

第一部分:准备1.建立一个应急响应团队:确定团队成员的角色和责任,并确保团队成员具备必要的技能和知识。

2.设计一个应急响应计划:制定一个详细的计划,包括在发生安全事件时所需的步骤和程序。

3.进行风险评估:评估系统和网络的安全风险,确定最常见的威胁和漏洞。

4.建立日志和监控机制:确保系统正常运行并留下足够的日志,便于事后分析。

第二部分:响应1.确认安全事件:监测并确认是否发生了安全事件,例如入侵、恶意软件感染或数据泄露。

2.实施紧急措施:立即采取必要的措施来限制损害,并保护系统的关键部分和数据。

3.隔离受感染的系统:将受感染的系统与其他系统隔离开来,以防止进一步的传播。

4.收集证据:收集与安全事件相关的证据,包括日志文件、网络流量数据和恶意软件样本等。

第三部分:分析和恢复1.分析证据:使用适当的工具和技术对收集到的证据进行分析,确定攻击的来源和方式。

2.恢复受损系统:清除受感染的系统并修复被破坏的部分,确保系统能够正常运行。

3.安全漏洞补丁:评估系统存在的漏洞,并安装适当的补丁和更新,以防止未来类似事件的发生。

4.加强安全措施:重新评估系统和网络的安全策略,并采取措施来增强其安全性。

第四部分:预防措施1.培训和教育:提供培训和教育,使员工了解常见的安全威胁和最佳实践。

2.安全审计:定期进行系统和网络的安全审计,发现并修复潜在的漏洞。

3.认证和访问控制:采用强密码和访问控制策略,确保只有授权人员可以访问关键系统和数据。

4.定期备份:定期备份系统和数据,以防止数据丢失和恢复受损系统。

总结:Linux应急响应手册为系统管理员和安全团队提供了一个详细的指南,以应对Linux系统遭受攻击或其他安全事件的情况。

如何在Linux终端中查看系统信息

如何在Linux终端中查看系统信息

如何在Linux终端中查看系统信息Linux终端是Linux操作系统中一种非常重要的工具,它不仅可以执行各种命令和操作,还能够提供系统信息以供用户参考。

本文将介绍如何在Linux终端中查看系统信息的方法和命令。

一、查看系统基本信息1. 使用 uname 命令uname命令允许我们获取有关内核和操作系统的基本信息。

在终端中输入以下命令并按回车键:```bashuname -a```此命令将显示包括内核版本、主机名、操作系统版本和架构等信息。

2. 使用 hostnamectl 命令hostnamectl命令允许我们查看和修改系统的主机名和相关信息。

在终端中输入以下命令并按回车键:```bashhostnamectl```此命令将显示主机名、操作系统版本、内核版本、硬件架构和时间相关信息。

3. 使用 lsb_release 命令lsb_release命令用于显示当前系统的发行版信息。

在终端中输入以下命令并按回车键:```bashlsb_release -a```此命令将显示操作系统的发行版名称、版本号和描述等信息。

二、查看硬件信息1. 使用 lspci 命令lspci命令用于显示计算机的PCI总线配置信息,包括连接到PCI总线的设备列表。

在终端中输入以下命令并按回车键:```bashlspci```此命令将显示包括设备名称、供应商信息和设备标识等硬件信息。

2. 使用 lsusb 命令lsusb命令用于显示连接到USB总线的设备列表。

在终端中输入以下命令并按回车键:```bashlsusb```此命令将显示包括设备名称、供应商信息和设备标识等USB设备信息。

3. 使用 lscpu 命令lscpu命令用于显示CPU架构和详细信息。

在终端中输入以下命令并按回车键:```bashlscpu```此命令将显示处理器架构、核心数量、线程数量和缓存信息等CPU 相关信息。

三、查看内存和磁盘信息1. 使用 free 命令free命令用于显示系统的内存使用情况。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

L INUX主机僵死信息收集指导
版本:1.0
1.故障现象收集
1.1.是否能ping通?(如果100%丢包才是不通)
不能ping通示例:
[root@rhel55i386-builder ~]# ping 10.4.5.1
PING 10.4.5.1 (10.4.5.1) 56(84) bytes of data.
--- 10.4.5.1 ping statistics ---
5 packets transmitted, 0 received, 100% packet loss, time 4009ms
[root@rhel55i386-builder ~]#
能ping通示例:
[root@rhel55i386-builder ~]# ping 10.1.70.1
PING 10.1.70.1 (10.1.70.1) 56(84) bytes of data.
64 bytes from 10.1.70.1: icmp_seq=1 ttl=255 time=2.11 ms
64 bytes from 10.1.70.1: icmp_seq=2 ttl=255 time=1.93 ms
64 bytes from 10.1.70.1: icmp_seq=3 ttl=255 time=2.32 ms
64 bytes from 10.1.70.1: icmp_seq=4 ttl=255 time=1.87 ms
--- 10.1.70.1 ping statistics ---
4 packets transmitted, 4 received, 0% packet loss, time 3001ms
rtt min/avg/max/mdev = 1.874/2.063/2.324/0.178 ms
[root@rhel55i386-builder ~]#
实际操作结果截屏:
1.2.是否能telnet?(如果是一致Trying …则是不通。

若出现“Escape character is
'^]'”提示字符串则表示能建立连接,但是主机没有给出登录提示,该项不能作为
主机僵死的判定依据。


不能telnet示例:
[root@rhel55i386-builder ~]# telnet 10.4.5.1
Trying 10.4.5.1...
能ping通示例:
[root@rhel55i386-builder ~]# telnet 10.1.70.47
Trying 10.1.70.47...
Connected to 10.1.70.47 (10.1.70.47).
Escape character is '^]'.
+----------------------------------------------------------------------+ | | | Authorized users only. All activity may be monitored and reported. | | | +----------------------------------------------------------------------+
login:
实际操作结果截屏:
1.3.是否能ssh?(如果有密码输入提示则可登录)
不能ssh示例:(执行命令后,光标闪烁无进一步提示)
[root@rhel55i386-builder ~]# ssh 10.4.5.1
能ssh通示例:
[root@rhel55i386-builder ~]# ssh -p 19222 10.1.70.47
root@10.1.70.47's password:
还可以使用ssh –v命令查看通信的详细过程:
[root@rhel55i386-builder ~]# ssh -v 10.4.5.1
OpenSSH_4.3p2, OpenSSL 0.9.8e-fips-rhel5 01 Jul 2008
debug1: Reading configuration data /etc/ssh/ssh_config
debug1: Applying options for *
debug1: Connecting to 10.4.5.1 [10.4.5.1] port 22.
实际操作结果截屏:
1.4.显示器、键盘是否有响应?
1.1.1.显示器是否有输出信息?请记录输出和拍照截图。

1.1.
2.键盘输入字符是否在显示器中得到回显?请记录输出和拍照截图。

1.1.3.显示器显示的是否为X-Window图形环境?请记录输出和拍照截图。

1.1.4.按下Ctrl+Alt+F1、Ctrl+Alt+F2、Ctrl+Alt+F3、Ctrl+Alt+F4组合键是否能够切
换到文本控制台。

请记录输出和拍照截图。

1.1.5.切换到文本控制台之后,键盘输入在显示器中是否得到回显?请记录输出和
拍照截图。

1.1.6.按下键盘CapsLOCK键、NumLOCK键后键盘对应的指示灯是否有响应?
1.5.串口是否有输出?
如果是使用的标准版Linux安装的系统,使用串口线和笔记本连接主机串口,波特率配置为如下图所示,,是否有登录提示并截图记录。

2.采集系统信息
1.按照如下文档《Linux 宕机分析利器 netdump kdump v1.
2.pdf》参照对应系统配置
dump信息收集机制。

Linux
宕机分析利器 netdump kdump v1.2.pdf
2.对于已经配置dump信息收集机制的主机在发生问题时,通过键盘、显示器接入后可
以进行如下操作并记录保存相关输出信息:
2.1.按下Alt+SysRq+M组合键获取主机当前内存使用信息。

2.2.按下Alt+SysRq+T组合键获取主机当前任务信息。

2.3.按下Alt+SysRq+P组合键获取主机当前CPU信息。

2.4.收集并记录上述信息输出后,再按下Alt+SysRq+C组合键触发内核生成vmcore。

如果是使用的netdump,vmcore文件将在netdump server上生成。

如果是使用的kdump,vmcore文件将在主机的/var/crash目录下生成。

3.经过上述步骤采集信息后,可以重启主机。

4.重启主机后执行sysreport命令,保存生成的sysreport压缩包。

相关文档
最新文档