linux系统巡检命令及相关知识点整理
巡检主要内容与方法说明

巡检主要内容与方法说明巡检主要内容与方法一、日常巡检内容包括以下方面:1、服务器物理硬件巡检2、操作系统的磁盘、内存、cpu、硬盘读写情况使用情况3、服务器系统日志4、运行与服务器上应用是否可用5、应用系统日志检查(根据实际情况执行)6、数据库运行状态、运行日志检查(根据实际情况执行)7、数据库定时备份机制执行情况(根据实际情况执行)8、系统定时任务执行情况(根据实际情况执行)二、巡检内容详细说明1、服务器硬件巡检主要内容1)服务器硬盘工作状态检查方法:硬盘指示灯指示是否正常,一般绿色为正常2)服务器网卡工作状态检查方法:服务器插上网线后,若有数据传输,则网卡指示灯呈现规律性闪烁;若闪烁不正常或指示灯指示颜色不正常,则说明系统数据传输将不正常3)服务器散热检测检查方法:靠近服务器检查是否有热风吹出4)服务器风扇运行检测检查方法:检查服务器风扇是否正常运行5)服务器电源连接检查检查方法:电源连接线是否有松动、接触不良等情况6)服务器外壳整体检查检查方法:服务器整体是否有移动或损害痕迹2、内存、cpu、硬盘读写与使用巡检主要内容1)内存、cpu使用情况巡检检查方法:Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序;Linux下通过free或cat /proc/meminfo命令查看系统内存使用情况,通过top命令进程占用系统内存、cpu情况AIX下通过topas或svmon或其他相关命令查看系统内存占用情况,使用ps命令查看占cpu、内存使用情况(具体要根据实际情况添加相应参数)2)硬盘使用与读写io巡检检查方法:Windows下通过查看系统属性可以查看磁盘分区与对应分区使用情况,在windows 2008系统任务管理器中可以查看到当时的系统io 情况Linux/AIX下通过df命令查看磁盘使用情况,通过iostat命令查看io命令(在linux 5.4中有问题)3、服务器系统日志1)重要的系统日志检查检查方法:windows系统下通过事件查看器进行查看,重点记录其错误日志号即可,通过错误日志号对错误进行定位解决linux系统查看如下日志:/var/log/lastlog :记录最后一次用户成功登陆的时间、登陆IP 等信息/var/log/messages :记录Linux操作系统常见的系统和服务错误信息/var/log/secure :Linux系统安全日志,记录用户和工作组变坏情况、用户登陆认证情况/var/log/btmp :记录Linux登陆失败的用户、时间以及远程IP 地址例如cat /var/log/lastlogAIX系统查看如下日志:通过last –n查看登录前n次登录的信息通过who /etc/security/failedlogin命令查看用户登录和访问服务器失败的情况信息通过alog –o –t boot命令查看系统启动错误日志通过tail –f /tmp/hacmp.out来检查HACMP在启动和关闭时的信息,如出现启动失败则可以帮助我们定位错误4、运行在服务器上应用是否可用1)对于金蝶应用是否可用的检查检查方法:通过双击金蝶客户端检测是否可以连接上来进行检验,输入用户名和密码登录进去后,则证明应用可用2)对于英孚思为dms、tms应用检查检查方法:通过双击dms客户端检测连接是否可以进行正常登录;系统层面通过在ie浏览器中输入http://ip:8080检查tomcat status来查看,如可以登录上,则证明系统服务端可用注:ip代表应用部署所在的服务器3)对于英孚思为gms应用检查检查方法:通过在ie浏览器中输入http://10.10.11.44/gms检查是否可用4)其他系统根据应用实际情况进行补充即可5、应用系统日志检查(根据实际情况执行)1)对于金蝶系统日志检查检查方法:cd /kingdee/kingdee/eas/admin/logs#tail –f admin.log2)业务系统地区dms、tms应用日志检查检查方法:该系统主要通过tomcat发布,所以需重点检查tomcat日志,此外,该系统产生dmslog 和tmslog来进行检查3)业务系统集团端应用日志检查检查方法:该软件主要通过ibm web application server发布,所以在系统层面主要查看其发布件运行状态。
linux相关的运维基础常识

linux相关的运维基础常识Linux运维基础常识Linux操作系统是一种类Unix操作系统,广泛应用于服务器、工作站等领域。
以下是一些Linux运维的基础常识:1. 常见的Linux发行版有Ubuntu、Debian、RedHat、CentOS等,不同发行版有不同的安装和配置方式。
2. Linux系统中文件和目录以“/”开头,例如“/var/log/messages”表示根目录下的var目录下的log目录下的messages文件。
3. Linux系统中,不同类型的文件有不同的权限,可以分为读、写、执行三种权限,可以通过“ls -l”命令查看文件权限。
4. Linux系统中,可以通过系统日志来查看系统的运行状态和故障信息,常见的系统日志有/var/log/messages、/var/log/syslog等。
5. Linux系统中,常用的命令有cd(切换目录)、ls(查看文件目录)、mkdir(创建目录)、rm(删除文件或目录)、vim(编辑文本文件)等。
6. Linux系统中,常见的网络命令有ping(测试网络连通性)、ifconfig(查看系统网络配置)、iptables(设置防火墙规则)等。
7. Linux系统中,常见的服务命令有service(管理系统服务)、chkconfig(设置系统服务启动顺序)、top(查看系统状态)等。
8. Linux系统中,常见的安装和管理软件的方法有yum(RedHat系列发行版)、apt-get(Debian系列发行版)等。
9. Linux系统中,安全是非常重要的,可以通过设置防火墙、安装安全软件、关闭不必要的端口等方式来提高系统的安全性。
以上是一些基础的Linux运维常识,了解这些常识对于新手来说是非常重要的。
同时,也需要不断学习掌握更多的技能和技巧,才能更好地管理和维护Linux系统。
linux日常巡检方法

linux日常巡检方法
【最新版】
目录
1.Linux 日常巡检的必要性
2.Linux 日常巡检的方法
2.1 系统日志检查
2.2 系统资源使用情况检查
2.3 系统安全检查
2.4 系统性能检查
正文
【Linux 日常巡检的必要性】
Linux 系统的日常巡检对于保证系统的稳定性、安全性和性能至关重要。
通过对系统的各项指标进行定期检查,可以发现潜在的问题,防止系统故障,确保系统持续、稳定地运行。
【Linux 日常巡检的方法】
【2.1 系统日志检查】
系统日志是 Linux 系统运行过程中产生的一系列记录,通过检查日志,可以了解系统的运行状况和潜在问题。
常用的日志检查工具有 grep、awk 等。
对于异常日志,需要及时分析原因并采取相应措施。
【2.2 系统资源使用情况检查】
系统资源使用情况是衡量系统性能的重要指标,包括 CPU 使用率、内存使用率、磁盘使用率等。
可以使用 top、vmstat 等命令查看实时的系统资源使用情况,以便及时发现并处理资源瓶颈问题。
【2.3 系统安全检查】
系统安全是 Linux 系统运行的重要保障,需要定期检查系统安全漏洞、软件更新等情况。
常用的安全检查工具有 sudo、chmod 等,还需要定期更新系统补丁和软件包,以保障系统的安全稳定运行。
【2.4 系统性能检查】
系统性能是评价系统运行质量的重要指标,包括系统响应速度、数据传输速度等。
可以通过监测系统性能指标,如 CPU 利用率、磁盘 I/O 速度等,来评估系统的性能,并根据实际情况进行优化。
巡检用到的命令

/var/spool/cron查看对时服务 crontab -l
查日志
var/adm
var/log
uptime 系统运行时间
vmstat 查看内存
prstat -a
swap -s
Solaris 10
bash
cat /etc/release 系统版本
1133 ls
ps -ef |grep java
ps -ef |grep web 查看pid文件 solaris操作系统
ps -ef |grep servername
/sbin/ifconfig -a查看网络配置
查看NFS文件共享cat /etc/exports
查看防火墙状态 service iptables status
程序必须以下面的行开始(必须方在文件的第一行):
#! /bin/sh
符号#!用来告诉系统它后面的参数是用来执行该文件的程序。在这个例子中我们使用/bin/sh来执行程序。
当编辑好脚本时,要想执行脚本,必须使脚本可以执行
下面的命令,可以使脚本可以执行
chmod +x filename 或 chmod 755 filename
一,
1,
Cmd 输入 netstat –ano
可以看到
2,
例如我查80端口被什么占用了 对应的进程id是 3600
再输入tasklist来查看 pid 3600是哪个进程什么程序在跑
3,
可以很快看到是tomcat6在用pid 3600 也即此占用了80端口
此时可以用 taskkill /pid 3600 /t /f 快速关闭此进程
Linux服务器巡检指导

Linux服务器巡检指导Linux服务器巡检指导随着互联网技术的不断发展,Linux服务器在各行各业中得到了广泛应用。
为了保证服务器的稳定性和安全性,进行定期的巡检至关重要。
本文将为大家提供一份详细的Linux服务器巡检指导,包括巡检的意义、准备事项、常用命令、实践经验以及总结。
一、明确巡检的意义Linux服务器巡检的主要意义在于:1、及时发现潜在的安全隐患,防止黑客攻击和数据泄露;2、诊断并解决服务器性能问题,提高系统稳定性;3、通过定期的巡检,了解服务器的运行状态,为后续的运维工作提供数据支持。
二、巡检前的准备事项在进行Linux服务器巡检前,需要做好以下准备事项:1、准备巡检工具:常用的巡检工具包括Nmap、Netcat、Nagios等;2、确定巡检范围:根据实际需要,确定要巡检的服务器范围;3、备份重要数据:在开始巡检之前,建议备份服务器上的重要数据,以防万一。
三、常用巡检命令以下是一些常用的Linux服务器巡检命令:1、查看服务器硬件信息:使用lshw命令可以查看服务器硬件的详细信息,包括CPU核数、内存大小、硬盘容量等;2、查看服务器网络状态:使用ifconfig命令可以查看服务器的网络接口状态,包括IP地址、子网掩码等;3、查看服务器运行的服务:使用ss命令可以查看当前运行的进程和服务;4、查看服务器端口状态:使用netstat命令可以查看服务器的端口状态,判断是否有异常连接。
四、实践经验分享在进行Linux服务器巡检时,积累一些实践经验会很有帮助。
以下是一些经验分享:1、注意服务器环境:在巡检过程中,注意服务器的环境,包括温度、湿度等,以确保服务器正常运行;2、关注异常进程:在查看进程和服务时,关注异常进程,判断是否存在可疑程序;3、定期更新补丁:定期更新服务器系统补丁,修复安全漏洞;4、加强密码管理:加强服务器密码管理,避免弱密码和重复使用密码。
五、总结本文提供了一份详细的Linux服务器巡检指导,包括巡检的意义、准备事项、常用命令、实践经验以及总结。
服务器操作系统巡检命令

AIX日常巡检命令巡检命令:1.oslevel -s查看系统版本号2.hostname 查看主机名称3.nmon 查看序列号,系统内核位数4.lscfg -vp |grep -p PLATFORM 查看系统微码lscfg -vp |grep -p Systemlscfg -vp 查看所有硬件设备微码5.alog -o -t boot 查看系统上次启动的日志6.uptime 时间运行时间与系统的负载st reboot 查看系统上次重启的时间8.diag检查系统硬件运行情况9.lspv 查看卷组镜像10.df -g 查看文件系统使用信息,-g以GBytes为单位,-m以MBytes为单位,-k以KBytes为单位11.lsfs 列出所有文件系统12.mount 列出挂载的文件系统13.bootinfo -y 查看机器硬件位数,bootinfo -K 查看AIX系统内核位数,bootinfo -r 查看物理内存大小14.prtconf 查看系统的所有信息15.errpt 查看系统错误日志16.mail发送给root用户的错误报告17.more /tmp/hacmp.out and smit.log and alog –o –t boot 检查hacmp.out,smit.log,bootlog等lssrc -g cluster检查HA18.lsvg -l rootvg或lsvg rootvg查看逻辑卷的状态,是否有“stale”状态19.lsps -a或lsps -s查看paging space的使用信息stat -in显示IP地址,netstat -rn显示路由表信息,netstat -i网卡21.sysdumpdev -l 查看DUMP设置22.ps -ef |grep err 和 ps -ef |grep src 检查errdemon,srcstr运行状态23.instfix -i|grep ML 查看补丁级别及是否完整linux 系统巡检常用命令查看一些硬件配置# uname -a # 查看内核/操作系统/CPU信息# head -n 1 /etc/issue # 查看操作系统版本# cat /proc/cpuinfo # 查看CPU信息# hostname # 查看计算机名# lspci -tv # 列出所有PCI设备# lsusb -tv # 列出所有USB设备# lsmod # 列出加载的内核模块# env # 查看环境变量资源# free -m # 查看内存使用量和交换区使用量# df -h # 查看各分区使用情况# du -sh <目录名> # 查看指定目录的大小# grep MemTotal /proc/meminfo # 查看内存总量# grep MemFree /proc/meminfo # 查看空闲内存量# uptime # 查看系统运行时间、用户数、负载# cat /proc/loadavg # 查看系统负载磁盘和分区# mount | column -t # 查看挂接的分区状态# fdisk -l # 查看所有分区# swapon -s # 查看所有交换分区# hdparm -i /dev/hda # 查看磁盘参数(仅适用于IDE设备)# dmesg | grep IDE # 查看启动时IDE设备检测状况网络# ifconfig # 查看所有网络接口的属性# iptables -L # 查看防火墙设置# route -n # 查看路由表# netstat -lntp # 查看所有监听端口# netstat -antp # 查看所有已经建立的连接# netstat -s # 查看网络统计信息进程# ps -ef # 查看所有进程# top # 实时显示进程状态用户# w # 查看活动用户# id <用户名> # 查看指定用户信息# last # 查看用户登录日志# cut -d: -f1 /etc/passwd # 查看系统所有用户# cut -d: -f1 /etc/group # 查看系统所有组# crontab -l # 查看当前用户的计划任务服务# chkconfig --list # 列出所有系统服务# chkconfig --list | grep on # 列出所有启动的系统服务程序# rpm -qa # 查看所有以rpm形式安装的软件包。
Linux服务器巡检指导

Linux服务器巡检指导Linux服务器巡检指导1.硬件巡检1.1 检查服务器硬件是否正常工作,包括CPU、内存、硬盘和电源等是否有故障。
1.2 检查物理连接线路,确保连接稳定可靠。
1.3 检查温度和风扇工作状况,避免硬件过热。
2.操作系统巡检2.1 检查系统版本和补丁,及时更新操作系统以修复漏洞。
2.2 检查磁盘空间,清理不必要的文件,防止磁盘溢出。
2.3 检查日志文件,查找异常信息和错误日志,及时处理问题。
2.4 检查网络配置,确保网络连接正常,防火墙配置正确。
3.服务和进程巡检3.1 检查运行的服务和进程,确保关键服务正常运行。
3.2 检查服务日志,查找错误信息,并及时处理故障。
3.3 检查服务端口,确保只开放必要的端口,避免安全风险。
4.安全巡检4.1 检查用户和组配置,删除不必要的用户和组,限制权限。
4.2 检查文件和目录权限,保证关键文件和目录的权限设置正确。
4.3 检查密码策略,设置复杂密码,并定期修改密码。
4.4 检查防火墙配置,确保防火墙规则设置正确并有效。
5.备份和恢复巡检5.1 检查备份策略,包括备份频率和备份存储介质。
5.2 检查备份的完整性和可恢复性,确保备份数据可靠。
5.3 检查备份恢复流程,测试备份恢复功能,确保能够及时恢复数据。
6.性能监控和优化巡检6.1 监控服务器的CPU、内存、磁盘和网络等性能指标。
6.2 优化系统内核参数,提升系统性能和稳定性。
6.3 优化关键服务和应用程序的配置,提高性能。
7.日常维护巡检7.1 定期清理日志文件,避免日志过大影响系统性能。
7.2 定期更新软件包和补丁,保持系统安全性。
7.3 定期检查硬件状态,确保及时更换老化硬件。
7.4 定期监测系统性能,发现潜在问题并进行优化。
附件:无附件。
法律名词及注释:1.操作系统:计算机系统的核心软件,提供计算机硬件与应用软件之间的接口。
2.漏洞:软件或系统中存在的安全漏洞,可能被攻击者利用导致系统被入侵。
linux日常巡检方法

linux日常巡检方法Linux日常巡检是确保Linux服务器正常运行的重要工作之一、巡检可以帮助我们发现潜在问题,提前解决,从而避免系统故障和安全问题的发生。
下面我将介绍一些常用的Linux日常巡检方法。
1.CPU使用率检查:通过命令“top”或“htop”可以查看CPU的使用率,通过观察CPU 的使用情况,可以判断系统是否存在过载问题,及时采取措施处理。
2.内存使用情况检查:使用命令“free -h”可以查看内存使用情况,包括已用内存、可用内存、缓存和交换空间等。
如果内存使用率过高,可能会导致系统变慢或者崩溃,需要进一步检查哪些进程占用了过多的内存。
3.磁盘空间检查:通过命令“df -h”可以查看各个分区的磁盘空间使用情况,及时发现磁盘空间不足的问题,避免系统因为磁盘满了而停止工作。
4.磁盘I/O检查:使用命令“iostat -x 1”可以实时监控磁盘的读写情况,可以检查磁盘是否存在过高的I/O负载,以及是否有磁盘读写速度异常的问题。
5.网络连接检查:使用命令“netstat -tun lp”可以查看当前的网络连接情况,包括TCP和UDP连接。
可以检查是否存在异常连接,及时发现并处理网络安全问题。
6.日志文件检查:通过检查系统日志文件,如/var/log/messages和/var/log/syslog,可以了解系统的运行状态,包括系统启动,服务启动和关闭等。
如果发现异常或者错误信息,可以及时采取措施解决。
7.进程监控:使用命令“ps aux”可以查看当前运行的进程列表,如果发现有异常或者未知的进程,可能存在安全风险。
应该及时调查并进行处理。
8.定时任务检查:通过命令“cron tab -l”可以查看系统的定时任务列表,确保定时任务正常运行,并检查是否存在异常的定时任务,避免系统遭受攻击。
9.网络服务检查:通过命令“systemctl list-units --type=service”可以查看系统中运行的服务列表,确保关键服务正常运行,并检查是否存在异常的服务进程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系统:
uname -a
#例如:
#[root@dingoshan ~]# uname -a
#Linux dingoshan 2.6.9-55.ELsmp #1 SMP Fri Apr 20 17:03:35 EDT 2007 i686 i686 i386 GNU/Linux
#Linux dingoshan:所在主机的主机名,与主机配置文件/etc/hosts内容一致
2.6.9-55.ELsmp#1:内核版本号
SMP Fri Apr 20 17:03:35 EDT 2007:系统启动时间
i686:CPU指令集
i686:CPU厂商
i386:CPU架构
GNU/Linux:该Linux版本符合GNU
hostname
#系统主机名称
hostid
#系统相关MAC地址,此项为电脑唯一项,每个主机均不同。
Linux与Solaris中Hostid可修改,但为避免修改后出现问题,特此不建议修改,切忌!!!
cat /etc/hosts
#查看系统配置文件hosts,主机名称。
uptime
#查看系统已运行时间。
date
#查看系统现在时间。
top
#查看即时的系统进程状态,相似于windows系统中的查看系统进程,时时跳动,ctrl+C结束。
df -k
#以K为单位,查看系统磁盘使用空间。
cat /etc/fstab
#/etc/fstab有几个用处:
决定开机时自动挂载哪些介质;
指定每个介质挂载时的可选项、载入点;
系统用来挂载几个虚拟文件系统。
dmidecode
#dmidecode的输出格式一般如下:
Handle 0x0002
DMI type 2, 8 bytes
Base Board Information
Manufacturer:Intel
Product Name: C440GX+
Version: 727281-0001
Serial Number: INCY92700942
其中的前三行都称为记录头(recoce Header), 其中包括了:
1、recode id(handle): DMI表中的记录标识符,这是唯一的,比如上例中的Handle 0x0002。
2、dmi type id: 记录的类型,譬如说:BIOS,Memory,上例是type 2,即"Base Board Information"
3、recode size: DMI表中对应记录的大小,上例为8 bytes.(不包括文本信息,所有实际输出的内容比这个size要更大。
)记录头之后就是记录的值:
4、decoded values: 记录值可以是多行的,比如上例显示了主板的制造商(manufacturer)、model、version以及serial Number。
swapon -s
#系统交互分区的使用情况,即查看系统虚拟内存使用情况。
mii-tool
#查看网卡情况。
ip addr
#查看网络地址。
ip route
#查看路由。
ifconfig -a
#查看所有网络硬件配置情况。
netstat -an
#显示网络连接、路由表和网络接口信息,可以让用户得知目前都有哪些网络连接正在运作。
netstat -rn
#查看路由方面信息,其中重点关注flags项,U 该路由可用、G 这个路由器是一个网关、H 该路由是一个主机,如果没该标志,则可能是表示一个网络段、D 该路由是由重定向报文建立的、H 该路由被重定向报文修改。
ps -ef
#查看所有正在进行中的服务器进程。
ps -ef |wc -l
#查看服务器进程总数量
vmstat 1 5
#报告关于内核线程、虚拟内存、磁盘、陷阱和CPU 活动的统计信息。
由vmstat 命令生成的报告可以用于平衡系统负载活动。
系统范围内的这些统计信息(所有的处理器中)都计算出以百分比表示的平均值,或者计算其总和。
前面的数字表示时间间隔,后面则为显示次数。
cat /etc/rc.d/rc.local
#查看系统开机启动项目配置文件。
重要!
cat /etc/crontab
#查看系统的任务项文件,此文件可以设定某些进程在特定时间进行(例如:关机,运行脚本等)类似windows中的计划任务。
last
#最后登录的用户
more /var/log/secure
#查看系统log日志中的ssh错误登录信息。
如果其中显示过多信息,则应注意是否有非法用户正在试图强行进入服务器的危险。
more /var/log/messages
#同上有相同意思。
可以限制ssh的登录ip地址
vi /etc/hosts.deny
sshd:all
vi /etc/hosts.allow
sshd:192.168.10.
sshd:你允许的IP段或者IP
more /var/log/messages |grep fail
more /var/log/messages |grep error
more /var/log/messages |grep Error
more /var/log/messages |grep warn
#查看服务器错误信息。
apache:
ps aux |grep httpd
#查看apache的相关进程。
more /var/apachelog/acclogs/w01wwwlog20100429
# 查看apache当天日志,此路径只针对国网。
tail -100 /var/apachelog/acclogs/w01wwwlog20100429 |grep fail tail -100 /var/apachelog/acclogs/w01wwwlog20100429 |grep error tail -100 /var/apachelog/acclogs/w01wwwlog20100429 |grep Error tail -100 /var/apachelog/acclogs/w01wwwlog20100429 |grep warn #查看apache日志中的相关错误信息。
syncserver:(iguard服务)
ps -ef |grep syncserver
#查看iguard相关进程
more /usr1/local/iguard/syncserver/logs/error.log
#查看iguard错误日志信息。