几个常用的Linux监控脚本

供稿：hz-xin.com 日期：2025-01-16

linux下几个简易的系统监控脚本

1. sar
每两秒刷新一次，总共5次
[root@dbhost01 ~]# sar 2 5
Linux 2.6.32-504.el6.x86_64 (dbhost01) 03/30/2018 _x86_64_ (4 CPU)
02:53:15 PM CPU %user %nice %system %iowait %steal %idle
02:53:17 PM all 0.66 0.00 1.72 0.66 0.00 96.96
02:53:19 PM all 1.34 0.00 3.35 0.80 0.00 94.51
02:53:21 PM all 0.79 0.00 1.59 1.45 0.00 96.17
02:53:23 PM all 0.40 0.00 2.00 0.80 0.00 96.80
02:53:25 PM all 0.66 0.00 1.85 0.79 0.00 96.70
Average: all 0.77 0.00 2.10 0.90 0.00 96.23
2. top
top -a 按照内存降序
[root@dbhost01 ~]# top -a
top - 15:00:54 up 6:04, 1 user, load average: 0.31, 0.19, 0.11
Tasks: 306 total, 1 running, 305 sleeping, 0 stopped, 0 zombie
Cpu(s): 7.8%us, 2.4%sy, 0.0%ni, 88.9%id, 0.8%wa, 0.0%hi, 0.1%si, 0.0%st
Mem: 4048972k total, 3848576k used, 200396k free, 134844k buffers
Swap: 4194300k total, 1788k used, 4192512k free, 1835360k cached
3. vmstat
vmstat用于显示虚拟内存，内核线程，磁盘，系统进程， CPU活动等统计信息。
需要安装sysstat工具。
[root@dbhost01 ~]# vmstat
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 1788 202508 135064 1835920 0 0 32 26 96 276 1 2 95 1 0
[root@dbhost01 ~]#
[root@dbhost01 ~]# vmstat 2 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 1788 202336 135068 1836000 0 0 32 26 97 276 1 2 95 1 0
0 0 1788 202624 135068 1836000 0 0 25 29 4012 6682 0 1 98 1 0
0 0 1788 202624 135072 1836004 0 0 57 87 4003 6685 0 1 98 1 0
1 0 1788 202508 135072 1836004 0 0 57 33 4402 7353 1 1 98 0 0
0 0 1788 202540 135076 1836004 0 0 33 47 4002 6674 0 1 98 1 0

4. lsof(list open files)
[root@dbhost01 ~]# lsof | grep 1521
certmonge 2348 root 16r FIFO 0,8 0t0 15212 pipe
certmonge 2348 root 18r FIFO 0,8 0t0 15218 pipe
gipcd.bin 2754 grid 109u unix 0xffff880139152180 0t0 36936 socket
5. tcpdump
tcpdump -i eth1
15:24:28.777779 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 393080:393596, ack 105, win 148, options [nop,nop,TS val 22996360 ecr 2443327], length 516
15:24:28.777809 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 393080:393596, ack 105, win 148, options [nop,nop,TS val 22996360 ecr 2443327], length 516
15:24:28.778976 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 393596:393968, ack 105, win 148, options [nop,nop,TS val 22996361 ecr 2443327], length 372
15:24:28.779011 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 393596:393968, ack 105, win 148, options [nop,nop,TS val 22996361 ecr 2443327], length 372
15:24:28.779013 IP 192.168.2.82.50990 > dbhost01.ssh: Flags [.], ack 393968, win 16652, options [nop,nop,TS val 2443327 ecr 22996360], length 0
15:24:28.779481 IP dbhost02-priv.23602 > dbhost01-priv.24271: UDP, length 556
15:24:28.779585 IP dbhost01-priv.24271 > dbhost02-priv.23602: UDP, length 80
15:24:28.779909 IP dbhost01-priv.24271 > dbhost02-priv.23602: UDP, length 80
15:24:28.780584 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 393968:394724, ack 105, win 148, options [nop,nop,TS val 22996362 ecr 2443327], length 756
15:24:28.780590 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 393968:394724, ack 105, win 148, options [nop,nop,TS val 22996362 ecr 2443327], length 756
15:24:28.780820 IP dbhost01-priv.24271 > dbhost02-priv.23602: UDP, length 556
15:24:28.782232 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 394724:395176, ack 105, win 148, options [nop,nop,TS val 22996364 ecr 2443327], length 452
15:24:28.782235 IP dbhost01.ssh > 192.168.2.82.50990: Flags [P.], seq 394724:395176, ack 105, win 148, options [nop,nop,TS val 22996364 ecr 2443327], length 452
6.netstat
[root@dbhost01 ~]# netstat -a | grep oracle
unix 2 [ ACC ] STREAM LISTENING 31861 /var/tmp/.oracle/ora_gipc_sdbhost01gridmyracdb-clusterCRFM_SIPC
unix 2 [ ACC ] STREAM LISTENING 33820 /var/tmp/.oracle/sdbhost01DBG_LOGD
unix 2 [ ACC ] STREAM LISTENING 41177 /var/tmp/.oracle/sdbhost01DBG_EVMD
unix 2 [ ACC ] STREAM LISTENING 65106 /var/tmp/.oracle/sAevm
unix 2 [ ACC ] STREAM LISTENING 65108 /var/tmp/.oracle/sSYSTEM.evm.acceptor.auth
7. htop
需要安装

8. iostat
Total DISK READ: 91.48 K/s | Total DISK WRITE: 45.27 K/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND
4071 be/4 oracle 30.18 K/s 0.00 B/s 0.00 % 4.69 % ora_lmon_orcl1
4117 be/4 oracle 60.36 K/s 15.09 K/s 0.00 % 3.69 % ora_ckpt_orcl1
2989 rt/4 grid 965.71 B/s 0.00 B/s 0.00 % 2.13 % ocssd.bin
4099 be/4 oracle 0.00 B/s 30.18 K/s 0.00 % 0.07 % ora_ckpt_test
2987 rt/4 grid 0.00 B/s 482.86 B/s 0.00 % 0.03 % ocssd.bin
2979 rt/3 root 0.00 B/s 3.77 K/s 0.00 % 0.00 % ologgerd -M -d /g01/grid/app/11.2.0/grid/crf/db/dbhost01
2980 rt/3 root 0.00 B/s 15.09 K/s 0.00 % 0.00 % ologgerd -M -d /g01/grid/app/11.2.0/grid/crf/db/dbhost01
9. iftop(流量监控工具)

几个常用的Linux监控脚本
下面是几个主机监控的脚本，大家可以根据自己的情况再进行修改，希望能给大家一点帮助。
1、查看主机网卡流量
#!/bin/bash
#network
#Mike.Xu
while : ; do
time='date +%m"-"%d" "%k":"%M'
day='date +%m"-"%d'
rx_before='ifconfig eth0|sed -n "8"p|awk '{print $2}'|cut -c7-'
tx_before='ifconfig eth0|sed -n "8"p|awk '{print $6}'|cut -c7-'
sleep 2
rx_after='ifconfig eth0|sed -n "8"p|awk '{print $2}'|cut -c7-'
tx_after='ifconfig eth0|sed -n "8"p|awk '{print $6}'|cut -c7-'
rx_result=$[(rx_after-rx_before)/256]
tx_result=$[(tx_after-tx_before)/256]
echo "$time Now_In_Speed: "$rx_result"kbps Now_OUt_Speed: "$tx_result"kbps"
sleep 2
done

2、系统状况监控
#!/bin/sh
#systemstat.sh
#Mike.Xu
IP=192.168.1.227
top -n 2| grep "Cpu" >>./temp/cpu.txt
free -m | grep "Mem" >> ./temp/mem.txt
df -k | grep "sda1" >> ./temp/drive_sda1.txt
#df -k | grep sda2 >> ./temp/drive_sda2.txt
df -k | grep "/mnt/storage_0" >> ./temp/mnt_storage_0.txt
df -k | grep "/mnt/storage_pic" >> ./temp/mnt_storage_pic.txt
time=`date +%m"."%d" "%k":"%M`
connect=`netstat -na | grep "219.238.148.30:80" | wc -l`
echo "$time $connect" >> ./temp/connect_count.txt

3、监控主机的磁盘空间,当使用空间超过90％就通过发mail来发警告
#!/bin/bash
#monitor available disk space
SPACE='df | sed -n '/ \ / $ / p' | gawk '{print $5}' | sed 's/%//'
if [ $SPACE -ge 90 ]
then
fty89@163.com
fi

4、监控CPU和内存的使用情况
#!/bin/bash
#script to capture system statistics
OUTFILE=/home/xu/capstats.csv
DATE='date +%m/%d/%Y'
TIME='date +%k:%m:%s'
TIMEOUT='uptime'
VMOUT='vmstat 1 2'
USERS='echo $TIMEOUT | gawk '{print $4}' '
LOAD='echo $TIMEOUT | gawk '{print $9}' | sed "s/,//' '
FREE='echo $VMOUT | sed -n '/[0-9]/p' | sed -n '2p' | gawk '{print $4} ' '
IDLE='echo $VMOUT | sed -n '/[0-9]/p' | sed -n '2p' |gawk '{print $15}' '
echo "$DATE,$TIME,$USERS,$LOAD,$FREE,$IDLE" >> $OUTFILE

5、全方位监控主机
#!/bin/bash
# check_xu.sh
# 0 * * * * /home/check_xu.sh

DAT="`date +%Y%m%d`"
HOUR="`date +%H`"
DIR="/home/oslog/host_${DAT}/${HOUR}"
DELAY=60
COUNT=60
# whether the responsible directory exist
if ! test -d ${DIR}
then
/bin/mkdir -p ${DIR}
fi
# general check
export TERM=linux
/usr/bin/top -b -d ${DELAY} -n ${COUNT} > ${DIR}/top_${DAT}.log 2>&1 &
# cpu check
/usr/bin/sar -u ${DELAY} ${COUNT} > ${DIR}/cpu_${DAT}.log 2>&1 &
#/usr/bin/mpstat -P 0 ${DELAY} ${COUNT} > ${DIR}/cpu_0_${DAT}.log 2>&1 &
#/usr/bin/mpstat -P 1 ${DELAY} ${COUNT} > ${DIR}/cpu_1_${DAT}.log 2>&1 &
# memory check
/usr/bin/vmstat ${DELAY} ${COUNT} > ${DIR}/vmstat_${DAT}.log 2>&1 &
# I/O check
/usr/bin/iostat ${DELAY} ${COUNT} > ${DIR}/iostat_${DAT}.log 2>&1 &
# network check
/usr/bin/sar -n DEV ${DELAY} ${COUNT} > ${DIR}/net_${DAT}.log 2>&1 &
#/usr/bin/sar -n EDEV ${DELAY} ${COUNT} > ${DIR}/net_edev_${DAT}.log 2>&1 &

放在crontab里每小时自动执行：

是需要inotify? 还是incrontab

基础监控做的最好的，最轻量的工具，搜WGCLOUD，开源项目

linux shell脚本监控zookeeper,如果挂了自动重启
具体示例脚本如下：首先，通过ps命令查询是否有一个org.apache.zookeeper.server.quorum.QuorumPeerMain进程正在运行。若该进程不存在，表示Zookeeper服务已停止。此时，使用systemctl命令重启Zookeeper服务，确保其恢复正常运行状态。定期执行此脚本，通过crontab定时任务，实现自动监控与重启，保障Zookeeper服务的稳定...

关于linux服务器进程监控及自动重启的方法介绍
实现原理主要是使用linux提供的crontab机制，定时查询服务器进程是否存在，如果宕机则处理我们预设的脚本。首先我们要向crontab加入一个新任务。crontab -e：进入编辑状态，其实就是使用vi编辑。\/1 * * * * sh \/root\/monitor.sh 我这里只是简单的设置每分钟调用一个shell脚本monitor.sh。这里可以配置的更...

求一个linux将监控网卡出入流量的shell脚本,每隔设定的时间输出到文本或...
2. 安装net-snmp yum install net-snmp 3.验证你服务器snmp是否正确安装：snmpwalk -v 2c -c <你自己设置的community> 127.0.0.1 有返回信息就是正确。4. 写你shell程序，通过snmpwalk可查看各网卡端口流量，可根据下面我提供的信息你自己选择你要监控的端口。[root@AAA snmp]# snmpwalk -v ...

Linux系统中Sysstat性能监控工具包中20个实用命令
0表示第一个cpu。复制代码代码如下:tecmint@tecmint ~ $ mpstat -P ALLLinux 3.11.0-23-generic (tecmint.com) Thursday 04 September 2014 _i686_ (2 CPU)12:29:26 IST CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle12:29:26 IST all 37.33 0.01 4.57 2...

【Linux入门】10个超好用的免费服务器和网络监控工具!
Nagios 是一个监视系统运行状态和网络信息的监视系统，提供异常通知功能，运行在Linux\/Unix平台，支持基于浏览器的Web界面，方便管理人员查看网络状态、系统问题和日志。Collectd 是一个守护进程，用于收集系统性能数据，并提供多种存储方式，如RRD文件形式，便于数据管理和分析。Fiddler 是一款强大的Web调试工具...

Linux While循环常用脚本案例及使用事项
在Linux中，while循环是一种常见的循环结构，通过测试条件的真假来重复执行代码块，实现自动化任务。以下是一些Linux while循环常用脚本案例及使用事项，帮助您更好地理解和应用while循环。案例一：持续监控应用状态通过while循环持续检查应用状态，直到应用运行正常或达到预期条件。例如，持续监控一个服务是否在...

在linux下怎么使用shell脚本修改文本里的相关内容?
在Linux系统中，shell脚本实现对服务器和进程资源的有效监控是运维过程中不可或缺的工具。本文将详细介绍在Linux下实现常见监控需求及其对应的shell脚本编写方法，帮助系统管理员及时发现和处理异常情况。目录：检查进程是否存在检测进程CPU利用率检测进程内存使用量检测进程句柄使用量查看TCP或UDP端口是否在监听...

linux下如何监听进程
参考：用monit监控系统关键进程 supervisord Supervisor是一个C\/S系统,它可以在类unix操作系统让用户来监视和控制后台服务进程的数量。它是由python编写的，常用于进程异常退出的重启保护。安装：pip install supervisor 查看配置文件：echo_supervisord_conf 从该命令的结果中，可以看到各个模块的配置信息。创建...

如何做一个linux查看cpu使用率的脚本
Linux性能监控工具 - Nmon安装及简介 tar.gz安装包安装方式：1）用root用户登录到系统中；2）建目录：#mkdir \/nmon，作为Nmon的安装目录；3）把nmon_linux_14g.tar.gz用ftp上传到\/nmon，或者通过其他介质拷贝到\/nmon目录中；4）进入.\/nmon目录下，cd .\/nmon；5）解压缩上传的压缩包，tar -xf ...

,谁帮我写个简单的SHELL脚本啊,LINUX里面的,大一刚接触,明天检查,也...
随便写了一个监控根磁盘空间的脚本。code=`df -k \/ | grep -v Available | awk '{print $5}' | awk -F% '{print $1}'`if [ $code -le 90 ]then echo "正常"else echo "不正常"fi exit 0