news 2026/6/25 3:45:03

springboot服务监控脚本1.0

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
springboot服务监控脚本1.0

背景:

系统刚上线,需要监控各网格服务的运行状态,仅靠人工监控,费事费力,费成本。但还要满足系统需求,还需要满足领导的要求。于是乎,开干~

实现思路:

编写脚本,加入定时任务,配置服务异常邮件告警,最好结合SpringBoot 多应用管理脚本实现,这篇文章使用。当然也可自行改造。

监控内容:

1. 检查期望的服务列表是否运行。
2. 显示运行服务的详细状态(服务名、PID、运行状态、运行时长、CPU使用率、物理内存、线程数 )。
3. 对停止的服务进行告警。
4. 支持邮件和企业微信两种告警方式(脚本里配置)。

开干上脚本:

都是热乎的,刚用,小伙伴们估计看到了,有2.0版本,晚会上:

java_health_checker1.0.sh

#!/bin/bash # ============================================================================== # Java服务状态监控脚本 (健康检查与告警完整版) # 功能: # 1. 检查期望的服务列表是否运行。 # 2. 显示运行服务的详细状态。 # 3. 对停止的服务进行告警。 # 4. 支持邮件和企业微信两种告警方式。 # ============================================================================== # 颜色定义 RED='\033[0;31m' GREEN='\033[0;32m' YELLOW='\033[1;33m' BLUE='\033[0;34m' NC='\033[0m' # No Color # ============================================================================== # 配置区域:请在这里修改配置 # ============================================================================== # --- 期望监控的服务列表 --- # 格式: "服务名:端口号" EXPECTED_SERVICES=( "model:8286" "esb:8285" *****服务自定义(根据实际情况修改) ) # --- 邮件告警设置 (方案一) --- EMAIL_ENABLED=false # true:启用, false:禁用 EMAIL_TO="*****@dtestcom" # 接收告警的邮箱 EMAIL_SUBJECT="[******] Java服务健康检查报告" # 邮件主题 # --- 企业微信告警设置 (方案二) --- WECHAT_ENABLED=false # true:启用, false:禁用 # 请替换为您自己的企业微信机器人Webhook地址 WECHAT_WEBHOOK_URL="https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=YOUR_KEY_HERE" # ============================================================================== # 打印标题 echo -e "${BLUE}============================================${NC}" echo -e "${BLUE} ****** $(hostname) Java服务健康巡检报告${NC}" echo -e "${BLUE} $(date '+%Y-%m-%d %H:%M:%S')${NC}" echo -e "${BLUE} 当前IP:$(hostname -I | awk '{print $1}')${NC}" echo -e "${BLUE}============================================${NC}" # 创建一个关联数组,用于存储正在运行的服务信息 declare -A running_services # --- 1. 扫描并收集所有正在运行的Java服务信息 --- echo -e "${GREEN}🔍 正在扫描当前运行的Java服务...${NC}" echo "" # 使用pgrep获取所有Java进程的PID java_pids=$(pgrep -f java) if [ -n "$java_pids" ]; then for pid in $java_pids; do # 获取完整命令行 full_cmd=$(ps -p $pid -o cmd=) if [[ "$full_cmd" != *"java"* ]]; then continue fi # 提取服务名和端口 service_name=$(echo "$full_cmd" | grep -oP 'SW_AGENT_NAME=\K[^ ]+' | head -1) if [ -z "$service_name" ]; then service_name=$(echo "$full_cmd" | grep -oP '\-jar\s+\K[^\.]+' | head -1) fi #port=$(echo "$full_cmd" | grep -oP 'server\.port=\K\d+' | head -1) port=$(echo "$full_cmd" | grep -oP 'D?server\.port=\K\d+' | head -1) # 如果服务名和端口都有效,存入数组 if [ -n "$service_name" ] && [ -n "$port" ]; then running_services["${service_name}:${port}"]="$pid" fi done fi # --- 2. 检查期望的服务状态 --- echo -e "${BLUE}📋 开始检查期望的服务状态...${NC}" echo "" down_services_count=0 down_services_list="" # 遍历期望的服务列表 for expected_service in "${EXPECTED_SERVICES[@]}"; do if [[ -n "${running_services[$expected_service]}" ]]; then # 服务正在运行 pid=${running_services[$expected_service]} service_name=${expected_service%:*} # 获取运行时信息 etime=$(ps -p $pid -o etime= | tr -d ' ') cpu_usage=$(ps -p $pid -o %cpu= | tr -d ' ') mem_rss=$(ps -p $pid -o rss= | tr -d ' ') threads=$(ps -p $pid -o nlwp= | tr -d ' ') mem_rss_mb=$(echo "$mem_rss" | awk '{printf "%.0f", $1/1024}') echo -e "${GREEN}✅ ${service_name} (PID: ${pid}) - 运行正常${NC}" printf " %-10s: %s\n" "运行时长" "$etime" printf " %-10s: %s%%\n" "CPU使用率" "$cpu_usage" printf " %-10s: %s MB\n" "物理内存" "$mem_rss_mb" printf " %-10s: %s\n" "线程数" "$threads" echo "" else # 服务停止或异常 service_name=${expected_service%:*} echo -e "${RED}❌ ${service_name} - 服务停止或异常!${NC}" ((down_services_count++)) down_services_list="${down_services_list} ${service_name}" fi done # --- 3. 最终报告与告警发送 --- echo -e "${BLUE}============================================${NC}" if [ "$down_services_count" -eq 0 ]; then echo -e "${GREEN}🎉 所有期望的服务都在正常运行!${NC}" else echo -e "${RED}⚠️ 发现 ${down_services_count} 个服务存在问题,请立即检查!${NC}" # --- 发送邮件告警 --- if [ "$EMAIL_ENABLED" = true ]; then echo -e "${YELLOW}📧 正在发送告警邮件到 $EMAIL_TO ...${NC}" email_body=$(cat <<EOF 服务器 $(hostname) 上的Java服务健康检查发现异常! 时间: $(date '+%Y-%m-%d %H:%M:%S') 异常服务数量: $down_services_count 异常服务列表: $down_services_list 请登录服务器检查详细情况。\n EOF ) echo "$email_body" | mailx -s "$EMAIL_SUBJECT - [ALERT]" "$EMAIL_TO" if [ $? -eq 0 ]; then echo -e "${GREEN}✅ 告警邮件发送成功!${NC}" else echo -e "${RED}❌ 告警邮件发送失败!请检查邮件配置。${NC}" fi fi # --- 发送企业微信告警 --- if [ "$WECHAT_ENABLED" = true ]; then echo -e "${YELLOW}📱 正在发送企业微信告警...${NC}" # 构建JSON消息体 message=$(cat <<EOF { "msgtype": "markdown", "markdown": { "content": "<font color='warning'>【$(hostname)服务告警】</font>\n\n> 服务器: <code>prd1</code>\n> 时间: <code>$(date '+%Y-%m-%d %H:%M:%S')</code>\n> 异常服务数: <code>$down_services_count</code>\n> 异常列表: <code>${down_services_list//\\n/ }</code>\n\n请立即登录服务器检查!" } } EOF ) # 发送HTTP请求 curl -s -X POST "$WECHAT_WEBHOOK_URL" \ -H "Content-Type: application/json" \ -d "$message" > /dev/null 2>&1 if [ $? -eq 0 ]; then echo -e "${GREEN}✅ 企业微信告警发送成功!${NC}" else echo -e "${RED}❌ 企业微信告警发送失败!请检查Webhook URL和网络。${NC}" fi fi fi echo -e "${BLUE}============================================${NC}" # 如果有服务停止,脚本的退出码为1,便于告警系统识别 if [ "$down_services_count" -gt 0 ]; then exit 1 fi

效果展示:

其他功能:

1、可配置邮件通知。

2、使用crontab定时巡检。

因为时间有限,这些之前文章也提到过,可自行配置。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/25 3:25:38

Plotly Dash多页面仪表盘的构建框架

Plotly Dash — 一个适用于多页面仪表盘的结构化框架 多页面仪表盘的精确输出&#xff08;暗色模式&#xff09;显示了项目结构的特性 – 图片由作者提供 – 数据来自 GAPMINDER.ORG&#xff0c;CC-BY 许可证 Plotly Dash 是一个广受认可和使用的框架&#xff0c;可用于创建交…

作者头像 李华
网站建设 2026/6/25 19:48:23

数据可视化中色彩运用的核心指南

这是数据可视化系列的第三篇文章。参见第一部分&#xff1a;“数据可视化解读&#xff1a;它是什么以及为何重要”和第二部分&#xff1a;“数据可视化解读&#xff1a;视觉变量简介”。 在下图中&#xff0c;您看到了多少种颜色&#xff1f; 大多数人看到了四种&#xff1a;白…

作者头像 李华
网站建设 2026/6/25 12:51:49

通过“回馈行动“支持美国退伍军人掌握数据技术

通过"回馈行动"支持美国退伍军人英雄 "回馈行动"于2021年9月启动&#xff0c;旨在向所有美国退伍军人及现役军人提供某中心的技术培训机会&#xff0c;以帮助他们增长和拓展技术技能组合。此举是某中心对所有军事人员表示感谢的一种方式&#xff0c;为他们…

作者头像 李华
网站建设 2026/6/25 19:36:37

智能网页工作便签备忘录HTML源码

简介&#xff1a;智能网页工作便签备忘录HTML源码功能说明 便笺显示&#xff1a;默认设置便签按创建日期倒序显示&#xff08;最新的便签在最前面&#xff09; 主题选择&#xff1a;支持消息通知&#xff08;toast通知&#xff09; 红色主题 – 激情、活力&#xff0c;适合需要…

作者头像 李华
网站建设 2026/6/24 20:08:50

Deep Learning for Person Re-identification:A Survey and Outlook阅读笔记

Deep Learning for Person Re-identification:A Survey and Outlook 深度学习用于行人重识别&#xff1a;综述与展望 参考阅读&#xff1a;TPAMI2021深度学习行人重识别综述与展望 笔记 Re-ID技术的五大步骤 1&#xff09;数据采集&#xff0c;一般来源于监控摄像机的原始…

作者头像 李华
网站建设 2026/6/25 14:20:49

国内口碑好的牦牛绒混纺纱线供应商推荐,含 90%羊毛+10%

国内口碑好的 90%羊毛10%牦牛绒混纺纱线供应商探秘在纺织行业中&#xff0c;牦牛绒混纺纱线凭借其独特的性能和价值&#xff0c;正逐渐成为市场的新宠。尤其是 90%羊毛 10%牦牛绒的混纺纱线&#xff0c;既融合了羊毛的坚韧与牦牛绒的柔软保暖&#xff0c;又具备良好的性价比&a…

作者头像 李华