news 2026/2/3 9:16:01

Amazon CloudWatch 的系统化汇总版

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Amazon CloudWatch 的系统化汇总版

一、CloudWatch 是什么(一句话版)

Amazon CloudWatch 是 AWS 的集中式监控服务,用来收集、存储、可视化和告警 AWS 资源的指标和日志。

核心关键词:
集中式(centralized) / 托管(managed) / 无需运维

二、CloudWatch 如何工作(整体逻辑)

AWS 中的各种资源(EC2、ELB、Lambda、RDS 等)
➡️ 自动或主动发送数据到 CloudWatch
➡️ CloudWatch 统一存储、分析、展示、告警

你只需要:

  • 一个 AWS 账号

  • 不需要部署任何监控服务器

三、CloudWatch Metrics(指标)

1️⃣ 基础监控(Basic Monitoring)

  • 默认开启

  • 免费

  • 5 分钟一个数据点

  • 多数 AWS 服务自动发送

📌 例子:

  • EC2:CPUUtilization

  • ELB:RequestCount

  • Lambda:Invocations

很多应用“只用基础监控就够了”

2️⃣ 详细监控(Detailed Monitoring)

  • 1 分钟粒度

  • 额外收费

  • 主要用于 EC2

📌 适合:

  • 对响应时间敏感

  • 自动扩缩容需要更快响应

3️⃣ Metric 的结构(考试重点)

每个 Metric 都有:

组成含义
Timestamp时间点
Namespace命名空间(分类)
Dimensions维度(身份标识)

Namespace

  • 不同服务在不同 Namespace

  • 彼此隔离

Dimensions

  • name / value 键值对

  • 用来区分资源

📌 例子:

Metric: CPUUtilization Namespace: AWS/EC2 Dimension: InstanceId=i-123456

四、自定义指标(Custom Metrics)

为什么需要?

CloudWatch 默认 看不到应用内部指标,比如:

  • 页面访问量

  • 错误率

  • 业务处理量

Custom Metrics 能做什么?

你可以自己上报:

  • Web 页面加载时间

  • 请求错误率

  • 进程 / 线程数

  • 应用完成的工作量

📌 方式:

  • 使用 PutMetricData API

  • 高分辨率自定义指标(High-Resolution)

  • 1 秒一个数据点

  • 更精细

  • 更贵

👉 用于:

  • 实时监控

  • 高频交易 / 实时系统

五、CloudWatch Dashboards(可视化)

Dashboard 是什么?

自定义监控首页

由多个 widget 组成:

  • 折线图

  • 数字

  • 文本

Dashboard 的能力

  • 一个 Dashboard 看多个 Metrics

  • 跨 多个 AWS Region

  • 支持:

    • 聚合统计

    • 实时数据(最近 1 分钟)

CloudWatch ≠ 只能自己用
你也可以用 GetMetricData API 拉到第三方系统

安全控制

  • 使用 IAM Policy

  • 控制:

    • 谁能看

    • 谁能改 Dashboard

六、CloudWatch Logs(日志)⭐⭐⭐

CloudWatch 不只是 Metrics

还能集中管理日志

来源包括:

  • EC2

  • Lambda

  • 其他 AWS 服务

Logs 能做什么?

  • 存储日志

  • 搜索 / 过滤

  • 查询错误堆栈

  • 把日志转成指标(Metric Filters)

不同服务的日志接入方式

  • Lambda

  • 几乎零配置

  • 只要 IAM 权限

  • EC2

需要安装 CloudWatch Logs Agent

Agent 包含:

  • CLI 插件

  • 启动脚本

  • cron 保活任务

七、CloudWatch Logs 术语(考试必背)⭐⭐⭐

1️⃣ Log Event

单条日志

包含:

  • 时间戳

  • 日志内容

2️⃣ Log Stream

  • 一组 Log Events

  • 来自 同一个资源

例如:一台 EC2 的日志

3️⃣ Log Group

  • 多个 Log Stream 的集合

共享:

  • 保留策略

  • 权限

📌 例子:

Log Group: /application/employee-directory ├─ EC2-1 Log Stream ├─ EC2-2 Log Stream

八、CloudWatch Alarms(告警)

Alarm 是什么?

当 Metric 在“持续一段时间内”超过阈值时触发动作

创建 Alarm 需要 3 个要素

  • Metric

  • Threshold(阈值)

  • Time Period(持续时间)

不是“瞬间超过”,而是 持续超标

状态含义
OK正常
ALARM超过阈值
INSUFFICIENT_DATA数据不足

Alarm 能触发什么?

  • EC2 行为(重启等)

  • Auto Scaling

  • SNS 通知(邮件 / 短信)

  • Lambda(自动修复)

九、Logs + Alarm:实战监控模式

示例:500 错误告警

日志里记录 HTTP 500

用 Metric Filter 转成指标

设置 Alarm:

  • 5 次 / 小时

触发:

  • SNS 通知

  • 或 Lambda 自动修复

从“被动发现问题” → “主动 + 自动响应”

十、CloudWatch 在架构中的定位(总结)

CloudWatch 是 AWS 的“监控中枢”,负责:

  • 看得见(Metrics)

  • 查得清(Logs)

  • 叫得响(Alarms)

  • 动得快(Automation)

一句话考试总结

  • Metrics:资源状态

  • Logs:行为记录

  • Dashboards:可视化

  • Alarms:自动响应

  • Custom Metrics:应用级监控

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/31 23:26:58

基于单片机水产育苗系统设计(有完整资料)

资料查找方式:特纳斯电子(电子校园网):搜索下面编号即可编号:T3042410M设计简介:本设计是基于STM32的基于单片机水产育苗系统设计,主要实现以下功能:通过温度传感器检测水中温度。通…

作者头像 李华
网站建设 2026/2/2 5:51:08

基于STM32的智能门锁系统的设计

第二章 整体方案设计 2.1 需求分析 搭建简单的智能门锁系统作品,需要相应的硬件与软件结合,本设计基于STM32的智能门锁系统主要实现的功能要求有: (1)显示屏显示操作界面; (2)使用者可以通过设置按键进入管理界面,可以…

作者头像 李华
网站建设 2026/1/31 10:12:59

基于单片机控制的音乐盒

第2章 系统硬件设计 2.1单片机内部结构 STC89C52 是一种耗能低、性能高CMOS8位微控制器,它基本都是51内核的种类,是新一代增强型单片机,具有8K在系统可编程Flash存储器,加密性好,抗干扰强。STC89C52具有的可编程的Flas…

作者头像 李华
网站建设 2026/1/28 18:11:53

学霸同款2026 8款一键生成论文工具测评:开题报告+文献综述全攻略

学霸同款2026 8款一键生成论文工具测评:开题报告文献综述全攻略 2026年学术写作工具测评:为何需要一份精准指南 随着AI技术在学术领域的广泛应用,越来越多的学生开始依赖智能写作工具提升论文效率。然而,面对市场上琳琅满目的选择…

作者头像 李华
网站建设 2026/2/1 6:25:50

用于材料测试的阻抗分析仪选购指南

在材料科学研究中,阻抗分析仪是评估材料介电性能、电导特性及界面行为的重要工具。不同材料对测试条件具有高度敏感性,因此科学选型至关重要。以下是针对材料测试场景选购阻抗分析仪的系统建议。一、明确测试频率范围,匹配材料响应特性 材料的…

作者头像 李华
网站建设 2026/2/2 4:43:37

Linux中Centos和Ubuntu的区别!

Linux是一种免费使用和自由传播的类UNIX操作系统,拥有众多发行版本,其中最受欢迎的就是Centos和Ubuntu,各自具有独特的特点和优势,那么Linux中Centos和Ubuntu的区别是什么?具体请看下文。CentOS和Ubuntu都是流行的Linux发行版&am…

作者头像 李华