快速体验
- 打开 InsCode(快马)平台 https://www.inscode.net
- 输入框内输入如下内容:
创建一个简单的Prometheus监控系统,监控一台Linux服务器的CPU、内存和磁盘使用情况。包括Prometheus的安装、配置、数据采集和Grafana的基本使用。提供详细的步骤和截图,适合初学者学习。- 点击'项目生成'按钮,等待项目生成完整后预览效果
Prometheus作为云原生时代的监控利器,对于运维和开发人员来说都是必备技能。最近我在学习搭建监控系统时,发现从零开始配置Prometheus并没有想象中复杂。下面分享我的实践过程,特别适合刚接触监控系统的新手朋友。
环境准备阶段
首先需要准备一台Linux服务器作为监控目标,我用的是Ubuntu 20.04系统。建议选择干净的系统环境,避免端口冲突。
Prometheus本身是用Go编写的,不需要复杂的依赖环境。但要注意系统时间必须准确,因为所有监控数据都会打上时间戳。
防火墙需要开放9090端口(Prometheus默认端口)和9100端口(Node Exporter端口)。如果是云服务器,还要检查安全组设置。
安装Prometheus服务
从官网下载最新版的Prometheus压缩包,解压后就能直接运行。这种免安装的方式特别方便,不需要处理复杂的依赖关系。
解压后的目录结构很清晰:prometheus.yml是主配置文件,prometheus是服务启动文件。我更喜欢把程序放在/opt目录下管理。
通过systemd创建服务单元文件,这样就能用systemctl命令管理Prometheus服务了。记得设置开机自启,避免服务器重启后监控中断。
配置监控目标
Prometheus通过拉取(pull)方式获取数据,需要安装Node Exporter来采集系统指标。这个组件也是开箱即用,解压就能运行。
修改prometheus.yml配置文件,在scrape_configs部分添加job_name为node的监控任务。这里要注意缩进格式,YAML对格式要求很严格。
配置完成后重启Prometheus服务,通过status页面就能看到监控目标的状态。我第一次配置时因为缩进错误导致配置不生效,排查了好久。
数据可视化
Grafana是Prometheus的最佳搭档,安装过程同样简单。官方提供了APT源,一条命令就能完成安装。
在Grafana中添加Prometheus数据源时,URL要填写正确。我一开始填了localhost导致无法连接,后来改成服务器实际IP才成功。
导入官方提供的Node Exporter仪表板模板,立即就能看到漂亮的监控图表。CPU使用率、内存占用、磁盘IO等指标一目了然。
使用技巧
PromQL是Prometheus的查询语言,刚开始可以先用简单的指标名称查询,比如node_memory_MemFree_bytes。
对于关键业务指标,建议设置告警规则。我配置了当内存使用超过90%时发送邮件告警,避免服务宕机。
数据保留策略要根据磁盘空间合理设置,默认是15天。对于测试环境可以缩短保留时间,节省存储空间。
整个搭建过程最让我惊喜的是InsCode(快马)平台的一键部署功能。不需要手动配置环境,就能快速启动一个可运行的Prometheus实例,特别适合新手快速验证想法。平台内置的编辑器也很方便,可以直接修改配置文件,实时看到效果。对于想学习云原生监控的朋友,这种开箱即用的体验真的很省心。
快速体验
- 打开 InsCode(快马)平台 https://www.inscode.net
- 输入框内输入如下内容:
创建一个简单的Prometheus监控系统,监控一台Linux服务器的CPU、内存和磁盘使用情况。包括Prometheus的安装、配置、数据采集和Grafana的基本使用。提供详细的步骤和截图,适合初学者学习。- 点击'项目生成'按钮,等待项目生成完整后预览效果