• Post author:
  • Post category:prometheus
  • Post comments:0评论

一、介绍

Prometheus 是一个开源的监控软件。非常适合用来监控docker容器,k8s标配。
优点特性看官方文档吧:https://prometheus.io/docs

二、安装部署

1、二进制包部署

下载地址:https://prometheus.io/download/

[root@cp-3 ~]# wget https://github.com/prometheus/prometheus/releases/download/v2.28.1/prometheus-2.28.1.linux-amd64.tar.gz

[root@cp-3 ~]# tar -xf prometheus-2.28.1.linux-amd64.tar.gz -C /usr/local/
[root@cp-3 ~]# mv /usr/local/prometheus-2.28.1.linux-amd64 /usr/local/prometheus
[root@cp-3 ~]# ln -s /usr/local/prometheus/prometheus /usr/local/bin/prometheus
[root@cp-3 ~]# ln -s /usr/local/prometheus/promtool /usr/local/bin/promtool
[root@cp-3 ~]# prometheus --version
prometheus, version 2.28.1 (branch: HEAD, revision: b0944590a1c9a6b35dc5a696869f75f422b107a1)
  build user:       root@2915dd495090
  build date:       20210701-15:20:10
  go version:       go1.16.5
  platform:         linux/amd64

使用 systemd 管理:

[root@cp-3 ~]# vim /usr/lib/systemd/system/prometheus.service 
[Unit]
Description=prometheus
After=network.target
After=syslog.target

[Service]
ExecStart=/usr/local/prometheus/prometheus --config.file=/usr/local/prometheus/prometheus.yml

[Install]
WantedBy=multi-user.target

[root@cp-3 ~]# systemctl daemon-reload 
[root@cp-3 ~]# systemctl start prometheus
[root@cp-3 ~]# netstat -ntlp | grep 9090
tcp6       0      0 :::9090                 :::*                    LISTEN      6782/prometheus

此时可以通过 ip:9090 去访问 web 界面。

2、docker

docker run -d -p 9090:9090 --restart=always --name prometheus prom/prometheus

三、配置文件

默认配置文件:

[root@cp-3 ~]# cat /usr/local/prometheus/prometheus.yml
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

默认配置文件中定义了四个部分,分别是 global、alerting、rule_files 和 scrape_configs。
以下只是简单描述下,详情请查阅官方文档:https://prometheus.io/docs/prometheus/latest/configuration/configuration/

1、global

全局配置:

scrape_interval:抓取数据的时间间隔。
evaluation_interval: 评估规则的的频率,主要有两种记录规则和报警规则
  • 记录规则:允许预先计算使用频繁且开销大的表达式,并将结果保存为一个新的时间序列数据。
  • 报警规则:允许定义报警条件。

2、alerting

报警配置。preometheus 报警由 Alertmanager 的独立工具进行管理的,它是一个可以集群化的独立报警管理工具。

alertmanagers:这个块表示 Prometheus 服务器使用的 Alertmanager
static_configs:这个块表示手动指定在 targets 数组中配置的 Alertmanager 地址

3、rule_files

规则文件配置。用来指定包含记录规则或者警报规则的文件列表。

4、scrape_configs

  抓取配置。用来指定 Prometheus 抓取数据的目标。
  Prometheus 将它抓取的指标数据源称为端点。为了抓取这些端点的数据,Prometheus 定义了一个目标,这个目标里包含的信息是抓取数据所必需的。比如用到的标签、建立连接的所需的的身份验证或者其它定义数据抓取的信息。若干目标构成的组称为作业,作业里每个目标都有一个名为实例(instance)的标签(默认),用来唯一标识这个目标。

job_name:作业名称
static_configs:这个块表示手动指定在 targets 数组中配置的目标地址和 labels 标签。

参考:

《Prometheus监控实战》
https://prometheus.io/docs

发表评论

验证码: 23 + = 30