ConsulManager/README.md

245 lines
8.1 KiB
Markdown
Raw Normal View History

2022-01-28 04:10:09 +00:00
# 如何优雅的使用Consul管理站点监控
2022-01-28 07:29:50 +00:00
### 关注公众号【**云原生DevOps**】加入运维群交流,获取更多...
![](https://github.com/starsliao/Prometheus/blob/master/qr.jpg)
2022-01-28 04:10:09 +00:00
## 实现功能
- 基于Prometheus + Blackbox_Exporter实现站点与接口监控。
- 基于Consul实现Prometheus监控目标的自动发现。
2022-01-28 08:24:42 +00:00
- Blackbox Manager基于Flask + Vue实现的Web管理平台可以简单的对监控目标增删改查便于分类维护管理。
2022-01-28 04:10:09 +00:00
- 实现了一个脚本可批量导入监控目标到Consul。
- 更新了一个Blackbox Exporter的Grafana展示看板。
2022-01-28 19:26:36 +00:00
## v0.2.0更新
- 后端使用Flask Blueprint重构前端规范URI路径匹配后端。
2022-01-28 06:10:29 +00:00
## v0.1.2更新
- 所有字段增加了排序功能
- 新增筛选功能:可以根据名称或实例来进行关键字筛选
- 新增清空查询条件按钮
- 简化了web界面新增操作
- 选择选项查询后,点击新增或自动填写好选择的选项
- 增加确认并新增按钮可以自动填上之前填写的前4个字段
- 新增批量删除功能
- 新增分页功能
2022-01-28 07:07:17 +00:00
```
2022-01-28 08:46:23 +00:00
更新docker-compose pull && docker-compose up -d
2022-01-28 07:07:17 +00:00
```
2022-01-28 04:10:09 +00:00
## 截图
### Blackbox Manager Web管理界面
2022-01-28 05:29:34 +00:00
![0](https://raw.githubusercontent.com/starsliao/ConsulManager/main/screenshot/0.png)
2022-01-28 04:10:09 +00:00
### Blackbox Exporter Dashboard 截图
2022-01-28 05:29:34 +00:00
![1](https://raw.githubusercontent.com/starsliao/ConsulManager/main/screenshot/1.png)![2](https://raw.githubusercontent.com/starsliao/ConsulManager/main/screenshot/2.png)
2022-01-28 04:10:09 +00:00
2022-01-28 07:07:17 +00:00
## 部署说明
2022-01-28 04:10:09 +00:00
### 部署Consul
##### 安装
```bash
# 使用yum部署consul
yum install -y yum-utils
yum-config-manager --add-repo https://rpm.releases.hashicorp.com/RHEL/hashicorp.repo
yum -y install consul
# 或者直接下RPM包安装
wget https://rpm.releases.hashicorp.com/RHEL/7/x86_64/stable/consul-1.11.1-1.x86_64.rpm
rpm -ivh ./consul-1.11.1-1.x86_64.rpm
```
##### 配置
```bash
vi /etc/consul.d/consul.hcl
data_dir = "/opt/consul"
client_addr = "0.0.0.0"
ui_config{
enabled = true
}
server = true
bootstrap = true
acl = {
enabled = true
default_policy = "deny"
enable_token_persistence = true
}
```
2022-01-28 07:07:17 +00:00
##### 启动与鉴权配置
2022-01-28 04:10:09 +00:00
```bash
systemctl enable consul.service
systemctl start consul.service
# 获取登录密码
consul acl bootstrap
# 记录 SecretID
```
2022-01-28 07:29:50 +00:00
---
2022-01-28 04:10:09 +00:00
### 部署Blackbox Manager
2022-01-28 07:07:17 +00:00
##### 使用docker-compose来部署
2022-01-28 07:13:54 +00:00
编辑docker-compose.yaml文件修改传入的3个环境变量
- **consul的`token`consul的`URL`(/v1要保留)登录Blackbox Manager的`密码`**
2022-01-28 07:07:17 +00:00
- 启动:`docker-compose up -d`
2022-01-28 08:24:42 +00:00
- 访问:`http://{IP}:1026`
2022-01-28 07:07:17 +00:00
2022-01-28 04:10:09 +00:00
##### Consul字段设计说明
2022-01-28 08:24:42 +00:00
- 所有数据存在一个名为`blackbox_exporter`的Services项中每个监控目标为一个子Service。
- 每个Service包含一个Tag会自动配置为meta中的`module`的值作为Prometheus自动发现的tags。
2022-01-28 08:57:13 +00:00
- 每个Service使用Meta的kv保存监控目标的明细`module``company``project``env``name``instance`分别表示监控类型公司部门项目环境名称实例url
2022-01-28 07:13:54 +00:00
- **前5个字段合并即为consul的serviceID作为唯一监控项标识**
2022-01-28 08:57:13 +00:00
- **建议监控类型字段:`meta内的module``blackbox-exporter配置中的module`及`Prometheus的job名`使用同一命名。**
2022-01-28 08:24:42 +00:00
---
2022-01-28 04:10:09 +00:00
### 配置Prometheus
##### 基于Consul实现Prometheus的自动发现功能配置
- 根据Consul每个service的tag来把监控目标关联到Prometheus的JOB。
- 把Consul每个service的Meta的KV关联到Prometheus每个指标的标签。
2022-01-28 08:24:42 +00:00
- 根据每个指标的标签来对监控目标分类,分组,方便管理维护。
2022-01-28 04:10:09 +00:00
2022-01-28 08:24:42 +00:00
**以下配置的同一个job的`job_name``module``tags`使用同一命名关联jobmodule与consul的tags**
2022-01-28 08:48:55 +00:00
参考配置2XX4XXTCP类型的监控注意JOB名称不要与已有的重复。
2022-01-28 04:10:09 +00:00
```yaml
vi prometheus.yml
#####blackbox_exporter#####
- job_name: 'http_2xx'
metrics_path: /probe
params:
module: [http_2xx]
consul_sd_configs:
- server: 'x.x.x.x:8500'
token: 'xxx-xxx-xxx-xxx'
services: ['blackbox_exporter']
tags: ['http_2xx']
relabel_configs:
- source_labels: ["__meta_consul_service_metadata_instance"]
target_label: __param_target
- source_labels: ["__meta_consul_service_metadata_company"]
target_label: company
- source_labels: ["__meta_consul_service_metadata_env"]
target_label: env
- source_labels: ["__meta_consul_service_metadata_name"]
target_label: name
- source_labels: ["__meta_consul_service_metadata_project"]
target_label: project
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: 127.0.0.1:9115
2022-01-28 08:46:23 +00:00
- job_name: 'http_4xx'
2022-01-28 04:10:09 +00:00
metrics_path: /probe
params:
2022-01-28 08:46:23 +00:00
module: [http_4xx]
2022-01-28 04:10:09 +00:00
consul_sd_configs:
- server: 'x.x.x.x:8500'
token: 'xxx-xxx-xxx-xxx'
services: ['blackbox_exporter']
2022-01-28 08:46:23 +00:00
tags: ['http_4xx']
2022-01-28 04:10:09 +00:00
relabel_configs:
- source_labels: ["__meta_consul_service_metadata_instance"]
target_label: __param_target
- source_labels: ["__meta_consul_service_metadata_company"]
target_label: company
- source_labels: ["__meta_consul_service_metadata_env"]
target_label: env
- source_labels: ["__meta_consul_service_metadata_name"]
target_label: name
- source_labels: ["__meta_consul_service_metadata_project"]
target_label: project
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: 127.0.0.1:9115
2022-01-28 08:46:23 +00:00
- job_name: 'tcp_connect'
2022-01-28 04:10:09 +00:00
metrics_path: /probe
params:
2022-01-28 08:46:23 +00:00
module: [tcp_connect]
2022-01-28 04:10:09 +00:00
consul_sd_configs:
- server: 'x.x.x.x:8500'
token: 'xxx-xxx-xxx-xxx'
services: ['blackbox_exporter']
2022-01-28 08:46:23 +00:00
tags: ['tcp_connect']
2022-01-28 04:10:09 +00:00
relabel_configs:
- source_labels: ["__meta_consul_service_metadata_instance"]
target_label: __param_target
- source_labels: ["__meta_consul_service_metadata_company"]
target_label: company
- source_labels: ["__meta_consul_service_metadata_env"]
target_label: env
- source_labels: ["__meta_consul_service_metadata_name"]
target_label: name
- source_labels: ["__meta_consul_service_metadata_project"]
target_label: project
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: 127.0.0.1:9115
```
### 配置Blackbox_Exporter
2022-01-28 08:48:55 +00:00
参考配置2XX4XXTCP类型的监控注意模块名称不要与已有的重复。
2022-01-28 04:10:09 +00:00
```
cat blackbox.yml
modules:
http_2xx:
prober: http
http:
valid_status_codes:
- 200
- 301
- 302
- 303
no_follow_redirects: true
2022-01-28 08:42:23 +00:00
preferred_ip_protocol: ip4
ip_protocol_fallback: false
2022-01-28 04:10:09 +00:00
2022-01-28 08:42:23 +00:00
http_4xx:
2022-01-28 04:10:09 +00:00
prober: http
http:
valid_status_codes:
- 401
- 403
- 404
2022-01-28 08:42:23 +00:00
preferred_ip_protocol: ip4
ip_protocol_fallback: false
tcp_connect:
prober: tcp
2022-01-28 04:10:09 +00:00
```
### 批量导入脚本
2022-01-28 07:17:57 +00:00
在units目录下`instance.list`中写入监控目标的信息JOB名称公司/部门项目环境名称实例url每行一个空格分隔。
**注意前5个字段组合起来必须唯一作为一个监控项的ID。**
修改units目录下导入脚本中的consul_token和consul_url保存后执行input.py即可导入所有监控目标到Consul并符合Prometheus的自动发现配置。
2022-01-28 04:10:09 +00:00
### 导入Blackbox Exporter Dashboard
- 支持Grafana 8基于blackbox_exporter 0.19.0设计
- 采用图表+曲线图方式展示TCPICMPHTTPS的服务状态各阶段请求延时HTTPS证书信息等
- 优化展示效果,支持监控目标的分组、分类级联展示,多服务同时对比展示。
```
导入ID9965
详细URLhttps://grafana.com/grafana/dashboards/9965
```
### GitHub
所有代码都在里面,抛砖引玉。
```
2022-01-28 08:42:23 +00:00
https://github.com/starsliao/ConsulManager
2022-01-28 04:10:09 +00:00
```