Prometheus Service Discovery を構成しました。
プロメテウス.yml:
- job_name: 'GP'
ec2_sd_configs:
- region: us-west-1
access_key: ...
secret_key: ...
port: 9100
relabel_configs:
- source_labels: [__meta_ec2_tag_Name]
regex: GP-.*
action: keep
# Use the instance ID as the instance label
- source_labels: [__meta_ec2_instance_id]
target_label: instance
そして、2 つのインスタンスが自動的に検出されます。
メトリクスも両方のインスタンスから返されます。
# HELP go_gc_duration_seconds A summary of the pause duration of garbage collection cycles.
# TYPE go_gc_duration_seconds summary
go_gc_duration_seconds{quantile="0"} 7.296e-06
go_gc_duration_seconds{quantile="0.25"} 2.2649e-05
go_gc_duration_seconds{quantile="0.5"} 3.5584e-05
go_gc_duration_seconds{quantile="0.75"} 6.745e-05
go_gc_duration_seconds{quantile="1"} 0.010453099
go_gc_duration_seconds_sum 0.280941774
go_gc_duration_seconds_count 1405
...
次に、Prometheus をデータ ソースとして追加し、1860 ダッシュボードをインポートしましたが、GP がジョブとしてリストされている間はデータが表示されません。
また、テスト目的で Prometheus Job をハードコーディングしました。
- job_name: 'nodeexporter'
scrape_interval: 5s
static_configs:
- targets: ['xx.xx.xx.xx:9100']
そして、これで動作します:
私は何を間違っていますか?
GP
さらに、 Host の値は、との両方で常に同じですnodeexporter
。また、他の 3 つの Prometheus ジョブ (cadvisor、prometheus、pushgateway) はドロップダウンで公開されていないため、これも混乱を招きます。