問題タブ [exporter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
27 参照

docker - より深い swarm ノード関連のメトリクスを提供する

swarm クラスター内のマネージャー ノードをより正確に監視できるようにしたいと考えています。私は(例えば)そのような指標を期待しています:

...ノードのラベルも提供できる場合、これらはケーキのアイシングになります! ...

しかし、今のところ、node_exporter (または cAdvisor) でそのようなものを提供することができませんでした... 手がかりを逃した可能性がありますが、そのようなヒントを提供したようには聞こえません。

そのような指標をどのように提供できるかについて何か考えがありますか?

それらを最初からコーディングする (または機能要求を送信する) ことができると確信していますが、ホイールが既に存在する場合は再発明したくありません!

0 投票する
1 に答える
467 参照

prometheus - 1 つの Prometheus サーバーから複数の同一のエクスポーターにターゲットの単一リストをフェデレート/Hashmod する方法は?

データセンターで実行していて、サーバーのサイズによって制限されている状況に遭遇しました。1 つのサーバーで 1 つの Prometheus インスタンスとエクスポーターを実行しています。エクスポーターのターゲットの数は数千に上ります。これはサーバーの負荷が大きすぎるため、スケールアップできません。ただし、同じサイズのサーバーをさらに追加することはできます。

複数の同一の Prom インスタンスをフェデレートして、それぞれのエクスポーターで実行し (現在のセットアップのように)、Leader Prom インスタンスにフィードできると思います。ただし、ターゲットの長いリストをスクレイピングしていますが、Prom インスタンスは多くのリソースを使用しておらず、エクスポーターはより多くのリソースを使用しています (リソースの 85% がエクスポーターによって使用されています)。したがって、それぞれが独自のサーバーにいくつかの同一のエクスポーターをセットアップし、単一の Prom インスタンスを使用して、リストから各エクスポーター サーバーにターゲットの 1/3 を送信することは理にかなっています。

複数の Prom サーバーを実行したくないので、これはフェデレーションの使用例とは少し異なります。さらに、ターゲットのリストを含むファイルが生成され、それを複数のファイルに分割することは困難です。それ以外の場合は、prometheus.yml で異なるジョブを作成するだけで済みます。各ジョブは、file_sd_configs を使用して、ファイルの 1/3 を含む一意のファイルを指します。ターゲット (targets1.json、targets2.json、targets3.json など)

理想的には、file_sd_configs 用の 1 つのファイル「targets.json」を用意し、relabeling/hashmod (または何か?) を使用してそれらを均等に分割し、サブセットを特定のサーバーに送信したいと考えています。これは可能なことですか?

0 投票する
0 に答える
111 参照

apache-kafka - ブローカー障害時の Apache Kafka の動作

合計で約 85 個のパーティションを持つ 3 つのブローカー クラスターで Kafka を使用してきました。そのほとんどはレプリケーション ファクター 3 です。また、JMX エクスポーターを使用してクラスターでメトリックを収集しています。

最近、ブローカーがダウンすると、メトリクスで報告される「パーティション数」が他の 2 つのノードで増加することに気付きました。

私の理解では、ブローカーがダウンすると、ISR が失われ、リーダーが再選されますが、他の 2 つのブローカーで新しいものを作成する必要はありません。別のブローカーが失敗したときに、ブローカーがこのメトリックの 100 以上を報告する理由は何ですか?