2

CPU メトリクスに関するビジュアルとインサイトを構築する方法についての小さな質問をお願いします。

私はSpring Boot Webfluxアプリを持っていますが、特別なことは何もありません。Actuator、Micrometer、Prometheus の依存関係を取り込みます。

このアプリには、すぐに使用できる CPU のメトリックがあり、これは非常に優れていると思います。また、これらの指標には膨大な情報が含まれていると思います。残念ながら、Grafana やメトリクス自体を理解して、その可能性を完全に引き出すことはできないと思います。

メトリックは次のとおりです。

system_cpu_usage
process_cpu_usage
system_cpu_count
system_load_average_1m

それらを適切に使用する方法がわからないので、非常に基本的な noob クエリを使用します。

system_cpu_usage{_ns_=“my_namespace",cluster=~”my_cluster"}
process_cpu_usage{_ns_=“my_namespace",cluster=~”my_cluster"}
system_cpu_count{_ns_=“my_namespace",cluster=~”my_cluster”}
system_load_average_1m{_ns_=“my_namespace",cluster=~”my_cluster"}

そして、それらで、いくつかの結果が返されます。問題は、それ以上の洞察やアクションを実行できない平坦な線しか得られないということです。

Web で、次のようなより複雑なクエリをいくつか見ます。

avg_over_time(process_cpu_usage{_ns_=“my_namespace",cluster=~”my_cluster"}[1h])

またはいくつかを使用してdelta rate irateいます。しかし、彼らが何のためにここにいるのかはわかりません。

これらのメトリクスを使用する適切な方法と、現在のメトリクスと意味のあるメトリクスの間にギャップがあるため、現在のクエリの問題点は何ですか?

ありがとうございました。

4

1 に答える 1