最近Airflow
、タスクを実行するように構成しました。タスクを実行するマスター ノードと 2 つのワーカーがあります。と を使用してクラスターを監視したいと考えていGraphite
ますGrafana
。私がしたことは、マスターノードにインストールGraphite
して、単純な bash コマンドでテストすることだけでした。ここで、タスクの実行中にクラスターGrafana
を監視したいと考えています。Airflow
私はそれを作成 metrics.properties
して配置しましたspark/conf
:
# Enable Graphite
*.sink.graphite.class=org.apache.spark.metrics.sink.GraphiteSink
*.sink.graphite.host=192.168.2.241
*.sink.graphite.port=2003
*.sink.graphite.period=10
# Enable jvm source for instance master, worker, driver and executor
master.source.jvm.class=org.apache.spark.metrics.source.JvmSource
worker.source.jvm.class=org.apache.spark.metrics.source.JvmSource
driver.source.jvm.class=org.apache.spark.metrics.source.JvmSource
executor.source.jvm.class=org.apache.spark.metrics.source.JvmSource
そして、次のフラグを my に追加しましたspark-submit
:
--files=/path/to/metrics.properties \
--conf spark.metrics.conf=metrics.properties
開いた後に見つけることができるのGraphite ui
はGraphite->carbon->agents->cluster1-a
、いくつかのグラフだけです。私のAirflow
クラスターではなく、何か他のものを監視していると確信しています。
多分私はインストールする必要がありgrafana-spark-dashboards
ますか?しかし、それはすべてについてYARN
であり、私はAirflow
管理システムを使用しています。
またはブロックをに追加しCarbon
ますstorage-schemas.conf
か?
このブロックはGraphite
ダッシュボードに表示されます:
[carbon]
pattern = ^carbon\.
retentions = 60:90d
どのメトリクスSpark
が に送信されるかをどうにかして確認できますGraphite
か?