spark-submitで起動する spark jar があり、正常に動作します (ファイルの読み取り、RDD の生成、hdfs への保存)。ただし、Oozie ジョブ(oozie:spark-action)内で同じ jar を起動しようとすると、spark ジョブは失敗します。
ログを調べたところ、最初に表示されるエラーは次のとおりです。
エラー MetricsSystem: シンク クラス org.apache.spark.metrics.sink.MetricsServlet をインスタンス化できません。
さらに、spark スクリプトをいじり始めたところ、saveAsText関数に問題があることがわかりました。HDFS に書き込まずに同じ Spark ジョブを実行すると、ワークフロー全体が正常に機能します。
助言がありますか ?