HDFS と Accumulo を使用してシステムを実装します。HDFS に大量のファイルがあり、Spark ジョブを使用してそれらを処理し、Accumulo に保存する必要があります。Googleを使用して良い例を見つけることができませんでした。
そのようなワークフローを設定する方法について、誰かが例を提供できますか?
HDFS と Accumulo を使用してシステムを実装します。HDFS に大量のファイルがあり、Spark ジョブを使用してそれらを処理し、Accumulo に保存する必要があります。Googleを使用して良い例を見つけることができませんでした。
そのようなワークフローを設定する方法について、誰かが例を提供できますか?