Webアプリケーションと1つのリモートクラスターがあります(1つ以上の場合もあります)。これらのクラスターは、異なるマシン上に配置できます。Webアプリケーションから次の操作を実行したい:
1 HDFSアクション:-
- 新しいディレクトリを作成する
- HDFS(Hadoop分散ファイルシステム)からファイルを削除します
- HDFSに存在するファイルを一覧表示します
- ファイルをHDFSにロードします
- ファイルのアンロード
2ジョブ関連のアクション:-
- MapReduceジョブを送信する
- それらのステータス、つまり完了したジョブの量を表示します
- ジョブが完了するまでにかかった時間
これらのタスクをWebアプリケーションから(API、REST呼び出しなどを介して)実行するのに役立つツールが必要です。ツールは(Webアプリケーションと)同じマシンで実行され、特に、リモートクラスター。
最後のオプションとして(複数の異なるクラスターが存在する可能性があるため、それぞれにプラグイン、ライブラリなどがインストールされていることを確認するのは困難です)、Hadoopライブラリ、プラグインがあるかどうか疑問に思います-クラスター上にあり、リモートマシンからのアクセスを許可し、前述のタスクを実行します。