私は Hadoop に非常に慣れていません。外部アプリケーションからジョブを開始し、結果をそのアプリケーションに直接取得する方法があるかどうか疑問に思っていました。Hadoop MapReduce ジョブを作成して構成した後、別のマシンの外部アプリケーションからそれを呼び出し、MapReduce の出力をストリームまたはオブジェクトを介して外部アプリケーションに直接配信したいと考えています。
たとえば、Web サーバーで特定のサーブレットが呼び出されるたびにサンプルの wordcount ジョブを実行したいとします。どうすればいいですか?
これは可能ですか?もしそうなら、例や経験は大歓迎です。