Java で map-reduce ジョブを作成しています。物理的な出力ファイルではなく、ジョブの出力をストリーム (出力ストリームの場合もあります) として取得できるかどうかを知りたいです。私の目的は、ストリームを別のアプリケーションに使用することです。
2 に答える
0
カスタム出力形式を作成し、その書き込みを任意のストリームに使用できます。必ずしもファイルではありません。カスタム出力形式の作成方法については、このチュートリアルを参照してください。
または、Hadoop Streaming API を使用することもできます。それについては、こちらをご覧ください。
于 2013-02-12T10:17:30.093 に答える
0
Apache-Hadoop を使用してこれを行うことはできないと思います。これは分散システムで動作するように設計されており、AFAIK を発行する方法を提供することは、システムが発行するストリームoutput stream
をどのように決定するか、つまりどのリデューサーかを決定する方法として、目的に反します! flat-file/DB/amazon-s3 などに書き込むことはできますが、おそらくストリームは得られません。
于 2013-02-13T19:34:18.377 に答える