1

したがって、私のMRジョブはレポートファイルを生成します。そのファイルは、通常のWebレポートインターフェイスのボタンをクリックして出力をダウンロードする必要があるエンドユーザーがダウンロードできる必要があります。このO'Reillyの本の抜粋によると、HTTP読み取り専用インターフェースがあります。XMLベースであると書かれていますが、プログラムで照会、一覧表示、ダウンロードできるものではなく、単にWebブラウザーで表示することを目的とした通常のWebインターフェースのようです。独自のサーブレットベースのインターフェイスを作成する唯一の手段はありますか?または、hadoop cliツールを実行しますか?

4

2 に答える 2

3

Java以外からプログラムでHDFSにアクセスする方法は、Triftを使用することです。HDFSソースツリーには、いくつかの言語(Java、Python、PHPなど)用に事前に生成されたクライアントクラスが含まれています。

http://wiki.apache.org/hadoop/HDFS-APIsを参照してください

于 2011-02-19T08:45:00.467 に答える
-1

恐らく、CLIAFAIKで解決する必要があるでしょう。

状況に合うかどうかはわかりませんが、MRジョブを開始するスクリプトで、hadoop dfs -get ...ジョブの完了後に、提供されている既知のディレクトリに対して実行するのが妥当だと思います。

もっと簡単な解決策がわからないのでごめんなさい。

于 2011-02-19T01:52:51.867 に答える