6

HBase (0.20.1) をデータ ソースとデータ シンクの両方として使用する Hadoop (0.20.1) mapreduce ジョブを作成しています。Python スクリプトとの間でデータをストリーミングするために hadoop-0.20.1-streaming.jar を使用する必要がある Python でジョブを作成したいと考えています。データ ソース/シンクが HDFS ファイルの場合、これは正常に機能します。

Hadoop は mapreduce の HBase との間のストリーミングをサポートしていますか?

4

1 に答える 1

1

これは私が望んでいることのようですが、Hadoop ディストリビューションの一部ではありません。その他の提案やコメントは引き続き歓迎します。

http://github.com/wanpark/hadoop-hbase-streaming

于 2009-11-10T10:06:15.747 に答える