0

Hadoop ストリーミングで DistributedCache と同様の依存関係を処理する標準的な方法はありますか (Java MR で)

たとえば、すべてのマップ タスクで使用する Python モジュールがあるとします。どうすれば達成できますか?

4

1 に答える 1

0

-file 引数を使用して、python モジュールを指定できます。

http://hadoop.apache.org/docs/r0.18.3/streaming.htmlを参照してください

依存モジュールなどがある場合は、複数の -file 引数を指定できます。

于 2013-07-11T18:28:13.390 に答える