1

私はPythonでMapReduceジョブを書いていますが、のようないくつかの3番目のライブラリを使用したいと思いますchardet

オプションを使用して、JavaMapReduce-libjars=...にそれらを含めることができると思います。

しかし、Python MapReduceジョブにサードパーティのライブラリを含めるにはどうすればよいですか?

ありがとうございました!

4

1 に答える 1

1

問題は によって解決されましたzipimport

次にchardet、 fileに圧縮しmodule.mod、次のように使用します。

importer = zipimport.zipimporter('module.mod')
chardet = importer.load_module('chardet')

-file module.modHadoop ストリーミング コマンドを追加します。

chardetスクリプトで使用できるようになりました。

詳細は、Hadoop ストリーミング ジョブに Python パッケージを含めるにはどうすればよいですか? を参照してください。

于 2013-03-12T08:01:23.330 に答える