分割せずにファイル全体をマッパーに送信する方法はありますか?
これを読みましたが、中間ファイルを生成せずに同じことを行う別の方法があるかどうか疑問に思っています。理想的には、Hadoop に対するコマンド ラインの既存のオプションが必要です。
streaming
Amazon EMR で Python スクリプトを使用してこの機能を使用しています。
分割せずにファイル全体をマッパーに送信する方法はありますか?
これを読みましたが、中間ファイルを生成せずに同じことを行う別の方法があるかどうか疑問に思っています。理想的には、Hadoop に対するコマンド ラインの既存のオプションが必要です。
streaming
Amazon EMR で Python スクリプトを使用してこの機能を使用しています。