Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
ジョブの実行時に 2 つ以上の入力引数を読み取るように Hadoop ストリーミングを構成することはできますか?
たとえば、次のように実行されるスクリプトがあるとします。my_script file1 file2
my_script file1 file2
Hadoop ストリーミングでこれを指定するにはどうすればよいですか?
私の知る限り、次の実行構文を持つジョブのみを指定できます: my_script "fixed_params" "input".
my_script "fixed_params" "input"
ストリーミングではあまり機能していませんが、別の-input引数を追加できると確信しています。
-input
参照: Hadoop の 1 つのストリーミング ジョブで複数のマッパー入力を使用しますか?