Hadoop ストリーミングを使用しています。次のようにスクリプトを開始します。
../hadoop/bin/hadoop jar ../hadoop/contrib/streaming/hadoop-streaming-1.0.4.jar \
-mapper ../tests/mapper.php \
-reducer ../tests/reducer.php \
-input data \
-output out
「データ」は2.5GBのtxtファイルです。
ただし、ps axf では、1 つのマッパーしか表示されません。-Dmapred.map.tasks=10 で試しましたが、結果は同じです - 単一のマッパーです。
Hadoop で入力ファイルを分割し、複数のマッパー プロセスを開始するにはどうすればよいですか?