マッパーへの入力としてテキストファイルを取得し、シーケンスファイルを出力したいと思います。簡単なmap-reduceジョブを同じように書く方法は?テキストファイルにはタブ区切りの値があります。例:input:group1 1 2 3 4 5
このような入力の場合、キーに「group1」があり、その値は1 2 345のベクトルである出力シーケンスファイルを作成します。
どうすればこれらの仕事を書くことができますか?また、この場合、レデューサーは必要ないと思います。この場合、アイデンティティリデューサージョブを作成するにはどうすればよいですか?レデューサージョブの記述をスキップできますか?
助けに感謝します。よろしく。