Hadoop in Actionを読んだところ、とクラスをJava
使用するとデータを複数のファイルに減らすことができることがわかりましたが、 を使用して同じことを達成する方法がわかりません。 MultipleOutputFormat
MultipleOutputs
Python streaming
例えば:
/ out1/part-0000
mapper -> reducer
\ out2/part-0000
知っている方、聞いた方、同じようなことをした方、教えてください。