Elastic Map Reduce (AWS) の Hadoop で Map Reducer を使用していますが、文字列として並べ替えているため、整数の並べ替えを行いたいと考えています。どうやってするの ?キーを整数として取得し、キーに対して整数の並べ替えを行います。
2 に答える
2
Hadoop (または EMR) で辞書順ソートを実行できるように、整数の先頭にゼロを付ける (またはパディングする) ことをお勧めします。Hadoop は整数ベースの並べ替えをサポートしていません。単純な辞書式並べ替えです。
たとえば、これらがキーの場合:
1
15
168
1900
マッパーで次のように出力する必要があります。
0001
0015
0168
1900
Hadoop がそれらを正しくソートできるようにします。
于 2013-06-04T19:34:39.037 に答える
0
この関連する質問の回答は、データを変更せずに使用できます。hadoop のシャッフル/ソート段階で数値的にソートする方法は?
于 2013-08-08T01:52:28.437 に答える