1

Elastic Map Reduce (AWS) の Hadoop で Map Reducer を使用していますが、文字列として並べ替えているため、整数の並べ替えを行いたいと考えています。どうやってするの ?キーを整数として取得し、キーに対して整数の並べ替えを行います。

4

2 に答える 2

2

Hadoop (または EMR) で辞書順ソートを実行できるように、整数の先頭にゼロを付ける (またはパディングする) ことをお勧めします。Hadoop は整数ベースの並べ替えをサポートしていません。単純な辞書式並べ替えです。

たとえば、これらがキーの場合:

1
15
168
1900

マッパーで次のように出力する必要があります。

0001
0015
0168
1900

Hadoop がそれらを正しくソートできるようにします。

于 2013-06-04T19:34:39.037 に答える
0

この関連する質問の回答は、データを変更せずに使用できます。hadoop のシャッフル/ソート段階で数値的にソートする方法は?

于 2013-08-08T01:52:28.437 に答える