私の仕事への入力がファイルセット[a、b、c、d]である場合、ソートへの入力は厳密に[map(a.0)、map(a.1)、map(b.0)、map( b.1)、マップ(c.0)、マップ(c.1)、マップ(d.0)、マップ(d.1)]?
私の動機は、行が[キー、値]である一連のファイル(もちろんブロックに分割されます)を持つことです。ここで、キーと値はそれぞれ単純な文字列です。明示的な順序定義フィールドがないにもかかわらず、入力に存在する順序でキーごとにレデューサーでこれらの値を連結したいと考えています。
アドバイスをいただければ幸いです。これは、Google にとって難しいクエリであることがわかっています。
例
入力形式
A First
A Another
A Third
B First
C First
C Another
望ましい出力
A First,Another,Third
B First
C First,Another
繰り返しますが、ファイルが別々のブロックに保存されている場合、First-Third を正しい順序で取得できるかどうかはわかりません。