Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
複数のマップ側結合を連鎖させることはできますか? マップのみを使用して値をソートできないため、私には不可能です(reduceではセカンダリソートを使用できます)。したがって、次の結合のためにソートされた値の結果を提供することは不可能です。マップ側結合の結果値をソートする解決策はありますか? または、いくつかのマップ側の結合を連鎖させるソリューションはありますか? これで、map-reduce ジョブを使用して値を並べ替えることができます。
古い API (mapred パッケージ) を使用している場合は、CompositeInputFormat を調べてください。使用方法をより詳細に説明している Roberto Congiu のブログ記事もあります。
これには、データ セットが事前に並べ替えられ、適切にパーティション化されている必要があります。
Yahoo の Oozie フレームワークを参照してください。