1

元の Map-Reduce 実行チェーンは次のとおりです。InputSplits-->Mapper--> [Sorting/Shuffling, etc]-->Reducer-->...

ここで、入力分割が最初にマッパーに到達するのではなく、代わりに別の新しいステージに移動する必要があります (たとえば、プレマッパーと呼ぶことができます。このクラスは自分で作成します)。

したがって、新しい順序は次のようになります。InputSplits -> Pre-Mapper->Mapper ->...

現在ソースコードを読んでいます。しかし、私はまだ手がかりを見つけることができません (どのクラスに触れるべきか)。

どんな提案でも大歓迎です。どうもありがとうございました :)

4

3 に答える 3

0

MapRunnerクラスをオーバーライドすることを検討できます

于 2014-04-29T09:24:34.653 に答える