0

私のmap-reduceジョブは、最終結果をシーケンスファイルに書き込みます。特定のキーのシーケンスファイルを見つける効率的な方法はありますか?

4

1 に答える 1

2

マッパーから発行されたキーがレデューサーで出力されたものと同じである場合は、使用済みのパーティショナー(Hash Paritionerがデフォルト)を介して検索キーを実行し、キーとジョブが最初に実行されたレデューサーの数を渡すことができます。これにより、キーが送信されたレデューサー番号がわかり、キーが含まれている必要があるpart-r-xxxxxファイルがわかります。

于 2012-12-14T17:54:00.110 に答える