Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私のmap-reduceジョブは、最終結果をシーケンスファイルに書き込みます。特定のキーのシーケンスファイルを見つける効率的な方法はありますか?
マッパーから発行されたキーがレデューサーで出力されたものと同じである場合は、使用済みのパーティショナー(Hash Paritionerがデフォルト)を介して検索キーを実行し、キーとジョブが最初に実行されたレデューサーの数を渡すことができます。これにより、キーが送信されたレデューサー番号がわかり、キーが含まれている必要があるpart-r-xxxxxファイルがわかります。