Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私はたくさんの小さなファイルを持っています、例えば20000以上。
マッパーの初期化に費やす時間を節約したいので、500個のマッパーを使用して、それぞれが40個の小さなファイルを入力として処理することは可能ですか?
可能であれば、この種の入力形式を実装する方法についてのガイダンスが必要です、ありがとう!
ところで、私はこれらの小さなファイルをマージする必要があることを知っています。この手順も必要です。
CombineFileInputFormat を使用できます。これは、古いMR APIと新しいMR API にあります。使い方を紹介した素敵なブログです。