約 1000 万個の小さなファイルを含む 1 GB の zip ファイルがあります。ZipInputStreamを使用してzipファイルを十分にインポートしていますか、それとも「Hadoopの小さなファイルの問題」に直面しますか。
また、この問題を解決するためのより良いアプローチについても親切に言及してください。基本的に、各小さなファイルの内容を解析し、それに対して何らかの処理を行いたいと考えています。
ありがとう
約 1000 万個の小さなファイルを含む 1 GB の zip ファイルがあります。ZipInputStreamを使用してzipファイルを十分にインポートしていますか、それとも「Hadoopの小さなファイルの問題」に直面しますか。
また、この問題を解決するためのより良いアプローチについても親切に言及してください。基本的に、各小さなファイルの内容を解析し、それに対して何らかの処理を行いたいと考えています。
ありがとう