Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
MapReduce でこのパラメーターを実験しようとしていますが、いくつか質問があります。
これは HDFS のサイズ (圧縮されているかどうか) によって異なりますか? それとも解凍後ですか?前者だと思いますが、確認したいだけです。
Hadoop 0.21 から、bz2 ファイルは分割可能だと思います。したがって、bz2 を使用できます。
このパラメーターは、入力形式が入力ファイルの分割をサポートしている場合にのみ使用されます。一般的な圧縮コーデック (gzip など) はファイルの分割をサポートしていないため、これは無視されます。
入力形式が分割をサポートしている場合、これは圧縮サイズに関連しています。