達人!
長い間、次の質問に対する答えが見つかりませんでした:書き込み中にhadoopが大きなファイルを分割する方法。例:1)ブロックサイズ64 Mb 2)ファイルサイズ128 Mb(フラットファイル、テキストを含む)。
私がファイルを書くとき、それは2つの部分(ファイルサイズ/ブロックサイズ)に分割されます。しかし... Block1に続く発生 は...word300word301woで終了し ブロック2はrd302word303で開始する 可能性があります...書き込みケースは
ブロック1は...word300word301で終了し、ブロック2はword302 **word303..で開始します。
または、Hadoop分割アルゴリズムについて書く場所にリンクできますか。
前もって感謝します!