をカスタマイズする必要がある入力ファイルがありますRecordReader
。ただし、ここでの問題は、データがさまざまな入力分割に分散され、別のマッパーが最初のマッパーによって消費されるデータを取得する可能性があることです。
例:
ABCD
$ EF
先頭の「$」は、前の行の続きであることを意味します。
考えると、2 番目の分割は $ から始まります。さて、私の最初のマッパーは、最初の行の続きに何かがあることを知りません。また、データに 2 行目がまったくない可能性が非常に高いことにも注意してください。したがって、2行目を読むまで、または読まない限り、データの続きに何かがあるとは言えません。
この問題の解決策を見つけてください。