Java コード内で Hadoop のデフォルトのレコード リーダーをオーバーライドしたいと考えています。デフォルトでは、レコードを 1 行ずつ読み取ります。「:」に遭遇したときに変更し、レコードを区切ります。ただし、レコードを区切りながら、区切り記号も発行します。たとえば、私の記録は次のとおりです。
> I go to school : He goes to school : we go to school
レコードが読み取られると、次のように生成されます。
I go to school
He goes to school
we go to school
ただし、区切り文字「:」はなくなりました。この区切り文字を記録に残す方法はありますか? デリミタには重要な情報が含まれている可能性があるためです。