タイトルはすでに私の質問を説明していると思います。変更したい
key (tab space) value
の中へ
key;value
レデューサーがマッパーの出力から生成しているすべての出力ファイルで。
Google を使用して、これに関する適切なドキュメントを見つけることができませんでした。これを達成する方法について、コードの一部を教えてください。
mapred.textoutputformat.separator
構成プロパティを次のように設定します";"
より良いドキュメントがないため、ここに私が集めたものがあります:
setTextOutputFormatSeparator(final Job job, final String separator){
final Configuration conf = job.getConfiguration(); //ensure accurate config ref
conf.set("mapred.textoutputformat.separator", separator); //Prior to Hadoop 2 (YARN)
conf.set("mapreduce.textoutputformat.separator", separator); //Hadoop v2+ (YARN)
conf.set("mapreduce.output.textoutputformat.separator", separator);
conf.set("mapreduce.output.key.field.separator", separator);
conf.set("mapred.textoutputformat.separatorText", separator); // ?
}
「KeyValueLineRecordReader」の「KEY_VALUE_SEPERATOR」プロパティを使用して、選択した区切り文字を指定できます。