12

タイトルはすでに私の質問を説明していると思います。変更したい

key (tab space) value

の中へ

key;value

レデューサーがマッパーの出力から生成しているすべての出力ファイルで。

Google を使用して、これに関する適切なドキュメントを見つけることができませんでした。これを達成する方法について、コードの一部を教えてください。

4

3 に答える 3

18

mapred.textoutputformat.separator構成プロパティを次のように設定します";"

于 2012-06-14T12:05:07.510 に答える
15

より良いドキュメントがないため、ここに私が集めたものがあります:

    setTextOutputFormatSeparator(final Job job, final String separator){
            final Configuration conf = job.getConfiguration(); //ensure accurate config ref

            conf.set("mapred.textoutputformat.separator", separator); //Prior to Hadoop 2 (YARN)
            conf.set("mapreduce.textoutputformat.separator", separator);  //Hadoop v2+ (YARN)
            conf.set("mapreduce.output.textoutputformat.separator", separator);
            conf.set("mapreduce.output.key.field.separator", separator);
            conf.set("mapred.textoutputformat.separatorText", separator); // ?
    }
于 2013-09-08T17:38:19.283 に答える
1

「KeyValueLineRecordReader」の「KEY_VALUE_SEPERATOR」プロパティを使用して、選択した区切り文字を指定できます。

于 2012-06-14T12:10:12.193 に答える