行ごとではなく、テキストの段落をMapperクラスに渡すことは可能ですか?ParagraphRecordReaderの実装を探しています。
1 に答える
1
https://stackoverflow.com/a/5398215/1660002の答えは、この要件に答えています。ただし、構成パラメーターtextinputformat.record.delimiter
を二重の改行文字列 (例: "\n\n"
) に設定して、これを解決することもできます。
この構成可能な機能は、Apache Hadoop 0.23.x および 2.x リリースで利用できます。Cloudera の CDH3 および CDH4 リリースを使用する場合は、これらのリリースでも利用できます。
于 2012-09-10T11:58:00.147 に答える