4

行ごとではなく、テキストの段落をMapperクラスに渡すことは可能ですか?ParagraphRecordReaderの実装を探しています。

4

1 に答える 1

1

https://stackoverflow.com/a/5398215/1660002の答えは、この要件に答えています。ただし、構成パラメーターtextinputformat.record.delimiterを二重の改行文字列 (例: "\n\n") に設定して、これを解決することもできます。

この構成可能な機能は、Apache Hadoop 0.23.x および 2.x リリースで利用できます。Cloudera の CDH3 および CDH4 リリースを使用する場合は、これらのリリースでも利用できます。

于 2012-09-10T11:58:00.147 に答える