実際には、CSV ファイルで計算を実行したいのですが、その CSV ファイルの各行について、前の 4 行も計算に使用したいと考えています。どうやってやるの?私が読んだほとんどすべての MapReduce の例では、データを読み取る唯一の方法は一度に 1 つの行であり、異なる行の計算でさえも互いに独立していました。あらゆるリソースと適切な指針をいただければ幸いです。
user1403483
質問する
80 次
2 に答える
0
レコードが分割される方法は、使用されているRecordReaderによって異なります。デフォルトのRecordReaderは LineRecordReaderであるため、レコードは実際には行です。データを4行のチャンクで表示する場合は、データを4行のグループに分割する独自のRecordReaderを実装してみてください。
于 2012-12-12T16:39:25.237 に答える
0
InputFormat
それを行う方法は、 andをオーバーライドすることですRecordReader
。
Web で MultipleLineTextRecordReader.java MultipleLineTextInputFormat.java WholeFileTextInputFormat.java を検索して開始できます。
于 2012-12-14T10:19:56.720 に答える