0

実際には、CSV ファイルで計算を実行したいのですが、その CSV ファイルの各行について、前の 4 行も計算に使用したいと考えています。どうやってやるの?私が読んだほとんどすべての MapReduce の例では、データを読み取る唯一の方法は一度に 1 つの行であり、異なる行の計算でさえも互いに独立していました。あらゆるリソースと適切な指針をいただければ幸いです。

4

2 に答える 2

0

レコードが分割される方法は、使用されているRecordReaderによって異なります。デフォルトのRecordReaderLineRecordReaderであるため、レコードは実際には行です。データを4行のチャンクで表示する場合は、データを4行のグループに分割する独自のRecordReaderを実装してみてください。

http://developer.yahoo.com/hadoop/tutorial/module4.html

于 2012-12-12T16:39:25.237 に答える
0

InputFormatそれを行う方法は、 andをオーバーライドすることですRecordReader

Web で MultipleLineTextRecordReader.java MultipleLineTextInputFormat.java WholeFileTextInputFormat.java を検索して開始できます。

于 2012-12-14T10:19:56.720 に答える