カスタム csv ファイルを入力として処理し、csv ファイルを HDFS に書き戻す必要があります。実数が発生する map reduce クラス内で直接これを行うことはできますか?
csv ファイルを処理するために、opencsv ライブラリを使用しています。inputformat フラグと outputformat フラグを使用して、ユーザー定義の形式を処理する Java クラスを指定するチュートリアルを見てきました。csvファイルの操作方法について誰かアドバイスをください。
Hadoop が提供するものに固執したいのですが、そうしないと、入力および出力形式の独自の実装により、処理が遅くなる可能性があります。