1

Excel から Hadoop にデータをインポートまたは読み取る必要があるシナリオに遭遇した人はいますか? Flume Excel ソースのようなものはありますか?

ところで、Excelファイルをcsvに変換して処理できることは知っています。ここで実際に Flume ソースをもう少し詳しく調べようとしています。

4

1 に答える 1

2

スプーリング ディレクトリ ソースは、Excel ファイル (またはその他の形式) から読み取るように構成できます。ドキュメントに記載されているように、このソースはEventDeserializer (ファイルをイベントに解析するロジックを実装するクラス) で構成できます。

誰かがそのようなデシリアライザーを既に実装しているとは思いませんが、Apache POI ライブラリを使用すると非常に簡単な作業のようです。

于 2013-09-25T12:40:22.153 に答える