1

多数の小さなファイルを HDFS シーケンス ファイルに移動したいと考えています。私は2つのオプションに出くわしました:

  1. フルームを使用します。Flume にはファイル ソースが組み込まれていないため、ファイルをプッシュするにはカスタム ソースが必要です。
  2. hdfs ルートに apache camel ファイルを使用します。

上記の 2 つの方法は目的を果たしますが、いずれかを選択する前に、利用可能な他のオプションを検討したいと思います。特に、より構成可能で保守性の低いコードになるソリューションに興味があります。

4

2 に答える 2

1

フルームを使用します。Flume にはファイル ソースが組み込まれていないため、ファイルをプッシュするにはカスタム ソースが必要です。

うーん...いいえ、そうではありません。Flume にはSpooling Directory Sourceがあり、必要なことを高レベルで実行できます。

于 2013-08-15T21:07:01.207 に答える