Flume (flume 0.9.4-cdh3u4) フローを BE モードで実行しています。別のマシンにあるエージェントとコレクターの両方が大規模な EC2 インスタンスです。
コレクターは、ローカル ファイルシステムと同じリージョン内の S3 バケットに書き込みます。
エージェントは、E2E モードで構成されている場合、4MB/秒を処理するようにテストされており、エージェント <-> コレクター速度も同様です。
「iftop」を使用すると、コレクターによる S3 への発信接続が 2 つあり、s3 への書き込みスループットが約 40KB/s ~ 50KB/s であることがわかります。
コレクタを使用して見た s3 への典型的な書き込みスループットは?
インスタンスの使用率を最大化するために、これらのスレッド (S3 に書き込む) をさらに生成できるかどうか疑問に思っていました。
それ、どうやったら出来るの?
別の方法で書き込みスループットを向上させることができれば、これ以上コレクターを生成したくありません。