問題タブ [flume]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
4959 参照

hadoop - MySQL から Hadoop にデータを移行する Flume

あなたの考えを共有してください。

要件は、分析目的で MySQL db のデータを Hadoop/HBase に移行することです。

データは、リアルタイムまたはほぼリアルタイムで移行する必要があります。Flume はこれをサポートできますか。

より良いアプローチとは何か。

0 投票する
2 に答える
1140 参照

bash - shell/bashスクリプトでflumeを構成します-インタラクティブなflumeシェルコンソールを避けます

flumeを構成する通常の方法は、flumeマスターWebコンソールを使用することで、ここで簡単に説明できます。

また

インタラクティブな水路シェルコンソールを介して、以下の手順に従います。

ここまでは順調ですね。

次に、Flume構成用のbashスクリプトを作成しようとしています。だから私は1、2、3、4、5をbashに絞りたいので、介入なしで毎回自動的に実行されます。

しかし、このbashスクリプトを実行するたびに、常に#line1で停止し、非反復モードでスムーズに実行するのではなく、インタラクティブなFlumeシェルコンソールに移動します。

インタラクティブモードを無視して、それを巧みに実行する方法を知っている人はいますか?

0 投票する
1 に答える
2030 参照

hadoop - なぜ水路を作るために節約が必要なのですか?

「 https://github.com/apache/flume/downloads 」からFlumeをダウンロードしましたが、ビルドできません。Flumeをビルドするには、最初にThriftをインストールする必要がありますか? reson..mvncompileを実行すると次のエラーが発生します-

0 投票する
1 に答える
1055 参照

flume - Flume エージェントが java.net.ConnectException をスローします: 接続が拒否されました

私はしばらくの間 Flume を使用しており、同じマシンでエージェントとコレクターを実行しています。

構成

エージェント ノードで直面している問題:

その後、空の ACK が連続して送信されます

接続が拒否される理由がわかりません。実行する必要があるシステム レベルの変更はありますか?

注:コレクターはポートをリッスンしていますが、エージェントは 35855 ポート経由でデータを送信できません。

誰でもこの問題を解決できますか。

ありがとう

0 投票する
0 に答える
699 参照

hadoop - Flume-ng の奇妙な動作

Flume-ngを使用してApache Webサーバーのログをhdfsに集約しようとしています..しかし、奇妙なことに、hdfsに最初の数行しか取得していません..さらに奇妙なことに、エージェントを起動するたびに2つのファイルが作成され、2番目のファイルが作成されます最初のものより常に小さい。私のエージェントの conf ファイルは次のようになります。

また、端末にエラーメッセージが表示されません..それは正常ですか、それとも私の側の間違いですか??

0 投票する
1 に答える
670 参照

amazon-s3 - s3 への典型的な書き込みスループットは? (flume 0.9.4 を使用)

Flume (flume 0.9.4-cdh3u4) フローを BE モードで実行しています。別のマシンにあるエージェントとコレクターの両方が大規模な EC2 インスタンスです。

コレクターは、ローカル ファイルシステムと同じリージョン内の S3 バケットに書き込みます。

エージェントは、E2E モードで構成されている場合、4MB/秒を処理するようにテストされており、エージェント <-> コレクター速度も同様です。

「iftop」を使用すると、コレクターによる S3 への発信接続が 2 つあり、s3 への書き込みスループットが約 40KB/s ~ 50KB/s であることがわかります。

  1. コレクタを使用して見た s3 への典型的な書き込みスループットは?

  2. インスタンスの使用率を最大化するために、これらのスレッド (S3 に書き込む) をさらに生成できるかどうか疑問に思っていました。

それ、どうやったら出来るの?

別の方法で書き込みスループットを向上させることができれば、これ以上コレクターを生成したくありません。

0 投票する
0 に答える
420 参照

java - 水路でslf4jを構成しますか?

log4jではなくflumeでslf4jを使用したい(デフォルトではflumeで使用されます)-slf4jを構成するためにどのファイルで変更を加えたか教えてください。

0 投票する
1 に答える
755 参照

hadoop - FlumeはファイルをS3バケットに入れることができません

私はノードのみ(テスト)モードで水路を使用しています。flumeはRabbitMQからメッセージをプルし、AmazonS3バケットに配置します。

問題:

Flumeは実際にはRabbitMQからプルしますが、ファイルはS3バケットに表示されません。

技術的な詳細:

私は次の方法で水路を開始します:

Flumeログ:

水路の再起動後、関連する交換とキューを介して何かを送信すると、水路ログに次の行が表示されます。

0 投票する
1 に答える
602 参照

java - Flume が出力形式を .csv から .json に変更

ノードのみの (テスト) モードで Flume を使用しています。私のフルームは次の方法で開始されます。

Flume node -1 -c $FQDN':amqp("exchangeName=[エクスチェンジ名]", "bindings=[バインディング名]", "host=127.0.0.1", "port=5672", "userName=[ユーザー] ", "password=[pass]", "exchangeType=direct", "durableExchange=false", "queueName=[キュー名]", "durableQueue=true", "exclusiveQueue=false", "autoDeleteQueue=false"," useMessageTimestamp=true")|collectorSink("s3n://[Amazon キー]:[Amazon シークレット]@[S3 のパス]","server");' -s "$@" > "$log" 2>&1

Flume で .csv ファイルを渡すことに興味があります。残念ながら、flume は .csv ファイルを .json に変換し、いくつかのフィールドを追加します。

例:

元のメッセージ:

Flume はメッセージを次のように変換します。

メッセージをそのまま渡すようにflumeを設定するにはどうすればよいですか?

0 投票する
3 に答える
6311 参照

linux - Linux で Flume の実行に失敗しました

Flume を Linux にインストールしたときに、flume の実行中に警告が表示されました。この手順に従って、flume をインストールしました。

Flume を実行するために、このコマンドを使用しました

しかし、いくつかの警告が表示されています