“flume”の関連問題_Stack Overflow日本語サイト

0 投票する

5 に答える

4959 参照

hadoop - MySQL から Hadoop にデータを移行する Flume

あなたの考えを共有してください。

要件は、分析目的で MySQL db のデータを Hadoop/HBase に移行することです。

データは、リアルタイムまたはほぼリアルタイムで移行する必要があります。Flume はこれをサポートできますか。

より良いアプローチとは何か。

2012-05-11T09:07:49.930

0 投票する

2 に答える

1140 参照

bash - shell/bashスクリプトでflumeを構成します-インタラクティブなflumeシェルコンソールを避けます

flumeを構成する通常の方法は、flumeマスターWebコンソールを使用することで、ここで簡単に説明できます。

また

インタラクティブな水路シェルコンソールを介して、以下の手順に従います。

ここまでは順調ですね。

次に、Flume構成用のbashスクリプトを作成しようとしています。だから私は1、2、3、4、5をbashに絞りたいので、介入なしで毎回自動的に実行されます。

しかし、このbashスクリプトを実行するたびに、常に＃line1で停止し、非反復モードでスムーズに実行するのではなく、インタラクティブなFlumeシェルコンソールに移動します。

インタラクティブモードを無視して、それを巧みに実行する方法を知っている人はいますか？

bash shell scripting flume

2012-06-01T13:13:06.043

0 投票する

1 に答える

2030 参照

hadoop - なぜ水路を作るために節約が必要なのですか？

「 https://github.com/apache/flume/downloads 」からFlumeをダウンロードしましたが、ビルドできません。Flumeをビルドするには、最初にThriftをインストールする必要がありますか？ reson..mvncompileを実行すると次のエラーが発生します-

hadoop flume

2012-06-04T11:22:25.487

0 投票する

1 に答える

1055 参照

flume - Flume エージェントが java.net.ConnectException をスローします: 接続が拒否されました

私はしばらくの間 Flume を使用しており、同じマシンでエージェントとコレクターを実行しています。

構成

エージェントノードで直面している問題:

その後、空の ACK が連続して送信されます

接続が拒否される理由がわかりません。実行する必要があるシステムレベルの変更はありますか?

注:コレクターはポートをリッスンしていますが、エージェントは 35855 ポート経由でデータを送信できません。

誰でもこの問題を解決できますか。

ありがとう

flume

2012-06-04T14:14:23.887

0 投票する

0 に答える

699 参照

hadoop - Flume-ng の奇妙な動作

Flume-ngを使用してApache Webサーバーのログをhdfsに集約しようとしています..しかし、奇妙なことに、hdfsに最初の数行しか取得していません..さらに奇妙なことに、エージェントを起動するたびに2つのファイルが作成され、2番目のファイルが作成されます最初のものより常に小さい。私のエージェントの conf ファイルは次のようになります。

また、端末にエラーメッセージが表示されません..それは正常ですか、それとも私の側の間違いですか??

hadoop hdfs flume

2012-06-12T18:00:56.920

0 投票する

1 に答える

670 参照

amazon-s3 - s3 への典型的な書き込みスループットは? (flume 0.9.4 を使用)

Flume (flume 0.9.4-cdh3u4) フローを BE モードで実行しています。別のマシンにあるエージェントとコレクターの両方が大規模な EC2 インスタンスです。

コレクターは、ローカルファイルシステムと同じリージョン内の S3 バケットに書き込みます。

エージェントは、E2E モードで構成されている場合、4MB/秒を処理するようにテストされており、エージェント <-> コレクター速度も同様です。

「iftop」を使用すると、コレクターによる S3 への発信接続が 2 つあり、s3 への書き込みスループットが約 40KB/s ～ 50KB/s であることがわかります。

コレクタを使用して見た s3 への典型的な書き込みスループットは?
インスタンスの使用率を最大化するために、これらのスレッド (S3 に書き込む) をさらに生成できるかどうか疑問に思っていました。

それ、どうやったら出来るの？

別の方法で書き込みスループットを向上させることができれば、これ以上コレクターを生成したくありません。

amazon-s3 throughput flume

2012-06-20T22:08:07.250

0 投票する

0 に答える

420 参照

java - 水路でslf4jを構成しますか？

log4jではなくflumeでslf4jを使用したい（デフォルトではflumeで使用されます）-slf4jを構成するためにどのファイルで変更を加えたか教えてください。

java apache hadoop flume

2012-06-29T06:13:41.383

0 投票する

1 に答える

755 参照

hadoop - FlumeはファイルをS3バケットに入れることができません

私はノードのみ（テスト）モードで水路を使用しています。flumeはRabbitMQからメッセージをプルし、AmazonS3バケットに配置します。

問題：

Flumeは実際にはRabbitMQからプルしますが、ファイルはS3バケットに表示されません。

技術的な詳細：

私は次の方法で水路を開始します：

Flumeログ：

水路の再起動後、関連する交換とキューを介して何かを送信すると、水路ログに次の行が表示されます。

hadoop amazon-s3 amazon amqp flume

2012-08-16T12:33:50.640

0 投票する

1 に答える

602 参照

java - Flume が出力形式を .csv から .json に変更

ノードのみの (テスト) モードで Flume を使用しています。私のフルームは次の方法で開始されます。

Flume node -1 -c $FQDN':amqp("exchangeName=[エクスチェンジ名]", "bindings=[バインディング名]", "host=127.0.0.1", "port=5672", "userName=[ユーザー] ", "password=[pass]", "exchangeType=direct", "durableExchange=false", "queueName=[キュー名]", "durableQueue=true", "exclusiveQueue=false", "autoDeleteQueue=false"," useMessageTimestamp=true")|collectorSink("s3n://[Amazon キー]:[Amazon シークレット]@[S3 のパス]","server");' -s "$@" > "$log" 2>&1

Flume で .csv ファイルを渡すことに興味があります。残念ながら、flume は .csv ファイルを .json に変換し、いくつかのフィールドを追加します。

例：

元のメッセージ:

Flume はメッセージを次のように変換します。

メッセージをそのまま渡すようにflumeを設定するにはどうすればよいですか?

java logging hadoop flume hadoop-plugins

2012-08-19T13:58:59.530

0 投票する

3 に答える

6311 参照

linux - Linux で Flume の実行に失敗しました

Flume を Linux にインストールしたときに、flume の実行中に警告が表示されました。この手順に従って、flume をインストールしました。

Flume を実行するために、このコマンドを使用しました

しかし、いくつかの警告が表示されています

linux flume

2012-09-05T11:26:57.027

問題タブ [flume]

構成

問題：

技術的な詳細：

Flumeログ：

Reference