問題タブ [spark-streaming-kafka]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
917 参照

apache-spark - Spark Streaming Kafka createDirectStream - Spark UI で入力イベントのサイズがゼロと表示される

createDirectStream を使用して Spark Streaming を実装しました。私の Kafka プロデューサーは、2 つのパーティションを持つトピックに毎秒複数のメッセージを送信しています。

Spark ストリーミング側では、毎秒カフカ メッセージを読み取り、5 秒のウィンドウ サイズと頻度でそれらをウィンドウ処理しています。

Kafka メッセージは適切に処理されています。正しい計算と出力が表示されています。

しかし、Spark Web UI の [ストリーミング] セクションでは、ウィンドウごとのイベント数がゼロとして表示されます。この画像を見てください:

Zero イベントを表示する Spark UI

Spark Stream にフィードされている Kafka メッセージの数を表示するべきではないのに、なぜゼロと表示されているのか不思議です。

更新しました:

groupByKeyAndWindow() api を使用すると、この問題が発生するようです。コードからこの API の使用法をコメントアウトすると、Spark Streaming UI は Kafka イベントの入力サイズを正しく報告し始めました。

これはなぜですか?これは Spark Streaming の欠陥でしょうか?

Cloudera CDH: 5.5.1、Spark: 1.5.0、Kafka: KAFKA-0.8.2.0-1.kafka1.4.0.p0.56 を使用しています。

ここに画像の説明を入力

0 投票する
6 に答える
25821 参照

apache-spark - Kafka プロデューサー - org.apache.kafka.common.serialization.StringSerializer が見つかりませんでした

シンプルな Kafka Producer & Consumer を作成しました。kafka_2.11-0.9.0.0 を使用しています。これが私のプロデューサーコードです。

バンドルを開始しているときに、次のエラーに直面しています。

以下のように設定してみましkey.serializervalue.serializer

また、好きですが、それでも同じエラーが発生します。ここで私が間違っていることは何ですか。

0 投票する
1 に答える
317 参照

apache-spark - スパーク ストリーミング + カフカの互換性の問題

Spark ストリーミングは 0.8.2.1 より上のバージョンの kafka と互換性がありますか? カスタム レシーバーを作成するのは、spark ストリーミングで 0.9 より上のバージョンの kafka を使用する唯一のオプションですか?

0 投票する
2 に答える
5133 参照

java - Spark ストリーミング Kafka コンシューマー

Kafka トピックからメッセージを読み取る Spark Streaming シンプルなアプリをセットアップしようとしています。

多くの作業の後、私はこの段階にいますが、以下に示す例外があります。

コード:

スローするもの:

必死になって、Zookeeper に接続してみました。

しかし、それはスローします:

関連する依存関係は次のとおりです。

質問したいのですが:

Kafka ブローカーまたは Zookeeper サーバーに接続する必要がありますか?

着信メッセージに接続/リッスンできないためにコードで間違っていることは何ですか?