問題タブ [spark-streaming-kafka]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2952 参照

scala - スパーク ストリーミング + カフカ - スパーク セッション API

spark 2.0.2 を使用して Spark ストリーミング プログラムを実行するための支援に感謝します。

での実行エラー"java.lang.ClassNotFoundException: Failed to find data source: kafka"。POM ファイルを次のように変更します。

Spark は作成されていますが、kafka からのロードが呼び出されるとエラーが発生します。

作成されたスパーク セッション:

カフカ ストリーミングの作成:

エラーメッセージ:

POM.XML:

0 投票する
2 に答える
1897 参照

apache-spark - java.lang.NoClassDefFoundError: kafka/serializer/StringDecoder 例外の取得 Spark ストリーミングからの kafka のストリーミング中

Spark ストリーミング アプリケーションから kafka ストリーミング データを読み込もうとしています。データの読み取り中に、次の例外が発生します。

16/12/24 11:09:05 情報 storage.BlockManagerMaster: BlockManager を登録しました

ここに私のバージョン情報があります:

火花: 1.6.2

カフカ: 0.8.2

ここに pom.xml があります:

0 投票する
1 に答える
386 参照

python - Spark ストリーミングと kafka の統合

Pythonでプログラムされたプロジェクトにkafkaとsparkストリーミングを使用しています。kafka プロデューサーからストリーミング プログラムにデータを送信したいと考えています。依存関係を指定して次のコマンドを実行すると、スムーズに動作します。

./spark-submit --packages org.apache.spark:spark-streaming-kafka-0-8_2.11:2.1.0 ./kafkastreaming.py

依存関係を指定してストリーミング コードを直接実行する方法はありますか (つまり、spark-submit を使用せずに、または spark-submit を使用して依存関係を指定せずに)。

sparkのconfディレクトリにあるspark-defaults.confで依存関係を指定してみました。指定された依存関係は、1.org.apache.spark:spark-streaming-kafka-0-8_2.11:2.1.0 2.org.apache.spark:spark-streaming-kafka-0-8-assembly:2.1. 1

注 - https://spark.apache.org/docs/latest/streaming-programming-guide.htmlから netcat を使用して Spark ストリーミング ガイドを参照しました が、spark-submit コマンドを使用せずに機能したため、できるかどうか知りたいです。カフカとスパークストリーミングと同じです。