私は SimpleConsumer を使用しており、spark を使用してメッセージ サイズ (バイト) をプルしようとしています。
メタデータ リクエストを使用して最も古いオフセットと最新のオフセットを取得できますが、kafka (0.8.0) でバイト数を取得する方法がわかりません。
十分なデータをチェックしたいので、アクションを実行するためにsparkジョブ(ストリーミングではなく)のみを実行するため、フェッチリクエストを使用したくありません。
私は SimpleConsumer を使用しており、spark を使用してメッセージ サイズ (バイト) をプルしようとしています。
メタデータ リクエストを使用して最も古いオフセットと最新のオフセットを取得できますが、kafka (0.8.0) でバイト数を取得する方法がわかりません。
十分なデータをチェックしたいので、アクションを実行するためにsparkジョブ(ストリーミングではなく)のみを実行するため、フェッチリクエストを使用したくありません。