問題タブ [apache-flink]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

6165 問題

0 投票する

1 に答える

968 参照

apache-kafka - flink: kafka から byte[] データを取得する

flink-1.0-SNAPSHOTを使用して、カフカからのデータを消費しています。データは、後で使用するために thrift に渡されるSnappy 圧縮byte[] として入ってきます。

flinkを使用してデータを取得すると、データが破損または誤って処理され、解凍できなくなります。コードはこのサンプルから派生したもので、次のとおりです。

isValidCompressedBufferは毎回 false を返します。

データは、他の方法で消費された場合に良好であることが知られています。

私は何を取りこぼしたか？

解決：

を使用した例が見つからなかったので、これを投稿しますRawSchema。

2015-10-26T23:49:38.623

0 投票する

2 に答える

1185 参照

apache-flink - Apache Flink DataStream API には mapPartition 変換がありません

Spark DStream にはmapPartitionAPI がありますが、Flink DataStreamAPI にはありません。理由を説明できる人はいますか。私がやりたいことはreduceByKey、Flink で Spark に似た API を実装することです。

apache-flink

2015-10-28T20:47:33.703

0 投票する

1 に答える

966 参照

java - Flink Streaming java.lang.Exception: タスクの呼び出し可能なクラスをロードできませんでした

基本的な Flink ストリーミングジョブ (Java で) をローカルで実行しようとしています。Eclipse を使用してアプリケーションを実行すると、魅力的に機能します。しかし、Flink コマンドラインインターフェイスを使用して実行すると、次の例外が発生します。

Flink-Kafka 統合の例を data- artisans で実行しています。

java streaming apache-flink flink-streaming

2015-10-29T15:40:35.067

0 投票する

1 に答える

790 参照

java - Apache Flink fromCollection java.lang.IllegalStateException: 未読のブロックデータ

Scala と Flink 1.0-SNAPSHOT を使用して DataSet で leftOuterJoin を実行すると、次の例外が発生します。

DataSet の型として単純な Scala ケースクラスを使用します。

ケースクラスのインスタンスを生成するには、次のメソッドを使用します。

環境を初期化し、次の方法で DataSet[RawValue] を作成します。

シリアル化の問題がエラーの原因であると思われます。プロジェクトをコンパイルするために Scala 2.10.5 および Java 7 システムライブラリを使用しています。私は Eclipse を使用しています。プロジェクトは、サンプルプロジェクト生成スクリプトによって生成されました。

問題を解決するための助けやヒントをいただければ幸いです:-) ありがとう、ダニエル

java scala serialization apache-flink

2015-10-30T11:22:29.727

0 投票する

1 に答える

608 参照

perf - Flinks 実行プロセスの PID を調べる方法は?

パフォーマンスカウンター (perf) を使用して flinks のパフォーマンスを測定したいと考えています。私のコード:

ジョブマネージャーの PID はわかっています。また、実行中に execute() コマンドを実行するスレッド (CHAIN DataSource) の TID を確認できます。ただし、実行ごとに TID が変更されるため、TID では機能しません。execute() コマンドを実行する jobmanagers 子プロセスの PID を把握する方法はありますか? また、rdd の変換 (flatMap など) ごとに異なる子プロセスがありますか? もしそうなら、それらの個別の PID を見つけることは可能ですか?

perf apache-flink

2015-10-30T16:15:59.940

1 2 3 4 5 6 7 8 9 10

問題タブ [apache-flink]

apache-kafka - flink: kafka から byte[] データを取得する

解決：

apache-flink - Apache Flink DataStream API には mapPartition 変換がありません

java - Flink Streaming java.lang.Exception: タスクの呼び出し可能なクラスをロードできませんでした

java - Apache Flink fromCollection java.lang.IllegalStateException: 未読のブロック データ

perf - Flinks 実行プロセスの PID を調べる方法は?

Reference

java - Apache Flink fromCollection java.lang.IllegalStateException: 未読のブロックデータ