問題タブ [apache-flink]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

6165 問題

0 投票する

1 に答える

730 参照

scala - カスタムオブジェクト配列でデータセットを使用する場合の Flink での NoSuchMethod 例外

Flink に問題がある

問題のある行はこれです

FlinkRegionType私はのArrayカスタムオブジェクトを持っています

IDE で maven プラグインを使用してアプリを開発しましたが、すべて正常に動作していますが、Web サイトからダウンロードしたバージョンに移行すると、上記のエラーが発生します

Flink 0.9 を使用しています

一部のライブラリが欠落しているのではないかと考えていましたが、すべてを処理するために maven を使用しています。さらに、 ObjectArrayTypeInfo.javaのコードを実行しても問題はないようです

2015-05-08T09:18:54.497

0 投票する

1 に答える

1088 参照

apache-flink - Flink では、ストリームウィンドウが機能していないように見えますか?

ストリームの使用法を表示する Flink の例を拡張しようとしました。私の目標は、ウィンドウ機能を使用することです (window関数呼び出しを参照)。以下のコードは、ストリームの最後の 3 つの数値の合計を出力すると仮定します。（ubuntuのおかげでストリームが開かれますnc -lk 9999）実際、出力は入力されたすべての数値を合計します。タイムウィンドウに切り替えても、同じ結果が生成されます。つまり、ウィンドウ処理は行われません。

それはバグですか？(使用バージョン: github の最新マスター)

apache-flink

2015-05-26T14:44:42.423

0 投票する

1 に答える

1339 参照

apache-flink - Flink は、distinct() でどのような魔法を使用しますか? 代理キーはどのように生成されますか?

代理キーの生成に関しては、最初のステップは個別のキーを取得してから、タプルごとに増分キーを作成することです。

したがって、Java Set を使用して個別の要素を取得すると、ヒープ領域が不足します。次に、Flink の distinct() を使用すると、完全に機能します。

この違いは何ですか？

別の関連する質問は、Flink はマッパーで代理キーを生成できますか?

apache-flink

2015-05-29T09:38:29.553

0 投票する

3 に答える

2822 参照

scala - Apache Flink で入力ファイルからオブジェクトを作成する

フォルダーとファイルで構成されたデータセットがあります。フォルダー/ファイル構造自体は、データ分析にとって重要です。

データセットの構造:

すべてのファイルには、1 つのオブジェクトを記述するデータが含まれています。ファイルの形式は一貫しています。基本的に、2 つの列を持つ csv ファイルです。2 つの列は、結果のオブジェクトで一連のタプルとして表される必要があります。

ファイルのサイズはかなり小さいです。20kbまでです。各フォルダには約 200 個のファイルが含まれています。

目的の出力オブジェクトは次のようになります。

Scala でこのデータセットの読み取りを処理するにはどうすればよいですか?

scala apache-flink

2015-06-02T14:57:19.437

0 投票する

1 に答える

441 参照

java - YARN での Spark Submit と Flink の HDFS パス

私はcloudera live vmで作業しています。そこには、hadoopとspralのスタンドアロンクラスターがあります。今度は、spark submit および flink run スクリプトを使用してジョブを送信します。これも機能します。しかし、私のアプリは hdfs で入力ファイルと出力ファイルへのパスを見つけることができます。私はパスを次のように設定します: hdfs://127.0.0.1:50010/user/cloudera/outputs から取得したポートからの情報: ここに画像の説明を入力

javaでhdfsのパスを設定するには??

敬具、ポール

java hadoop apache-spark hdfs apache-flink

2015-06-05T13:47:32.253

1 2 3 4 5 6 7 8 9 10

問題タブ [apache-flink]

scala - カスタム オブジェクト配列でデータセットを使用する場合の Flink での NoSuchMethod 例外

apache-flink - Flink では、ストリーム ウィンドウが機能していないように見えますか?

apache-flink - Flink は、distinct() でどのような魔法を使用しますか? 代理キーはどのように生成されますか?

scala - Apache Flink で入力ファイルからオブジェクトを作成する

java - YARN での Spark Submit と Flink の HDFS パス

Reference

scala - カスタムオブジェクト配列でデータセットを使用する場合の Flink での NoSuchMethod 例外

apache-flink - Flink では、ストリームウィンドウが機能していないように見えますか?