問題タブ [apache-flink]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
866 参照

xml - Apache Flink の XmlInputFormat

Mahout の XmlInputFormatに似たものがありますが、Flink 用ですか?

大きな XML ファイルがあり、特定の要素を抽出したいと考えています。私の場合、それはウィキペディアのダンプであり、すべての<page>タグを取得する必要があります。

つまり、ファイルがある場合

<page>...</page>マッパーで使用する3 つのレコードすべてを取得したいと考えています。理想的には、xpath クエリ/mediawiki/pageが返す有効な XML である必要があります。

0 投票する
1 に答える
3343 参照

scala-ide - Flink Scala API "not enough arguments"

I'm having troubles using Apache Flink Scala API

For example, even when I take the examples from the official documentation, the scala compiler gives me tons of compilation errors.

Code:

Scala IDE outputs the following for the line val text = env.fromElements

It's not just fromElements method: even if I read from a file and then try to do something as simple as ds.map(r => r), I get something very similar

I tried two versions of Flink: 0.8.1 from Maven Central and the most fresh one from the github repository.

I'm running Windows 7, scala 2.10.4, jdk 1.7.0_25, Scala IDE version is 3.0.3-20140327-1716-Typesafe on top of Eclipse 4.3.0

What am I doing wrong?

0 投票する
1 に答える
1477 参照

apache-flink - ジェネリック パラメーターの Flink Scala API 関数

これは、 Flink Scala API の「十分な引数がありません」に関するフォローアップの質問です。

DataSetFlink の を渡して何かを実行できるようにしたいのですが、データセットへのパラメーターは一般的です。

これが私が今抱えている問題です:

私はこのエラーがありますds.map(r => r):

もちろん、idここに示した機能は一例であり、もっと複雑なことができるようにしたいと考えています。

どうすれば解決できますか?

0 投票する
1 に答える
1565 参照

apache-spark - 大規模データ処理エンジンによる構造化および非構造化データの統合

Spark や apache flink などのデータ処理エンジンは、構造化データ、半構造化データ、非構造化データを統合し、計算にどのように影響を与えるのでしょうか?