問題タブ [apache-flink]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - Apache Flink の XmlInputFormat
Mahout の XmlInputFormatに似たものがありますが、Flink 用ですか?
大きな XML ファイルがあり、特定の要素を抽出したいと考えています。私の場合、それはウィキペディアのダンプであり、すべての<page>
タグを取得する必要があります。
つまり、ファイルがある場合
<page>...</page>
マッパーで使用する3 つのレコードすべてを取得したいと考えています。理想的には、xpath クエリ/mediawiki/page
が返す有効な XML である必要があります。
scala-ide - Flink Scala API "not enough arguments"
I'm having troubles using Apache Flink Scala API
For example, even when I take the examples from the official documentation, the scala compiler gives me tons of compilation errors.
Code:
Scala IDE outputs the following for the line val text = env.fromElements
It's not just fromElements
method: even if I read from a file and then try to do something as simple as ds.map(r => r)
, I get something very similar
I tried two versions of Flink: 0.8.1 from Maven Central and the most fresh one from the github repository.
I'm running Windows 7, scala 2.10.4, jdk 1.7.0_25, Scala IDE version is 3.0.3-20140327-1716-Typesafe on top of Eclipse 4.3.0
What am I doing wrong?
apache-flink - ジェネリック パラメーターの Flink Scala API 関数
これは、 Flink Scala API の「十分な引数がありません」に関するフォローアップの質問です。
DataSet
Flink の を渡して何かを実行できるようにしたいのですが、データセットへのパラメーターは一般的です。
これが私が今抱えている問題です:
私はこのエラーがありますds.map(r => r)
:
もちろん、id
ここに示した機能は一例であり、もっと複雑なことができるようにしたいと考えています。
どうすれば解決できますか?
apache-spark - 大規模データ処理エンジンによる構造化および非構造化データの統合
Spark や apache flink などのデータ処理エンジンは、構造化データ、半構造化データ、非構造化データを統合し、計算にどのように影響を与えるのでしょうか?