Apache Flink に一種のウィンドウ関数を実装しようとしています。たとえば、要素 1 ~ 5 を取得して何かを行いたいとします。その後、要素 6 ~ 10 を取得したいとします。
現在、データが CSV ファイルによって導出されるデータセットがあります。
DataSet<Tuple2<Double, Double>> csvInput = env
.readCsvFile(csvpath)
.includeFields(usedFields)
.types(Double.class, Double.class);
ここで、このデータセットの最初の 5 つの要素を含むサブセットが必要です。-関数でこれを行うことができるかもしれませんfirst
:
DataSet<Tuple2<Double, Double>> subset1 = csvInput.first(5);
しかし、次の 5 つの要素を取得するにはどうすればよいでしょうか。私が使用できる関数のような関数はありstartAt
ますか?たとえば、次のようなものです。
DataSet<Tuple2<Double, Double>> subset2 = csvInput.first(5).startAt(6);
Apache Flink Java API には何も見つかりませんでした。これをアーカイブする最良の方法は何ですか?