クエリが何百万行も返す場合、JdbcIO がクエリを並列に実行する方法を知りたいです。https://issues.apache.org/jira/browse/BEAM-2803および関連するプル リクエストを参照しました。私はそれを完全に理解できませんでした。
ReadAll
expand
メソッドは を使用しParDo
ます。したがって、データを並行して読み取るために、データベースへの複数の接続を作成しますか? データソース内の DB に作成できる接続の数を制限すると、接続制限に固執しますか?
でこれがどのように処理されるかを理解するのを手伝ってもらえますJdbcIO
か? 私は使っている2.2.0
アップデート :
.apply(
ParDo.of(
new ReadFn<>(
getDataSourceConfiguration(),
getQuery(),
getParameterSetter(),
getRowMapper())))
上記のコードは、ReadFn が ParDo に適用されることを示しています。ReadFn は並行して実行されると思います。私の仮定が正しければ、readAll()
一度に限られた数の接続しか確立できない DB から読み取るメソッドをどのように使用すればよいでしょうか?
ありがとうバル