6

Dataflow でユニオン操作を実行しようとしています。Dataflow で 2 つの PCollection を結合するためのサンプル コードはありますか?

4

2 に答える 2

10

これを行う簡単な方法は、Flatten() と RemoveDuplicates() をこのように組み合わせることです。互いに素な和集合または集合論的和集合が必要かどうかに応じて、RemoveDuplicates 呼び出しを省略できます。

PCollection<String> pc1 = ...;
PCollection<String> pc2 = ...;
PCollection<String> union = PCollectionList.of(pc1).and(pc2)
  .apply(Flatten.<String>pCollections())
  .apply(RemoveDuplicates.<String>create());
于 2015-02-12T20:11:56.730 に答える