Dataflow でユニオン操作を実行しようとしています。Dataflow で 2 つの PCollection を結合するためのサンプル コードはありますか?
1803 次
2 に答える
10
これを行う簡単な方法は、Flatten() と RemoveDuplicates() をこのように組み合わせることです。互いに素な和集合または集合論的和集合が必要かどうかに応じて、RemoveDuplicates 呼び出しを省略できます。
PCollection<String> pc1 = ...;
PCollection<String> pc2 = ...;
PCollection<String> union = PCollectionList.of(pc1).and(pc2)
.apply(Flatten.<String>pCollections())
.apply(RemoveDuplicates.<String>create());
于 2015-02-12T20:11:56.730 に答える