いくつかの数値 (または文字列) のグループ化の 2 つのセットがあります。各グループには何らかの ID (番号) があり、同じグループが 2 つのグループで異なる ID を持つ場合があります。私はこれら 2 つのグループ化である種の diff を実行したいと考えており、そのようなアルゴリズムを使用できるかどうか疑問に思っています :) 利用可能な map reduce 実装があれば、さらに良くなります。
私の用語が理解しやすいかどうかわからないので、明確にするためにいくつかの例を次に示します。1、2、3、4、5 の 5 つの数があるとします。
グループ化 (1) には、次の 2 つのグループがあります。
-
グループ 1 には 1 と 2があります。
グループ 2 には 3、4、5 があります。
グループ化 (2) には、次の 3 つのグループがあります。
-
グループ 1 には 3 と 4 があります。
グループ 2 には 1 と 2 があります。
グループ 3 には 5 があります。
次に、差分ツールは、グループ化 (1) からのグループ 1 とグループ化 (2) からのグループ 2 が同じであり、グループ化 (1) からのグループ 2 の要素 5 がグループ化 (2) などで新しいグループとして分割されたことを認識する必要があります。それ。