1

2 つのデータ ソースがあり、どちらも JSON を返します。

2 つの JSON を照合して 1 つのレコードに格納するために、2 つの JSON に一定の割合の一致 (場合によってはデータの重複) があることを確認したいと考えています。

2 つの文字列のエントロピーを比較するのが最善の方法ですか? 他の解決策はありますか?私はJavaを使用していますが、同じためにscalaを使用することもできます.

4

1 に答える 1

2

それらを xml に変換してからxdiffアルゴリズムを使用するか、すべての json レコードを 1 行にまとめて unix を使用できますdiff。または、内部ツリー表現に変換し、並列ツリー差分アルゴリズムを適用します。それはあなたが探している違いの種類に依存し、実装言語には依存しません。

于 2011-03-23T09:15:13.390 に答える