2 つまたは 3 つの大規模な (そして成長している) 文字列リスト データベースを効率的に同期するためのデータ構造を作成しようとしています。実装する必要があるデータ構造の仕様はわかっていますが、何が適合するかわかりません。私は次のように言われました:
1: いくつかの同一のページを交換できる可能性はありますが、同一でないページを交換するのを絶対に見逃すべきではありません (したがって、偽陰性は問題ありませんが、偽陽性は問題ありません)。
2: 解決策には、固定された少量のデータを交換し、その情報を使用して同一でない結果ページを同期する必要があります。
3: 2 つのステップで比較してから同期するのではなく、1 つの通信ステップで同期する必要があります。
最初は固定サイズが小さいという理由でブルームフィルターを考えましたが、これは場合によっては送信されるべきクエリを送信しないため、私が望むものとは逆のように思えます。代わりにキャッシュを行った場合、誤検知なしで機能する可能性がありますが、固定サイズにはなりません。
1と2の両方の条件に当てはまるものはありますか??