ここで定義されているバイナリ文字列は、固定サイズのビットの「配列」です。それらには順序がないため(数字としてソート/インデックス付けすることは意味がありません)、各ビットは他のビットから独立しているため、文字列と呼びます。このような文字列はそれぞれ N ビットの長さで、N は数百にのぼります。
これらの文字列を保存し、ハミング距離を距離メトリックとして使用して、最近傍の新しいバイナリ文字列クエリを指定する必要があります。
メトリック ベースの検索 (VP ツリー、カバー ツリー、M ツリー) 用の特殊なデータ構造 (メトリック ツリー) がありますが、通常のデータベース (私の場合は MongoDB) を使用する必要があります。
1 対 1 のハミング距離一致を実行する前に、DB がレコードのサブセットのみにアクセスできるようにするバイナリ文字列に適用できるインデックス作成機能はありますか? あるいは、標準の DB でそのようなハミング ベースの検索を実装するにはどうすればよいでしょうか?