タイトルの大きなリストを検索する必要があるアプリに取り組んでいます。理想的には NoSQL を使用したいのですが、データベース全体でのテキスト検索は SQL データベースほど良くないようです (間違っている場合は修正してください)。
いずれにせよ、検索速度を最適化したいのです。通常の検索でも十分速いかもしれませんが、レスポンシブなライブ検索とファジー検索が必要です。したがって、私は2つのアプローチしか考えられません:
タイトルのリスト全体をメモリにロードし、トライまたはプレフィックス ツリーとしてインデックスを作成します
mapreduce 関数を使用して、ある種のトライ アルゴリズムを実装します。これは好ましい解決策ですが、実行できるかどうか、またはディスク容量のコストが利点を上回る可能性があるかどうかはわかりません.
何か案は?また、「あいまい検索」がトライと B+ ツリーのどちらで実装するのが最適かはわかりません。
「タイトル」がユニークなので。完全なタイトルを ID として使用する必要がありますか?