数十億の小さなドキュメント (〜 200 文字/ドキュメント) で構成される大規模なデータセットがあります。位置クエリを実行して最良の 3 つのドキュメントのみを取得する最も効率的な方法は何ですか?
私の考えは、位置インデックスを作成してデータセット全体に対してそのようなクエリを実行するのではなく、単純なブールクエリの結果を使用してオンザフライで位置インデックスを構築し、次に位置クエリを実行して、私が見つけた最良の 3 つのドキュメントを取得することです。必要。
したがって、代わりに: 数十億のドキュメント -> ポジティナル インデックスの構築 -> 位置クエリの実行 -> 最適な 3 つのドキュメントの取得
私は次のことをしたいと思います: 何十億ものドキュメント -> 通常のインデックスを構築します -> ブールクエリを実行します -> 最良の 250 (高い数値) を取得します -> 結果を使用して RAM 位置インデックスを構築します -> 位置クエリを実行します - > ベスト 3 のドキュメントを取得します。
そうすることで、わずかな概算を支払うことで検索時間を短縮できると思います。それを行うための他の/より良い解決策はありますか?