私は約 10,000 の記事を含む MySQL データベースを持っていますが、その数はおそらく時間とともに増加するでしょう。これらの記事を検索して、いくつかのキーワードに基づいて最も関連性の高い結果を引き出すことができるようにしたいと考えています。基本的にこれを行うことができる、プラグインできるプロジェクトがたくさんあることを私は知っています。ただし、このアプリケーションは非常に単純であり、全体がどのように動作するかを直接制御し、実用的な知識を持っていると便利です。したがって、Python で非常に単純な検索エンジンをゼロから構築することを検討したいと思います。
本当にどこから始めればよいかさえわかりません。MySQL DB からすべてをリストにダンプし、関連性に基づいてそのリストをソートしようとすることもできますが、データベース項目の量が増えるにつれて遅くなり、遅くなるようです。基本的な MySQL 検索を使用して、MySQL の考えから最も関連性の高い上位 100 件の結果を取得し、それらの 100 件を並べ替えることができます。範囲の。
これに対して私が取ることができる最善のアプローチは何ですか?