4

[タイトル]フィールドからタブで移動したときに、StackOverflowと同様に、関連する[things/questions]をアプリで取得したいと思います。

私はそれを行うための唯一の方法を考えることができます、それは私が十分に速いかもしれないと思います

  1. すべての[things]のタイトルのコーパスでタイトルを検索し、最初のx個の一致を返します。サイト検索に使用されている検索を使用できます。

これを行う他の方法は何ですか。これはタブアウトで送信されるため、十分に高速であるため、大規模なサーバー側の処理は実行できません。

私はこれを行う方法を探していますが、mysqlとDJangoを使用しているので、あなたの答えがそれを使用しているのであれば、なおさらです。

[良いタグが思いつかないので、お気軽に編集してください]

4

1 に答える 1

1

コンテンツ ベースのレコメンデーション アルゴリズムを見ています。AFAICT StackOverflow はタグとタイトルの単語を見て、これらのいくつかを共有する質問を見つけます。これは、ドキュメントがTF-IDF ベクトルとして表される空間での最近傍検索として実装できます。

実装に関しては、ステミング、ストップワード、非厳密一致、および tf-idf 重みをサポートする任意の Django 検索エンジンを使用してください。アルゴリズムの複雑さは高くない (数回のインデックス ルックアップのみ) ため、Python で記述されているかどうかは問題ではありません。

必要な処理を行う検索エンジンが見つからない場合は、ステミングとストップワードを検索エンジンに任せ、個々の単語で検索エンジンを呼び出し、同様のタグを優先するスコアで独自の tf-idf スコアリングを行います。

于 2010-01-10T13:50:59.947 に答える