Whoosh を使用してドキュメントの類似度を取得するにはどうすればよいですか?
ドキュメントとの類似性が高い、以前に索引付けされた他のドキュメントをランク付けする「関連」機能を作成したいと考えています。
ドキュメントを長いクエリ文字列として入力しますか? ドキュメントをインデックスに追加し、そこから何らかの方法で類似クエリの結果を抽出しますか?
ありがとう
Whoosh サーチャー クラスには、「more_like()」というメソッドがあります。
これにより、索引付けされた文書を他の索引付けされた文書と比較して索引付けし、指定された文書に類似した文書のリストを返すことができます。
クラス whoosh.searching.Hitはランクとスコアを与えることができます。