0

この質問は新しいものではなく、ここここで何らかの説明を見てきました。どちらの方法も、クエリ 1 とクエリ 2 の項に対して N グラム (主にバイグラム) の計算を実行し、コサインの類似性を見つけることを説明していました。

私が理解していることに基づいて明確にすることを望んでいました:

クエリ 1 とクエリ 2 のすべてのバイグラムの TF-IDF スコアを取得し、そのスコアを使用してコサイン類似度スコアを計算する必要があります。もしそうなら、より明確な説明のために誰かが親切に簡単なpythonコードを書くことができますか?

4

0 に答える 0