何らかの関連性を持つ用語(キーワード エンティティ) をテキスト ドキュメントを介してリンクする方法。たとえば、Googleで人を検索すると、その人に関連する他の人のおすすめが表示されます。
この画像では、配偶者、大統領候補、同等の指名を計算しました
頻度カウント手法を使用しています。同じドキュメントに2 つの用語が出現するほど、それらが何らかの関係を持つ可能性が高くなります。しかし、これはまた、テキスト文書内のページマーク、動詞、ページ参照などの無関係な用語をリンクします。
どうすれば改善できますか?他に簡単だが信頼できる手法はありますか?