5

短い説明テキストに対するキーワードの関連性を計算したいと考えています。効率性と実装の容易さの点で最良のアプローチは何でしょうか。C++ を使用していますか?

4

2 に答える 2

6

簡単な解決策: テキスト内の単語の出現回数を数えます。

しかし、良い仕事をすることは、Google のような企業が何年も取り組んできた難しい問題です。可能であれば、彼らの技術を使用して見てみたいかもしれません

展開するには、次のことを試してください。

  • 辞書を使用します (例: WordNetを使用して、すべての同義語を一般的な単語に置き換えます)。
  • レーベンシュタイン距離を使用して類似単語を検出する

それはまだあなたをここまで得るだけです。キーワードを同じ回数だけ含む複数のテキストを区別するには、説明の内容を正確に理解するために、自然言語処理を実行する必要があります。

于 2010-12-28T13:07:58.343 に答える
3

これらの以前の Stack Overflow の質問を参照してください。

于 2010-12-28T13:07:33.160 に答える