短い説明テキストに対するキーワードの関連性を計算したいと考えています。効率性と実装の容易さの点で最良のアプローチは何でしょうか。C++ を使用していますか?
2452 次
2 に答える
6
簡単な解決策: テキスト内の単語の出現回数を数えます。
しかし、良い仕事をすることは、Google のような企業が何年も取り組んできた難しい問題です。可能であれば、彼らの技術を使用して見てみたいかもしれません
展開するには、次のことを試してください。
- 辞書を使用します (例: WordNetを使用して、すべての同義語を一般的な単語に置き換えます)。
- レーベンシュタイン距離を使用して類似単語を検出する
それはまだあなたをここまで得るだけです。キーワードを同じ回数だけ含む複数のテキストを区別するには、説明の内容を正確に理解するために、自然言語処理を実行する必要があります。
于 2010-12-28T13:07:58.343 に答える
3
これらの以前の Stack Overflow の質問を参照してください。
于 2010-12-28T13:07:33.160 に答える