ドキュメントから抽出された文字列として保存されている文章があります。文に標準コサイン類似度を適用したい。どうすればそれを行うことができますか?
2 に答える
0
まあ、あなたはすでにウィキペディアに式を持っています。それぞれがAi
単語であるため、最初にドキュメント内の単語の頻度を計算する必要があります。単語の出現のマップを作成できる必要があります。次に、各文を単語のベクトルで表し、式を適用できます。
于 2012-02-06T11:10:52.670 に答える
0
まず、Term-Document マトリックスについて読んでください。
テキスト マイニングに興味がある場合は、SVDに進み、最後に潜在的意味分析に進みます。
于 2012-02-07T05:31:16.220 に答える