java - 文章の遷移確率行列計算

Question

ドキュメントから抽出された文字列として保存されている文章があります。文に標準コサイン類似度を適用したい。どうすればそれを行うことができますか？

score 0 · Accepted Answer

まあ、あなたはすでにウィキペディアに式を持っています。それぞれがAi単語であるため、最初にドキュメント内の単語の頻度を計算する必要があります。単語の出現のマップを作成できる必要があります。次に、各文を単語のベクトルで表し、式を適用できます。

score 0 · Accepted Answer

テキストマイニングに興味がある場合は、SVDに進み、最後に潜在的意味分析に進みます。

2 に答える 2