1

単語間の類似度を計算するときにLSAがどのように機能するかを理解しました。ウェブサイトlsa.colorado.eduのLSAを使用していますが、文または複数の単語間の類似性がどのように計算されるかについてのソースが見つかりません。それは、すべてのペアごとの類似性を平均することによって行われるだけですか?

4

2 に答える 2

1

単語ベクトルを合計し、最終的な合計を文ベクトルとして返すだけで、単語ベクトルを組み合わせることができます。これらの表現は単語表現と同じ型であるため、既存の方法を使用して意味的類似性を簡単に計算できます。

次に、意味的類似性を計算するために、これらのベクトル間のコサイン値を使用できます。

現在、S-Spaceライブラリを使用しており、このタスクを実行するDocumentVectorBuilderクラスがあります。

于 2013-07-22T02:23:16.030 に答える