2

大規模で動的なテキスト ドキュメントのセット間の類似性を計算しようとしています。静的セットの場合、コサイン類似度 + tf-idf のようなものがうまく機能します。ただし、類似度セット全体を再計算せずに新しいドキュメントを追加できるスキームを探しています。そのようなアルゴリズムは存在しますか?

4

1 に答える 1