algorithm - 増分ドキュメント類似性アルゴリズム

翻译自：https://stackoverflow.com/questions/18089364 2013-08-06T20:01:25.650

693 次

2

大規模で動的なテキストドキュメントのセット間の類似性を計算しようとしています。静的セットの場合、コサイン類似度 + tf-idf のようなものがうまく機能します。ただし、類似度セット全体を再計算せずに新しいドキュメントを追加できるスキームを探しています。そのようなアルゴリズムは存在しますか？

1 に答える 1