ドキュメントの 2 つのグループ (たとえば、1 つのグループに 1000 個のドキュメントがある場合) を比較し、2 番目のグループのどのドキュメントが最初のグループの特定のドキュメントに最も類似しているかを判断する必要があります。これまでのところ、TF/IDF とコサイン類似度を使用しましたが、TF/IDF のようなより高速で正確なものが必要です :) より高速なアルゴリズムまたは TF/IDF 時間の改善を提案してもらえますか?
質問する
1806 次