ドキュメント間の TF-IDF を計算するために、この質問 ( 2 つのテキスト ドキュメント間の類似性) に対する最も支持された回答で与えられたコードを使用しています。ただし、カスタム値min_df
(コード内で 1) を指定せずにコードを実行すると、2 つのドキュメントが完全に異なる (共通の単語が含まれていないなど) 場合、TF-IDF を受信する代わりに、値が 0 の場合、次のエラーが発生します。
ValueError: empty vocabulary; training set may have contained only stop words or min_df (resp. max_df) may be too high (resp. too low).
このエラーを取り除く方法を教えてもらえますか?