0

トピック モデリングに Mallet を使用しています。入力テキスト内の大量の単語には、文字と数字の両方が含まれています。例: A54、D892。Mallet が自動的に数字を削除し、単語の文字だけを保持していることに気付きました。テキスト ファイルをインポートするときは、 --remove-stopwords オプションも使用しません。この問題を解決する方法を知っている人はいますか。

4

1 に答える 1