mallet を使用すると、特定の数のトピックとその単語を取得できます。トピック ワードが確率分布 (つまり、合計が 1) になるようにするにはどうすればよいですか?
たとえば、次のように実行すると、マレットによって与えられた出力を使用して、トピック 0 のトピック ワードの確率が 1 になるようにするにはどうすればよいですか?
mallet train-topics --input text.vectors --output-topic-keys topics.txt --output-doc-topics doc_comp.txt --topic-word-weights-file weights.txt --num-top-words 50 --word-topic-counts-file counts.txt --num-topics 3 --output-state topicstate.gz --alpha 1