mahout lda を正常に実行し、コマンド mahout ldatopics を使用して出力を表示しました。
たとえば、私のトピックは科学とスポーツです。出力は次のようになります: トピック 0 バスケットボール、プレー、野球 トピック 1 研究、研究、哲学
私の質問は、個々の記事のグループまたはクラスターをどのように識別できるかです。追加するすべての新しい記事が特定のクラスター/トピックにグループ化または追加されるように、ID 番号または何らかの追跡がありますか。
クラスターを既に持っている場合、次のステップは何ですか?
ありがとう