潜在的ディリクレ配分 (LDA) とドキュメント クラスタリングの一般的なタスクとの関係を明らかにしたいと思います。
LDA 分析は、各ドキュメントのトピックの比率を出力する傾向があります。私の理解が正しければ、これはドキュメント クラスタリングの直接の結果ではありません。ただし、この確率比率を各ドキュメントの特徴表現として扱うことができます。その後、LDA 分析によって生成された機能構成に基づいて、他の確立されたクラスタリング方法を呼び出すことができます。
私の理解は正しいですか?ありがとう。