正直なところ、私は LDA に詳しくありませんが、プロジェクトの 1 つで MALLET のトピック モデリングを使用する必要があります。
私の質問は: トピック モデルのトレーニング データとして特定のタイムスタンプ内の一連のドキュメントが与えられた場合、ドキュメント + または - トレーニング データのタイムスタンプについて、トピックの傾向を追跡するために (推論を使用して) モデルを使用することはどの程度適切ですか? . つまり、MALLET が提供するトピックの分布は、モデル構築段階で分析が必要なデータセットのサブセットのみを提供する場合、トピックの人気を経時的に追跡するための適切なメトリックであるかということです。
ありがとう。