トピックの曖昧さの解消と割り当てのために潜在的なディリクレ割り当てを試しており、アドバイスを求めています。
- どのプログラムが「最良」であるか、最も使いやすい、最良の事前推定、高速の組み合わせ
- 話題性についての直感をどのように取り入れるか。同じ著者によるすべての記事のように、コーパス内のいくつかのアイテムが実際には同じカテゴリにあることを知っているとしましょう。それを分析に追加できますか?
- 乗船する前に知っておくべき予期しない落とし穴やヒントはありますか?
どのようなプログラムでも R または Python のフロント エンドがあればいいのですが、C を扱うことになると思います (そして受け入れます)。