text2vec現在、パッケージから LDA を使用してトピック モデリングを行っています。私はなんとかdtmマトリックスを作成し、適用LDAしてそのfit_transformメソッドをn_topics=50.
各トピックのトップワードを見ていると、疑問が頭に浮かびました。その後、モデルを新しいデータに適用する予定であり、以前のモデルでは検出されなかった新しい単語が発生する可能性があります。モデルは、各単語をそれぞれのトピックに割り当てることができますか? さらに、これらの単語もトピックに追加されるので、 を使用してそれらを見つけることができますget_top_wordsか?
答えてくれてありがとう!