何かについて 1 つの質問があります。R 言語でトピック モデリング - LDA を適用しています。これを使用して、ユーザーのツイートのトピックを決定しました。このコマンドを使用してツイートを取得しているときに、何かに気づきました (最後の 500 ツイートリツイートなし) あるときは 500 になり、あるときは 130 になり、あるときは別のユーザーで 45 になりましたが、同じ n=500 で、その背後にある要因は何ですか?
tweets <- userTimeline("BarackObama",n=500,includeRts = FALSE)
また、ツイートからユーザーの名前を削除したい場合、トピックのクラスタリングの精度が良くないことに気付いたので、R でそれを行う方法がわかりません。R でこのことの精度のパーセンテージを測定する方法がわかりません。TwitterR がアラビア語のツイートをサポートしているかどうかについての最後の質問です。
ありがとう。