ツイートでテキスト分析を行い、DR に LSA() を使用しようとしています。ただし、lsa スペースの計算は非常にメモリを集中的に使用するようです。最大 2.3k のツイートしか処理できません。そうしないと、コンピューターが死んでしまいます。
並列処理に関するオンライン リソースを調べたところ、私のコンピューターは 4 コアですが、R の既定の設定であるため、そのうちの 1 つしか使用しないことがわかりました。非常に役立つこの投稿も読みました。 、しかし、並列処理しかできないようです:
- apply() ファミリで使用できる関数について
- forループを置き換える
lsa() の並列処理を使用しようとしています。これが私の1行のコードです:
lsa.train = lsa(tdm.train, dimcalc_share())
ここで、tdm.trainは用語を行、ドキュメントを列とする TermDocumentMatrix です。
私の質問は:
lsa() のこのコード行を変更して、順次形式ではなく並列形式で処理するにはどうすればよいですか? 1 コアのみではなく n コアを使用するようにします。ここで、n はユーザー (私) によって定義されたコアの数です。