tmパッケージを使用してテキスト マイニングを実行しようとしています。そこでcorpus
、文字列ベクトルから を作成します。次に、 , を使用tolower
してすべての大文字を削除すると、エラーが発生します。
corpus <- Corpus(VectorSource(string_vector))
corpus <- tm_map(corpus, tolower) # Makes all words lower case
Error in mcfork() :
unable to fork, possible reason: Cannot allocate memory
コーパスの作成に使用している文字列ベクトルには 5621 行あり、最長の文字列は 4590 文字です。
を使用して、そのコマンドに不可欠ではないすべてのオブジェクトをメモリから削除しましたrm(list=ls())
。しかし、違いはありません。
32GBのRAMを搭載したサーバーで実行しています:
R version 3.0.2 (2013-09-25)
Platform: x86_64-pc-linux-gnu (64-bit)
どうすればこれを修正できますか、またはサーバーの強度が十分ではありませんか?