allWords
は 130 万語のベクトルで、多少の繰り返しがあります。私がやりたいことは、2 つのベクトルを作成することです。
Aという言葉で
単語の出現を伴うB
後でそれらをマトリックスに結合して、次のように関連付けることができるように: "mom", 3 ; 「鉛筆」、14など
for(word in allWords){
#get a vector with indexes for all repetitions of a word
temp <- which(allWords==word)
#Make "allWords" smaller - remove duplicates
allWords= allWords[-which(allWords==word)]
#Calculate occurance
occ<-length(temp)
#store
A = c(A,word)
B = c(B,occ)
}
この for ループには永遠に時間がかかり、なぜ、または何が間違っているのか本当にわかりません。ファイルから 130 万ワードを読み取るのは 5 秒ほどの速さですが、これらの基本的な操作を実行しても、アルゴリズムが終了することはありません。