そのため、フレームの特定の列に特定の単語が含まれているかどうかに基づいて、データ フレームにアタッチするダミー変数を作成しようとしています。列は次のようになります。
dumcol = c("good night moon", "good night room", "good morning room", "hello moon")
そして、各行に含まれる単語に基づいてダミー変数を作成します。たとえば、最初の行には"good", "night",
andが含まれますが、 orは含まれ"moon"
ません。"room", "morning"
"hello"
私がこれまで行ってきた方法は、非常に原始的な方法で、適切なサイズの 0 値の行列を作成し、次のように for ループを使用することです。
result=matrix(ncol=6,nrow=4)
wordlist=unique(unlist(strsplit(dumcal, " ")))
for (i in 1:6)
{ result[grep(wordlist[i], dumcol),i] = 1 }
または似たようなもの。より高速でリソース効率の高い方法があると思います。何かアドバイス?