自然に発生するテキストがあります。
text="word1 word2 word3. word4, word5 word6 word7"
そして、そのテキストで検出したいいくつかの要素:
elements=c("word2","word6 word7",".",",")
でも、
elements[sapply(paste0("\\<",elements,"\\>"),grepl,text)]
ユニグラム「word2」とバイグラム「word6 word7」のみを返します。テキスト内のピリオドとコンマは検出されません。
どうすればそれを達成できますか?