R の正規表現に問題があります。ライブラリ stringr の str_extract を使用していますが、問題は次のとおりです。
library(stringr)
test="word1 something word2 something word3 something word3"
temp = str_extract(test,'word2.+word3')
print(temp)
## [1] "word2 something word3 something word3"
問題は、最初の単語 3 で停止することです。文字列の最後の部分は必要ありません。任意のアイデアをお願いします? どうもありがとうございます
もし私が持っているなら
test="word1 something word2 something1 word3 something2 word3 something3 word2 something4 word3"
そして、この「word2 something1 word3」、「word2 something4 word3」のような 2 サイズのベクトルを維持したいと思います。