1

私の小さなプロジェクトのために私を助けてください。

テキスト要素の大きなリストを用意します。各要素は、文の小さなリストに分割する必要があります。各小さなリストは、元のテキスト要素と同じ位置 (「行」) で最初の大きなリストの新しい列に 1 つの要素として「保存」する必要があります。

分割基準は"/$""und/KON""oder/KON"です。これは、新しい small-list-element の先頭に保持する必要があります。

のような正規表現と、"/$|und/KON|oder/KON"エスケープの多くの組み合わせを"$"試しました。また、パラメータを変更しようとしました。私が注意しようとするたびに起こります。が正しく解釈されていないようです。問題を解決するために何をお勧めしますか?"|""/"perl = TRUEfixed = TRUEFALSE|

library(stringr) # don't know if it's required

# Input list to be splitted at each
#      "/$", "und/KON", "oder/KON"
#      but should keep the expression at the start of the next list element
#      
#      Would be nice but not necessary: The small-list to be named after the ID in the first column

> r <- list(ID=c(01, 02, 03),
            elements=c("This should become my first small-list :/$. the first element ,/$, the second element ,/$, and the third element ./$.",
                       "This should become my second small-list :/$. Element eins und/KON Element zwei oder/KON Element drei ./$.",
                       "This should become my third small-list :/$. Element Alpha und/KON Element Beta oder/KON Element Gamma ./$.")

# Would look something like 
r$small_lists <- sapply(r$elements ,function(x) as.list(strsplit(x,"/$|und/KON"|oder/KON", fixed=TRUE)))
> r$small_lists

$01
[1] "This should become my first small-list "
[2] ":/$. the first element "
[3] ",/$, the second element "
[4] ",/$, and the third element "
[5] "./$."

$02 
[1] "This should become my second small-list "
[2] ":/$. Element eins "
[3] "und/KON Element zwei "
[4] "oder/KON Element drei"
[5] "./$."

$03
[1] "This should become my third small-list "
[2] ":/$. Element Alpha "
[3] "und/KON Element Beta "
[4] "oder/KON Element Gamma "
[5] "./$."

> class(r)
[1] "list"
> class(r$small_lists)
[1] "list"
4

1 に答える 1