3

大きな文字列内にdata.frame(サブ) 文字列の位置があります。データには、(サブ) 文字列の開始とその長さが含まれます。(サブ)ストリングの終了位置は簡単に計算できます。

data1 <- data.frame(start = c(1,3,4,9,10,13),
                   length = c(2,1,3,1,2,1)
                   )

data1$end <- (data1$start + data1$length - 1)

data1
#>   start length end
#> 1     1      2   2
#> 2     3      1   3
#> 3     4      3   6
#> 4     9      1   9
#> 5    10      2  11
#> 6    13      1  13

reprex パッケージ(v0.3.0)により 2019-12-10 に作成

data.frame新しいデータが次のようになるように、連続した (サブ) 文字列 (互いに接続されている文字列) を要約してこれを「圧縮」したいと思います。

data2 <- data.frame(start = c(1,9,13),
                   length = c(6,3,1)
                   )

data2$end <- (data2$start + data2$length - 1)

data2
#>   start length end
#> 1     1      6   6
#> 2     9      3  11
#> 3    13      1  13

reprex パッケージ(v0.3.0)により 2019-12-10 に作成

data1から私を得る基本的なRソリューションはありdata2ますか?

4

2 に答える 2