R での文字列の分割に関する多くの投稿を読みました。ただし、変数が R に読み込まれた方法、つまり ID が短いため、場合によっては日付の後のスペースが原因であると思われるエラーが発生しています。文字変数「VESSELID」を「vesselID」と「DATE」の 2 つの新しい変数に分割しようとしています。以下は私のデータセットのサブセットです。
> dput(df)
structure(list(SETID = c(24153L, 24187L, 24215L, 31990L, 31990L,
31995L, 31995L, 31995L, 31996L, 31996L, 31996L, 31997L, 31997L,
32002L, 32002L, 32002L, 32002L, 32003L, 32003L, 32003L), VESSELID = c("6830 2002/08/13 ",
"6830 2002/08/12 ", "6830 2002/08/15 ", "105372 2002/08/23",
"105372 2002/08/23", "104234 2002/07/20", "104234 2002/07/20",
"104234 2002/07/20", "104234 2002/07/21", "104234 2002/07/21",
"104234 2002/07/21", "104234 2002/07/22", "104234 2002/07/22",
"5744 2002/08/14 ", "5744 2002/08/14 ", "5744 2002/08/14 ",
"5744 2002/08/14 ", "5744 2002/08/13 ", "5744 2002/08/13 ",
"5744 2002/08/13 ")), .Names = c("SETID", "VESSELID"), row.names = c(1L,
2L, 3L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L,
21L, 22L, 23L, 24L, 25L, 26L), class = "data.frame")
私は次のことを試しました:
library(reshape2)
test <- data.frame(df, colsplit(df$VESSELID, split= " ",names=c("vesselID","DATE")))
ただし、次のエラー メッセージが表示されます。
Error in colsplit(log21$VESSELID, split = " ", names = c("vesselID", "DATE")) :
unused argument(s) (split = " ")
split
コマンドが正しく動作していないようです。文字列を修正する方法がわかりません。