組み込みのデータ セットでこの問題を再現しようとしましたが、自分自身でのみ発生します。
データのランダムなサブセットを取得すると、次のようになります。
structure(list(ID = structure(c(27L, 1L, 27L, 7L, 5L, 10L, 23L,
19L, 21L, 26L), .Label = c("AC ", "AJ ", "AT ", "AWY", "BP ",
"BW ", "CA ", "CK ", "CS ", "DJ ", "EN ", "ES ", "HF ", "HG ",
"HL ", "HR ", "IP ", "JA ", "JG ", "JN ", "KB ", "KP ", "MJ ",
"PC ", "RFH", "RPA", "SB ", "SG ", "TM "), class = "factor"),
TNO = c(30L, 60L, 30L, 10000L, 10000L, 10000L, 120L, 60L,
120L, 10000L), TNOGroup = structure(c(1L, 1L, 1L, 2L, 2L,
2L, 2L, 1L, 2L, 2L), .Label = c("Good", "Poor"), class = "factor"),
x = c(6.15, 7.75, 5.6, 3.05, 3, 4.1, 6, 3.9, 5.85, 3.75),
View = structure(c(1L, 1L, 2L, 2L, 2L, 2L, 1L, 2L, 1L, 1L
), .Label = c("Binocular", "Monocular"), class = "factor"),
Prior = structure(c(2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L
), .Label = c("N", "Y"), class = "factor")), .Names = c("ID",
"TNO", "TNOGroup", "x", "View", "Prior"), row.names = c(169L,
49L, 24L, 16L, 9L, 4L, 35L, 18L, 164L, 36L), class = "data.frame")
次に、「SB」などの 2 文字の文字列である ID のすべてのインスタンスを削除してみてください。
data2 <- data[!data$ID %in% c("SB"),] # List syntax in case multiple cases
しかし、データフレームを確認すると、IDが「SB」のケースが残っています。「RPA」などの 3 文字の文字列でこれを試してみると、この ID を持つすべてのケースが期待どおりに削除されます。
なぜこれが発生するのかについての洞察はありますか?