約 800 万行と 3 列のデータ フレームがあります。私strptime()
は次の方法で使用しました:
df$date.time <- strptime(df$date.time, "%m/%d/%y %I:%M:%S %p")
これは、1104行を除くすべての行で正常に機能します。
df[is.na(df$date.time), ]
これらの「問題のある」データを見ると、date.time
エントリは期待どおりにフォーマットされているようです。たとえば、問題として出てくるが、NA ではないように見える観測は次のとおりです。
id date.time outcome
observation543490 2012-03-11 02:14:01 C
is.na(df$date.time)
明らかに正しく変換されたこの行に対して TRUE 値を返すには、何が起こっているのでしょうか?
再現可能な例を次に示します (CST を使用している場合)。
is.na(strptime("03/11/12 2:14:01 AM", "%m/%d/%y %I:%M:%S %p", "CST6CDT"))
#[1] TRUE