3

約 800 万行と 3 列のデータ フレームがあります。私strptime()は次の方法で使用しました:

df$date.time <- strptime(df$date.time, "%m/%d/%y %I:%M:%S %p")

これは、1104行を除くすべての行で正常に機能します。

df[is.na(df$date.time), ]

これらの「問題のある」データを見ると、date.timeエントリは期待どおりにフォーマットされているようです。たとえば、問題として出てくるが、NA ではないように見える観測は次のとおりです。

id                date.time              outcome
observation543490 2012-03-11 02:14:01    C

is.na(df$date.time)明らかに正しく変換されたこの行に対して TRUE 値を返すには、何が起こっているのでしょうか?

再現可能な例を次に示します (CST を使用している場合)。

is.na(strptime("03/11/12 2:14:01 AM", "%m/%d/%y %I:%M:%S %p", "CST6CDT"))
#[1] TRUE
4

1 に答える 1

6

問題はNA、夏時間のため、使用しているどのタイムゾーンにも返されるすべての時間が存在しない可能性があります。

データ ソースを確認して、データが記録されたタイムゾーンを特定し、tzへの呼び出しで引数をその値に設定しますstrptime

于 2013-07-11T22:08:10.150 に答える