参加者がさまざまな形式で生年月日を入力したアンケート データがあります。
ID <- c(101,102,103,104,105,106,107)
dob <- c("20/04/2001","29/10/2000","September 1 2012","15/11/00","20.01.1999","April 20th 1999", "04/08/01")
df <- data.frame(ID, dob)
分析を行う前に、データが正しい形式 (つまり dd/mm/yr) でない場合にデータをサブセット化し、各セルを手動で修正できるようにする必要があります。
私は使用してみました:
df$dob <- strptime(dob, "%d/%m/%Y")
...どの日付が正しい形式であったかを強調しますが、間違って入力された日付の NA を取得するだけなので、後でそれらを変更したい場合には役に立ちません (ID を参照として使用します)。
誰かが私を助けることができるかもしれないアイデアを持っていますか?