次のようなデータを含む大きな ARFF ファイルがあります。
555,"2011-03-13 01:50:48.000",0
540,"2011-03-13 02:10:19.000",0
解析しやすいように、次のように 2 番目の属性を宣言しました。
@attribute RecordedOn date "yyyy-MM-dd HH:mm:ss.SSS"
Java の SimpleDateFormat を使用するパーサーは、最初の行 (およびそれに非常によく似た数百万行) では問題なく動作しますが、2 行目などの数行で停止します。時間が「02」の 1 行だけをチョークすることに気付きました。実際、2 行目は に変更すると問題なく解析され540,"2011-03-13 01:10:19.000",0
ます。謎に加えて、 a を含むいくつかの行は02
とにかくうまく解析されます。お気に入り:1,"2006-12-16 02:58:51.000",111
それで、誰かが何が起こっているのか知っていますか?何かアドバイス?前もって感謝します。