以下の形式の巨大なテキスト ファイルがあります (ASCII ファイルとして)。同じ処理にpythonを使用しています。この種のファイルについて、(より一般的な方法で) いくつか質問があります。
- データ形式が正しいことを確認するにはどうすればよいですか? テンプレートを指定して、そのようなテキスト ファイルの正確性を検証する方法はありますか? (xml の dtd ファイルに似ています)。
- 2 番目の質問は、そのようなファイルを解析し、ファイルからデータを読み取ることです。
XYZ
行の後にデータが来ると予想しているように、time
それらを解析する必要があります。そのようなシナリオのための簡単なメカニズムはありますか? これもテンプレートと解析のメカニズムのようなものです。
===========================BEGIN=========================================
2012-12-05 12:03
XYZ 123(0) 654(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:04
XYZ 123(0) 654(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:05
XYZ 523(0) 654(2) 235(4)
MON 83(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:03
XYZ 193(0) 644(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================