私はたくさんの.cifファイルを持っており、合計で約33Mbで、ローカルバスとその時刻表に関する情報を保持しています。各行は、その行が何であるかを示すために異なる識別子で始まります。
行の例:
QSN319 020S3_20110104219912311111100 S3 LFBUS O
これがバスの旅の情報、いくつかのさまざまな日付、およびバスが運行している曜日であることを示しますS3
。あなたはより詳細な例を見ることができますhttp://pastebin.com/3jzp6QL9
私がする必要があるQSN
のは、SQLiteをさらにインポートするために、すべての(または部分的に選択された、たとえばデータベースの一部は必要ない)データをCSVまたはXMLに解析することです。正しい方向にプッシュするだけで、使用できるツールがいくつか必要です。これを行うには、awkとsedで十分でしょうか、それともパーサーを最初から作成することを検討しますか。
アドバイスや提案をいただければ幸いです。