-1

毎日、約 60,000 の xml ファイルを PostgreSQL または mysql データベースの 3 つのテーブルに解析する必要があります。各ファイルのサイズは約 50 ~ 300k です。メッセージは10種類。各ファイルには、さまざまな種類のメッセージがあります。解析を堅牢で効率的にするために使用する方法またはツールは何ですか?

4

2 に答える 2

1

Perl、Mojo::DOMDBIx::Connector、および PostgreSQL を使用します。

于 2012-11-02T22:48:59.990 に答える
1

この問題に取り組むには多くの方法があります。XML の構文解析は固有の問題ではありません。ほとんどの適切な言語で実行できます。

どのプラットフォームを使用していますか?

あなたが最もよく知っている言語は何ですか?

堅牢である限り、Python は優れた言語であり、エラー処理が適切で、非常に柔軟で、開発が速く、保守が容易です。

Python を選択した場合は、速度を上げるために C ベースの xml 拡張機能を使用することをお勧めします。http://lxml.de/を見てください。または、一部のバージョンでは ElementTree が ac モジュールによってサポートされている可能性があります。

詳細があれば、より良い回答が得られます。

于 2012-11-02T23:12:25.023 に答える