私は巨大なXMLを解析するデータインポートツールを持っています(それはSAXパーサーを使用しますが、適応は私の問題の中で最も少ないものです)。失敗、新しいデプロイメント、システムの再起動が発生し、最初からやり直したくないので、パーサーの状態(必要に応じてXMLカーソルと呼ぶことができます)を時々保存する必要があります。
状態を保存して再開できるパーサーはありますか(明らかに、再開時にファイルも検索する必要があります)。
私はそのようなパーサーを見つけられなかったので、それについて疑問があります。それで、ここに私の2番目の質問があります:私がそれを実装し始める方法について何か提案がありますか?SAXパーサーの実装を取得して掘り下げます。それとも、最初から始めたほうがよいでしょうか。
重要な場合は、xml名前空間が必要ですが、スキーマ/DTDチェックは必要ありません。
カーソルは、xmlを事前に解析し、並列処理のために作業を分散するのにも役立ちます。