メイン レベル エントリの ID で XML ファイルのインデックスを作成したいと考えています。ドキュメント全体を解析し、エントリから ID を抽出してインデックスを作成する予定です (ファイルの開始タグ<
の位置と終了タグの位置>
+ 1 を覚えておいてください)。後でこれにより、ID でこの場所をすばやく見つけることができます。
しかし、SAX でファイルの位置を追跡することは可能でしょうか?
SAX でそれができない場合、それが可能な他のパーサーはありますか?
アップデート
LocationにはgetCharacterOffset()
メソッドがあることがわかりました。のStAX
ですか?
更新 2
Location
動作しますが、どういうわけか予想外です。最初のタグはmediawiki
で、位置ゼロから始まります。getCharacterOffset()
処理の最初から同時に4 を返します。
先読みが発生しているようです。