FO変換前または後のいずれかの状態にあるXMLドキュメントがあり、そこから情報を抽出する必要があります。前のケースでは、pageWidthとpageHeightを表す2つのタグを引き出す必要があり、後のケースでは、特定のタグからpage-heightとpage-widthのパラメーターを抽出する必要があります(どちらが外れているか忘れています)私の頭のてっぺん)。
私が探しているのは、これら2つの要素を取得するための効率的で簡単に保守できる方法です。必要な2つのものを取得して、ドキュメントを1回だけ読みたいと思います。
最初はBufferedReader
+を使用するものを書き始めましFileReader
たが、文字列検索を行っているため、タグが複数行にまたがると面倒になります。次に、を調べましたDOMParser
。これは理想的と思われますが、ファイルが大きくなる可能性があり、探しているタグが大きくなる可能性があるため、ファイル全体をメモリに読み込む必要はありません。ほとんどの場合、ファイルの先頭に近い位置にあります。それから私は調べましたSAXParser
、しかしそれは私が成し遂げようとしていることのための複雑なやり過ぎの大きな山のようです。
誰かアドバイスはありますか?または、私の目標を達成する簡単な実装ですか?ありがとう。
編集:私が持っているさまざまな制限のために、私が使用するものはすべてコアJavaに「組み込まれている」必要があり、サードパーティのXMLツールを使用および/またはダウンロードできないことを忘れました。