0

私は巨大な文字列を持っていて、その一部には次のように含まれています:

<df>asdffs</df><titletext xml:lang="eng" original="y">Dose intensity <inf>low</inf> in advanced cancer: Have we answered the question?</titletext><sdf>gfdgas</sdf>

<inf>タグにタグが存在するかどうかを確認する必要があります<titletext>。私はそれをJavaで書いています。

前もって感謝します。

4

1 に答える 1

0

XML パーサー ( SAX、ドキュメントはおそらく大きいため、すべてのドキュメントを一度にメモリにロードするのではなく、ストリーミングすることはできません) を使用して、この方法で解析することを強くお勧めします。正規表現ハンドラーが処理できないあらゆる種類のエッジ ケースを回避します (XML は正規ではないため) 。

上記の例では、遭遇した XML 要素のスタックを維持し、先行するかどうかを追跡する必要<inf>があります。<titletext>

于 2013-01-11T10:41:21.013 に答える