ログファイルがあり、このファイルからすべてのxmlを取得するプログラムを作成する必要があります。ファイルは次のようになります
text
text
xml
text
xml
text
etc
正規表現などを使用する方がよいアドバイスを教えてください。多分それはdom4jでそれを行うことが可能ですか?
正規表現を使おうとすると、テキスト部分に<>
タグがあるという次の問題が発生します。
更新1: XMLの例
SOAP message:
<soapenv:Envelope xmlns:soapenv="http://schemas.xmlsoap.org/soap/envelope/">
<soapenv:Body>
here is body part of valid xml
</soapenv:Body>
</soapenv:Envelope>
text,text,text,text
symbols etc
SOAP message:
<soapenv:Envelope xmlns:soapenv="http://schemas.xmlsoap.org/soap/envelope/">
<soapenv:Body>
here is body part of valid xml
</soapenv:Body>
</soapenv:Envelope>
text,text,text,text
symbols etc
ありがとう。