xml ファイルを処理する前にクリーンアップする必要があります。ファイルの最初と最後にジャンクがあり、要素間にジャンクがあります。ファイルの例を次に示します。
junkjunkjunkjunk<root>
\par junkjunkjunkjunkjunk<level1>useful info to keep</level1>
</root>
junkjunkjunkjunk
正規表現を使用して (replace を使用して) 最初と最後のジャンクを切り取り、次に中間のジャンクを切り取るにはどうすればよいですか? 真ん中のジャンクは常に "\par ..." で始まります。