0

私は正規表現が初めてです。テキスト部分のみをキャプチャするか、すべての子ノードと値をすべて<firstpar>削除します。<asmbly>誰でもその方法を教えてもらえますか。以下は、xml フィールドのスナップショットです。ありがとう。

<?xml version="1.0" encoding="UTF-8"?>
<firstpar>
    <thumbcred>Sample 1 thumbcred</thumbcred>
    <asmbly>
       <caption>
           <p><work ty="drawing">Two Fabulous Animals</work>Sample 1 <e> sample 1caption </e></p>
        </caption>
        <credit>Paul Miller/AP</credit>
        <asset id="126099" hgt="450" wdth="289" tmstp="24-OCT-08"
            bintype="2" filename="images/sample126099.jpg" source="eb" bighgt="1600"
            bigwdth="1029" bigfilename="botany003.jpg"
            bigdeployfullfilename="/eb-media/99/126099-050-CAD1EF0A.jpg"
        />

        <copyright>Copyright © 1994-2013 Encyclopædia Britannica,  Inc.</copyright>
    </asmbly>

Sample firstpar text <e>Sample e</e> just some
text <sub>sample sub </sub><e>sample e text again</e> more text with sup sub e. 

    </firstpar>
4

1 に答える 1

2

残念ながら、正規表現の既知の制限の 1 つは、ネストを処理できないことです。

使用している言語に関係なく、使用可能な XML パーサーを使用できますし、使用する必要があります。


非常に具体的に形成された XML 部分と非常に具体的な目標がある場合、正規表現を使用してそれに対していくつかの操作を実行することは可能ですが、正規表現を非特定の XML 部分に適用しようとすると、それを処理することができません。

于 2013-08-12T19:20:58.380 に答える