BBEdit で編集している大きな XML ファイルがあります。
古い日記をデジタルで再現した XML ファイル内には、メモ タグで囲まれたテキストがあります。
<note>Example of a note.</note>
ただし、一部の注記タグには、ネストされた引用タグで囲まれた引用があります。
<note>Example of a note, but <quote>"here is a quotation within the note"</quote></note>
引用タグの実際のコンテンツを保持しながら、メモタグから引用のすべてのインスタンスを削除する必要があります。したがって、例は次のようになります。
<note>Example of a note, but "here is a quotation within the note"</note>
私は BBEdit で GREP を使用してこれらの一部を正常に削除しましたが、複数の行にまたがる、または 2 つの異なるタグ セットの間にテキストがある、より複雑なメモ タグに行き詰まり始めています。例えば:
<note>Example of a note, <quote>"with a quotation"</quote> and a <quote>"second quotation"</quote> along with some text outside of the quotation before the end of the note.</note>
一部の引用は 10 行を超えることがあります。私の正規表現で \r を使用しても役に立たないようです。
また、引用タグはメモ タグの外に存在する可能性があることも言及しておく必要があります。これにより、/?quote を一括で検索して削除する可能性が排除されます。メモ タグ内ではなく、ドキュメント内で引用タグを使用する必要があります。
助けてくれてありがとう。