0

紛らわしいタイトルで申し訳ありませんが、これをどのように表現すればよいかわかりません。また、私は正規表現に非常に不慣れです。これが私の問題です:

区切り文字「{{」と「}}」の間にあるテキストを抽出しています。これも複数行で一致させる必要があります。これは正規表現を使えば簡単です:

pageText = pageText.replaceAll( "(?s)\\{\\{.*?\\}\\}", "" )

ただし、追加の区切り文字が次のようにテキスト ブロック内に埋め込まれているという問題が発生しています。

"ここにあるテキスト {{ {{ すべて }} を削除する必要があります }} といくつかのテキスト"

その文字列で上記の正規表現を使用すると、次のようになります。

ここの一部のテキストは削除されました }} といくつかのテキスト

次のような場合:

「ここにテキストと追加のテキスト」

そのため、{{ .. }} の間に別の {{ .. }} が含まれている場合は無視して、その間のすべてを抽出する必要があります。

こことGoogleで多くの質問を読んできましたが、この特定の問題に取り組むものは何も見つかりませんでした. 正規表現でこれを行う方法がある場合、特に興味があります。このタスクを実行するいくつかの関数を書くことができるようですが (私はそれに苦労しており、ロジックはそれほど単純ではありません)、エラーにさらされることなく数行で実行したいと考えています。私が書くコード。

どんな助けや指示も大歓迎です。ありがとう!

4

1 に答える 1