php - 中括弧間の正規表現の一致では、結果が多すぎます

Question

私はたくさんのテキストを持っています、例えば：

foofoofooabcdefhjkldh389dn{pdf}images/1.pdf,100%,500{/pdf}hfnkjt8499duidjglkj

以下を抽出したいと思います。

{pdf}images/1.pdf,100%,500{/pdf}

これが私が作った正規表現です：

#{pdf}(.*?){/pdf}#

結果を確認すると、次のようになります。

Array
(
[0] => {pdf}images/1.pdf,100%,500{/pdf}
[1] => images/1.pdf,100%,500
)

配列の最初のアイテムのみを取得することを期待していましたが、代わりに2つのアイテムがあります。私はPHPを使用しており、テストには次のWebサイトを使用しています。PHP正規表現テスター

{pdf}...{/pdf}テキストのみを取得するにはどうすればよいですか？

score 3 · Accepted Answer

正規表現でグループを使用します。あなたの場合、グループは

(.*?)

これにより、PHPは最初のグループで見つかった完全な結果{PDF} sometext{/PDF}とsometextを提供します。

グループを削除するには、次のことを試してください。

#{pdf}.*?{/pdf}#

score 1 · Accepted Answer

非キャプチャグループを使用して、中央のテキストが配列内の後方参照として表示されないようにし、ゼロ幅アサーションを使用して、{pdf}部分が一致の一部ではないことを確認します。

#(?<={pdf})(?:.*?)(?={/pdf})#

{pdf}区切り文字を保持したい場合：

#{pdf}(?:.*?){/pdf}#

score 1 · Accepted Answer

2つの結果はありません。

ここでの問題（ただし問題ではありません）は、おそらく関数preg_matchが使用されていることです。この関数は、一致するクエリ全体、つまり{pdf}images/1.pdf,100%,500{/pdf}、と最終結果、つまり。の両方を返しますimages/1.pdf,100%,500。

$result[1]したがって、さらに解析するためにを使用する必要があるだけです。

3 に答える 3