ruby - Ruby正規表現：部分文字列が存在しない場合のマッチング

Question

文字列でグループをキャプチャしようとすると問題が発生します：

"type=gist\nYou need to gist this though\nbecause its awesome\nright now\n</code></p>\n\n<script src=\"https://gist.github.com/3931634.js\"> </script>\n\n\n<p><code>Not code</code></p>\n"

私の正規表現は現在次のようになっています：

/<code>([\s\S]*)<\/code>/

私の目標は、コードブラケットの間にすべてを入れることです。残念ながら、2番目の終了コードブラケットまで一致しています。終了コードブラケットが最初に出現するまで、コードブラケット内のすべてを一致させる方法はありますか？

score 4 · Accepted Answer

正規表現のすべての繰り返し数量詞は、デフォルトで貪欲です（できるだけ多くの文字に一致します）。*次のように、貪欲にしないでください。

/<code>([\s\S]*?)<\/code>/

ただし、代わりにDOMパーサーの使用を検討してください。正規表現は、HTMLを解析するための適切なツールではありません。

score 0 · Accepted Answer

そして、私はちょうど複数の部分を通過するために、

String.scan( /<code>(.*?)<\/code>/ ){
  puts $1
}

これは、発生するすべてのコードを調べるための非常に優れた方法ですが、適切なパーサーを取得する方が優れています...

ruby - Ruby正規表現：部分文字列が存在しない場合のマッチング

2 に答える 2

Related

Reference