次の文字列があります。
<A href="CarPage.asp?parent=CAR123+++&Color=RED">The Car is Red - Its Fast</a>
そして、私は抽出したい:
- CAR123
- 赤
- 車は赤い - 速い
私がこれまでに持っているものは次のとおりです。
(?<=<A href="CarPage\.asp\?parent=)[A-Za-z0-9]*(\+\+\+&Color=)[A-Za-z0-9]{3}(\">)[A-Za-z0-9\- ]*(?=</a>)
しかし、文字列の境界にない場合に、正と負の先読みと後読みを設定する方法がわかりません。
確かに、それは HTML です...前に聞いたことがあります... 「正規表現で html を解析しないでください...」 これ以上複雑なことは必要ありません。
助けていただければ幸いです。
ありがとう!