java - Javaコンパイルでの正規表現

Question

まず、HTML を正規表現で解析するのはよくないことです。しかし幸いなことに、コードを抽出している Web サイトは単純なので、この方法を使用すると常に良い結果が得られます。

Pattern p = Pattern.compile("(?<=<span class=\\\"itemName\\\">).*(?=</span>)"); 
Matcher m = p.matcher(code);

「itemname」タグと「span タグ」の間にあるものを返すはずです。そんな感じ：

PESCA INSOLITA

しかし、その代わりに、次のように返します。

PESCA INSOLITA</span></a><li><a href="/uy/synop...

私は何を間違っていますか？

score 3 · Accepted Answer

貪欲なマッチャーを使用しています.*。これにより、マッチャーspanは HTML ドキュメントの最後のタグまで完全に一致します。代わりに、.*?-- または、さらに良いことに、パーサーを使用してください...

1 に答える 1