重複の可能性:
Web ページからのリンクを解析するための正規表現?
正規表現を使用して HTML からすべての URL を見つけるにはどうすればよいですか。ページの URL のみが必要なため、「.css」、「.jpg」、「.js」などで終わる URL の除外を追加したいと考えています。
HTML の例:
<a href=index.php?option=content&task=view&id=2&Itemid=25 class="menu_selected" id="">Home</a>
また
<a href="http://data.stackexchange.com">data</a> |
<a href="http://shop.stackexchange.com/">shop</a> |
<a href="http://stackexchange.com/legal">legal</a> |
ありがとう