Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私はサイトマップを作成し、href持っていないsのhtml本体を解析しようとしています#(ハッシュのあるものは一部のコンテンツページhtmlのサブチャプターリンクにすぎないため)。
href
#
今の私の正規表現: sからまたはを除外する<a\\s[^>]*href\\s*=\\s*\"([^\"]*)\"[^>]*>(.*?)</a> 必要があると思いますが、それを試したりグーグルしたりするだけでは解決できませんでした。私を助けてくれてありがとう![^#]!##href
<a\\s[^>]*href\\s*=\\s*\"([^\"]*)\"[^>]*>(.*?)</a>
[^#]
!#