さて、これは簡単なものですが、私には理解できません。
<a href="[^<>]*">[^<>]*</a>
基本的に、大きなhtml
ファイルからすべてのリンク()を抽出したいと思います。
でこれを実行しようとしましたがsed
、希望する結果ではなく、あらゆる種類の結果が得られます。ファイル内のすべてのリンクを置き換えることができるので、正規表現が正しいことを知っています。
sed 's_<a href="[^<>]*">[^<>]*</a>_TEST_g'
私がそれを次のようなもので実行すると
<div><a href="http://wwww.google.com">A google link</a></div>
<div><a href="http://wwww.google.com">A google link</a></div>
私は得る
<div>TEST</div>
<div>TEST</div>
他のすべてを取り除き、代わりに一致を印刷するにはどうすればよいですか?私の好ましい最終結果は次のようになります。
<a href="http://wwww.google.com">A google link</a>
<a href="http://wwww.google.com">A google link</a>
PS。私の正規表現は最も柔軟なものではないことを知っていますが、それは私の意図には十分です。