私は別の答えで見つけた何かを試していますが、いくつかの問題があります:
URLの正規表現の方が優れていることは知っていますが、たとえば次のように考えてください。
@links=($content =~ m/(https?)?.*[.]com/g);
*$content has text or html
(https?)?
のようなリンク用の部分ですがwww.google.com
、元に戻る括弧"http"
を$1
使用して@links
!リンク全体が欲しいので、それは問題です。
テキストから単純なリンク(または指定されている正規表現)をグローバルに抽出し、それらをリストに入れるにはどうすればよいでしょうか。
簡単に言うと、次のことを意味します。
http://www.google.com
www.google.com
google.com
https://www.google.com