Web アドレスのホスト名の部分を無視して、パスのみを保持しようとしています。
例えば:
http://bar.foooo.com/path1/path2/path3
現在、次の正規表現があります。
\\bhttp\\b)*(\\bhttps\\b)*(\\b[\\w']{1,2}\\b)*(\\bwww\\b)*(\\bco\\b)*(\\buk\\b)*(\\bcom\\b)*(\\borg\\b)*[^\\p{L}\\p{N}]+|[\\w\\d']{20,}|\\b\\w*\\d\\w*", " "));
それはそのリンクを次のようにします:
bar foooo path1 path2 path3
しかし、bar と foooo も除外したい、つまり無視したい [http://bar.foooo.com/]