このような正規表現があります。
/(?:http[s]?:\/\/)?(?:www\.)?(.*)/
プロトコルを無視して、Webサイトのドメイン部分をキャプチャしたいだけです。したがって、この正規表現は機能しますが、いくつかの空白もキャプチャします。ここの空きスペースはどこから来たのですか?これが分かれば、とても助かります。
一致するように次の文字列をフィードすると、
入力:
http://google.com
https://www.simplecms.com
www.facebook.com
gmail.com
出力:
Match 1
1. google.com
Match 2
1.
Match 3
1. simplecms.com
Match 4
1.
Match 5
1. facebook.com
Match 6
1.
Match 7
1. gmail.com
Match 8
1.
Match 9
1.
出力を見ると、それは仕事をしていますが、空の文字列もキャプチャしています。このことをキャプチャするためのより良い方法があると確信しています。