正規表現を使用して URL を解析しようとしています。
URLの形式は次のようになります
yadayadahttp://www.theurl.com/apage
yadayadahttp://www.theurl.com/
yadayadahttp://www.theurl.com
yadayadahttp://meow.theurl.com/apage
yadayadahttp://theurl.com
yadayadahttp: //theurl.com/
これらは、www(または他のサブドメイン)の有無にかかわらず処理するための私の2つの正規表現です。
www 正規表現:
\bhttp:\/\/\b\w*[a-z0-9]\.\w*[a-z0-9]\.\w*[a-z0-9]
および非 www 正規表現:
\bhttp:\/\/\b\w*[a-z0-9]\.\w*[a-z0-9]
とにかくそれらを組み合わせる方法はありますか?あることはわかっているのですが、できないようです。私は今数時間試しました。
また、リストに不要なアイテムを与える空の一致を返すようですが、null ではない一致を返すことは可能ですか?