HTMLコードからすべてのWebサイトを取得したい。問題は、すべてのURLを取得する正規表現がありますがwww
、アドレスに存在する必要があることです。コンテンツに含まれていないURLを取得するには、どのような正規表現を使用する必要がありますwww
か?
更新:私が使用している正規表現は次のとおりです。
string anchorPattern =
@"(?<Protocol>\w+)://(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&+]*'";