HTMLコードからすべてのWebサイトを取得したい。問題は、すべてのURLを取得する正規表現がありますがwww、アドレスに存在する必要があることです。コンテンツに含まれていないURLを取得するには、どのような正規表現を使用する必要がありますwwwか?
更新:私が使用している正規表現は次のとおりです。
string anchorPattern =
@"(?<Protocol>\w+)://(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&+]*'";