フォーマットがどこのようなカスタム正規表現を書きたいのですclass="r"><a href="http://www.hihostels.com/"
が
1.class="r"><a href="
固定
2.http://www.hihostels.com/
可変
3."
固定
HTMLAgilityPack http://htmlagilitypack.codeplex.com/のような HTML 解析エンジンを使用することをお勧めします。これらの解析ツールの学習曲線はかなり急勾配になる傾向があるため、手早く簡単なものを探していても、エッジ ケースのシナリオでつまずく可能性がある場合は、次のユニバーサル正規表現の PowerShell の例を検討してください。
$Matches = @()
$String = '<div class="r"><a href="http://www.hihostels.com/" class="RememberToVote">click me</a></div'
([regex]'class="r"><a href="([^"]*)"').matches($String) | foreach {
write-host "at $($_.Groups[1].Index) = '$($_.Groups[1].Value)'"
} # next match
収量
at 24 = 'http://www.hihostels.com/'
これは、文字列の後にキャプチャしようとしている文字列が常にclass="r"><a href="
続くと仮定することで機能します。この場合、二重引用符[^"]*
に達するまで、二重引用符以外のすべての文字を探します。