""内に/thumb/が含まれているすべてのリンクを抽出しようとしています。実際、私は画像srcを使用するだけで済みます。画像がjpgで終わるのか、大文字と小文字の区別の問題があるのかなどはわかりません。実際には、完全なリンクのみを気にします。
m = Regex.Match(page, @"""(.+?/thumbs/.+?)""");
//...
var thumbUrl = m.Groups[1].Value;
私の完全なコード
var page = DownloadWebPage(url);
var reg = new Regex(@"Elements\s+\((.*)\)", RegexOptions.Multiline);
var m = reg.Match(page);
var szEleCount= m.Groups[1].Value;
int eleCount = int.Parse(szEleCount);
m = Regex.Match(page, @"""(.+?/thumbs/.+?)""");
while (m.Success)
{
var thumbUrl = m.Groups[1].Value;
//i break here to see a problem
m = m.NextMatch();
}
thumbUrlは次のようになります
center \ "> ...テキストが多く、/ thumbs / ... src = \" http://images.fdhkdhfkd.com/thumbs/dfljdkl/22350.jpg