2

これは私がこれまでに持っているものですが、問題が発生しています。

ページhttps://xxxxxxxx.zendesk.com/tickets/33126には、.jpg 画像へのリンクが含まれています。この画像をダウンロードしたいです。ページには複数の画像が含まれている可能性があるため、ページをスキャンしてすべての .jpg、.gif などを見つける必要があります。

I'm having an issue with my code at the end. I'll explain there.

    public static void GetTicketAttachments(string url)
    {   
        GetImages("https://xxxxxxxx.zendesk.com/tickets/33126");   
    }

static void GetImages(string url)
    {
        string responseString;
        HttpWebRequest initialRequest = (HttpWebRequest)WebRequest.Create(url);
        using (HttpWebResponse initialResponse = (HttpWebResponse)initialRequest.GetResponse())
        {
            using (StreamReader reader = new StreamReader(initialResponse.GetResponseStream()))
            {
                responseString = reader.ReadToEnd();
            }

            List<string> imageset = new List<string>();
            Regex regex = new Regex(@"f=""[^""]*jpg|bmp|tif|gif|png", RegexOptions.IgnoreCase);
            foreach (Match m in regex.Matches(responseString))
            {
                if (!imageset.Contains(m.Value))
                    imageset.Add(m.Value);
            }
            for (int i = 0; i < imageset.Count; i++)
                imageset[i] = imageset[i].Remove(0, 3);
            totalFiles = imageset.Count;
            currentFiles = totalFiles;

            foreach (string f in imageset)
            {
                ThreadPool.QueueUserWorkItem(new WaitCallback(DownloadImage), f);
            }
        }
    }

ここで問題が発生します。オブジェクトの「パス」は、何らかの理由で常に null です。そのため、画像をダウンロードできません。

static void DownloadImage(object path)
    {
        currentFiles--;
        path = Path.GetFileName(path.ToString());
        HttpWebRequest request = (HttpWebRequest)WebRequest.Create(path.ToString());
        using (HttpWebResponse response = (HttpWebResponse)request.GetResponse())
        {
            Image image = Image.FromStream(response.GetResponseStream());
            image.Save(@"C:\" + Path.GetFileName(path.ToString()));
        }
    }

何が問題なのか知っている人はいますか?「写真の数」は実際には 1 (ページ上の写真への 1 つのリンク) をカウントしています。

4

1 に答える 1

0

ドキュメントを自分で解析しようとしないでください。HTML ドキュメントから意味のある情報を抽出するには、HTML Agility Pack ( http://htmlagilitypack.codeplex.com/ ) を参照してください。

于 2012-11-07T16:16:16.603 に答える