0

IEで既に開かれているwabpageからXMLテキストを取得しようとしています。ターゲットページのセキュリティ(証明書などの長い退屈な話)のため、Webリクエストは許可されていません。メソッドを使用して、開いているすべてのページをウォークスルーします。ページのURIと一致するものが見つかった場合は、そのXMLを取得する必要があります。少し前に、bodyタグの間にHTMLコードを取得する必要がありました。私は次のようにIHTMLDocument2でメソッドを使用しました:

private string GetSourceHTML()
{            
    Regex reg = new Regex(patternURL);
    Match match;
    string result;
    foreach (SHDocVw.InternetExplorer ie in shellWindows)
    { 
        match = reg.Match(ie.LocationURL.ToString());
        if (!string.IsNullOrEmpty(match.Value))
        {
            mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)ie.Document;
            result = doc.body.innerHTML.ToString();
            return result;
        }                
    }
    result = string.Empty;
    return result;            
}

したがって、ターゲットページのXMLコード全体を取得する必要があります。私はたくさんグーグルで検索しましたが、役に立つものは何も見つかりませんでした。何か案は?ありがとう。

4

1 に答える 1

1

これを試しましたか?HTMLを取得する必要があります。これをXMLに解析できるといいのですが。

于 2012-12-17T09:00:03.103 に答える