特定の URL を指定すると、ID と XPath を取得する方法があります。ユーザー名とパスワードが必要な URL をスクレイピングできるように、リクエストでユーザー名とパスワードを渡すにはどうすればよいですか?
using HtmlAgilityPack;
_web = new HtmlWeb();
internal Dictionary<string, string> GetidsAndXPaths(string url)
{
var webidsAndXPaths = new Dictionary<string, string>();
var doc = _web.Load(url);
var nodes = doc.DocumentNode.SelectNodes("//*[@id]");
if (nodes == null) return webidsAndXPaths;
// code to get all the xpaths and ids
Web リクエストを使用してページ ソースを取得し、そのファイルを上記のメソッドに渡す必要がありますか?
var wc = new WebClient();
wc.Credentials = new NetworkCredential("UserName", "Password");
wc.DownloadFile("http://somewebsite.com/page.aspx", @"C:\localfile.html");