0

私は Web ブラウザー コントロールを使用して、ヘルスケア プロバイダーから医療情報をスクレイピングしています。この Web サイトはユーザー名とパスワードを使用して保護されており、PDF ファイル以外の必要なものはすべてスクレイピングできました。

ページに移動した後、このjavascript「読み込み中...」を取得します。通常のブラウザーでは、ブラウザーでレンダリングされたPDFファイルが表示されますが、Webブラウザーコントロールではpdfが表示されず、有名な黄色が表示されます通知バー。

PDFファイルのURLはこんな感じ

"https://www.***.com/phoenix/views/akgCharts/zoomAkgChart.jsp?&date=20130502&time=123000", 

mshtml を使用してすべてのスクレイピングを行っていますが、mshtml オブジェクト内にファイルが見つかりません。フィドラー 2.0 を使用しています任意のフォルダ)

何か案が??

4

1 に答える 1

0

ファイルを送信するURLがわかっている場合は、次のようなことを試すことができます。

System.Net.WebClient _wclient = new System.Net.WebClient();
_wclient.DownloadFile("https://www.***.com/phoenix/views/akgCharts/zoomAkgChart.jsp?&date=20130502&time=123000",", @"c:\MedicalReport_" + DateTime.Now + ".pdf");
于 2014-09-21T14:05:04.557 に答える