このコードは、Web サイトの HTML ファイルをダウンロードして、ハードディスクに保存しています。コンストラクターで:
var uri = new Uri("http://www.walla.co.il");
それで :
DownloadHtml();
private void DownloadHtml()
{
using (var client = new WebClient())
{
client.DownloadFile(webSite, OriginalHtmlFilePath);
}
}
次に、ダウンロードした html ファイルで何らかの処理を行った後、WebBrowser でロードします。
string html = File.ReadAllText(ScrambledHtmlFilePath);
webBrowser1.DocumentText = html;
たとえば、Web サイトがhttp://www.cnn.comの場合、 Web ブラウザーで問題なくロードします。たとえば、サイトがhttp://www.walla.co.ilの 場合、Web ブラウザで読み込むと、一部の画像やその他のものが表示されません。
そして、両方のサイトで、Web ブラウザーでそれらをロードすると、多くのスクリプト エラーが発生し、ページをロードし続けるために [はい] を何度もクリックする必要があります。
スクリプト エラー
このページのスクリプトでエラーが発生しました
行文字 ....
このページでスクリプトの実行を続行しますか?
次に、はいを選択し、ページが読み込まれるまでそれを行います。多くの YES を実行した後、html ファイルが cnn.com コンテンツである場合、ページは正常に読み込まれます。
しかし、html ファイルが例えば walla.co.il のようにヘブライ語である場合、最後に [はい] を何度もクリックした後、次のように表示されます。
そして、元のサイトはまったくこのようなものではありません。