0

サイトからスクレイピングしようとしていますが、iMacro がページをロードしません。URL GOTO=http://www.grosshandel-produkte.com/adressen/detail/id/13500

Firefox 17 Web コンソールでは、次のようなエラーが表示されます。

GET http://www.grosshandel-produkte.com/adressen/detail/id/13500 [HTTP/1.0 500 内部サーバー エラー 598ms]

HTML ドキュメントの文字エンコーディングが宣言されていません。ドキュメントに US-ASCII 範囲外の文字が含まれている場合、一部のブラウザー構成では、ドキュメントが文字化けしてレンダリングされます。ページの文字エンコーディングは、ドキュメントまたは転送プロトコルで宣言する必要があります。

iMacros で文字セットを強制する方法はありますか? ブラウザの文字セットを変更してみました。それもうまくいきませんでした。サイトはドイツ語です。utf-8でやってみましたがだめでした。

助けてください。

4

1 に答える 1

0

smartsniffまたはFiddler2を使用して、通常どおりサイトに移動します。サイトをロードして障害を特定するときに使用するエンコードなどが示されます。

GET http://www.grosshandel-produkte.com/adressen/detail/id/13500 HTTP/1.1
Host: www.grosshandel-produkte.com
Connection: keep-alive
Cache-Control: max-age=0
User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.97 Safari/537.11
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-GB,en-US;q=0.8,en;q=0.6
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: symfony=9pebil173uvj7j4r61ntbu3072; __utma=21097197.1518127093.1358333525.1358333525.1358333525.1; __utmb=21097197.0.10.1358333525; __utmc=21097197; __utmz=21097197.1358333525.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)

応答は次のとおりです。

HTTP/1.1 200 OK
Date: Wed, 16 Jan 2013 10:53:09 GMT
Server: Apache
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
P3P: CP="ALL CURa ADMa DEVa TAIa OUR BUS IND PHY UNI PUR COM NAV INT DEM"
X-Powered-By: PleskLin
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=utf-8

チャンク応答:P

于 2013-01-16T10:53:54.827 に答える