Pythonのurllib2(またはurllib)を使用しているサイトからは読み取れないことがわかりました。例...
urllib2.urlopen("http://www.dafont.com/").read()
# Returns ''
これらのサイトは、ブラウザでサイトにアクセスすると機能します。PHPを使用してそれらをスクレイプすることもできます(他の言語は試していません)。同じ問題を抱えている他のサイトを見たことがありますが、現時点ではURLを思い出せません。
私の質問は...
- この問題の原因は何ですか?
- 回避策はありますか?