興味のある craigslist のリストを管理するために、GAE で小さなアプリを作成しようとしています。アプリからこれらのリストからデータを取得したいのですが、そうするたびに craigslist から 404 が返されます。
調査の結果、私のコードが原因ではないことが判明しました。craigslist は HTTP ヘッダーを調べ、User-Agent ヘッダーに「AppEngine-Google」が見つかると、体系的に 404 を返します。
あなたはcurlでそれを見ることができます:
curl http://sfbay.craigslist.org/
動作します(ページを返します)。
curl http://sfbay.craigslist.org/ --header "User-Agent: AppEngine-Google"
何も与えません。
GAE によってデフォルトで設定されているこのヘッダーを削除する方法はありますか? または、問題を回避するための別のアイデアはありますか?