python - エラー500を取得せずにpython urllib2を使用してデータベースをコピーする方法は?

Question

Web サイトでホストされているデータベースを自分のコンピュータにコピーしたいと考えています。

私はpython urllib2を使用して、ループを作成して各リンクを開き、ページコンテンツを含むファイルを書き込もうとしました。最初の 100 個のリンクではほぼ完全に機能しますが、エラー 500 が表示され、Web サイトもダウンしているようです (実行時エラー)。

データベースのセキュリティメカニズムによるものですか? それを避けるためのトリックはありますか？

ありがとう！

score 0 · Accepted Answer

HTTP 500 (内部サーバーエラー) も発生します。したがって、これはセキュリティメカニズムではないと思いますが、おそらく実際のサーバーエラーです。

クローラーがリンクを「クリック」して、サーバーをクラッシュさせたのではないでしょうか? もちろん、サーバーエラーはクロール作業とは完全に無関係である可能性もあります。

とにかく、問題が解決しない場合は、次の連絡先の詳細を使用してデータベースの所有者に連絡する価値があるかもしれません: http://archive.unctad.org/iia-dbcases/

1 に答える 1