Web サイトでホストされているデータベースを自分のコンピュータにコピーしたいと考えています。
私はpython urllib2を使用して、ループを作成して各リンクを開き、ページコンテンツを含むファイルを書き込もうとしました。最初の 100 個のリンクではほぼ完全に機能しますが、エラー 500 が表示され、Web サイトもダウンしているようです (実行時エラー)。
データベースのセキュリティメカニズムによるものですか? それを避けるためのトリックはありますか?
ありがとう!
HTTP 500 (内部サーバー エラー) も発生します。したがって、これはセキュリティ メカニズムではないと思いますが、おそらく実際のサーバー エラーです。
クローラーがリンクを「クリック」して、サーバーをクラッシュさせたのではないでしょうか? もちろん、サーバー エラーはクロール作業とは完全に無関係である可能性もあります。
とにかく、問題が解決しない場合は、次の連絡先の詳細を使用してデータベースの所有者に連絡する価値があるかもしれません: http://archive.unctad.org/iia-dbcases/