MusicBrainzのWebサイトから編集履歴ページをプログラムで取得しようとしています。(musicbrainzngs
はMB Webサービスのライブラリであり、Webサービスから編集履歴にアクセスすることはできません)。このためには、ユーザー名とパスワードを使用してMBWebサイトにログインする必要があります。
モジュールを使用してみましたがmechanize
、ログインページの2番目のフォーム(最初のフォームは検索フォーム)を使用して、ユーザー名とパスワードを送信します。応答から、私はサイトに正常にログインしたようです。ただし、編集履歴ページをさらにリクエストすると、例外が発生します。
mechanize._response.httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
例外とその理由を理解しています。私はサイトを悪用しないように全責任を負います(結局のところ、使用法はすべて私のユーザー名でタグ付けされます)。手動でページを開いたり、HTMLを保存したり、保存したHTMLでスクリプトを実行したりすることは避けたいだけです。403エラーを克服できますか?