Webページからデータを取得しようとしていますが、問題が見つかりました。次のページ(つまり2ページ)に移動してデータを取得し続けると、1ページからデータを受信し続けます。次のページに切り替えようとして何か問題が発生したようです。
問題は、次のようなURLで問題が発生したことはないということです。
'http://www.webpage.com/index.php?page=' + str(pageno)
whileステートメントを開始するだけで、「pageno」に1を追加して2ページにジャンプします。
この形式でURLを開こうとすると、問題が発生します。
'http://www.webpage.com/search/?show_all=1#sort_order=ASC&page=' + str(pageno)
として
urllib2.urlopen('http://www.webpage.com/search/?show_all=1#sort_order=ASC&page=4').read()
http://www.webpage.com/search/?show_all=1からソースコードを取得します
私に関する限り、ハッシュを使用せずに他のページを取得する方法は他にありません。
通常、ブラウザの開始点を指定するために使用されるため、ハッシュを無視するのはurllib2だけだと思います。