2

この形式の URL を開くために Python Mechanize を使用しています...

https://www.simplewebsite.com?view=discussions#/?page=2

ページを開くと...これが表示されます...

https://www.simplewebsite.com?view=discussions

「#」マーク以降を完全にバイパス...

URLを開く方法の手がかりはありますか?私はウェブを検索するのに多くの時間を費やしました...肯定的な答えはありません...

4

3 に答える 3

1

ほとんどの場合、サイトは JavaScript に依存して URL の残りの部分を解析しています ( の後#)。window.locationを参照してください。

Mechanize が何らかの方法で JavaScript を実行できない限り、必要な結果は得られません。SeleniumPhantom.JS / Phantompyなどを試してください。

サイトが実際にパラメーターを直接渡すことをサポートしている可能性がある場合は、リクエストできます

https://www.simplewebsite.com?view=discussions&page=2

そうでない場合は、実際に必要なデータを要求するために作成される AJAX クエリを検査する必要があります。

于 2013-06-26T22:55:43.783 に答える