バックグラウンドでAJAXが実行されているWebページをスクレイプしようとしています。PythonとSeleniumを使用して、Webページの読み込み、フォームへのデータの入力、[送信]をクリックして待機するまでになりました。この時点で、再取得されたJSON形式のデータをキャッチしようとしていますが、この記事では、JSON本体を取得できないことを示しています。Seleniumコードを自分で調べて、すべてを返すようにしようとしましたが、あまり運がありませんでした。同様の問題に遭遇し、それを解決する方法について提案を持っている人はいますか?私はセレン(またはそのことについてはPython)を使用する必要はありませんありがとう!
質問する
1731 次
2 に答える
0
これを行うには、Webサイトが(ソースで)行っているajax呼び出しを確認します。これは通常、POST(場合によってはGET)です。次に、そのURL +必要なデータを送信するcURL(PHP)またはurllib2(Python)を実行します。これにより、JSONを含む本文が返されます。
于 2013-03-24T09:13:16.713 に答える
0
この場合、JSONを直接取得できるはずです。JSONはここにあります。firefoxとfirebugを使用して、XHRリクエストを調べて見つけることができます。
于 2013-03-24T10:46:04.197 に答える