私はpycurlを使用してグーグルで何かを検索するためのコードを書きました。pycurlを使用してこれを実行できるようにしたいと思いますが、すべての助けに感謝します。用語を検索してから、pycurlを使用して「次のページのボタンをクリック」または「下部のインデックス付きの数字をクリック」して、最初の10件のWeb結果だけを取得できる機能を探しています。
前もって感謝します。
私はpycurlを使用してグーグルで何かを検索するためのコードを書きました。pycurlを使用してこれを実行できるようにしたいと思いますが、すべての助けに感謝します。用語を検索してから、pycurlを使用して「次のページのボタンをクリック」または「下部のインデックス付きの数字をクリック」して、最初の10件のWeb結果だけを取得できる機能を探しています。
前もって感謝します。
これを行うには複数の方法があります。
ベース URL がhttp://www.google.co.uk/search?hl=en&q=YOUR_QUERY_STRINGの場合
URL の末尾に &num=100 を追加すると、最初の 100 件の結果を取得できます。
または、&start=N (N は 10 の倍数) を追加して、webrequest を再送信して次のページを取得できる場合
または、XPATHを使用して Web ページを解析し、検索結果の次のページの URL を取得します。