0

私はキーワードを検索する際にグーグルページからトップ10の検索リンクをこすり落としたいです。

私はwebharvestを使用しています。hrefリンクをスクレイプし、いくつかを使用してトップ10を除外することを計画しています

属性パターン?それは正しい方法ですか、現時点では機能していません。それを行う他の簡単な方法はありますか?:(

4

2 に答える 2

1

ここで説明されているように、Google検索RESTAPIを使用するのはどうですか。

于 2010-09-02T12:11:28.730 に答える
0

Googleスプレッドシートを使用する方が簡単ですが(変更を監視することもできます)、おそらく外部ツールを選択する理由があります。

一般に、結果を得るには3つの関数が必要です。

extract Title "//h3[@class='r']"
extract  URL "//h3/a/@href"
clean URL "\/url\?q=(.+)&sa" - (All external URLs in Google Search results have tracking enabled and we’ll use Regular Expression to extract clean URLs)
于 2015-10-29T18:31:31.667 に答える