information-retrieval - Googleページを取得する方法

Question

親愛なる皆様、私は今webtoolを使用しています

ウェブページを解析します。

たとえば、newyorktimes のホームページを解析するには、次のようにします。

ブラウザのアドレスバーで、物事をうまく解析してくれます。

ただし、Googleページでは失敗します。たとえば、次のように Google ニュースのヘッドページを解析したい場合:

常に 500 内部サーバーエラーが発生します。

私はそれがグーグルのウェブサイトと関係があると確信しています.おそらくグーグル用のAPIが必要だと思います.グーグルページのためにこれを整理する方法を知っている人はいますか? どうもありがとう。

score 2 · Accepted Answer

google.com のrobots.txtファイルによると、コンテンツをスクレイピングしないように明示的に要求されています。Google は、機械可読な検索結果のための API を提供していません。ウィジェットや埋め込み戦略を介してコンテンツの表示を制御したいと考えています。

1 に答える 1