0

さまざまなWebサイトのコンテンツを取得するためにphpとcURLを使用しています。

これはグーグルマップ情報ウィンドウです:https ://google-developers.appspot.com/maps/documentation/javascript/examples/infowindow-simple

ここで、情報ウィンドウにあるコンテンツを取得したいと思います。それを行う方法はありますか?

4

1 に答える 1

2

この特定のケースでは、情報ウィンドウ内のデータは html 自体のスクリプト タグに埋め込まれているため、URL から html をダウンロードし、正規表現を作成して情報ウィンドウのコンテンツを抽出します (この場合、contentString という名前の変数) はとても簡単です。

ただし、一部の Web サイトは単純ではなく、情報を収集するためにさまざまなアプローチを採用する必要があります。動的 Web サイトでは、ajax 呼び出しを使用して情報ウィンドウのコンテンツを入力するか、コンテンツが別のスクリプトまたは json ファイルに含まれている場合があります。これらの各サイトのコンテンツをスクレイピングすることに決めた場合は、個々のサイトごとにカスタム コーディングを行う必要があります。

于 2012-04-25T21:17:40.617 に答える