-1

IcheckMovies のサイトでチェックした最新の映画を取得して、自分の Web サイトに表示したいと考えています。php_get_contents() について読んでから要素を取得する方法がわかりませんが、必要な特定の要素はDOM構造のかなり深いところにあります。そのリスト内のdiv内のdiv内...

だから、これは私が自分のコンテンツを取得したいリンクです: http://www.icheckmovies.com/profiles/robinwatchesmoviesそして、リスト内の映画の最初のタイトルを取得したいと思います。

よろしくお願いします!

編集:

したがって、 file_get_contents() メソッドを使用して

<?php
$html = file_get_contents('http://www.icheckmovies.com/profiles/robinwatchesmovies/');
echo $html;
?>

このhtml出力を取得しました。ここで、「スマッシュ」を取得する必要があるだけなので、リスト内の div 内の div 内の h3 内の href リンクのコンテンツです。入手方法がわからないところです。

...
<div class="span-7">
<h2>Checks</h2>
<ol class="itemList">
<li class="listItem listItemSmall listItemMovie movie">
<div class="listImage listImageCover">
<a class="dvdCoverSmall" title="View detailed information on Smashed (2012)" href="/movies/smashed/"></a>
<div class="coverImage" style="background: url(/var/covers/small/10/1097928.jpg);"></div>
</div>
<h3>
<a title="View detailed information on Smashed (2012)" href="/movies/smashed/">Smashed</a>
</h3>
<span class="info">6 days ago</span>
</li>
<li class="listItem listItemSmall listItemMovie movie">
<li class="listItem listItemSmall listItemMovie movie">
</ol>
<span>
</div>
...
4

3 に答える 3

0

あなたを助けることができるいくつかのライブラリがあります!私がずっと前に同じ目的で使用したものはこれです:http ://simplehtmldom.sourceforge.net/

お役に立てば幸いです。

于 2013-03-09T19:16:26.987 に答える
0

あなたが求めているのはWeb スクレイピングと呼ばれるものです。私は数か月前にこれを行いました。プロセスは次のようになります。

  • HttpRequestコンテンツが必要なサイトにアクセスし、php クラスを確認します
  • ダウンロードしたページを処理するために DOM 解析ライブラリを使用します (html になります)。シンプルな HTLM DOMが適しています。
  • 必要な情報を抽出する

ここにいくつかのチュートリアルがあります。

SO投稿:

そして何よりも、Google は「PHP スクレイピング」で検索するだけです。

于 2013-03-09T19:25:21.333 に答える
0

これを達成するための手順に従ってください

ステップ1:-

最初にphpファイルでfile_get_contentsを使用してコンテンツを取得します

例: getcontent.php

<?php

echo file_get_contents("http://www.icheckmovies.com/movies/checked/?user=robinwatchesmovies ");

?>

ステップ2:-

ajax 呼び出しを使用して上記のスクリプトを呼び出し、コンテンツを html の表示非表示フィールドに追加します。

元:

$('#hidden_div').html(response);

html:-

<html>
<body>
<div id='hidden_div' style='visibility:hidden'>
</div>
</body>
</html>

STEP3:-

必要なIDを抽出します。

于 2013-03-09T19:25:34.537 に答える