2

http://bit.ly/4z5IFj

この RSS フィードには投稿画像が含まれていません。おそらく、サイトが画像を不適切に配置しているためです。画像がタイトルの上に来て、画像もいっぱいではありません(cssのように)

投稿例: http://bit.ly/LEj3tj

<div id="newsItemComplete">
<p><img src="news_images/712315777drugs1.jpg" alt="Over 19,000 suspects ...." /></p>

<h2 class="completeNewsTitle" style="margin-top:10px;">Over 19,000 suspects ....</h2>   

<p class="newsDateStamp"  style="width:100%; float:left; margin:0;">June 14, 2012&nbsp;&nbsp;05:04 pm</p>
</div>

<div class="newsContent"  style="width:100%; float:left; clear:both; margin-bottom:5px;"> 

<p>The police have seized ....</p>         
</div> 
</div>
<div class="clearFix"></div>

<!-- control:news headline item ends here --><!-- control:category list starts here -->
<!-- control:category list ends here -->
<!-- headline news article  -->

説明に対応する完全な記事と画像を取得したいのですが、誰か助けてもらえますか?

4

2 に答える 2

1

よくできていますが、正確ではありません。

リンクは元の Web サイトに関連しており、あなたのものではないため、パイプ出力を Web ページに配置しても画像は表示されません。正規表現モジュールを使用して、不足している URL の残りを挿入し、リンクを絶対にすることもできますが、元の Web サイトは、画像へのホットリンクに不満を抱くでしょう.

Yahoo パイプは、画像自体を取得できず、それらへのリンクのみを取得します。ウェブサイトがこれらの画像のコピーを取得するのはもう少し複雑で、PHP を使用してウェブサイト サーバーからすべてのスクレイピングを行う方がよいでしょう。

Fetch Page Moduleについて他に知っておくべきことは、おそらく 6 か月以内になくなるので、今すぐXPATH Fetch Page Module を使い始める必要があります。

これは、要件に基づいて開始するための不完全なパイプです。 http://pipes.yahoo.com/pipes/pipe.info?_id=d7aba8c124693f3af888838ca12ac547

ところで、広告と「いいね」ボタンの独自のIDコードを交換するか、正規表現モジュールでそれらを完全に削除することを忘れないでください

于 2012-06-14T21:44:28.890 に答える
0

私は自分でそれを修正しました。ここにそのスクリーンショットがあります。リンクを取得し、必要な部分を取得して説明にコピーします。

http://i.stack.imgur.com/CZ1lx.png

于 2012-06-14T18:10:14.860 に答える