フィード経由でニュースやウェブサイトの投稿の完全なコンテンツを取得したい。しかし、多くの Web サイトでは、フィードを介してニュースや投稿の一部のみを表示していることがわかります。もちろん、フィード経由で Web サイトのコンテンツを取得するために開発された
、というスクリプトが存在することは知っています。SimplePie
ただし、このスクリプトはニュースの完全なコンテンツを取得しません。
もちろん、それを行うというスクリプトを見つけましたFull-Text Feeds
。しかし、それは無料ではありません。無料のスクリプトが欲しいです。
私のニーズを満たす同様のスクリプトまたは方法を知っていますか?
3684 次
3 に答える
9
Five Filters のコンテンツ抽出の背後にあるコードは、実際にはオープン ソースであり、Readability のオリジナルの Javascript (サービスになる前) に基づいています。
次のように使用できるはずです。
$page = file_get_contents($item_url);
$readability = new Readability($page);
if ($result = $readability->init()) {
$content = $readability->getContent()->innerHTML;
}
于 2012-02-06T17:19:12.507 に答える
0
ここで何をしようとしているのか完全にはわかりませんが、これが役立つかもしれません:
$full_page_content = file_get_contents('http://www.example.com/');
編集:わかりました、あなたが正しく理解しているなら、次のようなことをする必要があります:
Get rss feed
Use SimplePie or something like it to go through each feed item
For each item in RSS feed
Get the item's url
Get the content from that URL
Strip out the HTML/extract only the text you need
Combine all of these into a new RSS feed and send that to the user
注: これは簡単なことではありません。Full-Text RSS が自社の製品に対して課金できるのには理由があります。
于 2012-02-06T16:19:19.300 に答える
-2
http://magpierss.sourceforge.net/cookbook.shtml(無料)を使用できます
RSSフィードを取得します。ウェブ上でそれを行うPHPスクリプトはたくさんあります...Googleはあなたの友達です!! :)
于 2012-02-06T16:07:26.973 に答える