0

InstaPaper API を使用しています

この文字列を使用して、記事のコンテンツを取得しています。

$Bookmark_Text = $connection->getBookmarkText($Bookmark['bookmark_id']);

残念ながら、それはhtml全体を引っ張っていて、基本的にHTML構造をHTMLに入れています。

例。

<html>
<head></head>
<body>
    <html>
    <head>Instapaper Title</head>
    <body>InstaPaper Article Content</body>
    </html>
</body>
</html>

「Instapaper記事のコンテンツ」を取得する方法についての考え

ありがとう!

4

2 に答える 2

1

記事のみを抽出し、Instapaper のもの (たとえば、上部と下部のバー) を削除する JS コードを次に示します。

html.replace(/^[\s\S]*<div id="story">|<\/div>[^<]*<div class="bar bottom">[\s\S]*$/gim, '');

Instapaper の HTML 出力が変更されると、変更される可能性があることに注意してください。

于 2012-08-27T15:45:48.990 に答える
0

パーサーを使用して の内容を抽出し<body>ます。PHP には組み込みの がいくつかありますが、にも使いやすいものがあります。

$Bookmark_Textが有効な HTML ドキュメントである場合、これで問題が解決するはずです。

$dom = new DOMDocument();
$dom->loadHTML($Bookmark_Text);
$body = $dom->getElementsByTagName('body')->item(0);
$content = $body->ownerDocument->saveHTML($body);
于 2012-05-19T00:27:05.160 に答える