php - PHP からテキストを抽出する
?

Question

次のような .html ファイルがあります。

<html>
<body>
<pre style="word-wrap: break-word; white-space: pre-wrap;">{blah blah blah text that I want extracted} </pre>
</body>
</html>

<pre>タグから内部テキストを抽出する PHP スクリプトを作成したいと考えています。Simple HTML DOM を試してみましたが、それは何もしていません。何もエコーしません。ここで何が間違っているのか、Simple HTML Domを使用する必要があるのかどうかわかりません。HTMLファイルからテキストを抽出するためのPHPスクリプトのコードは次のとおりです。

<?php
include 'simple_html_dom.php';
// Create DOM from URL or file
$html = file_get_html('http://data.mtgox.com/api/2/BTCUSD/money/ticker');

// Find all images
foreach($html->find('img') as $element)
       echo $element->src . '<br>';

// Find all links
foreach($html->find('pre') as $element)
       echo $element . '<br>';
?>

なぜそれが機能しないのかについてのアイデアはありますか?

score 2 · Accepted Answer

動作する DOMDOcument の例

$doc = new DOMDocument();
$doc->loadXML('<html><body><pre style="word-wrap: break-word; white-space: pre-wrap;">{blah blah     blah text that I want extracted} </pre></body></html>');
$pres = $doc->getElementsByTagName('pre');
foreach($pres as $v){
   echo $v->firstChild->wholeText.'<br />';
}

score 0 · Accepted Answer

取得している URL は、HTML ではなく JSON を返しています。

json パーサーを使用して処理します。

php - PHP からテキストを抽出する?

2 に答える 2

Related

Reference

php - PHP からテキストを抽出する
?