-2

コード :

$html = file_get_html('http://url.com');
$ret = $html->find('div[samplediv]');
echo $ret;

私が得る出力はただの配列です。つまり、空です。スクレイピングしているページにdivが事前設定されていると確信しています。

また、達成しようとしているもう 1 つのことは、html からテキストを取得することです。単純にプレーンテキストに変換すると、多くの不要な数値やものが生成されます。私がやろうとしているのは、ブラウザに表示されるテキストを取得することです。(html からテキスト全体を取得する代わりに)。

すべての提案を歓迎します。

4

1 に答える 1

8

ドキュメント全体を出力しているようです。試す

echo $ret->innertext;

divの内容を出力するだけです。

PS:グーグルでこれを調べたところ、http: //simplehtmldom.sourceforge.net/manual.htmが見つかりました

于 2012-04-29T17:04:41.297 に答える