0

の最新バージョンをダウンロードしましたphpcrawler。自分のテスト Web サイトにアクセスできます。

このサイトには画像といくつかのテキストしかありません。クローラーを実行すると、適切に行ったため、テキストから画像を差し引いたものを受け取ります。$crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

tmpファイルを保存できません。クローラーを実行するフォルダーに一意のtmpファイルが保存されません。名前付きファイルを保存しようとしましたが、うまくいきませんでした。

すべてのphpファイルのさまざまな行で、多くの減価償却エラーに遭遇しました。たとえば@fopen@さまざまな領域で問題が発生しました。も使えPHPますRegex。デビッド。

4

1 に答える 1

0

PHPCrawler質問には実際に回答が得られないことがわかっているので、私は自分の質問に回答しました。昨年の質問が回答されていないのを見ました。私もそれに答えますが、何か良いことをするには遅すぎるかもしれません. これが答えです。

必要に応じて調整した変更済みの phpcrawler を追加しました。

$fp = fopen('c:/test/poopoo.txt','w');
fwrite($fp,($page_data['source'])); 
fclose($fp);

ファイルをフラッシュする前にそれを置き、クラスのインスタンスを作成します。

このプロジェクトPHP Simple HTML DOM Parserから使用するとうまくいくことがわかりました。さらに制御が必要な場合は を使用しますが、学習曲線が急になります。RegExp

于 2012-04-05T11:03:23.870 に答える