phpcrawl - PHPcrawler - tmp ファイル

Question

の最新バージョンをダウンロードしましたphpcrawler。自分のテスト Web サイトにアクセスできます。

このサイトには画像といくつかのテキストしかありません。クローラーを実行すると、適切に行ったため、テキストから画像を差し引いたものを受け取ります。$crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

tmpファイルを保存できません。クローラーを実行するフォルダーに一意のtmpファイルが保存されません。名前付きファイルを保存しようとしましたが、うまくいきませんでした。

すべてのphpファイルのさまざまな行で、多くの減価償却エラーに遭遇しました。たとえば@fopen、@さまざまな領域で問題が発生しました。も使えPHPますRegex。デビッド。

score 0 · Accepted Answer

PHPCrawler質問には実際に回答が得られないことがわかっているので、私は自分の質問に回答しました。昨年の質問が回答されていないのを見ました。私もそれに答えますが、何か良いことをするには遅すぎるかもしれません. これが答えです。

必要に応じて調整した変更済みの phpcrawler を追加しました。

$fp = fopen('c:/test/poopoo.txt','w');
fwrite($fp,($page_data['source'])); 
fclose($fp);

ファイルをフラッシュする前にそれを置き、クラスのインスタンスを作成します。

このプロジェクトPHP Simple HTML DOM Parserから使用するとうまくいくことがわかりました。さらに制御が必要な場合はを使用しますが、学習曲線が急になります。RegExp

1 に答える 1