ここで、この概念が可能かどうか、またはクローラーの機能を誤解していないかどうかを明確にする必要があります。
たとえば、100のWebサイト/ブログのリストがあり、毎日、私のプログラム(クローラーのものを想定しています)がそれらを通り抜け、「マイアミヒート」や「レブロンジェームズ」などの特定のフレーズに一致する場合は、そのページのダウンロードに進みます->フルテキスト/画像を含むPDFに変換し、そのPDFを保存します。
だから私の質問は;
- この種のことは可能ですよね?plsは、テキストスニペットだけは必要ないが、ページ全体を紙に印刷されたかのように取得したいと考えていることに注意してください。
- このタイプのプログラムはクローラーと呼ばれていますよね?
- 私はhttp://phpcrawl.cuab.de/about.htmlからのコードに基づいて構築することを計画しています