0

ここで、この概念が可能かどうか、またはクローラーの機能を誤解していないかどうかを明確にする必要があります。

たとえば、100のWebサイト/ブログのリストがあり、毎日、私のプログラム(クローラーのものを想定しています)がそれらを通り抜け、「マイアミヒート」や「レブロンジェームズ」などの特定のフレーズに一致する場合は、そのページのダウンロードに進みます->フルテキスト/画像を含むPDFに変換し、そのPDFを保存します。

だから私の質問は;

  1. この種のことは可能ですよね?plsは、テキストスニペットだけは必要ないが、ページ全体を紙に印刷されたかのように取得したいと考えていることに注意してください。
  2. このタイプのプログラムはクローラーと呼ばれていますよね?
  3. 私はhttp://phpcrawl.cuab.de/about.htmlからのコードに基づいて構築することを計画しています
4

2 に答える 2

1

phpcrawl を使用して Web ページをクロールするため、 wkhtmltopdfを使用して html をそのまま pdf に変換するため、これは完全に可能です。

  1. はい、可能です。wkhtmltopdf ツールを使用すると、Web ページをそのまま変換できます。デスクトップベースのソフトウェアなので、マシンにインストールできます
  2. はいクローラー。
  3. 作りたいものを作るのに最適なツールです。
于 2012-11-26T19:14:15.927 に答える
0
  1. はい、可能です。

  2. Web サイトからデータをスクレイピングしているため、クローラーまたはスクレーパーと呼ぶことができます。

Web サイトを PDF にレンダリングすることは、おそらく最も難しい部分です。これを行うことができる Web サービスがあります。

例えば

http://pdfmyurl.com/

(私は何の関係もありませんし、私はそれらを使用したことはありません。私がチェックしたとき、それはGoogleの検索結果の最初のサイトでした)

于 2012-11-26T19:14:46.183 に答える